研究显示生成式AI工具答案质量堪忧：三分之一缺乏可靠来源支持一项分析显示，生

小嗯聊科技 2025-09-17 23:52:12

研究显示生成式 AI 工具答案质量堪忧：三分之一缺乏可靠来源支持

一项分析显示，生成式人工智能（AI）工具及其驱动的深度研究智能体与搜索引擎，常常会给出未经证实且带有偏见的回答，而这些回答与其引用的信息来源并不相符。该分析发现，AI 工具提供的答案中，约有三分之一缺乏可靠来源支持。其中，OpenAI 旗下的 GPT-4.5 表现更差，这一比例高达 47%。

Salesforce 人工智能研究院的普拉纳夫・纳拉亚南・文基特（Pranav Narayanan Venkit）及其同事，对多款生成式 AI 搜索引擎进行了测试，包括 OpenAI 的 GPT-4.5 与 GPT-5、You.com、Perplexity 以及微软的必应聊天（Bing Chat）。

此外，他们还对五款深度研究智能体工具的性能进行了评估，具体包括 GPT-5 的“深度研究”功能、必应聊天的“深入思考”功能，以及 You.com、谷歌 Gemini 和 Perplexity 推出的深度研究工具。

0 阅读：0

小嗯聊科技

感谢大家的关注

作者最新文章

1

开车是件很费心思的事尚界H5依托华为乾崑智驾ADS 4和全向防碰撞系统，在遇到

2

尚界H5复刻消失的前车尚界H5的辅助驾驶功能可以及时应对这种场景，能快速识别消失

3

一加 15 真机曝光，设计风格延续一加 13T一加 15 的真机照亮相 2025

4

苹果折叠屏 iPhone Fold 细节曝光：超薄钛合金机身尽管今年的新款 iP

5

以前总觉得智驾离20万级SUV很远，直到体验了尚界H5这个想法才有所改观，尚界

6

长城灵魂巡航摩托车官图公布：复古造型，8 缸动力长城灵魂摩托官微昨晚公布了一组新

7

詹姆斯・卡梅隆谈 AI：能和人类一样富有创造力，但无法拥有独特生活体验据外媒 T

8

因滥用广告技术主导地位遭欧盟罚款近 30 亿欧元后，谷歌将提交“不完全拆分”的整

9

消息称“理想牌”电池明年上车，理想与欣旺达成立合资公司据 36 氪汽车今日报道，

10

家人们！尚界H5真的做到“全都要”了！余承东官宣尚界H5发布会，鸿蒙智行秋季新

热门分类

科技TOP

1

当下高端手机市场同质化严重，各大品牌陷入参数堆砌的内卷怪圈，追觅AURORA手机

2

界面新闻独家获悉，OPPO子品牌一加将于3月10号宣布涨价，涨价幅度为300元到

3

在杭州，提起互联网大厂，大家第一反应还是阿里、网易。但最近一份《杭州互联网&科技

4

听我一句劝！荣耀的中高端旗舰不能乱选，小心选错悔断肠，这四款中择优选择更明智[灵

5

2026年1月中国AI助手应用排行榜榜单！📊豆包以日均5186.8万活跃用户断

6

基本漏完了，一加15T绿色外观有点好看哦新小屏旗舰，一加15T这还没发布呢，

7

果然没有友商的赛道总是如此静悄悄的，甚至安静得可怕。华为在MWC上属于硬刚了英伟

8

拿荣耀Magic8ProAir当了一天的主力机，有两个地方还是挺让我惊喜的，

9

华为Mate80系列大奖拿到手软。在MW2026大会上亮相的Mate80系列mw

10

美国同意英伟达的芯片只要回到国内建厂，就能卖给中国。一出政策，中国立马反击：只要

科技最新文章

1

界面新闻独家获悉，OPPO子品牌一加将于3月10号宣布涨价，涨价幅度为300元到

2

当下高端手机市场同质化严重，各大品牌陷入参数堆砌的内卷怪圈，追觅AURORA手机

3

黄仁勋最新重磅发言，直接给整个科技圈投重新洗牌在摩根士丹利TMT大会上，黄仁勋直

4

【苹果MacBookUltra今年发布】据马克・古尔曼爆料称，苹果计划2026

5

有开发者挖出了苹果在几天前刚推出的两款全新显示器的处理器参数，其中XDRDis

6

韩伯啸放出了vivoX300Ultra内部模组结构图，14mm超广角用

7

基本漏完了，一加15T绿色外观有点好看哦新小屏旗舰，一加15T这还没发布呢，

8

哇，一加15T官宣了！还是熟悉的配方，这两个新色好看啊😍

9

尊贵的iPhone17ProMax用户，珍惜你们最后5个月的高贵时间吧

10

13080mAh就要来了刚刷到数码大佬爆料在今年这个手机厂商就要推出来了，也