网易首页 > 网易号 > 正文 申请入驻

研究称,AI搜索工具平均出错了约60%,Grok 3高达94%!

0
分享至

  • AI搜索服务向用户传递错误信息,且无视出版社的排除请求。

哥伦比亚新闻评论(Columbia Journalism Review)旗下的陶氏数字新闻研究中心(Tow Center for Digital Journalism)的一项新研究发现:用于新闻搜索的生成式AI模型存在严重的准确性问题 —— 错误率高达 60%。

据悉,该研究对 8 款具备实时搜索功能的AI驱动搜索工具进行了测试,结果发现,AI模型在回答有关新闻来源的查询时,平均超过 60% 的答案是错误的。

研究人员 Klaudia Jaźwińska 和 Aisvarya Chandrasekar 在报告中指出,现在大约每 4 个美国人中就有 1 人使用AI模型来替代传统搜索引擎。鉴于研究中发现的高错误率,不仅引发了对 AI 可靠性的严重担忧。

在测试的平台中,错误率差异显著。Perplexity 在 37% 的测试查询中提供了错误信息,而 ChatGPT 搜索在被查询的文章中,错误识别了 67%(200 篇中的 134 篇)。Grok 3 的错误率最 高,达到了 94%。

在测试中,研究人员将实际新闻文章的直接节选内容输入到人工智能模型中,然后要求每个模型识别文章的标题、原始发布者、发布日期和网址(URL)。他们在这 8 种不同的生成式搜索工具上共进行了 1600 次查询。

这项研究突出了这些AI模型的一个共同趋势:当缺乏可靠的信息支撑时,这些AI模型不是选择“诚实”,而是经常给出“编造”的内容 —— 一些看似合理,却存在错误或猜测性的回答。研究人员强调,所有测试的AI模型都存在这一问题,并非个例!

更离谱的是,这些AI工具的付费高 级版本有时表现甚至更差。Perplexity Pro(每月 20 美元)和 Grok 3 的高 级服务(每月 40 美元)比它们的免费版本错误率更高,但它们却十分自信。虽然这些付费模型的正确回答数量较多,但当它们面对“不确定的问题”时,不仅不会像免费版本那样“容易崩溃”,而且更喜欢给出一些“自以为是”的回答,这样导致了它们总体错误率比免费版还要高。

除此之外,研究人员还发现了另一个问题,某些AI模型无视了 “机器人排除协议(Robot Exclusion Protocol)”—— 出版社利用相关协议来防止未经授权的访问。举个例子,虽然《国家地理》(National Geographic)明确禁止 Perplexity 的网络爬虫访问,但 Perplexity 的免费版本还是精准识别出了《国家地理》付费内容中的 10 篇节选文章。

与此同时,即使这些AI模型引用了来源数据,但它们也常常只会将用户引导至雅虎新闻(Yahoo News)等平台上的内容集,而非内容的原始出处。即使在发布者与人工智能公司有正式许可协议的情况下,这种情况也会发生。

编造来源成为了又一个大问题。谷歌 Gemini 和 Grok 3 的内容引用来源中,超过50%会将用户引入一个虚假或无效的网址中,这也是“错误答案”的主要来源。在对 Grok 3 的 200 次引用测试中,有 154 次出现了引用来源链接无效的情况。

这也让出版商们叫苦不迭。阻止AI爬虫吧,他们还是会自行“引用”内容,且不标注你的来源;允许它们访问吧,又会导致版权所有的内容被不断重复使用,依旧无法将流量引回自己的网站。

《时代》(Time)杂志的CEO马克・霍华德(Mark Howard)怒斥“现在是AI产品(表现)最糟糕的时候。”同时,他也对一些用户提出了批评:如果有任何一个用户会对这些免费产品抱有100 %准确率的幻想,那他们应该感到羞愧。

对于这项研究,OpenAI 和微软都给予了反馈,承认收到了这些研究结果。OpenAI 指出,它承诺通过摘要、引用、清晰的链接和归属引用等方式为发布者带来流量,以此来支持发布者。微软则表示,它遵守 “机器人排除协议” 和发布者的指令。但除此之外,别无他话。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卡拉格:无法相信阿利松这种级别的门将,会做出送点的选择

卡拉格:无法相信阿利松这种级别的门将,会做出送点的选择

懂球帝
2026-02-09 15:17:24
同为中国领土,为什么英国能归还香港,而俄罗斯不愿归还海参崴

同为中国领土,为什么英国能归还香港,而俄罗斯不愿归还海参崴

文史达观
2025-04-02 06:45:09
上海弄堂老伯20年只买一只股,50W本金滚到800WW:结硬寨,打呆仗

上海弄堂老伯20年只买一只股,50W本金滚到800WW:结硬寨,打呆仗

真实人物采访
2025-12-18 13:00:08
这一指,千斤重!王楚钦夺冠后为何独指王皓?怒吼里全是故事

这一指,千斤重!王楚钦夺冠后为何独指王皓?怒吼里全是故事

曹老师评球
2026-02-08 23:09:33
2300吨黄金运抵回国,丢失定价权,美财长开甩锅中国,美元没救了

2300吨黄金运抵回国,丢失定价权,美财长开甩锅中国,美元没救了

东极妙严
2026-02-09 17:36:25
“大腰子”不来了!国安第5外援浮现,比古加高点有限,球迷失望

“大腰子”不来了!国安第5外援浮现,比古加高点有限,球迷失望

体坛鉴春秋
2026-02-09 16:17:26
人老了,不管子女孝顺与否,都难避开8个养老真相,看到就是赚到

人老了,不管子女孝顺与否,都难避开8个养老真相,看到就是赚到

情感大使馆
2025-11-27 10:33:06
还能赢!41分,伦纳德率队升至西部第九!队史41年纪录被打破!

还能赢!41分,伦纳德率队升至西部第九!队史41年纪录被打破!

Haviven聊球
2026-02-09 17:23:37
亚冠出线生死战!海港申花拼了:不胜=提前出局!蓉城赢球有望前8

亚冠出线生死战!海港申花拼了:不胜=提前出局!蓉城赢球有望前8

球场没跑道
2026-02-09 16:03:16
汪小菲再次跪地,祈祷马筱梅母子平安,回应大S忌日带孩子旅游

汪小菲再次跪地,祈祷马筱梅母子平安,回应大S忌日带孩子旅游

古希腊掌管月桂的神
2026-02-09 13:39:59
半分钟1000万美元!凯迪拉克在超级碗期间正式发布首部F1赛车涂装

半分钟1000万美元!凯迪拉克在超级碗期间正式发布首部F1赛车涂装

体育妞世界
2026-02-09 12:49:08
如果牛顿的贡献值是100,爱因斯坦是90,那么杨振宁大约是多少?

如果牛顿的贡献值是100,爱因斯坦是90,那么杨振宁大约是多少?

博览历史
2025-11-27 18:56:40
吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

夜深爱杂谈
2026-02-08 19:27:12
相信牢A的原因,其实很简单!

相信牢A的原因,其实很简单!

皮蛋儿电影
2026-01-28 20:25:52
丈夫王晓玉也没想到,临近年关,75岁刘晓庆竟还能发笔“横财”

丈夫王晓玉也没想到,临近年关,75岁刘晓庆竟还能发笔“横财”

林轻吟
2026-02-08 11:27:28
伊能静晒全家福,秦昊发法院公告,两人到底怎么了?

伊能静晒全家福,秦昊发法院公告,两人到底怎么了?

科学发掘
2026-02-09 16:37:27
中国批准稀土出口,日媒欢呼:对华反制措施见效,下一秒遭打脸

中国批准稀土出口,日媒欢呼:对华反制措施见效,下一秒遭打脸

奇思妙想生活家
2026-02-09 17:07:00
离过年不到10天,全红婵高调官宣大喜讯,可谓是春风得意

离过年不到10天,全红婵高调官宣大喜讯,可谓是春风得意

查尔菲的笔记
2026-02-09 12:47:25
炸锅了!春节前夜茅台价格“大崩盘”,一天跌出一台红米K70

炸锅了!春节前夜茅台价格“大崩盘”,一天跌出一台红米K70

小鬼头体育
2026-02-09 03:52:12
中日铜牌战 蒯曼赢了! 张本美和接受采访时落泪

中日铜牌战 蒯曼赢了! 张本美和接受采访时落泪

看看新闻Knews
2026-02-08 23:47:07
2026-02-09 19:20:49
站长之家
站长之家
致力为创业者提供动力
11910文章数 3798关注度
往期回顾 全部

科技要闻

马斯克终于想通了:先去月球“刷经验”

头条要闻

爱泼斯坦案亚裔受害者:首次见他就与2人发生关系

头条要闻

爱泼斯坦案亚裔受害者:首次见他就与2人发生关系

体育要闻

创中国冬奥最佳战绩!19岁速滑新星含泪向天拉勾

娱乐要闻

李亚鹏暂停直播:将投入嫣然医院工作

财经要闻

沪深北交易所优化再融资 释放3个信号

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

教育
亲子
时尚
家居
本地

教育要闻

家长必看:中产家庭应该怎么规划孩子的留学教育?

亲子要闻

萌娃爆笑控诉姐姐:我不是你的员工,你不能对我发号施令,太逗了

2026最流行的5种发型,太适合过年了!

家居要闻

山院焕新 雅聚悦亲朋

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

无障碍浏览 进入关怀版