网易首页 > 网易号 > 正文 申请入驻

Google AI 搜索每天或生成数千万条错误答案

0
分享至

有测试显示,Google在搜索结果中默认展示的 AI 总览内容虽然大部分时间是准确的,但在当前超大规模的搜索量之下,哪怕只有一小部分出错,也意味着用户每天会看到数以千万计的错误答案。


《纽约时报》援引 AI 初创公司 Oumi 的评估称,大约每 10 条Google AI 总览中就有 1 条包含虚假信息。按Google每年处理约 5 万亿次搜索来推算,用户每小时可能会接触到超过 5700 万条不准确的回答,换算下来几乎是“每分钟近百万条”。

Oumi 应《纽约时报》要求,使用广泛采用的生成式 AI 测试基准 SimpleQA,对Google搜索中的 Gemini 准确率做了量化评估。在 4326 条搜索样本中,去年 10 月 Gemini 2 提供准确 AI 总览的比例约为 85%,到了今年 2 月升级到 Gemini 3 后,这一比例提升到 91%。

不过,Oumi 之所以能在大样本规模下进行评估,本身也依赖其他 AI 工具,这可能会引入新的误差。与此同时,Google在现实使用中有时会对同一搜索请求给出不同的 AI 总览内容,即便两次搜索之间仅间隔数秒,这也加大了评估难度。

Google方面则认为 Oumi 的测试方法“有缺陷”,并不符合真实世界的搜索行为。按照Google内部测试数据,在脱离搜索、单独运行的情况下,Gemini 3 的“幻觉率”(生成错误内容的比例)约为 28%。

报道指出,信息来源也是一大难题。Google会尝试在 AI 总览中附上相关链接,但这些链接经常无法真正支撑 Gemini 给出的结论——无论这些结论本身是对是错。测试发现,在一些情况下,错误的 AI 总览后面紧跟着的链接却给出了正确信息;也有时候,总览内容准确,但引用的是含有错误信息的网页;还有一部分结果中,链接页面根本没有与总览相关的内容。

更值得注意的是,AI 总览与其引用来源之间的不一致现象在升级后更加突出:使用 Gemini 2 时,有 37% 的搜索存在这种不一致,而升级 Gemini 3 后,这一比例升至 56%。

研究人员还发现,AI 总览容易被外部内容“操控”。一位 BBC 记者在个人博客中刻意发布了错误信息,随后便发现Google在第二天的搜索总览中重复了这些不实内容。

在使用条款的细则中,几家主流科技公司事实上都承认了当前生成式 AI 对“真实性”的把握仍然不牢靠。微软在条款中把其 Copilot 工具界定为“仅供娱乐”,不适宜用于做出重要决策。Google则在 AI 总览界面明确提示用户要对回答进行再次核查,而 xAI 也公开承认,其模型存在产生“幻觉”的可能性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
迟重瑞不再隐忍!坦言和陈丽华结婚真相,难怪550亿遗产一分不要

迟重瑞不再隐忍!坦言和陈丽华结婚真相,难怪550亿遗产一分不要

阿伧说事
2026-04-09 03:25:55
惊雷!4000亿市值蒸发,迈瑞医疗年报爆冷,股民遭闷杀

惊雷!4000亿市值蒸发,迈瑞医疗年报爆冷,股民遭闷杀

慧眼看世界哈哈
2026-04-11 19:21:11
去了一趟非洲的农村,回来后才敢讲,那里的贫困,是无声的震撼

去了一趟非洲的农村,回来后才敢讲,那里的贫困,是无声的震撼

千秋文化
2026-04-07 10:47:30
既要保护全红蝉,也不能网暴陈芋汐,总算有人说公道话了!

既要保护全红蝉,也不能网暴陈芋汐,总算有人说公道话了!

乐天闲聊
2026-04-12 02:49:55
阿森纳英超剩余赛程:连续对阵曼城、纽卡,末轮迎战水晶宫

阿森纳英超剩余赛程:连续对阵曼城、纽卡,末轮迎战水晶宫

懂球帝
2026-04-11 21:52:19
美伊谈判开启,美国释放重要信号!此前打伊朗决策过程披露,仅万斯反对,特朗普“全凭直觉”......

美伊谈判开启,美国释放重要信号!此前打伊朗决策过程披露,仅万斯反对,特朗普“全凭直觉”......

新民周刊
2026-04-11 18:14:15
天生坏种?女子用自己名字开卤菜店,被索赔50万!说她店名侵权

天生坏种?女子用自己名字开卤菜店,被索赔50万!说她店名侵权

阿纂看事
2026-04-10 16:42:33
残忍!以军在加沙教室内公然开枪打死一名正在上课的9岁女学生

残忍!以军在加沙教室内公然开枪打死一名正在上课的9岁女学生

大象新闻
2026-04-10 14:48:32
利物浦官方:恩古莫哈当选与富勒姆一役队内最佳球员

利物浦官方:恩古莫哈当选与富勒姆一役队内最佳球员

懂球帝
2026-04-12 04:13:39
脑梗最怕的三种维生素,不妨了解!

脑梗最怕的三种维生素,不妨了解!

药师方健
2026-04-10 22:05:32
卡位战洛佩斯小卡拼尽全力,全被加兰败光,战绩跌第九本赛季毁了

卡位战洛佩斯小卡拼尽全力,全被加兰败光,战绩跌第九本赛季毁了

篮球资讯达人
2026-04-11 12:33:46
曼城VS切尔西:4231出击 罗德里B席坐镇 谢尔基领衔哈兰德冲锋

曼城VS切尔西:4231出击 罗德里B席坐镇 谢尔基领衔哈兰德冲锋

零度眼看球
2026-04-12 02:20:03
6部热度爆表的欧美剧,尺度突破天花板,你追更了几部?

6部热度爆表的欧美剧,尺度突破天花板,你追更了几部?

影唠安利社
2026-04-11 11:20:51
伊朗获中国支持后,美国24小时内急喊话中国

伊朗获中国支持后,美国24小时内急喊话中国

和海看日出
2026-04-12 01:40:55
千万粉丝网红晒剃光头视频感动全网

千万粉丝网红晒剃光头视频感动全网

新民周刊
2026-04-11 18:14:45
又砍下33+7+7!抱歉卡尔马龙:你从历史第一变成了历史第二

又砍下33+7+7!抱歉卡尔马龙:你从历史第一变成了历史第二

篮球大视野
2026-04-11 17:19:07
山西7分险胜!山东惨败23分,深圳赢5分,四川37连败,积分榜大变

山西7分险胜!山东惨败23分,深圳赢5分,四川37连败,积分榜大变

老吴说体育
2026-04-11 21:52:16
两性关系:不管你信不信,女性过了65岁后,基本都有这7个现状

两性关系:不管你信不信,女性过了65岁后,基本都有这7个现状

王二哥老搞笑
2026-03-24 09:47:27
脚痛医头?杨世元突然“脑震荡”!前国脚质疑,申花教练当场申诉

脚痛医头?杨世元突然“脑震荡”!前国脚质疑,申花教练当场申诉

足球大腕
2026-04-12 00:34:50
民调出炉,郑丽文获一面倒力挺,连胜武成焦点,王浅秋一语道破

民调出炉,郑丽文获一面倒力挺,连胜武成焦点,王浅秋一语道破

娱乐圈的笔娱君
2026-04-11 19:00:57
2026-04-12 04:44:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
67336文章数 70152关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

霍尔木兹海峡突传大消息 特朗普最新发声

头条要闻

霍尔木兹海峡突传大消息 特朗普最新发声

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

房产
艺术
数码
家居
公开课

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

艺术要闻

你绝对想不到,这个国家美女竟如此多!

数码要闻

索尼INZONE首款开放式游戏耳机H6 Air曝光,机身重199g

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版