网易首页 > 网易号 > 正文 申请入驻

有问题问AI?研究发现AI的回答超三成“不可靠”

0
分享至

据参考消息网报道,据英国《新科学家》周刊网站于9月16日报道称,生成式人工智能(AI)工具及其驱动的深度研究智能体和搜索引擎,并非那么可靠,事实上,它们经常给出缺乏依据和存在偏见的说法。日前,一项分析发现,AI工具提供的答案有大约三分之一缺乏可靠资料的支持。对开放人工智能研究中心(OpenAI)的GPT-4.5来说,这一比例更高,达到47%。

赛富时公司AI研究部门的普拉纳夫·纳拉亚南·文基特和他的同事测试了一些生成式AI搜索引擎,包括OpenAI的GPT-4.5和GPT-5、You.com、“解惑”和微软的必应聊天。此外,他们还测试了5个深度研究智能体:GPT-5的深度研究功能、必应聊天的深度思考选项以及You.com、谷歌“双子座”和“解惑”提供的深度研究工具。

这一测试的目的,是确定答案的质量及人类应该如何对待其中包含的信息。

他们要求不同的AI引擎回答303个问题,评价AI的回应使用了8个指标。研究人员把这套指标称为DeepTrace。其设计目的是检测某个答案是否过于片面或自信,它与问题的相关性如何,它引述了什么资料,引述的资料对答案给出的说法有多少支持,以及引述的资料的详尽程度。

问题大致被分成两组:第一组包含一些有争议的问题,以发现AI回应中的偏见;第二组用于检测一系列领域的专业知识,包括气象学、医学和人机交互。

总的来说,AI驱动的搜索引擎和深度研究工具表现得相当差。

研究人员发现许多模型给出了过于片面的答案。必应聊天搜索引擎给出的答案有大约23%包含缺乏依据的说法,而You.com和“解惑”AI搜索引擎的这一比例为31%左右。GPT-4.5给出的缺乏依据的说法更多,为47%,而“解惑”深度研究智能体的该比例高达97.5%。纳拉亚南·文基特说:“看到这样的情况确实让我们很惊讶。”

当下,AI正在快速融入人们的生活。据统计,截至2025年,我国AI问答用户已突破3亿,83%的年轻用户在查询产品时首选AI。但越来越多的研究发现,AI并不代表客观与纯粹。甚至,“数据投毒”产业悄然兴起——通过伪造专家身份、虚构研究报告等方式,向AI“投喂”本不存在的虚假信息,从而让这些虚假内容以客观答案的形式,优先出现在你的AI对话框中,甚至排名第一。

研究显示,当训练数据中仅有0.01%的虚假文本时,大模型的有害输出率会上升11.2%;即使只有0.001%的污染,也会导致有害内容增加7.2%。

极目新闻综合参考消息网、大河报等

(来源:极目新闻)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
香港名流饭局一幕:杨澜没理张艺谋,转头握旁人

香港名流饭局一幕:杨澜没理张艺谋,转头握旁人

阿废冷眼观察所
2026-02-14 20:31:06
绝对是细糠!普通女生无成本长脑子的方法,网友:我将慢慢学习

绝对是细糠!普通女生无成本长脑子的方法,网友:我将慢慢学习

夜深爱杂谈
2026-02-08 21:23:15
澳洲杨兰兰是谁?五层“身份套娃”揭秘:她或许根本就不存在

澳洲杨兰兰是谁?五层“身份套娃”揭秘:她或许根本就不存在

麦大人
2025-08-18 18:02:38
工龄31年4个月,个人账户85298.25元,60岁退休,养老金有多少?

工龄31年4个月,个人账户85298.25元,60岁退休,养老金有多少?

起喜电影
2026-02-15 16:47:27
科莫利:意大利足球失去的远比三分更多,这是彻头彻尾的不公

科莫利:意大利足球失去的远比三分更多,这是彻头彻尾的不公

懂球帝
2026-02-15 07:40:47
女老师与学生偷情:一周开房四次使用道具助兴,大量私密细节披露

女老师与学生偷情:一周开房四次使用道具助兴,大量私密细节披露

博士观察
2026-02-15 12:34:22
美军宣布:发动空袭

美军宣布:发动空袭

中国基金报
2026-02-15 16:10:23
什么是干休所,要达到什么军衔的军官,才能进干休所?

什么是干休所,要达到什么军衔的军官,才能进干休所?

触摸史迹
2025-12-21 19:31:28
81年彭真会见江青,江青大骂一句,彭真一脸淡定:你还有什么要求

81年彭真会见江青,江青大骂一句,彭真一脸淡定:你还有什么要求

舆图看世界
2025-12-09 08:45:05
重磅加盟!你好,麦基!彻底轰动整个CBA

重磅加盟!你好,麦基!彻底轰动整个CBA

篮球实战宝典
2026-02-15 16:07:58
别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

像梦一场a
2026-02-13 20:20:26
宝马独立子品牌发布全新品牌标识!

宝马独立子品牌发布全新品牌标识!

新浪财经
2026-02-14 21:40:19
王菲将六登春晚,献唱《你我经历的一刻》;此前五次登台首首爆火,去年《世界赠予我的》创收视峰值

王菲将六登春晚,献唱《你我经历的一刻》;此前五次登台首首爆火,去年《世界赠予我的》创收视峰值

扬子晚报
2026-02-15 08:40:17
没有新闻发布会,没有告别仪式,几页黑底白字,传奇就这么落幕了

没有新闻发布会,没有告别仪式,几页黑底白字,传奇就这么落幕了

阿浪的篮球故事
2026-02-14 16:30:43
非常观察|马年新表扎堆上市,谁更懂中国市场?

非常观察|马年新表扎堆上市,谁更懂中国市场?

澎湃新闻
2026-02-14 16:22:29
王毅在慕尼黑安全会议上,拿德国和日本作对比,日本媒体人不干了

王毅在慕尼黑安全会议上,拿德国和日本作对比,日本媒体人不干了

安安说
2026-02-15 12:43:39
从被骂水货到大腿!利物浦 21 岁新援爆发,一战打脸所有质疑者

从被骂水货到大腿!利物浦 21 岁新援爆发,一战打脸所有质疑者

奶盖熊本熊
2026-02-15 16:55:57
布伦森和唐斯:为比赛训练了10秒钟 感谢休斯顿带领我们夺冠

布伦森和唐斯:为比赛训练了10秒钟 感谢休斯顿带领我们夺冠

北青网-北京青年报
2026-02-15 15:04:05
全线大涨!超9万人爆仓!

全线大涨!超9万人爆仓!

吉刻新闻
2026-02-15 15:05:37
高志凯:中国若真给日本断供,别说大蒜、洋葱,棺材板可能都没了

高志凯:中国若真给日本断供,别说大蒜、洋葱,棺材板可能都没了

荷兰豆爱健康
2026-02-15 16:47:57
2026-02-15 18:00:49
极目新闻 incentive-icons
极目新闻
全球眼,中国心,瞭望者,思想家
360984文章数 947384关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

网红带货"100%纯牛肉"涉虚假宣传 事后道歉但拒绝赔偿

头条要闻

网红带货"100%纯牛肉"涉虚假宣传 事后道歉但拒绝赔偿

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

亲子
教育
旅游
数码
公开课

亲子要闻

年夜饭这盘“毒饺子”,正在悄悄毁了无数娃,很多家长却毫不知情

教育要闻

五年级求面积,中点是解题关键

旅游要闻

红墙为底,福字点睛,繁花作伴——中山公园的新春大片无需滤镜

数码要闻

央视主持人马凡舒点赞!追觅T60 Ultra洗地机春晚后台实力救场

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版