网易首页 > 网易号 > 正文 申请入驻

有问题问AI?研究发现AI的回答超三成“不可靠”

0
分享至

据参考消息网报道,据英国《新科学家》周刊网站于9月16日报道称,生成式人工智能(AI)工具及其驱动的深度研究智能体和搜索引擎,并非那么可靠,事实上,它们经常给出缺乏依据和存在偏见的说法。日前,一项分析发现,AI工具提供的答案有大约三分之一缺乏可靠资料的支持。对开放人工智能研究中心(OpenAI)的GPT-4.5来说,这一比例更高,达到47%。

赛富时公司AI研究部门的普拉纳夫·纳拉亚南·文基特和他的同事测试了一些生成式AI搜索引擎,包括OpenAI的GPT-4.5和GPT-5、You.com、“解惑”和微软的必应聊天。此外,他们还测试了5个深度研究智能体:GPT-5的深度研究功能、必应聊天的深度思考选项以及You.com、谷歌“双子座”和“解惑”提供的深度研究工具。

这一测试的目的,是确定答案的质量及人类应该如何对待其中包含的信息。

他们要求不同的AI引擎回答303个问题,评价AI的回应使用了8个指标。研究人员把这套指标称为DeepTrace。其设计目的是检测某个答案是否过于片面或自信,它与问题的相关性如何,它引述了什么资料,引述的资料对答案给出的说法有多少支持,以及引述的资料的详尽程度。

问题大致被分成两组:第一组包含一些有争议的问题,以发现AI回应中的偏见;第二组用于检测一系列领域的专业知识,包括气象学、医学和人机交互。

总的来说,AI驱动的搜索引擎和深度研究工具表现得相当差。

研究人员发现许多模型给出了过于片面的答案。必应聊天搜索引擎给出的答案有大约23%包含缺乏依据的说法,而You.com和“解惑”AI搜索引擎的这一比例为31%左右。GPT-4.5给出的缺乏依据的说法更多,为47%,而“解惑”深度研究智能体的该比例高达97.5%。纳拉亚南·文基特说:“看到这样的情况确实让我们很惊讶。”

当下,AI正在快速融入人们的生活。据统计,截至2025年,我国AI问答用户已突破3亿,83%的年轻用户在查询产品时首选AI。但越来越多的研究发现,AI并不代表客观与纯粹。甚至,“数据投毒”产业悄然兴起——通过伪造专家身份、虚构研究报告等方式,向AI“投喂”本不存在的虚假信息,从而让这些虚假内容以客观答案的形式,优先出现在你的AI对话框中,甚至排名第一。

研究显示,当训练数据中仅有0.01%的虚假文本时,大模型的有害输出率会上升11.2%;即使只有0.001%的污染,也会导致有害内容增加7.2%。

极目新闻综合参考消息网、大河报等

(来源:极目新闻)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
8岁考出760高分,智商230碾压爱因斯坦,天才陶哲轩如今现状如何

8岁考出760高分,智商230碾压爱因斯坦,天才陶哲轩如今现状如何

大鱼简科
2026-04-22 17:11:04
日本人不信专程去腾冲,结果真的不被接待,直言恨自己祖先

日本人不信专程去腾冲,结果真的不被接待,直言恨自己祖先

映射生活的身影
2026-04-19 11:36:27
华谊亏损82亿,老板娘直播还债,罗海琼的清醒才是顶级豪门

华谊亏损82亿,老板娘直播还债,罗海琼的清醒才是顶级豪门

亿通电子游戏
2026-04-22 17:41:20
成名前的赵丽颖,没有化妆个子不高,走在街头跟普通人没区别

成名前的赵丽颖,没有化妆个子不高,走在街头跟普通人没区别

白宸侃片
2026-04-22 14:34:02
中东,大消息!刚刚,直线猛拉!

中东,大消息!刚刚,直线猛拉!

中国基金报
2026-04-22 18:11:35
不管你“泡”多大年纪的女人,对方身体有这4个反应,99%是成功了

不管你“泡”多大年纪的女人,对方身体有这4个反应,99%是成功了

王二哥老搞笑
2026-04-22 20:31:57
最后24小时,万斯出师不利,伊朗拒绝派人赴会,中方接到求援电话

最后24小时,万斯出师不利,伊朗拒绝派人赴会,中方接到求援电话

林子说事
2026-04-22 20:27:56
马特-劳:切尔西正在基地开会,以决定是否解雇罗塞尼尔

马特-劳:切尔西正在基地开会,以决定是否解雇罗塞尼尔

懂球帝
2026-04-22 21:27:05
世锦赛:韦克林四连鞭完胜普伦进16强,英格兰小将无缘创造历史!

世锦赛:韦克林四连鞭完胜普伦进16强,英格兰小将无缘创造历史!

世界体坛观察家
2026-04-22 19:47:29
敲诈中国10亿美元、拒绝中国飞机借道,如今这个国家又找上中国!

敲诈中国10亿美元、拒绝中国飞机借道,如今这个国家又找上中国!

春序娱乐
2026-04-20 04:52:53
宅基地“父改子”黄金窗口期!农村有儿子的抓紧,错过就亏大了

宅基地“父改子”黄金窗口期!农村有儿子的抓紧,错过就亏大了

三农雷哥
2026-03-25 17:58:07
反转!许家印当庭认罪判无期,昔日恒大歌舞团长白珊珊已结婚生子

反转!许家印当庭认罪判无期,昔日恒大歌舞团长白珊珊已结婚生子

一盅情怀
2026-04-18 08:14:55
日本10式坦克炸膛事故细节:坦克内有4人,3名死者身份曝光

日本10式坦克炸膛事故细节:坦克内有4人,3名死者身份曝光

新京报
2026-04-21 20:51:12
美国发现一个“秘密”:每次对华加征关税,中国就去找非洲,为何

美国发现一个“秘密”:每次对华加征关税,中国就去找非洲,为何

泠泠说史
2026-04-21 21:59:17
木村拓哉在镜头前吐露“失恋经历”,原来连木村拓哉也有搞不定的女人......

木村拓哉在镜头前吐露“失恋经历”,原来连木村拓哉也有搞不定的女人......

日本物语
2026-04-21 21:06:10
河北一小车斑马线撞飞2人后掉头再次冲撞伤者,周边商家:警方和120急救车赶到现场,肇事司机当场被控制

河北一小车斑马线撞飞2人后掉头再次冲撞伤者,周边商家:警方和120急救车赶到现场,肇事司机当场被控制

潇湘晨报
2026-04-22 15:47:21
段奕宏现身志愿军烈士遗骸迎回仪式,他曾在电影《长津湖》饰演三营营长,是一位“打不死的英雄”

段奕宏现身志愿军烈士遗骸迎回仪式,他曾在电影《长津湖》饰演三营营长,是一位“打不死的英雄”

极目新闻
2026-04-22 12:12:46
正午阳光最烂的6部电视剧,高开低走,全看过的该去洗眼睛了

正午阳光最烂的6部电视剧,高开低走,全看过的该去洗眼睛了

小Q侃电影
2026-04-22 21:13:50
河北一地用“冰红茶”浇灌农作物 已持续几年 自己不吃售卖

河北一地用“冰红茶”浇灌农作物 已持续几年 自己不吃售卖

原某报记者
2026-04-21 17:49:54
长盈精密:公司位于深圳市宝安区燕罗街道的机器人智能制造产业园已经投入使用

长盈精密:公司位于深圳市宝安区燕罗街道的机器人智能制造产业园已经投入使用

每日经济新闻
2026-04-22 16:15:09
2026-04-22 21:52:49
极目新闻 incentive-icons
极目新闻
全球眼,中国心,瞭望者,思想家
380302文章数 950190关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

媒体:伊朗用“不怕死”三个字 劝退特朗普

头条要闻

媒体:伊朗用“不怕死”三个字 劝退特朗普

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

复婚无望!baby黄晓明陪小海绵零交流

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

房产
亲子
旅游
本地
时尚

房产要闻

官宣!今年9月起,广州中小学“重点班”将成历史!

亲子要闻

妈妈看不到的时候,孩子能拒绝才真的放心!

旅游要闻

“五一”玩转徐汇:从爵士铛铛车到二次元痛街,四大主题活动贯穿全域

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

今年春夏一定要有“这件衣服”,高级又气质!

无障碍浏览 进入关怀版