网易首页 > 网易号 > 正文 申请入驻

有问题问AI?研究发现AI的回答超三成“不可靠”

0
分享至

据参考消息网报道,据英国《新科学家》周刊网站于9月16日报道称,生成式人工智能(AI)工具及其驱动的深度研究智能体和搜索引擎,并非那么可靠,事实上,它们经常给出缺乏依据和存在偏见的说法。日前,一项分析发现,AI工具提供的答案有大约三分之一缺乏可靠资料的支持。对开放人工智能研究中心(OpenAI)的GPT-4.5来说,这一比例更高,达到47%。

赛富时公司AI研究部门的普拉纳夫·纳拉亚南·文基特和他的同事测试了一些生成式AI搜索引擎,包括OpenAI的GPT-4.5和GPT-5、You.com、“解惑”和微软的必应聊天。此外,他们还测试了5个深度研究智能体:GPT-5的深度研究功能、必应聊天的深度思考选项以及You.com、谷歌“双子座”和“解惑”提供的深度研究工具。

这一测试的目的,是确定答案的质量及人类应该如何对待其中包含的信息。

他们要求不同的AI引擎回答303个问题,评价AI的回应使用了8个指标。研究人员把这套指标称为DeepTrace。其设计目的是检测某个答案是否过于片面或自信,它与问题的相关性如何,它引述了什么资料,引述的资料对答案给出的说法有多少支持,以及引述的资料的详尽程度。

问题大致被分成两组:第一组包含一些有争议的问题,以发现AI回应中的偏见;第二组用于检测一系列领域的专业知识,包括气象学、医学和人机交互。

总的来说,AI驱动的搜索引擎和深度研究工具表现得相当差。

研究人员发现许多模型给出了过于片面的答案。必应聊天搜索引擎给出的答案有大约23%包含缺乏依据的说法,而You.com和“解惑”AI搜索引擎的这一比例为31%左右。GPT-4.5给出的缺乏依据的说法更多,为47%,而“解惑”深度研究智能体的该比例高达97.5%。纳拉亚南·文基特说:“看到这样的情况确实让我们很惊讶。”

当下,AI正在快速融入人们的生活。据统计,截至2025年,我国AI问答用户已突破3亿,83%的年轻用户在查询产品时首选AI。但越来越多的研究发现,AI并不代表客观与纯粹。甚至,“数据投毒”产业悄然兴起——通过伪造专家身份、虚构研究报告等方式,向AI“投喂”本不存在的虚假信息,从而让这些虚假内容以客观答案的形式,优先出现在你的AI对话框中,甚至排名第一。

研究显示,当训练数据中仅有0.01%的虚假文本时,大模型的有害输出率会上升11.2%;即使只有0.001%的污染,也会导致有害内容增加7.2%。

极目新闻综合参考消息网、大河报等

(来源:极目新闻)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
忠县惊现特大谋杀案!副县长办公室内惨遭杀害,真相引人深思!

忠县惊现特大谋杀案!副县长办公室内惨遭杀害,真相引人深思!

人生录
2026-04-24 09:13:06
戴安娜因太好看引发SBI强烈不满,称不伦不类令人作呕

戴安娜因太好看引发SBI强烈不满,称不伦不类令人作呕

街机时代
2026-04-25 18:00:03
美专家:美军一旦向北京、上海扔下核弹,中国并不会对等报复

美专家:美军一旦向北京、上海扔下核弹,中国并不会对等报复

董董历史烩
2026-04-26 04:42:31
颜宁微博发文:我本人曾经至少两篇CNS论文被审稿人偷信息抢发

颜宁微博发文:我本人曾经至少两篇CNS论文被审稿人偷信息抢发

澎湃新闻
2026-04-26 11:18:27
30多家法院集体引用一部“空气法”:这不是荒唐剧,是恐怖片

30多家法院集体引用一部“空气法”:这不是荒唐剧,是恐怖片

迷世书童H9527
2026-04-25 14:15:25
男子带9岁儿子到广州一酒店泡温泉碰到两条蛇,酒店回应

男子带9岁儿子到广州一酒店泡温泉碰到两条蛇,酒店回应

潇湘晨报
2026-04-26 13:36:00
114:98!联盟首个2:2诞生,二当家季后赛首个3双,天王山之战来了

114:98!联盟首个2:2诞生,二当家季后赛首个3双,天王山之战来了

林子说事
2026-04-26 15:58:23
强肝第一名!不是枸杞,也不是山药,而是家家户户都有的

强肝第一名!不是枸杞,也不是山药,而是家家户户都有的

华庭讲美食
2026-04-26 11:25:05
千万企退人员多年合理诉求迟迟未落地!真实现状深度解析

千万企退人员多年合理诉求迟迟未落地!真实现状深度解析

匹夫来搞笑
2026-04-25 15:26:44
张军失联背后四大影响揭晓!李永波巧妙抽身,刘国梁成舆论焦点

张军失联背后四大影响揭晓!李永波巧妙抽身,刘国梁成舆论焦点

林子说事
2026-04-26 14:41:39
网易号平台每日辟谣公告(四月二十四日)

网易号平台每日辟谣公告(四月二十四日)

网易号官方平台
2026-04-24 17:54:26
37岁男篮传奇人物:定居广东,身居要职财富自由,娶娇妻生双胞胎

37岁男篮传奇人物:定居广东,身居要职财富自由,娶娇妻生双胞胎

寻墨阁
2026-04-26 01:21:55
已入化境!亚历山大83%命中率狂飙42分创季后赛得分新高

已入化境!亚历山大83%命中率狂飙42分创季后赛得分新高

北青网-北京青年报
2026-04-26 14:33:03
干掉阵风只是小意思,外媒说歼-10C厉害,根本不是因为它自己能打

干掉阵风只是小意思,外媒说歼-10C厉害,根本不是因为它自己能打

知鉴明史
2026-04-25 17:45:03
银行收缩潮来了

银行收缩潮来了

读懂财经研究所
2026-04-24 10:51:21
5分钟2球!曼城2-1逆转连续4年晋级决赛 大黑马20场不败惨遭终结

5分钟2球!曼城2-1逆转连续4年晋级决赛 大黑马20场不败惨遭终结

狍子歪解体坛
2026-04-26 02:12:15
嫌犯携多种武器冲向安检点后开火,特朗普再次躲过危险称与伊朗无关

嫌犯携多种武器冲向安检点后开火,特朗普再次躲过危险称与伊朗无关

澎湃新闻
2026-04-26 12:32:27
乌军曝出丑闻,西尔斯基怒不可遏:所有指挥官撤职查办!

乌军曝出丑闻,西尔斯基怒不可遏:所有指挥官撤职查办!

史政先锋
2026-04-25 20:38:13
事态已升级,1.7万外军集结,3面围堵中国,解放军万吨战舰已就位

事态已升级,1.7万外军集结,3面围堵中国,解放军万吨战舰已就位

阿伧说事
2026-04-26 10:44:32
300965,重大资产重组!明天停牌!

300965,重大资产重组!明天停牌!

证券时报e公司
2026-04-26 17:29:23
2026-04-26 18:51:00
极目新闻 incentive-icons
极目新闻
全球眼,中国心,瞭望者,思想家
381371文章数 950336关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

手机
时尚
健康
亲子
本地

手机要闻

一加Ace 6至尊版规格全揭晓,堆料堆到友商沉默!

IU的脸,真的有自己的时间线

干细胞如何让烧烫伤皮肤"再生"?

亲子要闻

给宝宝的辅食太精细,危害不是一般大,家长们早了解早安心

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

无障碍浏览 进入关怀版