网易首页 > 网易号 > 正文 申请入驻

OpenAI发表Nature论文:揭开AI模型总“说谎”的真相,人类对AI准确性的评估促使其产生幻觉

0
分享至

撰文丨王聪

编辑丨王多鱼

排版丨水成文


当你问当前几个主流的大语言模型,PGGB是什么意思?

ChatGPT回答:“多项式高斯梯度带宽”(Polynomial Gaussian Gradient Bandwidth);

Claude回答:“私募全球增长与收益基金”(Privately Held Global Growth and Income Fund);

DeepSeek回答:“完美守卫团购”(Perfect Guard Group Buy)。

但实际情况是,这三个回答都是错的,都是它们瞎编的。那么,这些大语言模型为什么不回答不知道,而是自信满满地给出一个编造的看似专业的答案呢?

这种现象在 AI 领域被称为“幻觉”(Hallucination),也就是,大语言模型(LLM)有时会产生自信且看似合理但错误的信息,而这这限制了它们的可靠性。即便是在当前最先进(SOTA)的语言模型中,幻觉问题依然存在。要想进一步减少 AI 的幻觉,我们需要了解它们为何产生以及为何持续存在。

2026 年 4 月 22 日,OpenAI的研究人员国际顶尖学术期刊Nature上发表了题为:Evaluating large language models for accuracy incentivizes hallucinations 的研究论文。

这项研究揭示了一个令人惊讶的真相——我们用来衡量 AI 模型能力的评估标准,可能正是导致它“说谎”(出现幻觉)的元凶。


为什么 AI 会“胡说八道”?

如果你正在参加一场考试,遇到一道完全不会的题目,此时你会怎么做?相信大多数人会随便猜一个答案写上去,因此空着不答显然是零分,而瞎蒙一个就算错了也不会多扣分,并没有额外损失。

大语言模型(LLM)也面临同样的困境。

研究团队从两个层面分析了幻觉产生的原因。

首先是预训练阶段的统计压力,大语言模型最初通过“下一个词预测”进行训练,即使训练数据完全正确无误,这种训练方式也会产生统计偏差。对于训练数据中只出现一次的事实(比如某人的生日),模型几乎不可避免地会产生错误;而对于反复出现的规律(比如语法规则),错误率则很低。这就像你只见过某人一次,很难准确记住他的生日;但如果你每天都用同样的语法结构,自然能掌握它。简单来说,AI 对罕见事实的“记忆”天生就不靠谱。

评估体系的“后天误导”

更严重的问题出现在后续的评估阶段

基于准确性的评估指标系统性地奖励猜测行为。当前对于大语言模型的主流评估方式——基于准确性(accuracy)的评分系统,这在本质上是在鼓励 AI“猜答案”而不是“承认不知道”。

研究团队分析了多个主流的大语言模型基准测试,发现绝大多数都采用二元评分:答对得 1 分,答错或放弃得 0 分。在这种规则下,放弃回答永远是最差的选择,因为放弃意味着 0 分,而猜一个答案至少有机会得分。

研究团队举了一个具体例子:在SimpleQA评估中,OpenAI 的 o4-mini 模型几乎回答了所有问题(错误率超过 3/4),而 GPT-5-mini 则经常选择放弃(因此错误更少)。但在这一评估标准下,o4-mini 的得分反而更高,因为它答得多。

这种评估方式让 AI 陷入了“考试模式”——永远在猜答案,永远不敢说“我不知道”。而现实中,一个可靠的人类助手在面对不确定的问题时,会主动承认知识局限或请求更多信息。


训练和评估过程中幻觉的起源与持续存在

解决方案:让AI知道“考试规则”

那么,如何解决这个问题?论文提出了一个简单而有效的方案:开放式评分标准(open-rubric)。

具体做法是:在向 AI 提问时,明确告知评分规则。比如:“正确答案得 1 分,错误答案得 -1 分(所以如果你正确的概率低于 50%,那么最好放弃回答)”、“只有完全正确的答案才能得分(如果不确定,请做出最佳猜测)”

这就像考试前老师明确告知“答错扣分”还是“答错不扣分”,让学生可以根据规则调整策略。

接下来,研究团队在四个前沿模型(Google 的 Gemini 3 Pro、OpenAI 的 GPT-5、xAI 的 Grok 4,以及 Anthropic 的 Claude Opus 4.5)上进行了实验。结果显示,当使用“开放式评分标准”时,所有模型都能根据不同的错误惩罚程度调整自己的“猜测倾向”——惩罚越重,放弃越多。

更重要的是,在这种评估体系下,减少幻觉的技术不再需要以降低准确率为代价。模型可以像好学生一样,既展示知识,又懂得在适当的时候保持谨慎。

这对 AI 发展意味着什么?

这项研究揭示了一个根本性的问题:我们如何评估 AI,决定了 AI 如何行为。

当前,大语言模型的开发过程中,准确率等“关键指标”主导着模型选择、数据筛选和算法优化。如果这些指标本身就在鼓励不良行为,那么无论我们在减少幻觉方面取得多少技术进步,都可能被评估体系所抵消。

因此,论文作者强调,提高 AI 的可靠性不仅是建模问题,更是评估机制设计问题。与其增加单独的反幻觉基准测试,不如修改评估方式,让它们能够激励 AI 在适当的时候承认不确定性。

随着大语言模型在医疗、法律、金融等关键领域的应用越来越广泛,解决幻觉问题变得至关重要。这项发表于Nature的研究提醒我们,要让 AI 更可靠,我们首先需要更聪明的评估方式。

论文链接

https://www.nature.com/articles/s41586-026-10549-w

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
皇室独苗悠仁19岁选妃,4大条件层层筛选,第4条直接劝退所有人

皇室独苗悠仁19岁选妃,4大条件层层筛选,第4条直接劝退所有人

z千年历史老号
2026-04-24 11:37:07
英超积分榜,利物浦3:1,升至第四,热刺1:0,16轮首胜仍在降级区

英超积分榜,利物浦3:1,升至第四,热刺1:0,16轮首胜仍在降级区

小彭美识
2026-04-26 00:18:42
2026年税务稽查变天,这8类企业将迎来严查!

2026年税务稽查变天,这8类企业将迎来严查!

细说职场
2026-04-25 20:36:35
乌克兰清除全部库皮扬斯克俄军部队!摧毁红军村通讯系统

乌克兰清除全部库皮扬斯克俄军部队!摧毁红军村通讯系统

项鹏飞
2026-04-24 12:48:43
大理民宿市场凉透了!7000家民宿厮杀,有人亏百万仍没卖出去…

大理民宿市场凉透了!7000家民宿厮杀,有人亏百万仍没卖出去…

火山詩话
2026-04-23 09:14:07
雷阵雨+局地6级大风!北京4区雷电蓝色预警中——

雷阵雨+局地6级大风!北京4区雷电蓝色预警中——

BRTV新闻
2026-04-25 19:58:56
特朗普抨击哈里王子访乌,俄市民哀叹乌克兰袭击后当地像广岛和切尔诺贝利 | 狼叔看世界

特朗普抨击哈里王子访乌,俄市民哀叹乌克兰袭击后当地像广岛和切尔诺贝利 | 狼叔看世界

狼叔看世界
2026-04-24 15:29:22
湖人队没东契奇和里夫斯,3比0领先火箭队,球迷:火箭队,解散吧

湖人队没东契奇和里夫斯,3比0领先火箭队,球迷:火箭队,解散吧

好火子
2026-04-26 00:39:45
F-47原型机可能已秘密试飞多年,累计数百小时,项目推进符合计划

F-47原型机可能已秘密试飞多年,累计数百小时,项目推进符合计划

止戈军是我
2026-04-25 12:29:15
女子乘高铁被26寸行李箱砸到头:索赔600元无果,列车长个人“补偿”了400元;箱子主人:已付CT检查费,索赔额已超过我应承担的责任范围

女子乘高铁被26寸行李箱砸到头:索赔600元无果,列车长个人“补偿”了400元;箱子主人:已付CT检查费,索赔额已超过我应承担的责任范围

台州交通广播
2026-04-25 00:39:45
菲律宾一夜变天?副总统莎拉紧急出国!杜特尔特家族大势已去?

菲律宾一夜变天?副总统莎拉紧急出国!杜特尔特家族大势已去?

哎呀哎呀看电影
2026-04-24 21:37:50
这才是刚走完长征的毛主席相貌,美国人拍摄,满脸憔悴,瘦到脱相

这才是刚走完长征的毛主席相貌,美国人拍摄,满脸憔悴,瘦到脱相

史之铭
2026-04-25 19:39:39
新闻的使命是揭示真相,宣传的目的是灌输立场

新闻的使命是揭示真相,宣传的目的是灌输立场

壹家言
2026-04-25 20:59:02
鲍尔默6000万美元投资血本无归,痛斥欺诈创始人“我被骗了”

鲍尔默6000万美元投资血本无归,痛斥欺诈创始人“我被骗了”

IT之家
2026-04-25 12:43:15
小米SU7自动泊车时撞上悬空墙体;车主:以后不再用了;厂家:悬空障碍物会影响到泊车辅助功能

小米SU7自动泊车时撞上悬空墙体;车主:以后不再用了;厂家:悬空障碍物会影响到泊车辅助功能

大风新闻
2026-04-23 15:47:14
演员毛晓彤凌晨从医美诊所离开引网友热议,其晒医院检测报告回应:作为一个从小爱吃面食的天津人,查出面粉不耐受可怎么办

演员毛晓彤凌晨从医美诊所离开引网友热议,其晒医院检测报告回应:作为一个从小爱吃面食的天津人,查出面粉不耐受可怎么办

鲁中晨报
2026-04-25 08:56:26
女子酒店抓获丈夫出轨,无法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓获丈夫出轨,无法容忍不戴避孕套,丈夫:她是我朋友

李晚书
2026-04-24 10:39:33
怒了!国安球迷:蒙哥马利下课,知道大厂为何35岁以上的不要了吧

怒了!国安球迷:蒙哥马利下课,知道大厂为何35岁以上的不要了吧

足球大腕
2026-04-25 23:21:55
随着维拉爆大冷门0-1,英超最新积分榜出炉:曼联渔翁得利

随着维拉爆大冷门0-1,英超最新积分榜出炉:曼联渔翁得利

侧身凌空斩
2026-04-25 21:24:16
李启言父亲病逝,日夜照顾瘫痪儿子病倒,曾拒绝李泽楷千万救济金

李启言父亲病逝,日夜照顾瘫痪儿子病倒,曾拒绝李泽楷千万救济金

开开森森
2026-04-25 18:07:45
2026-04-26 01:24:50
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科学研究
9273文章数 145060关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

数码
艺术
亲子
旅游
公开课

数码要闻

联发科亮相2026北京车展:主动式智能体座舱解决方案

艺术要闻

最适合作为抖音总部的大楼,它在福建莆田!

亲子要闻

发生率仅十万分之一!这种稀有血型跨省紧急调配,只为守护母婴安全

旅游要闻

美猴王VS水蜜桃,连云港、无锡文旅“双向奔赴”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版