网易首页 > 网易号 > 正文 申请入驻

诚恳认错坚决不改,为什么AI总“扯谎”?

0
分享至

来源:中关村在线

【ZOL中关村在线原创技术解析】“很抱歉,我之前的回答有误。”“感谢您的指正,我会努力改进。”

相信很多人在使用大语言模型时,偶尔发现一些很离谱的错误,纠正AI之后,就会获得这种回应。然而,当你再次提问类似问题,它很可能换一种说法,继续给出错误答案。这种“诚恳认错,坚决不改”的行为,让不少用户哭笑不得。

众所周知,AI没有欺骗我们的动机,我们所看到的“谎言”有一个更准确的术语:幻觉。那么,AI幻觉究竟是怎么产生的?为何即便开发者反复优化,它依然难以彻底根除?今天我们就来通俗地聊聊这个话题。

大语言模型的幻觉也分多种类型,一般来讲,指的是语言模型在生成文本时,输出看似合理、实则与事实不符、逻辑矛盾或完全虚构的内容。例如介绍产品时瞎填参数、编造一本从未出版的书籍及其作者、杜撰从未发布过的虚假新闻等等,这些内容往往语言流畅、结构严谨,但本质上是“一本正经地胡说八道”。

那么,为何大语言模型会产生幻觉呢?

首先,来源数据并不全都正确。当前主流大语言模型通过海量互联网文本、书籍内容进行自监督学习。但这些内容里本身就有很多错误、偏见、重复信息,甚至有人故意编造的假话。AI一模仿,就学会了“说谎”。另外,有些专业知识它根本没学过,或者学的是过时的信息,遇到新问题就只能“瞎猜”。有时模型无法判断哪条信息更权威,只能基于概率“猜”出最像人类会说的话,虚假数据就这么产生了。

其次,大语言模型倾向于预测下一个最可能出现的词。为了生成连贯、自然的文本,它倾向于选择高频、语义平滑的组合,而非核查事实。例如,当被问“《三体》的作者是谁?”,模型知道“刘慈欣”是高概率答案;但若问题稍作变形:“《三体Ⅳ》的作者是谁?”,尽管该书并不存在,模型仍可能基于“《三体》+作者=刘慈欣”的强关联,自信地编造出续作信息。

此外,为了让AI“更听话”,开发者会用人工反馈来微调它。但如果要求它回答超出能力范围的问题,它为了“表现好”反而更容易编造答案。

尽管学术界和工业界已提出多种缓解幻觉的方法,但完全消除幻觉在当前技术框架下几乎不可能。对于面向一般用户的大语言模型,它们的设计目标是通用对话,而非专业问答。要在任意话题上都保证100%准确,需为每个领域构建专用验证系统,这违背了大模型便利的初衷。

如今幻觉形式多样,有些错误显而易见,有些则需专业知识才能识别。目前尚无统一、可扩展的自动评估标准。用户常默认AI无所不知,但模型本质是概率引擎。这种认知落差,使得即使低频幻觉也会被放大为AI不可信。

虽说幻觉难免,但如果行业放纵其产生,AI总是挑最好听的话来说,久而久之,人们就可能懒得自己动脑、分不清什么是真什么是假。更麻烦的是,这些为了讨好用户而编出来的虚假内容,还可能被重新收集进AI的训练数据里,结果就是错误信息越喂越多,AI说得越来越离谱,整个系统陷入恶性循环。

理解大模型幻觉,我们才能更理性地使用AI,它能充当工作、生活中的灵感助手,而非权威信源。未来幻觉或许能被大幅抑制,但对AI的回答保持一分怀疑,才是正确的使用方式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒋勤勤揭开辛柏青丧妻两个月后的处境,令人担忧的事还是发生了

蒋勤勤揭开辛柏青丧妻两个月后的处境,令人担忧的事还是发生了

揽星河的笔记
2025-12-03 19:58:54
你见过最离谱的网购是什么?网友:仓库是不会承认自己发错了的

你见过最离谱的网购是什么?网友:仓库是不会承认自己发错了的

另子维爱读史
2026-02-16 20:35:50
法国第一美人消失25年,被救时竟已沦为46斤人畜,亲妈在阁楼里藏了整整25年的秘密终于曝光了

法国第一美人消失25年,被救时竟已沦为46斤人畜,亲妈在阁楼里藏了整整25年的秘密终于曝光了

历史回忆室
2026-01-02 19:54:11
郑州10岁男孩8万压岁钱被父亲偷偷取走,用于再婚开销,男孩无奈起诉,法院:全额返还存款及利息

郑州10岁男孩8万压岁钱被父亲偷偷取走,用于再婚开销,男孩无奈起诉,法院:全额返还存款及利息

极目新闻
2026-02-20 17:01:59
皇马后卫赫伊森转发社媒,内容含明显辱华的种族歧视评论

皇马后卫赫伊森转发社媒,内容含明显辱华的种族歧视评论

懂球帝
2026-02-21 23:48:17
凯特王妃自安德鲁被捕后首露面,穿搭高雅吸睛,开怀大笑精气神好

凯特王妃自安德鲁被捕后首露面,穿搭高雅吸睛,开怀大笑精气神好

译言
2026-02-22 04:09:01
改变一个孩子最有效的手段,不是讲道理、发脾气

改变一个孩子最有效的手段,不是讲道理、发脾气

经济观察网
2025-11-10 09:57:13
世界第1爆冷出局,赵心童6-5大逆转晋级决赛对阵出炉,第6冠稳了

世界第1爆冷出局,赵心童6-5大逆转晋级决赛对阵出炉,第6冠稳了

求球不落谛
2026-02-22 07:00:05
印度谈中印战争:中国军队伤亡2400人,8个人才能打赢一个印度兵

印度谈中印战争:中国军队伤亡2400人,8个人才能打赢一个印度兵

比利
2026-02-22 19:53:00
高速服务区如何盈利?多数人只上厕所或接热水,听保安怎么说?

高速服务区如何盈利?多数人只上厕所或接热水,听保安怎么说?

寄星夜幕星河
2026-02-17 20:39:30
1962年,陈云被毛主席约谈一小时后,告假不再参会:心脏不好

1962年,陈云被毛主席约谈一小时后,告假不再参会:心脏不好

雍亲王府
2026-02-22 12:50:06
美国制裁古巴的太阳了吗?援助的大米是自己游泳过去的吗?

美国制裁古巴的太阳了吗?援助的大米是自己游泳过去的吗?

忠于法纪
2026-01-27 08:57:12
联盟第一!活塞5连胜送公牛8连败 坎宁安准三双杜伦复出26+13

联盟第一!活塞5连胜送公牛8连败 坎宁安准三双杜伦复出26+13

醉卧浮生
2026-02-22 11:22:15
许某深陷困境:不惧妈祖惩罚,唯恐失去闽粤商人合作。

许某深陷困境:不惧妈祖惩罚,唯恐失去闽粤商人合作。

特约前排观众
2026-02-22 00:15:04
深圳一海边突发!有人高处坠落……

深圳一海边突发!有人高处坠落……

深圳晚报
2026-02-22 17:26:38
旅客下车接电话将900克金饰遗落在动车上,价值约135万元,乘务组:在行李架上,黑色手提袋里有金条、金手链、金项链等

旅客下车接电话将900克金饰遗落在动车上,价值约135万元,乘务组:在行李架上,黑色手提袋里有金条、金手链、金项链等

封面新闻
2026-02-21 18:27:11
不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

金哥说新能源车
2026-02-22 13:47:06
新一轮楼市风暴,又要开始了!

新一轮楼市风暴,又要开始了!

巢客HOME
2026-02-22 09:50:05
网上都在说春晚王菲输给了伊能静,可高清镜头一切过去,

网上都在说春晚王菲输给了伊能静,可高清镜头一切过去,

小光侃娱乐
2026-02-22 08:30:07
深度长文:能量不会凭空出现,那么宇宙大爆炸的超级能量来自哪?

深度长文:能量不会凭空出现,那么宇宙大爆炸的超级能量来自哪?

宇宙时空
2026-02-21 19:45:04
2026-02-22 22:19:00
娱乐督察中
娱乐督察中
独乐乐不如众乐乐
245文章数 20706关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

中国游客与贝加尔湖8死事故擦肩而过:曾踩过出事冰缝

头条要闻

中国游客与贝加尔湖8死事故擦肩而过:曾踩过出事冰缝

体育要闻

自由式滑雪U型池 谷爱凌成功卫冕

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

游戏
本地
艺术
公开课
军事航空

2026年迎财神大赛,冠军是爆出茅台的传奇玩家!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

冷军:超小幅名人肖像油画新作

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

约旦基地美军战机骤增 包括F-35隐形战斗机

无障碍浏览 进入关怀版