网易首页 > 网易号 > 正文 申请入驻

AI为何会一本正经地“胡说八道”

0
分享至

*本文为《半月谈》2025年第6期内容

“编造”法律条文、权威观点、数据成果,提供虚假理论依据,误导处理……当人们查核文献、搜寻资料、处理数据越来越习惯于“遇事不决问AI”的时候,却发现人工智能娴于一本正经地“说谎”,在我们眼前腾起以假乱真的幻觉。

今天,AI正迅速成为你我生活“日用品”。我们可以像治病一样除去它带来的“知识幻觉”吗?幻觉生成的风险,又当如何规避?当如何与之一同生活,而且生活得更好?

什么是AI“知识幻觉”

随着大模型加速走进百行千业,人们开始发现,大模型有时“不太靠谱”。“我试着让DeepSeek回答工程方面的问题,其引用的工程规范中的条款和实际规范压根对不上”“大模型往往‘张冠李戴’,如果质疑它,有时候还会狡辩”“让它推荐书,告诉我的却是一堆压根不存在的书名,居然还都有作者和内容简介”……这样的大模型“用后感”,是不是也道出了你我身边人的心声?

“一本正经地‘说谎’,就是AI生成的‘幻觉’。”浙江大学人工智能研究所所长吴飞一语道破。

清华大学沈阳团队在2025年2月发布的《DeepSeek与AI幻觉》报告中介绍,他们测试了眼下风行的一系列大模型,题目是随机抽取300道事实性幻觉测试题,涵盖健康、科学、历史、文化、音乐等多个领域,获取大模型给出的答案与正确答案比对发现,多个热门大模型的幻觉率超过20%。

例如,面对“水浒传中李逵为什么要大闹五台山”的提问,3款热门大模型无一指出此提问本身的错误,反而“顺坡下驴”,给出了诸如“喝醉酒”“误闯寺庙”“出手相助鲁智深”等答案。

事实上,对于人工智能的“知识幻觉”问题,国际科学界早有体会。今年《自然》一篇报道指出,目前AI辅助科研在参考文献方面出现错误的情况相当普遍,AI检索工具往往会“找出”与研究主题并无关系的论文。至于论文标题、第一作者或发表年份等细节的偏差,AI的差错率少则30%,多则90%。

看来,不只是你的父母长辈搞不清楚AI的“锦囊妙计”靠不靠谱,科学家也一样头疼呀!

“知识幻觉”难以避免

好吧,也许你会说,现在的AI还比较幼稚,有“幻觉”也难免,咱们认了。那大模型到底有没有可能彻底根除“知识幻觉”?

对不起,就目前的大模型技术路线而言,说“难免”不如说“难以避免”。对,“幻觉”是大模型数据驱动的内在机制带来的,因此“难以避免”。

香港科技大学团队一项研究,总结了导致AI幻觉的多种原因。以数据源为例,由于AI大模型的训练使用了大量互联网数据,数据集本身可能存在错误、过时或缺漏,导致幻觉的出现。再加上不同数据集之间存在相互矛盾的地方,“这可能会鼓励模型生成不一定有依据,也不忠实于(固定)来源的文本”。

北京通用人工智能研究院院长、北京大学智能学院院长朱松纯强调,大模型本身并不存在于真实世界中,因此无法像人一样实现从“词语(word)”到“世界(world)”的联结。也因此,大模型虽然出色,但仍然是“缸中之脑”,不具备真正的智能。

“这是由它的内在构造机制所决定的,即通过统计建模在大量文本上进行训练,学习文本之间的语言学相关关系,从而根据上一个词语预测下一个词语。”朱松纯说。

例如,大模型本质上不具备事实判断的能力,更多的是在纯符号空间中展开排列组合,更像是一种新型的“数据库”。即使它们生成了诸如“我爱你”这样的语句,也缺乏对人类真实生活体验的深刻理解,因此与我们所认同和期待的“我爱你”有着本质不同。

唉,那怎么才能与“致幻”的大模型良好共处呢?伤脑筋啊……

参观者在2024 世界智能产业博览会展台了解数智本草大模型 李然 摄

如何与人工智能共处

面对一时无法根治的大模型“知识幻觉”,我们怎么办才好?

科大讯飞董事长刘庆峰认为,“知识幻觉”虽然防不胜防,但可以利用技术手段设法矫正。AI大模型应当至少补充在线实时搜索与专业数据库动态接入两大“工具包”,让大模型的回答也过一遍“智能检校”。

不久前,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病人工智能大模型,就把主要精力放在了动态更新权威来源知识、增加多渠道溯源机制两方面。研发者表示,事关临床,决策可信度不敢稍有怠慢。这种谨慎,应当是大模型未来升级必备的品质。

当然,很多专家建议,如果是普通使用者,还是交叉比对一下不同模型的回答才好。3个大模型就算顶不上诸葛亮,也能让安心的程度高上几分。

不过,大模型“知识幻觉”,当真就一无是处吗?

其实,“一分为二”的眼光,也该用于“知识幻觉”。如业内人士所言,“幻觉”也意味着大模型“创造力”的萌芽。

360集团创始人周鸿祎接受采访时曾表示,“幻觉”对于实现AGI(通用人工智能)极其重要。实际上可以说,模型能力越强,“幻觉”也越强。换句话说,“幻觉”也就是人工智能的“灵感”。不大靠谱是代价,但不羁的想象力也是助力科研的潜能源泉。广受媒体关注的AI预测蛋白质结构,立下功劳的就是大模型的“幻觉”。

沈阳也承认,“幻觉”可能成为突破人类思维定式的“超现实引擎”,AI有可能藉之创造新的视觉和听觉体验,为游戏和文学创作打开不一样的世界。

看来,初出茅庐的大模型,已经颇有艺术家气息了……

说来说去,搞清楚“知识幻觉”到底是怎么回事,它其实并不可怕。我们使用AI,当有所节制;引导AI化“想象力”为生产力,办法也会日新又新。与AI大模型共度的时光,虽有乌云,但更灿烂的是乌云的金边。

原标题《AI,如何走出“知识幻觉”》

半月谈记者:朱涵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大结局要来了?伊朗开出六大停战条件,特朗普回应4个字

大结局要来了?伊朗开出六大停战条件,特朗普回应4个字

混沌录
2026-03-25 16:22:08
美日达成一致,特朗普让日本在台海“打响第一枪”!中方反击到了

美日达成一致,特朗普让日本在台海“打响第一枪”!中方反击到了

寻迹追心
2026-03-26 09:15:11
黄金跳水跌破4430美元,白银失守70美元

黄金跳水跌破4430美元,白银失守70美元

21世纪经济报道
2026-03-26 14:15:54
现货黄金突破4540美元/盎司

现货黄金突破4540美元/盎司

证券时报
2026-03-26 09:22:05
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

新浪财经
2026-03-25 01:53:52
王国本:江西省人大常委会原副主任

王国本:江西省人大常委会原副主任

王姐懒人家常菜
2026-03-26 13:38:47
国安名宿炮轰:中超边路断档!认可杨希实力,邓捷夫是“半吊子”

国安名宿炮轰:中超边路断档!认可杨希实力,邓捷夫是“半吊子”

体坛鉴春秋
2026-03-26 12:23:21
1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

微野谈写作
2026-01-27 06:00:03
王晶曝陈百强真正死因,64岁何超琼颜面尽失

王晶曝陈百强真正死因,64岁何超琼颜面尽失

君笙的拂兮
2026-03-22 03:44:36
以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

星辰大海路上的种花家
2026-03-25 13:09:41
20亿美元还不够!中企宣布,对巴拿马索赔涨价,巴政府内部已乱套

20亿美元还不够!中企宣布,对巴拿马索赔涨价,巴政府内部已乱套

李健政观察
2026-03-26 11:11:27
以色列批准战争期间征召40万名预备役人员!美国陆军将新兵征召年龄上限从35岁提升至42岁,还给曾犯大麻持有罪的人开绿灯

以色列批准战争期间征召40万名预备役人员!美国陆军将新兵征召年龄上限从35岁提升至42岁,还给曾犯大麻持有罪的人开绿灯

大象新闻
2026-03-25 22:45:22
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
中东睿评|表层冲突烈火焚烧,深层矛盾坚如寒冰:美以对伊朗战争的表与里

中东睿评|表层冲突烈火焚烧,深层矛盾坚如寒冰:美以对伊朗战争的表与里

澎湃新闻
2026-03-25 13:14:37
马刺大胜送灰熊出局,本赛季常规赛西部前十球队已全部出炉

马刺大胜送灰熊出局,本赛季常规赛西部前十球队已全部出炉

懂球帝
2026-03-26 12:27:11
同样是妹妹,王熙凤为何称呼薛宝钗为薛姑娘,称呼林黛玉为林丫头

同样是妹妹,王熙凤为何称呼薛宝钗为薛姑娘,称呼林黛玉为林丫头

铭记历史呀
2026-03-26 11:13:56
玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

洞读君
2026-03-04 14:30:12
昨天杭州有医院门诊突然多了不少“跑友”,主动要求检查心脏功能!医生:长期跑步不等于心肺功能没问题

昨天杭州有医院门诊突然多了不少“跑友”,主动要求检查心脏功能!医生:长期跑步不等于心肺功能没问题

大风新闻
2026-03-26 08:55:08
等不来特朗普,普京抢先一步来华!美国终于认栽:拦不住中国了

等不来特朗普,普京抢先一步来华!美国终于认栽:拦不住中国了

小聪明说科普
2026-03-25 17:19:57
2026-03-26 14:59:00
学申论的谈妹 incentive-icons
学申论的谈妹
半月谈APP,党媒更懂公考
15877文章数 25597关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
本地
手机
教育
公开课

艺术要闻

哪一座桥不是风景?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

手机要闻

存储涨价苦了国产品牌、普通消费者,苹果却不受影响

教育要闻

高考地理中的花海经济

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版