AI幻觉，如何“解蛊”|算法|上下文|人工智能|神经网络|ai幻觉

分享至

作者 | 玉城风

编辑 | 张来

“AI人文学的序章”之七

前段时间，以讹传讹的“DeepSeek向王一博道歉”的消息，闹得沸沸扬扬。有人梳理事情经过后说，这是一起“AI幻觉”导致的闹剧；也有人认为是粉丝人为搅浑水。一起娱乐圈的乌龙事件，因为与人工智能发生了关联，让“AI幻觉”的严肃命题再次受到人们的关注。

也就在不久前，全国首例“AI幻觉”案落槌——一位高考生的哥哥梁某在查询高校信息后，发现AI平台生成的信息存在错误，而AI仍信誓旦旦回答：如内容有误将赔偿10万元。一气之下，梁某将AI平台的研发公司告上法庭，要求赔偿。

杭州互联网法院作出一审判决，驳回诉讼请求。法院的判决，当然有着法理和现实的多重考量，而这一“首例”判例，进一步引起了人们对“AI幻觉”，以及对生成式人工智能服务的责任边界的热议。

01AI喝了致“幻”剂

“一本正经的胡说八道！”“死要面子，不懂装懂！”“明明喝醉了酒，偏要走直线！”不少人对AI幻觉问题深恶痛绝。而2025年8月，麦可思研究院的一项调查也显示，有78%师生曾遭遇“AI幻觉”的陷阱。

何为AI幻觉？英文原词是Artificial Intelligence Hallucination。Hallucination这个词，是指没有相应的客观刺激时所出现的“幻觉、幻象、幻听”，是一种比较严重的知觉障碍，一般是指生病或吸毒引起的类似症状。想象一下，一个人在安静、光线正常的房间里，却声称看到了不存在的东西，或者听到了奇怪的声音，这就是医学上所说的幻觉。

AI出现后，“AI胡诌”这一新现象的影响如此之大，以至于剑桥词典干脆将2023年年度词汇确定为“hallucinate”（产生幻觉），并在该词的字典释义中，直接增加了一个延伸释义，专指“AI产生幻觉，生成错误的信息”。这就好比给AI的这种“病症”在字典里正式“开了户头”。

图源：图虫·创意

简单来说，所谓“AI幻觉”，就是指AI生成了看似合理，却与事实严重不符的内容。

AI幻觉，大致上分为两类：一种叫“事实性幻觉”，另一种是“忠实性幻觉”。

比如，AI生成的人物图片手上有六个指头。又如，让AI写一篇关于古代丝绸之路美食的科普文章，AI写得头头是道，诸如“唐朝时期，丝绸之路上流行一种用仙鹤骨头和千年灵芝熬制的滋补汤，深受商队喜爱”云云。这样的美食，显然只有谵妄患者才会想得出来。又如，有学生让AI帮忙整理科学家的发明成果，AI说“爱迪生发明了蒸汽机”，可显然蒸汽机是瓦特改良发明的。

这些都属于“事实性幻觉”。

又如，如果用户要求AI“讲解一下龙飞凤舞”，但AI回答了“好的，我给你搜了几段舞蹈教学”，这就完全偏离了原始的问题。这叫指令不一致式幻觉。再如，假设在一个讨论中国传统节日的上下文中，用户问：“春节是什么时候？”AI回答：“春节是中国农历新年，通常在每年的1月或2月。”这个回答是正确的。然而，如果AI接着说：“春节是纪念屈原的节日，人们会吃粽子和赛龙舟。”这就是上下文不一致式幻觉。

这些则属于“忠实性幻觉”。

图源：pexels

AI幻觉不仅仅是计算机科技应用中的一个bug现象，它在现实世界中产生的负面影响，常常让人不堪其扰。对此，尝试过AI大模型查找资料或起草学术论文的朋友，肯定深有体会。

那么，AI幻觉有哪些特点呢？简单归纳，其特点包括：

表面合理。尽管荒谬错误，生成的内容看起来“很可信”“很自信”，有模有样，而不是“一眼假”的类型，很多时候非专业人士难以辨别。

上下文相关。AI幻觉生成的内容并不突兀和刺眼，它们通常与特定的上下文情境紧密相关，行文也流畅自然、浑然一体。不细看、细究，很容易蒙混过关。

不可预测。就像人做梦一样具有随机性。用户很难预测AI何时会产生幻觉，而且每次出现的幻觉也各不相同。

《我，机器人》剧照

当然，也有不少人对“AI幻觉”这个表述提出了异议。

他们认为，所谓“AI幻觉”，是一种被浪漫化的技术缺陷，AI并不能真的像人类一样产生幻觉。因为从医学或心理学上说，导致hallucination的原因包括中枢神经病变、情绪影响、暗示、弱视和重听、感觉剥夺、神经毒品致幻等等。

显然，AI产生“幻觉”的原理和机制，都与上述因素无关。它是基于算法和数据模型进行信息处理的，当数据存在偏差、算法存在漏洞或者训练不足时，就可能生成错误的内容。这和人类产生幻觉的生理和心理机制有着本质的区别。

因此，英国格拉斯哥大学的三名哲学研究人员为此专门写了一篇论文发表在权威学术期刊。这篇论文指出，聊天机器人“胡编乱造”回答的行为不应被称为“幻觉”，而应该用“胡说八道（bullshitting）”一词来描述才更准确。

02致“幻”成分，来自何方？

当然，名称是次要的。现在，我们更要关心的是，大语言模型这类AI工具的工作机制和原理，为何会导致“AI幻觉”问题？

对于这个问题，全国政协委员、西南财经大学大数据研究院院长寇纲做了一个相对较通俗的解释——他说，如果把人工智能想象成一个思考的人，它会在思考过程中形成一个“思维链”。人工智能做不到像人一样“并行”处理信息，而是在链上以“串行”的结构来思考。

如果它在思考的第一步，和我们预想的方向产生细微的偏差，可能只是一个“脑洞”，这样的“脑洞”会随着思维链一步一步向前串行地去扩张，就会导致它越来越偏离原始目标。

图源：pexels

简单而言，他认为，串联的“思维链”，容易导致“失之毫厘，谬以千里”。这就是大语言模型产生“幻觉”的原因。

从上面这种当前主流大语言模型的工作机制中，我们可以发现几个关键要素。正是它们的共同作用，导致AI幻觉的出现——

其一，数据偏差，语料库先天营养不良。

从技术本质上看，AI，尤其是基于深度学习的模型，都必须基于大量数据来生成回应或创作内容。数据是AI的“学习课本”，如果这本“课本”本身就有问题，AI自然会学到错误知识。

以自然语言处理模型为例，它们通过分析海量文本，学习词汇、语法和语义之间的关系。当接收到输入时，模型会按照概率，依据所学模式预测下一个最可能出现的词汇，从而生成连贯的文本。但问题在于，如果训练数据存在偏差、不完整，或者模型的学习不够精准，就可能在生成过程中“跑偏”，产生幻觉内容。

图源：pexels

而数据偏差，很可能源于数据收集过程中的局限性；或者，训练数据中某些信息被过度强化，而其他重要信息缺失。模型就可能在这些不全面的“知识”基础上，构建出错误的表述。

更何况，当前AI写作、AI洗稿，导致互联网上充斥着大量垃圾信源——有人愤怒地将其称为“电子粪坑”。基于这样的语料库进行的AI学习和推理，正如手持盗版地图进行导航，很容易“盲人骑瞎马，夜半临深池”。

其二，模型的“黑箱”本质为幻觉提供了温床。

深度学习模型常被称为“黑箱”，因为其内部的复杂计算和决策过程难以完全透明。模型由大量的神经网络和复杂的连接组成，在训练过程中，这些神经网络通过调整权重来优化对数据模式的学习。然而，我们很难确切知道每个权重调整的具体含义，以及最终模型是如何将输入转化为输出的。

这种不透明性使得模型在生成内容时，可能出现一些无法解释的错误。就像一个神秘工厂，我们只看到原材料（输入数据）进入，产品（输出结果）出来，但中间生产过程并不透明、充满未知（尤其是闭源模式的AI产品更是如此）。这就为“AI幻觉”的形成提供了温床，也不利于及时发现和解决问题。

《超少年密码》剧照

其三，“泛化难题”，令AI如“新手走迷宫”。

随着AI应用场景不断拓展，任务的复杂性也在增加。从简单的图像分类到复杂的多模态交互、开放式对话，AI面临的挑战越来越大。当任务超出模型在训练中所接触到的范围时，模型的泛化能力就面临考验。

例如，一个在大量新闻报道数据上训练的语言模型，在处理文学创作、专业学术讨论等领域的任务时，可能因为缺乏针对性的训练，而产生幻觉。这就如同一个新手被突然扔进迷宫，没有足够的经验和技能，只能苦苦摸索；或者就像给赛车装上超强引擎却未加固底盘，速度越快越容易失控——模型在面对复杂多变的任务时，由于缺乏良好的泛化能力，就容易底盘不稳、漂移打滑，产生“AI幻觉”。

03解“蛊”良药，何处觅得？

正如有人戏谑，AI幻觉，要么体现为“历史穿越剧”，要么创造出“学术鬼打墙”，还可能摆出“法律迷魂阵”……总之，就是细节精致得像瑞士制造的钟表，底层逻辑却破碎得如万花筒中的斑驳光影。

那么，解“蛊”的药方，藏在何处？

一是，扩大语料库，让AI更有知识。

知识图谱、语料库，堪称AI的“知识粮仓”。若粮仓里尽是过期粮，AI的“肠胃”自然会出问题。因此，持续扩充高质量数据是“祛幻”的根基。

大语言模型的学习能力、知识储量更新能力惊人，其自我“祛幻”能力也在不断进化。

例如，当网络热梗“恐龙抗狼”刚兴起时，部分AI软件还会一本正经进行说文解字，分析其语义和内涵；但经过很短时间的新一轮数据训练后，如今AI已能分辨其娱乐属性，不会再闹当初的笑话了。

再如，面对“9.11与9.9哪个更大”的“陷阱题”，早期AI产品可能因对小数点规则理解不足而答错。但通过引入更多数学教材和常识数据，如今已经不再是个问题。

图源：Unsplash

二是，数据治理，净化知识源泉。

解决AI幻觉的首要任务是治理数据。在数据收集阶段，要确保数据的多样性和全面性。通过扩大数据收集范围，涵盖不同来源、不同特征的数据，可以减少数据偏差。

例如，在图像识别训练中，收集来自不同环境（如白天黑夜、室内室外）、不同拍摄设备（如手机、专业相机）、不同角度的图像，让AI对物体有更全面的认识，避免因训练数据单一而产生“脸盲症”——比如将北极熊误认为萨摩耶犬。

同时，对数据进行严格的清洗和标注。去除噪声数据，确保标注的准确性，为AI提供高质量的学习素材。这就像给AI提供纯净、准确的知识源泉，帮助它在正确的基础上构建认知。

图源：图虫·创意

三是，打开“黑箱”，让深思更“可视”。

为了降低模型“黑箱”带来的风险，研究模型的可解释性至关重要。科研人员正在努力开发各种方法，试图理解模型内部的决策过程。例如，通过改进流程，更直观展示神经网络中不同部分在处理输入信号时的工作状态，从而帮助研究者了解模型是如何对数据进行分析和生成输出的。

一些新型的模型架构，也在尝试引入更多的可解释性设计，将传统的逻辑规则与神经网络相结合，使模型的决策过程更易于理解和解释。

当人们能够看清模型的“思考”过程，就能更容易发现和纠正可能导致幻觉的苗头性错误。

图源：Unsplash

四是，强化学习与对抗训练，磨砺AI的判断力。

强化学习可以为AI提供一种在动态环境中不断学习和优化的机制。通过设置合理的奖励机制，让AI在生成准确、可靠内容时获得“鼓励”，而在产生幻觉时受到“警示”，从而引导AI逐渐提高输出的质量。

对抗训练也是一种有效的方法——

让生成模型和判别模型相互对抗，生成模型努力生成逼真的内容，判别模型则尽力辨别生成内容的真假。在这种对抗过程中，生成模型不断优化，算法技术不断得到改进或提升（更稳定、更鲁棒），从而减少幻觉的产生。

五是，专业智慧引导，让AI成为“专”家。

在医疗、法律、金融等对准确性要求高的领域，将专业领域知识融入AI模型，可以有效提升模型在特定领域的准确性，减少幻觉。

04可贵的宽容：“AI幻觉”并非一无是处

很多深受其苦的朋友会说：“真希望科学发展得再快一点，早些克服AI幻觉！”

不过，话又说回来，从AI人文学的视角来看，如果完全消灭AI幻觉，不啻于扼杀AI的想象力。对于尚处幼年的AI技术，我们除了多些耐心，还要多点包容心态、辩证思维。

因为凡事都有两面。所谓的“AI幻觉”，同样如此。

有专家提醒，“AI幻觉”是大模型与生俱来的特点，极难消除。这源于大模型在海量数据训练中形成的概率关联机制——它并非像人类一样真正“理解”信息，而是通过统计规律生成答案。当数据存在矛盾或逻辑缺口时，模型为了“自圆其说”或者“不让你失望”，就可能输出看似合理却偏离事实的“幻觉”内容。

图源：Unsplash

有专家就认为，“AI幻觉”就好比人类创意工作者的“脑洞大开”，决定AI创造力和想象力，对于AGI(通用人工智能)而言极其重要。

例如，在药物研发过程中，新药分子结构的设计往往需要突破常规思维。大模型的“幻觉”能力，有时能让其跳出现有知识框架的束缚，“想象”出全新的分子结构组合，为科学家们提供新的灵感和启发。

同样，在蛋白质结构预测方面，面对复杂的生物大分子，AI的“幻觉”特质，能令其生成一些突破传统认知的结构模型。这些模型或许在初期看似离经叛道，但经过科学家的深入研究和验证，有可能成为开启新研究领域的钥匙。

而且，越是能力强的模型，可能往往越容易产生“幻觉”。比如DeepSeek，在“深度思考”模式下，它在小说、诗歌这类创意内容的生成上，表现优异，很长时间里明显胜出很多其他AI产品一大截。然而相对应的，它在严肃的学术性内容的创作中，则有时会表现得过于“活泼”，在史实、名言和引证出处方面，“自圆其说”的冲动过于强烈。

这好像是一对难以调和的矛盾——强大的学习能力让模型捕捉到数据中隐秘的关联性，却也因过度敏感而放大噪声。

所以，有专家就认为，如果我们强行通过规则约束消除“幻觉”，AI便只能沦为机械的知识“复读机”或“统计器”，而失去突破现有认知边界的能力与可能。

AI幻觉，就像一面棱镜，既照出当前AI技术的局限性，亦为我们了解AI、善用AI、改进AI，提供了更多的启示。

图源：Unsplash

对于AI幻觉，我们既不能放任自流，任其误入歧途；也不必因噎废食，将“幻觉”视为洪水猛兽。

理性的做法有很多——首先，前提是看清“AI幻觉”的真相和本质，学会理性看待，既不对AI生成内容偏信盲从，也不因暂时和偶尔的“犯傻”而对AI予以全盘否定；其次，熟悉现有各类AI工具的基本特征（长处和短处），从而针对自己的需求类型，聪明地选择具有不同特长的AI工具；其三，熟悉基本的AI提示词（“咒语”），掌握基本的操作规律和技巧，从而更好地驾驭AI、善用AI。

唯有这样，我们才能在AI的可靠性与创造性之间找到某种平衡，才能让AI真正成为人类智慧的延伸，而非失控的“造梦机器”。

（作者是AI人文学研究者、博士）

值班主编 | 张来

排版 | 八斤

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.