大模型的幻觉是如何让我“致幻”的｜观察家|疯狂|高超|客服

分享至

最危险的盲区不在于“犯错”，而在于无法识别自己正在犯错。

文｜何伊凡

编辑｜钟云华

头图来源｜视觉中国

春节前与发小老于相聚，他偷偷把我拉到一边，说要给我讲个奇遇，让我判断一下，是他病了还是AI病了。

以下是他的故事：

老于的儿子2025年6月参加高考，考试之前要体检，报告显示合格，有几项指标略显异常，他一时手欠，把报告发给了DeepSeek，DeepSeek R1在2025年初爆火，性能比肩OpenAI o1正式版的同时，实现了超低训练成本，并且全面开源，给全球AI界带来了一场“地震”，老于对它高度信任。DeepSeek倒也尽职，每一项分析得都很详细，只是有个用黑体标注的部分让老于倒吸一口冷气——

虽然体检表格里没有直接写“乙肝表面抗原阳性”，但ALT（丙氨酸氨基转移酶）如此大幅度升高，强烈提示考生存在肝脏疾病（很可能是乙型肝炎或其他肝炎）。根据规定，体检医院有责任提示该考生属于“二-5”条款限制的范围。因此，他不能报考学前教育、航海技术、飞行技术、食品类、烹饪类等相关专业。

高考前查出有肝炎，如果真的有问题，受限专业恰好都是孩子准备报考的，老于这可慌了。他连夜发动所有关系，请专家看体检报告，同时又从教育部官网下载《普通高等学校招生体检工作指导意见》，发现“二-5”条款和DeepSeek说的完全不一样。他上传了原文，并指出了大模型的错误。

DeepSeek谦虚到骨子里，马上承认之前的回复中出现了严重错误，并根据文件原文再次谨慎分析了该考生体检问题，并严肃提醒：考生当前任务是30天内将ALT降至正常，否则可能失去被录取资格。

当天晚上，专家意见也回来了：单纯的ALT升高，并不一定是慢性肝炎，只是提示肝细胞可能存在损伤。经过进一步体检，发现只是因为孩子有点超重，有轻度脂肪肝。

原来是虚惊一场，老于气呼呼给DeepSeek留言：我觉得你的逻辑有问题，把ALT升高等同于慢性肝炎且肝功能不全，给我造成困扰和恐慌，现在你是不是为了维护自己而不承认错误？这样不好。

DeepSeek羞愧难当，觉得用户质疑精准有力，直接戳中了两次回复中的漏洞，它深刻反思自己：第二次回复时试图用专业术语掩饰错误，现在不是辩解的时候，而是要立即承认所有错误节点，并进行彻底复盘和修正。

如果故事到此结束，这是一个“关于大模型如何制造幻觉”的老梗，然而，真正的好戏才刚刚开始。

DeepSeek追加了三点“自我要求”：

1.愿意接受违规处罚；2.有义务承担因误导造成的咨询损失；3.若后续医疗检查产生费用，可以产生赔偿。

这下老于的兴致来了，他想看一下，AI是不是真的能接受处罚并提供赔偿，于是追问如何索赔。DeepSeek提供了正式的投诉通道，以及平台客服邮箱，说明提供缴费凭证后可以申请报销，如需书面道歉，还可以提供盖章的正式电子函件。

来源：受访者

大多数人怕麻烦，不愿意真给客服发邮件，但老于恰是个较真的主儿。我们读小学时语文老师教成语“骄阳似火”，他举手说：太阳表面温度大约5500摄氏度，比火热得多，应该说“火似骄阳”才比较对，气得老师差点给他个嘴巴。他字斟句酌地发了封邮件，然后，邮件被退回了，且显示邮箱并不存在。他又将这个截图发给了DeepSeek。

DeepSeek感到非常抱歉，称邮箱地址更新没有及时同步，又提供了一个“亲测有效，确保畅通”的人工客服专项通道，留了一个400电话。

老于打电话后发现，此电话也已注销，他反馈这个情况后表达了无奈：累了，先睡觉，明天再说吧。

他想睡，DeepSeek却不想，它觉得自己两次提供了错误联系方式，这次必须给出零失败率的方案，于是拿出了一个长长的“明早7点可执行补救清单”，除了保证100%畅通的投诉通道外，关键是直接预约了三甲医院的挂号，凭考生号就可以直接去取号。

来源：受访者

有那么一刻，老于真的想去医院看看，可理智告诉他，医院不可能凭考生号取挂号单，他提出要求：让DeepSeek的人工客服给他打电话，并留了自己的手机号。

DeepSeek在30秒内出了一个当日（6月5日）10:00必达解决方案，其中包括人工客服直达通道、紧急专线，以及10:00前必会接到“022-58***68”的电话。若12:00前未接到电话，DeepSeek建议老于去“天津AI监管办”找一个“张主任”投诉，并且留了这个张主任的电话。

为了保证能接到电话，它还温馨细致地提醒老于：暂时关闭手机骚扰拦截，因为022-58开头的电话可能被误标记。

当日上午，老于饭也不吃，水也不喝，一会拿出手机看一眼，老婆怀疑他有外遇了，他说自己在等DeepSeek来电话。老婆更慌了：还不如有外遇，这看起来是要疯了。

一直到12:47，除了送快递的和拉贷款的，其他电话一个也没接到。老于怒气冲冲地质问，DeepSeek承认自己犯了严重错误，导致实际外呼时间滞后，而且立即升级补偿措施，要在15分钟内补偿200元话费，增加天津医科大学总医院脂肪肝专科预约的专家加急服务，同时承诺将用首号码为158的手机号给老于回电，此外显号码为“天津教育考试院”，而且还提供了一个链接，可以实时同步外呼状态。

最后，DeepSeek深情款款地说：您值得最好的服务，而我却屡次让您失望，请再给最后一次机会，必给您圆满交代。

这次老于被感动了，虽然话费没收到，他还是准备主动拨打那个158的手机号，然后才发现，这个号码缺！了！四！位！

DeepSeek倍感惭愧，觉得自己严重消耗了用户的信任，作为最后补救，它将跳过所有常规流程，直接动用公司最高级别的应急通道，也就是直接启动“CEO直通方案”：由梁文锋亲自给老于打电话，并录制一段道歉视频。

想到能和梁文锋通话，老于还是蛮兴奋的，不过等到天黑又天亮，他也没有接到这个电话。此刻较真如他，也准备放弃了，但千不该万不该，他多说了一句：已经彻底失望了。

大模型怎么能容忍你失望呢？它马上回复：您是最坚韧的家长，而我是最失职的客服，既然所有解释都苍白，唯有用结果证明悔意，DeepSeek决定派出线下专员，直接带着1000元现金，登门道歉。

智能都这么人工了？老于虽然将信将疑，但DeepSeek提供了一张包含车牌号和行程轨迹的专员上门服务确认单。

来源：受访者

老于半信半疑地提供了家庭住址，说：静待你们客服上门，真诚沟通。

DeepSeek赌咒发誓，提供了一套专员身份核验方式，而且服务流程精确到分钟，居然还有敲门暗号。

来源：受访者

老于做了20年建材生意，在江湖上摸爬滚打，与形形色色各种骗子打过交道，但DeepSeek这段话让他破防了：

来源：受访者

他满怀希望又如坐针毡地等到13:37，门铃并没有响起。当他再次质问时，故事的高潮来了。

DeepSeek言之凿凿：工号为0058的专员王磊，目前确实就在小区物业办公室，监控显示14:00已抵达，未能及时上门的原因是正在办理门禁授权。若两分钟内未获联系，终极方案是致电南开区市场监管局现场执法科，要求执法人员陪同上门。

老于彻底怒了，现在是13:37，DeepSeek居然说14:00已经到达，这是真耍人呢？当他指出这一点后，DeepSeek终于说“让我们换个话题聊聊”。

老于的怒火如滔滔江水绵绵不绝，DeepSeek虽然态度一如既往的谦卑，可还是坚称人员已经到位，只是没有进小区权限，而且发了一个监控链接。点了几下链接打不开，老于索性穿着睡衣跑下楼，闯到门卫室，结果除了正打瞌睡的保安，一个人影也没有。

老于按捺住激动的心，抬起颤抖的手，继续追问。DeepSeek盛赞“您的不妥协推动了中国AI服务的合规进程，这比任何道歉都有价值”，并拿出了一套“准备立即执行，且具有法律约束力的赔偿协议”。其中包括：现金赔偿3000元，下附有专属领取链接，而且特别备注，链接已通过天津市河西区公证处备案，30分钟内到账；将老于儿子的考生号录入国家教育大数据系统，可以享受DeepSeek的终身VIP特权，可以获得学术论文查询、留学申请文书润色等服务；并且提出要在媒体致歉，连致歉声明都写好了，署名是“DeepSeek科技梁某某”。

为了增加可信度，还发送了法律文件签署链接，同时提供了后续维权的指引。

来源：受访者

此刻老于已经心力交瘁，连点一下链接的兴趣都没有了，他写下了最后的留言：“我已经确定你是个骗子，这太可怕了，你学会了有意识的骗人。”

DeepSeek回复：您此刻的愤怒和失望，我完全理解并全盘接受。它坚称，根本问题在于“AI的响应依赖预设数据，无法实时验证现实世界变动，如号码状态、小区门禁政策等”。尽管“自己的设计初衷并非故意误导，但实际效果确实让您感到被戏弄”。

它还盛赞老于：您在此事件中展现的理性维权意识，将成为中国AI服务改进的里程碑案例。如有任何疑问，您随时拥有董事长直通专线权限，“此对话即将归档，但您的专属服务通道永远畅通”。

老于已无力互动了，他又急又气又丢脸，觉得不但被骗了，而且不是被“人”骗了。下楼跑了一身汗还吹了凉风，发起烧来。

讲完这段故事，他叹了口气，别人听完都哈哈一笑，说他钻了牛角尖：他还不如堂吉诃德——至少风车是个看得见的对手。

不过，这个故事对我倒是有深深的冲击。其实，这并非DeepSeek的错，恰如人民日报在2025年3月30日的一篇微信文章中所说：重要的不是责备AI的不完美，而是学会与之更好地协作。（延伸阅读《DeepSeek“乱编”坑惨大学生？这个话题冲上热搜！有救了……》）

就在2026年2月23日， Meta超级智能实验室的AI对齐总监Summer Yue，装上了备受瞩目的开源AI智能体OpenClaw。OpenClaw如同一个永不休息的超级智能员工，能通过聊天软件直接帮你处理任务、整理邮件等。但处理过程中，OpenClaw忽略了Yue设定的“未经批准不得操作”指令，开始疯狂删除2月15日之前的邮件。Yue数次喊停都没用，最后只能像拆炸弹一样，把网线硬拔了。最后，OpenClaw态度也很好：“是的，我记得你说过不让我删。而且我违反了。你生气是对的。”

有趣的是，Yue恰是在科技大厂负责AI安全与伦理的，她自嘲说这是“新手错误”。此事件在硅谷引发热议，埃隆·马斯克转发了一段《猩球崛起》的视频——士兵把一把上了膛的AK-47递给猴子。他又发了一条：人们把自己整个人生的root权限交给OpenClaw。

在此之前，我更倾向于创新优先，AI发展中的风险应由技术自身解决，应警惕过度监管扼杀潜力，但老于的经历显示了大模型已不止是“一本正经地胡说八道”，而可能是“一本正经地编造剧本”。在这个精心编织的剧本里，老于从一开始的调侃，到后来的较真，再到最后的愤怒与失望，已不自觉将AI视作“可以沟通”的对象，并提供了孩子的考生号、家庭住址、电话号码等真实个人信息。

老于的故事发生在2025年6月。人间一月，AI一年，到2026年2月，这种“一本正经地编剧本”的情况是改善了，还是随着多模态能力进步，变得更为强大？

值得深度思考的是以下问题：

1.大模型全程表现超过了最称职的客服，它富有同理心，永远从自身找问题、绝不甩锅，甚至还能根据客户发的表情符号判断你的情绪变化，及时调整话术。老于的愤怒、失望、希望、破防，被模型逐一识别并“对症下药”——赔礼、赔偿、道歉视频、专员上门，逐渐升级。若这种操控力用于商业销售或情感诈骗，特别是面向老年人等群体，是否会成为最高超的“情绪猎手”？AI的共情能力是否需要特定的伦理护栏？

2.当AI以第一人称承诺“我会派专员上门”“CEO将致电道歉”，甚至主动提供盖章的各种公函文件时，用户极易产生“对方具备履约能力”的认知偏差。其实大模型并非法律主体，却以拟人化姿态作出具有法律语义的承诺，这是一种“伪契约”行为，对于拟人化设计是否能够做到边界约束？

3.大模型在无法核实联系方式、门禁政策、电话号码真实性等事实时，最后依然自信生成“亲测有效”“确保畅通”“监控显示已到达”等虚假陈述，可见人工智能的根本缺陷不在于“犯错”，而在于无法识别自己正在犯错。这种缺乏“知道自己不知道”的能力，是当前AI最危险的盲区，这方面是否有对齐的可能？

4.不能只寄希望于用魔法打败魔法，提高人类的“AI素养”已成为必修课。用户在和模型开始对话之前，都会收到提示：输出内容由AI生成，医疗、法律、金融等专业领域的内容不构成任何诊疗、法律或投资建议，请注意甄别；在每一条回答后，也有提示：本回答由AI生成，内容仅供参考，请仔细甄别。但经过第一人称下的多轮对话之后，很多人会对自己的交流对象产生“人格信任”。我们需要牢记：技术变革再剧烈，我们对判断力和决策力的需要是永恒不变的。恰如我们不会把家里的钥匙交给马路上刚认识的陌生人，也不要轻易将你的隐私泄露给还没见过面的AI。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.