网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

你的AI"失忆"了：生产环境上下文丢失的复盘

2026-05-06 00:12:22　来源: 薛定谔的BUG

北京举报

0

分享至

凌晨两点，工程师盯着日志发呆。系统通过了所有内部测试，上线后却像得了健忘症——对话几轮后开始自相矛盾，把已经确认过的事再问一遍，最后彻底"人格分裂"。没有报错，没有崩溃，只有缓慢的 coherence 崩塌。

这不是 bug，是设计缺陷

大多数 AI 系统本质上是无状态的。每次请求都是独立 prompt，"记忆"靠把历史消息塞进上下文窗口来模拟。这招在 demo 里光鲜亮丽，规模一上去就露馅。

原文作者团队踩的坑，几乎是行业通病。他们试了四种方案，每种都看似合理，每种都暗藏杀机。

方案一：消息缓冲——最简单的陷阱

最直接的做法：保留最近 N 条消息。代码写起来就一行：

context = last_n_messages(conversation, n=10)

问题来得很快。长期约束丢了——用户第一周设定的预算上限，第十轮对话时被挤出窗口。已经澄清的歧义重新冒头，AI 又开始问"您说的是 A 还是 B"。

把 N 调大？只是推迟崩溃。上下文窗口（context window）就那么大，历史占多了，推理空间就被压缩。这是零和博弈。

方案二：摘要层——优雅的慢性毒药

既然完整历史存不下，那就压缩。用模型生成对话摘要，再叠加最近消息：

summary = summarize(conversation_history)

context = summary + recent_messages

听起来完美：token 用量可控，核心信息保留。实际运行后，团队发现摘要会随时间漂移（drift），关键细节被抽象掉，错误无声地累积。

最致命的是单向性。一旦某次摘要曲解了用户意图，后续所有交互都建立在这个错误地基上。没有机制检测"摘要是否还准确"，也没有回滚能力。

方案三：向量检索——相关性≠正确性

转向向量数据库（vector database），用语义搜索捞取相关片段：

relevant_chunks = vector_db.search(query_embedding)

context = relevant_chunks + recent_messages

比前两种聪明，但可靠性没好到哪去。检索质量极度依赖查询措辞（query phrasing），用户换个说法，可能捞出完全不同的内容。隐式上下文（比如没出现在查询词里的约束条件）根本进不了检索范围。

更隐蔽的 bug：相关性评分不理解时间有效性。系统可能捞出三个月前的"当前状态"，而用户的情况早已改变。

方案四：混合架构——冲突的交响乐

走投无路时，团队把三种方案拼在一起：最近消息 + 周期摘要 + 检索片段。看起来层层加固，实际成了层层埋雷。

典型失效场景：摘要说用户偏好 A，检索捞出旧记录显示 B，最新消息暗示 C。模型被迫同时消化三个互相矛盾的信息源，经常选错。

这时候团队意识到一个不舒服的事实：他们一直把记忆当成压缩问题来解决，而不是状态管理问题。

核心矛盾：有限窗口 vs 无限状态

上下文窗口的物理限制是硬边界。即使窗口再大，历史 vs 推理的权衡永远存在：塞更多历史，留给模型思考的空间就少；保推理空间，就得丢弃历史。

更深层的问题是 token 相关性不等于语义重要性。截断策略默认"最近=重要"，但现实中：十条消息前的约束可能是关键，最后三条可能是闲聊。模型没有内在机制区分这些。

大语言模型（LLM）本身不"追踪状态"。它们从文本推断状态，没有结构化记忆，没有持久锚定，没有超越当前 prompt 的"真相"概念。所谓的记忆，只是概率性重构，不是真正的系统能力。

为什么内部测试发现不了

作者的系统通过了所有内部测试，却在生产环境缓慢失血。根源在于测试场景的局限性：短对话、单一任务、清晰边界。真实用户会跨会话、跨主题、跨时间地累积上下文，测试用例覆盖不到这种长尾。

小规模时像用户不一致，规模上去后才暴露系统性缺陷。这种" subtly broken "比崩溃更难排查——没有错误日志，只有体验劣化。

给从业者的实用清单

如果你正在做对话 AI 产品，这几条能帮你少踩坑：

1. 明确区分"会话状态"和"对话历史"。前者是结构化的、可验证的，后者是文本的、易漂移的。

2. 任何摘要机制都需要校验回路。问自己：如果摘要错了，系统怎么知道？

3. 向量检索要加时间衰减和显式过滤条件，别让"相关"偷换"当前"。

4. 混合架构必须有冲突消解策略。多个信息源打架时，优先级规则是什么？

5. 测试用例要包含长对话、多会话、跨主题切换。模拟真实用户的"不规矩"行为。

这件事的真正价值

上下文丢失不是技术细节，是产品定义问题。当用户说"AI 记不住我说的话"，他们期待的到底是什么？是字面意义上的文本存储，还是被理解的连续感？

原文作者的复盘揭示了一个行业盲区：我们都在用工程手段模拟"记忆"，却很少追问记忆的本质是什么。也许下一代对话系统的分水岭，不在于窗口大小或检索精度，而在于能否建立真正的状态语义——让 AI 知道什么该忘、什么必须记得，以及什么时候该主动确认"我还对吗？"。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

19岁，常青藤辍学，这群中国年轻人重构了AI记忆

量子位 2026-04-04 16:21:02
0 跟贴 0
ACL 2026｜AI for聋哑群体，港理工开源思考型手语翻译模型

机器之心Pro 2026-05-05 15:22:29
0 跟贴 0

RouteMoA：无需预推理的动态路由，实现高效多智能体混合

机器之心Pro 2026-05-05 15:04:19
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0

吴宜泽斯诺克世锦赛夺冠成首位00后斯诺克世锦赛冠军

央视新闻客户端 2026-05-05 05:39:09
11815 跟贴 11815

横跨大西洋11小时，中国开发者用Mac跑Llama 70 B？评论区吵翻了

新智元 2026-05-03 19:13:05
126 跟贴 126
5月5日5点55分，GPT-5.5自己选客人开派对！Codex反超Claude Code

新智元 2026-05-05 17:07:29
12 跟贴 12

用AI复刻童年游戏，零成本找回老玩家快乐

爬虫饲养员 2026-05-05 10:29:32
0 跟贴 0
美国的规则遇到校车要等待，偏偏有头铁的，下秒就被直接追击！

逗趣乐园 2026-05-05 09:47:21
1 跟贴 1
达索阵风战机，基于一个不寻常的概念设计的：“全角色”！

动感丸子 2026-05-04 13:25:28
1 跟贴 1
095高考数学全国卷（理）复盘 1-17 等比、等差数列的计算

我服子佩 2026-05-04 20:13:04
1 跟贴 1
央视官宣！歼35AE出口版首次亮相，该国将成首个海外用户！

芮予猪猪 2026-05-05 03:53:31
1 跟贴 1
莫氏鸡煲上线汤料包5分钟售罄4000多份，累计卖出4万多份，总销售额破160万元，记者实测：1分钟抢到两包

极目新闻 2026-05-04 09:46:46
8519 跟贴 8519
CMU开源首份Agentic Search日志数据，把Agent拆开给你看

机器之心Pro 2026-02-09 12:05:13
0 跟贴 0
曲水兰亭旗下的概念餐厅

小朋友手工 2026-05-05 09:25:38
0 跟贴 0
096高考数学全国卷（理）复盘 1-18 立体几何线面垂直以及二面角

我服子佩 2026-05-04 20:13:23
1 跟贴 1
景区装电梯无痛爬山被质疑过度开发

极目新闻 2026-05-02 17:18:12
4162 跟贴 4162
金融打工人终于不用熬夜做PPT了

薛定谔的BUG 2026-05-05 23:16:09
0 跟贴 0
华谊兄弟余波未了：济南长清电影小镇摘牌，西城集团血亏数亿投资

中国能源网 2026-05-05 17:32:04
54 跟贴 54
抗癌12年，没复发没转移！掏心窝子分享7个生活规则，供大家参考

老白者乎 2026-05-02 05:49:54
0 跟贴 0
这是真正懂篮球的人，教出来的孩子，尤其懂现代篮球规则

逗趣乐园 2026-05-03 09:23:13
1 跟贴 1
媒体：霍尔木兹海峡一声惊雷炸响战争的引信已经点燃

国是直通车 2026-05-04 21:08:48
21 跟贴 21
俄罗斯宣布与乌克兰实施胜利日停火

财联社 2026-05-05 09:57:03
4537 跟贴 4537
印度网友：真希望我们的古代文本也有这么朗朗上口的韵律给孩子

为了更好 2026-05-02 03:43:01
3 跟贴 3
真人秀开除现场：当事人复盘自己怎么搞砸的

追星雷达站 2026-05-05 15:54:12
0 跟贴 0
在线尘埃粒子计数器厂家梳理：生产环境空气质量监测的可靠选择

太阳的向日葵2 2026-05-04 12:17:06
0 跟贴 0
看完《黑夜告白》再看《低智商犯罪》，真是没对比就没伤害

往史过眼云烟 2026-05-05 22:08:36
6 跟贴 6
文班：我消耗了太多体力做了一些对球队并没有太大帮助的事情

北青网-北京青年报 2026-05-05 19:44:31
61 跟贴 61
接好运！上海女子200元买刮刮乐，30元面值的喜相逢刮中100万元！

观威海 2026-05-05 10:42:12
128 跟贴 128
异地恋女友日常报备：护日、跑代码、美容院

YYz 2026-05-04 02:11:45
0 跟贴 0
深圳楼市，咨询量爆了

南方都市报 2026-05-05 11:04:16
3150 跟贴 3150
实探郑州中牟蒜地：免费抽蒜薹持续近一个月，有人从海南专程来，农户提供午餐

环球网资讯 2026-05-05 09:36:24
608 跟贴 608
WTI原油期货跌幅扩大至3%，报103.195美元/桶

每日经济新闻 2026-05-05 16:57:23
16 跟贴 16
伊媒：伊朗已启动霍尔木兹海峡通行管理新机制

财联社 2026-05-06 01:56:10
0 跟贴 0
以西方神器击坠东方神明，韦伯的跨领域概念续写

叨哔叨动漫解说DY 2026-05-05 17:39:16
3 跟贴 3
黄一鸣说不起诉王思聪后，正面怒怼网友，说底层生活的人都是烂人

晓帝爱八卦 2026-05-05 21:56:46
12 跟贴 12
张雪父子，共同亮相赛场

鲁中晨报 2026-05-05 16:58:04
36 跟贴 36
语法第1课-英语简单句的造句法则和基本语法概念（下）

沙中的世界 2026-05-03 12:46:43
6 跟贴 6
广东一景区岩石被染成五彩色，景区回应：是环保涂料

上观新闻 2026-05-05 13:44:14
92 跟贴 92

小龙虾大量上市，今年为啥遇冷了？店家：4个原因，太现实了

小龙虾大量上市，今年为啥遇冷了？店家：4个原因，太现实了

餐饮新纪元

2026-05-05 07:11:55

俄副部长叛逃美国，俄军每天最低伤亡千人，仍在组织新攻势！

俄副部长叛逃美国，俄军每天最低伤亡千人，仍在组织新攻势！

知兵

2026-05-04 16:06:33

今年五一，楼市扯下了最后遮羞布

今年五一，楼市扯下了最后遮羞布

房产老司机

2026-05-05 11:35:27

刚刚确认：明天抵达湖北！这波太猛

刚刚确认：明天抵达湖北！这波太猛

极目新闻

2026-05-05 19:40:16

河北邢台“一家五口被害案”凶手已被执行死刑，家属：独自在5位家人坟前告慰，伤痛永远无法消失

河北邢台“一家五口被害案”凶手已被执行死刑，家属：独自在5位家人坟前告慰，伤痛永远无法消失

极目新闻

2026-05-05 14:33:25

女性跑步：暴露这个隐私，是性感吗？

女性跑步：暴露这个隐私，是性感吗？

马拉松跑步健身

2026-05-05 19:18:07

泽连斯基为什么宣布5月6日起乌军单方面停火？

泽连斯基为什么宣布5月6日起乌军单方面停火？

名人苟或

2026-05-05 09:54:37

浏阳爆炸已致26人死亡，工厂的“防爆距离”，为什么没起效？

浏阳爆炸已致26人死亡，工厂的“防爆距离”，为什么没起效？

社会酱

2026-05-05 15:44:11

嵩山标语牌上写“爬不动了吧哈哈哈”，因有人质疑其“嘲讽游客”被换下，网友惋惜：原标语生动有梗

嵩山标语牌上写“爬不动了吧哈哈哈”，因有人质疑其“嘲讽游客”被换下，网友惋惜：原标语生动有梗

天津人

2026-05-05 18:57:00

表姑向我借了85000，17年没还，我去银行注销旧卡时，柜员看了眼卡说：女士，最后一笔转账留言您要看吗？

表姑向我借了85000，17年没还，我去银行注销旧卡时，柜员看了眼卡说：女士，最后一笔转账留言您要看吗？

大爱三湘

2026-05-05 19:43:43

欧洲情报声称：普京已在地下掩体度过数周，并禁止工作人员用手机

欧洲情报声称：普京已在地下掩体度过数周，并禁止工作人员用手机

激情与荣耀并存

2026-05-05 15:34:41

连续3场3-0横扫！国乒男团完胜澳大利亚，强势跻身世乒赛16强

连续3场3-0横扫！国乒男团完胜澳大利亚，强势跻身世乒赛16强

全景体育V

2026-05-05 18:28:04

高市早苗在澳大利亚这一跪，跪出了日本最丑陋的一面！

高市早苗在澳大利亚这一跪，跪出了日本最丑陋的一面！

朋笔生辉

2026-05-05 15:10:25

范冰冰远东电影节夺奖，身穿越南设计师高定惊艳全场

范冰冰远东电影节夺奖，身穿越南设计师高定惊艳全场

缅甸中文网

2026-05-03 15:25:26

零缓冲，全国一刀切！从6月1日起，车主自己去车管所“横着走”！

零缓冲，全国一刀切！从6月1日起，车主自己去车管所“横着走”！

夜深爱杂谈

2026-05-05 10:14:28

喊了六声“停下”，椅子还在动：享界S9零重力座椅爆“夹娃”事件

喊了六声“停下”，椅子还在动：享界S9零重力座椅爆“夹娃”事件

听心堂

2026-05-05 21:49:02

湖南浏阳烟花厂爆炸事故已致26人死亡61人受伤，“发布会现场，全体起立，向遇难人员默哀”

湖南浏阳烟花厂爆炸事故已致26人死亡61人受伤，“发布会现场，全体起立，向遇难人员默哀”

都市快报橙柿互动

2026-05-05 13:48:29

强词夺理！“中国不应获得最先进芯片，美国才应领先”

强词夺理！“中国不应获得最先进芯片，美国才应领先”

观察者网

2026-05-05 18:52:05

吴宜泽：奥沙利文在决赛关键时刻给我发短信，让我试着打出自己的风格

吴宜泽：奥沙利文在决赛关键时刻给我发短信，让我试着打出自己的风格

懂球帝

2026-05-05 21:25:07

酒局持续4小时，从下厨招待到拿刀拼命，妻子到底经历了什么

酒局持续4小时，从下厨招待到拿刀拼命，妻子到底经历了什么

笑谈历史阿晡

2026-05-04 12:02:08

薛定谔的BUG

有态度网友ytd

2142文章数 41关注度

往期回顾全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

媒体：中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

头条要闻

媒体：中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

体育要闻

全世界都等着看他笑话，他带国米拿下冠军

娱乐要闻

内娱真情谊！杨紫为谢娜演唱会送花篮

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

家居

艺术

本地

军事航空

亲子要闻

这个五一，带宝宝来北海看海啦～银滩细沙海浪，是小朋友最爱的天

家居要闻

灵动实用生活艺术场

艺术要闻

AI应用“豆包”要收费，第一批“韭菜”是谁？

本地新闻

用青花瓷的方式，打开西溪湿地

军事要闻

特朗普威胁伊朗不要向美国船开火

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版