![]()
“现在大部分AI,都是“金鱼”记忆。
“你记不记得我昨天说的那个项目?”
每天,大量的用户向ChatGPT、Claude、Gemini抛出这个问题,然后收获一个礼貌而陌生的回答:“我没有之前对话的记忆,可以提供更多信息吗?”
AI的智商在飙升——OpenAI的模型在数学竞赛中屡创佳绩,Google的Gemini能一口气读完长文档。但在这个关于“记得你”的最基本问题上,AI像个金鱼。
这是个笑话,也是个信号。当整个行业都在比拼“谁更聪明”时,一个被忽视的真相正在浮出水面:推理能力正在被快速攻克,而记忆才是真正的瓶颈。2025年12月,OpenAI CEO萨姆·奥尔特曼在采访中直言,AI的下一大步将来自“无限记忆”——能够长期记住用户、偏好和过往互动的能力。他坦言,当前的AI记忆功能“依然非常原始、非常早期”。
大多数AI都是“金鱼”?
主流大模型的设计存在一个根本性的缺陷:每次对话都是独立的。模型处理完当前请求后,不会保留任何关于这次交互的信息。下次你再打开对话框,它就像第一次见你一样——不记得你的名字、你的偏好、你三小时前说的关键信息。
这不是某个产品的疏忽,而是整个技术范式的结构性缺陷。当前主流大模型采用的Transformer架构天生缺乏真正的“长期记忆”模块,所有信息都必须在有限长度的上下文窗口中一次性提供。
Gartner在2026年的报告中指出,至少50%的生成式AI项目在概念验证后即被放弃,原因包括数据质量低下、风险控制不足、成本攀升或商业价值不清晰。这背后反映的正是数据基础和治理能力跟不上AI模型迭代速度的深层问题。
“回忆”不等于“记忆”
问题摆在那里,解法也在分化。
2025年至2026年,一个全新的技术方向正在成形——“AI记忆层”(AI Memory Layer)。这些项目的核心理念很简单:给AI配一个专属的“记忆芯片”,让它能够跨对话、跨场景地记住、学习和成长。
从技术路径上看,当前市场呈现几个不同的探索方向:
第一类:外挂记忆层。以Mem0、Zep等为代表,它们作为独立的记忆服务运行在AI模型之外。当你跟AI对话时,这个系统会自动提取关键信息——你的名字、职业、偏好、说过的重要事情——存储起来,下次你再提起时,它能把这些记忆“喂”给AI。根据官方数据,Mem0项目在GitHub上已获得约41000颗星,Python包下载量超1400万次。AWS也选择Mem0作为其新Agent SDK的AI记忆提供商。
![]()
图示:Mem0记忆层在AWS数据流中的位置
第二类:架构级革新。更具颠覆性的是直接在模型内部重构“记忆”模块。2026年1月,DeepSeek发表了关于“Engram”模块的论文,提出“查—算分离”架构——将事实性记忆从神经网络计算中剥离,转向确定性的高效查找。据论文所述,在处理2万字以上长文本时,推理延迟降低62%,同时保持98.7%的语义一致性。这一技术将MoE(混合专家模型)专注的复杂组合推理与静态记忆的常数时间O(1)查找相分离。
大模型上的“记忆检索”架构实践时间尚短,能否在实践中落地并经受住考验仍有待观察。
当AI真的记住你
体验的代差正在形成
理论讲完了,我们来聊聊体验——这才是用户真正关心的。
想象两个场景:
场景A:你打开AI,像往常一样说“帮我写个方案”。它问:“请问是关于什么项目的?”你答:“上次说的那个电商平台。”它又问:“你能再提供一些背景信息吗?我不记得了。”你叹了口气,开始重新录入需求清单。
场景B:你打开AI,它主动问候:“早安,上次那个电商平台的方案进展如何?需要我续写第三章的数据分析部分吗?”
这不是科幻。2025年4月,OpenAI将ChatGPT的记忆功能升级为可参考全部历史对话的长期记忆系统,能跨对话保留用户偏好、工作内容与常用格式。Google也为Gemini上线了“个人智能”功能,可经用户授权后调取Gmail、Google Photos等个人数据,实现跨应用的语境理解。xAI则于2025年4月引入了长期记忆能力,Anthropic于同年8月加入了对过往对话的Recall功能。
但这场记忆竞赛才刚起步。人类所有的公开数据可能都会被大模型用完,后期AI很大的一个方向会是下沉到每个人身边,实现个性化,记忆这件事情就变得非常重要。
记忆能带来多大的提升?
+26%准确率vs91%更快响应
Mem0在官方博客和GitHub页面中公布了一系列基准测试数据,将其记忆方案与两种替代方案进行对比:
![]()
数据来源:Mem0官方README及研究摘要
最值得关注的是第一个数字——对OpenAI原生记忆的性能超越。当一个“外挂”记忆层能够比AI模型自带的原生记忆更准确地回忆信息时,这本身就说明:当前主流AI的记忆能力还远未成熟。独立基准测试机构Cognee的对比研究显示,不同记忆方案在同样的LOCOMO数据集上表现存在显著差异,且小规模测试中结果波动较大。
但这场记忆竞赛真正的价值或许不在benchmark分数本身。在医疗、金融、法律等高风险领域,一个记错关键信息的AI带来的代价,不会是“准确率低了几个百分点”这么简单位的一句话。
当然,记忆也不是万能药
记忆技术正受到产业界和学术界的密切关注,但这条路上仍有几个核心挑战尚未解决。
记忆污染与遗忘。如果AI记住了错误信息,如何修正?更重要的是,当注入大量新知识时,模型可能“覆盖”旧记忆——这在学术界被称为“灾难性遗忘”。如何在学习新内容的同时保留旧记忆,仍是前沿研究方向之一。
隐私悖论。AI“记住你”的能力越强,隐私风险就越大。你的偏好、习惯、弱点都可能被记录。Gartner预测,到2027年,超过40%的AI相关数据泄露将由跨境不当使用生成式AI造成。有学者提出“数据下毒”等保护性策略,但这些措施是否能投入实际应用仍有待观察。Gartner预计,到2026年,应用AI信任、风险和安全管理(AI TRiSM)控制措施的企业将减少至少50%的不准确或非法信息摄入。
评测标准之争。记忆系统的评测本身也充满争议。比如,有人质疑Mem0的基准测试存在“数据造假”“毫无意义的测试”,这一行业事件凸显了记忆系统评估方法论的混乱。如果连“哪个记忆系统更好”都无法达成共识,那么整个产业走向标准化和成熟还需要时间。
更深层的问题是:当AI真的能记住一切,人类还愿意跟它对话吗?
记忆正在成为AI的下一个战场
回望AI发展的编年史,每个阶段都有不同的主角。
第一阶段是“算力”:英伟达的GPU成为硬通货。第二阶段是“模型”:OpenAI、Google、Anthropic围绕参数量的竞赛尚未结束。第三阶段,我们正在进入——记忆。
这不是说推理不重要。推理是AI的智商,记忆是AI的经验。一个只有智商没有经验的AI,像个天才儿童——聪慧但不可靠。一个既有智商又有经验的AI,才是真正可靠的专家。
奥尔特曼坦言,当前的AI记忆仍处于“GPT-2时代”——言下之意是,它离真正的成熟还有好几个代际的差距。谁能在“记忆”这个点上实现突破,谁就可能定义下一代AI的形态——不是更聪明的AI,而是更懂你的AI。
而对于用户来说,真正的变革或许不是AI能做多难的数学题,而是它能否在你开口之前,就知道你要说什么。
毕竟,我们需要的不是一个每次都要重新认识的陌生人,而是一个陪伴我们、理解我们、记住我们的——伙伴。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.