网易首页 > 网易号 > 正文 申请入驻

你的AI Agent越用越蠢?港中大、浙大戳破「记忆」的谎言

0
分享至


新智元报道


【新智元导读】你是否在使用Agent工作或者写代码时,总感觉上下文不够用?或者感觉反复使用Agent时并没有变得更聪明?感觉目前的记忆方案仍然不够用?今日,香港中文大学联合浙江大学发布的一篇论文关注了这个问题,并引起了学术界广泛讨论:你以为Agent在「记忆」,其实只是在记备忘录。

你有没有遇到过这种情况:

给Agent配了向量数据库,上传了大量历史对话,结果它下次还是答不上来;或者用Cursor、Claude写了几十轮代码,感觉它对你项目的理解并没有随着时间真正加深,每次都像是在重新认识你。


这不是模型的问题,也不是RAG配置的问题。

香港中文大学与浙江大学的研究者在一篇新论文中给出了一个更根本的答案:我们根本就没有给Agent真正的记忆。我们只是给了它一个备忘录(Memo)。


论文链接:https://arxiv.org/pdf/2604.27707

论文于2026年4月30日在arXiv发布预印本,约10天之内便在国际学术社区引发大量讨论。AI领域知名账号 @dair_ai 在X(Twitter)的转发获得超过26,100次浏览与700余次点赞,多位YouTuber亦自发制作了介绍视频,小红书上也有多篇转载。

Agent为什么越用越蠢?

当前主流的Agent记忆方案,大体可以分为四类:向量存储、检索增强生成(RAG)、便签本(Scratchpad)与上下文窗口管理。

它们有一个共同点:都是「查找」,而非「记忆」。

论文作者将这类机制统称为「备忘录(Memo)」,而非真正意义上的记忆(True Memory)。

备忘录的逻辑是:把信息存起来,用的时候再检索出来。这和人类把一件事「记在心里」,是完全不同的两件事。


这个区别的核心在于泛化机制的本质差异:

  • 基于检索的记忆:通过与存储案例的相似性进行泛化。如果你存的案例里没有类似的情境,Agent就不会处理。

  • 基于权重的记忆:将经验抽象成规则,并将规则应用于从未见过的输入。

人类在学习一门语言时,不是把每一个句子都背下来,而是内化了语法规则,然后能造出从没说过的新句子。

目前的Agent「记忆」,更像是基于检索的记忆。

三大结构性缺陷

作者归纳出当前上下文代理记忆系统的三个关键局限,且每一个都可以在理论层面被证明,而非仅凭直觉。

缺陷一:信息量不等于能力

Agent会无限积累笔记,却无法发展出真正的专业知识。

认知科学早已证明(Chi et al., 1981),人类专家与新手的根本区别不在于掌握了更多信息,而在于知识的组织方式发生了质变:专家的知识按照深层原则重新结构化,而非简单堆积。

当前Agent做不到这一步。每次会话结束,模型的权重完全不变,下一次依然是从同一个「新手」起点出发,只是多了几条备忘录。

缺陷二:泛化天花板——数学分析

研究者用样本复杂度理论,证明了可量化的泛化鸿沟:

  • 检索式记忆系统,要处理组合式新颖任务,需要存储Ω(k²)个案例

  • 而参数化学习(权重记忆),只需O(d)个示例(d为算子的复杂度维度)

更关键的是:增大上下文窗口无法突破这个上限。限制不来自容量,而来自组合覆盖度。如果Agent从没见过「A规则+B规则同时适用」的情形,它就无法处理这种组合,无论你塞进多少备忘录。

用一个直观的例子:假设Agent学会了「摄氏度转华氏度」和「时区换算」两项技能,如果它只是把案例存在向量库里,那遇到「把北京时间的温度转换到纽约同等时刻」这类组合问题,它很可能就卡壳了。而人类学会了规则之后,这种组合是自然而然的。

缺陷三:记忆投毒——结构性安全漏洞

持久化记忆存储在结构上对记忆投毒攻击(Memory Poisoning)具有固有脆弱性。论文引用的实证数据触目惊心:

  • MINJA攻击:在最小化功能损耗的前提下,注入成功率高达98.2%

  • PoisonedRAG攻击:仅用5条对抗性文本,即可实现90%的攻击成功率

更危险的是,一旦注入成功,恶意内容会通过持久记忆在所有后续会话中持续循环,单次攻击转化为永久性入侵。

海马体+新皮层

缺一不可

论文的理论基础来自神经科学中的互补学习系统理论(Complementary Learning Systems, CLS)

哺乳动物大脑通过两套系统的协作解决了记忆问题:

  • 海马体(Hippocampus):快速记录情景,高保真存储新经验

  • 新皮层(Neocortex):缓慢整合,将情景记忆提炼为抽象规则,写入权重

这两套系统缺一不可。人类睡眠时,大脑会将白天的情景记忆向新皮层「回放」,完成从「记住这件事」到「学会这件事」的转化。

当前AI Agent只实现了海马体,即快速写入,相似性召回,没有抽象步骤。


论文作者将当前的Agent比作一个永远不睡觉的人——不断记笔记,却从不整理,永远无法将零散的经验升华为真正的专业知识。

学界怎么看?

X上的真实讨论

论文发布后,@dair_ai 的转发帖迅速引发国际学术社区的热议,以下是部分代表性讨论的翻译:






双系统并存

不是推倒重来

论文并非只是「批判」,而是提出了双系统共存的架构路径。

核心思路是:在保留现有检索式情景记忆(海马体等价物)的同时,增加一条异步巩固通道,将情景记忆逐步整合进模型权重(新皮层等价物)。

具体技术早已存在,从LoRA(轻量微调)和MEMIT(记忆编辑),到TTT层(测试时训练)和SSR(自我蒸馏)等。

论文为三类受众发出具体的行动呼吁:

  • 系统构建者:实现从情景存储到权重的巩固通道,而非无限扩大向量库

  • 基准设计者(Benchmark):引入「跨时间组合泛化(CGT)」指标,真正衡量Agent是否在学习

  • 持续学习研究社区:重新关注Agent场景,它天然提供了连续经验流、奖励信号与真实的部署环境


总结

这篇论文本质上是一篇立场论文(Position Paper),没有庞大的实验堆砌,但论证框架清晰,理论证明严格,

它引发如此广泛的讨论,或许恰恰说明:这个问题,几乎每一个认真使用过长期Agent的工程师和研究者都曾隐约感受到,只是暂时没有人把它说清楚。

如果你正在构建长期运行的Agent系统,这篇论文提供了一个重要的概念校准:你存的那些「记忆」,到底是备忘录,还是真正的学习?

参考资料:

Xu, B., Dai, X., & Zhang, K. (2026). Contextual Agentic Memory is a Memo, Not True Memory. arXiv:2604.27707v1

@dair_ai Twitter/X 讨论:https://x.com/dair_ai/status/2050694339165335754

Chi, M. T. H., et al. (1981). Categorization and representation of physics problems by experts and novices. Cognitive Science.

MINJA & PoisonedRAG 相关攻击研究(见论文参考文献)

编辑:LRST

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CBA最新消息!辽宁男篮主帅确定,崔永熙或离开广东宏远

CBA最新消息!辽宁男篮主帅确定,崔永熙或离开广东宏远

体坛瞎白话
2026-05-27 20:05:00
鸡蛋兽药残留严重超标!山东、河南、安徽等地通告鸡蛋抽检不合格

鸡蛋兽药残留严重超标!山东、河南、安徽等地通告鸡蛋抽检不合格

新浪财经
2026-05-26 22:02:15
伊媒:伊美谅解备忘录框架的初步非正式文件已披露

伊媒:伊美谅解备忘录框架的初步非正式文件已披露

新华社
2026-05-27 19:35:04
国际原油短线下挫 美油大跌超5%

国际原油短线下挫 美油大跌超5%

财联社
2026-05-27 20:24:53
美情报称穆杰塔巴藏身秘密地点

美情报称穆杰塔巴藏身秘密地点

参考消息
2026-05-27 10:59:07
韩国股市涨到熔断,A股跌到怀疑人生

韩国股市涨到熔断,A股跌到怀疑人生

东方豪侠
2026-05-27 15:43:54
A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

夜深爱杂谈
2026-05-27 20:06:42
马斯克转发的这张梗图,藏着工程界最朴素的真理

马斯克转发的这张梗图,藏着工程界最朴素的真理

新浪财经
2026-05-27 13:40:30
欧洲要求俄罗斯“投降、赔款”,俄外长告知美方对乌打击计划!普京修改法律批准境外用兵:军队可用于保护境外俄公民

欧洲要求俄罗斯“投降、赔款”,俄外长告知美方对乌打击计划!普京修改法律批准境外用兵:军队可用于保护境外俄公民

每日经济新闻
2026-05-26 15:11:33
陕西“强拆致一强拆人员死亡案”新进展:被拆迁户获取保候审

陕西“强拆致一强拆人员死亡案”新进展:被拆迁户获取保候审

澎湃新闻
2026-05-27 19:26:27
三星搞出900层闪存芯片,SSD白菜价时代要来了?

三星搞出900层闪存芯片,SSD白菜价时代要来了?

奶凶的小霸王
2026-05-26 21:00:51
这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

天马幸福的人生
2026-05-26 11:05:02
全网封杀已注定?林志玲风波升级,国台办回应,以后难在大陆捞金

全网封杀已注定?林志玲风波升级,国台办回应,以后难在大陆捞金

手工制作阿歼
2026-05-27 16:21:44
歧视中国,亲近美日,幻想加入北约来掣肘中国:认为中国好欺负?

歧视中国,亲近美日,幻想加入北约来掣肘中国:认为中国好欺负?

说历史的老牢
2026-05-25 18:32:45
拿女性私密部位博眼球,这广告太恶心了!网友:又是AI为恶人背锅?

拿女性私密部位博眼球,这广告太恶心了!网友:又是AI为恶人背锅?

品牌新
2026-05-27 16:39:13
知名投资人段永平成为泡泡玛特第二大股东

知名投资人段永平成为泡泡玛特第二大股东

澎湃新闻
2026-05-27 21:06:14
中国被曝限制AI人才出境,阿里DeepSeek核心人员出国要先获批

中国被曝限制AI人才出境,阿里DeepSeek核心人员出国要先获批

桂系007
2026-05-26 23:43:08
央企会大批量疏解到雄安吗?知乎网友:有央企“雄安总部”只有边缘部门

央企会大批量疏解到雄安吗?知乎网友:有央企“雄安总部”只有边缘部门

六子吃凉粉
2026-05-27 17:19:22
女生白嫖外卖海外播放超2000万!薪资被扒全网社死,更严重在后头

女生白嫖外卖海外播放超2000万!薪资被扒全网社死,更严重在后头

爱写的樱桃
2026-05-26 20:45:31
男子将窗帘系在身上从六层下落,窗帘断裂后坠亡 保险公司被判赔保险金10万余元

男子将窗帘系在身上从六层下落,窗帘断裂后坠亡 保险公司被判赔保险金10万余元

红星新闻
2026-05-27 20:17:40
2026-05-27 22:16:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15321文章数 66892关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

教育
时尚
本地
健康
军事航空

教育要闻

5577人毕业,86.1%落实就业!这所"听起来像野鸡大学"的学校,就业率碾压

她一夜爆火,成了年度互联网嘴替

本地新闻

用剪纸的方式,打开江苏扬州

打外泌体会比干细胞更安全吗

军事要闻

以军称已打死哈马斯新任军事领导人

无障碍浏览 进入关怀版