网易首页 > 网易号 > 正文 申请入驻

M+框架来了,增加LLM隐空间记忆,不再受上下文窗口限制

0
分享至



本文的第一作者Yu Wang来自加州大学圣地亚哥分校,主要研究方向为Memory for LLMs and Memory for LLM Agents. 该论文于2024年在MIT-IBM Waston Lab实习过程中完成,通讯作者Zexue He也毕业于加州大学圣地亚哥分校。

M+是在 MemoryLLM 之上提出的长期隐空间记忆扩展框架:通过把「过期」隐藏向量写入CPU - 侧长期记忆池,再用协同检索器拉回最相关记忆,它将 8 B 级模型的有效记忆跨度从原本不到 20 k tokens 提升到 160 k tokens 以上,同时显存占用保持不变。



  • 论文标题:M+: Extending MemoryLLM with Scalable Long-Term Memory
  • 论文链接:https://arxiv.org/abs/2502.00592
  • 代码仓库:https://github.com/wangyu-ustc/MemoryLLM
  • 开源模型:https://huggingface.co/YuWangX/mplus-8b

背景:上下文 ≠ 记忆 & 现有记忆模型的缺陷

上下文窗口并不能直接等价于记忆。GPT-4.1 之类的模型即便支持 100 万 token,也会随窗口线性升高显存与延迟,难以落地本地部署。

业界主流做法是 “Token-Level Memory”:把历史内容或三元组存在数据库 / 向量库,检索后再拼接回 prompt;MemGPT等系统即属此类。该类做法不需要重复训练,直接结合 GPT-4 这样的大模型便可以获得很不错的性能,但是,它也会有一些随之而来的问题:(1)冗余:原始文本并非最紧凑表达,重复率高。(2)冲突难解:遇到相互矛盾或不断更新的信息时,文本级冲突消解复杂。(3)多模态能力弱:由于数据库格式为文本,处理音频或者图片,视频数据将相对困难。

因此,我们希望探索隐空间 (Latent-Space) 的 Memory -- 既压缩又可端到端训练,更接近人类在神经激活中存储信息的方式。

M + 的关键改进:Long-Term Memory

在 MemoryLLM 中,我们为 8B 的 Llama3 模型引入了约 1.67B 的 Memory。Llama3-8B 的 Transformer 共包含 32 层。当第一层接收到词输入后,会通过 Embedding 层将词转化为一系列 4096 维的向量。基于这一特点,我们设计了 MemoryLLM,在每一层都加入 N 个 Memory Tokens(实验中 N=12800)。在生成过程中,这些 Memory Tokens 会作为每一层的 Prefix,通过 Cross-Attention 将信息注入后续层,使模型能 “看到” 保存在 Memory Pool 中的历史信息。



在更新阶段,我们会将每层 Memory Token 中最后 K 个(实验中 K=256)与需要写入的信息一同送入 Transformer,再次经过 Cross-Attention,将信息压入新的 Memory Tokens 中(如下图所示)。与此同时,我们在原有 Memory 中随机丢弃 K 个旧 Token,并将新生成的 K 个 Token 放到 Memory 尾部,完成更新。



基于这样的设计,借助每层 12800 个 Memory Vectors,我们在 50k tokens 内都能保持良好的信息留存(最早 MemoryLLM-7B 版本只做到 20k,后续在 GitHub 提供的新版模型 https://github.com/wangyu-ustc/MemoryLLM 可达 50k)。然而,这样的记忆容量仍无法满足我们对更长序列的期待。要进一步扩展 Memory,单靠原有的 1.67B 容量已远远不够,因此我们提出了Long-Term Memory。

如何高效实现 Long-Term Memory?考虑到 MemoryLLM 中每一个 Memory Token 本质上都来自 Hidden States,我们将那些在更新过程中被 “丢弃” 的 Memory Token 并非直接舍弃,而是将其保存在长期记忆池中(如下图)。



仅仅保存是不够的,我们还需要具备强大的提取能力。最初我们尝试用 Attention 来从长期记忆中检索 Hidden States,但实验表明 Attention 在提取 Hidden States 时效果有限(在论文的消融实验中做了详尽对比)。因此我们提出协同提取器(Co-trained Retriever),并与全模型进行联合训练(如下图)。



通过这一结构,我们将模型的有效记忆跨度从 50k 一举提升到 160k,且由于 Memory 主要驻留在 CPU,不会显著增加 GPU 负担。

M + 的实验结果

显著性能提升及更少的 GPU 使用:在 Longbook-QA 和 Longbook-Event-QA 两个数据集上,我们都在更少 GPU 的使用下(单卡 18GB 左右)获得了更强大的性能。





更强的信息留存能力:在 SQuAD 数据集上表现出远超 MemoryLLM-7B 以及相关 ablation baseline 的信息留存能力,可以达到 160k 依旧不完全遗忘过去的信息。





结语

M+ 展示了我们在探索隐空间长期记忆领域的重要进展,也为下一代具备持续记忆能力的语言模型提供了坚实的技术支撑。未来,我们将继续研究更高效的存储机制、更智能的检索策略,以及与多模态输入更自然融合的隐空间记忆架构。在此方向上,M+ 不仅是对 MemoryLLM 的一次扩展,也是我们对 “让模型拥有接近人类记忆能力” 这一愿景的又一次有力实践。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
刚刚!美股突然大跳水!发生什么了?

刚刚!美股突然大跳水!发生什么了?

龙行天下虎
2025-11-20 01:47:15
为何感冒总先“攻击”咽喉??教你几招,把病毒“打回去”!

为何感冒总先“攻击”咽喉??教你几招,把病毒“打回去”!

猫大夫医学科普
2025-11-20 06:48:14
“亚洲最大医院”郑大一附院西院区今起停诊,投入运行不到一年半

“亚洲最大医院”郑大一附院西院区今起停诊,投入运行不到一年半

澎湃新闻
2025-11-20 11:22:27
忍了两天,中方开了金口:日本敢碰红线,总账就从甲午战争开始算

忍了两天,中方开了金口:日本敢碰红线,总账就从甲午战争开始算

趣味八卦
2025-11-20 04:26:57
中央批准:中候补任副省级城市市委书记!浙江三地市委书记近期调整

中央批准:中候补任副省级城市市委书记!浙江三地市委书记近期调整

上观新闻
2025-11-20 17:48:08
甲流特效药:好是真好,贵是真贵!广东家长晒账单:两粒222.3元

甲流特效药:好是真好,贵是真贵!广东家长晒账单:两粒222.3元

小李睡不醒了
2025-11-18 07:20:20
中方是否接受日方“涉台”言论的最新解释?外交部:收回错误言论

中方是否接受日方“涉台”言论的最新解释?外交部:收回错误言论

澎湃新闻
2025-11-20 15:24:26
大超说媒也死了

大超说媒也死了

求实处
2025-11-19 23:55:28
先升后降!陕西即将大降温

先升后降!陕西即将大降温

鲁中晨报
2025-11-20 16:13:16
4枚导弹打醒了俄罗斯,普京向北约打出明牌,每10天炸乌克兰一轮

4枚导弹打醒了俄罗斯,普京向北约打出明牌,每10天炸乌克兰一轮

文雅笔墨
2025-11-20 09:02:17
朝鲜第一家现代化地方医院!金正恩穿过拥挤的人群

朝鲜第一家现代化地方医院!金正恩穿过拥挤的人群

IN朝鲜
2025-11-20 14:42:31
吴艳妮哭成泪人!颁奖典礼掩面痛哭,三届全运会无缘金牌

吴艳妮哭成泪人!颁奖典礼掩面痛哭,三届全运会无缘金牌

奥拜尔
2025-11-19 22:57:40
中日一战不可避免,日本达成一致:解放军若武统,日本定武力介入

中日一战不可避免,日本达成一致:解放军若武统,日本定武力介入

胖福的小木屋
2025-11-20 00:02:51
毛新宇少将担任副部长!妻子刘滨担任扇子协会会长

毛新宇少将担任副部长!妻子刘滨担任扇子协会会长

李昕言温度空间
2025-11-09 14:50:17
杨颖送子去黄晓明妈妈家过秋假,并和前婆婆聚餐,全程微笑情商高

杨颖送子去黄晓明妈妈家过秋假,并和前婆婆聚餐,全程微笑情商高

喜欢历史的阿繁
2025-11-21 01:01:53
王成兼任宁波市委书记,哪些城市“一把手”目前由省委副书记高配兼任?

王成兼任宁波市委书记,哪些城市“一把手”目前由省委副书记高配兼任?

极目新闻
2025-11-20 19:57:05
国家社科基金神成果:男人阴茎越短,智商越高

国家社科基金神成果:男人阴茎越短,智商越高

尚曦读史
2025-11-19 10:33:10
台积电:我们已经顾不上美国工厂了,大陆再不给稀土,大家都得完

台积电:我们已经顾不上美国工厂了,大陆再不给稀土,大家都得完

boss外传
2025-10-28 08:00:05
快扔掉!戴一天,辐射量相当于拍117次胸片

快扔掉!戴一天,辐射量相当于拍117次胸片

上海约饭局
2025-10-31 15:32:01
2025-11-21 04:27:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11765文章数 142508关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

日本政府被判赔偿39亿日元

头条要闻

日本政府被判赔偿39亿日元

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

教育
亲子
房产
数码
家居

教育要闻

2020年吉林省国家励志奖学金发放时间

亲子要闻

又红又肿!佛山3岁幼童被锁孔“咬”手指!家长多留心这些“洞”

房产要闻

超95亿!三亚巨量资产,突然甩出!

数码要闻

一键击毁芯片无法恢复 十铨科技发布全球首款支持销毁的SSD

家居要闻

黑白极简 慵懒通透空间

无障碍浏览 进入关怀版