网易首页 > 网易号 > 正文 申请入驻

Google团队的记忆缓存技术:让RNN记忆力像人脑一样可以无限扩展

0
分享至

来源:市场资讯

(来源:科技行者)


这项由Google Research与Cornell University、USC联合开展的研究于2026年2月27日发表在arXiv预印本平台,论文编号为arXiv:2602.24281v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下,如果你在背诵一本厚厚的书,传统的方法是从头到尾一字不漏地记住每个细节,这样虽然准确,但需要巨大的记忆容量。而另一种方法是每读完一页就只记住这一页的要点,然后丢掉前面的内容,这样虽然节省记忆空间,但很容易忘记重要信息。现在,Google的研究团队找到了第三种方法——他们教会计算机如何像人类一样,既能压缩信息节省空间,又能在需要时快速调取过去的重要记忆。

在人工智能的世界里,有两大"记忆高手"一直在竞争。一个是Transformer(变压器模型),它就像一个拥有完美记忆的学霸,能够记住对话中的每一个词、每一个细节,但这种完美记忆需要付出巨大代价——处理信息的时间会随着内容长度呈平方增长,就像背诵内容翻倍时,所需时间要增加四倍。另一个是RNN(循环神经网络),它更像一个善于总结的人,会把之前的信息压缩成要点存储,处理速度很快,但问题是压缩过程中容易丢失重要细节,特别是需要回忆很久以前信息的时候。

Google的研究团队意识到,这就像是在"完美记忆但效率低下"和"高效率但健忘"之间做选择。他们想:"能不能找到一个中间路线,既保持高效率,又不丢失重要信息呢?"于是,他们开发了一种叫做"Memory Caching"(记忆缓存)的技术,这个技术的核心思想就像是给计算机装上了一个智能的"记忆相册"。

### 一、记忆缓存:给AI装上智能相册

记忆缓存技术的工作原理可以用整理照片来比喻。当你拍了很多照片后,你不会把所有照片都放在桌面上(那样会很乱),也不会只保留最后一张照片(那样会丢失珍贵回忆)。相反,你会把照片按时间段整理成不同的相册,比如"春节假期"、"毕业旅行"、"日常生活"等。当你需要找某张照片时,你会根据记忆先找到对应的相册,然后在相册里搜索。

记忆缓存正是这样工作的。研究团队把长长的文本内容切分成不同的"段落",就像把照片分成不同相册。对于每个段落,AI会像写读书笔记一样,把重要信息压缩成一个"记忆快照",然后把这些快照存储在不同的"记忆格子"里。当AI需要回答问题或处理新信息时,它不需要翻遍所有原始内容,而是快速浏览这些记忆快照,找到相关信息,就像你根据相册封面就能知道哪个相册里有你要找的照片。

这种方法的巧妙之处在于,它让AI的记忆容量可以根据需要灵活增长。如果内容比较短,AI只需要很少的记忆格子;如果内容很长,AI就会使用更多的记忆格子。这样既避免了Transformer那种"不管内容多少都要完整记住"的浪费,又避免了传统RNN"只记住最后一点信息"的健忘问题。

更重要的是,这个系统的计算复杂度介于两种传统方法之间。如果用数学语言描述,传统RNN的复杂度是O(L)(处理时间与内容长度成正比),Transformer的复杂度是O(L?)(处理时间与内容长度的平方成正比),而记忆缓存的复杂度是O(NL)(处理时间与内容长度和记忆格子数量的乘积成正比)。这意味着用户可以根据自己的需求和计算资源,在效率和记忆容量之间找到最佳平衡点。

### 二、四种记忆整理方式:从简单到精巧

就像整理照片有不同方法一样,研究团队开发了四种不同的记忆缓存方式,每种方式都有自己的特点和适用场景。

最基础的方法叫做"残差记忆"(Residual Memory),就像把所有相册的内容简单叠加在一起。当AI需要回忆信息时,它会把当前的记忆状态和所有过去的记忆快照加起来,形成一个综合的回忆。这种方法虽然简单,但已经能显著提升AI的记忆能力。研究团队发现,即使是这样简单的方法,也能让AI在处理长文本时的表现明显改善。

但简单叠加有个问题——所有记忆被平等对待,就像你在找一张照片时,不管是十年前的还是昨天的照片都占同等重要性。为了解决这个问题,研究团队开发了"门控残差记忆"(Gated Residual Memory)。这就像给每个相册装上了智能标签,AI可以根据当前需要查找的内容,自动调整对不同记忆的重视程度。比如,如果AI在处理关于"春节"的问题,它会自动增加对"春节假期"相册的关注度,减少对"日常生活"相册的关注度。

第三种方法叫"记忆融合"(Memory Soup),这个名字听起来很有趣,实际上是借鉴了烹饪中"融合不同食材精华"的概念。传统的方法是把不同记忆的"结果"混合在一起,而记忆融合是把不同记忆的"参数"(可以理解为制作方法)混合在一起,然后用这个混合后的新方法来处理当前问题。这就像是把不同大厨的招牌菜做法融合起来,创造出一道专门针对当前客人口味的新菜品。

最精巧的方法是"稀疏选择缓存"(Sparse Selective Caching),这种方法受到了"专家混合系统"的启发。想象你是一个图书管理员,面对读者的问题,你不需要翻遍图书馆的每一本书,而是根据问题的类型,选择最相关的几个书架进行搜索。稀疏选择缓存让AI像智能管理员一样,根据当前处理的内容,只选择最相关的几个记忆快照进行查询,这样既提高了效率,又保持了准确性。

这四种方法各有优势。残差记忆最简单可靠,门控残差记忆更加智能,记忆融合对复杂情况处理更好,稀疏选择缓存在处理超长内容时最高效。研究团队在不同的测试中发现,没有一种方法在所有情况下都是最好的,但它们都比传统方法有显著提升。

### 三、从理论到实践:三个AI模型的华丽变身

为了验证记忆缓存技术的有效性,研究团队选择了三个不同类型的AI模型进行改造,就像给三种不同性格的学生提供同样的学习方法,看看效果如何。

第一个模型是"线性注意力"(Linear Attention),它就像一个善于快速浏览的学生,能够高效地处理信息,但记忆深度有限。研究团队给它装上记忆缓存系统后,它不仅保持了原有的高效性,还获得了更强的长期记忆能力。在处理需要回忆很久以前信息的任务时,改造后的模型表现显著提升。

第二个模型叫"Titans",它本身就是一个相对复杂的记忆系统,使用了更高级的学习算法。给Titans装上记忆缓存就像给一个已经很聪明的学生提供更好的笔记本,让他能够更有条理地整理和回忆知识。实验结果显示,这种组合产生了最好的效果,在多个测试中都表现出色。

第三个模型是"滑动窗口线性注意力"(Sliding Window Linear Attention),它的特点是只关注最近的一小段内容,就像一个只看得见眼前几步路的近视眼学生。记忆缓存系统为它提供了"远视镜",让它能够在保持对近期信息敏感度的同时,也能回忆起更远的重要信息。

有趣的是,研究团队还发现了一个重要的设计选择问题:是把记忆缓存看作"同一个学生的不同学习阶段笔记",还是"不同学生各自的独立笔记"?前一种方法让AI的记忆更加连贯,就像一个人从小到大的日记本,后一种方法让每段记忆都更加纯净,就像不同主题的专业笔记本。实验显示,这两种方法各有优势,具体选择取决于应用场景。

### 四、段落划分的艺术:在压缩和完整性之间找平衡

记忆缓存系统面临的一个关键问题是:如何把长内容分割成合适的段落?这就像决定每个相册应该装多少张照片一样,是一门需要平衡的艺术。

如果段落太短,比如每个词都单独成为一个段落,那么AI就需要为每个词创建一个记忆快照,虽然信息保存得很完整,但计算量会变得很大,几乎和Transformer一样复杂。如果段落太长,比如把整篇文章当作一个段落,那就回到了传统RNN的问题——重要信息可能在压缩过程中丢失。

研究团队提出了几种分割策略。最简单的是"等长分割",就像把一本书平均分成若干章节,每章包含相同数量的页数。这种方法简单可控,用户可以根据自己的计算资源和精度要求选择合适的章节长度。

更有趣的是"对数分割"策略,这种方法受到了计算机科学中"二分法"的启发。它会把内容按照2的幂次方进行分割,比如第一段包含32个词,第二段包含16个词,第三段包含8个词,以此类推。这种分割方法的巧妙之处在于,它为重要信息提供了不同层次的存储粒度,就像一个多级的记忆系统。

对数分割的计算复杂度是O(L log L),比传统Transformer的O(L?)要好很多,特别是处理超长内容时优势更加明显。但是,这种方法也有自己的局限性——对于需要精确回忆很久以前细节信息的任务,它可能不如等长分割方法表现稳定。

研究团队通过大量实验发现,不同的分割策略适用于不同的应用场景。对于需要高精度回忆的任务,等长分割更可靠;对于追求高效率的应用,对数分割更合适。这为用户提供了灵活的选择空间。

### 五、实验室里的精彩表现:多项测试全面胜出

为了全面评估记忆缓存技术的效果,研究团队设计了一系列测试,就像给学生进行全科目的期末考试。这些测试涵盖了语言理解、常识推理、长文本处理、信息检索等多个方面。

在语言建模测试中,研究团队使用了两种规模的模型:7.6亿参数和13亿参数。结果显示,所有装备了记忆缓存的模型都比原版本有显著提升。特别是Titans配合门控残差记忆的组合,在各项指标上都表现出色,不仅超过了原始的RNN模型,甚至在某些任务上接近了Transformer的性能。

"大海捞针"测试是评估AI长期记忆能力的经典方法,就像在一本厚厚的小说中间藏一个重要信息,然后看AI能否在读完整本书后还记得这个信息。在这项测试中,记忆缓存技术显示出了明显优势。装备了记忆缓存的模型在处理4K、8K、16K长度的文本时,都能准确找到隐藏的信息,而传统RNN模型随着文本长度增加,准确率急剧下降。

更有挑战性的是多查询联想回忆测试,这就像给AI一堆看似无关的信息,然后问它能否找出其中的隐含联系。这种测试特别考验AI的综合记忆和推理能力。结果显示,记忆缓存技术大幅提升了AI在这类复杂任务中的表现,证明它不仅能记住信息,还能更好地理解信息之间的关系。

在实际应用导向的测试中,研究团队使用了包括阅读理解、问答系统、文档摘要等多种任务。虽然Transformer在某些任务上仍然保持最佳性能,但配备记忆缓存的RNN模型显著缩小了差距,有时甚至表现更好。更重要的是,这些改进是在保持原有计算效率优势的基础上实现的。

效率测试的结果更加令人印象深刻。随着处理内容长度的增加,传统Transformer的计算时间呈平方增长,很快变得不可承受,而记忆缓存系统的处理时间增长要慢得多。在处理32K长度的文本时,记忆缓存系统比Transformer快几十倍,同时保持了可接受的准确性。

### 六、技术细节的巧妙设计:魔鬼藏在细节里

记忆缓存系统的成功不仅在于整体架构的创新,更在于许多精巧的技术细节。这些细节就像一道精美菜肴中的各种调料,每一个都不起眼,但缺少任何一个都会影响最终效果。

在门控机制的设计上,研究团队面临一个重要选择:应该让AI根据当前输入的内容来决定调取哪些记忆,还是根据记忆内容本身的特征来决定权重?最终他们选择了一种更智能的方法——让当前输入和历史记忆进行"对话",通过计算相似性来决定哪些记忆最相关。这就像你在回忆时,会根据当前的话题自动联想到相关的过往经历。

在稀疏选择机制中,研究团队借鉴了"专家混合"系统的设计思路,但做了重要改进。传统的专家混合系统需要为每个输入重新计算所有专家的权重,计算量很大。而记忆缓存系统可以预先计算每个记忆段落的特征表示,只需要在查询时进行快速的相似性计算,大大提高了效率。

对于线性记忆和非线性记忆的处理,系统采用了不同的策略。对于线性记忆,记忆融合方法在数学上等价于门控残差记忆,这是一个有趣的发现。但对于非线性的深度记忆模块,两种方法产生了不同的效果,记忆融合通过混合参数创造了全新的记忆处理方式,而门控残差通过加权输出保持了原有记忆的完整性。

研究团队还发现了一个重要的实现细节:记忆缓存可以作为后训练技术应用。也就是说,对于已经训练好的模型,可以直接加装记忆缓存系统,而不需要重新训练整个模型。这大大降低了技术的应用成本,让更多研究者和开发者能够受益。

### 七、局限性与未来展望:完美路上的下一步

尽管记忆缓存技术取得了显著成果,但研究团队也诚实地指出了当前系统的一些局限性。这种科学的态度反而让这项技术显得更加可信和有发展潜力。

首先是存储空间的考量。虽然记忆缓存比Transformer节省了大量计算资源,但它仍然需要存储多个记忆快照,这意味着内存使用量会随着内容长度增长。对于处理超长文档的应用,这可能成为一个需要权衡的因素。

其次是记忆质量与压缩率之间的平衡。当段落长度增加时,每个记忆快照需要压缩更多信息,可能导致一些细节丢失。当段落长度减少时,虽然信息保存更完整,但需要存储更多快照,计算量也会增加。找到最优的平衡点需要根据具体应用进行调优。

在某些需要精确回忆远程信息的任务中,记忆缓存系统仍然不如Transformer表现出色。这主要是因为压缩过程不可避免地会丢失一些信息,而Transformer保留了所有原始信息。但考虑到效率上的巨大优势,这种权衡在大多数实际应用中是值得的。

研究团队也指出了几个有前景的改进方向。首先是开发更智能的分割策略,比如根据内容的语义结构而不是简单的长度来划分段落。其次是设计更精巧的记忆压缩算法,在保持效率的同时减少信息损失。再次是探索自适应的记忆管理策略,让系统能够根据任务需求动态调整记忆的详细程度。

更有趣的是,研究团队提到了将记忆缓存与其他先进技术结合的可能性。比如,可以将它与检索增强生成技术结合,创建更强大的知识管理系统;或者与多模态技术结合,处理包含文本、图像、音频的复杂内容。

说到底,Google团队的这项记忆缓存技术代表了AI发展中的一个重要里程碑。它不是简单地在现有技术中做选择,而是创造性地找到了一条新路径,在效率和能力之间实现了更好的平衡。这种思路本身就很有启发性——当面对看似对立的选择时,也许答案不在于选择其中一个,而在于创造第三种可能性。

对于普通人来说,这项技术意味着未来的AI助手将能够更好地理解和记住长对话、长文档,同时保持快速响应。无论是处理工作报告、分析研究论文,还是进行长时间的对话交流,AI都将变得更加智能和实用。而且由于技术的高效性,这些改进不会带来高昂的计算成本,让更多人能够享受到先进AI技术的便利。

这项研究也展示了科学研究的魅力——通过深入理解问题本质,用创新思维找到意想不到的解决方案。Google团队没有被传统的思维模式局限,而是从生物记忆的启发中找到灵感,最终创造出了这个优雅而实用的技术。这提醒我们,最好的创新往往来自于跨领域的思考和不拘一格的探索。

Q&A

Q1:记忆缓存技术是什么原理?

A:记忆缓存技术就像给AI装了一个智能相册系统。它把长文本分成若干段落,为每个段落创建一个记忆快照并存储起来,当AI需要回忆信息时,会快速浏览这些记忆快照找到相关内容,而不是翻遍所有原始信息。

Q2:记忆缓存比传统AI方法好在哪里?

A:记忆缓存在效率和记忆力之间找到了完美平衡。比传统RNN记忆力更强,能记住更久远的信息;比Transformer效率更高,处理长文本时速度快几十倍,同时计算成本大幅降低,让更多人能使用先进AI技术。

Q3:这项技术什么时候能用到日常生活中?

A:这项技术目前还在研究阶段,但已经显示出很好的应用前景。未来可能会集成到AI助手、文档处理工具、对话系统中,让它们能更好地理解和记住长对话内容,处理复杂文档时既快速又准确。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乾隆登基后,平反了诸多被雍正打压的叔伯,为何不愿平反其大伯?

乾隆登基后,平反了诸多被雍正打压的叔伯,为何不愿平反其大伯?

鹤羽说个事
2026-03-01 18:29:37
吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

另子维爱读史
2026-02-27 20:31:34
美以伊最新发声

美以伊最新发声

看看新闻Knews
2026-03-02 16:59:09
伊朗革命卫队发布血性檄文:哈梅内伊殉难是胜利象征,复仇之手已张开

伊朗革命卫队发布血性檄文:哈梅内伊殉难是胜利象征,复仇之手已张开

健身狂人
2026-03-01 10:58:21
丈夫心梗住院女儿一次没来,出院后女儿:妈,你怎么把我婚房卖了

丈夫心梗住院女儿一次没来,出院后女儿:妈,你怎么把我婚房卖了

风起见你
2026-03-02 00:28:21
教父级基金经理清仓了。。

教父级基金经理清仓了。。

格隆汇
2026-03-02 15:38:27
国际油价跳涨,黄金、白银直线拉升!伊朗:反击已造成560名美军伤亡

国际油价跳涨,黄金、白银直线拉升!伊朗:反击已造成560名美军伤亡

每日经济新闻
2026-03-02 10:56:32
伊拉克民兵组织称袭击巴格达机场内美军目标

伊拉克民兵组织称袭击巴格达机场内美军目标

界面新闻
2026-03-02 11:14:08
美以空袭伊朗,阿拉伯国家联盟发声:“阿拉伯-以色列冲突升级为全面地区战争的时刻”

美以空袭伊朗,阿拉伯国家联盟发声:“阿拉伯-以色列冲突升级为全面地区战争的时刻”

环球网资讯
2026-03-01 11:00:18
表面是演员,实际职务却高到吓人,这四位明星个个“深藏不露”

表面是演员,实际职务却高到吓人,这四位明星个个“深藏不露”

丁丁鲤史纪
2026-03-02 15:06:53
美媒:因芯片含有中国稀土,台积电无法向美国供应半导体芯片

美媒:因芯片含有中国稀土,台积电无法向美国供应半导体芯片

白天的太阳晚上的月亮
2026-03-02 13:28:21
他俩官宣复婚!全网炸了:兜兜转转还是你

他俩官宣复婚!全网炸了:兜兜转转还是你

背包旅行
2026-03-01 20:05:18
美国中央司令部:美军三架F-15E战机在科威特“明显遭友军误击”坠毁

美国中央司令部:美军三架F-15E战机在科威特“明显遭友军误击”坠毁

环球网资讯
2026-03-02 19:32:13
现货黄金失守5320美元/盎司

现货黄金失守5320美元/盎司

每日经济新闻
2026-03-02 09:06:28
中日机械巨头对比:日本小松年营收270亿美元,徐工集团多少?

中日机械巨头对比:日本小松年营收270亿美元,徐工集团多少?

亿通电子游戏
2026-03-02 00:16:04
这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

潮鹿逐梦
2026-03-02 17:19:02
从中国男篮惊险逆转台北队的过程看:周琦在国家队尚有一席之地

从中国男篮惊险逆转台北队的过程看:周琦在国家队尚有一席之地

姜大叔侃球
2026-03-01 21:55:19
基辛格坦言:如果爆发核战争,中国可能只有5个地方可以躲避危险

基辛格坦言:如果爆发核战争,中国可能只有5个地方可以躲避危险

混沌录
2026-03-02 17:15:04
美以军事行动引发伊朗“最猛烈”回击 中东危局40小时一文速览

美以军事行动引发伊朗“最猛烈”回击 中东危局40小时一文速览

极目新闻
2026-03-02 06:57:53
原来,费翔这辈子爱得最深的,不是叶倩文。而是大他7岁的她

原来,费翔这辈子爱得最深的,不是叶倩文。而是大他7岁的她

她时尚丫
2026-03-01 19:26:59
2026-03-02 20:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2315166文章数 5639关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

美记者询问就伊朗局势中方会采取什么行动 外交部回应

头条要闻

美记者询问就伊朗局势中方会采取什么行动 外交部回应

体育要闻

“想要我签名吗” 梅西逆转后嘲讽对手主帅

娱乐要闻

美伊以冲突爆发,多位明星被困中东

财经要闻

金银大涨 市场仍在评估冲突会否长期化

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

教育
游戏
时尚
手机
军事航空

教育要闻

26考研:理工专业成高分重灾区,401分排名128位,390分只能调剂

《王者荣耀世界》终于定档!你会第一时间玩吗?

从每天只睡4小时到8小时:一个失眠者的自救指南

手机要闻

卢伟冰回应小米新机海外售价1.6万元:有信心冲击iPhone!

军事要闻

美军动用新型武器:山寨伊朗的

无障碍浏览 进入关怀版