网易首页 > 网易号 > 正文 申请入驻

不用额外缓存!英伟达开源记忆压缩方案,128K上下文提速2.7倍

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

提高大模型记忆这块儿,美国大模型开源王者——英伟达也出招了。

联合Astera研究所、斯坦福大学、UC伯克利、加州大学圣地亚哥分校等机构推出了TTT-E2E方法。

在128K超长文本上处理速度比全注意力模型快2.7倍,处理2M上下文时提速达35倍,性能还不打折。



这项技术与前几天大火的DeepSeek条件记忆模块有所不同。

DeepSeek的Engram模块依赖的是“按需查表”的静态学习路径,而英伟达走的是动态学习的路子,关键在于上下文压缩

通过实时学习将关键内容压缩到自身权重中,让模型在测试阶段依然保持学习状态。

这样既避免了额外缓存的负担,又能精准捕捉长文本中的核心逻辑。

给模型装上记忆压缩包



TTT-E2E并没有依赖复杂特殊架构,反而是基于带滑动窗口注意力的标准Transformer,容易部署。

这个方法的核心思路是将长文本建模从架构设计问题转化为「持续学习」任务

在测试阶段,模型会基于当前读取的上下文进行下一个词预测。

每读取一段文本,就通过梯度下降更新自身参数,通过这种方式持续训练自身,把读到的文本信息动态压缩到权重中,这样就不用额外存储冗余数据。

在训练阶段,团队通过元学习为模型做初始化准备,让模型天生适应「测试时学习」的模式。

把每个训练序列都模拟成测试序列,先在内循环中对其进行测试时训练,再在外循环中优化模型的初始参数,确保初始状态就能快速适配测试时的学习需求,实现了训练与测试的端到端对齐优化。



为了平衡效率与稳定性,TTT-E2E还设计了三项关键优化。

一是采用「迷你批处理+滑动窗口」的组合策略。将测试时的训练数据分成多个迷你批,配合8K大小的滑动窗口注意力,既解决了单token梯度更新易爆炸的问题,又保证模型能记住批内上下文,提升计算并行度;

二是精准更新策略。只更新模型的MLP层(冻结嵌入层、归一化层和注意力层),并且只更新最后1/4的网络块,在减少计算成本的同时避免参数更新混乱;

三是双MLP设计。在需更新的网络块中加入一个静态MLP层,专门存储预训练知识,另一个动态MLP层负责吸收新上下文,来防止模型学新忘旧。



从实验数据来看,TTT-E2E的表现很亮眼。

在3B参数模型的测试中,TTT-E2E在128K上下文长度下的测试损失与全注意力Transformer持平甚至更优,而Mamba 2、Gated DeltaNet等同类模型在长文本场景下性能均出现明显下滑;

在延迟上,它的推理延迟不随上下文长度增加而变化,与RNN类似,在H100显卡上处理128K文本时,速度比全注意力模型快2.7倍。



在解码长序列任务中,经Qwen-8B模型评估,TTT-E2E生成的文本质量稳定,损失值持续低于传统模型。



通过实验结果也可以看出,该方法的推理延迟与上下文长度无关,始终保持恒定,这也意味着无论处理8K还是128K文本,用户都能获得一致的快速响应体验。

不过,TTT-E2E也存在一些小局限。

在大海捞针这类需要精准回忆细节的任务中,它的表现远不如全注意力模型。

这是因为它的核心是压缩记忆,会过滤掉看似无关的细节,而全注意力模型能近乎无损地召回所有信息。

另一方面,训练阶段的元学习需要计算梯度的梯度,目前实现比标准预训练要慢。

目前,TTT-E2E的代码和相关论文已完全开源。

这项研究的项目总负责人是斯坦福的博士后研究员Yu Sun,他同时是该研究的核心贡献者。



他研究的总体目标是让人工智能系统能够像人类一样持续学习。自2019年以来,他就在开发“测试时训练”的概念框架,TTT-E2E项目的早期构想就是他提出的。

论文地址:https://arxiv.org/abs/2512.23675
代码地址:https://github.com/test-time-training/e2e
参考链接:https://x.com/karansdalal/status/2010774529120092481

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美伊如果拖持久战,是否会像俄乌战争一样深陷泥潭,趁机拖垮美国

美伊如果拖持久战,是否会像俄乌战争一样深陷泥潭,趁机拖垮美国

小轲搞笑解说
2026-03-02 12:10:23
自家名宿不护着,赖特:赖斯的动作绝对是一个点球

自家名宿不护着,赖特:赖斯的动作绝对是一个点球

懂球帝
2026-03-02 09:48:07
战火升级!烈度或超“12日战争”,本轮美伊冲突五大疑问待解

战火升级!烈度或超“12日战争”,本轮美伊冲突五大疑问待解

中国网
2026-03-01 11:35:05
体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

带你感受人间冷暖
2026-02-24 01:03:13
骑士106-102篮网!阿特金森赛后把话挑明,哈登复出带来一大变化

骑士106-102篮网!阿特金森赛后把话挑明,哈登复出带来一大变化

鱼崖大话篮球
2026-03-02 10:21:28
“最惨超女”黄雅莉:没工作没积蓄,34岁生子后住5平米的小屋

“最惨超女”黄雅莉:没工作没积蓄,34岁生子后住5平米的小屋

地理三体说
2026-01-29 21:40:34
中国电网砸5万亿锁死优势!越南被迫限电减产,欧洲电价暴涨10倍

中国电网砸5万亿锁死优势!越南被迫限电减产,欧洲电价暴涨10倍

财经保探长
2026-02-23 19:10:05
隔扣杨瀚森!库明加三战轰64+23太炸裂 老鹰全场高呼谢谢勇士队

隔扣杨瀚森!库明加三战轰64+23太炸裂 老鹰全场高呼谢谢勇士队

星Xin辰大海
2026-03-02 13:27:42
24小时之内,赖清德喊话大陆,郑丽文向民进党妥协,日本部署导弹

24小时之内,赖清德喊话大陆,郑丽文向民进党妥协,日本部署导弹

野史日记
2026-03-01 09:25:03
一汽丰田第六代RAV4荣放双擎精英版上线限时焕新价,15.18万元

一汽丰田第六代RAV4荣放双擎精英版上线限时焕新价,15.18万元

IT之家
2026-03-02 09:08:37
哈梅内伊之死和伊朗性史

哈梅内伊之死和伊朗性史

哲空空
2026-03-01 11:14:17
知名演员秦岚自曝患病,已做手术!

知名演员秦岚自曝患病,已做手术!

极目新闻
2026-02-28 23:12:57
别当废品扔!2026这5类旧物暴涨,有的涨10倍,家家都有

别当废品扔!2026这5类旧物暴涨,有的涨10倍,家家都有

爱下厨的阿酾
2026-03-01 16:51:26
邹市明一家国外度假!冉莹颖膘肥体壮不好惹,轩轩一头白毛好土气

邹市明一家国外度假!冉莹颖膘肥体壮不好惹,轩轩一头白毛好土气

小徐讲八卦
2026-03-01 05:51:11
汪小菲首次回应包机事件,谈到S家直呼无语,对黑粉毫不客气

汪小菲首次回应包机事件,谈到S家直呼无语,对黑粉毫不客气

小徐讲八卦
2026-03-01 06:14:05
港股暴跌,亚太股市全线走低,A股跳水后拉回,下午能全线收红吗

港股暴跌,亚太股市全线走低,A股跳水后拉回,下午能全线收红吗

有范又有料
2026-03-02 12:16:58
梅西2球1助导演大逆转,任意球破门次数追平贝利

梅西2球1助导演大逆转,任意球破门次数追平贝利

体坛周报
2026-03-02 11:19:11
不是那个年代的,你真看不懂

不是那个年代的,你真看不懂

深度报
2026-02-15 23:01:53
3月2日人民币对美元中间价调贬8个基点

3月2日人民币对美元中间价调贬8个基点

证券时报
2026-03-02 09:31:54
一场34分惨败,让开拓者看清杨瀚森,中国球迷开始理解斯普利特

一场34分惨败,让开拓者看清杨瀚森,中国球迷开始理解斯普利特

球场没跑道
2026-03-02 11:15:40
2026-03-02 15:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12212文章数 176399关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛 给世界5个深刻教训

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛 给世界5个深刻教训

体育要闻

卡里克主场5连胜!队史第2人通过最大考验

娱乐要闻

美伊以冲突爆发,多位明星被困中东

财经要闻

中东局势影响如何?十大券商策略来了

汽车要闻

预售11.28万起 狐全新阿尔法S5标配宁德时代

态度原创

数码
手机
艺术
家居
旅游

数码要闻

联想公布ThinkBook Modular AI PC Concept模块化双屏概念机

手机要闻

最高暴涨3000元!史上最猛安卓涨价潮来了 2026年手机出货量将创13年来新低

艺术要闻

2025北京青年美术作品展 | 油画作品选刊

家居要闻

万物互联 享科技福祉

旅游要闻

【花Young贵阳】南明区永乐乡万亩桃花竞相绽放

无障碍浏览 进入关怀版