网易首页 > 网易号 > 正文 申请入驻

谷歌发布新架构,用一半内存实现推理速度翻倍

0
分享至

谷歌 DeepMind 与韩国科学技术院(KAIST)的研究人员近日联合发布了一种名为“Mixture-of-Recursions”(MoR)的新型语言模型架构。据称能在保持模型性能的同时,实现了推理速度翻倍、训练计算量减少并降低了约 50% 的 KV 缓存内存使用。论文一经发布,便在社交媒体上引发了广泛关注,甚至有评论称其或许是“Transformer 杀手”。

自 2017 年问世以来,Transformer 架构已成为大型语言模型的技术基础,目前几乎所有先进模型都建立在这一架构之上。但随着模型规模越来越大,Transformer 架构对计算和内存资源的需求也日益增加,训练和部署成本十分高昂。过去的效率优化方法通常只关注单一方向,例如通过参数共享来缩小模型尺寸,或通过自适应计算来按需分配算力,但很少能将多个效率目标同时优化。

MoR 架构的核心创新在于将递归计算与动态路由机制相结合,在一个统一框架内解决多重效率问题。在标准的 Transformer 模型中,输入文本的每一个 token 都要经过相同数量的计算层处理。MoR 则改变了这一模式,它允许不同的 token 根据自身的复杂度,接受不同深度的处理。

具体来说,MoR 使用共享的参数块来提升参数效率,同时通过一个轻量级的“路由器”,来决定每个 token 需要经历多少次递归计算。研究团队测试了多种路由策略,例如“专家选择”(expert-choice)和“token 选择”(token-choice),以平衡计算负载和避免信息处理中的逻辑问题。在参数共享方面,测试结果表明“Middle-Cycle”策略表现最好,该策略保持模型的第一层和最后一层使用独立的参数,只在中间层之间共享权重,以此在参数效率和模型的表达能力之间取得较好的平衡。

内存管理是 MoR 的另一项关键改进。即使参数共享了,传统递归模型在每一层递归时仍会产生独立的 KV 缓存,导致内存占用依然很高。MoR 提出了两种新的 KV 缓存策略来应对这一问题。一种是“递归式缓存”,只为被路由到特定递归步骤的 token 存储 KV 数据,并将注意力计算限制在这些本地数据中,从而有效降低了 KV 缓存的内存占用和数据读写量。另一种“递归共享”策略则更进一步,利用所有 token 都会经过第一个递归块的特性,只在第一步缓存 KV 数据,供后续所有递归步骤重复使用,以此最大化地节省内存。

研究团队在 1.35 亿到 17 亿参数的多个模型规模上进行了测试。结果表明,在相同的训练计算预算下,一个采用 MoR 架构的模型,虽然其参数量比基准 Transformer 模型少了近一半,但在多项少样本学习任务中的平均准确率达到了 43.1%,超过了基准模型的 42.3%。

更重要的是,MoR 更高的计算效率,使其能在相同的计算预算内处理更多的训练数据,这反过来也提升了模型的最终性能。在固定训练数据量的对比实验中,一个 MoR 配置在使用少 25% 训练计算量的情况下,其性能依然超过了基准模型,同时训练时间减少了 19%,峰值内存使用也降低了 25%。

在推理性能上,MoR 的优势更加明显。它采用了一种连续深度批处理技术,可以将处在不同计算阶段的 token 组合到同一个批次中进行处理,因为它们都使用相同的参数块。该技术配合模型的早期退出机制,显著提升了处理吞吐量。在 3.6 亿规模的模型测试中,MoR-4 配置在特定设置下实现了高达 2.06 倍的推理加速。

研究还发现,MoR 模型在处理不同类型 token 时,表现出一种与语义重要性相关的模式。内容丰富的 token,如“People”或“defensively confident”,会被分配更多的递归次数(三次);而功能性词汇,如“and”,通常只需要较少的递归次数。这表明,模型学会了将更多的计算资源用于处理更重要的信息。

实际上,MoR 的出现也离不开谷歌此前相关研究的铺垫。在早前的 Mixture-of-Depths(MoD)等技术中,谷歌 DeepMind 就已经探索了动态分配计算资源的方法。同时,递归 Transformer 作为一种参数共享技术,也为 MoR 提供了理论基础。

MoR 进一步延续了这些研究对 AI 效率优化的探索,即从单一维度的优化,转向参数、计算和内存等多个维度的协同优化。这对于降低大语言模型的部署和使用成本具有较大的实际意义。

总体而言,虽然现在断言 MoR 能否完全替代 Transformer 还为时过早,但它确实为未来的语言模型架构设计,提供了一个在性能和效率上都极具潜力的发展方向。

参考资料:

1.https://arxiv.org/abs/2507.10524

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗建议民众离开德黑兰

伊朗建议民众离开德黑兰

财联社
2026-02-28 21:58:42
哈梅内伊给所有掌权者,上了最后一课

哈梅内伊给所有掌权者,上了最后一课

梳子姐
2026-03-01 15:14:59
美国军力全球第一,敢打任何国家?俄泼冷水:这4国你敢打谁?

美国军力全球第一,敢打任何国家?俄泼冷水:这4国你敢打谁?

近史谈
2026-01-19 10:09:51
中美冲突升级的下一步,一定是军事较量,我们要做好全面准备

中美冲突升级的下一步,一定是军事较量,我们要做好全面准备

曾经年少
2025-04-14 16:03:33
内鬼把哈梅内伊从地堡中骗出来让美发卡点斩首

内鬼把哈梅内伊从地堡中骗出来让美发卡点斩首

健身狂人
2026-03-02 00:29:41
水利部长傅作义无实际职权,副部长代替签字,周总理:一律无效

水利部长傅作义无实际职权,副部长代替签字,周总理:一律无效

兴趣知识
2026-02-27 22:03:38
原来早已不是中国籍?事业巅峰远赴美国,被老外“玩腻”晚年回国

原来早已不是中国籍?事业巅峰远赴美国,被老外“玩腻”晚年回国

往史过眼云烟
2026-02-27 23:04:59
蒙古国的人,为啥如此仇视中国人?

蒙古国的人,为啥如此仇视中国人?

贱议你读史
2026-02-27 15:12:56
高考语文题,“固若金汤”中“汤”指什么?当年难倒不少学霸

高考语文题,“固若金汤”中“汤”指什么?当年难倒不少学霸

长风文史
2026-03-01 20:40:30
中国要做好战争准备,中国的下场战争不是印度菲律宾越南而是日本

中国要做好战争准备,中国的下场战争不是印度菲律宾越南而是日本

百态人间
2026-01-09 17:17:17
绝了!白百何的脚凭啥成全网热议焦点,快来看!

绝了!白百何的脚凭啥成全网热议焦点,快来看!

草莓解说体育
2026-03-02 01:19:59
超20000名旅客滞留!上海大学生:因为一场急病,提前逃出迪拜,感叹“差点没法上学”

超20000名旅客滞留!上海大学生:因为一场急病,提前逃出迪拜,感叹“差点没法上学”

新民晚报
2026-03-01 20:44:34
美伊开战,重温毛主席的5个重要论断!

美伊开战,重温毛主席的5个重要论断!

钧言堂
2026-03-01 11:16:37
神坛彻底崩塌!李莉被中情局盯上的谎言,该彻底戳穿了

神坛彻底崩塌!李莉被中情局盯上的谎言,该彻底戳穿了

老马拉车莫少装
2026-03-01 17:23:52
哈梅内伊和亲属开会时遇袭身亡!伊朗内鬼和现场照片曝光

哈梅内伊和亲属开会时遇袭身亡!伊朗内鬼和现场照片曝光

项鹏飞
2026-03-01 20:35:46
国民党前最美发言人投入议员选举,罗智强细数贡献赞“明日之星”

国民党前最美发言人投入议员选举,罗智强细数贡献赞“明日之星”

海峡导报社
2026-03-01 10:42:19
女子回湖北婆家过年,车被妯娌砸稀烂,竟牵扯上孩子,原因太炸裂

女子回湖北婆家过年,车被妯娌砸稀烂,竟牵扯上孩子,原因太炸裂

社会日日鲜
2026-03-01 08:30:01
日股大跌,日经225重挫近1400点

日股大跌,日经225重挫近1400点

21世纪经济报道
2026-03-02 08:47:32
炸锅!向佑破防:我是亲儿子,父母却把百亿家产全给大嫂郭碧婷

炸锅!向佑破防:我是亲儿子,父母却把百亿家产全给大嫂郭碧婷

可乐谈情感
2026-03-01 15:48:35
女大学生回家机票被人恶意取消后,挖出作案人身份详细操作堪称福尔摩斯

女大学生回家机票被人恶意取消后,挖出作案人身份详细操作堪称福尔摩斯

不二表姐
2026-03-01 23:47:51
2026-03-02 11:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16343文章数 514689关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛 给世界5个深刻教训

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛 给世界5个深刻教训

体育要闻

卡里克主场5连胜!队史第2人通过最大考验

娱乐要闻

美伊以冲突爆发,多位明星被困中东

财经要闻

中东局势影响如何?十大券商策略来了

汽车要闻

预售11.28万起 狐全新阿尔法S5标配宁德时代

态度原创

本地
健康
数码
公开课
军事航空

本地新闻

津南好·四时总相宜

转头就晕的耳石症,能开车上班吗?

数码要闻

军规可靠:联想发布ThinkTab X11强固型Android平板电脑

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军动用新型武器:山寨伊朗的

无障碍浏览 进入关怀版