网易首页 > 网易号 > 正文 申请入驻

MIT携手英伟达开发TLT技术,推理大模型训练效率最高提速210%

0
分享至

来源:市场资讯

(来源:IT之家)

IT之家 2 月 28 日消息,MIT News 于 2 月 26 日发布博文,报道称麻省理工学院(MIT)联合英伟达等机构,发布“驯服长尾”(TLT)技术,可以大幅提升推理大语言模型(LLM)的训练效率。

IT之家援引博文介绍,推理大模型擅长通过拆解步骤来解决复杂问题,但在强化学习(RL)的训练过程中,算力与能耗的消耗极为巨大。

研究团队发现,生成多个备选答案的“推演”(rollout)阶段占据了高达 85% 的训练时间。由于不同处理器生成回答的长度不一,完成较快的处理器只能被迫闲置,等待其他处理器完成长文本任务,从而形成了严重的效率瓶颈。

MIT 研究人员为解决该痛点,联合英伟达、苏黎世联邦理工学院等机构,提出了一种名为“驯服长尾(TLT)”的自适应解决方案。


该方案的核心在于创新性地运用“投机解码”技术,即训练一个较小的“草稿模型”(drafter)来快速预测大模型的未来输出,随后由大模型批量验证这些猜测。这样一来,大模型无需逐个顺序生成输出,从而大幅加快了处理进程。



在传统的投机解码中,草稿模型通常只训练一次并保持静态。然而在强化学习中,主模型需要更新数千次,静态草稿模型会迅速失效。


因此,TLT 系统引入了“自适应草稿训练器”。一旦部分处理器完成短查询进入闲置状态,系统会立即调度它们实时训练草稿模型。

同时,“自适应推演引擎”会根据工作负载特征自动调整解码策略,确保草稿模型始终与目标大模型保持高度同步,且不增加额外算力开销。


基于真实世界数据集的测试表明,TLT 技术在保持模型准确率完全无损的情况下,将多个推理大语言模型的训练速度提升了 70% 到 210%。


不仅如此,训练得到的轻量级草稿模型还可以作为免费的副产品,直接用于后期的高效部署。研究团队未来计划将该技术融入更多训练与推理框架中,进一步降低 AI 开发成本并提升能源利用率。


参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“清华学霸”李一诺:27岁博士毕业,4年生3个娃,替世界首富花钱

“清华学霸”李一诺:27岁博士毕业,4年生3个娃,替世界首富花钱

北有南栀
2026-02-28 17:55:03
上海电影院现场捉奸,女主照片曝光,最刺痛的一幕其实不是打架

上海电影院现场捉奸,女主照片曝光,最刺痛的一幕其实不是打架

半糖甜而不腻
2026-02-28 10:58:19
前线首次拍到乌克兰幻影2000,“铁锤”数量大涨!俄军又炸水坝

前线首次拍到乌克兰幻影2000,“铁锤”数量大涨!俄军又炸水坝

鹰眼Defence
2026-02-28 17:01:01
油价最新分析:或出现历史性飙升

油价最新分析:或出现历史性飙升

上观新闻
2026-03-01 06:50:08
960万拆迁款全给弟弟,父亲70大寿姐姐没去,寿宴当天弟弟懵了

960万拆迁款全给弟弟,父亲70大寿姐姐没去,寿宴当天弟弟懵了

晓艾故事汇
2025-08-04 08:08:52
伊朗:科威特美国海军基地所有基础设施被摧毁,大量美军伤亡;一艘美国运送弹药的战舰被袭后发生爆炸

伊朗:科威特美国海军基地所有基础设施被摧毁,大量美军伤亡;一艘美国运送弹药的战舰被袭后发生爆炸

极目新闻
2026-03-01 07:40:29
杭州灵隐寺,为何要保留“一代妖僧”的雕像?看到千万不要乱拜

杭州灵隐寺,为何要保留“一代妖僧”的雕像?看到千万不要乱拜

收藏大视界
2026-02-28 23:03:27
中国四位最“不靠谱”专家,“忽悠”央视28年,为何还能爆火至今

中国四位最“不靠谱”专家,“忽悠”央视28年,为何还能爆火至今

小莜读史
2026-02-27 20:30:12
美以袭击伊朗,华人紧急逃离德黑兰:没想到袭击来得这么快,连夜买机票离开但领空已关闭,街头发生爆炸已断网

美以袭击伊朗,华人紧急逃离德黑兰:没想到袭击来得这么快,连夜买机票离开但领空已关闭,街头发生爆炸已断网

极目新闻
2026-02-28 17:13:18
泪目!21岁少年的最后成全:停药救母,把遗憾藏进未赴的海边之约

泪目!21岁少年的最后成全:停药救母,把遗憾藏进未赴的海边之约

行者聊官
2026-02-28 16:06:40
男篮世预赛晋级形势分析!中国队1战定生死:韩国或被联手踢出局

男篮世预赛晋级形势分析!中国队1战定生死:韩国或被联手踢出局

篮球快餐车
2026-03-01 00:42:22
男篮世预赛又曝出一大冷门!3冠王惨遭掀翻:中国队苦主彻底陨落

男篮世预赛又曝出一大冷门!3冠王惨遭掀翻:中国队苦主彻底陨落

篮球快餐车
2026-02-28 11:36:43
价格战再次打响!问界“降”7万,零跑4.6万!

价格战再次打响!问界“降”7万,零跑4.6万!

电动知家
2026-02-28 19:59:59
很可惜,白象的基本盘危险了

很可惜,白象的基本盘危险了

首席品牌评论
2026-02-28 13:55:53
汪小菲吐槽小汪宝心眼太多,回应玥箖上学问题,筱梅或成了导火索

汪小菲吐槽小汪宝心眼太多,回应玥箖上学问题,筱梅或成了导火索

查尔菲的笔记
2026-02-28 13:39:27
年销7900辆,巨亏223亿欧:意大利的汽车工业已然输掉了全部未来

年销7900辆,巨亏223亿欧:意大利的汽车工业已然输掉了全部未来

电科技网
2026-02-28 19:48:45
53岁李冰冰在巴黎杀疯了!白到发光隐现腹肌,这状态真不是人类?

53岁李冰冰在巴黎杀疯了!白到发光隐现腹肌,这状态真不是人类?

草莓解说体育
2026-02-06 05:59:56
美国媒体:中国突破禁令的方式简单粗暴,日本将助中国科技腾飞

美国媒体:中国突破禁令的方式简单粗暴,日本将助中国科技腾飞

蜉蝣说
2026-01-09 14:37:07
浙江省纪委省监委网站:林世南,主动投案

浙江省纪委省监委网站:林世南,主动投案

浙江之声
2026-02-27 20:27:04
火箭爆冷输热火,还内讧!杜兰特砍历史第5神迹,一战看清3个现实

火箭爆冷输热火,还内讧!杜兰特砍历史第5神迹,一战看清3个现实

毒舌NBA
2026-03-01 07:22:35
2026-03-01 09:35:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2301502文章数 5611关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普称哈梅内伊身亡 后者去年6月布局完整继承体系

头条要闻

特朗普称哈梅内伊身亡 后者去年6月布局完整继承体系

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

艺术
房产
家居
时尚
本地

艺术要闻

惊艳!这位天使般的女子与油画让人心动不已!

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

家居要闻

素色肌理 品意式格调

普通人穿衣不需要太复杂!颜色恰当、搭配和谐,高级又耐看

本地新闻

津南好·四时总相宜

无障碍浏览 进入关怀版