网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

MIT何恺明打破GPT垄断，新语言模型ELF：仅45B训练量碾压同级基线

2026-05-13 21:22:58　来源: 知识圈

北京举报

0

分享至

MIT何恺明团队发布了新语言模型 ELF（Embedded Language Flows）。他们绕开了目前的自回归架构，把自己在视觉领域最拿手的扩散模型直接用在了文本生成上。具体做法是：把整个生成过程塞进连续的向量空间，直到最后一步才把数据还原成离散 token。

图像像素能平滑变色，天生适合扩散模型去噪。但文字不行，词与词之间是断开的，「猫」和「狗」之间没有任何中间地带。为了填平这个鸿沟，以前的文本扩散模型做得很拧巴：要么在去噪时每一步都强行去查词表，要么在模型外面再挂一个独立的解码器。ELF 彻底切断了这种纠缠：中间全不管，让模型安安心心在连续空间里算去噪，只在最后一刻用同一套网络把向量转回文字。

这条路不仅走通了，而且极度省数据。在 OpenWebText 评测中，105M 参数的 ELF-B 仅用32步采样，困惑度（Gen. PPL）就压到了约24.1，优于多款基线模型。更重要的是，它只消耗了约45B 训练 token，而同级别对手通常需要500B 以上，训练量直接砍掉九成。这个结果证明，语言天生的离散性并没有堵死连续扩散这条路。

一旦这种思路成熟，未来的大模型有望彻底摆脱只能「从左到右、单向蹦字」的架构束缚。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

俄军："世界上最强大导弹"试射成功射程超35000公里

红星新闻 2026-05-13 13:21:19
44678 跟贴 44678
头皮发麻！广东飞蚁大爆发住30几楼都逃不掉

看看新闻Knews 2026-05-13 12:04:06
272 跟贴 272

中方对无核武国家鼓吹拥核言论表示关切

环球网资讯 2026-05-13 07:54:25
15922 跟贴 15922

U17国足胜卡塔尔惊险晋级亚洲杯淘汰赛，中国足球时隔21年重返世界大赛

文汇报 2026-05-13 07:48:10
2188 跟贴 2188
法国新法落地：归还 “260万被抢文物”有多艰难？｜重建现场

新京报动新闻 2026-05-11 01:46:32
913 跟贴 913

豆包收费了！大模型将告别免费时代？有何考量？

大象新闻 2026-05-13 10:26:14
6650 跟贴 6650

九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
3112 跟贴 3112
男子走夜路发现剧毒白头蝰，毒性远超五步蛇，至今无抗毒血清

星视频 2026-05-13 15:03:50
752 跟贴 752

孙铭阳正式宣布退出国家队：我随时都在，有召必回！

现代快报 2026-05-13 15:38:07
334 跟贴 334
约0.01飞米！中国科学家重要发现，将改写教科书

上观新闻 2026-05-14 06:48:04
32 跟贴 32
斯诺克女子世界第一白雨露谈吴宜泽世锦赛夺冠：深受激励，气场与自信值得学习

上观新闻 2026-05-14 04:58:06
3 跟贴 3
京沪高铁部分线路涨价

无线徐州 2026-05-13 11:33:17
129 跟贴 129
自助餐加了“饱腹剂”？记者调查自助餐“快速饱腹”的秘密

大象新闻 2026-05-13 14:30:03
96 跟贴 96
贵州一女子在河边“放生”奶茶，口中念念有词，当地：并无此类风俗，已介入核查

扬子晚报 2026-05-13 14:54:14
97 跟贴 97
汉邦高科拿下27亿GPU大单，合作方成立不到1年、探访注册地“查无此司”

红星资本局 2026-05-13 20:05:36
397 跟贴 397
佩林卡：任何球队都渴望拥有詹姆斯我们只想尊重他的决定

北青网-北京青年报 2026-05-13 21:52:20
193 跟贴 193
“这是一次我们从未见过的大变革”，李彦宏称“代码正在变得不值钱”

红星资本局 2026-05-13 16:42:26
108 跟贴 108
美丽中国行｜执绿色之笔，绘美丽中国

新华社 2026-05-13 13:10:21
47 跟贴 47
狗在金门大桥崩溃，她还是跑完了13英里

晚风也遗憾 2026-05-14 07:12:23
0 跟贴 0
4月汽车销量前十名仅剩一款燃油车！麦肯锡：燃油车中短期内在中国市场不会快速退出历史舞台

每日经济新闻 2026-05-13 16:52:04
0 跟贴 0
房东收冰箱"月租费"：不交就远程锁机

追星雷达站 2026-05-14 07:18:26
0 跟贴 0
河南17岁少年跟父亲负气出走7天未归，父亲一句“不敢”看哭网友

魔都姐姐杂谈 2026-05-14 07:17:28
0 跟贴 0

巴萨0比1负阿拉维斯新援首秀成唯一亮点

巴萨0比1负阿拉维斯新援首秀成唯一亮点

竞技风云录

2026-05-14 06:26:19

足协主席宋凯与国际足联秘书长在京会面

足协主席宋凯与国际足联秘书长在京会面

北青网-北京青年报

2026-05-13 17:44:09

印度互联网狂飙：机遇密码与潜在隐忧

印度互联网狂飙：机遇密码与潜在隐忧

烽火瞭望者

2026-05-14 06:13:38

1500万潮汕人移民东南亚，当年究竟有多惨烈？| 地球知识局

1500万潮汕人移民东南亚，当年究竟有多惨烈？| 地球知识局

地球知识局

2026-05-13 07:30:17

深圳女商人罗长丽把国内套路搬去美国，12亿天价勒索栽在FBI手里

深圳女商人罗长丽把国内套路搬去美国，12亿天价勒索栽在FBI手里

观星娱记

2026-05-13 11:06:24

特斯拉：再次突破

新浪财经

2026-05-11 10:29:59

足球报：U17国少球员遭遇网络暴力，赛前部分主力因故被放弃

足球报：U17国少球员遭遇网络暴力，赛前部分主力因故被放弃

懂球帝

2026-05-13 13:04:31

76人队传闻：达里尔·莫雷被解雇后，麦凯恩的交易或将引发争议

76人队传闻：达里尔·莫雷被解雇后，麦凯恩的交易或将引发争议

好火子

2026-05-14 00:18:29

跟着第1梯队下飞机，黄仁勋估计还处于比较懵的状态

跟着第1梯队下飞机，黄仁勋估计还处于比较懵的状态

阿龙聊军事

2026-05-14 06:43:50

每体：巴尔德吉无缘瑞典世界杯50人名单是因附加赛后失态行为

每体：巴尔德吉无缘瑞典世界杯50人名单是因附加赛后失态行为

懂球帝

2026-05-13 18:45:10

领导的网名叫上善若水，我该叫什么才能压他一头？

领导的网名叫上善若水，我该叫什么才能压他一头？

摩登人类

2026-05-11 19:43:02

华南理工一男生课堂偷拍女生裙底被当场发现，校方：对涉事学生作出留校察看处分

华南理工一男生课堂偷拍女生裙底被当场发现，校方：对涉事学生作出留校察看处分

扬子晚报

2026-05-13 17:16:56

挤走董卿、靠爹上位、央视“穷鬼”，龙洋的私生活谣言有多离谱？

挤走董卿、靠爹上位、央视“穷鬼”，龙洋的私生活谣言有多离谱？

猪小艳吖

2026-05-12 03:50:15

2026年电费新规来了！7月1日起执行，看完再用电，每月少花几十块

2026年电费新规来了！7月1日起执行，看完再用电，每月少花几十块

陈博世财经

2026-05-12 17:03:49

筑牢安全防线守护万家灯火

人民网

2026-05-13 09:07:38

2026才过半！5位顶流网红接连塌房，偷税炫富低俗一个比一个荒唐

2026才过半！5位顶流网红接连塌房，偷税炫富低俗一个比一个荒唐

橙星文娱

2026-05-12 09:13:39

1076万买走张雪35%股份，两年估值暴涨100倍，凯越亏的从来不是钱

1076万买走张雪35%股份，两年估值暴涨100倍，凯越亏的从来不是钱

烈史

2026-05-12 17:55:13

89年前那场灾难，照片为何至今仍让人窒息

89年前那场灾难，照片为何至今仍让人窒息

时光慢邮啊

2026-05-13 07:19:13

抢在被定罪前，莎拉迎来最大强援，菲军火速清场，马科斯蒙在鼓里

抢在被定罪前，莎拉迎来最大强援，菲军火速清场，马科斯蒙在鼓里

古史青云啊

2026-05-13 19:24:23

侯耀文离世后，侄儿接手自己娇妻，两人如今过得怎样

侯耀文离世后，侄儿接手自己娇妻，两人如今过得怎样

观察鉴娱

2026-05-13 10:59:34

全球热点新闻资讯

233文章数 317400关注度

往期回顾全部

科技要闻

阿里年营收首破万亿，AI终于不再是画大饼

头条要闻

中东战火烧痛印度莫迪六天访五国要外交“救国”

头条要闻

中东战火烧痛印度莫迪六天访五国要外交“救国”

体育要闻

14年半，74万，何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉，网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑吉利银河"TT"申报图来了

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

亲子

本地

艺术

公开课

旅游要闻

泰国拟缩短93国游客免签停留期限，从60天减少至30天

亲子要闻

重庆儿童配眼镜，家长指南：儿童防控五大核心问题汇总

本地新闻

用苏绣的方式，打开江西婺源

艺术要闻

这才是真正的“史上最强毕业证”，书法堪比字帖！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版