网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

清华2年前预言，正成为全球共识！Meta等三大AI机构已得出同一结论

2026-04-13 17:08:13　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：好困桃子

【新智元导读】太疯狂了！Meta和METR刚测出的AI进化数据，与中国团队两年前提出的「密度定律」完美重合。硅谷猛然回头，发现中国研究者在这条路上已领先两年！

全球三家最严肃的AI研究机构，过去一周集体撞车了！

4月3日，美国研究机构METR悄悄更新了一份技术报告，核心结论压成一句话。

AI能力每88.6天翻倍一次。

5天后，4月8日，Meta超级智能实验室发布全新模型Muse Spark，公开了一条内部叫做scaling ladder的训练效率曲线，结论也是一句话。

要追上一年前Llama 4 Maverick的性能，新模型只需要不到十分之一的训练算力。

一份测任务时长，一份测训练算力。两家机构没有任何往来，研究方法毫无重合。

但当两条曲线被换算到同一坐标系里，斜率几乎完全重合。

到这里，事情已经够离谱了。

更离谱的是，这条曲线，被一个中国团队两年前就完整地画出来过，还登上了Nature子刊。

它叫密度定律。

两年前，有人提前画过这条线

这个概念最早出现在一篇叫「Densing Law of LLMs」的论文里。

作者是面壁智能和清华大学的联合团队，孙茂松和刘知远两位教授领衔，第一作者是博士生肖朝军。

论文2024年12月挂上arXiv，2025年11月被Nature Machine Intelligence接收。

论文地址：https://arxiv.org/abs/2412.04315

论文地址：https://www.nature.com/articles/s42256-025-01137-0

论文的核心判断只有一句话。

模型智能密度随时间呈指数级增强，达到特定智能水平所需的参数量，每3.5个月下降一半。

放在2024年底，这话听上去有点过激。

那时全行业都在崇拜scaling law。OpenAI在堆模型，Anthropic在堆模型，Meta也在堆模型。

所有人都觉得参数越大智能越强，把GPU烧到极致才是正道。

但研究团队不这么看。

他们把当时所有有影响力的开源基础模型，从Llama-1一路到Gemma-2、MiniCPM-3，总共51个模型都放进了同一把尺子里去量。

五大基准跑完，结果是几乎完美的指数关系，R²达到0.934。

考虑到大模型评测很容易被数据污染干扰，他们又用一个新构建的污染过滤数据集MMLU-CF重测了一次。R²=0.953。

两次拟合都拿到了接近1的R²。统计学上，这几乎不可能是巧合。

换句话说就是，这两年发布的每一个主流开源模型，不管来自哪个团队、用什么架构，都落在了同一条「每3.5个月翻倍」的指数线上。

到这里，故事还只是「一个中国团队提出了一个看上去很激进的经验规律」。

真正让这件事变成一个「时刻」的，是接下来这小半年发生的事。

三家机构，三种方法，同一个斜率

把面壁、Meta、METR三方的结论摊开看。

面壁的密度定律衡量的是「同样的智能水平需要多少参数」。结论是参数需求每3.5个月减半。
Meta的scaling ladder衡量的是「同样的智能水平需要多少训练算力」。结论是Muse Spark比一年前的Llama 4 Maverick节省了一个数量级。
METR的时间跨度报告衡量的是「同样的模型能搞定多长任务」。结论是任务时长每88.6天翻倍。

三把尺子。三个学术机构。三种没有任何重合的研究路径。

但当所有数字被换算到同一坐标系里看时，它们的曲线斜率几乎完全重合。

这事最容易被忽略的一点是，密度定律是这三者里最早提出的。比Meta的scaling ladder早了近两年，比METR的完整建模也早了一年多。

而当Meta在四月初的发布博客里画出那条scaling ladder时，他们大概自己都没意识到。这张图的形状，和2024年北京一个学术会议PPT上的曲线，几乎是同一条线。

什么样的观察，才配得上「定律」两个字

在科学界，有一套不成文的标准，来判断一条经验观察是否有资格被叫做「定律」。

不是看数据有多漂亮，是看它能不能在多个独立的测量系统下同时成立。

摩尔定律之所以是定律，因为半导体行业从光刻精度、晶体管密度、单位算力成本三个完全不同的维度，几十年来一遍遍验证过它。

密度定律走的是同一条路。

它最初只是来自单一团队的一条拟合曲线。到Nature子刊接收时，它已经能在污染过滤后的数据集上重现。到这个月，它在Meta的训练数据和METR的任务评测里又被两次独立验证。

放在更大的坐标系里看，这一刻像极了1880年代电力刚进入纽约的时候。

那时也是几个不同的发明家、不同的工程师、不同的城市，各自在搞各自的电网。直到有人把所有项目的发展曲线画在一张纸上，人们才反应过来。这不是几个零散的工程进步，这是一个新时代正在悄悄铺开。

只是这一次，从论文发表到被全球同行验证，只用了不到一年。

三个推论，每一个都在改写行业假设

如果密度定律站得住脚，它会同时改写很多东西。

第一，推理成本会比所有人预期的都崩得更快。

密度定律的一个推论是，达到同样性能的LLM，推理成本大概每2.6个月减半。

如今，这个降幅已经被现实超过了。

Epoch AI最新追踪数据显示，达到Claude 3.5 Sonnet性能水平的LLM，过去一年token价格降了400倍。同档位性能的最快降幅触到900倍/年。

2022年底GPT-3.5开价20美元/百万token那种水平，今天Mistral Nemo只要0.02美元，便宜了1000倍，模型还更强。

回头来看，论文里的预测还是保守了。

第二，端侧智能的爆发点，比所有人预想的都近。

把密度定律和摩尔定律相乘，会得到一个更刺激的数字。

按目前估算，在同价格芯片上能跑的最大有效模型规模，大约每88天翻一倍。

这个数字和METR算出的88.6天几乎一致。两家完全不同的推算路径，在小数点后撞了车。

未来三五年，在一台普通笔记本甚至一部手机上跑当下顶级GPT级别模型这件事，可能不再是科幻。

第三，大模型行业的最优策略，正在悄悄反转。

过去三年，行业对scaling law的理解一直停留在「堆参数堆数据」

但密度定律给出了一个反直觉的判断。在密度持续指数增长的前提下，任何状态的最强模型都只有几个月的最优窗口期。

砸全部资源去训一个更大的模型，然后等三个月被一个体积一半的新模型超越，在经济账上是不划算的。

真正可持续的路，是把资源砸在密度本身的提升上。更好的架构，更高质量的数据，更聪明的训练算法。

面壁，一直在沿着自己画的尺子走

值得说一句的是，密度定律不是一篇发完就结束的论文。

提出这套理论的面壁智能，过去两年一直在用自家的「小钢炮」MiniCPM系列模型验证它。

MiniCPM-1-2.4B在2024年2月发布的时候，跑分能打平或超过2023年9月的Mistral-7B。也就是说，四个月时间，35%的参数，达到了同等性能。

这个数字被直接写进了Nature子刊那篇论文里，作为密度定律的第一个实证案例。

从那之后，小钢炮系列一路开源，覆盖10B以下参数的文本、多模态、语音、全模态四大方向。这个开源完整度，在国内除了阿里之外，只有面壁一家做到。

到目前为止，小钢炮系列在全球的开源下载量已经突破2400万次。

它不是行业里最大的模型。但它是行业里第一个把「密度优先」当作公司方法论来执行的团队。

而当Meta和METR在2026年4月这一周用各自的方式验证密度定律时，这家2024年就开始按这套方法论训练模型的中国公司，其实已经领先了两年的工程经验。

这一次，中国研究者站在了曲线的起点

一个中国研究团队两年前提出的理论框架，正在被Meta、METR这些海外最严肃的机构，用他们各自的方式，一次次重新发现。

这件事的份量，可能需要一点时间才能完全理解。

它不是一个「我们也行」的故事。它是一个「我们更早一点看见」的故事。

科学史上这样的瞬间不算多。一个在2024年被怀疑的判断，在2026年变成了多个独立证据指向的同一条曲线。

这种跨地域、跨方法、跨机构的「不约而同」，在物理学里发生过几次，每一次都标志着一个旧范式的终结和一个新范式的开始。

中国AI研究者这一次站在了那个起点上。

而那条曲线，还在以每88天翻一倍的速度往上走。

参考资料：

面壁智能首创的「密度定律」，获 Meta 等海外顶级机构认可

https://arxiv.org/abs/2412.04315

https://www.nature.com/articles/s42256-025-01137-0

https://metr.org/blog/2026-1-29-time-horizon-1-1/

https://ai.meta.com/blog/introducing-muse-spark-msl/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

机器之心Pro 2026-06-14 19:24:09
0 跟贴 0
给世界模型加上因果，她要让机器人真正理解“为什么”

DeepTech深科技 2026-06-20 11:32:15
0 跟贴 0

视频生成模型会「推理」吗？303道题全面揭示世界模型的推理短板

机器之心Pro 2026-06-28 18:29:07
0 跟贴 0

我把昨晚的梦输入AI，它居然直接把我拉进去玩儿了一把？！

量子位 2026-06-19 16:40:27
0 跟贴 0
网格智算：“不堆算力”的AI大脑如何填补林下场景空白 | 水下项目

36氪 2026-07-23 18:08:34
0 跟贴 0

OpenAI下一代模型，被曝8月提前上线

新智元 2026-07-25 13:01:05
9 跟贴 9

全新统一流式架构，Vivix灵动时刻正式发布首个实时互动模型

量子位 2026-07-25 11:26:28
0 跟贴 0
人类研发时代结束？XYZ最强Search Agent横扫七大榜单，300个Agent跑通AI4AI全栈闭环

机器之心Pro 2026-07-25 13:11:10
0 跟贴 0

WAIC最狠展台打爆工业「深水区」！它石智航首发具身原生大脑AWE 3.5，具身Scaling全面释放

量子位 2026-07-23 11:29:31
0 跟贴 0
全球首发宇树机器人街头争霸赛亮相成都春熙路

每日经济新闻 2026-07-25 15:12:19
4 跟贴 4
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0
GSMA大中华区总裁斯寒：亚太已成全球AI创新试验场，“6G+AI”将重构数字经济新范式

每日经济新闻 2026-07-25 14:50:07
0 跟贴 0
AI手机三国杀，荣耀们各有算盘

财天COVER 2026-07-25 15:15:01
0 跟贴 0
川这个地方很神奇，除了不挣钱哪都好？听听清华学霸为什么这么说

鹿云清 2026-07-24 02:50:52
0 跟贴 0
走遍全世界，为啥最爱的还是四川成都听听清华学霸怎么说的

一個人的夜晚 2026-07-23 02:38:04
0 跟贴 0
女孩以655分考上清华，全村举牌祝贺随后到祠堂敬拜祖先，网友：一人清华全村光荣！

观象视频 2026-07-24 17:32:43
162 跟贴 162
千年预言正应验，有路无人走，有房无人住，学区房时代即将落幕

君笙拂兮啊 2026-07-25 06:30:28
0 跟贴 0
爱因斯坦临死前烧掉手稿，只留一句话：人类不该知道这个秘密，物理学证明你的死亡早就存在

闽睿解说动物世界 2026-07-23 14:39:29
20 跟贴 20
清华学霸分享学数学思路，“数学一定要反着学”，网友：学霸的思路果然不一样

速览新闻 2026-07-21 14:27:06
312 跟贴 312
杨植麟为何没留在美国？毕竟潮汕人，永不打工！

网易科技态度见闻 2026-07-23 10:00:00
1 跟贴 1
Meta与微软扩大合作，Horizon+订阅新增Xbox Game Pass Starter服务

VR陀螺 2026-07-23 10:38:43
1 跟贴 1
"清华没考上，陪老婆读北大，后来自己干到年销一个亿。"

亚隆的视频播客 2026-07-22 14:53:07
0 跟贴 0
清华大学录取通知书已送达，画面令人羡慕不已，给人一种清华很好考的感觉

重庆科教融媒体 2026-07-23 15:49:10
0 跟贴 0
孙子考上清华，领着相依为命的爷爷，上台领奖

重庆热点 2026-07-22 19:20:03
1 跟贴 1
周桦：别认为没考上北大和清华，就不配享一流的生活，任何人任何时候都有无限可能

潇湘晨报 2026-07-21 18:43:09
0 跟贴 0
男生假装晒出自己2026小目标清单，实则是炫耀自己的清华录取通知书

重庆热点 2026-07-23 19:17:52
0 跟贴 0
姚洋：建议清华取消“丘班” 家长有啥错？只是为了让孩子免高考进清华

网易科技态度见闻 2026-07-23 08:00:00
0 跟贴 0
花重金刷进清华预科，终究撑不起数学天赋

嘎哈大哥科普 2026-07-24 11:04:32
1 跟贴 1
英伟达x清华Gamma World迅速登顶抱抱脸多智能体世界模型γ-World

量子位 2026-05-30 20:18:29
0 跟贴 0
英国示好巴基斯坦？贸易对话将升级，千企获Meta免费培训

人间百态中的温馨 2026-07-25 10:15:04
0 跟贴 0
紫牛调查｜西安一私立幼儿园变普惠后面临超千万欠款，原本属小区公建配套且应移交的幼儿园为何被高价转卖？

扬子晚报 2026-07-24 19:50:15
16807 跟贴 16807
清华毕业生备考3年被北大医学部录取，追梦，什么时候都不晚！

慢半拍sir 2026-07-23 17:46:55
0 跟贴 0
清华、北理工、北邮！三胞胎学霸被北京三高校录取

艺飞说 2026-07-25 14:50:14
0 跟贴 0
清华毕业备考三年，38岁入北大医学部八年制拒变现

他是她的岛熊 2026-07-25 06:56:07
0 跟贴 0
清华大学教育基金会英雄文化基金《栋梁》系列：陆建勋 (通信技术专家 )

东方文化杂志 2026-07-24 16:24:54
0 跟贴 0
为什么滑铁卢会成为失败的代名词？听听清华学霸怎么说

讲真剪辑社 2026-07-25 00:42:49
0 跟贴 0
1915年实拍影像，百年学府初现雏形，清华最早动态画面重现

人间闲散客 2026-07-25 13:15:04
0 跟贴 0
清华学姐分享：妈妈如何改掉我的拖延症！

诺鸽鸽 2026-07-23 02:32:58
0 跟贴 0
怪诞双胞胎携枪逼迫神父“履行预言”，这部黑白惊悚片戳穿权威的虚伪面具

自愈小日子 2026-07-25 01:25:25
0 跟贴 0
怎样判断固态电池技术是否成熟？

和讯网 2026-07-25 10:20:02
0 跟贴 0

苍蝇直接往脸上爬！莫迪当众发飙怒骂全国，印度卫生到底有多烂？

苍蝇直接往脸上爬！莫迪当众发飙怒骂全国，印度卫生到底有多烂？

丁懰惊悚影视解说

2026-07-25 10:01:03

山西洪洞发生一起黄土崩塌，致5人死亡

山西洪洞发生一起黄土崩塌，致5人死亡

界面新闻

2026-07-25 09:53:46

7月25日，人社部、财政部公布2026年养老金调整通知了吗？来看看

7月25日，人社部、财政部公布2026年养老金调整通知了吗？来看看

社保小达人

2026-07-25 09:44:38

假如许世友的两套作战方案得到采纳，估计世界历史会被重写！

假如许世友的两套作战方案得到采纳，估计世界历史会被重写！

兴趣知识

2026-07-20 02:56:49

菲尔兹奖美国得主走红：会说中文脱口秀，曾讲单田芳评书夺冠！儿子问：爸出生在中国？

菲尔兹奖美国得主走红：会说中文脱口秀，曾讲单田芳评书夺冠！儿子问：爸出生在中国？

红星新闻

2026-07-25 12:11:13

曝台湾省歌手费玉清现状曝光！无儿无女，和女闺蜜互相解决需求

曝台湾省歌手费玉清现状曝光！无儿无女，和女闺蜜互相解决需求

小徐讲八卦

2026-04-02 07:51:08

美媒：中国第五架“歼-36”原型机开始试飞，六代机进入新阶段，F-47用鸭翼隐身性能遭质疑

美媒：中国第五架“歼-36”原型机开始试飞，六代机进入新阶段，F-47用鸭翼隐身性能遭质疑

蓝星杂谈

2026-07-24 14:24:28

王祖贤将肖像卖给AI公司，唐国强的话正在被验证

王祖贤将肖像卖给AI公司，唐国强的话正在被验证

娱乐圈十三太保

2026-07-23 16:15:55

新司令上任第一天就猛攻库皮扬斯克！乌克兰战场打法全变了

新司令上任第一天就猛攻库皮扬斯克！乌克兰战场打法全变了

子桑说

2026-07-24 19:00:08

谢霆锋揭穿遗产假象仅1天，张柏芝官微发声，没给谢家留一丝体面

谢霆锋揭穿遗产假象仅1天，张柏芝官微发声，没给谢家留一丝体面

调侃国际观点

2026-07-25 11:24:26

高温趴窝发酵，股价下跌30%，小鹏召回33473辆X9汽车

高温趴窝发酵，股价下跌30%，小鹏召回33473辆X9汽车

ZAKER新闻

2026-07-24 18:26:55

方星海的AB面，揭开金融改革家的复杂肖像

方星海的AB面，揭开金融改革家的复杂肖像

坠入二次元的海洋

2026-07-25 02:13:46

突然火了，已售罄！“荷兰弟”来中国第一天，买了一条100多元五分裤……

突然火了，已售罄！“荷兰弟”来中国第一天，买了一条100多元五分裤……

都市快报橙柿互动

2026-07-24 19:15:32

北海舰队原政委陈先锋海军中将逝世，享年85岁

北海舰队原政委陈先锋海军中将逝世，享年85岁

澎湃新闻

2026-07-25 07:58:27

获菲尔兹奖的两位中国数学家，不在中国当差

获菲尔兹奖的两位中国数学家，不在中国当差

木蹊说

2026-07-24 12:52:30

真是万万没想到！大S遗产分配落锤，最后竟然是具俊晔手握产权

真是万万没想到！大S遗产分配落锤，最后竟然是具俊晔手握产权

笑饮孤鸿非

2026-07-25 15:34:09

降价9万仍无人问津，库存超260万辆，经销商应该如何跳出死循环？

降价9万仍无人问津，库存超260万辆，经销商应该如何跳出死循环？

史之铭

2026-07-23 16:38:39

时薪100起，高德包车上线，要求车龄三年内五年以上驾龄

时薪100起，高德包车上线，要求车龄三年内五年以上驾龄

网约车观察室

2026-07-25 09:52:33

“祖国为你自豪，全家人为你骄傲！”邓煜母亲在菲尔兹奖现场发朋友圈，老师回忆邓煜高中时代

“祖国为你自豪，全家人为你骄傲！”邓煜母亲在菲尔兹奖现场发朋友圈，老师回忆邓煜高中时代

极目新闻

2026-07-24 22:46:25

詹姆斯“决定4”完整时间线：东契奇到来导致离开湖人加盟76人很意外

詹姆斯“决定4”完整时间线：东契奇到来导致离开湖人加盟76人很意外

醉卧浮生

2026-07-25 00:40:14

AI产业主平台领航智能+时代

15784文章数 66967关注度

往期回顾全部

科技要闻

星舰13飞全中！20颗真卫星出舱

头条要闻

菲律宾总统马科斯会见中国大使：希望"重置"中菲关系

头条要闻

菲律宾总统马科斯会见中国大使：希望"重置"中菲关系

体育要闻

拿过两个金球奖，却说它只值10英镑

娱乐要闻

曝谢贤离世内情难怪王菲缺席葬礼

财经要闻

滥用市场支配地位携程被罚没51.79亿元

汽车要闻

精致硬汉吉利银河战舰700是台不一样的方盒子SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

游戏

房产

亲子

军事航空

再见多巴胺，今年夏天流行的“薄荷绿穿搭”太好看了！

《魔兽世界》员工滥用GM专属法术帮朋友作弊遭解雇

房产要闻

37人抢1套房…海棠湾资产拍卖，爆了！

亲子要闻

广州多家幼儿园批量关停引发热议，网友说：怪不得鼓励生育呢，原来是生源不够了！

军事要闻

美国考虑对第8国动武

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版