网易首页 > 网易号 > 正文 申请入驻

从ChatGPT到世界模型:李飞飞一天三篇论文,AI下半场开始了

0
分享至

No.0313

Science Partner

Bring you to the side of science


导 读

6月11日,李飞飞的World Labs在同一天悄悄上传了三篇技术论文到arXiv。没有发布会,没有CEO直播,没有吊足胃口的预热推文。三篇论文、代码链接、项目主页、Demo全部附上。

熟悉AI圈节奏的人会意识到这意味着什么:这家公司要出那口憋了快两年的气。

三篇论文的主题分别是深度感知与图像生成的统一、3D场景的可见域外几何预测、以及人体动态的4D重建,覆盖了空间智能这个赛道从底层表示到高层应用的三个关键环节。也让我们管窥到世界模式是什么,也知道这件事有多难。

走,跟伙伴君来!


今日主笔 | 恒意

从ChatGPT到世界模型:李飞飞一天三篇论文,AI下半场开始了

01. 一场被很多人低估的路线之争

要理解这三篇论文的意义,得先弄清楚一个问题:大语言模型(LLM)和世界模型(World Model),到底在争什么?

过去三年,ChatGPT的成功让“下一个词预测”这件事变成了全球最热门的投资主题。训练数据更多、参数更大、算力更强,模型就越聪明。这套逻辑驱动了数千亿美元的资本流向,也主导了整个AI行业的技术路线。

但“邪路”从2024年底就已经出现了。

OpenAI的联合创始人之一Ilya Sutskever在2024年12月的NeurIPS年会上领了一个“时间考验奖”,上台发言时说了一句被广泛截图的话“我们所知道的预训练将会终结”。他把互联网比作AI的石燃料,警告这种资源是有限的。这位亲手参与建造大语言模型体系的人,给自己的路线判了一个有条件的死刑。

Yann LeCun比Ilya早说了好几年,炮火也猛烈的多得多。这位2018年与Hinton、Bengio共享图灵奖的得主(三人后来撕了),在Meta担任首席AI科学家超过十二年,期间反复在公开场合宣称:大语言模型永远无法实现人类水平的推理,因为它们缺少一个对世界的内在模型。2025年11月,他宣布离开Meta,2025年12月正式确认创立AMI Labs(Advanced Machine Intelligence),目标只有一个:训练世界模型。

虽然方向相同,但李飞飞给出的是另一种表述。她在2026年6月3日那篇长文里写道:大语言模型学的是文本的统计规律,而世界模型学的是时空的统计规律,光怎么照在物体上,东西受力后怎么运动,空间里的遮挡关系如何变化。一个从未见过物理世界的系统,对“苹果从树上掉下来”的理解,永远只是一组词与词之间的条件概率。

说白了,这是一场关于AI的下一步到底是什么的根本性分歧。

02. 数据墙有多真实

批评LLM路线的人,最常拿出来说的论据是数据墙(Data Wall)。

这个概念的核心逻辑并不复杂:互联网上的高质量文本数据是有限的。Forbes在2026年3月的分析指出,某些研究机构预测,可公开获取的高质量文本数据最早可能在2029年前耗尽,这一拐点正在加速逼近。AI公司的应对方案是合成数据,即用AI自己生成训练数据再喂给自己。但Forbes的分析直白地说,这时候真正稀缺的是人类无法被合成替代的高信号数据:合成数据可以量产,但它无法复现人类思维中那些罕见、独特、有创造性的边缘样本,模型反复在自我生成的数据上训练,最终会退化成对均值的模糊近似。

世界模型这条路的回答是:绕开文本数据的瓶颈,从视觉、空间、物理交互中学习。三维世界的信息密度远高于文字,而且不会枯竭。

现实世界永远在产生新的数据。

TechCrunch在2026年5月的一篇报道里揭示了这条逻辑链的商业延伸:一家叫Origin Lab的初创公司刚刚完成800万美元融资,专门帮电子游戏公司把游戏资产转化成世界模型训练数据,客户直接锁定的就是AMI Labs和World Labs。数据稀缺的问题,整个行业都感受到了。

03. 三篇文章看World Labs在赌什么

从外部能观察到的动作来看,World Labs的打法相当激进。

这家公司2024年9月从隐身状态现身,融了2.3亿美元。2026年2月18日,它宣布完成10亿美元融资,投资方包括NVIDIA、AMD、Autodesk,其中Autodesk单笔投入2亿美元,并拿下了一个战略顾问席位。彭博此前报道该轮估值约为50亿美元。从隐身到估值50亿美元,不到18个月。

2026年4月,World Labs入选Forbes年度AI 50榜单,被定位为空间智能赛道的奠基型公司。

这周的三篇论文,本质上是在给World Labs的产品Marble补技术底座。Marble是2025年11月上线的第一款商业产品,核心是从文字、图像或视频生成可导航的三维世界,定价从免费到95美元/月四个档位。咱们就看看,这三篇都说了啥:

第一篇:Modality Forcing

解决的是“如何用同一个模型同时学会看图和估深度的问题,即把图像和深度信息统一到一个Diffusion Transformer(DiT)里训练,仅用稀疏的深度数据就让模型学会几何感知。关键数据:深度估计误差(AbsRel指标)比现有同类方法降低57%;从3.7亿参数扩展到33亿参数时性能持续提升,说明这条路线有效的Scaling性质。

第二篇:World Tracing

传统的3D重建只能重建相机能看到的部分,如被遮挡的物体背面、桌子底下的地板,全是盲区。World Tracing为每一个输入像素预测一个“有序3D点堆栈”,第一层是可见表面,后续层是被遮挡的几何面,让模型能够“猜”出视野之外的世界结构。这篇论文在arXiv上直接标注为World Labs Technical Report(技术公告)。

第三篇:Flex4DHuman

把一段普通的单目视频里的人物,变成可以从任意角度观看的4D高斯泼溅(4D Gaussian Splats)。不需要骨骼数据、不需要深度图,只需要相对相机位姿。怎么样,这个能力对游戏、AR/VR、影视制作的意义不言而喻了吧。

04. LeCun和李飞飞的路线是两回事

虽然都是做世界模型,大家也经常将Yan LeCun和李飞飞并提,但其实,有一个细节容易被忽略:他们走的其实不是同一条路,甚至在某些技术假设上是对立的。

LeCun主推的是联合嵌入预测架构(Joint Embedding Predictive Architecture,JEPA)。2026年2月4日,他在蒙特利尔MILA研究院举办的世界建模研讨会上做了一场主题演讲,题目直接叫“为什么世界模型需要用JEPA,而不是生成式架构”。JEPA的逻辑是:不生成原始图像或视频,只在压缩的抽象表示空间里做预测,避开高维感官数据的噪声问题。LeCun认为生成每一个像素是浪费,世界模型应该学的是抽象的因果结构,而不是表象的视觉细节,感觉他读了经书有没有,LoL。

2026年3月,AMI Labs宣布完成10.3亿美元融资,估值35亿美元,创下欧洲史上最大种子轮纪录。机构投资方包括Cathay Innovation、Greycroft等五家,天使投资人名单里有Tim Berners-Lee、Mark Cuban和Eric Schmidt。

World Labs走的则是生成式路线。这周三篇论文核心也都是生成。李飞飞在6月3日那篇分类文章里明确写道,能够生成符合物理规律的世界,是世界模型区别于其他AI系统的首要标志。

这两条细分路线谁对谁错,现在下结论还太早。但这个分歧本身很有意思:两个都在批评LLM的人,但对于接下来该怎么做的答案,是相当不一样的。

05. 这对真实世界意味着什么

如果用最简单的话来说,大语言模型改变了我们和信息打交道的方式,世界模型要改变的是机器和物理世界打交道的方式。

这不是一个抽象的哲学问题。机器人、自动驾驶、工业自动化、AR/VR内容生成,这些领域的瓶颈,几乎无一例外是机器无法理解三维空间和物理规律,而不是机器不够会说话。Forbes在2026年1月指出,AI的下一阶段正在向“从自身感知和经验中学习的系统”倾斜,这描述的正是世界模型的基本工作逻辑。

World Labs这三篇论文,技术细节扎实,工程取向明确,没有Anthropic和OpenAI那种颠覆一切的宏大叙事。但恰恰是这种低调,是不是反而成了判断一个技术团队是否真的在做事的正向信号?

当然,回到最开始”世界模型最终能不能打败大语言模型“?其实这个问题本身就问错了。更可能的结局是:LLM负责语言和推理,世界模型负责感知和空间,两者协同,共同构成下一代AI的骨架。

伙伴,你怎么看这个事儿?欢迎后台私信留言~


本文仅作科普分享使用,欢迎小伙伴们点、收藏、关注,以备不时之需,当然更欢迎您把 介绍给周边可能需要的更多伙伴们呀。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世界杯:阿根廷VS奥地利前瞻!梅西有望再次爆发破门

世界杯:阿根廷VS奥地利前瞻!梅西有望再次爆发破门

消保宣教
2026-06-22 10:19:19
1962年中印开战前,耿飚连夜派人翻墙通知印度外交官:中国反击了

1962年中印开战前,耿飚连夜派人翻墙通知印度外交官:中国反击了

元哥说历史
2026-06-06 06:45:06
为何清朝权臣始终无法架空皇帝?即使清朝末年也不敢,原因很简单

为何清朝权臣始终无法架空皇帝?即使清朝末年也不敢,原因很简单

历史人文2
2026-06-11 20:30:03
蔚来ES8官宣推出大五座版本 6月28日开启预订

蔚来ES8官宣推出大五座版本 6月28日开启预订

TechWeb
2026-06-22 11:49:08
64秒破门却捡走裁判手表,巴拉圭国脚世界杯奇行

64秒破门却捡走裁判手表,巴拉圭国脚世界杯奇行

慢享生活集
2026-06-22 01:17:25
彭加木失踪确为神秘事件!知情人:他同事被调到安全厅,待遇很高

彭加木失踪确为神秘事件!知情人:他同事被调到安全厅,待遇很高

史之铭
2026-06-22 01:56:41
社零负增长,都是新能源车惹的祸?

社零负增长,都是新能源车惹的祸?

道格财经观
2026-06-22 09:15:11
曼联确定中锋补强计划,模板就是维尔贝克!曝巴萨觊觎谢什科真相

曼联确定中锋补强计划,模板就是维尔贝克!曝巴萨觊觎谢什科真相

罗米的曼联博客
2026-06-21 10:58:18
红利曼和康城全丢了

红利曼和康城全丢了

星火聊天下
2026-06-21 05:54:27
向太破冰小儿子!昔拉黑断绝关系 留言喊话「奔4大人长点心」

向太破冰小儿子!昔拉黑断绝关系 留言喊话「奔4大人长点心」

ETtoday星光云
2026-06-22 11:40:23
他当过省长、书记,大军区司令兼政委、部长,是局外人重返军队?

他当过省长、书记,大军区司令兼政委、部长,是局外人重返军队?

历史龙元阁
2026-06-22 11:40:27
挺过3次病危!吴伯雄过88岁生日,戴“2026”俏皮发箍近况曝光

挺过3次病危!吴伯雄过88岁生日,戴“2026”俏皮发箍近况曝光

海峡导报社
2026-06-21 09:30:07
6换1豪赌!布朗+杜兰特?美媒:三方大交易,值得吗?

6换1豪赌!布朗+杜兰特?美媒:三方大交易,值得吗?

篮球盛世
2026-06-21 16:51:22
莫言:你细心观察一下你的身边人,凡是动不动就生气的人,没有一个是智者,生活多半过得一团糟糕

莫言:你细心观察一下你的身边人,凡是动不动就生气的人,没有一个是智者,生活多半过得一团糟糕

每日一首古诗词
2026-06-18 06:32:18
国产倾转旋翼机,再传捷报!旋翼倾转切换试飞成功,姿态稳如磐石

国产倾转旋翼机,再传捷报!旋翼倾转切换试飞成功,姿态稳如磐石

今夜繁星坠落
2026-06-21 22:46:33
C罗六次出征世界杯!12个女友,5个娃3个妈,终被等了9年柜姐收服

C罗六次出征世界杯!12个女友,5个娃3个妈,终被等了9年柜姐收服

法老不说教
2026-06-21 16:13:57
龙岗区交通部门:东部过境高速明年通车

龙岗区交通部门:东部过境高速明年通车

南方都市报
2026-06-22 07:06:17
不吹不黑!男篮91-81澳大利亚不可怕,可怕的是赛后爆出三坏消息

不吹不黑!男篮91-81澳大利亚不可怕,可怕的是赛后爆出三坏消息

诺诺谈史
2026-06-22 10:36:53
女子趁闺蜜出国,偷换金戒指卖了3000元还贷! 警方一查: 3万多的金镯早没了

女子趁闺蜜出国,偷换金戒指卖了3000元还贷! 警方一查: 3万多的金镯早没了

极目新闻
2026-06-22 08:58:09
勃列日涅夫的曾孙被俘,俄上将发出终极警示

勃列日涅夫的曾孙被俘,俄上将发出终极警示

西楼饮月
2026-06-19 18:18:53
2026-06-22 12:20:49
科学伙伴 incentive-icons
科学伙伴
把科学用通俗易懂的方式带到您身边
244文章数 52关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

伊朗挥一挥衣袖愤然离席 看直播的记者皱眉神情紧张

头条要闻

伊朗挥一挥衣袖愤然离席 看直播的记者皱眉神情紧张

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

韩红帮冯小刚宣传,结果翻车了…

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

全面提升 全新理想L8 livis将家用舒适再进化

态度原创

教育
亲子
游戏
健康
公开课

教育要闻

长方形ABCD的面积为24,三角形AEF的面积是多少?

亲子要闻

“孩子体内的甲酰胺从何而来”,Babycare恳请有关部门进行全面调查

又一猛将加盟GTA6!漫威金刚狼绝对关键人物

吃粽子的3条保胃法则,消化科医生推荐

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版