网易首页 > 网易号 > 正文 申请入驻

世界模型,是否正在逼近自己的「ChatGPT时刻」?

0
分享至




机器之心报道

机器之心编辑部

李飞飞等顶尖学者投身的创业方向——世界模型是 AI 的下一站吗?

「AI 是人类自诞生以来,唯一担得起『日新月异』这个词的技术领域,」在机器之心近日举办的 NeurIPS 2025 论文分享会圆桌讨论上,茶思屋科技网站总编张群英的开场感叹引发了在场专家们的共鸣。

这场由黄大年茶思屋总编主持,聚集了中科院自动化所、南京大学、北京通用人工智能研究院、极佳科技等机构专家的大讨论,直指目前 AI 领域最热门的方向——世界模型。最近一段时间,从谷歌 Genie 3 的发布到李飞飞的长文论述,世界模型、空间智能等概念正成为新的焦点。



四十多分钟的对话里,专家们围绕世界模型的定义、数据与架构方向、技术路径分歧,以及商业化前景展开了讨论。在一些议题上,大家的观点一致,不过在很多重要方向上有着明显不同的思考。看得出,面对这个正在快速发展的新兴领域,不论是技术还是评判标准,我们还有很多需要去探索、验证的。

首先,世界模型究竟是什么? 几位嘉宾从不同角度给出了自己的定义。

极佳科技联合创始人、首席科学家朱政认为,世界模型本质上是预测模型:「给定当前状态及动作序列,预测下一个状态。」他指出了世界模型的三大应用前景:为自动驾驶、具身智能等多模态任务提供更多数据、建立模型与世界的结合替代传统模拟器、以及最终成为端到端系统的一部分。

北京通用人工智能研究院具身机器人中心研究科学家贾宝雄则将世界模型理解为对 AI 对于环境状态的预测和判断。「从过去的简单游戏世界,到现在 3A 大作级的虚拟环境,世界模型正在逐渐走向对于高质量的状态的模拟。」

南京大学智能科学与技术学院准聘副教授、国家高层次青年人才范琦则从终极目标角度提出了一个宏大愿景:「世界模型的终极目标就是把世界 1:1 建模,目标可能要到原子级别。」但他也承认这几乎不可能,「我们并不需要如此精细的复刻,只需要依照目的进行建模,不同任务有不同的理想目标。」

如何构建世界模型?

在世界模型的发展中,一个核心悖论是:先有模型还是先有数据?世界模型的应用,经常与自动驾驶、具身智能等领域的合成数据 AI 训练相联系,但我们又该如何训练一个世界模型?

朱政以自动驾驶为例说明了这一困境:「自动驾驶公司积累了上亿公里数据,但 99% 都是晴天道路数据,真正危险的场景采集不到。」他提出了一个可行的路径:先用常见数据训练垂类模型,再生成更多 corner case 数据,通过迭代让世界模型越来越强。

贾宝雄从成本角度进行了思考:「有公司在构建世界模型时,采集数据的成本在千万级,这不是研究团队能够直接能做的事情。但对于不同形式的具身智能来说,数据是至关重要的。」他强调,对于具体的应用方向来说,我们可以通过特定的高质量数据来提升模型效果。

范琦则描绘了一个循环过程:「先有 0.1 的模型,生成 0.1 的数据,再用它来进一步训练模型。」他提出了「生成数据 + 真实数据」的混合模式,通过模型、产品、数据的循环推动发展。

在世界模型的技术实现路径上,专家们展现了明显分歧。

相比于视频内容的生成,贾宝雄的研究团队偏向融入物理信息的方法:「就算它是视觉模型,也要保持物理世界的一致性,比如重力。」

朱政则更加务实:「不论重渲染还是重预测,世界模型的构建很大程度上与需求有关。」如果是面向影视、游戏等方向,视频生成可能是更合适的方向。这可能是李飞飞 World Labs 使用生成 + 重建方式的理由。如果是面向消费者的通用的任务,我们可能不需要保持物理规律,甚至有时候创意是更为重要的,「如果要让一个人飞起来,现实不可能,但符合创作人意图。」

而且,随着生成能力的增强,世界模型对于物理规律的掌握、内容记忆的保持会越来越好,模型的最终形态可能是纯生成的,不需要重建。

范琦对此持不同意见:「终极目标可能是隐式的,但现在可能是显式 + 隐式一起。」他类比了大语言模型的情况,「大模型的记忆能力很不错,但是想要生成一整本书内容还是有很多错误,想要更好的生成(长序列的生成),会面临更多的挑战。所以到数据更加稀缺,更为复杂的世界模型上,想走到完全依赖隐式表征还有很长的路。」

架构之争:扩散 vs 自回归

在关于世界模型主流架构的讨论中,三位嘉宾发表了各自对扩散与自回归架构的看法。

朱政指出,从视觉角度来看,扩散模型更契合世界模型的发展方向。扩散模型从随机噪声中逐步还原图像、视频或音频,其本身就非常接近物理世界的生成方式。另外,从神经科学角度来看,人脑通过神经元从复杂噪声信号中解码世界的机制,与扩散模型通过去噪生成内容的过程类似。基于这两方面考虑,他认为扩散架构更适合世界模型。

贾宝雄观察到了技术融合的趋势,目前包括 OpenAI 在内正探索将不同架构在某些阶段统一起来,比如使用 token 化的扩散。

范琦点出了现在已经有扩散和自回归结合的工作。扩散模型擅长捕捉并建模现实世界的真实分布,但现实世界又是连续变化、具有因果关系的,仅靠扩散难以长期建模,因此还需自回归补足时序与逻辑上的连贯性。他举例说明,「扩散可以预测短时间(比如 2 秒)内的几十帧内容,而更长的连帧通过自回归连接。」总之,「无论黑猫白猫,能抓到老鼠的就是好猫。」

世界模型 ChatGPT 时刻还有多远?

最后,世界模型的「ChatGPT 时刻」何时到来?世界模型是否已经到了爆发前夜?这或许是大家最为关注的两个问题了。

贾宝雄没有直接给出个人判断,而是引用了一些业内人士的说法:世界模型的 ChatGPT 时刻可能需要三年左右出现。范琦强调关键在于数据,目前最困难的是缺乏高质量长视频数据。另外,视频生成时长大多在 5 到 10 秒,大厂的视频 Demo 也只能做到一分钟量级。因此,关于世界模型 ChatGPT 时刻何时到来,他认为时间可能要拉长一些。

在谈到世界模型是否成为新的爆点时,范琦则表示,随着语言模型发展至今,可能需要开拓其他研究方向以进一步推动人工智能进步。世界模型可能是现在以及未来十年新的爆发方向。

朱政回顾了极佳科技成立之初,外界对世界模型还很陌生。如今,随着李飞飞等领域领军人物的频频宣传,世界模型已经成为热点议题。不过,他指出世界模型存在着 ToB 和 ToC 两方面的商业化挑战,如 ToB 端按 token 收费时如何定义视频生成数据对用户的价值,ToC 端如何提升 token 等。

在这些挑战之外,朱政认为未来世界模型可能更需要训练强化学习 Agent 以及如何将 VLA(视觉 - 语言 - 动作)进化为 WLA(世界 - 语言 - 动作)。这些技术与商业难题需要业界与学界一起想办法解决。

此次圆桌讨论在主持人的引导下,三位嘉宾围绕世界模型的发展时间表、数据瓶颈、技术架构以及商业化路径各抒己见,在分歧与共识中展现了这一领域的多元性与活力。

整体来看,世界模型正站在聚光灯下,既拥有巨大的发展潜力,也面临数据、算力和技术路线等多重挑战。可以预见,未来围绕模型架构、训练范式及应用场景的探索仍将持续,而这些探索本身也将成为推动世界模型迈向成熟的重要动力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看完奚望再看谭松韵,才知观众烦的不是星二代,而是丑还没演技

看完奚望再看谭松韵,才知观众烦的不是星二代,而是丑还没演技

草莓信箱
2026-03-22 01:45:57
申军良回应“梅姨”落网:我找了她10年,在她住过的村子挨家打听,几次差点把命搭进去,不找到她这辈子不甘心

申军良回应“梅姨”落网:我找了她10年,在她住过的村子挨家打听,几次差点把命搭进去,不找到她这辈子不甘心

极目新闻
2026-03-21 17:23:19
一旦开战,中国若发射一枚东风41,得付出多大的代价?

一旦开战,中国若发射一枚东风41,得付出多大的代价?

小正说娱乐
2026-03-19 18:51:30
等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

青苹果sht
2026-03-18 05:35:16
女网红爆料:交1万住少林3天,凌晨争进方丈房间,释永信这次栽了

女网红爆料:交1万住少林3天,凌晨争进方丈房间,释永信这次栽了

未曾青梅
2026-03-21 23:04:09
暴跌40%,关店4000家!曾创神话的“零食界爱马仕”,卖不动了

暴跌40%,关店4000家!曾创神话的“零食界爱马仕”,卖不动了

好贤观史记
2026-03-02 20:17:10
奇怪的现象:你跟任何人交往,一旦你听话照做,对方就会看不上你

奇怪的现象:你跟任何人交往,一旦你听话照做,对方就会看不上你

木言观
2026-03-21 22:32:43
我去!内娱最大的性丑闻,拍出来了

我去!内娱最大的性丑闻,拍出来了

皮蛋儿电影
2026-03-04 14:39:25
你以为坏了,其实都能吃的7种食物,要是扔掉就亏大了

你以为坏了,其实都能吃的7种食物,要是扔掉就亏大了

室内设计师有料儿
2026-03-21 16:29:09
20000,疯了

20000,疯了

放毒
2026-03-11 17:04:33
上海德云社开业首日,杨议老毛病又犯,郭麒麟选择明智

上海德云社开业首日,杨议老毛病又犯,郭麒麟选择明智

老屬科普
2026-03-21 20:36:16
60岁董事长病逝后未成年女儿继承9亿元股票,妻子成百亿A股公司实控人

60岁董事长病逝后未成年女儿继承9亿元股票,妻子成百亿A股公司实控人

红星新闻
2026-03-21 11:25:09
伊朗又断网!或拟永久切断互联网!日均经济损失1850万美元

伊朗又断网!或拟永久切断互联网!日均经济损失1850万美元

深度报
2026-03-21 22:26:24
大变革!4月1日全国医保新规落地,70-80岁老人,看病牢记三件事

大变革!4月1日全国医保新规落地,70-80岁老人,看病牢记三件事

老特有话说
2026-03-20 12:35:16
刘烨的基因太强大了,儿子太像他了,诺一是中法混血儿,很帅

刘烨的基因太强大了,儿子太像他了,诺一是中法混血儿,很帅

喜欢历史的阿繁
2026-03-21 14:29:01
女子在医院顺产生下一个孩子,突然在阴道里排出大便

女子在医院顺产生下一个孩子,突然在阴道里排出大便

张晓磊
2026-03-21 11:44:27
世界公开赛决赛席位出炉!奥沙利文将战塔猜亚,历史第一人冲42冠

世界公开赛决赛席位出炉!奥沙利文将战塔猜亚,历史第一人冲42冠

世界体坛观察家
2026-03-22 00:04:32
能源史上最惨烈一日,伊朗的顶级导弹,正在灭掉3个国家的支柱!

能源史上最惨烈一日,伊朗的顶级导弹,正在灭掉3个国家的支柱!

Ck的蜜糖
2026-03-20 06:49:27
出场数已达标!不出意外,以杜兰特本赛季的表现保底最佳三阵!

出场数已达标!不出意外,以杜兰特本赛季的表现保底最佳三阵!

田先生篮球
2026-03-21 13:03:30
巴拿马这回真傻了!抢了港口才发现,全世界没人敢接盘

巴拿马这回真傻了!抢了港口才发现,全世界没人敢接盘

青梅侃史啊
2026-03-21 19:27:52
2026-03-22 03:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12555文章数 142589关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

通胀警报拉响,加息潮要来了?

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

教育
健康
数码
时尚
家居

教育要闻

南师附中举行2026年31公里步行者行动

转头就晕的耳石症,能开车上班吗?

数码要闻

炸锅!国产存储芯片再突破!手机固态价格大跳水,内存自由要来了

这个趋势好适合亚洲人!不用花大钱也能跟

家居要闻

时空交织 空间绮梦

无障碍浏览 进入关怀版