网易首页 > 网易号 > 正文 申请入驻

物理AI等待的世界模型离大规模应用还要多久

0
分享至

文|证券之星

2026年,人工智能领域正在经历一场深刻的范式转移。当大语言模型将数字世界的文本处理能力推向极致之后,行业的共识已清晰指向下一个核心赛场——物理世界。

AI不再满足于屏幕内的对话与生成,它开始试图"触达实体世界"。英伟达CEO黄仁勋将这一浪潮称为"物理AI",在他看来,世界模型正是实现物理AI的关键——能够帮助AI理解物理世界的规律,从而实现机器人、自动驾驶汽车等设备的自主操控。


(图片来源:浙商证券)

也正是因为世界模型潜在的能力和用途巨大,其目前离真正的可用尚有不少的距离和困境。

概念先于共识:当所有人都在说同一件事,说的其实不是同一件事

世界模型面临的第一重困境,恰恰是它最热闹的地方——概念本身。世界模型大概是2025年以来AI领域最热也最混乱的词汇。一个能生成火焰视频的模型、一个能凭空生成可玩游戏的语言模型、一个能精确模拟燃烧过程的物理引擎,现在都被叫作世界模型。智源研究院院长王仲远直言,不少视频生成模型、3D重建工具、多模态大模型都在纷纷贴上这个标签,行业对世界模型的定义、技术路线、评测标准始终没有形成共识。


(图片来源:浙商证券)

李飞飞在今年6月发表的长文中试图为这个混乱的局面建立一个分析框架。她把市面上的世界模型分为三类:渲染器只管"看起来像",生成漂亮的像素和视频,但不保证物理和几何的正确性;模拟器追求结构上的精确,输出的不是画面而是几何数据、材质参数、碰撞网格这类信息;规划器则负责在感知和行动之间搭桥,让智能体在行动前能预判世界的变化。但这个分类本身也说明了问题——如果连"世界模型是什么"都需要用一整篇长文来厘清,说明这个领域还远没有走到技术收敛的阶段。

王仲远则从另一个角度切入了这个问题。他将当前的技术路线分为四类:以语言为中心的世界模型(如VLA)、以像素为中心的世界模型(如视频生成)、以三维结构为中心的世界模型(如3D重建)、以视觉表征为中心的世界模型(如JEPA系列)。每一类都自称世界模型,但每一类距离真正能理解、预测、交互真实物理世界的基座模型,都还有非常大的差距。这四类路线都在各自的方向上推进,但它们之间不存在一个清晰的优劣排序,更不存在一个公认的"正确方向"。

数据的天堑:真实世界的燃料从哪里来

如果说概念混乱是"不知道该往哪走"的问题,那么数据匮乏就是"想走也没路"的问题。训练一个能理解物理世界的模型,需要的数据和训练大语言模型的数据完全是两码事。大语言模型可以从互联网上抓取几乎无限的文本——网页、书籍、论文、论坛帖子,文本数据几乎是免费的。但物理世界的数据呢?一个杯子从桌边掉下来会碎,人类看一眼就懂,但要让AI学会这个因果关系,需要的是带有精确几何、物理标注、动作标签的多模态交互数据。这种数据比互联网视频稀缺好几个数量级。

更麻烦的是,即便有了数据,也不一定是对的数据。王仲远坦言,真实物理世界的多模态交互数据极度匮乏,不同技术路线对数据的需求也各不相同。以具身智能为例,机器人在流水线上可以完成特定的任务,但不具备泛化性和通用性——原因就在于缺乏对世界常识、物理规律的通用理解。目前世界模型的成功应用仍然局限于自动驾驶或电子游戏等特定领域,而这些领域的数据规模和多样性,远远不足以支撑一个通用世界模型。

合成数据一度被视为解药。用物理仿真引擎和游戏引擎生成大量虚拟数据,成本远低于采集真实数据。但这条路也有自己的陷阱。各种物理仿真工具虽然可以对世界进行模拟,但因为人类掌握的真实物理知识、引擎规则和算法还不够完备,仿真始终无法达到100%的真实。仿真环境里物体的运动规律跟真实世界之间一直存在差距——这就是业内常说的仿真到现实的鸿沟。AI生成的几何体可能看起来没问题,但暗藏着面重叠、尺寸不对等缺陷,一旦送进物理引擎计算,结果就会变得荒谬。用有缺陷的数据训练模型,模型学到的也只能是有缺陷的世界。

架构的迷思:视频生成、三维重建还是潜空间预测

在数据和概念之外,还有一个更深层的问题:即便有了正确的数据、清晰的定义,我们也不知道该用什么架构去构建这个世界模型。这不仅是技术选择的问题,而是整个领域在根本假设上的分歧。

目前代表性的技术路线,如以谷歌的Genie3为代表的世界模拟器路线,创造出一个像电子游戏般、能根据用户输入实时演进的交互式视频环境。比如你一声令下让它"下雨",整个世界就会动态响应。它的优点在于画面和用户是双向奔赴的,支持长时间的连贯探索。但说到底,其内核还是基于视频生成的逻辑,并没真正掌握背后的物理因果

又如李飞飞World Labs团队——以三维结构为中心,可以称之为空间路线。他们的Marble模型能生成持久的、可下载的3D环境,用户只需一句提示就能生成一个可导出的3D世界。但批评者指出,Marble看起来更像是一个3D渲染流水线,而不是机器人的大脑。它捕捉的是表面是什么样子,并没有内置这个世界为什么会这样运"的物理规律。对于人类来说,看到一个放在斜坡上的球就知道它会滚下来;但机器人想做出同样的判断,还需要质量、摩擦、速度这些信息。

还有则是认知路线,以杨立昆主导的JEPA架构为代表。它的核心思想是预测下一个表征,而非预测下一个数据。模型没必要浪费算力去生成像素,只需专注于捕捉那些能用于AI决策的世界状态。这种路线在理论上更接近认知科学中"心智模型"的概念——大脑并不存储世界的每一个像素,而是存储一个抽象的内部表征,用来推理和预测。但这条路也远未成熟,从抽象表征到实际行动之间还有漫长的工程鸿沟。

世界模型离大规模应用还有多远

世界模型离世界有多远?这个问题没有一个简单的数字答案。从概念的层面看,它离世界还隔着一层"定义之雾"——当所有人都在用同一个词说不同的事,共识本身就遥不可及。从数据的层面看,它离世界还隔着一片"数据之海"——真实物理世界的交互数据稀缺到让最乐观的研究者也感到焦虑。从架构的层面看,它离世界还隔着一道范式之墙——视频生成、三维重建、潜空间预测,每条路都有各自的理论支撑,也都有各自的致命短板。

智源研究院的判断是,至少未来三到五年,都会是世界模型持续演进迭代的阶段。这个判断既乐观又克制——乐观在于它相信方向是对的,克制在于它承认时间不会太短。王仲远把世界模型比作深度学习的2012年前后——彼时,数据孤岛严重、路线未定、基准还在打架,ChatGPT时刻尚未到来。

但世界模型面临的挑战,可能比当年的深度学习更深层。深度学习处理的是模式识别——从数据中找出统计规律。世界模型要处理的是因果推理——理解为什么物体会这样运动、为什么事件会这样发生。这两种能力之间,隔着的可能不是几年的技术迭代,而是某种根本性的认知范式转换。

而从长远的视角看我们不必执着于世界模型这个标签,也不必执着于某一条特定的技术路线。真正重要的是,我们能否让AI从"看起来像世界"走向"理解世界",从像素级的模拟走向因果级的推理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
葡萄牙对阵克罗地亚 比分分析

葡萄牙对阵克罗地亚 比分分析

江山万里行
2026-07-02 09:47:54
世界杯神剧情!比利时经典内讧:两大主力现场吵架 连线绝平拥抱泯恩仇

世界杯神剧情!比利时经典内讧:两大主力现场吵架 连线绝平拥抱泯恩仇

宝哥精彩赛事
2026-07-02 06:07:04
太扯了!新加坡国大教授实锤,《给阿嬷的情书》争议并非空穴来风

太扯了!新加坡国大教授实锤,《给阿嬷的情书》争议并非空穴来风

小徐讲八卦
2026-07-02 07:17:57
意大利队没去成世界杯,场外新闻却不断,国脚巴斯托尼被立案调查:涉嫌与一名17岁少女有偿往来

意大利队没去成世界杯,场外新闻却不断,国脚巴斯托尼被立案调查:涉嫌与一名17岁少女有偿往来

红星新闻
2026-07-01 12:24:53
NBA国王队官宣郭昊文将出战夏联,司职前锋,本人发声:一起加油;首战7月10日对阵快船

NBA国王队官宣郭昊文将出战夏联,司职前锋,本人发声:一起加油;首战7月10日对阵快船

鲁中晨报
2026-07-02 10:02:04
艺人疑似高铁车厢脱鞋被拍 业内人士:脱鞋不违规,但违背文明乘车倡议

艺人疑似高铁车厢脱鞋被拍 业内人士:脱鞋不违规,但违背文明乘车倡议

封面新闻
2026-07-01 21:52:25
追觅砍掉了200多个事业部,并且开始裁员。

追觅砍掉了200多个事业部,并且开始裁员。

流苏晚晴
2026-07-01 18:16:49
青藏铁路 神奇天路二十年(大数据观察)

青藏铁路 神奇天路二十年(大数据观察)

人民网
2026-07-02 06:26:39
1夜4大转会确定!热刺搞定托纳利 夏窗签入6人 拜仁签世界杯红人

1夜4大转会确定!热刺搞定托纳利 夏窗签入6人 拜仁签世界杯红人

阿超他的体育圈
2026-07-02 06:04:02
樊振东正式加盟德甲豪门杜塞尔多夫,将于8月22日迎来主场首秀

樊振东正式加盟德甲豪门杜塞尔多夫,将于8月22日迎来主场首秀

懂球帝
2026-07-01 23:33:09
镰田大地:除非足球成为日本的国球,否则很难拿下世界杯冠军

镰田大地:除非足球成为日本的国球,否则很难拿下世界杯冠军

懂球帝
2026-07-01 16:20:23
突发!詹姆斯告别湖人,8年征战就此结束!……

突发!詹姆斯告别湖人,8年征战就此结束!……

体育新角度
2026-07-01 14:30:36
30支球队能给LBJ年薪盘点:快船2600万 勇士&热火1500万 骑士底薪

30支球队能给LBJ年薪盘点:快船2600万 勇士&热火1500万 骑士底薪

画夕
2026-07-01 19:07:05
杨紫庆功宴一张照片上了热搜!

杨紫庆功宴一张照片上了热搜!

最美的笔触
2026-07-02 07:07:34
马未都锐评“走面儿”风波,字字直戳韩红心窝,评论区不堪入目

马未都锐评“走面儿”风波,字字直戳韩红心窝,评论区不堪入目

梦在深巷qw
2026-06-27 16:26:37
他把现金堆成山,高调捐款20亿后“消失”,如今现身却在家种地

他把现金堆成山,高调捐款20亿后“消失”,如今现身却在家种地

老娱记啊
2026-06-24 15:04:38
1950 年,四川地主拿出朱德欠条,朱总司令:马上把他接到北京来

1950 年,四川地主拿出朱德欠条,朱总司令:马上把他接到北京来

纪实文录
2025-06-21 14:47:10
金庸亲妹查良琇:住在农村,家境普通,金庸一直补贴她到2002年

金庸亲妹查良琇:住在农村,家境普通,金庸一直补贴她到2002年

匹夫来搞笑
2026-07-01 09:41:36
2年1300万+底薪捡漏,火箭两大新援太超值!精打细算解决伊森难题

2年1300万+底薪捡漏,火箭两大新援太超值!精打细算解决伊森难题

锅子篮球
2026-07-02 01:52:06
太厉害了!俄罗斯最新战报!

太厉害了!俄罗斯最新战报!

故事终将光明磊落
2026-07-01 14:02:43
2026-07-02 10:20:49
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
134467文章数 194000关注度
往期回顾 全部

科技要闻

可灵AI上市前夜,快手想给它融30亿美元

头条要闻

父亲带9岁女儿在清华门口合影 17年后二人复刻了照片

头条要闻

父亲带9岁女儿在清华门口合影 17年后二人复刻了照片

体育要闻

世界杯硬核球迷,把自己变成了雕像

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

游戏
房产
旅游
亲子
公开课

《坦克世界:Heat》第一赛季开幕 沙漠新地图上线

房产要闻

海南楼市新政:公积金最高可贷192万!

旅游要闻

中国之城|甘肃张掖:“蜂腰之地”山河万象

亲子要闻

趣味游戏

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版