网易首页 > 网易号 > 正文 申请入驻

李飞飞、英伟达、杨立昆都在押注:世界模型,为什么走向三条不同路线?

0
分享至

来源:市场资讯

(来源:图灵人工智能)

您想知道的人工智能干货,第一时间送达


2026 年春天,“世界模型”这个词,已经从强化学习领域一个相对小众的角落,走到了机器人基础模型讨论的绝对中心。但随着这个术语迅速走红,它的含义也变得越来越模糊。正如研究员 Chris Paxton 最近所说,这个术语“相当令人沮丧”,因为不同的人用它指代的是完全不同的东西,而这些东西各自又有截然不同的优势与弱点。


本文基于 humanoidsdaily ,翻译整理而来,仅供参考。如需查看英文原版及更多资料,可在文末获取。

如果想理解,为什么几乎所有主要 AI 实验室如今都在构建世界模型,我们就必须穿透这个“性感但容易误导的名字”,去看清行业巨头们究竟在押注哪些具体的技术路线与战略方向。

核心问题:机器人为什么需要一个“世界”?

传统机器人系统,长期以来都依赖手工编写的启发式规则和显式运动学模型。在受控的工厂环境中,这套方法能够工作;但一旦进入人类家庭这种“混乱而开放”的真实场景,它就会迅速失效。这种失败,根源上与“符号落地问题”有关。也就是,计算系统内部那些任意的符号,究竟如何获得与现实世界对应的真实含义。

现代世界模型,试图通过将抽象概念锚定在连续的视觉与物理数据之中,来解决这个问题。它的目标,是让系统通过观察与交互,把物理规律“内化”为自身能力,而不是仅仅执行一套刚性的脚本。

三种战略押注:认知、仿真与空间

战略分析师兼投资人 Natasha Malpani 认为,当前被统称为“世界模型”的项目,实际上代表了 AI 生态中三种完全不同的价值累积方向。

1. 认知架构押注(Yann LeCun / AMI Labs)

这是时间跨度最长、最偏长期主义的一种路线。由图灵奖得主 Yann LeCun 领衔的 AMI Labs,最近完成了 10.3 亿美元种子轮融资,这本身就是产业界对联合嵌入预测架构(JEPA)的一次重注。

JEPA 的思路不是去预测每一个像素——LeCun 认为这件事“在数学上很困难,而且往往并不重要”——而是去预测未来的“潜在状态”。通过忽略诸如灯光闪烁这类不可预测的噪声,模型可以把注意力集中在高层规划与推理真正需要的因果物理结构上。最近,这一理论也在 LeWorldModel(LeWM)中得到了具体体现;据称,它的规划速度可比传统基于像素的模型快 48 倍。

2. 仿真基础设施押注(NVIDIA / Waymo)

在这一路线中,**世界模型本质上是一条“仿真护城河”。**通过构建高保真、可交互的环境,企业可以生成大规模合成数据,用来训练机器人,而这在现实世界中几乎不可能做到。

例如,NVIDIA 的 DreamDojo 汇集了 4.4 万小时的人类视频,用来模拟灵巧操作任务。类似地,Waymo World Model 借助 Google DeepMind 的 Genie 3,“梦出”龙卷风、洪水等罕见但与安全高度相关的场景,从而测试其自动驾驶系统在极端情况下的表现。

3. 空间智能押注(李飞飞 / World Labs)

这一路线认为,真正的世界理解,必须建立在世界原生的三维几何结构之上。像 PointWorld 这样的模型,会把环境表示为“3D 点流”。这样一来,机器人就能以几何层面的精度去预测形变、关节运动以及稳定性,从而为复杂操作提供一种更扎实、更贴近物理现实的建模方式。

技术层级:世界模型是如何运作的?

从技术角度看,Chris Paxton 将世界模型划分为三种主要的架构类型,每一种都有各自不同的工作流。


其中,世界动作模型(World Action Model,WAM)已逐渐成为一种极具潜力的综合性路线。通过在异构机器人数据上进行训练,WAM 不仅能够从多样化轨迹中学习,还可以实现跨形态迁移——例如从人类视频中学习,再把所学能力转移到机器人身上,以提升机器人表现。

更务实的挑战者:“从零训练”与统一大脑

当一些实验室仍在关注表征学习时,另一些组织则采取了更明确、更面向目标的务实路线。

Generalist AI:它们的 GEN-1 模型拒绝依赖微调,而是主张直接在 50 万小时的人类交互数据上“从零训练”。据称,这一路线在某些任务上取得了 99% 的成功率,而此前最先进模型只能达到 64%。

Tesla:Tesla 则放弃模块化思路,把汽车与 Optimus 人形机器人都视作同一项“Physical AI”使命的一部分。其统一的“神经世界模拟器”能够根据机器人的动作生成高保真视频,从而让系统在不冒真实硬件风险的前提下,对模型进行“对抗性场景”验证。

局限与“反应性鸿沟”

尽管热度很高,但世界模型仍面临显著障碍。最核心的问题之一,就是所谓的“反应性鸿沟”。也就是,大模型需要先“梦出”未来,机器人才能采取行动,而这中间的延迟,可能会让系统错失真实世界中的反应时机。生成式视频模型的计算开销非常高。如果机器人必须等待数秒,才能让一个 140 亿参数的模型预测出下一个状态,那么它就无法应对现实环境中的实时变化。

2026 年的一些突破,已经开始试图弥合这道鸿沟。例如 AGIBOT 的 Genie Envisioner 2.0,就尝试把“动作”视作一等变量纳入系统核心,从而实现分钟级稳定仿真,并减少短时 AI 生成视频中经常出现的“漂移”问题。

随着行业走向 2020 年代后期,这几类路线之间的边界,很可能会逐渐模糊,并最终融合成“混合模型”——既具备快速推理能力,又拥有稳健的物理先验。无论是通过 LeCun 所代表的“认知架构”路线,还是 Tesla 所代表的“苦涩教训”式规模化路径,整个行业追求的目标其实是一样的:构建一个像人类一样理解世界的“通用助手”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CBA最新消息!上海男篮大将常规赛报销,北京首钢签约顶级后卫

CBA最新消息!上海男篮大将常规赛报销,北京首钢签约顶级后卫

体坛瞎白话
2026-04-20 12:52:14
被豆包害惨了的大学生们!网友:豆包就是愚蠢且勤劳的老实人

被豆包害惨了的大学生们!网友:豆包就是愚蠢且勤劳的老实人

夜深爱杂谈
2025-12-02 20:51:10
福原爱没撒谎,公开祝福、独自带娃的江宏杰,证实她当年评价

福原爱没撒谎,公开祝福、独自带娃的江宏杰,证实她当年评价

白面书誏
2026-04-20 15:28:46
霍尔木兹突发!美伊谈判,重大宣布!

霍尔木兹突发!美伊谈判,重大宣布!

中国经济网
2026-04-20 10:02:03
德国百年巨头倒下时,浙江修鞋匠花4500万买下,如今年入70亿

德国百年巨头倒下时,浙江修鞋匠花4500万买下,如今年入70亿

毒sir财经
2026-04-19 22:12:53
国产混动,集体杀向丰田腹地

国产混动,集体杀向丰田腹地

新浪财经
2026-04-20 18:06:42
台军到底能不能打?7万字告诉你答案

台军到底能不能打?7万字告诉你答案

述策
2026-04-20 11:08:57
油价调整:倒计时1天,预计下调780元/吨,明晚油价要跌!

油价调整:倒计时1天,预计下调780元/吨,明晚油价要跌!

金投网
2026-04-20 11:01:32
到底得有多坏,才能做出这么丧尽天良的事!

到底得有多坏,才能做出这么丧尽天良的事!

胖胖说他不胖
2026-04-19 09:00:30
10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

听风喃
2026-04-06 11:16:04
买到宝了!曼城22岁小将赛季10球13助仅次哈兰德,一年身价翻1倍

买到宝了!曼城22岁小将赛季10球13助仅次哈兰德,一年身价翻1倍

衣衫褴褛的文人
2026-04-20 17:12:15
24架歼10直冲云霄!巴铁从名单中硬核抢人:以色列战机就在伏击圈

24架歼10直冲云霄!巴铁从名单中硬核抢人:以色列战机就在伏击圈

深析古今
2026-04-19 09:17:01
Model Y 撞报废,车主轻伤,又订了辆 Model Y L!

Model Y 撞报废,车主轻伤,又订了辆 Model Y L!

新浪财经
2026-04-20 15:28:47
间谍就在我们身边!4月16日,央视报道了一个让人后背发凉的新闻

间谍就在我们身边!4月16日,央视报道了一个让人后背发凉的新闻

游古史
2026-04-20 11:47:39
很多微信群都变成了死群,因为人很难对没有利益的事保持长久热情

很多微信群都变成了死群,因为人很难对没有利益的事保持长久热情

大张的自留地
2026-04-20 13:10:12
中央层面整治形式主义为基层减负专项工作机制办公室 中央纪委办公厅公开通报4起整治形式主义为基层减负典型问题

中央层面整治形式主义为基层减负专项工作机制办公室 中央纪委办公厅公开通报4起整治形式主义为基层减负典型问题

新华社
2026-04-20 17:44:02
张涵予新片《寻龙诀》上映仅1天,观众强烈要求下架,骂声一片

张涵予新片《寻龙诀》上映仅1天,观众强烈要求下架,骂声一片

秋姐居
2026-04-18 19:34:07
半场21分!真不像断过跟腱的样子啊...

半场21分!真不像断过跟腱的样子啊...

左右为篮
2026-04-20 11:57:07
我国科学家发现人有两个“断崖式衰老”节点,分别是50岁和63岁

我国科学家发现人有两个“断崖式衰老”节点,分别是50岁和63岁

科普大世界
2026-04-20 10:15:11
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

莫地方
2026-04-20 09:30:18
2026-04-20 20:04:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2928416文章数 6808关注度
往期回顾 全部

科技要闻

华为Pura90逆周期定价,4699元起,未涨价

头条要闻

小学生遭多名中小学生施暴搜家 家长以"入室抢劫"报案

头条要闻

小学生遭多名中小学生施暴搜家 家长以"入室抢劫"报案

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

鹿晗生日上热搜,被关晓彤撕下体面

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

数码
本地
手机
艺术
公开课

数码要闻

华为新内存技术来了,Mate X7用户6月有福

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

手机要闻

Pura双旗舰!当系统、硬件、应用 “拧成一股绳”,体验有多顶?

艺术要闻

王羲之《换鹅帖》尚在人间,惊艳无比!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版