网易首页 > 网易号 > 正文 申请入驻

李飞飞论文深度解读:从语言到世界,空间智能将重写AI的未来十年

0
分享至

【前言】如果说大语言模型点燃了人工智能的“语言革命”,那么李飞飞最新发表的长文则试图回答一个更深层的问题:真正的智能是否必须扎根于空间与物理世界?



图 | 李飞飞(来源:World Labs)

在这篇被称为“World Models 研究路线图”的文章中,她不仅提出了空间智能的理论框架,更给出了具体的技术方向与实现路径,清晰勾勒出AI 下一个十年的主航道。



而就在这股浪潮中,我们也尝试用 Marble 构建了一个小而真实的样本:一个完全由AI生成、可漫游的“蘑菇屋3D场景Demo”。这个Demo虽小,却恰好体现了世界模型的力量——AI 正在从语言迈向空间。

世界模型—蘑菇屋3D Demo

一、语言模型走到了极限——AI 需要一双“看世界的眼睛”

李飞飞开篇指出当今 AI 的核心矛盾:LLM 很会“说话”,但不会“理解世界”。它们能写小说,却不知道一把椅子转90度后会变成什么样;能生成漂亮的文章,却无法判断两个物体之间的距离。

换句话说,今天的 AI 更像是“经验缺失的文字匠”——聪明,却没有身体;博学,却没有空间直觉。

而真正的智能,必须能回答这些问题:

  • 桌子和灯之间相隔多少?
  • 杯子倒下后会往哪滚?
  • 两个物体会不会相撞?
  • 这个房间能不能再放下一张床?

这些能力不是语言,而是空间智能。

二、空间智能:人类心智的隐形操作系统

李飞飞提出一个关键观点:空间智能是人类认知的底层操作系统。

孩子在会说话前,就能理解“物体不会凭空消失”;成年人在走路时,不会每一步都计算角度和速度;驾驶员能凭直觉判断车距。这种能力支撑着人类的所有高级认知:

  • 对世界的理解
  • 对风险的预测
  • 对行为的规划
  • 对想象力的构建

而今天的 AI,仍然缺少这一部分。

三、答案不是更大的 LLM,而是“世界模型”(World Models)

李飞飞提出 AI 的下一阶段不是 GPT-6、GPT-7,而是:世界模型(World Models),一个能理解、生成、预测、操控空间世界的“空间大脑”。

它包含三项核心能力:

01、生成性:能构建一个一致的世界

不仅是图像,而是完整的 3D 结构、物理逻辑和动态变化。

02、多模态:能从更多输入理解世界

图像、深度、视频、动作、触觉、文本指令……

03、交互性:能在世界中行动

预测动作效果,形成观察—推理—行动闭环。

如果 LLM 是“文字生成器”,那么世界模型就是“空间逻辑生成器”。



图|World Labs创始人团队,左起依次为Ben Mildenhall、Justin Johnson、Christoph Lassner和李飞飞(来源:World Labs)

四、技术路线:如何真正构建世界模型?

李飞飞提出未来五年的三大攻坚方向:

01、寻找统一的世界建模任务函数

就像语言模型预测下一个 token,世界模型需要一个能统一几何、物理、语义、动态的预测目标。这是最深的科学难题。

02、规模化的空间数据训练

海量视频、深度、点云、3D扫描、触觉数据……

核心突破是让 AI 从 2D 像素中恢复 3D 世界结构。

03、全新的空间架构设计

需要新的 3D token、显式空间记忆、连续世界状态网络,以及近期出现的 RTFM(保持时空一致性的视频生成框架)。

世界模型不是 LLM 的补丁,而是新的 AI 物种。

五、构建“小世界”:用Marble生成的“蘑菇屋3D Demo”

在这场“从语言到世界”的技术迁移中,我们也做了一次小小的尝试。

基于 Marble,我们制作了一个完全由世界模型生成、可漫游的蘑菇屋3D场景 Demo:

  • 输入一句自然语言描述



  • Marble自动生成场景中的地形、房体结构、材质
  • 支持从第一视角自由走动
  • 光照、阴影、空间结构保持一致
  • 场景内部的石板路、树木及房屋都具有可辨识的三维关系

更重要的是,这个 Demo 不仅是“渲染的画面”,而是一个 可以进入、可以理解、可以探索的空间世界。

但真正让人感到“世界模型的力量”的,并不仅是一个可爱的蘑菇外形。我们在蘑菇屋内部嵌入了两个截然不同的空间:一个是紧凑但完整的现代化一居室酒店房间,另一个则是光影与色彩丰富的迷你游戏厅。两个空间并非简单拼贴,而是由 Marble 在同一世界坐标系中完成:

  • 一居室中的床、书桌、洗浴间被自然地安置在空间结构内;
  • 游戏厅里的街机设备、灯箱、座椅也自动保持正确的尺度、距离和遮挡关系;
  • 跨空间的光影渲染保持连续;
  • 行走路径、空间逻辑、房间连接全部由模型自洽生成。

世界模型—蘑菇屋3D Demo

整个体验过程不像浏览一段渲染动画,更像是亲自走进了一座真实存在的小世界。

如果说图像生成是“拍一张照片”,那么 Marble 更像是“搭建一个真实存在的地方”。这个小小的蘑菇屋,让人第一次直观感受到:AI 正在从表达信息,走向生成世界本身。

这正是李飞飞论文所强调的未来方向。

六、未来:空间智能将改变五大领域

李飞飞将世界模型的应用归纳为三个阶段。

01、短期:内容生产的空间化

游戏、动画、建筑、工业设计、虚拟世界创作。

未来的创作者将从“画画”变成“造世界”。

02、中期:机器人与具身智能的突破

世界模型将成机器人“认知层”的核心。

它让机器人第一次真正理解现实中的空间结构。

03、长期:科学研究的重新定义

药物空间结构推理、材料探索、气候模拟、复杂系统预测……

世界模型可能成为科学家的“智能显微镜”。

七、AI 的未来不是取代人,而是扩展人类能力

李飞飞在论文最后写道:AI 的使命不是替代,而是增强人类。

世界模型将让 AI 从“会说话”走向“会理解世界”。

它会成为:

  • 科学家的模拟器
  • 创作者的虚拟工作室
  • 城市的空间大脑
  • 机器人的世界观

当 AI 终于拥有了空间智能,人类也将拥有新的工具去理解世界、创造世界。

而今天我们搭建的这间蘑菇屋,也许只是未来万千虚拟世界中的一个原点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
打到了绝世好车!

打到了绝世好车!

新住家居
2026-04-06 06:05:50
中美俄意见达成一致:宁愿日本消失,也绝不能让他们拥有核武器

中美俄意见达成一致:宁愿日本消失,也绝不能让他们拥有核武器

嫹笔牂牂
2026-04-06 14:42:58
世锦赛下午六点开锣!赵心童是1号种子,和丁俊晖、肖国栋同区!

世锦赛下午六点开锣!赵心童是1号种子,和丁俊晖、肖国栋同区!

格斗社
2026-04-06 10:17:50
战争有多烧钱,网友说我讲一下我家里的局部战争你就明白

战争有多烧钱,网友说我讲一下我家里的局部战争你就明白

侃神评故事
2026-04-06 11:45:08
友商评张雪:他不成功天理难容,这个男人真的可以带我们称霸世界

友商评张雪:他不成功天理难容,这个男人真的可以带我们称霸世界

干史人
2026-04-05 22:30:03
普通家庭给孩子最好的托举是什么?张雪峰:做到这7点少走十年弯路

普通家庭给孩子最好的托举是什么?张雪峰:做到这7点少走十年弯路

户外阿毽
2026-04-06 06:09:27
院士罕见发话:别再叫北斗“中国版GPS”了!差距大到离谱!

院士罕见发话:别再叫北斗“中国版GPS”了!差距大到离谱!

小兰聊历史
2026-04-05 05:34:48
人类重返月球!NASA阿耳忒弥斯2号宇航员抵达月球空间

人类重返月球!NASA阿耳忒弥斯2号宇航员抵达月球空间

IT之家
2026-04-06 13:17:17
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
抓李镇全头发被罚下,米特里策社媒致歉:我失去了冷静没控制好自己

抓李镇全头发被罚下,米特里策社媒致歉:我失去了冷静没控制好自己

懂球帝
2026-04-06 15:04:10
盲目的大学扩招,正在反噬整个社会

盲目的大学扩招,正在反噬整个社会

凡人志
2026-03-25 01:34:53
很多人,都低估了30年房贷的杀伤力

很多人,都低估了30年房贷的杀伤力

一条要飞跃的咸鱼
2026-04-06 11:08:43
油价大涨超1.8元/升创新高,清明节假期后(4月7日)汽柴油或再大涨

油价大涨超1.8元/升创新高,清明节假期后(4月7日)汽柴油或再大涨

油价早知道
2026-04-05 01:45:53
留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

触摸史迹
2026-04-02 14:39:03
特朗普暗示“最后期限”推迟1天,伊朗提出开放霍尔木兹海峡条件

特朗普暗示“最后期限”推迟1天,伊朗提出开放霍尔木兹海峡条件

大风新闻
2026-04-06 08:27:21
松岛辉空:谈不上完全满意,但战胜了以往赢不了的对手

松岛辉空:谈不上完全满意,但战胜了以往赢不了的对手

懂球帝
2026-04-06 11:01:22
深圳房价真要跌到5万?2026年回暖信号已现,真相是…

深圳房价真要跌到5万?2026年回暖信号已现,真相是…

房探科技
2026-04-06 14:24:13
天津一地烧纸引发火情,过火面积达600余㎡!

天津一地烧纸引发火情,过火面积达600余㎡!

天津族
2026-04-06 07:32:47
0-4惨败,中国女足获得蒙太古杯亚军,连续2届决赛输给日本

0-4惨败,中国女足获得蒙太古杯亚军,连续2届决赛输给日本

侧身凌空斩
2026-04-06 04:59:02
突然拉升!美联储、鲍威尔,突发!降息,大消息!

突然拉升!美联储、鲍威尔,突发!降息,大消息!

证券时报e公司
2026-04-04 22:12:45
2026-04-06 16:43:00
美林数据Tempodata
美林数据Tempodata
数据分析与应用服务提供商
268文章数 20关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

外媒:美国副总统万斯和伊朗外长等人彻夜交流

头条要闻

外媒:美国副总统万斯和伊朗外长等人彻夜交流

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

乔任梁离世10年 父母曝舞台光鲜的背后

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

本地
艺术
旅游
手机
公开课

本地新闻

跟着歌声游安徽,听古村回响

艺术要闻

草书入门的“最强宝典”!因内容太妙,作者不敢留名,比学王羲之都靠谱

旅游要闻

桃花满谷、“蟠龙”苍劲 清明时节的千山人气高涨

手机要闻

苹果App Store今年Q1应用提交同比激增84%,分析称受氛围编程推动

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版