网易首页 > 网易号 > 正文 申请入驻

世界模型怎么才算“能用”?李飞飞把它做成了 API

0
分享至

全文 2,000字 | 阅读约 6 分钟


( 李飞飞:人类的常识并不难,AI 能学会)

真正的“世界模型”是什么?李飞飞说:不只是看,还要能走进去。

2026 年 1 月 21 日,她创立的 World Labs 上线了开放平台 World API。输入一张图、一段文字或一个视频,它就能生成一个 3D 世界。AI 可以在里面移动和探索,你也可以把它导出到游戏引擎或机器人仿真系统。

但在李飞飞眼中,World API 不只是一个生成工具。

1 月 28 日,在播客《Rethink Reality》上,李飞飞说:

“世界可以是抽象的,也可以是物理的。它可以大到宇宙,也可以小到一粒沙子。我们不只是在做一个模型,而是在重新定义,什么才算一个世界。”

就在几天前,彭博社曝出这家公司正与投资人谈判新一轮融资,估值或达50亿美元,是首轮融资时的五倍。

第一节|世界不是图像,是可交互空间

要理解 World API 为什么重要,先看它和现在主流的 AI 工具有什么不同。

Sora、即梦等生成的是视频流,本质是固定角度的连续画面。你看到一段影像,但无法走进去,无法绕到背后。这是给人看的内容。

World Labs 生成的是空间结构,是完整的几何模型加上物理关系。你可以走进去,可以绕到后面,可以导出到游戏引擎或机器人仿真系统。这是给机器用的环境。

这个区别为什么重要?

视频模型解决“看什么”,世界模型解决“能做什么”。游戏需要可探索的关卡、机器人需要可训练的仿真环境、VR 需要可沉浸的空间,这些都不是一段视频能解决的。

而要做到这些,AI 必须理解物体能做什么。

一张椅子不只是椅子,是可以坐的东西;一扇门不只是形状,是可以推开的入口。AI 如果不理解这些,就无法真正进入世界,更无法在里面行动。

所以,世界可以大到宇宙,也可以小到一粒沙子。关键不在尺度,在于它是否具备完整的空间关系、物理规则和可交互性。

AI的输出,正在从内容变成环境。

第二节|World API 的核心能力

这个环境是怎么造出来的?

1月21日上线的World API,把李飞飞对世界的定义变成了可调用的产品。从这个API的设计,可以看出两个技术判断:

1、多模态输入:用多种信息源还原空间

World API 支持文本、图片、视频、全景图作为输入。你可以给它一句话,也可以给它一段视频或几张全景照片,AI 会从这些不同信息里拼出一个 3D 空间。

为什么不像 ChatGPT 那样只用文本?

因为真实世界的信息是多维度的。语言描述空间结构效率很低,图像能提供视觉信息但缺少深度,视频有时间序列但视角受限。只有把这些信息融合,才能还原完整的空间。

World Labs 开发的模型是多模态的,包含语言、语义、几何,最终还有物理。

2、语义可编辑:AI要懂人话,不只是懂数字

比如这样一句话:在客厅中央放一张沉重的沙发。

这里的“沉重”、“中央”不是精确坐标,但人能懂,AI 也必须能懂。

类似的词还有很多:“滑”表示摩擦,“暗”表示光照,“易碎”带有预判。这些日常用语里都藏着物理信息。World API 的处理方式是:保留这些模糊性,不把它们转成精确数值,而是直接读懂语义。

这样创作者就可以用自然语言描述想要的世界,而不需要学建模软件或写代码。

配合自然语言,World Labs 还提供了可视化工具 Chisel(凿子)。用户可以放置几个方块来决定画廊的几何结构,AI 会基于这些约束生成完整场景。

这两个能力的组合,让World API成为了一个开放的空间基础设施。任何需要 3D 环境的系统,都可以直接调用它来构建场景,而不需要从零开发。

从产品定位看,这不是一个生成式AI应用,而是下一代空间智能的底层平台。

第三节|世界造出来给谁用?

产品能力已经清楚了,但更重要的问题是:这个市场有多大?

1、三类核心场景

游戏开发最直接。传统 3D 建模耗时数月,World API 可以在几分钟内生成可用关卡,设计师再用 Chisel 调整细节。原本花在重复建模上的时间,可以用来打磨玩法和叙事。

机器人训练依赖仿真环境。现在的做法是在Unity 或 Isaac Sim 里手工搭建场景,成本高、周期长。如果能从一段真实环境的视频直接生成可训练的 3D 仿真空间,机器人从实验室走向现实世界的速度会快得多。

VR和AR需要大量3D内容但大多数创作者不会用 Blender 或Maya,World API降低了制作门槛。建筑设计、室内装潢、展览策划,都可以快速把概念变成可交互的空间原型。

李飞飞还提到了下一步的技术方向:动力学。树会随风摇摆、沙发能压出地毯形变、光照会随时间变化。这些不只是为了真实感,而是为了让生成的世界能真正用于物理仿真和机器人训练。

2、不同的赛道

World Labs 和 OpenAI、Google的重点不太一样。

OpenAI 当前主攻对话和通用 Agent,ChatGPT 帮你写文章、分析数据、执行任务,但重心不在空间理解。

Google 有 Genie 3 这样的世界模型,也能生成可交互 3D 环境,但主要用于游戏开发和agent训练,定位更偏向研究和特定场景。

World Labs 做的是可编程空间的基础设施,生成的不只是环境,而是可以直接接入各种系统的空间数据。任何需要 3D 环境的应用,都可以调用 World API。

这是基础设施和应用层的差异。就像10年前,做操作系统的和做应用的不是对手。

投资人看到的也是这个:如果可编程空间成为下一代平台,World Labs占据的是底层位置。API 上线后,公司正洽谈新一轮融资,目标估值 50亿美元,是此前 10 亿估值的五倍。

3、技术的另一面

李飞飞在对话中主动谈到了风险。

任何能重建空间的技术,都可能被用于监控、操控或制造虚假现实。她的观点很直接:技术本身是中性的,问题在于如何使用。

那怎么办?她的答案是:依靠法律、治理、社会规范、教育,还有人类自身的善意。

这个回答诚实,但也有限。因为技术一旦开放,控制权就不在开发者手里了。World API现在是给开发者用的工具,但最终这些生成的空间会被用在哪里、服务于什么目的,很难完全约束。

这不是李飞飞能解决的问题,也不是任何一家公司能解决的问题。但至少她没有回避,在大多数创业公司急于讲故事、冲估值的时候,愿意公开谈风险,这本身就是一种态度。

造世界的工具已经出现。机会很大,风险也很大。

结语|她做的不是产品,是入口

OpenAI 用对话框让 AI 接近语言,李飞飞 让 AI 进入空间。

对话框生成的是内容,World API 生成的是可交互的环境。前者是终点,后者是起点。

她给底层模型取名 Marble(大理石),工具叫 Chisel(凿子)。隐喻很清楚:世界等待被雕刻,工具已经给你,剩下的看你怎么用。

World API 已经上线,代码已经开放。

接下来,就看开发者用它造出什么世界。

识自AI

本文由AI深度研究员出品,内容基于李飞飞在播客《Rethink Reality》的访谈及World Labs公开信息翻译整理,属编译分析性质。内容为原文理解性翻译与合理解读,非逐字对照翻译。未经授权,不得转载。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:

https://www.youtube.com/watch?v=61VpIEpdZGg

https://www.bloomberg.com/news/articles/2026-01-23/fei-fei-li-s-ai-startup-world-labs-in-funding-talks-at-5-billion-valuation

https://www.worldlabs.ai/blog/announcing-the-world-api

https://x.com/drfeifei/status/2016201629121269831?referrer=grok-com

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军进入战位,特朗普给伊朗最后机会:答应美方的条件,不然就动手

美军进入战位,特朗普给伊朗最后机会:答应美方的条件,不然就动手

阿芒娱乐说
2026-01-29 13:32:45
万科郁亮失联大反转,一切都结束了!

万科郁亮失联大反转,一切都结束了!

财经三分钟pro
2026-01-28 15:21:59
婚宴延误上菜2小时,消费者获减免餐费28120元

婚宴延误上菜2小时,消费者获减免餐费28120元

环球网资讯
2026-01-27 18:27:08
出身浙江豪门,前夫是上海顶级富豪,现仍在前夫集团担任高层领导

出身浙江豪门,前夫是上海顶级富豪,现仍在前夫集团担任高层领导

素衣读史
2026-01-19 15:12:16
被央视怒批、洋相百出、腹中空空,这几位“绝望的文盲”凭啥能火

被央视怒批、洋相百出、腹中空空,这几位“绝望的文盲”凭啥能火

娱说瑜悦
2025-12-13 12:24:22
载入史册!穆帅:以为晋级了所以上后卫,发现不够后让特鲁宾进攻

载入史册!穆帅:以为晋级了所以上后卫,发现不够后让特鲁宾进攻

砚底沉香
2026-01-29 07:24:03
秦志戬点名,陈梦迎大事,或官宣决定,国乒名单公布,球迷期待

秦志戬点名,陈梦迎大事,或官宣决定,国乒名单公布,球迷期待

江湖第一菜鸡
2026-01-29 08:04:25
大瓜!一线当红女星被曝肇事逃逸,事后让助理“顶缸”评论区炸锅

大瓜!一线当红女星被曝肇事逃逸,事后让助理“顶缸”评论区炸锅

深析古今
2026-01-29 13:46:29
一支笔锁死中国14亿人命运:为何90年过去了,这条斜线谁也动不了

一支笔锁死中国14亿人命运:为何90年过去了,这条斜线谁也动不了

半解智士
2026-01-20 18:03:00
断指乞讨精神失常?甜甜圈现状惊人:他用三年半,跌入美国斩杀线

断指乞讨精神失常?甜甜圈现状惊人:他用三年半,跌入美国斩杀线

揽星辰入梦
2026-01-28 09:08:36
世界正在淘汰「优秀」的孩子

世界正在淘汰「优秀」的孩子

蓝橡树
2026-01-22 14:27:16
俄邀请泽连斯基赴莫斯科会晤,哈梅内伊开始紧张了

俄邀请泽连斯基赴莫斯科会晤,哈梅内伊开始紧张了

山河路口
2026-01-29 12:23:47
一语惊醒梦中人!欧洲高官直言:搞垮中国,就是给美国送霸权!

一语惊醒梦中人!欧洲高官直言:搞垮中国,就是给美国送霸权!

达文西看世界
2026-01-24 11:29:41
安徽两市政协主席调整!

安徽两市政协主席调整!

凤凰网安徽
2026-01-29 09:58:18
黄磊女儿黄多多有意进圈,脸是真的小,身材也是真的好,应该会爆

黄磊女儿黄多多有意进圈,脸是真的小,身材也是真的好,应该会爆

民间平哥
2026-01-18 21:36:22
1997年回归前夜,香港十几万黑帮连夜“大逃亡”,他们最后都去哪了?

1997年回归前夜,香港十几万黑帮连夜“大逃亡”,他们最后都去哪了?

老杉说历史
2026-01-13 19:14:13
英首相时隔8年访华,阵容大有变化,俄方嘲讽:将引发灾难性后果

英首相时隔8年访华,阵容大有变化,俄方嘲讽:将引发灾难性后果

井普椿的独白
2026-01-29 12:57:18
近170亿!常州巨头超级工厂落地

近170亿!常州巨头超级工厂落地

常州大喇叭
2026-01-28 17:03:40
大雪暴雪!冻雨!全国大范围雨雪降温天气将“上线”!山东多地有雨雪!最新天气预报↘

大雪暴雪!冻雨!全国大范围雨雪降温天气将“上线”!山东多地有雨雪!最新天气预报↘

山东教育电视台
2026-01-29 11:16:51
苹果客服回应降价iPhone Air疑为库存机:产品不是先订单后生产 时间会有出入

苹果客服回应降价iPhone Air疑为库存机:产品不是先订单后生产 时间会有出入

快科技
2026-01-27 17:02:05
2026-01-29 14:48:49
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
372文章数 158关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

外媒:特朗普执政一年后 对华不友好国家正"转向"中国

头条要闻

外媒:特朗普执政一年后 对华不友好国家正"转向"中国

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

张译不再隐瞒!公开回应退圈息影真相

财经要闻

金价狂飙,历史首次!

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

手机
本地
亲子
公开课
军事航空

手机要闻

消息称字节2025年底开启豆包手机助手正式版项目 新机预计2026年Q2中晚期发布

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

孩子睡觉露脚丫,不怕着凉吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

无障碍浏览 进入关怀版