网易首页 > 网易号 > 正文 申请入驻

李飞飞空间智能首秀:AI靠单图生成3D世界,可探索交互

0
分享至

衡宇 西风 发自 凹非寺
量子位 | 公众号 QbitAI

就在刚刚,李飞飞空间智能首个项目突然发布:

仅凭借1张图,就能生成一个3D游戏世界的AI系统!

重点在于,生成的3D世界具有交互性

能够像玩游戏那样,自由地移动相机来探索这个3D世界,浅景深、希区柯克变焦等操作均可行。

随便输入一张图:

除了这张图本体,可探索的3D世界里,所有东西都是AI生成的:

这些场景在浏览器中实时渲染,配备了可控的摄像机效果和可调节的模拟景深(DoF)。

你甚至可以改变其中物体颜色,动态调整背景光影,在场景中插入其他对象。

此外,之前大多数生成模型预测的是像素,而这个AI系统直接预测3D场景

所以场景在你移开视线再回来时不会发生变化,并且遵循基本的3D几何物理规则。

网友们直接炸开锅,评论区“难以置信”一词直接刷屏。

其中不乏Shopify创始人Tobi Lutke等知名人士点赞:

还有不少网友认为这直接为VR打开了新世界。

官方则表示“这仅仅是3D原生生成AI未来的一个缩影”:

我们正在努力尽快将这项技术交到用户手中!

李飞飞本人也第一时间分享了这项成果并表示:

无论怎么理论化这个想法,用语言很难描述通过一张照片或一句话生成的3D场景互动的体验,希望大家喜欢。

目前候补名单申请已开启,有内容创作者已经用上了。

羡慕的口水不争气地从眼角落了下来。

Beyond the input image

官方博文表示,今天,World labs迈出了通往空间智能的第一步:

发布一个从单张图片生成3D世界的AI系统。
Beyond the input image, all is generated。

而且是输入任何图片。

而且是能够互动的3D世界——用户可以通过W/A/S/D键来控制上下左右视角,或者用鼠标拖动画面来逛这个生成的世界。

官网博文中放了很多个可以试玩的demo。

这次真的推荐大家都去试玩一下,上手体验和看视频or动图的感受非常的不一样。

(直通车按惯例,放在文末)

好,问题来了,这个AI系统生成的3D世界还有什么值得探究的细节之处?

摄影机效果

World Labs表示,一旦生成,这个3D世界就会在浏览器中实时渲染,给人的感觉跟在看一个虚拟摄像头似的。

而且,用户能够精准地控制这个摄像头。

所谓“精准控制”,有2种玩法,

一是能够模拟景深效果,也就是只能清晰对焦距离相机一定距离的物体。

二是能模拟滑动变焦(Dolly Zoom),也就是电影拍摄技巧中非常经典的希区柯克变焦。

它的特点是“镜头中的主体大小不变,而背景大小改变”。

很多驴友去西藏、新疆玩儿的时候都希望用希区柯克变焦拍视频,有很强的视觉冲击力。

在World Labs展示中,效果如下(不过在这个玩法里,没办法控制视角):

3D效果

World Labs表示,大多数生成模型预测的都是像素,与它们不同,咱这个AI预测的是3D场景。

官方博文罗列了三点好处:

第一,持久现实。

一旦生成一个世界,它就会一直存在。

不会因为你看向别的视角,再看回来,原视角的场景就会改变了。

第二,实时控制。

生成场景后,用户可以通过键盘或鼠标控制,实时在这个3D世界畅游移动。

你甚至可以仔细观察一朵花的细节,或者在某个地方暗中观察,用上帝视角注意这个世界的一举一动。

第三,遵循正确的几何规则。

这个AI系统生成的世界,是遵守3D集合物理基本规则的。

某些AI生成的视频,虽然效果很梦核,但可没有咱的这种深度的真实感哟(doge)。

官方博文中还写道,创造一个可视化3D场景,最简单的办法是绘制深度图。

图中每个像素的颜色,都是由它和摄像头的距离来决定的。

当然了,用户可以使用3D场景结构来构建互动效果——

单击就能与场景互了,包括但不限于突然给场景打个聚光灯。

动画效果?

那也是so easy啦。

走进绘画世界

团队还玩儿了一把,以“全新的方式”体验一些经典的艺术作品。

全新,不仅在于可互动的交互方式,还在于就靠输入进去的那一张图,就能补全原画里没有的部分。

然后变成3D世界。

这是梵高的《夜晚露天咖啡座》:

这是爱德华·霍普的《夜行者》:

创造性的工作流

团队表示,3D世界生成可以非常自然地和其它AI工具相结合。

这让创作者们可以用他们已经用顺手的工具感受新的工作流体验。

举个栗子:

可以先用文生图模型,从文本世界来到图像世界。

因为不同模型有各自擅长的风格特点,3D世界可以把这些风格迁徙、继承过来。

在同一prompt下,输入不同风格的文生图模型生成的图片,可以诞生不同的3D世界

World Labs和空间智能

“World Labs”公司,由斯坦福大学教授、AI教母李飞飞在今年4月创立。

这也是她被曝出的首次创业。

而她的创业方向是一个新概念——空间智能,即:

视觉化为洞察;看见成为理解;理解导致行动。

在李飞飞看来,这是“解决人工智能难题的关键拼图”。

只用了3个月时间,公司就突破了10亿美元估值,成为新晋独角兽。

公开资料显示,a16z、NEA和Radical Ventures是领投方,Adobe、AMD、Databricks,以及老黄的英伟达也都在投资者之列。

个人投资者中也不乏大佬:Karpathy、Jeff Dean、Hinton……

今年5月,李飞飞有一场公开的15分钟TED演讲。

她洋洋洒洒,分享了对于空间智能的更多思考,要点包括:

  • 视觉能力被认为引发了寒武纪大爆发——一个动物物种大量进入化石记录的时期。最初是被动体验,简单让光线进入的定位,很快变得更加主动,神经系统开始进化……这些变化催生了智能。
  • 多年来,我一直在说拍照和理解不是一回事。今天,我想再补充一点:仅仅看是不够的。看,是为了行动和学习。
  • 如果我们想让AI超越当前能力,我们不仅想要能够看到和说话的AI,我们还想要能够行动的AI。空间智能的最新里程碑是,教计算机看到、学习、行动,并学习看到和行动得更好。
  • 随着空间智能的加速进步,一个新时代在这个良性循环中正在我们眼前展开。这种循环正在催化机器人学习,这是任何需要理解和与3D世界互动的具身智能系统的关键组成部分。

据报道,该公司的目标客户包括视频游戏开发商和电影制片厂。除了互动场景之外,World Labs还计划开发一些对艺术家、设计师、开发人员、电影制作人和工程师等专业人士有用的工具。

如今伴随着空间智能首个项目的发布,他们要做的事也逐渐具象化了起来。

但World Labs表示,目前发布的只是一个“早期预览”:

我们正在努力改进我们生成的世界的规模和逼真度,并尝试新的方式让用户与之互动。

[1]https://www.worldlabs.ai/blog

[2]https://mp.weixin.qq.com/s/3MWUv3Qs7l-Eg9A9_3SnOA?token=965382502&lang=zh_CN

[3]https://x.com/theworldlabs/status/1863617989549109328

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曝樊振东放弃世乒赛另有隐情!向鹏0-3一轮游,国乒想换人来不及

曝樊振东放弃世乒赛另有隐情!向鹏0-3一轮游,国乒想换人来不及

侃球熊弟
2026-04-09 19:36:39
林心如真敢穿,衬衫敞开露肉色内搭,这身材谁看了不迷糊?

林心如真敢穿,衬衫敞开露肉色内搭,这身材谁看了不迷糊?

娱乐领航家
2026-04-07 00:00:03
人民日报都下场了!张雪夺冠没火,12天后在墨西哥火得一塌糊涂

人民日报都下场了!张雪夺冠没火,12天后在墨西哥火得一塌糊涂

童叔不飙车
2026-04-09 21:27:53
赛季报销!新疆官宣阿不都跖骨骨折 多主力受伤大概率无缘季后赛

赛季报销!新疆官宣阿不都跖骨骨折 多主力受伤大概率无缘季后赛

醉卧浮生
2026-04-09 19:50:32
英国45驱逐舰意外故障,疑似被中国外贸反舰导弹击中

英国45驱逐舰意外故障,疑似被中国外贸反舰导弹击中

恋人眼中的女孩
2026-04-09 12:17:42
李斌谈ES9汽车设计:原创艰难也必须做 不能活在别人的影子里

李斌谈ES9汽车设计:原创艰难也必须做 不能活在别人的影子里

快科技
2026-04-09 15:54:12
美副总统称美方从未承诺停火协议包含黎巴嫩

美副总统称美方从未承诺停火协议包含黎巴嫩

国际在线
2026-04-09 07:17:52
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
“台湾永远都不会是中国的一部分”,她被全民唾骂,被明星扇耳光

“台湾永远都不会是中国的一部分”,她被全民唾骂,被明星扇耳光

阅微札记
2026-02-28 20:01:18
张雪从凯越离开 33 字离职信意外走红!网友:天马行空又锋芒毕露……

张雪从凯越离开 33 字离职信意外走红!网友:天马行空又锋芒毕露……

互联网思维
2026-04-08 23:34:35
10年选秀谁赚得多?考辛斯9千万,沃尔2.8亿,榜首5亿太夸张了

10年选秀谁赚得多?考辛斯9千万,沃尔2.8亿,榜首5亿太夸张了

大西体育
2026-04-09 18:55:45
10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

孤单是寂寞的毒
2026-03-04 15:38:03
每天吃维生素,竟吃出肝衰竭?医生劝告:这3种维生素别乱吃!

每天吃维生素,竟吃出肝衰竭?医生劝告:这3种维生素别乱吃!

健康之光
2026-04-09 14:25:03
物业费会不会是压死失业人群的最后一根稻草?

物业费会不会是压死失业人群的最后一根稻草?

慧翔百科
2026-04-09 18:26:20
陈思诚新片定档五一,票房剑指10亿,《寒战1994》最强对手来了

陈思诚新片定档五一,票房剑指10亿,《寒战1994》最强对手来了

电影票房预告片
2026-04-09 21:49:18
25岁,太汹涌了,韩国顶级女爱豆

25岁,太汹涌了,韩国顶级女爱豆

技巧君侃球
2026-04-09 21:08:31
马克龙签涉台声明后,中方直击要害,朱凤莲强硬发声,法国赌输了

马克龙签涉台声明后,中方直击要害,朱凤莲强硬发声,法国赌输了

骚年先锋
2026-04-10 01:19:37
陈丽华告别仪式于北京八宝山殡仪馆举办,六小龄童、马德华、白岩松等人到场悼念;马德华:迟重瑞心里很难过,希望他节哀

陈丽华告别仪式于北京八宝山殡仪馆举办,六小龄童、马德华、白岩松等人到场悼念;马德华:迟重瑞心里很难过,希望他节哀

大象新闻
2026-04-09 11:45:05
陶喆再一次证明,娶妻要娶年轻的,即使你老了,她还美得心旷神怡

陶喆再一次证明,娶妻要娶年轻的,即使你老了,她还美得心旷神怡

许三岁
2026-03-16 10:18:04
郑丽文称台湾是国家,反对两岸统一?喊话大陆:美国让我过去

郑丽文称台湾是国家,反对两岸统一?喊话大陆:美国让我过去

阿器谈史
2026-01-26 20:48:30
2026-04-10 04:12:49
量子位 incentive-icons
量子位
追踪人工智能动态
12448文章数 176449关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

以色列总理:同意与黎巴嫩直接谈判

头条要闻

以色列总理:同意与黎巴嫩直接谈判

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

停火又悬了,最糟糕的情况要来了?

汽车要闻

文飞掌舵,给神行者带来了什么?

态度原创

房产
家居
健康
本地
公开课

房产要闻

利润暴跌44%!那个春节被骂惨了的海峡股份 正在经历什么?

家居要闻

清新自然 复古风尚

干细胞抗衰4大误区,90%的人都中招

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版