网易首页 > 网易号 > 正文 申请入驻

李飞飞「空间智能」首个模型发布:一张图生成交互3D场景,生成式AI进入3D化时代

0
分享至

文章转载自「机器之心」。

「无论怎样理论化,我们还是很难用语言来描述与照片或句子生成的 3D 场景交互的体验,」李飞飞说道。

北京时间今天凌晨,著名 AI 学者、斯坦福大学教授李飞飞公布了她的第一个创业项目。这是一个能用单张图片、一句话生成 3D 世界的神奇项目。

生成式 AI,从此进入了 3D 化、完全沉浸式的新时代。

完整的体验可以在博客体验:https://www.worldlabs.ai/blog

只用一张图生成的 3D 世界会有多精细?World Labs 表示,效果是这样的:

这里是更多效果展示:

此前,我们已经见证了一系列会制作 2D 内容的生成式 AI 工具,它们可以输出图像或视频。相比之下,生成 3D 内容的方法并不多见。直接生成 3D 内容可以提高对内容的控制力和一致性,这将改变我们制作电影、游戏、模拟器和其他物理世界数字表现的方式。

英伟达高级研究科学家、李飞飞高徒Jim Fan总结道,「GenAI正在创造越来越高维度的人类体验快照。Stable Diffusion是2D快照;Sora是2D+时间维度的快照;而World Labs是3D、完全沉浸式的快照」。

的确,当我们把 AI 生成的内容提升到 3D 物体层面上之后,「想象力」与可操作性终于得到了统一,这就为以后的无数应用打开了大门。

在 World Labs 的博客中,团队展示了他们如何探索 3D 生成式世界,并在浏览器中实时呈现,包括相机效果、3D 效果和经典绘画。

01探索世界

下面展示了由奇幻图片和日常照片生成的 3D 世界一些官方示例。

02相机效果

一旦场景生成完,之后会使用虚拟相机在浏览器中实时渲染。精确控制该相机可实现艺术摄影效果。

可以模拟景深,只有距离相机一定距离的物体才能聚焦:

还可以模拟滑动变焦,同时调整摄像机的位置和视野:

033D 效果

大多数生成模型预测像素,但预测 3D 场景有很多优势:

  • 持久现实:一旦生成一个世界,它就会一直存在。即使你移开视线再回来,场景也不会改变。

  • 实时控制:生成场景后,你可以在场景中实时移动。你可以停留在一朵花的细节上,也可以窥探角落里的一举一动。

  • 正确的几何形状:生成的世界符合三维几何的基本物理规则。它们具有实体感和深度感,与某些人工智能生成的视频的梦幻性质形成鲜明对比。

可视化 3D 场景的最简单方法是绘制深度图,其中每个像素都按其与摄像头的距离着色:

我们可以利用 3D 场景结构来构建交互效果:

还可以构建特效,让场景活跃起来:

走进世界名画

World generation 还有一个应用方式:体验标志性艺术作品。这里是根据梵高、霍珀、修拉和康定斯基的最爱作品生成的,模型没有生成原画之外的任何东西。

04创意工作流

World Labs 让 3D 世界生成自然地与其他 AI 工具组合在一起。这使得创作者可以使用他们已知的工具来实现新的体验。

例如,可以通过首先使用文本到图像模型生成图像来从文本创建世界。不同的模型有自己的风格,World Labs 生成的 3D 世界可以继承这些风格。

例如,使用不同的文本到图像模型生成同一场景的四个变体,全部使用相同的提示:

一间充满活力的卡通风格的青少年卧室,里面有一张铺着彩色毯子的床,一张杂乱的桌子,上面有一台电脑,墙上贴着海报,还有散落的运动装备。一把吉他靠在墙上,中间是一张舒适的带图案的地毯。窗外的光线为房间增添了温暖、年轻的氛围。

World Labs 已经让一些创作者提前了解了技术,开始尝试 3D 原生生成 AI 工作流带来的可能性。

Eric Solorio 展示了 World Labs 的模型如何填补其创意工作流中的空白,使场景中的角色轻松上演并指导精确的摄像机移动:

Brittani Natali 使用将 World Labs 技术与 Midjourney、Runway、Suno、ElevenLabs、Blender 和 CapCut 等工具相结合的工作流程,在生成的世界中精心设计了摄像机路径,以唤起三部短片的不同情绪:

最后,World Labs 表示这些结果是他们生成 3D 世界的第一个早期预览。他们正在努力改善生成的世界的大小和保真度,并尝试用户与其交互的新方式。

参考链接:https://www.worldlabs.ai/blog

转载原创文章请添加微信:founderparker

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
表弟估分705全家笃定北大稳录,查分瞬间全家沉默

表弟估分705全家笃定北大稳录,查分瞬间全家沉默

鬼菜生活
2026-06-27 08:15:25
2026高考420-510分,推荐报考这5所大学,毕业生就业质量高!

2026高考420-510分,推荐报考这5所大学,毕业生就业质量高!

高三倒计时
2026-06-26 19:03:06
身背26条人命,公安部挂牌追逃12年,退役特种兵为何蜕变成黑老大

身背26条人命,公安部挂牌追逃12年,退役特种兵为何蜕变成黑老大

易玄
2026-05-29 16:50:57
王菲低调登西安城墙!随行人员气场不凡,疑似解锁秦腔非遗新身份

王菲低调登西安城墙!随行人员气场不凡,疑似解锁秦腔非遗新身份

魔都姐姐杂谈
2026-06-26 15:38:11
A股:下周一,6月29日,股民坐稳扶好了,很可能将上演熟悉的剧情

A股:下周一,6月29日,股民坐稳扶好了,很可能将上演熟悉的剧情

云鹏叙事
2026-06-27 10:33:59
郭可盈女儿参加毕业舞会,16岁完美继承母亲颜值

郭可盈女儿参加毕业舞会,16岁完美继承母亲颜值

TVB剧评社
2026-06-26 20:56:32
制片人于冬:拍主旋律不能把观众当成被教育的对象|造梦者说

制片人于冬:拍主旋律不能把观众当成被教育的对象|造梦者说

新京报
2026-06-25 20:55:00
曼联血亏!8000 万王牌完爆 1.2 亿安德森,红魔放着不抢专砸水货

曼联血亏!8000 万王牌完爆 1.2 亿安德森,红魔放着不抢专砸水货

澜归序
2026-06-27 07:21:22
金价跌回3字头,半年回撤超30%,东方豪侠再度预言黄金白银见底时间

金价跌回3字头,半年回撤超30%,东方豪侠再度预言黄金白银见底时间

东方豪侠
2026-06-26 11:37:33
电诈的核心源头,就是三大运营商突破了电话卡实名制约束的底线!

电诈的核心源头,就是三大运营商突破了电话卡实名制约束的底线!

林子说事
2026-06-27 07:21:09
被发腮的张一山惊艳,33岁终于长开,网友:杨紫得避嫌了

被发腮的张一山惊艳,33岁终于长开,网友:杨紫得避嫌了

东方不败然多多
2026-06-24 02:31:15
国足是怎样一步步沦为全民笑柄、被视作人间笑话的

国足是怎样一步步沦为全民笑柄、被视作人间笑话的

笑熬浆糊111
2026-06-25 13:37:06
江苏600分以上40931人,看到这个数字我沉默了

江苏600分以上40931人,看到这个数字我沉默了

金哥说新能源车
2026-06-27 06:03:30
Anthropic CEO:市场对DeepSeek很兴奋,但订单上我们没输过!网友:你自己使用版权争议数据训练模型还说人合法蒸馏不合法!

Anthropic CEO:市场对DeepSeek很兴奋,但订单上我们没输过!网友:你自己使用版权争议数据训练模型还说人合法蒸馏不合法!

大白聊IT
2026-06-25 16:30:33
委内瑞拉强震前后最新卫星图像对比,重灾区建筑损毁严重,委代总统视察现场,幸存者:就像恐怖片

委内瑞拉强震前后最新卫星图像对比,重灾区建筑损毁严重,委代总统视察现场,幸存者:就像恐怖片

扬子晚报
2026-06-26 14:41:32
男子突发脑出血,结婚15年没下过厨房的妻子为救丈夫欲卖宝马车:以后等他能坐轮椅,我可以上班赚钱养他

男子突发脑出血,结婚15年没下过厨房的妻子为救丈夫欲卖宝马车:以后等他能坐轮椅,我可以上班赚钱养他

台州交通广播
2026-06-26 20:46:53
震惊了!坐飞机,发现了一名超像豆包的空姐

震惊了!坐飞机,发现了一名超像豆包的空姐

微微热评
2026-06-25 12:35:51
国足差哪了?50万人口小国,3连平进32强创奇迹,主帅发声很扎心

国足差哪了?50万人口小国,3连平进32强创奇迹,主帅发声很扎心

萌兰聊个球
2026-06-27 11:02:08
相亲大爷退休金4000,怎料大妈一惊,坦言:这点钱也太少了吧

相亲大爷退休金4000,怎料大妈一惊,坦言:这点钱也太少了吧

多久情感
2026-06-26 08:16:41
76岁变身潮州首富,广东小县城开始“拿捏”英伟达?

76岁变身潮州首富,广东小县城开始“拿捏”英伟达?

新10亿商业参考
2026-06-26 18:16:56
2026-06-27 11:51:00
FounderPark incentive-icons
FounderPark
关注AI创业,专注和创业者聊真问题
1255文章数 162关注度
往期回顾 全部

科技要闻

GPT-5.6发布,旗舰模型先向可信伙伴开放

头条要闻

三战三平佛得角小组第二晋级 下一场挑战阿根廷

头条要闻

三战三平佛得角小组第二晋级 下一场挑战阿根廷

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

杨紫获白玉兰最佳女主角奖,泪洒现场

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

11.99万起 捷途自由者7 PLUS/山海T1四驱版上市

态度原创

教育
旅游
游戏
家居
时尚

教育要闻

北京理工大学在河南招生222人,新增3个本科专业 其中具身智能招120人,理科671分可报考物理101组,文科632分可报考历史102组!

旅游要闻

柳林县北墕村黄河乡村生态休闲园桑葚迎来采摘季

NS2杀疯了!美国首年590万台 成历史销量第2快主机

家居要闻

绿意盎然 自然之境

“这件衣服”今年夏天越来越流行!简单穿就很好看

无障碍浏览 进入关怀版