网易首页 > 网易号 > 正文 申请入驻

用AI创造元宇宙,Meta发布最强3D素材生成模型,一分钟创造一个世界

0
分享至

文|王沁 王奕昕

编辑|李然

因为有了AI,Meta的元宇宙梦不死!

Meta 3D Gen

Meta推出了一种名为Meta 3D Gen的端到端3D素材生成模型,可以在不到一分钟的时间内根据文本描述创建高质量的3D素材。

图源:X(@AIatMeta)

Meta 3D Gen结合了Meta的两个现有模型:用于生成 3D 网格素材的AssetGen和用于精细纹理化的 TextureGen。 Meta 表示,这种集成可以为沉浸式内容带来更高质量的3D生成。

Meta 3D Gen

据Meta称,3D Gen在速度和质量方面都超过了领先的行业解决方案。技术报告中称,专业3D艺术家在大多数类别中对该工具的评分都好于竞争对手,特别是对于复杂的请求。Meta表示,**它的速度是同类系统的3到60倍。**

Meta 3D Gen

VR行业发展速度不及预期,其中一个最重要的原因就是创建内容的成本过高,很难吸引内容创作者为元宇宙创建素材。而且人工创建的VR 3D素材质量因为硬件性能等各种因素的限制,相比平面素材过于“简陋”,使得用户的沉浸感不足。

和现有的业界产品(Meshy、Tripo等)相比,Meta的Gen 3D生成的效果确实要好上不少,而且用时还是最少的。图源:Meta论文

而如果用户能够非常方便且高效地创造3D素材,至少将能大大改善VR内容缺乏的问题。如果素材的质量再能得到进一步的提高,生成的虚拟现实世界真的能够达到以假乱真的地步。在Gen AI的加持之下,也许VR中的虚拟世界未来要成为第一个AI生成比例大于人工生成的领域。

Meta 3D Gen

也许小扎的VR梦,在AI的加持下,就真的要成了。

图源:X(@KaladinFree)

网友惊呼:这个技术对于VR以及Meta自身的发展策略来说太重要了。Meta可能是除了英伟达以外AI发展最大的赢家!

图源:X(@sonieashan)


从文本到3D,是怎样炼成的?

从文本提示词生成3D素材的模型,在 3D 图形、动画、游戏和 AR/VR 等领域都具有巨大的发挥潜力。

虽然在文生图和文生视频模型领域,已经取得了世界瞩目的进展(例如MidJourney、Sora、Runway等等),但在3D 生成模型领域,以往的模型质量仍然不足以用于专业用途。

**以往3D生成模型有很多缺陷,比如生成速度慢,生成的3D网格和纹理中存在伪影。此外,以往的很多模型仍然将物体外观渲染为固有的颜色,忽略了 3D 物体的颜色应该随着环境光的变化而变化**。特别是对于反光材料,当把它们放置在新环境中时,它们会显得格格不入。

而Meta的3D Gen 能在不到 30 秒内生成3D素材,相比于以往具有同等速度的模型,在保真度、生成的 3D 网格质量、特别是材料的质量和控制等方面,表现更好。

Meta 3D Gen

3D Gen是如何做到如此栩栩如生的3D素材生成的呢?

3D Gen 采用了两阶段的方法,结合了两个组件,第一阶段使用AssetGen组件,第二阶段使用TextureGen组件。


第一阶段:从文本到图像

这一阶段的目标是,从文本生成有着色和阴影的图像,从四个标准视角,生成这些角度的4张视图。为此,Meta团队使用了一个经过预训练的文生图的扩散模型,该模型在数十亿张带标签的图像上进行训练。

第一阶段的推理时间约为 30 秒。

左为其他模型效果,右为3D Gen模型效果。图源:Meta论文

和其他3D素材生成模型相比,Meta的AssetGen的细节,光照的效果都明显要丰富和真实得多。

左为其他模型效果,右为3D Gen模型效果。图源:Meta论文

值得一提的是,Meta团队使用的这个文生图模型,其架构与国内智源研究院的「悟道3.0」Emu开源多模态模型类似


第二阶段:从图像到3D

根据第一阶段生成的 3D 素材和最初的文本提示词,**对第一阶段的素材进行纹理细化或者重新着色,来生成更高质量的纹理和 PBR(physically based rendering,基于物理的渲染)图**。这一阶段使用了Meta团队的从文本到纹理( text-to-texture)的生成模型 3D TextureGen。

第二阶段推理时间约为 20 秒。

相比业内其他技术,Meta的TextureGen生成的纹理质量非常高。图源:Meta论文

通过构建 AssetGen 和 TextureGen两个组件,3D Gen模型将3D物体的三种高度互补的表现方式结合起来:视觉空间(图像)、体积空间(3D 形状和外观)以及 UV 空间(纹理与质地)。

与许多最先进的解决方案不同,AssetGen 和 TextureGen 都是前馈生成器,因此在部署后既快速又高效。

下图显示了 3D Gen 从第一阶段到第二阶段处理后的效果对比。第二阶段后通常具有更高的视觉美学,看起来更逼真,并且在高频颜色区有更多细节。

△第一阶段效果。图源:Meta论文

△第二阶段处理后的效果。图源:Meta论文

Meta团队将3D Gen与其他文生3D模型同行们(Meshy v3、Tripo等)进行了比较。Meta表示,竞争对手们在简单物体上做得很好,但更复杂的物体组合和场景就有挑战了,而且展现高频区细节与暴露视觉伪影之间总是难以平衡。

3D Gen还可以在同一形状的物体上,进行不同的着色。在第一阶段生成的 3D 网格,然后传递到第二阶段,只要使用不同的提示词,就能创建具有相同形状但外观不同的新素材。除了实现语义编辑并执行全局和局部修改之外,3D Gen 还可以成功地模仿不同的材料和艺术风格。

在同一形状的物体上,进行不同的着色

除了对物体本身进行不同着色,3D Gen还能调整整体场景的风格。通过对物体层面的提示词进行加强,加上风格信息,就能将整个场景的风格进行调整,效果很协调。

在下图中,3D Gen就对同样的物体,进行不同风格的场景渲染,有针织玩偶、恐怖电影、水下世界、像素艺术、圣诞节等风格。

调整整体场景的风格

90后研发团队

Gen 3D的研发团队也非常年轻,基本都是由90后组成。

**Raphael Bensadoun**

Raphael Bensadoun

他毕业于特拉维夫大学,之后在两家小公司有过时间不长的工作经历,之后来到Meta成为了AI研究人员。

Raphael Bensadoun

**Tom Monnier**

Tom Monnier

他毕业于法国最好的工程师大学,然后在Tinyclues和Adobe工作了一段时间之后,进入Meta担任研究科学家。

Tom Monnier

**Filippos Kokkinos**

Filippos Kokkinos

他是Meta GenAI的研究科学家,此前曾在Facebook AI Research(FAIR)工作。他的研究以生成性深度学习为中心,特别关注视频和从文本、图像和视频生成3D的技术。在加入Meta之前他曾经在华为等公司实习过。

他博士毕业于伦敦大学学院。

Filippos Kokkinos

Meta的3D Gen的潜在应用是巨大的。游戏开发人员可以用3D Gen快速制作游戏环境和角色原型,建筑可视化公司则只需要文本描述,就能生成建筑物整体和内部的详细 3D 模型,简化设计流程。在VR/MR领域,3D Gen 可以快速创建沉浸式环境和物体,加速元宇宙应用程序的开发。AI的未来将会进一步加速。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
故事:4名游客云南参加彝族婚宴,随礼800入席,临走被住家拦住去路

故事:4名游客云南参加彝族婚宴,随礼800入席,临走被住家拦住去路

卡西莫多的故事
2025-06-05 10:31:37
汤姆·哈迪被曝开除?反转来了

汤姆·哈迪被曝开除?反转来了

时光慢旅人
2026-05-30 00:02:07
不满求购小蜘蛛!马竞回击巴萨:HWG,4张门票+瓜子换亚马尔

不满求购小蜘蛛!马竞回击巴萨:HWG,4张门票+瓜子换亚马尔

奥拜尔
2026-05-30 00:03:36
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
心理学上说,极度坦诚的人其实很可怕:开始,你可能觉得他傻、性子直,但慢慢会发现,他的境界极高,他的一切都可以摊开讲,打的全是明牌

心理学上说,极度坦诚的人其实很可怕:开始,你可能觉得他傻、性子直,但慢慢会发现,他的境界极高,他的一切都可以摊开讲,打的全是明牌

心理观察局
2026-05-22 07:29:28
定了!人社部正式发文!7月1日全国落地,在职、退休人员一起受益

定了!人社部正式发文!7月1日全国落地,在职、退休人员一起受益

石辰搞笑日常
2026-05-29 20:26:56
1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

犀利辣椒
2026-05-20 06:23:07
花了19万接下一个菜鸟驿站,开了三个月,收入支出跟大家伙聊聊

花了19万接下一个菜鸟驿站,开了三个月,收入支出跟大家伙聊聊

小谈食刻美食
2026-05-29 07:32:51
马英九深夜求援赵少康怕了,党内一面倒挺萧旭岑,绿营已蠢蠢欲动

马英九深夜求援赵少康怕了,党内一面倒挺萧旭岑,绿营已蠢蠢欲动

时尚的弄潮
2026-05-30 00:55:36
身份揭秘!这个潮汕女子投资《给阿嬷的情书》100万,回报有多少

身份揭秘!这个潮汕女子投资《给阿嬷的情书》100万,回报有多少

童叔不飙车
2026-05-29 11:58:24
父亲县委书记离职后,老婆和我离婚了,半年后父亲调任市委副书记

父亲县委书记离职后,老婆和我离婚了,半年后父亲调任市委副书记

千秋文化
2026-04-30 19:27:10
徐帆回应离婚几个月后,68岁冯小刚再惹争议,养女徐朵成导火索!

徐帆回应离婚几个月后,68岁冯小刚再惹争议,养女徐朵成导火索!

乡野小珥
2026-05-18 08:58:28
原来洗钱这件事一直都贴近生活!网友:手段变化多端,长见识了

原来洗钱这件事一直都贴近生活!网友:手段变化多端,长见识了

另子维爱读史
2026-05-27 07:52:25
马刺118-91大胜雷霆!文班创80年NBA纪录,前无古人

马刺118-91大胜雷霆!文班创80年NBA纪录,前无古人

篮球大视野
2026-05-29 11:15:30
百万粉丝网红边牧被人“顺走”,以180元转卖遭宰杀:陌生男女将狗强行带走,称“以为没人要”,4元一斤卖了,目前警方已立案

百万粉丝网红边牧被人“顺走”,以180元转卖遭宰杀:陌生男女将狗强行带走,称“以为没人要”,4元一斤卖了,目前警方已立案

大风新闻
2026-05-29 09:54:19
竟然全胜,国羽6席闯入新加坡公开赛4强,大概能拿1冠

竟然全胜,国羽6席闯入新加坡公开赛4强,大概能拿1冠

真理是我亲戚
2026-05-29 22:50:35
海口一名26岁教师在赛课时疑因过度劳累猝死,校方:正在按工伤处理;当地教育局已介入调查

海口一名26岁教师在赛课时疑因过度劳累猝死,校方:正在按工伤处理;当地教育局已介入调查

台州交通广播
2026-05-29 22:27:19
Jennie秘恋陆顶流明星找到了! 网比对时间线…认证「唯一顶流」

Jennie秘恋陆顶流明星找到了! 网比对时间线…认证「唯一顶流」

ETtoday星光云
2026-05-29 18:27:05
爸爸梦到已故儿子说脚被刺扎了,立马驱车来到孩子墓前,眼前的一幕让人惊呆了!

爸爸梦到已故儿子说脚被刺扎了,立马驱车来到孩子墓前,眼前的一幕让人惊呆了!

张晓磊
2026-04-10 11:24:23
领馆回应23岁中国女子在新西兰失联:正与家属警方保持沟通

领馆回应23岁中国女子在新西兰失联:正与家属警方保持沟通

南方都市报
2026-05-29 15:02:21
2026-05-30 02:15:00
36氪 incentive-icons
36氪
让一部分人先看到未来
151528文章数 2848779关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

数码
游戏
艺术
手机
教育

数码要闻

宏碁推多款游戏新品:两款笔记本、一款串流掌机,还有键盘、背包

Sky&Infi领衔参赛!2026 GG全能王赛重磅开启,7月线下决战

艺术要闻

吴湖帆小品册页

手机要闻

自研OS+玄戒+AI大模型,小米18系列,稳了!

教育要闻

山东省家庭教育志愿服务总队公益大讲堂胶州巡讲落幕

无障碍浏览 进入关怀版