网易首页 > 网易号 > 正文 申请入驻

MIT的新方法让3D建模变得简单又有趣

0
分享至

制作 VR、电影和工程设计等所需的逼真 3D 模型通常是一个繁琐的过程,需要大量的手动尝试与调整。

尽管生成式 AI 图像模型可以通过文本提示生成逼真的 2D 图像,从而简化艺术创作过程,但这些模型并不适用于生成 3D 形状。为了解决这一问题,研究人员最近开发出名为“Score Distillation”的技术,利用 2D 图像生成模型来创建 3D 形状,但生成的结果往往模糊或带有过度的卡通风格。

MIT 的研究人员深入探索了生成 2D 图像与 3D 形状的算法之间的关系与差异,找出了 3D 模型质量较低的根本原因。基于此,他们对 Score Distillation 进行了简单的改进,使其能够生成更加清晰、高质量的 3D 形状,这些形状的质量更接近于目前最佳的模型生成 2D 图像水平。

如上图,这些示例展示了两个不同的 3D 旋转物体:一个机器蜜蜂和一颗草莓。研究人员通过基于文本的生成式人工智能和他们的新技术生成了这些 3D 物体。

一些其他方法试图通过重新训练或微调生成式人工智能模型来解决这个问题,但这些方法通常代价高昂且耗时。

相比之下,MIT 开发的技术无需额外训练或复杂的后处理,就能生成质量相当或优于这些方法的 3D 模型。

此外,通过找到问题的根本原因,研究人员提升了对 Score Distillation 及相关技术的数学理解,为未来进一步提升性能打下了基础。

“现在我们知道了努力的方向,这使我们能够找到更高效、更快速且质量更高的解决方案。”该技术相关论文的第一作者、电子工程与计算机科学研究生 Artem Lukoianov 说道,“从长远来看,我们的研究可以帮助将这一过程转变为设计师的辅助工具,让创建更加真实的 3D 形状变得更简单。”

Lukoianov 的合作者包括牛津大学研究生 Haitz Sáez de Ocáriz Borde、MIT-IBM Watson AI Lab 研究科学家 Kristjan Greenewald、丰田研究院科学家 Vitor Campagnolo Guizilini、Meta 研究科学家 Timur Bagautdinov,以及两位资深作者:MIT 电子工程与计算机科学助理教授、计算机科学与人工智能实验室(CSAIL)场景表示小组负责人 Vincent Sitzmann,以及 CSAIL 几何数据处理小组负责人、电子工程与计算机科学副教授 Justin Solomon。该研究将在NeurIPS上发表。

从 2D 图像到 3D 形状

扩散模型(如 DALL-E)是一种生成式 AI 模型,可以从随机噪声中生成逼真的图像。为了训练这些模型,研究人员向图像中添加噪声,然后教模型逆向处理以去除噪声。模型利用这一学习到的“去噪”过程,根据用户的文本提示生成图像。

然而,扩散模型在直接生成真实的 3D 形状时表现不佳,因为可用于训练的 3D 数据不足。为了解决这一问题,研究人员在 2022 年开发了一种名为 Score Distillation Sampling (SDS) 的技术,利用预训练的扩散模型将多个 2D 图像结合成 3D 表示。

该技术从一个随机的 3D 表示开始,先从随机相机角度渲染出所需物体的 2D 视图,再向该图像添加噪声,然后使用扩散模型去噪,并优化初始的 3D 表示,使其更接近去噪后的图像。研究人员重复这一过程,直到生成目标 3D 物体。

然而,通过这种方式生成的 3D 形状往往显得模糊或颜色过饱和。

“这一瓶颈问题已经存在了一段时间。我们知道底层模型本身能够表现得更好,但人们一直不明白为什么在处理 3D 形状时会出现这种问题。”MIT 研究生 Artem Lukoianov 解释道。

MIT 研究人员深入研究了 SDS 的每一步骤,并发现了一个关键公式与 2D 扩散模型的对应部分存在不匹配。这个公式决定了模型如何通过一步步添加和去除噪声,更新随机表示,使其更接近目标图像。

由于公式的一部分涉及一个复杂的方程,难以高效求解,SDS 用每一步随机采样的噪声代替了该方程。但 MIT 研究人员发现,正是这种随机噪声导致了模糊或卡通化的 3D 形状。

巧妙的近似解法

研究人员没有尝试精确求解这一复杂公式,而是测试了多种近似技术,最终找到了最佳方案。他们的方法并非随机采样噪声项,而是通过当前 3D 形状的渲染结果推断出缺失的噪声项。

“通过这样做,正如论文中的分析所预测的那样,我们能够生成清晰、逼真的 3D 形状。”Lukoianov 解释道。

此外,研究人员还提高了图像渲染的分辨率,并调整了一些模型参数,进一步提升了 3D 形状的质量。

最终,他们利用现成的预训练图像扩散模型,无需昂贵的重新训练,就能创建平滑且逼真的 3D 形状。生成的 3D 物体在清晰度上与依赖特定解决方案的其他方法相当。

“如果只是盲目地调整不同参数,有时有效,有时无效,但你不知道原因所在。而现在,我们明确了需要解决的方程,这让我们可以思考更高效的求解方式。”Lukoianov 说道。

由于他们的方法依赖于预训练的扩散模型,这一模型的偏差和不足也被继承了下来,因此可能会出现幻觉现象或其他错误。改进底层扩散模型将进一步提升这一过程的效果。

除了研究如何更高效地解决这一公式,研究人员还希望探索这些见解如何改进图像编辑技术。

Artem Lukoianov 的研究得到了丰田–CSAIL 联合研究中心的资助。Vincent Sitzmann 的研究获得了美国国家科学基金会、新加坡国防科学与技术局、美国内政部以及 IBM 的支持。Justin Solomon 的研究部分由美国陆军研究办公室、国家科学基金会、CSAIL 未来数据项目、MIT–IBM Watson AI 实验室、纬创集团以及丰田–CSAIL 联合研究中心资助。

https://news.mit.edu/2024/creating-realistic-3d-shapes-using-generative-ai-1204

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
军委副主席,过去四十年来人数上的变化

军委副主席,过去四十年来人数上的变化

深度财线
2025-10-21 13:06:54
美军连夜通告全球,特朗普想通了:对中国不能来硬的,要上点手段

美军连夜通告全球,特朗普想通了:对中国不能来硬的,要上点手段

书纪文谭
2026-01-26 15:25:20
刚刚,李湘前夫王岳伦发声:什么王诗龄休学呀,什么缅北诈骗呀,各种胡说八道……

刚刚,李湘前夫王岳伦发声:什么王诗龄休学呀,什么缅北诈骗呀,各种胡说八道……

都市快报橙柿互动
2026-01-26 19:01:46
急了!俄罗斯开始用军舰为油轮护航,乌军4枚火烈鸟全部命中目标

急了!俄罗斯开始用军舰为油轮护航,乌军4枚火烈鸟全部命中目标

史政先锋
2026-01-26 21:19:31
辛纳因澳网争议性幕后一幕遭国外球迷猛烈批评:最令人讨厌的球员

辛纳因澳网争议性幕后一幕遭国外球迷猛烈批评:最令人讨厌的球员

网球之家
2026-01-26 22:16:21
重兵包抄伊朗,特朗普要打了?普京已通告俄将出手,中方也有行动

重兵包抄伊朗,特朗普要打了?普京已通告俄将出手,中方也有行动

科普100克克
2026-01-24 18:11:51
最高检认定:非夫妻关系的男女自愿同居,如果被查到之后

最高检认定:非夫妻关系的男女自愿同居,如果被查到之后

北方原创情感故事会
2026-01-26 21:58:47
解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

新华社
2026-01-24 23:03:04
古巴人饿了,就有人给粮食,我不理解,没有战争,没有内乱

古巴人饿了,就有人给粮食,我不理解,没有战争,没有内乱

忠于法纪
2026-01-26 18:44:10
上海市政府、江苏省政府、浙江省政府研究,同意全国首个跨省域高新区命名

上海市政府、江苏省政府、浙江省政府研究,同意全国首个跨省域高新区命名

新京报政事儿
2026-01-25 14:08:06
中央纪委国家监委对群众身边不正之风和腐败问题集中整治工作再动员再部署

中央纪委国家监委对群众身边不正之风和腐败问题集中整治工作再动员再部署

澎湃新闻
2026-01-26 20:45:07
从95年首登春晚至今已参演20余届,孙涛宣布不再参与春晚演出,并重申不会直播带货

从95年首登春晚至今已参演20余届,孙涛宣布不再参与春晚演出,并重申不会直播带货

潇湘晨报
2026-01-26 16:27:14
9.6万,特斯拉的车主懵了...

9.6万,特斯拉的车主懵了...

放毒
2026-01-26 17:28:57
李湘背后,赵薇、黄有龙、佘智江的跨境黑金链

李湘背后,赵薇、黄有龙、佘智江的跨境黑金链

每日一见
2026-01-26 02:35:01
这次军委的动作,让人倒吸一口凉气!直接倒查9年,这不是闹着玩

这次军委的动作,让人倒吸一口凉气!直接倒查9年,这不是闹着玩

安安说
2026-01-26 19:04:41
中国国防部向全球发出的通知,解放軍全時待战

中国国防部向全球发出的通知,解放軍全時待战

扶苏聊历史
2026-01-26 09:52:08
A股:紧急提醒2.5亿股民!从明天起,或许历史总是惊人的相似!

A股:紧急提醒2.5亿股民!从明天起,或许历史总是惊人的相似!

云鹏叙事
2026-01-26 16:31:28
友尽赛!海港0-6俄超豪门 派3外援先发仍遭打爆 4天2次交手丢10球

友尽赛!海港0-6俄超豪门 派3外援先发仍遭打爆 4天2次交手丢10球

我爱英超
2026-01-26 18:13:04
14岁陈佳铭已昏迷超30天,上海专家会诊后,确认无生还希望

14岁陈佳铭已昏迷超30天,上海专家会诊后,确认无生还希望

离离言几许
2026-01-26 16:15:54
连丢2球!国足2-2被亚洲第五绝平 一国脚犯规染红 邵佳一3场不败

连丢2球!国足2-2被亚洲第五绝平 一国脚犯规染红 邵佳一3场不败

侃球熊弟
2026-01-26 21:26:26
2026-01-27 04:19:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16180文章数 514548关注度
往期回顾 全部

科技要闻

印奇再上牌桌,阶跃融资50亿

头条要闻

印度尼帕病毒现跨区域传播 世卫:或引起全球大流行

头条要闻

印度尼帕病毒现跨区域传播 世卫:或引起全球大流行

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被抵制成功!辽视春晚已将她除名

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

教育
艺术
亲子
本地
健康

教育要闻

武汉燃气热力学校有艺考吗?答案揭晓!

艺术要闻

沙特急刹车,NEOM规模大缩水,线性摩天楼留小段

亲子要闻

“生孩子老了就这下场”,母亲用按摩机被女儿网暴,网友看不下去

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

耳石脱落为何让人天旋地转+恶心?

无障碍浏览 进入关怀版