网易首页 > 网易号 > 正文 申请入驻

Transformer变革3D建模,MeshGPT生成效果惊动专业建模师

0
分享至

机器之心报道

机器之心编辑部

连续「预测下一个 token」能生成句子,同理,连续「预测下一个三角形网格」也能生成 3D 模型。

在计算机图形学中,「三角形网格」是 3D 几何物体的主要表现形式,也是游戏、电影和 VR 界面中主要使用的 3D 资产表示方法。业界通常基于三角形网格来模拟复杂物体的表面,如建筑、车辆、动物,常见的几何变换、几何检测、渲染着色等动作,也需要基于三角形网格进行。

与点云或体素等其他 3D 形状表示法相比,三角形网格提供了更连贯的表面表示法:更可控、更易操作、更紧凑,可直接用于现代渲染流水线,以更少的基元获得更高的视觉质量。



此前,已有研究者尝试过使用体素、点云和神经场等表示方法生成 3D 模型,这些表示也需要通过后处理转换成网格以在下游应用中使用,例如使用 Marching Cubes 算法进行 iso-surfacing 处理。

遗憾的是,这样做的结果是网格密度过高、网格划分过细,经常出现过度平滑和等值曲面化带来的凹凸不平的错误,如下图所示:



相比之下,3D 建模专业人员建模的 3D 网格在表示上更加紧凑,同时以更少的三角形保持了清晰的细节。

一直以来,很多研究者都希望解决自动生成三角形网格的任务,以进一步简化制作 3D 资产的流程。

在最近的一篇论文中,研究者提出了新的解决方案:MeshGPT,将网格表示直接生成为一组三角形。



论文链接:https://nihalsid.github.io/mesh-gpt/static/MeshGPT.pdf

受语言生成模型 Transformer 的启发,他们采用了一种直接序列生成方法,将三角形网格合成为三角形序列。

按照文本生成的范式,研究者首先学习了三角形词汇,三角形被编码为潜在量化嵌入。为了鼓励学习到的三角形嵌入保持局部几何和拓扑特征,研究者采用了图卷积编码器。然后,这些三角形嵌入由 ResNet 解码器解码,该解码器将其处理表示三角形的 token 序列,生成三角形的顶点坐标。最终,研究者在所学词汇的基础上训练基于 GPT 的架构,从而自动生成代表网格的三角形序列,并获得了边缘清晰、高保真度的优势。

在 ShapeNet 数据集上进行的多个类别的实验表明,与现有技术相比,MeshGPT 显著提高了生成 3D 网格的质量,形状覆盖率平均提高了 9%,FID 分数提高了 30 个点。



在社交媒体平台上,MeshGPT 也引发了热议:

有人说:「这才是真正革命性的 idea。」



一位网友指出,该方法的亮点在于克服了其他 3D 建模方法的最大障碍,即编辑能力。



有人大胆预测,或许每一个自上世纪 90 年代以来尚未解决的难题,都可以从 Transformer 中得到启发:



也有从事 3D / 电影制作相关行业的用户对自己的职业生涯表示担忧:



不过,也有人指出,从论文给出的生成示例来看,这一方法还未达到大规模落地的阶段,一位专业建模人员完全可以在 5 分钟内制作出这些网格。



这位评论者表示,下一步可能是由 LLM 控制 3D 种子的生成,并将图像模型添加到架构的自回归部分。走到这一步后,游戏等场景的 3D 资产制作才能实现大规模的自动化。

接下来,就让我们看看 MeshGPT 这篇论文的研究细节。

方法概述

受大语言模型进步的启发,研究者开发了一种基于序列的方法,将三角形网格作为三角形序列进行自回归生成。这种方法能生成干净、连贯和紧凑的网格,具有边缘锐利和高保真的特点。



研究者首先从大量的 3D 物体网格中学习几何词汇的嵌入,从而能够对三角形进行编码和解码。然后,根据学习到的嵌入词库,以自回归下索引预测的方式训练用于网格生成的 Transformer。



为了学习三角形词汇,研究者采用了图形卷积编码器,对网格的三角形及其邻域进行操作,以提取丰富的几何特征,捕捉 3D 形状的复杂细节。这些特征通过残差量化被量化为 codebook 中的 Embedding,从而有效减少了网格表示的序列长度。这些内嵌信息在排序后,在重建损失的指导下,由一维 ResNet 进行解码。这一阶段为 Transformer 的后续训练奠定了基础。

然后,研究者利用这些量化的几何嵌入,训练出一个 GPT 类型的纯解码器 transformer。给定从网格三角形中提取的几何嵌入序列,训练 transformer 来预测序列中下一个嵌入的 codebook 索引。

训练完成后,transformer 可以自回归采样,以预测嵌入序列,然后对这些嵌入进行解码,生成新颖多样的网格结构,显示出与人类绘制的网格类似的高效、不规则三角形。





MeshGPT 采用图卷积编码器处理网格面,利用几何邻域信息捕捉表征 3D 形状复杂细节的强特征,然后利用残差量化方法将这些特征量化成 codebook 嵌入。与简单的向量量化相比,这种方法能确保更好的重建质量。在重建损失的指导下,MeshGPT 通过 ResNet 对量化后的嵌入进行排序和解码。





该研究使用 Transformer 从预先学习的 codebook 词汇中生成网格序列作为 token 索引。在训练过程中,图形编码器会从网格面提取特征,并将其量化为一组面嵌入。这些嵌入会被扁平化,用开始和结束 token 进行标记,然后送入上述 GPT 类型的 transformer。该解码器通过交叉熵损失进行优化,预测每个嵌入的后续 codebook 索引。

实验结果

该研究将 MeshGPT 与常见的网格生成方法进行了比较实验,包括:

  • Polygen,通过首先生成顶点,然后生成以顶点为条件的面来生成多边形网格;
  • BSPNet,通过凸分解来表征网格;
  • AtlasNet,将 3D 网格表征为多个 2D 平面的变形。

此外,该研究还将 MeshGPT 与基于神经场的 SOTA 方法 GET3D 进行了比较。



如图 6、图 7 和表 1 所示,在全部的 4 个类别中,MeshGPT 都优于基线方法。MeshGPT 可以生成尖锐、紧凑的网格,并具有较精细的几何细节。

具体来说,与 Polygen 相比,MeshGPT 能生成具有更复杂细节的形状,并且 Polygen 在推理过程中更容易积累错误;AtlasNet 经常出现折叠瑕疵(folding artifact),导致多样性和形状质量较低;BSPNet 使用平面的 BSP 树往往会产生具有不寻常三角测量模式的块状形状;GET3D 可生成良好的高层次形状结构,但三角形过多,且平面不完美。







如表 2 所示,该研究还让用户对 MeshGPT 生成网格的质量进行了评估,在形状和三角测量质量方面,MeshGPT 明显优于 AtlasNet、Polygen 和 BSPNet。与 GET3D 相比,大多数用户更喜欢 MeshGPT 生成的形状质量(68%)和三角测量质量(73%)。



形状新颖性。如下图 8 所示,MeshGPT 能生成超出训练数据集的新奇形状,确保模型不仅仅是检索现有形状。





形状补全。如下图 9 所示,MeshGPT 还可以基于给定的局部形状推断出多种可能的补全,生成多种形状假设。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
降薪850万,重签快船!管理层后悔莫及,哈登也再一次看走了眼

降薪850万,重签快船!管理层后悔莫及,哈登也再一次看走了眼

呆哥聊球
2024-04-27 16:21:10
《浪姐5》出事了!29岁女星「高空惨摔骨裂」首发声逼哭粉丝

《浪姐5》出事了!29岁女星「高空惨摔骨裂」首发声逼哭粉丝

阿芒娱乐说
2024-04-27 10:25:50
真会享受!辽篮郭艾伦和妈妈在西班牙做美容,和美女粉丝帅气合影

真会享受!辽篮郭艾伦和妈妈在西班牙做美容,和美女粉丝帅气合影

体坛热消息
2024-04-27 11:51:20
人民网评:“凡”星不凡 微光成炬

人民网评:“凡”星不凡 微光成炬

人民网
2024-04-27 08:56:25
为什么广东队这一次进入四强后如此开心

为什么广东队这一次进入四强后如此开心

广东宏远球迷会
2024-04-27 08:03:18
原来医生说的这些话都是暗示!网友分享亲身经历,我恍然大悟

原来医生说的这些话都是暗示!网友分享亲身经历,我恍然大悟

今日养生之道
2024-04-27 12:26:39
here we go!罗马诺:费耶诺德主帅斯洛特将执教利物浦,接替渣叔

here we go!罗马诺:费耶诺德主帅斯洛特将执教利物浦,接替渣叔

直播吧
2024-04-27 03:56:27
军中色虎谷俊山,贪污300亿,无人敢动,背靠两大保护伞,被判死缓

军中色虎谷俊山,贪污300亿,无人敢动,背靠两大保护伞,被判死缓

天闻地知
2024-04-25 17:15:16
林更新正面回应与赵丽颖爱情:确定不是在“玩弄赵丽颖”!

林更新正面回应与赵丽颖爱情:确定不是在“玩弄赵丽颖”!

默默有话说
2024-04-27 12:42:22
抢黄金变成卖金潮,有人爆赚近14万元!回收商直喊苦:跌太快,头晚收的到早上就亏2万,已被套好几十万

抢黄金变成卖金潮,有人爆赚近14万元!回收商直喊苦:跌太快,头晚收的到早上就亏2万,已被套好几十万

每日经济新闻
2024-04-26 00:19:43
常德市委书记调整

常德市委书记调整

新京报政事儿
2024-04-26 18:11:09
编外人员清退问题愈发棘手:上级要求必须清退,下面表示难以完成

编外人员清退问题愈发棘手:上级要求必须清退,下面表示难以完成

弱肉强食法则
2024-04-26 17:37:09
42岁谢娜又怀孕了?大肚子带3个女儿逛商场,孕态十足!

42岁谢娜又怀孕了?大肚子带3个女儿逛商场,孕态十足!

永不后退
2024-04-25 10:09:34
“生理需求”极为旺盛的女性,5个地方能看出来,男人表示很受用

“生理需求”极为旺盛的女性,5个地方能看出来,男人表示很受用

闻心品阁
2024-04-24 09:00:24
PDD再造“神迹”!苹果灵动岛上弹广告,库克也拿它没办法?

PDD再造“神迹”!苹果灵动岛上弹广告,库克也拿它没办法?

热点科技
2024-04-26 11:12:33
妹妹被局长开除后摆地摊,五年后,哥哥调来担任市委书记

妹妹被局长开除后摆地摊,五年后,哥哥调来担任市委书记

乔生桂
2024-04-20 19:44:55
当老师不吃香了?厦门教师招聘疑因取消编制无人报考,官方回应了

当老师不吃香了?厦门教师招聘疑因取消编制无人报考,官方回应了

阿蒙聊教育
2024-04-26 21:13:21
血赚1.27亿欧!难怪巴萨留下哈维,五大天才出炉,高层笑纳大礼

血赚1.27亿欧!难怪巴萨留下哈维,五大天才出炉,高层笑纳大礼

祥谈体育
2024-04-27 16:24:01
广东外援沃特斯骑电动车未戴头盔被交警拦下,朱芳雨:该罚款

广东外援沃特斯骑电动车未戴头盔被交警拦下,朱芳雨:该罚款

懂球帝
2024-04-27 10:28:13
李铁再曝猛料,江津落网细节曝光,两爱好曝光,哥哥拒打假球退役

李铁再曝猛料,江津落网细节曝光,两爱好曝光,哥哥拒打假球退役

东球弟
2024-04-26 17:11:31
2024-04-27 17:14:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8934文章数 141895关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

亲子
教育
本地
时尚
军事航空

亲子要闻

看看这可爱的人类幼崽

教育要闻

教育观察:高比例体制内就业,这所大学录取分连涨8年!

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

70后的女人,推荐你尝试一下“轻熟”穿搭,简约、舒适、优雅

军事要闻

佩洛西称俄在支持"挺巴"的美国反战学生 扎哈罗娃回应

无障碍浏览 进入关怀版