网易首页 > 网易号 > 正文 申请入驻

3D领域「源神」又开了两个新项目:三维部件编辑与自动绑定框架

0
分享至

在不久之前机器之心报道文章《3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目》中,我们曾介绍到,国内专注于构建通用 3D 大模型的创业公司 VAST 将持续开源一系列 3D 生成项目。

近日,新的开源项目它来了,包括针对任意三维模型生成完整可编辑部件的HoloPart与通用自动绑定框架UniRig

今天,就让我们一起围观下这两个新的3D开源项目。

HoloPart:为任意三维模型生成完整、可编辑的部件

  • 论文标题:HoloPart: Generative 3D Part Amodal Segmentation
  • 论文地址: https://arxiv.org/abs/2504.07943
  • 项目主页: https://vast-ai-research.github.io/HoloPart
  • 代码地址: https://github.com/VAST-AI-Research/HoloPart
  • Demo: https://huggingface.co/spaces/VAST-AI/HoloPart
  • huggingface daily paper:https://huggingface.co/papers/2504.07943

3D 内容生产面临的一个关键痛点,是三维模型的部件及编辑挑战

你是否曾尝试编辑网上下载的、扫描得到的、或是 AI 生成的三维模型?它们往往是「一整坨」的几何体,想要调整、驱动或重新赋予某个独立部件(比如椅子腿、角色眼镜)不同的材质都极其困难。

现有的三维部件分割技术能识别出属于不同部件的可见表面块,但往往得到的是破碎、不完整的碎片,这极大地限制了它们在实际内容创作中的应用价值。

HoloPart 引入了一项新任务:三维部件完整语义分割(3D Part Amodal Segmentation)——它不仅是将三维形状分解为可见的表面块,而是分解成其背后完整的、包含语义信息的部件,甚至能推断出被遮挡部分的几何结构,即使部分被遮挡也能生成完整部件。

开发者可以在huggingface上试玩。

「看见」完整部件

HoloPart是一种新型扩散模型,由 VAST 和港大联合研发。受到非模式化感知(Amodal Perception,即人类即使在物体部分被遮挡时也能感知到完整物体的能力)的启发,研究团队通过一个实用的两阶段方法来实现:

  • 初始分割:首先,利用现有的先进方法(如 SAMPart3D)获得初始的表面块(即不完整的部件)。
  • HoloPart 部件补全:这是关键所在。将不完整的部件块,连同整个形状的上下文信息一起,输入到新颖的 HoloPart 模型中。HoloPart 基于强大的扩散变换器(Diffusion Transformer)架构,能够生成该部件完整且合理的 3D 几何形状。

HoloPart 工作原理

HoloPart 不仅仅是「填补空洞」。它基于 TripoSG 三维生成基础模型的生成先验构建,通过在大型数据集(如 Objaverse)上进行广泛预训练,并在部件 - 整体数据上进行专门微调,从而获得了对三维几何的深刻理解。

针对部件补全这一特定任务,HoloPart 对 TripoSG 的扩散变换器架构进行了适配。其关键创新在于双重注意力机制

  • 局部注意力(Local Attention):聚焦于输入表面块的精细几何细节,确保补全后的部件与可见几何无缝衔接。
  • 上下文感知注意力(Context - Aware Attention):关注整体形状以及该部件在其中的位置。这一关键步骤确保补全的部件在全局上是合理的——保持比例、语义和整体形状的一致性。

这使得 HoloPart 能够智能地重建隐藏的几何细节,即使对于复杂部件或存在严重遮挡的情况,也能尊重物体的整体结构。

在该项目中,研究团队还利用 ABO 和 PartObjaverse - Tiny 数据集建立了新的基准测试来评估这项新任务。实验证明,在处理这种具有挑战性的部件补全任务时,HoloPart 的性能显著优于现有的各种先进形状补全方法。

从效果上看,差异是肉眼可见的:其他方法在处理复杂结构时常常失败或产生不连贯的结果,而 HoloPart 则能持续生成高质量、高保真的完整部件,并与原始形状完美契合。

解锁下游应用

通过生成完整的部件,HoloPart 解锁了一系列以前难以甚至无法自动实现的强大应用:

  • 直观编辑:轻松抓取、缩放、移动或替换完整部件(如图中的戒指、图中的汽车编辑)。
  • 便捷的材质分配:将纹理或材质清晰地赋予给完整的组件。
  • 适用于动画的资产:生成适合绑定和动画制作的部件。
  • 更智能的几何处理:通过处理连贯的部件,实现更鲁棒的网格重划分 (Remeshing) 等几何操作。
  • 部件感知的生成:这项工作为未来能够在部件层面创建或操纵三维形状的生成模型奠定了基础。
  • 几何超分辨率:HoloPart 甚至展示了通过用高数量的 token 来表征部件,从而提升部件细节的潜力。

统一模型绑定万物:UniRig 通用自动绑定框架

  • 论文标题:One Model to Rig Them All: Diverse Skeleton Rigging with UniRig
  • 论文链接:https://zjp-shadow.github.io/works/UniRig/static/supp/UniRig.pdf
  • 代码地址:https://github.com/VAST-AI-Research/UniRig
  • 项目主页:https://zjp-shadow.github.io/works/UniRig/
  • HuggingFace 主页:https://huggingface.co/VAST-AI/UniRig

核心方法:自回归预测与创新的 Tokenization

UniRig 的核心在于借鉴了驱动语言和图像生成领域进步的大型自回归模型的力量。

但 UniRig 预测的不是像素或文字,而是 3D 骨骼的结构——逐个关节地进行预测。这种序列化的预测过程是确保生成拓扑结构有效骨骼的关键。

实现这一目标的关键创新是骨骼树 Tokenization (Skeleton Tree Tokenization)方法。

将具有复杂关节相互依赖关系的层级化骨骼结构,表示为适合 Transformer 处理的线性序列并非易事。UniRig 的方案高效地编码了:

  • 关节坐标:骨骼关节的离散化空间位置。
  • 层级结构:明确的父子关系,确保生成有效的树状结构。
  • 骨骼语义:使用特殊 Token 标识骨骼类型(例如,Mixamo 等标准模板骨骼,用于头发 / 布料模拟的动态弹簧骨骼),这对于下游任务和实现逼真动画至关重要。

这种优化的 Tokenization 方案,与朴素方法相比,序列长度减少约 30%,使得基于 OPT 架构的自回归模型能够有效地学习骨骼结构的内在模式,并以形状编码器处理后的输入模型几何信息作为条件。

不止骨骼:精准蒙皮与属性预测

在预测出有效的骨骼后,UniRig 采用骨骼 - 表面交叉注意力 (Bone - Point Cross Attention)机制来预测每个顶点的蒙皮权重。该模块有效地捕捉了每根骨骼对其周围模型表面的复杂影响,融合了来自模型和骨骼的几何特征,并通过关键的测地线距离信息增强了空间感知能力。

此外,UniRig 还能预测骨骼特定属性(如弹簧骨骼的刚度和重力影响),使得基于学习参数的、更符合物理规律的次级运动成为可能。研究团队在训练中通过可微分的物理模拟对此进行了评估,以增强最终结果的真实感。

Rig - XL 数据集:以数据驱动泛化能力

强大的模型离不开高质量数据的支撑。为了训练 UniRig 以获得广泛的适用性,研究团队还整理构建了Rig-XL——一个全新的、包含超过 14000 个多样化已绑定 3D 模型的大规模数据集。

Rig - XL 源自 Objaverse - XL 等资源并经过精心清洗,涵盖多个类别(双足、四足、鸟类、昆虫、静态物体等),为训练一个真正具备泛化能力的绑定模型提供了必要的规模和多样性。研究团队还利用 VRoid 数据集进一步优化模型在处理包含弹簧骨骼的精细动漫风格角色上的性能。

业界最优的性能表现

UniRig 显著提升了自动绑定技术的现有水平:

  • 高精度:在多个关键指标上远超现有学术界和商业方法,在具有挑战性数据集上,绑定精度(关节预测)提升 215%,动画精度(动画下的网格变形)提升 194%。
  • 强通用性:在广泛的模型类别上展现出鲁棒性能——精细角色、动物、复杂的有机和无机形态——这些都是以往方法经常遇到困难的领域。
  • 高鲁棒性:生成拓扑合理的骨骼和真实的蒙皮权重,在动画驱动下产生优于先前学术方法及常用商业工具的变形效果。
  • 高效率:优化的 Tokenization 和模型架构带来了实用的推理速度(1-5 秒)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
25万人将涌入,印度首次举办超大规模AI峰会

25万人将涌入,印度首次举办超大规模AI峰会

第一财经资讯
2026-02-17 16:12:00
98元涨到963元,最近价格飞涨近十倍,网友直呼离谱!有的已突破2000元

98元涨到963元,最近价格飞涨近十倍,网友直呼离谱!有的已突破2000元

浙江之声
2026-02-17 17:35:40
飞虎队”再现乌克兰天空,美国撕下面具强行干涉匈牙利大选

飞虎队”再现乌克兰天空,美国撕下面具强行干涉匈牙利大选

史政先锋
2026-02-17 20:22:20
除夕过年,很多家庭已经开始吵架了!

除夕过年,很多家庭已经开始吵架了!

黯泉
2026-02-16 21:35:48
住建部已查清全国房子数量,过剩问题有多严重?楼市或迎来新变局

住建部已查清全国房子数量,过剩问题有多严重?楼市或迎来新变局

猫叔东山再起
2026-02-15 11:30:03
90后男生春节爆赚16万元!每天只睡3小时,这种新职业爆火

90后男生春节爆赚16万元!每天只睡3小时,这种新职业爆火

大风新闻
2026-02-17 19:37:12
气急败坏!韩媒:林孝埈500米绊住了韩国的脚 黄大宪林钟彦无缘夺金

气急败坏!韩媒:林孝埈500米绊住了韩国的脚 黄大宪林钟彦无缘夺金

818体育
2026-02-17 21:05:40
心酸!三兄弟一起过年不买菜后续: 父母含泪要求分家,当事人发声

心酸!三兄弟一起过年不买菜后续: 父母含泪要求分家,当事人发声

离离言几许
2026-02-17 09:17:27
0.09秒奇迹!中国队再创历史,吴宇喜极而泣,李琰疯狂庆祝

0.09秒奇迹!中国队再创历史,吴宇喜极而泣,李琰疯狂庆祝

奥拜尔
2026-02-17 23:50:31
“罗翔夹着尾巴逃跑了”,攻击智者罗翔并显得你们多聪明

“罗翔夹着尾巴逃跑了”,攻击智者罗翔并显得你们多聪明

廖保平
2026-02-16 09:43:16
创历史!韩旭25分钟狂轰25+14+4帽 率队2-0进WNBL总决赛

创历史!韩旭25分钟狂轰25+14+4帽 率队2-0进WNBL总决赛

醉卧浮生
2026-02-17 17:51:23
台湾震传媒民调:63.5%的受访民众不接受郑丽文的身份认同主张

台湾震传媒民调:63.5%的受访民众不接受郑丽文的身份认同主张

总在茶余后
2026-02-16 23:18:17
天后老矣!王菲被骂上热搜,歌词曲皆非佳作,唱功掉线,堪称最差

天后老矣!王菲被骂上热搜,歌词曲皆非佳作,唱功掉线,堪称最差

火山詩话
2026-02-17 08:08:50
春晚飘过40载,今年春晚尤其难看

春晚飘过40载,今年春晚尤其难看

凤眼论
2026-02-16 22:50:18
一个非常不好的消息:中国超2亿独生子女面临的非常严峻问题。

一个非常不好的消息:中国超2亿独生子女面临的非常严峻问题。

百态人间
2026-02-05 15:39:14
去年脑血栓,今年后空翻,中国机器人已远超美国?别被骗了!

去年脑血栓,今年后空翻,中国机器人已远超美国?别被骗了!

传心财经
2026-02-17 19:24:42
江苏一老板给全村70岁以上老人发红包,派发红包的场面持续了近两个小时,总额达163500元;有老人已连续领14年红包:“比亲儿子还要亲”

江苏一老板给全村70岁以上老人发红包,派发红包的场面持续了近两个小时,总额达163500元;有老人已连续领14年红包:“比亲儿子还要亲”

大风新闻
2026-02-17 19:26:08
208850元!宇树科技春晚同款机器人上架,不支持7天无理由退货

208850元!宇树科技春晚同款机器人上架,不支持7天无理由退货

封面新闻
2026-02-17 15:47:18
金正恩同志:奶粉和乳制品是给孩子喝的

金正恩同志:奶粉和乳制品是给孩子喝的

微微热评
2026-02-17 21:26:49
鲁比奥再就对华关系表态:若美中没有交流互动,那将是疯狂的

鲁比奥再就对华关系表态:若美中没有交流互动,那将是疯狂的

环球网资讯
2026-02-17 17:25:54
2026-02-18 03:35:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12314文章数 142567关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

健康
家居
手机
教育
公开课

转头就晕的耳石症,能开车上班吗?

家居要闻

中古雅韵 乐韵伴日常

手机要闻

苹果春季发布会?邀请函曝光,大量新品蓄势待发

教育要闻

马跃新春|南师附中、金陵中学、一中、中华、十三中.....南京校长书记拜年合集!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版