今天腾讯更新开源了Hunyuan3D 2.0,一款先进的大规模3D合成系统,用于生成高分辨率的带纹理3D资产。此外,还开发了Hunyuan3D-Studio,一个功能丰富且用户友好的生产平台,简化了3D资产的再创作过程。无论是专业用户还是业余爱好者,都能高效地操作甚至为网格添加动画。团队对模型进行了系统评估,结果显示Hunyuan3D 2.0在几何细节、条件对齐、纹理质量等方面,均优于现有的最先进模型,包括开源和闭源模型。(链接在文章底部)
该系统包含两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理合成模型Hunyuan3D-Paint。形状生成模型基于可扩展的流式扩散变换器构建,旨在生成与给定条件图像高度对齐的几何形状,为后续应用奠定坚实基础。而纹理合成模型则通过强大的几何和扩散先验知识,为生成或手工制作的网格提供高分辨率且生动的纹理贴图。
01 技术原理
Hunyuan3D 2.0架构包含两个主要组件:Hunyuan3D-DiT负责从给定的输入图像生成基础网格,Hunyuan3D-Paint负责为生成的基础网格生成纹理贴图。Hunyuan3D-Paint 以几何条件(生成网格的法线贴图和位置贴图)为输入,生成用于纹理烘焙的多视角图像。![]()
Hunyuan3D-Paint :利用一个图像去光模块将输入图像转换为无光照状态,从而生成光照不变的纹理贴图。系统采用双流图像条件参考网络,为模型提供准确的条件图像特征。同时,该设计有助于生成与输入图像高度一致的纹理贴图。多任务注意力模块确保模型合成的图像在多视角下保持一致性。该模块在生成所有图像时保持一致性,同时严格遵循输入图像的特征。
Hunyuan3D-DiT :它采用了包含双流和单流模块的变换器架构。该设计增强了形状与图像模态之间的交互,帮助模型生成高质量的基础网格。(注意:橙色模块没有可学习参数,蓝色模块包含可训练参数,灰色模块表示由更多细节组成的模块。)
02 实际效果与对比
将 Hunyuan3D 2.0 与其他开源和闭源的3D生成方法进行了评估。数值结果表明,Hunyuan3D 2.0 在生成的带纹理3D资产质量和条件遵循能力方面超越了所有基准方法。
https://github.com/Tencent/Hunyuan3D-2
https://3d.hunyuan.tencent.com/
https://github.com/Tencent/Hunyuan3D-2/blob/main/assets/report/Tencent_Hunyuan3D_2_0.pdf欢迎交流~,带你学习AI,了解AI
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.