一、细节,让三维世界栩栩如生
明代匠人,于一粒核桃之上游刃有余,雕琢万千气象。指尖方寸,承载着人类对微观世界的终极挑战。世纪流转,当 2025 年“造好物”缔造的第一支高解析力镜头划破尘埃,人类才真正拥有了记录这些微观精妙的钥匙。从指尖雕琢到科技凝视,对细节与精度的追求,是人类永不停息的自我突破。此刻,我们划下新的刻度:Sparc3D——融合人工智能之力的超高精度 3D 生成大模型。它超越镜头的捕捉,以数字之名,把古人核雕的神技带回现实。
那么,造好物究竟凭借何等妙手,掀起这场数字魔法的狂澜?一切,皆源于“细节”。微观纹路宛如匠人指尖的低语,是三维模型的“灵魂之钥”;若将其轻易剥离,所有的几何体只剩下无神的空壳,难以触动人心。而过去的 3D 生成技术,在数据流转与压缩的迷宫中,不断丢失关键信息,留下的不过是粗糙的轮廓与单薄的肌理,让建模师的匠心难以施展,效率亦受桎梏。如今,造好物倾力打造的 Sparc3D,以人工智能为凿,以千亿参数为砧,首创单图送入、1536 分辨率雕刻级 3D 模型直出,精微肌理与微观结构得到前所未有的还原。权威测评表明,Sparc3D 的加持可将建模效率平均提升 90% 以上,之前数天的劳心伤神,现在只需几个小时,便能让每一缕纹理都重获生命。下面,就让我们进入硬核的技术解析。
二、模型原理介绍
Sparcubes:稀疏可变形网格立方体
原理:将输入网格的符号距离函数(Signed Distance Function)与变形场统一散列到一个稀疏立方体结构上。每个非空立方体单元(sparse cube)都携带该区域的细节信息,支持任意拓扑表面。
优势:避免了密集体素网格的立方级复杂度,稀疏结构下保持高分辨率(1536³)表面表达;通过可微优化接口,可端到端调整形状,进一步利用2D视觉监督强化细节
2.Sparconv-VAE:稀疏卷积变分自编码器
原理:我们设计了一种完全基于稀疏卷积网络的,输入输出信息完全相同的3D VAE,无需将三维数据投影到 2D 或稠密体素,消除了潜在的模态转换误差。
优势:几乎无损的压缩模型,重建误差(Chamfer Distance)相比常规模型降低 40%。参数量小、稀疏计算减少 50% FLOPs,训练与推理成本显著下降,同时为后续的生产模型提供高质量潜空间表达。
3.大规模图生3D模型训练
基于 Sparc3D 表达,我们进行了大规模生成模型(Flow Mathcing)训练:数据规模高达数百万,在千卡集群上进行了为期数周的训练。我们发现分辨率对细节的建模至关重要,于是我们训练出1536分辨率的大模型,达到了史无前例的细节生成能力。
三、效果展示
四、Math Magic—数字赋能现实之美
Math Magic 致力于打造数字世界与现实世界的桥梁,用顶尖 AI 技术推动制造业升级。在 3D 生成领域,我们不断突破表达瓶颈,让数字模型更具真实世界的微观质感。Sparc3D的问世,将进一步提升产品建模效率、加速工业制造流程,并为游戏、影视等多场景应用注入前所未有的细节生机。
Huggingface 体验链接:
论文链接:
更多案例请看项目主页:
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.