网易首页 > 网易号 > 正文 申请入驻

阶跃星辰×光影焕像联合打造超强3D生成引擎Step1X-3D!

0
分享至

阶跃星辰携手光影焕像发布并开源 3D 大模型 ——Step1X-3D。Step1X-3D 模型总参数量达 4.8B(几何模块 1.3B,纹理模块 3.5B),凭借坚实的数据基础与先进的 3D 原生架构,可生成高保真、可控的 3D 内容。

Step1X-3D 不止于视觉「好看」,更追求实现「好用」与「可控」,旨在为 3D 内容创作提供强大而可靠的技术引擎。这款模型可以广泛应用在游戏娱乐、影视与动画制作、工业制造与设计等各种场景。

Step1X-3D 公布了完整的数据清洗策略,数据预处理策略,以及 800K 高质量的 3D 资产,3D VAE、3D Geometry Diffusion 以及 Texture Diffusion 的全链路训练代码开源,助力 3D 生成社区发展。

  • 论文标题:Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets
  • 作者:Weiyu Li, Xuanyang Zhang, Zheng Sun, Di Qi, Hao Li, Wei Cheng, Weiwei Cai, Shihao Wu, Jiarui Liu, Zihao Wang, Xiao Chen, Feipeng Tian, Jianxiong Pan,Zeming Li, Gang Yu, Xiangyu Zhang, Daxin Jiang, Ping Tan
  • 代码地址: https://github.com/stepfun-ai/Step1X-3D
  • 项目主页:https://stepfun-ai.github.io/Step1X-3D
  • HuggingFace: https://huggingface.co/stepfun-ai/Step1X-3D
  • 技术报告: https://arxiv.org/pdf/2505.07747

欢迎大家上手体验:

Online Demo(立即体验):https://huggingface.co/spaces/stepfun-ai/Step1X-3D

核心特性与技术支撑

Step1X-3D 尝试解决 3D 内容生成的关键挑战,在数据、生成质量与可控性上进行了创新实践。

1. 数据驱动与算法协同优化

好数据是好模型的基础。Step1X-3D 对超 500 万原始数据进行严格筛选与处理后,建立了包含 200 万高质量、标准化的训练样本库,有效克服了行业数据稀缺与质量参差的瓶颈。

数据处理流程示意图

此外,Step1X-3D 通过增强型网格 - SDF 转换技术等方法,从源头保障了模型学习的精准性与最终生成的高效性,让水密几何转换成功率提升了 20%,也让 Step1X-3D 拥有了强大的泛化能力与细节捕捉力。

Step1X-3D 数据筛选与 SDF 转换流程示意图

2. 3D 原生生成:结构清晰、细节生动

Step1X-3D 采用先进的 3D 原生两阶段架构,解耦几何与纹理表征,确保生成的不仅是视觉「皮囊」,更是结构可靠、可供下游应用的「骨架」,有效规避几何失真,保证生成的准确性、真实感与一致性。

Step1X-3D 的原生 3D 架构

基于 FLUX MMDiT 结构和 Rectified flow 算法直接对 3D 表示生成进行建模。

纹理生成模型基于预训练的 Diffusion model,通过单视图和 3D 几何信息指导,生成多视角一致的纹理信息。

2.1 几何塑形更精准:

几何生成的核心在于采用为3D 特性深度优化的创新混合 VAE-DiT 架构。该架构负责生成水密(Watertight)的 TSDF 内部表示,确保产出的 3D 模型结构完整、无破面漏点;同时通过引入锐利边缘采样(Sharp Edge Sampling)等技术,精准捕捉并还原物体的丰富几何细节。

几何示例:覆盖硬边与曲面结构

2.2 纹理细节更生动:

纹理生成则基于强大的 SD-XL 模型进行深度定制与优化。通过几何条件(利用法线与位置信息)的精准引导,以及潜在空间多视图同步技术,实现了与几何模块的高效协同。确保生成的纹理不仅色彩饱满、质感生动逼真,更能跨越多视图保持高度一致,与复杂三维表面精密贴合,有效避免常见的扭曲与接缝瑕疵。

纹理示例:呈现清晰一致的表面纹理

3. 控制简单、效果可调

Step1X-3D 显著提升了 3D 内容生成的可控性与易用性。其关键在于,VAE-Diffusion 整体架构在设计上与主流 2D 生成模型(如 Stable Diffusion)保持了高度一致性,从而能够无缝引入并应用成熟的 2D 控制技术(如轻量化的 LoRA 微调)。

因此用户可以对生成 3D 资产的对称性、表面细节(如锋利度、平滑度)等多种属性进行直观、精细的调控,让创作更精准地符合用户意图。

对比图 1:对称性控制效果

对比图 2:表面细节控制效果(锋利 / 平滑)

性能评估

为了客观评估 Step1X-3D 的实际效果,我们通过一个自建的综合测试,对 Step1X-3D 进行了严格的定量与定性评估,同时与多款主流模型进行全面对比。

结果显示:在自动评估中,Step1X-3D 在多项关键维度上均表现出色。

在与主流 3D 模型的对比评测中,特别是在衡量内容与输入语义一致性的核心指标 CLIP-Score 上,Step1X-3D 取得了当前所有对比模型中的最高分,为开源社区提供了极具竞争力的 3D 生成方案。

不同 3D 模型测评对比数据

团队介绍

阶跃星辰 Step1X-3D 团队和光影幻像 LightIllusions 团队。阶跃星辰以实现 AGI为目标,规划了从单模态到多模态、再到多模理解与生成统一的技术路径,最终构建世界模型的大模型公司。光影焕像是一家专注于 3D AIGC 和空间智能技术的人工智能初创公司,公司致力于通过 AI 解放 3D 内容生产力。公司自设立之后便迅速建立了算法研发和产品落地并重的海内外人才梯队,拥有一批 3D AIGC 领域顶尖人才,迄今已经发表过多个 3D AIGC 代表性工作,汇集了来自港科大博士、字节、美团等具有顶级研发能力和丰富技术产品化经验的同学。 公司目前持续重点投入 3D 和空间智能相关的 AI 底层模型的研发,打造 3D 空间智能大脑,同时积极推进 3D 内容商业化落地。

官网:https://www.lightillusions.com/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这才是铁哥们!还清中国81亿欠债,赠百亿大礼,西方各国都眼红

这才是铁哥们!还清中国81亿欠债,赠百亿大礼,西方各国都眼红

霁寒飘雪
2025-12-30 11:54:50
CBA疯狂一夜!徐杰缺阵,广东升至第二,广厦再胜北京,守住榜首

CBA疯狂一夜!徐杰缺阵,广东升至第二,广厦再胜北京,守住榜首

侃球熊弟
2026-01-03 20:59:27
后背发凉!一月入3万36岁女高管,失业8个月加离婚,如今送外卖了

后背发凉!一月入3万36岁女高管,失业8个月加离婚,如今送外卖了

火山詩话
2026-01-02 19:14:41
“我把顶流都睡完了”?2026年第一瓜 iamroosie屠榜整个内娱圈

“我把顶流都睡完了”?2026年第一瓜 iamroosie屠榜整个内娱圈

杭城村叔
2026-01-03 15:38:28
机构改革!不保留退役军人事务局,成立新的民政和退役军人事务局

机构改革!不保留退役军人事务局,成立新的民政和退役军人事务局

扶苏聊历史
2026-01-03 10:18:12
宝马突然大范围调价,最高降30万,宝马中国回应→

宝马突然大范围调价,最高降30万,宝马中国回应→

第一财经资讯
2026-01-02 21:33:23
就在今天!贾巴尔保持了37年的NBA纪录被打破了

就在今天!贾巴尔保持了37年的NBA纪录被打破了

篮球大视野
2026-01-03 18:43:57
河北农村取暖现状扎心了!补贴取消后燃气费翻倍,老人裹棉袄过冬

河北农村取暖现状扎心了!补贴取消后燃气费翻倍,老人裹棉袄过冬

ICT解读者
2026-01-03 13:21:29
美国攻击委内瑞拉,总统马杜罗被逮捕——川普终于成了口嗨终结者

美国攻击委内瑞拉,总统马杜罗被逮捕——川普终于成了口嗨终结者

老王说正义
2026-01-03 20:41:54
特朗普,直扑马杜罗

特朗普,直扑马杜罗

中国新闻周刊
2026-01-03 18:56:58
队记:开拓者对杨瀚森信任程度极低 不迅速提升可能很快重返中国

队记:开拓者对杨瀚森信任程度极低 不迅速提升可能很快重返中国

罗说NBA
2026-01-03 20:52:55
香港取消免费医疗,马杜罗彻底认怂,伊朗街头很热闹

香港取消免费医疗,马杜罗彻底认怂,伊朗街头很热闹

难得君
2026-01-03 10:09:41
宝马降价后记者实探重庆线下4S店:元旦三天卖出30多台车,销量较以往节假日增幅50%,20万元可开走入门级X1

宝马降价后记者实探重庆线下4S店:元旦三天卖出30多台车,销量较以往节假日增幅50%,20万元可开走入门级X1

极目新闻
2026-01-03 20:19:54
特朗普突然发动战争,中国代表团还在委内瑞拉!

特朗普突然发动战争,中国代表团还在委内瑞拉!

胜研集
2026-01-03 17:14:34
不到三小时,美军就抓获委内瑞拉总统,斩首效率为何一直这么高?

不到三小时,美军就抓获委内瑞拉总统,斩首效率为何一直这么高?

装甲铲史官
2026-01-03 19:37:13
马杜罗后悔喊“快来抓我”了

马杜罗后悔喊“快来抓我”了

吴女士
2026-01-03 19:40:41
“国服嫂子”司晓迪,自曝与多位男星私照,林更新鹿晗火速辟谣

“国服嫂子”司晓迪,自曝与多位男星私照,林更新鹿晗火速辟谣

扒虾侃娱
2026-01-03 10:33:42
在委内瑞拉中企人员暂无伤亡情况

在委内瑞拉中企人员暂无伤亡情况

新华社
2026-01-03 19:53:02
国家博物馆回应:正在尝试联系崔凤祥,沟通正在推进中

国家博物馆回应:正在尝试联系崔凤祥,沟通正在推进中

社会日日鲜
2026-01-03 07:03:02
巴西总统谴责美轰炸委内瑞拉抓走马杜罗,称美开创危险先例

巴西总统谴责美轰炸委内瑞拉抓走马杜罗,称美开创危险先例

界面新闻
2026-01-03 21:12:35
2026-01-03 21:51:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12033文章数 142527关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

“国服嫂子”司晓迪,曝与多位男星私照

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

艺术
健康
教育
游戏
军事航空

艺术要闻

弗雷德里克·阿普尔亚德 (英国画家, 1874-1963)

元旦举家出行,注意防流感

教育要闻

乡村学校的老师,面对越来越少的学生,该考虑自己的后路了!

恭喜IG!新阵容拿下德杯冠军!3-0横扫完全体JDG,新人发挥出色

军事要闻

特朗普称将干涉伊朗骚乱事件 伊朗政府发声明强烈谴责

无障碍浏览 进入关怀版