网易首页 > 网易号 > 正文 申请入驻

影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

0
分享至

  新智元报道

  编辑:犀牛 桃子

  【新智元导读】3D生成模型高光时刻来临!DreamTech联手南大、复旦、牛津发布的Direct3D-S2登顶HuggingFace热榜。仅用8块GPU训练,效果超闭源模型,直指影视级精细度。

  HuggingFace是全球最大的开源大模型社区,汇集了来自世界各地的上百个开源大模型。

  其趋势榜(HuggingFace Trending)展示了各类开源大模型在全球开发者中的受欢迎程度,DeepSeek、Qwen等大模型就因曾登顶HuggingFace榜单而获得了全球开发者的关注与热议。可以说,这是当前最具权威性的榜单之一。

  最近一周,由DreamTech推出的Direct3D-S2 3D大模型登顶HuggingFace 3D modeling应用趋势榜,并在涵盖文本、图像和视频的综合榜单上跃居至第4位。

  这个大模型不仅赢得了海外知名AI精选博主AK (@_akhaliq) 的推荐,还在全球3D及AI领域的开发者和爱好者中引起了广泛关注。

  Direct3D-S2仅需8张GPU训练,生成效果远超数百张GPU训练的闭源商用模型,训练效率提升近20倍,相比现有的大模型,token吞吐量从4K提升到256K,直接提高64倍,目标直指影视级别高精细度3D模型生成。

  许多开发者表示Direct3D-S2就是「最强开源3D大模型」,直呼「3D生成的概念神」。

  为什么一个3D大模型能在AI行业引起如此高的关注度呢?

  从DreamTech团队发布的论文中,我们或许能找到答案。Direct3D-S2所实现的突破性进展,不仅提升了3D模型的精度与效率,也开启了新的应用场景和技术可能性。

  这不仅是对技术边界的探索,也是其在AI领域创新能力的一次重要展示。

  论文地址:https://arxiv.org/pdf/2505.17412

  从游戏角色、电影特效,到VR体验和3D打印产品,背后都离不开一个关键技术——3D建模。它就是数字世界的基础手艺,但传统建模过程复杂又耗时。

  AI正在改变这一切。近年来,越来越多的公司开始用来替代人工建模,AI不仅更快,效果也越来越逼真。微软、Meta、腾讯、字节跳动等行业巨头,以及众多创新企业纷纷发力,推出了各种AI 3D生成工具,掀起了一场技术热潮。

  而在所有探索中,如何让AI生成的3D模型更清晰、更精细,已经成为大家最关心的问题之一。

  为什么高分辨率的3D生成

  如此具有挑战性?

  现在AI已经能轻松生成高清的图片和视频了,但为什么利用AI进行高质量的3D建模却仍旧这么难?这背后有两个关键原因。

  3D数据比2D复杂得多。图像和视频只是平面信息,而3D模型要完整地表达一个物体在空间中的形状,它的细节是「立方级」的复杂度。也就是说,分辨率越高,需要处理的token数量会呈立方倍增长。比如,把分辨率从128提升到256,token数量的差别不是2倍,而是2³=8倍。

  AI模型本身的计算压力也很大。目前主流的AI架构Transformer在处理大量细节时会变得特别吃力,Transoform核心的Attention(注意力)机制的运算复杂度是随着数据token数量呈平方增长的。这意味着,当你想要更精细的模型时,算力需求几乎是指数爆炸式上升。

  举个例子:即使是分辨率为256级的3D生成任务,通常也需要动用32至64块高端GPU进行训练。

  而如果要生成1024级分辨率甚至影视级别超高精细度的3D任务,则需要几千甚至上万块GPU训练。这种训练方式成本高昂,技术挑战也非常大。

  如何在有限的资源下实现高质量的3D生成,已经成为整个行业都在攻克的核心难题。

  DreamTech联合南京大学、牛津大学提出了Direct3D-S2,解决了高分辨率3D生成的瓶颈问题。

  

  空间稀疏注意力机制

  在Direct3D-S2中,DreamTech团队提出了一项核心创新——空间稀疏注意力机制(Spatial Sparse Attention, SSA)。

  这一机制专为解决当前Diffusion Transformer(DiT)在处理高分辨率3D生成时效率低、精细度差的问题而设计,堪称3D生成领域的效率引擎。

  优点一:支持超大规模体素生成

  通过自适应3D空间分块策略,SSA可以让模型只关注真正重要的体素区域,避免大量冗余计算。

  即使面对1024³的超高分辨率,模型也能轻松处理数十万级tokens,token吞吐量提高64倍!

  优点二:保留几何一致性

  在大幅提高效率的同时,SSA并没有牺牲质量。

  它基于空间几何连续性概率分布对tokens进行智能分块,确保局部结构完整、表面平滑自然,避免了传统方法中常见的「断裂」或「扭曲」现象。

  稀疏SDF VAE以及稀疏DiT

  除了SSA注意力机制的创新,Direct3D-S2还引入了适配SSA的全新架构,包括稀疏SDF VAE和稀疏DiT,实现了从输入到输出的全流程效率提升。

  端到端稀疏SDF自编码器

  Direct3D-S2首次将3D生成表征统一到SDF(符号距离函数)体素场中,无需依赖传统的点云、多视角图像或隐式空间等复杂转换过程。

  简化了训练流程,将模型训练的稳定性和训练速度提升到极致。

  多分辨率支持+稀疏条件机制

  Direct3D-S2支持基于3D几何空间的multi-scale训练与推理,仅用8块A100 GPU,2天即可完成训练,整体效率提升4倍以上。

  同时,借助稀疏条件机制,模型能聚焦于前景物体的关键区域,实现更高效的交叉注意力计算,从而显著增强细节生成能力。

  细节更丰富、结构更精准

  在3D生成领域,细节决定成败。

  Direct3D-S2在生成质量上的突破,正是体现在它对复杂几何结构和精细纹理的出色还原能力上。

  在多项关键指标对比中,Direct3D-S2全面超越当前主流开源3D生成模型,在所有数值评测中全部领先。

  无论是细节丰富程度、几何精度、表面光滑度,还是整体结构的一致性,Direct3D-S2都展现出显著优势。

  不仅如此,在由数十位艺术家与开发者参与的盲测评估中,Direct3D-S2也在「图像一致性」与「几何质量」两个核心维度上获得最高评分。

  这意味着,不仅数据亮眼,实际效果也真正能打动专业人士。

  与当前流行的开源3D生成大模型对比,Direct3D-S2在细节和精细度表现上超越了全部的开源3D大模型。

  

  尽管只使用8张A100显卡和公开数据集训练,Direct3D-S2在生成的模型细节上甚至超过了目前市面上几乎全部的闭源商用模型。

  

  换句话说,Direct3D-S2不仅是目前最强的开源3D生成大模型之一,更是首个在质量和实用性上真正接近工业级应用的开源方案。

  拥抱开源,赋能全球开发者

  DreamTech始终秉持「技术共享」的理念,已将Direct3D-S2全面开源,并采用最宽松的 MIT License协议,允许自由用于商业用途,堪称业界良心,这一举措赢得了行业的广泛赞誉。

  为了让全球开发者更方便地体验与使用Direct3D-S2,DreamTech提供了多个开放入口:

  ·GitHub项目地址(开源代码):

  https://github.com/DreamTechAI/Direct3D-S2

  ·技术详情与论文访问:

  https://www.neural4d.com/research/direct3d-s2/

  ·HuggingFace在线体验Demo:

  https://huggingface.co/spaces/wushuang98/Direct3D-S2-v1.0-demo

  此外,DreamTech官网还提供更强版本模型及一系列实用功能,供用户免费使用,助力开发者、艺术家和企业快速上手与落地应用。

  ·DreamTech官网入口:

  www.neural4d.com

  创新无边界,Direct3D-S2不仅是一次技术突破,更是推动3D生成普及化的重要一步。

  

  团队介绍

  DreamTech深耕于3D及4D AI技术领域,致力于用创新的产品和服务提升全球AIGC创作者及消费者的使用体验,公司的愿景是利用先进的AI技术打造与真实世界无缝对接、实时互动的时空智能体验,并通过模拟真实世界的复杂性和多样性实现通用人工智能(AGI)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女人偷吃后晚上跟丈夫同房是什么体验?这位46岁出轨女人说出答案

女人偷吃后晚上跟丈夫同房是什么体验?这位46岁出轨女人说出答案

混音情感
2026-03-26 14:25:07
TVB四届视后主演新剧内地点击破亿!宣传遇突发状况,淡定应对显风范

TVB四届视后主演新剧内地点击破亿!宣传遇突发状况,淡定应对显风范

TVB剧评社
2026-03-26 22:37:56
韩媒臆想:中国队欢呼吧,国际足联同意他们替补世界杯

韩媒臆想:中国队欢呼吧,国际足联同意他们替补世界杯

体坛风之子
2026-03-26 07:00:06
三连冠后首度被主场球迷高呼下课,广东男篮近八年唯一无换帅球队

三连冠后首度被主场球迷高呼下课,广东男篮近八年唯一无换帅球队

狼叔评论
2026-03-26 18:02:06
伊朗发动第82波打击

伊朗发动第82波打击

闪电新闻
2026-03-26 18:32:07
伊朗伊斯兰革命卫队责令一艘擅自通过霍尔木兹海峡船只返航

伊朗伊斯兰革命卫队责令一艘擅自通过霍尔木兹海峡船只返航

财联社
2026-03-25 02:02:18
福气追着跑!三大生肖命中带财,2026一路顺遂财运旺到年底!

福气追着跑!三大生肖命中带财,2026一路顺遂财运旺到年底!

毅谈生肖
2026-03-26 11:31:20
原来他们是夫妻,《冬去春来》他又火了,不高不帅却娶了漂亮老婆

原来他们是夫妻,《冬去春来》他又火了,不高不帅却娶了漂亮老婆

趣味八卦
2026-03-25 17:34:15
油价降了!3月26日全国油价下调85元吨,4月7日油价将迎下跌!

油价降了!3月26日全国油价下调85元吨,4月7日油价将迎下跌!

沙雕小琳琳
2026-03-26 15:31:42
亿万国人破防了!90岁院士平静宣布,中国导弹从此没有任何死角!

亿万国人破防了!90岁院士平静宣布,中国导弹从此没有任何死角!

墨兰史书
2026-03-05 07:10:08
收评:三大指数均跌超1% 两市成交额跌破2万亿

收评:三大指数均跌超1% 两市成交额跌破2万亿

财联社
2026-03-26 15:02:09
别被“某音”前凸后翘的网红骗了

别被“某音”前凸后翘的网红骗了

健身S叔
2026-03-22 11:12:04
华裔女赌神赵苏茜:曾横扫美国赌场,一局赢下400万,33岁遭焚尸

华裔女赌神赵苏茜:曾横扫美国赌场,一局赢下400万,33岁遭焚尸

叹为观止易
2026-03-24 16:45:26
美军官揭露“爱国者”惨败原因:伊朗不讲武德用了几千架无人机!

美军官揭露“爱国者”惨败原因:伊朗不讲武德用了几千架无人机!

阿芒娱乐说
2026-03-27 00:16:22
国足决战库拉索 541阵型冲首胜 首发11人基本定9人 王钰栋或替补

国足决战库拉索 541阵型冲首胜 首发11人基本定9人 王钰栋或替补

男足的小球童
2026-03-26 17:47:27
51岁林志玲状态炸上热搜!岁月在她脸上按了暂停键?看完我服了

51岁林志玲状态炸上热搜!岁月在她脸上按了暂停键?看完我服了

时间巡查
2026-03-27 00:27:26
莱万最后1届世界杯悬了:波兰0-1输球就出局

莱万最后1届世界杯悬了:波兰0-1输球就出局

我是一个养虾人
2026-03-27 01:05:31
为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

另子维爱读史
2026-03-22 22:34:48
她58岁仍是干净之身,至今没谈过恋爱,除非是最爱不然不会献身

她58岁仍是干净之身,至今没谈过恋爱,除非是最爱不然不会献身

小熊侃史
2026-02-15 07:30:10
不结婚怎么解决生理需求?33岁的女顶流杨紫,用六个字道破真相!

不结婚怎么解决生理需求?33岁的女顶流杨紫,用六个字道破真相!

丁丁鲤史纪
2026-03-08 16:53:30
2026-03-27 01:44:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
亲子
教育
本地
军事航空

400万人爱过的女孩,被黄谣网暴180天后

亲子要闻

看看把孩子吓得哈哈哈

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版