网易首页 > 网易号 > 正文 申请入驻

Diffusion4D数分钟内实现4D内容生成,超81K的4D数据集已开源!

0
分享至

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。欢迎《》以及《》。wisemodel社区上升级了体验空间,。

本文介绍由多伦多大学,北京交通大学,德克萨斯大学奥斯汀分校和剑桥大学团队最新提出的4D生成扩散模型,该方法可以在几分钟之内可以完成时空一致的4D内容生成。Diffusion4D整理筛选了约81K个4D assets,利用8卡GPU共16线程,花费超过30天渲染得到了约四百万张图片,包括静态3D物体环拍、动态3D物体环拍以及动态3D物体前景视频。该方法是首个利用大规模数据集,训练视频生成模型生成4D内容的框架,目前项目已经开源所有渲染的4D数据集以及渲染脚本。

项目地址:https://vita-group.github.io/Diffusion4D/

论文地址:https://arxiv.org/abs/2405.16645

1

研究背景

过去的方法采用了2D、3D预训练模型在4D(动态3D)内容生成上取得了一定的突破,但他们主要依赖于分数蒸馏采样(SDS)或者生成的伪标签进行优化,同时利用多个预训练模型获得监督不可避免的导致时空上的不一致性以及优化速度慢的问题。

4D内容生成的一致性包含了时间上和空间上的一致性,它们分别在视频生成模型和多视图生成模型中被探索过。基于这个洞见,Diffusion4D将时空的一致性嵌入在一个模型中,并且一次性获得多时间戳的跨视角监督。

具体来说,使用仔细收集筛选的高质量4D数据集,Diffusion4D训练了一个可以生成动态3D物体环拍视图的扩散模型,而后利用已有的4DGS算法得到显性的4D表征,该方法实现了基于文本、单张图像、3D到4D内容的生成。

2

4D数据集

为了训练4D视频扩散模型,Diffusion4D收集筛选了高质量的4D数据集。已开源的Objaverse-1.0包含了42K运动的3D物体,在Objaverse-xl中包含323K动态3D物体。然而这些数据包含着大量低质量的样本,研究者们设计了运动程度检测、边界溢出检查等筛选方法,选取了共81K的高质量4D资产。

对于每一个4D资产,渲染得到了24个静态视角的图(上图第一行),24个动态视角的环拍图(上图第二行),以及24个正面动态图(上图第三行)。总计得到了超过四百万张图片,总渲染消耗约300 GPU天。其他数据集细节可以参考项目主页,目前所有渲染完的数据集和原始渲染脚本已开源,更多数据集使用方法值得探索!

3

方法

有了4D数据集之后,Diffusion4D训练具有4D感知的视频扩散模型(4D-aware video diffusion model)。过去的视频生成模型通常不具备3D几何先验信息,但近期工作如SV3D,VideoMV等探索了利用视频生成模型得到静态3D物体的多视图,因此Diffusion4D选用了VideoMV作为基础模型进行微调训练,使得模型能够输出动态环拍视频。此外设计了如运动强度(motion magnitude)控制模块、3D-aware classifier-free guidance等模块增强运动程度和几何质量。得益于视频模态具备更强的连贯性优势,输出的结果具有很强的时空一致性。

输出得到动态视角环拍视频后,Diffusion4D借助已有的4D重建算法将视频建模得到4D表达。具体来说采用了4DGS的表征形式,以及使用粗粒度、细粒度的两阶段优化策略得到最终的4D内容。从生产环拍视频到重建4D内容的两个步骤仅需花费数分钟时间,显著快于过去需要数小时的借助SDS的优化式方法。

4

结果

根据提示信息的模态,Diffusion4D可以实现从文本、图像、3D到4D内容的生成,在定量指标和user study上显著优于过往方法。在生成质量上,Diffusion4D有着更好的细节,更为合理的几何信息以及更丰富的动作。更多可视化结果可以参考项目主页。

5

总结

Diffusion4D是首个利用视频生成模型来实现4D内容生成的框架,通过使用超81K的数据集、以及精心设计的模型架构实现了快速且高质量的4D内容。未来,如何最大程度发挥4D数据集价值,如何生成多物体、复杂场景的4D内容仍有很大的探索空间!

投稿 | 尹雨阳

编辑 | 成蕴年

----- END -----

始智AI wisemodel开源社区最近上线了开源模型的在线体验功能,并全面支持ollama在线运行,已经有近60个开源大模型可以直接在线体验。 在线体验的创建无需任何代码开发,人人都可以来玩开源大模型。 欢迎前往wisemodel.cn社区进行体验,若需指引可以参考《 》。 如果有模型推理的在线托管服务需求,也欢迎联系我们。

wisemodel相关

系统升级

系列模型:

关于wisemodel更多

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑钦文陷争议:温网出局排名暴跌后,年入超1.7亿,引球迷质疑!

郑钦文陷争议:温网出局排名暴跌后,年入超1.7亿,引球迷质疑!

体坛侃排球
2026-07-04 00:05:24
李小孩的“小绿瓶”,看起来很平凡,为啥禁止出境展览?

李小孩的“小绿瓶”,看起来很平凡,为啥禁止出境展览?

收藏大视界
2026-05-24 17:41:29
外国人对中国有多不了解?看网友讲述,简直要笑喷。

外国人对中国有多不了解?看网友讲述,简直要笑喷。

侃神评故事
2026-06-27 18:06:25
亚洲9队团灭不可怕,更麻烦的是这5件事,世界杯扩军国足也进不去

亚洲9队团灭不可怕,更麻烦的是这5件事,世界杯扩军国足也进不去

小火箭爱体育
2026-07-04 06:17:25
世界杯前四场八分之一决赛裁判确定,分别来自四个大洲足联

世界杯前四场八分之一决赛裁判确定,分别来自四个大洲足联

懂球帝
2026-07-04 15:19:09
央行突然“放水”1万亿!楼市、股市、普通人钱袋子,都将迎巨变

央行突然“放水”1万亿!楼市、股市、普通人钱袋子,都将迎巨变

专业聊房君
2026-07-04 13:46:58
“尖叫瓶子”的邪修用法太厉害了!网友:尖叫可千万别涨价啊

“尖叫瓶子”的邪修用法太厉害了!网友:尖叫可千万别涨价啊

甜茶极简记
2026-07-03 13:06:09
谁干的?俄大使馆被袭击,美英法德乌失声,俄公布“核打击名单”

谁干的?俄大使馆被袭击,美英法德乌失声,俄公布“核打击名单”

小莜读史
2026-07-04 09:43:53
梅西赛后称:佛得角连平西班牙、乌拉圭绝非偶然,淘汰赛没人会白送你什么,“今天我们犯的错误还真不少”

梅西赛后称:佛得角连平西班牙、乌拉圭绝非偶然,淘汰赛没人会白送你什么,“今天我们犯的错误还真不少”

鲁中晨报
2026-07-04 10:50:11
热菲尼奥双响炮,中超第10逆转中超第2,辽宁铁人3-1终结2连败

热菲尼奥双响炮,中超第10逆转中超第2,辽宁铁人3-1终结2连败

侧身凌空斩
2026-07-04 20:58:57
UC伯克利麻了:生源太差,得从小学乘法开始教,微积分课被迫暂停

UC伯克利麻了:生源太差,得从小学乘法开始教,微积分课被迫暂停

机器之心Pro
2026-07-02 16:25:15
最新确认:上海一区开始试点,逐步覆盖全市!

最新确认:上海一区开始试点,逐步覆盖全市!

新浪财经
2026-07-04 17:02:32
国家在江门布下惊天大局,江门真正的王牌正在悄悄崛起

国家在江门布下惊天大局,江门真正的王牌正在悄悄崛起

三农老历
2026-07-04 14:45:03
林诗栋被大勒布伦横扫,再次证明王皓的“执拗”多么令人佩服

林诗栋被大勒布伦横扫,再次证明王皓的“执拗”多么令人佩服

鸿印百合
2026-07-04 20:59:24
发挥到极致的佛得角,让阿根廷的问题彻底暴露

发挥到极致的佛得角,让阿根廷的问题彻底暴露

澎湃新闻
2026-07-04 13:32:29
皇马卖人赚翻:11年10大高价转出谁最值,毫无疑问肯定是C罗

皇马卖人赚翻:11年10大高价转出谁最值,毫无疑问肯定是C罗

替补席懂王
2026-06-28 02:47:55
普京:必须继续大规模打击乌军工设施

普京:必须继续大规模打击乌军工设施

新京报
2026-07-04 11:26:06
巴拉圭vs法国前瞻:两队都有铁腰缺席,巴拉圭抵挡不住法国攻击群

巴拉圭vs法国前瞻:两队都有铁腰缺席,巴拉圭抵挡不住法国攻击群

智道足球
2026-07-04 15:22:31
重磅突发!这个板块马上大涨!重仓重仓!

重磅突发!这个板块马上大涨!重仓重仓!

星图金融研究院
2026-07-04 15:09:13
黄瓜再次成为关注对象!提醒:中老年吃黄瓜时,要多留意这几点!

黄瓜再次成为关注对象!提醒:中老年吃黄瓜时,要多留意这几点!

芹姐说生活
2026-07-04 15:31:18
2026-07-05 00:04:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
490文章数 16关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

艺术
手机
健康
教育
军事航空

艺术要闻

为什么时尚圈集体“失语”?只因这个男人的镜头,太敢拍了!

手机要闻

iPhone18 Pro Max偷跑:5391mAh史上最大!iPhone18:惨遭削弱!

听说少吃点能抗衰老?专家讲解!

教育要闻

UCAS补录全攻略:clearing其实是速度和信息差之战!

军事要闻

普京宣布俄军“完全解放”卢甘斯克

无障碍浏览 进入关怀版