网易首页 > 网易号 > 正文 申请入驻

Diffusion4D数分钟内实现4D内容生成,超81K的4D数据集已开源!

0
分享至

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。欢迎《》以及《》。wisemodel社区上升级了体验空间,。

本文介绍由多伦多大学,北京交通大学,德克萨斯大学奥斯汀分校和剑桥大学团队最新提出的4D生成扩散模型,该方法可以在几分钟之内可以完成时空一致的4D内容生成。Diffusion4D整理筛选了约81K个4D assets,利用8卡GPU共16线程,花费超过30天渲染得到了约四百万张图片,包括静态3D物体环拍、动态3D物体环拍以及动态3D物体前景视频。该方法是首个利用大规模数据集,训练视频生成模型生成4D内容的框架,目前项目已经开源所有渲染的4D数据集以及渲染脚本。

项目地址:https://vita-group.github.io/Diffusion4D/

论文地址:https://arxiv.org/abs/2405.16645

1

研究背景

过去的方法采用了2D、3D预训练模型在4D(动态3D)内容生成上取得了一定的突破,但他们主要依赖于分数蒸馏采样(SDS)或者生成的伪标签进行优化,同时利用多个预训练模型获得监督不可避免的导致时空上的不一致性以及优化速度慢的问题。

4D内容生成的一致性包含了时间上和空间上的一致性,它们分别在视频生成模型和多视图生成模型中被探索过。基于这个洞见,Diffusion4D将时空的一致性嵌入在一个模型中,并且一次性获得多时间戳的跨视角监督。

具体来说,使用仔细收集筛选的高质量4D数据集,Diffusion4D训练了一个可以生成动态3D物体环拍视图的扩散模型,而后利用已有的4DGS算法得到显性的4D表征,该方法实现了基于文本、单张图像、3D到4D内容的生成。

2

4D数据集

为了训练4D视频扩散模型,Diffusion4D收集筛选了高质量的4D数据集。已开源的Objaverse-1.0包含了42K运动的3D物体,在Objaverse-xl中包含323K动态3D物体。然而这些数据包含着大量低质量的样本,研究者们设计了运动程度检测、边界溢出检查等筛选方法,选取了共81K的高质量4D资产。

对于每一个4D资产,渲染得到了24个静态视角的图(上图第一行),24个动态视角的环拍图(上图第二行),以及24个正面动态图(上图第三行)。总计得到了超过四百万张图片,总渲染消耗约300 GPU天。其他数据集细节可以参考项目主页,目前所有渲染完的数据集和原始渲染脚本已开源,更多数据集使用方法值得探索!

3

方法

有了4D数据集之后,Diffusion4D训练具有4D感知的视频扩散模型(4D-aware video diffusion model)。过去的视频生成模型通常不具备3D几何先验信息,但近期工作如SV3D,VideoMV等探索了利用视频生成模型得到静态3D物体的多视图,因此Diffusion4D选用了VideoMV作为基础模型进行微调训练,使得模型能够输出动态环拍视频。此外设计了如运动强度(motion magnitude)控制模块、3D-aware classifier-free guidance等模块增强运动程度和几何质量。得益于视频模态具备更强的连贯性优势,输出的结果具有很强的时空一致性。

输出得到动态视角环拍视频后,Diffusion4D借助已有的4D重建算法将视频建模得到4D表达。具体来说采用了4DGS的表征形式,以及使用粗粒度、细粒度的两阶段优化策略得到最终的4D内容。从生产环拍视频到重建4D内容的两个步骤仅需花费数分钟时间,显著快于过去需要数小时的借助SDS的优化式方法。

4

结果

根据提示信息的模态,Diffusion4D可以实现从文本、图像、3D到4D内容的生成,在定量指标和user study上显著优于过往方法。在生成质量上,Diffusion4D有着更好的细节,更为合理的几何信息以及更丰富的动作。更多可视化结果可以参考项目主页。

5

总结

Diffusion4D是首个利用视频生成模型来实现4D内容生成的框架,通过使用超81K的数据集、以及精心设计的模型架构实现了快速且高质量的4D内容。未来,如何最大程度发挥4D数据集价值,如何生成多物体、复杂场景的4D内容仍有很大的探索空间!

投稿 | 尹雨阳

编辑 | 成蕴年

----- END -----

始智AI wisemodel开源社区最近上线了开源模型的在线体验功能,并全面支持ollama在线运行,已经有近60个开源大模型可以直接在线体验。 在线体验的创建无需任何代码开发,人人都可以来玩开源大模型。 欢迎前往wisemodel.cn社区进行体验,若需指引可以参考《 》。 如果有模型推理的在线托管服务需求,也欢迎联系我们。

wisemodel相关

系统升级

系列模型:

关于wisemodel更多

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人民日报反复提醒:最高级的教育,就抓这三样

人民日报反复提醒:最高级的教育,就抓这三样

诺妈家有男宝娃
2026-05-07 11:14:44
人死后49天,灵魂在阴间过7关,佛教古籍揭秘死亡轮回转世真相

人死后49天,灵魂在阴间过7关,佛教古籍揭秘死亡轮回转世真相

诡谲怪谈
2025-02-19 19:15:10
油价闪崩12%前 9.2亿美元空单提前埋伏

油价闪崩12%前 9.2亿美元空单提前埋伏

每日经济新闻
2026-05-07 07:49:35
最“短命”的美国总统,就职后睡了一觉,第二天醒来总统已经换人

最“短命”的美国总统,就职后睡了一觉,第二天醒来总统已经换人

孙錫北漂拍客
2026-05-06 19:01:01
36岁时的郑丽文与兰宣、尹乃菁合影。

36岁时的郑丽文与兰宣、尹乃菁合影。

草莓解说体育
2026-04-12 08:02:43
一张“初三女孩体测”照片,让家长被数万网友指责:太不用心了!

一张“初三女孩体测”照片,让家长被数万网友指责:太不用心了!

川渝视觉
2026-04-25 20:19:24
邱党0-3负张本智和,赛后诚恳表态被打到要害

邱党0-3负张本智和,赛后诚恳表态被打到要害

老嗮说体育
2026-05-07 23:49:57
49岁曾黎穿瑜伽裤晨跑被骂擦边:怎么穿都有错!

49岁曾黎穿瑜伽裤晨跑被骂擦边:怎么穿都有错!

马拉松跑步健身
2026-05-06 07:00:18
黄金白银,集体大涨

黄金白银,集体大涨

南方都市报
2026-05-07 14:49:06
我今年55了,想用血泪教训告诉你:不要跟任何人,包括你的父母、子女、枕边人,分享这4件事

我今年55了,想用血泪教训告诉你:不要跟任何人,包括你的父母、子女、枕边人,分享这4件事

东林夕亭
2026-03-27 09:07:57
特朗普访华前瞻——台湾怎么办?

特朗普访华前瞻——台湾怎么办?

凤凰卫视
2026-05-07 23:25:07
洗完澡千万不要顺手洗内裤,提醒:这2个清洗误区,很多人都犯了

洗完澡千万不要顺手洗内裤,提醒:这2个清洗误区,很多人都犯了

白话电影院
2026-04-12 13:13:58
森林球员赛前围圈,大马丁示意他们散开遭拒随后加入其中偷听

森林球员赛前围圈,大马丁示意他们散开遭拒随后加入其中偷听

懂球帝
2026-05-08 03:30:16
郑丽文彻底撕破脸,扯下蓝营最后一块遮羞布!

郑丽文彻底撕破脸,扯下蓝营最后一块遮羞布!

达文西看世界
2026-05-05 10:58:59
黄仁勋很生气:中国芯片用“落后”7nm工艺,抢走了英伟达50%市场

黄仁勋很生气:中国芯片用“落后”7nm工艺,抢走了英伟达50%市场

科技专家
2026-05-07 11:39:11
跟儿子“换血”的硅谷富豪,成为世界首位返老还童的人,如今怎样

跟儿子“换血”的硅谷富豪,成为世界首位返老还童的人,如今怎样

谈史论天地
2026-04-28 06:34:30
日本铁路设计专家称,乘坐中国高铁“感觉吃亏了”,“因为没窗”

日本铁路设计专家称,乘坐中国高铁“感觉吃亏了”,“因为没窗”

巢客HOME
2026-04-30 08:20:08
天津凌晨突发惊险一幕!

天津凌晨突发惊险一幕!

天津族
2026-05-07 07:33:52
“肉是臭的、菜是烂的”?托管班给孩子准备的食材被指变质,当地通报

“肉是臭的、菜是烂的”?托管班给孩子准备的食材被指变质,当地通报

界面新闻
2026-05-07 20:19:08
备份在手,勒索病毒为何仍能得手?

备份在手,勒索病毒为何仍能得手?

字节漫游指南
2026-05-07 00:12:10
2026-05-08 04:32:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
476文章数 16关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

游戏
旅游
数码
亲子
公开课

《远星物语》团队新作《皓白初晓》登Steam EA

旅游要闻

在上图文字奇旅中寻找她的笔迹(边玩边赢奖,互动体验开启预约!)

数码要闻

酷冷至尊elite 461系列机箱首发199元起:M-ATX海景房设计

亲子要闻

只祝她“母亲节快乐”是不够的

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版