网易首页 > 网易号 > 正文 申请入驻

打通视频到3D的最后一公里,清华团队推出一键式视频扩散模型

0
分享至


论文有两位共同一作。汪晗阳,清华大学计算机系本科四年级,研究方向为三维视觉、生成模型,已在CVPR、ECCV、NeurIPS等会议发表论文。刘芳甫,清华大学电子工程系直博二年级,研究方向为生成模型 (3D AIGC和Video Generation等),已在CVPR、ECCV、NeurIPS、ICLR、KDD等计算机视觉与人工智能顶会发表过多篇论文。

从视频到 3D 的桥梁:VideoScene 一步到位

随着 VR/AR、游戏娱乐、自动驾驶等领域对 3D 场景生成的需求不断攀升,从稀疏视角重建 3D 场景已成为一大热点课题。但传统方法往往需要大量图片、繁琐的多步迭代,既费时又难以保证高质量的 3D 结构重建。

来自清华大学的研究团队首次提出 VideoScene:一款 “一步式” 视频扩散模型,专注于 3D 场景视频生成。它利用了 3D-aware leap flow distillation 策略,通过跳跃式跨越冗余降噪步骤,极大地加速了推理过程,同时结合动态降噪策略,实现了对 3D 先验信息的充分利用,从而在保证高质量的同时大幅提升生成效率。

  • 论文标题:VideoScene:Distilling Video Diffusion Model to Generate 3D Scenes in One Step
  • 论文地址: https://arxiv.org/abs/2504.01956
  • 项目主页: https://hanyang-21.github.io/VideoScene
  • Github 仓库: https://github.com/hanyang-21/VideoScene

稀疏视角重建方法挑战

在稀疏视角重建领域,从少量图像中精准恢复 3D 场景是个极具挑战性的难题。传统方法依赖多视角图像间的匹配与几何计算 ,但当视角稀疏时,匹配点不足、几何约束缺失,使得重建的 3D 模型充满瑕疵,像物体结构扭曲、空洞出现等。

为突破这一困境,一些前沿方法另辟蹊径,像 ReconX 就创新性地借助视频生成模型强大的生成能力,把重建问题与生成问题有机结合。它将稀疏视角图像构建成全局点云,编码为 3D 结构条件,引导视频扩散模型生成具有 3D 一致性的视频帧,再基于这些帧重建 3D 场景,在一定程度上缓解了稀疏视角重建的不适定问题。

不过,当前大多数 video to 3D 工具仍存在效率低下的问题。一方面,生成的 3D视频质量欠佳,难以生成三维结构稳定、细节丰富、时空连贯的视频。在处理复杂场景时,模型容易出现物体漂移、结构坍塌等问题,导致生成的 3D 视频实用性大打折扣。另一方面,基于扩散模型的视频生成通常需要多步降噪过程,每一步都涉及大量计算,不仅耗时久,还带来高昂的计算开销,限制了其在实际场景中的应用。

继承与超越:ReconX 理念的进化

此前研究团队提出 video-to-3D 的稀释视角重建方法 ReconX,核心在于将 3D 结构指导融入视频扩散模型的条件空间,以此生成 3D 一致的帧,进而重建 3D 场景。它通过构建全局点云并编码为 3D 结构条件,引导视频扩散模型工作 ,在一定程度上解决了稀疏视角重建中 3D 一致性的问题。

VideoScene 继承了 ReconX 将 3D 结构与视频扩散相结合的理念,并在此基础上实现了重大改进,堪称ReconX 的 “turbo 版本”。

在 3D 结构指导方面,VideoScene 通过独特的3D 跃迁流蒸馏策略,巧妙地跳过了传统扩散模型中耗时且冗余的步骤,直接从含有丰富 3D 信息的粗略场景渲染视频开始,加速了整个扩散过程。同时也使得 3D 结构信息能更准确地融入视频扩散过程。在生成视频帧时,VideoScene 引入了更强大的动态降噪策略,不仅仅依赖于固定的降噪模式,而是根据视频内容的动态变化实时调整降噪参数,从而既保证了生成视频的高质量,又极大地提高了效率。

研究团队提出的 VideoScene 方法流程图

实验结果

通过在多个真实世界数据集上的大量实验,VideoScene 展示出了卓越的性能。它不仅在生成速度上远超现有的视频扩散模型,而且在生成质量上也毫不逊色,甚至在某些情况下还能达到更好的效果。这意味着 VideoScene 有望成为未来视频到 3D 应用中的一个重要工具。在实时游戏、自动驾驶等需要高效 3D 重建的领域,有潜力能发挥巨大的作用。

VideoScene 单步生成结果优于 baseline 模型 50 步生成结果

视频扩散模型在不同去噪步数下的表现

如果你对 VideoScene 感兴趣,想要深入了解它的技术细节和实验结果,可访问论文原文、项目主页和 GitHub 仓库。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026年存款超100万要慌了?4个难题找上门,普通人如何守住财富

2026年存款超100万要慌了?4个难题找上门,普通人如何守住财富

老特有话说
2026-05-07 15:05:50
38岁本泽马率新月2-1逆转 加盟3个月即获首冠 4天后与C罗联赛决战

38岁本泽马率新月2-1逆转 加盟3个月即获首冠 4天后与C罗联赛决战

我爱英超
2026-05-09 06:40:03
随着奥萨苏纳2-3遭大逆转,西甲最新积分榜出炉:保级争夺白热化

随着奥萨苏纳2-3遭大逆转,西甲最新积分榜出炉:保级争夺白热化

侧身凌空斩
2026-05-09 05:17:37
去年造了全球90%产品,摩根士丹利:中国人形机器人或重演十年前中国新能源车剧本

去年造了全球90%产品,摩根士丹利:中国人形机器人或重演十年前中国新能源车剧本

红星新闻
2026-05-08 18:37:14
统一台湾后,第一任省长由谁担任最合适?五人上榜,一人脱颖而出

统一台湾后,第一任省长由谁担任最合适?五人上榜,一人脱颖而出

知鉴明史
2026-04-24 20:05:03
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
她帮美国造出原子弹,37年后见到周总理,第一句话让人瞬间泪崩

她帮美国造出原子弹,37年后见到周总理,第一句话让人瞬间泪崩

老范谈史
2026-04-20 20:30:16
泽州4.26刑案嫌犯落网!逃亡四天后在山腰被抓,知情人披露案因

泽州4.26刑案嫌犯落网!逃亡四天后在山腰被抓,知情人披露案因

Likepres
2026-05-07 21:03:43
王暖暖不再隐瞒!自曝深夜被紧急送医,护士反复呼唤,熟悉的恐惧

王暖暖不再隐瞒!自曝深夜被紧急送医,护士反复呼唤,熟悉的恐惧

枫尘余往逝
2026-05-09 02:20:33
努诺:赢阿森纳难度非常大,但我们不会放弃保级

努诺:赢阿森纳难度非常大,但我们不会放弃保级

懂球帝
2026-05-09 05:55:11
皇马已启动“穆里尼奥行动”,本菲卡挽留穆帅,英超多队有意穆帅

皇马已启动“穆里尼奥行动”,本菲卡挽留穆帅,英超多队有意穆帅

福酱的小时光
2026-05-09 05:55:25
机关下设的事业单位,比如各种“中心”,名义上是独立机构,实际上早成了机关的内设处室?

机关下设的事业单位,比如各种“中心”,名义上是独立机构,实际上早成了机关的内设处室?

碧翰烽
2026-05-08 07:33:09
宁波女子帮“老同事”查快递被骗6万多元:“客服”让支付尾款否则定金作废,“老同事”网络不好请她先垫付并发毒誓“骗你出门被车撞死”

宁波女子帮“老同事”查快递被骗6万多元:“客服”让支付尾款否则定金作废,“老同事”网络不好请她先垫付并发毒誓“骗你出门被车撞死”

极目新闻
2026-05-08 22:19:45
《黑神话》3D大神发美图!美胸大雷 性感玉足太迷人

《黑神话》3D大神发美图!美胸大雷 性感玉足太迷人

游民星空
2026-05-06 21:29:22
酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

笑谈历史阿晡
2026-05-04 12:02:08
德云社弟子大洗牌!3人自断后路,岳云鹏边缘,烧饼一哥地位稳了

德云社弟子大洗牌!3人自断后路,岳云鹏边缘,烧饼一哥地位稳了

白面书誏
2026-05-08 15:52:08
瑞秋·齐格勒Met Gala红毯造型致敬名画,用力过猛,被称“失败的白雪公主”

瑞秋·齐格勒Met Gala红毯造型致敬名画,用力过猛,被称“失败的白雪公主”

大中国
2026-05-07 15:09:12
300872,拟超35亿元切入算力租赁赛道!近期股价大涨!

300872,拟超35亿元切入算力租赁赛道!近期股价大涨!

证券时报
2026-05-08 21:52:04
巴拉圭总统窜台,不到24小时,中方下达最后通牒:与台“断交”

巴拉圭总统窜台,不到24小时,中方下达最后通牒:与台“断交”

感谢过往
2026-05-09 04:46:45
DeepSeek网页及API服务出现异常,官方称正在实施修复

DeepSeek网页及API服务出现异常,官方称正在实施修复

界面新闻
2026-05-08 17:57:26
2026-05-09 07:19:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12950文章数 142646关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

手机
艺术
数码
旅游
公开课

手机要闻

OPPO K15系列手机规格曝光:6.78英寸直屏、8000mAh电池

艺术要闻

清风拂面,心旷神怡

数码要闻

华硕京东重磅新品日,华硕天选7系列游戏本开启预约

旅游要闻

社评:中国的“Country Walk”何以吸引西方年轻人

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版