网易首页 > 网易号 > 正文 申请入驻

扩散模型还原被遮挡物体,几张稀疏照片也能"脑补"重建交互式场景

0
分享至

DP-Recon团队 投稿量子位 | 公众号 QbitAI

你是否设想过,仅凭几张随手拍摄的照片,就能重建出一个完整、细节丰富且可自由交互的3D场景?

在传统方法中,这几乎是不可能完成的任务,稀少的拍摄视角往往导致模型无法还原被遮挡的区域,生成的场景要么残缺不全,要么细节模糊。更令人困扰的是,传统的重建算法无法解耦场景中的独立物体,重建结果无法交互,严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。

近期,北京通用人工智能研究院联合清华大学、北京大学的研究团队提出了名为DP-Recon的创新方法。该方法通过在组合式3D场景重建中,引入生成式扩散模型作为先验,即便只有寥寥数张图像输入,也能智能“脑补”出隐藏在视野之外的场景细节,分别重建出场景中的每个物体和背景。

值得一提的是,该方法还创新性地提出了一套可见性建模技术,通过动态调节扩散先验和输入图片约束的损失权重,巧妙地解决了生成内容与真实场景不一致的难题。在应用层面,DP-Recon不仅支持从稀疏图像中恢复场景,还能实现基于文本的场景编辑,并导出带纹理的高质量模型,为具身智能、影视游戏制作、AR/VR内容创作等领域,带来了全新的可能性。

研究概述

图1. 重建结果、基于文本编辑和影视特效展示

3D场景重建一直是计算机视觉和图形学领域的核心挑战,其目标是从多视角图像中恢复场景的完整几何和逼真纹理。近年来,NeRF和3DGS等神经隐式表示方法在多视角充足时表现出色,但在稀疏视角下却捉襟见肘。更重要的是,这些方法将整个场景作为一个整体重建,无法解耦独立物体,这严重制约了下游应用的发展。

现有的组合式场景重建方法同样面临稀疏视角带来的的严峻挑战。视角稀少会导致大面积区域缺乏观测数据,模型在这些区域容易崩塌;同时,物体间的相互遮挡使得某些部分在所有输入图像中都不可见,最终导致重建结果出现畸形或遗漏。

那么,如何为这些“看不见”的区域补充合理信息,让重建模型既忠实于输入图像,又能在空白处有所依据?DP-Recon给出了令人振奋的解决方案,该方法巧妙地将生成式扩散模型作为先验引入组合式场景重建,通过Score Distillation Sampling(SDS)技术,将扩散模型对物体概念的“理解”蒸馏到3D重建过程中。例如,当输入照片只拍到桌子的一面时,扩散模型可以基于对“桌子”这一概念的认知,智能推断出桌子背面的可能形状和纹理。这种方式为重建提供了宝贵的信息补充,极大提升了在稀疏视角和遮挡场景下的重建效果。

需要注意的是,直接将扩散先验硬套用到重建上并非易事。如果处理不当,生成模型可能会“过度想象”,产生与输入图像矛盾的内容,反而干扰基于真实照片的重建过程。为此,DP-Recon精心设计了一套基于可见性的平衡机制,巧妙协调重建信号(来自输入图像的监督)和生成引导(来自扩散模型的先验),通过动态调整扩散先验的作用范围,确保模型在已有照片信息处保持忠实,在空白区域合理发挥想象力。

下面将深入解析DP-Recon的核心技术细节。

关键技术

图2. DP-Recon的算法框架

DP-Recon的技术创新主要体现在以下三个关键方面:

1. 组合式场景重建:

与传统整体式重建不同,DP-Recon采用组合式重建策略。具体来说,模型会利用多种模态的重建损失(包括:RGB图像、深度图、法向量图和实例分割图),为每个对象分别建立隐式场(SDF),初步构建几何轮廓和外观表征,便于后续对每个物体加入基于文本的先验信息。

2. 几何和外观的分阶段优化:

DP-Recon将重建过程分为了几何和外观两个阶段,分别针对物体的形状和纹理进行优化。

在几何优化阶段,基于初步重建的基础,通过对法向量图引入Stable Diffusion的SDS损失,进一步优化物体在欠缺观察区域的细节,显著提升几何完整度。此阶段结束后,将输出每个物体和背景的Mesh结构。

在外观优化阶段,使用Nvdiffrast渲染生成的Mesh,巧妙融合输入图像的颜色信息和扩散先验,对物体表面纹理进行优化。为便于后续渲染和编辑,DP-Recon在此阶段还会为每个对象生成精细的UV贴图。

经过以上两个阶段的处理,最终,场景中每个对象的高质量网格模型及其纹理贴图,均具有精准几何和逼真外观。

3. 可见性引导的SDS权重机制:

针对扩散先验可能带来的不一致问题,DP-Recon提出了创新的可见性引导解决方案。该方法在计算SDS损失时引入可见性权重,根据每个像素在输入视角中的可见程度,动态调节扩散模型的引导强度。

具体而言,DP-Recon在重建过程中构建了一个可见性网格,通过输入视角体渲染过程中积累的透射率,来优化这个网格。当需要计算参与SDS视角的可见性图时,直接查询该网格即可。对于输入照片中高度可见的区域,系统会自动降低SDS损失权重,避免扩散模型“喧宾夺主”;而对于未被拍摄到或被遮挡的区域,则赋予更高的SDS权重,鼓励网络借助扩散先验补全细节。这种精细的可见性引导机制,完美平衡了重建的真实性与完整性。

实验结果

在Replica和ScanNet++等权威数据集上的系统性评估表明,DP-Recon在稀疏视角下的整体场景重建和分解式物体重建两方面都实现了显著突破。

表1. 整场景重建定量结果对比

1. 整体场景重建:

量化结果(见表1)清晰显示,DP-Recon方法在重建指标和渲染指标上与所有基线模型相比,均展现出明显优势。

△图3. 场景重建结果对比

如图3所示,通过将生成式先验融入重建流程,DP-Recon在拍摄不足的区域,实现了更精准的几何重建和颜色还原,以及更平滑的背景重建和更少的伪影漂浮物。如图4所示,在相同条件下,DP-Recon的渲染结果质量明显更高,而基线方法则出现明显伪影。

图4. 新视角合成结果对比

2. 分解式物体重建:

如表2和图3所示,生成式先验的引入极大改善了遮挡区域的重建效果,被遮挡物体的结构和背景都能更加精确地还原,DP-Recon显著减少遮挡区域的伪影漂浮物。在遮挡严重的复杂大场景测试中(见图1),DP-Recon仅用10个视角就超越了基线方法使用100个视角的重建效果,这一突破性成果充分证明了该方法在真实场景中的实用价值。

表2. 物体和背景重建结果对比

应用价值

1. 智能家居重建:

DP-Recon对室内场景展现出了卓越的鲁棒性。实验表明,仅需从YouTube看房视频中提取15张图像,配合Colmap标注相机位姿和SAM2物体分割,就能重建出高质量的带纹理场景模型,如图5所示。

△图5. YouTube看房视频重建结果

2. 赋能3D AIGC:

借助DP-Recon的生成式先验,用户可以轻松实现基于文本的场景编辑,如图6所示。就像为3D世界接入了AI想象力,用一句“将花瓶变成泰迪熊”或是“换成太空风格”,就能实现传统方法需要数日才能完成的修改。这种无缝融合重建与创作的能力,将大幅提升AIGC生产效率。

图6. 基于文本的场景几何和外观编辑

3. 影视游戏工业化:

DP-Recon输出的每个对象都是带有精细UV贴图的独立网格模型,如图7所示,这为影视特效(VFX)和游戏开发带来了极大便利。创作者可以轻松将模型导入Blender等3D软件,进行光照、动画和特效制作,或将场景直接接入游戏引擎开发交互内容。

图7. 影视特效展示

团队介绍

研究团队由来自北京通用人工智能研究院(BIGAI)、清华大学和北京大学的跨学科研究者组成,致力于通用人工智能领域的前沿研究。团队成员在三维场景理解、重建和生成等方面,拥有丰富的研究经验。一作为清华大学博士生倪俊锋,其它作者为清华大学博士生刘宇、北京大学博士生陆睿杰、清华大学本科生周子睿;通讯作者为北京通用人工智能研究院研究员陈以新、北京通用人工智能研究院研究员黄思远。

论文链接: https://arxiv.org/abs/2503.14830
项目主页: https://dp-recon.github.io/
代码仓库: https://github.com/DP-Recon/DP-Recon

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
抢疯了!暴涨40%,多人凌晨排队等开门,有人排了6小时

抢疯了!暴涨40%,多人凌晨排队等开门,有人排了6小时

深圳晚报
2026-01-26 08:11:53
央媒怒批、目不识丁,这几位德不配位的“文盲”明星,凭啥走红

央媒怒批、目不识丁,这几位德不配位的“文盲”明星,凭啥走红

天天热点见闻
2026-01-24 07:50:34
6名中国男子日本滑雪被困“死亡谷”,历时20小时获救,事发前一日刚有人脱困,大使馆两度发文提醒注意安全

6名中国男子日本滑雪被困“死亡谷”,历时20小时获救,事发前一日刚有人脱困,大使馆两度发文提醒注意安全

极目新闻
2026-01-26 18:36:30
伊朗对国内民众的残酷镇压,成为了自己的催命符

伊朗对国内民众的残酷镇压,成为了自己的催命符

林中木白
2026-01-26 16:58:23
白银连环杀人凶手高承勇:为儿子前途收手,被捕后儿子被单位辞退

白银连环杀人凶手高承勇:为儿子前途收手,被捕后儿子被单位辞退

谈史论天地
2026-01-26 16:55:03
太丢脸了!一男子武汉理工毕业,当保安月薪3800元,称被学校约谈

太丢脸了!一男子武汉理工毕业,当保安月薪3800元,称被学校约谈

火山诗话
2026-01-24 12:25:19
女明星被实名举报“插足婚姻”!

女明星被实名举报“插足婚姻”!

新动察
2026-01-26 10:45:00
央视暗访曝光!致命毒红薯已流遍20多省!种植户自己一口都不吃!

央视暗访曝光!致命毒红薯已流遍20多省!种植户自己一口都不吃!

今朝牛马
2026-01-26 22:00:31
你知道咱妈为何要拍《太平年》吗?知道这是拍给谁看的吗?

你知道咱妈为何要拍《太平年》吗?知道这是拍给谁看的吗?

草莓解说体育
2026-01-27 03:19:37
郭晶晶代言出事刚两天,恶心的一幕出现了,霍家的做法令人意外

郭晶晶代言出事刚两天,恶心的一幕出现了,霍家的做法令人意外

好贤观史记
2026-01-26 16:47:21
雷军宣布每周分享车主提车美照,照片中小米汽车女车主比例很高

雷军宣布每周分享车主提车美照,照片中小米汽车女车主比例很高

映射生活的身影
2026-01-27 00:48:02
刷到20+就拒投?SGA延续纪录却再吞耻辱 美媒:他正毁掉联盟形象

刷到20+就拒投?SGA延续纪录却再吞耻辱 美媒:他正毁掉联盟形象

颜小白的篮球梦
2026-01-26 19:57:59
14岁陈佳铭已昏迷超30天,上海专家会诊后,确认无生还希望

14岁陈佳铭已昏迷超30天,上海专家会诊后,确认无生还希望

离离言几许
2026-01-26 16:15:54
升第一!胡明轩决战连得11分广东双杀天津 萨姆纳39分单节20分

升第一!胡明轩决战连得11分广东双杀天津 萨姆纳39分单节20分

醉卧浮生
2026-01-26 21:24:15
丹麦网友众筹1万亿美元收购加州,想实现“牛油果自由”!美网友:俄勒冈州能加入吗

丹麦网友众筹1万亿美元收购加州,想实现“牛油果自由”!美网友:俄勒冈州能加入吗

红星新闻
2026-01-26 17:52:54
越南曝光中越战争真相:若中国军队晚撤5天,战争结局不敢想象

越南曝光中越战争真相:若中国军队晚撤5天,战争结局不敢想象

鉴史录
2026-01-26 22:15:16
无疫苗、无特效药!致命病毒扩散,多地重启“新冠级”防疫与隔离

无疫苗、无特效药!致命病毒扩散,多地重启“新冠级”防疫与隔离

华人生活网
2026-01-27 04:59:48
连丢2球!国足2-2被亚洲第五绝平 一国脚犯规染红 邵佳一3场不败

连丢2球!国足2-2被亚洲第五绝平 一国脚犯规染红 邵佳一3场不败

侃球熊弟
2026-01-26 21:26:26
为何欧盟接受了乌克兰的所有要求?

为何欧盟接受了乌克兰的所有要求?

高博新视野
2026-01-26 18:43:00
前10名大学中有8所来自中国!最新世界大学排名引发震惊,浙大超哈佛位列全球第一

前10名大学中有8所来自中国!最新世界大学排名引发震惊,浙大超哈佛位列全球第一

观威海
2026-01-26 19:22:32
2026-01-27 07:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
12065文章数 176364关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

上海一女子嫌风水不好 屡次掰歪小区两块反光镜

头条要闻

上海一女子嫌风水不好 屡次掰歪小区两块反光镜

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被抵制成功!辽视春晚已将她除名

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

健康
亲子
本地
手机
公开课

耳石脱落为何让人天旋地转+恶心?

亲子要闻

网友:这阶段属于纯阳之体

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

手机要闻

苹果更改iOS 27内部代号,距离亮相仅剩五个月!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版