本文是VCC唐铭锋同学对论文 Aerial Path Online Planning for Urban Scene Updation 的解读,该工作来自深圳大学可视计算研究中心黄惠教授课题组,已发表在国际计算机图形学顶级会议SIGGRAPH 2025上。
该工作提出了一种结合先验概率与实时变化检测的无人机城市场景更新路径规划方法,能高效准确地探测和更新城市环境中的变化区域并显著减少飞行与计算开销,该方法可在后续诸如三维重建和高效城市动态监测等应用中发挥更大作用。
论文标题: Aerial Path Online Planning for Urban Scene Updation 论文链接: https://arxiv.org/abs/2505.01486 项目主页: https://vcc.tech/research/2025/DroneUpdate一、引言
无人机三维城市重建技术近年来在城市规划、数字孪生等领域发展迅速,其核心目标是获取高精度、高完整度的三维模型。现有的大多数方法致力于从零开始重建整个场景,虽然在初次建模时能达到较好的效果,但在需要周期性更新的场景中则显得效率低下。例如,城市环境往往随时间发生局部变化,若采用传统方法对整个区域进行重复扫描和重建,将会在未变化区域浪费大量的飞行时间与计算资源,这凸显了对高效场景更新策略的迫切需求。
本次导读的论文针对这一挑战,提出了一种专为城市环境变化检测与更新而设计的无人机路径规划新算法。该方法创新性地结合了先验知识与实时感知,采用两阶段路径规划策略:首先,基于历史重建数据和变化概率统计生成一条“先验路径”,以优先探索潜在变化区域;其次,一旦在飞行中检测到变化,则会触发“实时路径”规划模块,动态调整飞行轨迹以完整捕获变化区域的细节。通过引入一种新的“场景可变性启发式算法” 来指导路径选择,该工作首次实现了在大幅减少飞行时间和计算成本的同时,保证了能提取出质量优秀的变化区域几何信息,为复杂城市环境的高效、可扩展及自适应更新铺平了道路。
二、技术贡献
本工作主要贡献如下:
首次提出了一种专为城市场景中变化区域检测与更新而设计的路径规划算法,该算法能显著减少飞行时间与计算开销;
引入了一种场景可变性启发式算法,用于评估三维城市场景中的潜在变化,并以此为基础规划实时场景更新飞行轨迹;
通过结合统计先验与实时决策,实现了高质量的场景更新,同时大幅降低了资源消耗,使其能够高效地应用于大型复杂城市环境。
如下表所示,该方法与传统的场景探索算法Region-Division相比,在场景更新效率、变化检测精度(IoU)和资源节约方面均展现出显著优势:
表1 定量比较:该工作在IoU和图像数量上取得最佳的性能 三、方法介绍
面向城市场景更新的在线路径规划方法的核心思想是结合先验知识与实时感知,通过两阶段路径规划策略高效地检测和更新城市环境中的变化区域。该方法主要包括先验路径规划、变化区域检测与提取,以及实时路径规划三个关键环节,并通过候选视角生成模块和场景可变性启发式算法进行支撑。
图1 方法流程示意图先验路径规划
此阶段的目标是基于 时刻已有的场景模型和变化概率统计,规划出一条初始飞行路径,用以高效探索潜在的变化区域并减少对静态区域的重复观测。
此部分输入为 时刻重建的场景模型 及其离散化样本点集(每个点附带先验变化概率 ) , 以及通过候选视角生成模块产生的大量候选视角 。 目标是找到一个最小化的视角子集 , 在减少冗余的同时最大化对 中高变化概率区域的覆盖。这个问题可以表示为:
然后,该工作采用类似于文献[1]的迭代优化框架,但视角的冗余性是根据该工作提出的场景可变性来定义的——即如果一个视角观测的样本点或已被其他视角充分覆盖,或其自身变化概率很低,则该视角被视为冗余。视角的重要性由其观测到的所有样本点的可变性总和来量化:
其中样本 的变化可能性是基于观察样本的视角集 来确定的:
这个公式确保了样本的变化可能性随着其被更多视角观察而逐渐减小。其中,对于任意 有 如下定义:
其中 和 是缩放参数,分别控制未访问和已访问视角的贡献;可见性函数 确定某样本点 是否从视角 中可见,若能被看见则值为1,否则为0。与已访问视角相关的负因子反映了边际效益递减:随着样本被更多的已访问视角观察,其变化可能性逐渐稳定。这符合一个观点:一旦某个样本被观察,其“已变化”或“未变化”的状态逐渐得到确认,每增加一次观察,就获得的新的信息减少。因此,变化可能性会下降,突显了冗余观察的低效性。
优化后得到的视角集合 通过求解旅行商问题(TSP)连接成一条连续的飞行轨迹,这条轨迹即为无人机初始飞行的先验路径。
变化区域检测与提取
当无人机沿先验路径飞行并在特定视角 捕获到当前 时刻的图像 后,将捕获的 与从 模型在相同视角渲染出的图像 进行比较。采用基于学习的图像特征匹配模型(DKM[2]结合GIM[3]自训练框架)来识别两幅图像间没有特征匹配的区域,这些区域被标识为变化的图像区域 。
然后利用预训练的多视角立体匹配方法(DUSt3R[4]),将 作为掩码,对 时刻捕获的图像序列进行三维重建,得到代表变化区域的3D点云 。 为了确保实时性能,重建时仅使用最近的若干图像。
新生成的点云 会与当前已知的变化区域点云 通过IoU进行评估:
以决定是合并还是替换,从而更新变化区域的表示。其中 是可配置的相似性阈值。最终,提取当前时刻检测到的总变化点云 的凸包,作为变化区域的几何表示 , 并用于指导后续的实时路径规划。如果检测到多个变化区域,这些凸包会被加入一个处理队列中。
图2 变化区域提取流程示意图实时路径规划
一旦通过上述环节识别出变化区域 , 系统便切换到实时路径规划模式,目标是对该变化区域进行动态且全面的探索。如果队列中有多个变化区域,系统优先选择距离无人机当前位置最近的作为下一个探索目标。该工作首先对变化区域 进行采样,得到 , 并且令其中 。
候选的下一最佳视角 来源于两部分:先验路径中尚未访问的视角,以及围绕当前变化区域 实时新生成的视角集合 (同样使用泊松盘采样)。筛选出这些候选视角中能至少能观测到 中的一个样本点的:
对于每个候选视角 , 计算其相对于已访问视角序列 的“总变化可能性增益”:
这个增益考虑了该视角能观测到的所有样本点 (包括当前变化区域 中的样本点和先验场景 中的样本点)的可变性,并计入了已访问视角提供的信息。其中为了评估候选视角的贡献,该工作首先考虑该视角能观察到的所有样本的变化可能性。对于样本 , 相对于候选的下一个视角 , 考虑到已访问视角序列 , 其变化可能性定义为:
为避免路径剧烈偏离,系统会从可变性增益最高的K个候选中选择一个距离当前无人机位置最近的作为下一最佳视角。
当一个变化区域探索完毕,系统会处理队列中下一个变化区域。若所有已检测到的变化区域均探索完成,系统会规划路径以覆盖先验路径中遗漏的、且仍能观测到未访问过、且未发生变化的先验样本点区域,确保对整个场景的有效更新。
四、部分结果展示
接下来,该工作展示了该工作在完整城市场景更新流程中的整体效率。在一个包含五个真实变化区域 (B1至B5) 的复杂场景中,通过该工作引导的更新路径与传统的全场景重新探索[5]和重建方法相比,轨迹长度缩短了52%,视角数量减少了71% :
图3 探索与重建效率对比图(黄色为探索路径,蓝色为重建路径)
下面是图3的两种方法探索后的重建结果对比。可以看到,两种方法的重建效果不相上下,说明,本工作确实能在减少探索资源消耗的同时保持与传统方法可比的重建质量:
图4 使用粗代理方法与本方法生成的凸包重建建筑物的视觉比较
此外,该方法还在两个大规模城市场景(粤海和青岛,源自UrbanBIS数据集)得到验证,展示了其可扩展性与实际应用潜力:
图5 在粤海和青岛场景上的结果 五、总结与展望
近年来,对大规模三维城市场景进行高效、及时的动态更新已成为智慧城市、数字孪生等领域的核心需求。传统的场景重建方法主要关注初次建模的完整性与精度,对于周期性的更新任务,因其往往需要完全重访和处理整个场景,从而在未变化区域造成了显著的资源浪费和效率瓶颈。本工作提出的面向城市场景更新的在线路径规划方法,通过结合先验知识与实时在线调整,专注于变化区域的检测与高效勘察,显著减少了不必要的飞行时间与计算开销,为解决这一难题提供了全新的思路与有效的技术途径。
展望未来,该框架在多个方向具有进一步研究和拓展的潜力:首先,开发一种能够根据建筑物高度和场景结构动态调整无人机飞行高度的自适应机制,是提升复杂场景适应性的重要方向;其次,集成或研发更快速、更鲁棒的实时三维重建算法以替代现有方案,将直接提升变化区域三维信息获取的效率,从而增强整个系统的实时响应能力;另一个值得探索的方向是如何将更高级的语义理解与变化预测模型融入路径规划决策中,使无人机能更智能地预判并聚焦于潜在的高价值变化区域。
六、思考与讨论
Q: 该工作在“先验路径”规划阶段依赖历史场景数据和变化概率统计。如果实际场景的变化模式与这些先验统计数据有较大偏差,方法的初始探索效率是否会受到显著影响?
A: 若实际变化与先验有较大出入,发现第一个变化点的时间可能会延长。然而,该工作的核心优势之一在于其两阶段设计与实时适应性。一旦无人机在飞行过程中检测到变化区域,系统将立刻触发“实时路径规划”模块。该模块会动态生成新的飞行路径以确保对新发现的变化区域进行全面勘察,而不再完全依赖初始的先验。因此,尽管不准确的先验可能影响首次发现变化的效率,但系统仍能通过实时路径调整来保证对实际发生变化的区域进行有效覆盖和更新。
Q: 变化检测会不会将几何变化和纹理变化混为一谈,如果只关心几何变化而不关心纹理变化是否能使用该算法?
A: 在进行变化检测的时候确实会检查出纹理的变化。但是并不会影响之后的凸包提取。换句话说,该工作认为一栋重新粉刷后的楼也是应该更新的区域。局限性是,如果面对春天和冬天的同一个场景不能做到很好的检测。
以下是开放性问题,欢迎读者朋友留言讨论:
Q: 当前提出的路径规划框架主要针对单架无人机执行任务。若要进一步提升大规模城市场景的更新效率与覆盖速度,应如何将此框架扩展至支持多无人机协同作业?在协同场景下,会面临哪些新的路径规划、任务分配、数据融合以及通信协调等方面的挑战?
作者:唐铭锋 来源: 公众号【深圳大学可视计算中心】
llustration From IconScout By Scout Stores
-The End-
扫码观看!
本周上新!
“AI技术流”原创投稿计划
TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。
投稿内容
// 最新技术解读/系统性知识分享 //
// 前沿资讯解说/心得经历讲述 //
投稿须知
稿件需要为原创文章,并标明作者信息。
我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励
投稿方式
发送邮件到
melodybai@thejiangmen.com
或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。
关于我“门”
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
bp@thejiangmen.com
点击右上角,把文章分享到朋友圈
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.