网易首页 > 网易号 > 正文 申请入驻

纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025

0
分享至

新智元报道

编辑:LRST

【新智元导读】OpenGS-SLAM是一种新的RGB-only SLAM系统,专门用于无界户外场景。它通过点图回归网络和3D高斯分布(3DGS)表示,实现了精准的相机定位和高保真的场景重建,显著提升了跟踪精度和新视角合成的效果。

在自主驾驶、机器人导航、AR/VR等前沿应用中,Simultaneous Localization and Mapping (SLAM) 是核心技术之一。

现有基于3D高斯分布(3DGS)的SLAM方法虽在室内场景表现出色,但使用仅RGB输入来处理无界的户外场景仍然面临挑战:

  • 准确的深度和尺度估计困难,这影响了姿态精度和3DGS初始化

  • 图像重叠有限且视角单一,缺乏有效的约束,导致训练难以收敛

为了解决上述挑战,港科广团队提出全新解决方案OpenGS-SLAM,仅凭RGB图像实现高精度定位与逼真场景重建。

论文链接:https://arxiv.org/abs/2502.15633

代码链接:https://github.com/3DAgentWorld/OpenGS-SLAM

官方主页:https://3dagentworld.github.io/opengs-slam/

具体来说,该方法采用了一个点图回归网络来生成帧间一致的点图,储存了来自多个标准视角的3D结构,包含了视角关系、2D到3D的对应关系和场景几何信息,使得相机位姿估计更加稳健,有效缓解了预训练深度网络的误差问题。

此外,将相机位姿估计与3DGS渲染集成到一个端到端可微的管道中,实现了位姿和3DGS参数的联合优化,显著提高了系统的跟踪精度。

文中还设计了一种自适应比例映射器和动态学习率调整策略,能够更准确地将点图映射到3DGS地图表示。

值得注意的是,在Waymo数据集上的实验表明,OpenGS-SLAM将追踪误差降低至现有3DGS方法的9.8%,研究人员还在新视角合成任务上建立了一个新的基准,达到了最先进的结果。

摘要

3D Gaussian Splatting(3DGS)已成为SLAM领域的一种流行解决方案,因其能够生成高保真的新视角图像。

然而,现有的基于3DGS的方法主要针对室内场景,并依赖于RGB-D传感器或预训练的深度估计模型,因此在户外场景中的表现较差。

为了解决这一问题,研究人员提出了一种针对无界户外场景的纯RGB 3DGS SLAM方法OpenGS-SLAM。

从技术上来说,该方法先引入了一种Pointmap回归网络,用于在不同帧之间生成一致的Pointmap以进行位姿估计。

与常用的深度图相比,Pointmap能够包含跨多个视角的空间关系和场景几何信息,从而实现更鲁棒的相机位姿估计。

随后,将估计得到的相机位姿与3DGS渲染结合,构建端到端可微分优化管线,使得相机位姿与3DGS场景参数能够同时优化,显著提高了系统的跟踪精度。

此外,研究人员还为Pointmap回归网络设计了一种自适应尺度映射器(Adaptive Scale Mapper),能够更准确地将Pointmap映射到3DGS结构表示中。

在Waymo数据集上的实验结果表明,OpenGS-SLAM将跟踪误差降低至现有3DGS方法的9.8%,并在新视角合成(Novel View Synthesis, NVS)任务上达到了最新的SOTA结果。

效果展示

如下图所示,在Waymo数据集的无界户外场景上,该方法能渲染高保真的新视角图片,准确捕捉车辆、街道和建筑物的细节。相比之下,MonoGS和GlORIE-SLAM存在渲染模糊和失真的问题。

如下图所示,该方法拥有明显更优的追踪性能,在面临大转弯时也能稳定收敛。

基本原理

下图为SLAM方法的管线示意图,每一帧都会输入一张 RGB 图像用于追踪,当前帧和上一帧作为图片对输入到Pointmap回归网络进行位姿估计,随后基于当前的3D高斯地图进行位姿优化。

在关键帧处,系统执行地图更新,并通过自适应尺度映射器(Adaptive Scale Mapper)对 Pointmap 进行处理,以插入新的3D高斯点。

此外,相机位姿与3D高斯地图会在局部窗口内进行联合优化,确保更精准的追踪与场景重建。


追踪
帧间点图回归与位姿估计

之前基于3DGS和NeRF的SLAM工作,主要集中在室内和小规模场景中,其中相机的运动幅度较小,视角密集。

在这种情况下,NeRF或3DGS可以直接用于优化相机位姿。然而,户外场景通常涉及基于车辆的摄影,特征是运动幅度较大且视角相对稀疏,使得直接优化相机位姿难以收敛。

鉴于点图包含视角关系、2D到3D的对应关系和场景几何信息,研究人员提出了一种基于帧间点图回归网络的位姿估计方法,旨在实现稳健且快速的当前帧相机位姿估计。

研究人员利用一个预训练的点图回归网络,结合了ViT编码器、带有自注意力和交叉注意力层的Transformer解码器以及一个MLP回归头,生成连续帧图像的点图,两个图像分支之间的信息共享有助于点图的正确对齐。

尽管应用点图可能看起来有些反直觉,但它能够在图像空间中有效表示3D形状,并且允许在不同视角的射线之间进行三角测量,而不受深度估计质量的限制。

随后,使用稳健且广泛应用的RANSAC和PnP来推断两帧之间的相对姿态,使用这种方法,估计第k帧的位姿为


位姿优化

为了实现精确的相机位姿追踪,研究人员基于3DGS可微光栅化管道,构建一套可微的相机位姿优化方法,定义光度损失为:

其中rr表示每个像素的可微渲染函数,通过高斯GG和相机位姿TCWTCW生成图像,IˉIˉ表示真实图像。光度损失LphoLpho关于位姿TCWTCW的梯度为:

通过这些步骤,利用渲染函数的微分,将增量位姿更新与光度损失紧密关联。这一策略使得相机位姿能够基于 3DGS 渲染结果 进行端到端优化,从而确保高精度且稳定的位姿跟踪。


3DGS场景表示

研究人员使用3DGS作为场景表示,提出自适应尺度映射器(Adaptive Scale Mapper),在关键帧时为地图插入新的高斯点。

利用先前获得的点图来映射3D高斯地图,由于帧间点图存在尺度不稳定的问题,基于点匹配关系计算连续帧之间的相对尺度变化因子,以确保整个场景的尺度一致性。


建图
高斯地图优化

研究人员管理一个局部关键帧窗口W,以选择观察相同区域的非冗余关键帧,为后续的建图优化提供更高效的多视角约束。

在每个关键帧上,通过联合优化W窗口中的高斯属性和相机位姿来实现局部BA,优化过程仍然通过最小化光度损失进行。

为了减少高斯椭球体的过度拉伸,采用了各向同性正则化:

高斯地图优化任务可以总结为:

自适应学习率调整

在经典的室内SLAM数据集中,相机通常围绕小范围场景运动并形成闭环,使高斯优化的学习率随迭代次数逐渐衰减。

然而,文中研究的户外数据由前向车辆相机捕获,所经过区域不会重访,因此需要不同的学习率衰减策略。

为此,研究人员提出了一种基于旋转角度的自适应学习率调整策略:当车辆沿直路行驶时,学习率逐步衰减;在遇到坡道或转弯时,动态提升学习率,以更有效地优化新场景。

首先,计算当前关键帧和上一关键帧之间的旋转矩阵R1和R0,其相对旋转矩阵为

,接着计算旋转弧度:

接着将弧度θrad转换为度数θ,并根据以下公式调整累计迭代次数:

当旋转角度达到90度时,累积迭代次数将被重置。

实验结果

精度

该方法在Waymo数据集上实现了新视角合成(NVS)的最佳性能。在追踪精度方面,与GlORIE-SLAM相当;而相比同样基于3DGS的SLAM方法MonoGS,误差降低至9.8%,显著提升了系统的鲁棒性和准确性。


消融研究

下表显示,自适应学习率调整和自适应尺度映射均对整体性能产生积极影响,而Pointmap回归网络更是该方法的核心支撑,对系统性能至关重要。

总结

OpenGS-SLAM是一种基于3DGS表示的RGB-only SLAM系统,适用于无界的户外场景。该方法将点图回归网络与3DGS表示结合,确保精确的相机姿态跟踪和出色的新视图合成能力。

与其他基于3DGS的SLAM系统相比,该方法在户外环境中提供了更高的跟踪精度和鲁棒性,使其在实际应用中具有较高的实用性。

参考资料:

https://arxiv.org/abs/2502.15633

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
程序员猝死反转!妻子拿了钱,事后倒打一耙,难怪很难认定是工伤

程序员猝死反转!妻子拿了钱,事后倒打一耙,难怪很难认定是工伤

阿纂看事
2026-01-23 15:55:20
央视官宣!国足冲亚洲杯冠军,足协重要决定:安东尼奥新职位曝光

央视官宣!国足冲亚洲杯冠军,足协重要决定:安东尼奥新职位曝光

冷紫葉
2026-01-22 19:20:23
詹姆斯回应珍妮巴斯言论:别把事情想的太复杂,谈是否离队:很好

詹姆斯回应珍妮巴斯言论:别把事情想的太复杂,谈是否离队:很好

你的篮球频道
2026-01-23 15:13:32
外媒:阿根廷总统米莱称,不必在美国和中国之间做选择,中国是“伟大”的贸易伙伴

外媒:阿根廷总统米莱称,不必在美国和中国之间做选择,中国是“伟大”的贸易伙伴

环球网资讯
2026-01-22 22:29:07
2026年首次:乌克兰摧毁杰巴利采沃的俄军巨型弹药库!

2026年首次:乌克兰摧毁杰巴利采沃的俄军巨型弹药库!

项鹏飞
2026-01-21 18:53:05
日本为何多次索要辛追夫人头发?多年后真相曝光,日本人居心叵测

日本为何多次索要辛追夫人头发?多年后真相曝光,日本人居心叵测

文史道
2025-07-18 20:15:00
决战今晚!1月23日晚19:30!中央5套CCTV5、CCTV5+直播节目表

决战今晚!1月23日晚19:30!中央5套CCTV5、CCTV5+直播节目表

皮皮观天下
2026-01-23 10:54:48
南部空军霸气官宣:“从今以后,绝不允许有人对我大声说话”

南部空军霸气官宣:“从今以后,绝不允许有人对我大声说话”

武器纵论
2026-01-21 22:11:41
65岁大爷半月换掉5保姆,儿子让女友扮保姆探真相,发现个大秘密

65岁大爷半月换掉5保姆,儿子让女友扮保姆探真相,发现个大秘密

林林故事揭秘
2025-04-10 20:40:12
斯诺克战报!吴宜泽7胜1负夺冠,赵心童2连亚后退赛,147先生陪跑

斯诺克战报!吴宜泽7胜1负夺冠,赵心童2连亚后退赛,147先生陪跑

刘姚尧的文字城堡
2026-01-23 06:41:42
重返英超?阿尔瓦雷斯不满马竞,阿森纳、切尔西同时开启谈判

重返英超?阿尔瓦雷斯不满马竞,阿森纳、切尔西同时开启谈判

夜白侃球
2026-01-23 16:19:43
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
中国空军立下规矩:从今以后,绝不允许有人对我大声说话!

中国空军立下规矩:从今以后,绝不允许有人对我大声说话!

诗酒趁的年华
2026-01-23 08:43:32
广州10年没下雪了!广州天气:要下雨了

广州10年没下雪了!广州天气:要下雨了

鲁中晨报
2026-01-23 07:11:29
梁洛施不再隐瞒!坦言与李泽楷分手原因,事实证明,我们都被骗了

梁洛施不再隐瞒!坦言与李泽楷分手原因,事实证明,我们都被骗了

素衣读史
2026-01-22 15:21:31
断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

达文西看世界
2026-01-18 20:56:11
98年泸定县惨案:690元引发血案,24岁民警遭围殴后枪杀10名村民

98年泸定县惨案:690元引发血案,24岁民警遭围殴后枪杀10名村民

谈史论天地
2026-01-21 23:20:03
俄罗斯亡中国寒?不!比西方围堵更可怕的,是我们的妄自菲薄

俄罗斯亡中国寒?不!比西方围堵更可怕的,是我们的妄自菲薄

指忘崖
2026-01-23 17:07:57
火箭最该交易的三人确定!申京不上场就是帮助球队,乌度卡在作死

火箭最该交易的三人确定!申京不上场就是帮助球队,乌度卡在作死

小彭美识
2026-01-23 16:43:41
记者:C罗预计明年夏天离开利雅得胜利,不排除就此退役

记者:C罗预计明年夏天离开利雅得胜利,不排除就此退役

懂球帝
2026-01-23 06:38:48
2026-01-23 18:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14392文章数 66525关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

21岁女孩确诊白血病后急寻亲生父母:已签病危通知书

头条要闻

21岁女孩确诊白血病后急寻亲生父母:已签病危通知书

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

本地
旅游
时尚
公开课
军事航空

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

旅游要闻

走进伊春冰雪森林,赴一场童话之约

告别臃肿!这种简约的高级穿法,别拒绝

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军首艘“高超导弹战舰”出海测试

无障碍浏览 进入关怀版