网易首页 > 网易号 > 正文 申请入驻

BEV下统一的多传感器融合框架 - FUTR3D

0
分享至

在自动驾驶汽车或者移动机器人上,通常会配备许多种传感器,比如:光学相机、激光雷达、毫米波雷达等。由于不同传感器的数据形式不同,如RGB图像,点云等,不同模态数据的信息密度和特性也不同。如何能够有效地融合各个模态的数据使得车或机器人能够准备地感知周围的场景是一个非常关键的问题。

论文名称: FUTR3D: A Unified Sensor Fusion Framework for 3D Detection 论文链接: https://arxiv.org/abs/2203.10642 网站链接: https://tsinghua-mars-lab.github.io/futr3d/

之前多模态融合的工作主要是为特定的传感器组合设计算法,比如用图像去增强点云(PointPainting,MVP)、用图像检测框去辅助点云检测(Frustum PointNet)等。而在FUTR3D中,我们试着在BEV下构建一个通用的可容纳各种不同传感器的3D目标检测框架。

FUTR3D的主要贡献如下:

  1. 通用框架。FUTR3D是第一个通用的可适应各种不同传感器的端到端的三维目标检测框架。

  2. 有效性。它在Camera, LiDAR, Camera+LiDAR , Camera+Radar等不同的传感器组合情况下都能实现领先效果。

  3. 低成本。FUTR3D在Camera+4线LiDAR的情况下能够超过32线LiDAR的结果,因此能够促进低成本的自动驾驶系统。

一、FUTR3D方案

FUTR3D主要包括Modality-Specific Feature Extractor, Modality-Agnostic Feature Sampler和Loss。

Modality-Specific Feature Extractor

对于不同的传感器输入数据,我们根据它们各自的模态形式分别用不同的backbone去提取它们的特征。

  • 对于camera images,采用ResNet50/101和FPN来对每张图片提取多尺度的特征图。

  • 对于LiDAR point clouds,用PointPillar或者VoxelNet来提取点云的特征。

  • 对于Radar point clouds,用3层MLP来提取每个Radar point的特征。

Modality-Agnostic Feature Sampler

模态无关的特征采样器,下面简称MAFS,是FUTR3D的detection head与各个模态的特征进行交互的部分。

类似于DETR3D,MAFS含有600个object query,每个query会经过一个全连接网络预测出在BEV下的3D reference points。

对于camera部分,我们依照DETR3D的做法,利用相机的内外参数将reference points投影到image上采集feature,得到 。具体做法可以参看,这里就不详细展开。

对于LiDAR部分,我们按照reference points在3D空间中的坐标,投影到LiDAR BEV特征上去采集它在LiDAR feature map上对应位置的feature,得到 。

对于Radar部分,根据每个reference points的位置,选取离它最近的10个Radar points的特征,并聚合在一起得到 。

采集得到各个模态的对应特征之后,将它们concatenate到一起,并经过一个MLP网络投射到一个共同的特征空间中。

之后再利用 以及reference points的位置编码去更新object query的信息。


在FUTR3D中,我们同样有6层decoder layer,在每层decoder layer中,用object query之间的self attention和MAFS去更新object query的信息,并且每个query会去通过MLP网络去预测得到bounding box的参数和reference points的offsets去迭代更新每一层的预测结果。

Loss

在loss部分,我们先利用Hungarian算法来将每个object query预测得到的bbox去和ground-truth box进行二分图匹配,得到最优的matching方案,然后对匹配成功的box计算regression L1 loss和classification focal loss,没有匹配到gt box的predicted box就只计算classification loss。

二、实验结果

FUTR3D作为一个通用框架,在各个不同传感器的配置下都能取得state-of-the-art的结果,超过针对特定输入组合的算法。特别是在低线LiDAR,如1线、4线等,FUTR3D表现出了很好的鲁棒性,结果远超其他方案。值得一提的是,在Cameras+4线LiDAR的情况下,FUTR3D达到了56.8mAP,超过了32线LiDAR的sota结果56.6mAP(CenterPoint)。

表1 Cameras和LiDAR融合的结果

表2 Cameras和Radar融合的结果

三、结果分析

由于FUTR3D的通用性,我们得以分析各个模态在目标检测中不同的特性。

在Cameras+LiDAR融合中,Cameras对体积小和距离远的物体有着显著的帮助作用。

表3 对不同距离的物体的模型表现可视化结果

在各种不同传感器配置组合的融合中,我们发现一些非常有趣的场景,并由其可以对比看出各个不同传感器之间不同的特性。

在Cameras+4 Beam LiDAR和32 Beam LiDAR的对比中,可以看出即使点云稀疏得多的情况下,相机也能极大地帮助检测那些体积小和距离远导致point很少的物体。

图1 Cameras+4线LiDAR vs. 32线LiDAR对比

在Cameras+1线LiDAR和Cameras-only的对比中,可以看到即使只有一线LiDAR,也可以通过它提供的距离信息来帮助检测。

图2 Cameras+1线LiDAR vs. Cameras-only 对比参考

[1] FUTR3D: A Unified Sensor Fusion Framework for 3D Detection

https://arxiv.org/abs/2203.10642

本文来自:知乎专栏【清华MARS Lab】 作者: 赵行

Illustration b y Oleg Shcherba from icon s8

-The End-

扫码观看!

本周上新!

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世界杯悲喜一夜:西班牙大胜4-0,比利时爆冷,伊朗登顶

世界杯悲喜一夜:西班牙大胜4-0,比利时爆冷,伊朗登顶

老斉科普君
2026-06-24 00:55:47
特朗普最新民调公布……

特朗普最新民调公布……

商业周刊中文版
2026-06-23 15:33:32
全球首次,AI 自主杀人

全球首次,AI 自主杀人

新动察
2026-06-22 15:06:59
一刀切关停舞厅,到底是净化风气,还是断了普通人的活路?

一刀切关停舞厅,到底是净化风气,还是断了普通人的活路?

成都人的故事
2026-06-23 22:35:08
金靴争夺白热化!3人进球4+,72年第一次,压力给到凯恩C罗

金靴争夺白热化!3人进球4+,72年第一次,压力给到凯恩C罗

奥拜尔
2026-06-23 10:40:22
出大事了!网传福耀科大校长王树国论文涉嫌抄袭被举报…

出大事了!网传福耀科大校长王树国论文涉嫌抄袭被举报…

慧翔百科
2026-06-23 08:29:42
有退休金的人发现一个奇怪的现象:手里有20、30万存款的老人,最后过得好的,几乎都做了同两个让子女意外的决定

有退休金的人发现一个奇怪的现象:手里有20、30万存款的老人,最后过得好的,几乎都做了同两个让子女意外的决定

心理观察局
2026-06-07 06:37:04
台监察机构晚间惊传命案!一名58岁男技工陈尸库房

台监察机构晚间惊传命案!一名58岁男技工陈尸库房

海峡导报社
2026-06-23 10:18:12
6届世界杯破门首人!C罗9球追平黑豹,破4年大赛球荒,连刷7纪录

6届世界杯破门首人!C罗9球追平黑豹,破4年大赛球荒,连刷7纪录

奥拜尔
2026-06-24 01:08:42
事情迎来反转!官方公开点名全红婵,陈若琳当初的话果然应验

事情迎来反转!官方公开点名全红婵,陈若琳当初的话果然应验

涵豆说娱
2026-06-24 02:11:21
拍吻戏被传染口臭!男星爆「戴口罩都闻到腐臭味」 下场惨遭全网出征

拍吻戏被传染口臭!男星爆「戴口罩都闻到腐臭味」 下场惨遭全网出征

ETtoday星光云
2026-06-22 15:47:36
一老人拉拽坐地铁爱心专座的女孩要求其让座,目击者称女孩妈妈表示“让座可以,但要好好说”,成都地铁:倡导尊老爱幼,但没有强制要求

一老人拉拽坐地铁爱心专座的女孩要求其让座,目击者称女孩妈妈表示“让座可以,但要好好说”,成都地铁:倡导尊老爱幼,但没有强制要求

扬子晚报
2026-06-23 11:05:38
女副处只有性别是真的

女副处只有性别是真的

晓记
2026-06-22 11:00:31
哈兰德“自认必输”言论引爆法国挪威对决

哈兰德“自认必输”言论引爆法国挪威对决

体坛观察猿
2026-06-24 00:49:51
中国00后美少女2-0横扫6冠王,柏林赛冠军爆冷出局

中国00后美少女2-0横扫6冠王,柏林赛冠军爆冷出局

铿锵格斗
2026-06-23 23:24:48
传阿里作价70-90亿出售灵犀互娱 潜在买家包括三七互娱、中国儒意、世纪华通和巨人网络等

传阿里作价70-90亿出售灵犀互娱 潜在买家包括三七互娱、中国儒意、世纪华通和巨人网络等

游戏干线
2026-06-24 00:27:41
不要动!6月23日金价行情拐点已清晰,6月底或迎更大变盘?

不要动!6月23日金价行情拐点已清晰,6月底或迎更大变盘?

生活新鲜市
2026-06-23 21:08:09
世界杯16场16球!姆巴佩狂飙:超越大罗 追赶梅西 历史第2人

世界杯16场16球!姆巴佩狂飙:超越大罗 追赶梅西 历史第2人

叶青足球世界
2026-06-23 08:20:02
2纪录+5球大胜!率葡萄牙战舰扬帆起航,C罗绝代双骄的荣光

2纪录+5球大胜!率葡萄牙战舰扬帆起航,C罗绝代双骄的荣光

刘哥谈体育
2026-06-24 04:23:10
乌兹队医:我不明白为什么卡纳瓦罗在意大利没有得到认可

乌兹队医:我不明白为什么卡纳瓦罗在意大利没有得到认可

懂球帝
2026-06-23 15:00:07
2026-06-24 04:48:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2411文章数 596关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

葡萄牙5-0乌兹别克斯坦 C罗梅开二度

头条要闻

葡萄牙5-0乌兹别克斯坦 C罗梅开二度

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

AI“算力稀缺”信仰开始动摇?

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

亲子
家居
本地
公开课
军事航空

亲子要闻

宝妈带娃避雨后续!酒店晒监控,真相完全不一样,双方已达成谅解

家居要闻

绿意盎然 自然之境

本地新闻

吃一次广东龙舟饭,才懂什么是豪华盛宴

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以色列总理、国防部长和国防军总参谋长发表联合声明

无障碍浏览 进入关怀版