网易首页 > 网易号 > 正文 申请入驻

让AI探测器看得见"不确定":奔驰如何让自动驾驶汽车变得更谨慎

0
分享至


在斯图加特的奔驰研究中心,一群科学家正在解决一个关键问题:如何让人工智能承认自己的不确定性。这项由梅赛德斯-奔驰公司联合斯图加特大学和纽伦堡-埃尔兰根大学共同完成的研究于2026年3月发表在arXiv预印本平台,论文编号为2603.01847v1。有兴趣深入了解的读者可以通过这个编号查询完整论文。

想象一下,当你在雾天开车时,你会自然地放慢速度,因为你知道视线不清楚可能存在危险。然而,目前大多数AI目标检测系统就像一个过于自信的司机,即使在看不清楚的情况下,也会给出非常肯定的判断。这种过度自信在自动驾驶这样的安全关键应用中可能带来灾难性后果。

研究团队注意到,现有的AI视觉系统在识别物体时,虽然能够给出"这是一辆车"的判断和置信度,但它们无法表达对物体位置和大小的不确定性。就好比一个人能够确定地说"那里有一辆车",但却无法告诉你"我不太确定那辆车的确切位置和大小"。这种"空间不确定性"的缺失意味着系统可能在关键时刻做出错误的决策。

为了解决这个问题,研究团队开发了一种名为GroupEnsemble的新方法。这个方法的巧妙之处在于,它就像让多个独立的观察员同时观察同一个场景,然后通过比较他们的观察结果来判断哪些地方存在分歧,从而识别出不确定性。

一、探测器的"眼睛"是如何工作的

为了理解GroupEnsemble的创新之处,我们首先需要了解现代AI目标检测系统的工作原理。目前最先进的检测系统之一被称为DETR(Detection Transformer),它的工作方式就像一个经验丰富的侦探在案发现场寻找线索。

DETR系统包含三个主要组件,就像侦探工作的三个步骤。首先是"现场勘查"环节,系统的编码器负责扫描整张图像,提取出重要的视觉特征,就像侦探仔细观察现场的每个角落。接着是"分析推理"环节,解码器接收这些特征信息,并使用一组特殊的"查询探针"来寻找图像中的物体。这些查询探针就像侦探心中的问题:"这里是否有车辆?那里是否有行人?"最后是"得出结论"环节,分类和回归头负责给出最终的检测结果:物体的类别、位置和置信度。

然而,传统DETR系统的一个根本缺陷是,它只能给出确定性的答案。当系统检测到一辆汽车时,它会输出一个精确的边界框坐标,却无法表达"我对这个位置有70%的把握"或"这个物体的边界可能在这个范围内变动"这样的空间不确定性信息。

二、现有解决方案的困境

面对这个问题,研究人员之前尝试过两种主要方案,但都存在明显缺陷。

第一种方案叫做蒙特卡罗dropout(MC-Dropout),就像让同一个侦探在不同的精神状态下多次观察同一个现场。具体来说,系统在推理时会保持某些神经网络连接的随机断开状态,通过多次运行得到不同的检测结果,然后分析这些结果之间的差异来估计不确定性。这种方法的问题在于,就像让侦探反复勘查现场一样,需要大量的时间成本,导致检测速度大幅下降,无法满足自动驾驶等实时应用的需求。

第二种方案叫做深度集成(Deep Ensembles),相当于训练多个完全独立的侦探,让他们各自分析同一个案例,然后综合所有人的意见。虽然这种方法通常能提供高质量的不确定性估计,但需要存储和运行多个完整的模型,内存消耗巨大,就像雇佣多个侦探团队一样成本高昂,在实际应用中往往不现实。

三、GroupEnsemble的巧妙解决方案

研究团队设计的GroupEnsemble方法采用了一个聪明的策略:在同一个侦探团队内部培养多个具有不同观察角度的小组。

具体来说,GroupEnsemble利用了一个现有技术叫做Group DETR的特性。在训练阶段,Group DETR会创建多个不同的查询组,每个组都包含一定数量的查询探针。这些查询组在训练过程中会随机初始化,导致它们学会从不同的角度观察和分析图像,就像同一个侦探团队中的不同小组各有各的工作方式和观察重点。

传统的Group DETR在推理时只使用第一个查询组,而丢弃其他同样训练有素的查询组。GroupEnsemble的创新在于充分利用所有这些查询组,让它们同时对同一张图像进行检测,产生多个独立的检测结果集合。

为了确保这些查询组真正独立工作,研究团队设计了一个特殊的注意力掩码机制。这个掩码就像在开放式办公室里为不同小组设置隔音屏障,确保各组在分析时不会相互影响,从而保证检测结果的多样性。通过这种方式,系统能够在单次推理过程中获得多个独立的检测结果,避免了重复运行的时间开销。

四、将多样化结果转化为不确定性信息

获得多个检测结果后,GroupEnsemble需要将这些结果转化为有用的不确定性信息。这个过程分为两个关键步骤:聚类和聚合。

聚类步骤就像整理侦探们的证据报告。系统使用一种叫做BSAS(基本序列算法方案)的聚类方法,将指向同一个真实物体的多个检测结果归为一组。判断标准包括两个方面:检测框之间的重叠程度(IoU值)和预测的物体类别是否一致。这样,针对同一辆汽车的多个检测结果会被归入同一个聚类。

聚合步骤则负责从每个聚类中提取最终的检测结果和不确定性信息。对于语义不确定性(即对物体类别的不确定性),系统会考虑有多少个查询组检测到了该物体。如果只有少数查询组发现了某个物体,而其他组都将其视为背景,这可能表明该检测是误报,因此系统会相应降低其置信度。

对于空间不确定性,系统会分析同一聚类中不同检测框之间的位置和大小差异。差异越大,表明系统对该物体的精确位置越不确定。系统会计算这些检测框的加权平均值作为最终的边界框,并用方差来量化空间不确定性。这种方法优先考虑高置信度的检测结果,同时用低置信度的异常值来评估整体的不确定性水平。

五、实验验证的全面表现

研究团队在三个不同的数据集上验证了GroupEnsemble的效果,这些数据集涵盖了从自动驾驶到日常物体检测的多种应用场景。

在Cityscapes数据集(包含2975张训练图像和500张验证图像的城市街道场景)的测试中,GroupEnsemble展现出了与MC-Dropout相当的性能。更令人印象深刻的是,当研究团队将GroupEnsemble与MC-Dropout结合使用时(称为MC-GroupEnsemble),得到了超越深度集成方法的结果。

具体的性能数据显示,在Cityscapes数据集上,确定性基准系统的PDQ(概率检测质量)得分仅为9.4,而MC-GroupEnsemble达到了21.4的高分,提升幅度超过一倍。在检测准确性方面,确定性系统的平均精度(mAP)为37.8%,而MC-GroupEnsemble达到了39.2%,在提供不确定性估计的同时还提升了检测性能。

在计算效率方面,GroupEnsemble的优势更加明显。深度集成方法需要存储五个完整模型,参数量增加107%,推理延迟达到53.4毫秒,比基准系统慢5倍。相比之下,GroupEnsemble仅增加0.7%的参数量,推理延迟为18.4毫秒,比基准系统慢1.7倍,但比深度集成方法快66%。

在更具挑战性的雾天场景(Foggy Cityscapes数据集)测试中,MC-GroupEnsemble同样表现出色,PDQ得分达到19.1,显著超越了确定性基准的9.5和深度集成的17.5。这表明该方法在恶劣天气条件下能够更好地识别和量化检测的不确定性。

在COCO数据集(包含80个日常物体类别)的测试中,MC-GroupEnsemble的PDQ得分与深度集成方法持平(均为19.1),但计算成本显著更低。这证明了该方法在通用物体检测任务中的有效性。

六、深入分析关键设计选择

研究团队通过详细的消融实验验证了方法中几个关键设计选择的合理性。

关于查询组数量的选择,实验表明增加查询组数量能够提升不确定性估计的质量。从单组到九组,PDQ得分从9.4逐步提升至19.7。这是因为更多的查询组能够生成更多样化的检测结果,为同一物体提供更丰富的空间变化信息,从而得到更准确的方差估计。同时,由于transformer解码器的并行处理能力,增加查询组数量对计算延迟的影响相对较小。

在置信度聚合策略的选择上,研究团队比较了三种方法:简单平均、最大值和加权最大值。实验发现,直接使用聚类内检测结果的平均置信度会导致系统过于保守,产生校准不佳的预测。使用未经调整的最大置信度则会导致系统过于自信。最终采用的加权最大值方法通过考虑聚类大小来调整置信度,在检测质量和校准性能之间取得了最佳平衡。

研究团队还发现,通过在批处理维度上处理不同查询组,可以避免自注意力机制的内存开销呈平方级增长,这是实现高效并行处理的关键技术细节。

七、方法的独特优势和意义

GroupEnsemble的最大优势在于它充分利用了DETR架构的固有并行性。传统的不确定性估计方法要么需要多次推理过程,要么需要多个独立模型,而GroupEnsemble能够在单次推理中同时获得多个独立检测结果,这是该方法效率优势的根本原因。

从校准性能来看,MC-GroupEnsemble在所有测试数据集上都显示出良好的校准特性。校准质量通过D-ECE(检测期望校准误差)指标衡量,该指标评估预测置信度与实际准确率之间的一致性。良好的校准意味着当系统表示90%置信度时,其预测确实有90%的准确率,这对安全关键应用至关重要。

该方法的另一个重要特点是其通用性。由于Group DETR本身是一个可以应用于几乎任何DETR类模型的训练方法,GroupEnsemble继承了这种灵活性,可以与条件DETR、可变形DETR等多种变体结合使用。

八、实际应用前景和影响

GroupEnsemble的研究成果对自动驾驶技术的发展具有重要意义。在自动驾驶系统中,准确的不确定性估计能够帮助系统在遇到模糊或困难情况时做出更谨慎的决策,比如在雾天或雨天减速行驶,或者在检测到高不确定性时提醒人类接管。

在实际部署中,该方法的低计算开销使其能够在车载计算平台上实时运行。相比需要多个完整模型的深度集成方法,GroupEnsemble仅需要额外0.7%的参数存储空间,这在内存受限的嵌入式系统中具有重要价值。

该技术的应用范围不限于自动驾驶。在医疗影像分析、工业质量检测、安防监控等需要高可靠性的计算机视觉应用中,能够量化检测不确定性的系统都能提供额外的安全保障。当系统检测到高不确定性时,可以触发人工审核或采取保守策略,避免因错误检测导致的严重后果。

从技术发展角度来看,这项研究开辟了一个新的研究方向:如何更好地利用transformer架构的并行性来实现高效的不确定性估计。随着transformer在更多计算机视觉任务中的普及应用,这种思路可能启发更多创新方法的出现。

说到底,GroupEnsemble代表了AI安全性研究的一个重要进展。它不仅解决了现有方法在效率和性能之间的矛盾,更重要的是为构建"知道自己不知道什么"的AI系统提供了一个实用的解决方案。在AI技术日益融入我们日常生活的今天,这种能够表达不确定性的谦逊态度可能比绝对的准确性更加珍贵。对于普通人来说,这意味着未来的AI驾驶员会更加谨慎可靠,在不确定的情况下不会冒然行动,而是会寻求帮助或采取保守策略,这正是我们在安全关键应用中最需要的特质。

Q&A

Q1:GroupEnsemble是什么?

A:GroupEnsemble是奔驰公司联合斯图加特大学开发的AI不确定性估计方法。它能让目标检测系统在识别物体时不仅给出"这是什么",还能表达"我有多确定物体在这个位置",就像让AI学会说"我不太确定",这对自动驾驶等安全应用很重要。

Q2:GroupEnsemble比现有方法有什么优势?

A:GroupEnsemble最大优势是效率高。相比需要多次运行的MC-Dropout方法和需要多个模型的深度集成方法,它能在一次推理中获得多个独立检测结果,速度快66%,内存占用仅增加0.7%,同时保持相当的不确定性估计质量。

Q3:这项技术什么时候能应用到实际的自动驾驶汽车上?

A:技术本身已经在实验室环境中验证有效,但要应用到商业自动驾驶汽车还需要进一步的工程化和安全验证。考虑到奔驰公司的参与,这项技术有望在未来几年内集成到奔驰的自动驾驶系统中,让汽车在不确定情况下变得更谨慎。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
悲催!鹤壁58岁知名律师心脏骤停去世,网友:死亡真的会随时降临

悲催!鹤壁58岁知名律师心脏骤停去世,网友:死亡真的会随时降临

火山詩话
2026-03-26 16:09:00
上篮两不沾,最后6秒后场乱扔!NBA最丑陋一场,真有队伍故意输球

上篮两不沾,最后6秒后场乱扔!NBA最丑陋一场,真有队伍故意输球

嘴炮体坛
2026-03-26 20:00:24
史前大洪水掩盖什么真相?所有文明都曾记录,是人类共同的记忆?

史前大洪水掩盖什么真相?所有文明都曾记录,是人类共同的记忆?

历史甄有趣
2026-03-20 15:40:07
巨亏36.8亿!中国光刻机突围,没想到最先顶不住的竟是日本?

巨亏36.8亿!中国光刻机突围,没想到最先顶不住的竟是日本?

百科密码
2026-03-26 14:50:58
中方坚决扣留船只,美方及时干预 取消中企投标资格,巴拿马难挽

中方坚决扣留船只,美方及时干预 取消中企投标资格,巴拿马难挽

南宗历史
2026-03-25 16:04:15
孙子生日,我转了8888元给儿媳,她回复2个字,我直接冻结银行卡

孙子生日,我转了8888元给儿媳,她回复2个字,我直接冻结银行卡

清茶浅谈
2025-09-07 23:32:29
逃亡沙特不久,马步芳强取亲侄女为妻,蒋介石:他让我颜面尽失

逃亡沙特不久,马步芳强取亲侄女为妻,蒋介石:他让我颜面尽失

史笔似尘钩
2026-03-17 20:35:07
光速掉粉!瑞幸被罗永浩坑惨了?!

光速掉粉!瑞幸被罗永浩坑惨了?!

广告案例精选
2026-03-26 08:59:17
参加世界杯,每人先交1.5万刀!特朗普政策影响多个世界杯参赛国

参加世界杯,每人先交1.5万刀!特朗普政策影响多个世界杯参赛国

全景体育V
2026-03-26 08:16:09
张雪峰对苏州的综合贡献曝光!5年纳税8.5亿,间接经济拉动28亿

张雪峰对苏州的综合贡献曝光!5年纳税8.5亿,间接经济拉动28亿

谈史论天地
2026-03-26 07:45:53
高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

古怪奇谈录
2025-10-16 10:53:42
国金证券:长期来看黄金有望开启新一轮大牛市

国金证券:长期来看黄金有望开启新一轮大牛市

财联社
2026-03-26 08:08:04
张雪峰去世后续!办公室内景曝光,门口堆满鲜花,写真照前放香炉

张雪峰去世后续!办公室内景曝光,门口堆满鲜花,写真照前放香炉

潮鹿逐梦
2026-03-26 11:53:28
延寿9年,心脏病风险降60%!悉尼大学最新:饮食、睡眠、运动最佳组合出炉,小改变也大有益

延寿9年,心脏病风险降60%!悉尼大学最新:饮食、睡眠、运动最佳组合出炉,小改变也大有益

医诺维
2026-03-24 17:02:18
大势已去,53%反对票创纪录,梅洛尼公投惨败,意大利政坛要变

大势已去,53%反对票创纪录,梅洛尼公投惨败,意大利政坛要变

时尚的弄潮
2026-03-26 18:02:15
中国电信:全面转向token经营!

中国电信:全面转向token经营!

最通信
2026-03-25 20:45:14
Altman发感谢信,16000名被裁程序员集体破防

Altman发感谢信,16000名被裁程序员集体破防

Ping值焦虑
2026-03-25 17:02:40
麦迪:杨瀚森球商高有注定长期竞争力,打法让我想到约基奇

麦迪:杨瀚森球商高有注定长期竞争力,打法让我想到约基奇

懂球帝
2026-03-26 11:45:09
浙江省高校排名更新!宁波大学第4,浙工大第7,温州医科大仅排14

浙江省高校排名更新!宁波大学第4,浙工大第7,温州医科大仅排14

朗威谈星座
2026-03-26 18:09:46
41岁张雪峰离世,峰学蔚来接班人正式浮出水面

41岁张雪峰离世,峰学蔚来接班人正式浮出水面

秋姐居
2026-03-25 17:02:04
2026-03-26 20:55:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7746文章数 556关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
本地
房产
公开课
军事航空

旅游要闻

20元人民币背景观景台乱收费?景区通报:不存在封闭管控、强制收费等

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版