[首发于智驾最前沿微信公众号]最近有小伙伴提问,现阶段智驾能否应对井盖缺失场景,比如路上井盖被盗,车辆开过去会陷下去,那么端到端能不能识别和避开?
其实在城市道路的复杂环境中,井盖缺失、路面开裂或深坑等被称为“负障碍物”的场景,这类场景始终是智能驾驶感知领域的顽疾。与行人、车辆、交通锥等高出地平面的“正障碍物”不同,井盖缺失不仅在视觉特征上具有极强的隐蔽性,在物理探测原理上也存在天然的探测难度。对于目前的智能驾驶系统而言,能否识别并避开一个缺失的井盖,不仅取决于硬件传感器的精度,更涉及感知架构从规则驱动向数据驱动的根本性转变。随着端到端技术的广泛应用,行业正试图通过模仿人类驾驶员的整体决策逻辑,来化解这些传统算法难以覆盖的长尾场景。
负障碍物为什么难以探测?
智能驾驶系统识别缺失井盖的首要难点在于物理层面的感知受限。在自动驾驶中,负障碍物指的是低于行驶平面的几何空洞。像是激光雷达和摄像头这类传统的探测手段,在面对负障碍物这类物体时都会遭遇严重的“掠射角”问题。当车辆在道路上行驶时,传感器安装的高度通常在1.5米至2米之间,而需要探测的障碍物却位于几十米外的地面。这就导致传感器发出的探测信号或光线只能以极小的角度照射向地面,这会导致感知不完全。
激光雷达在探测物体时依靠的是激光点的反射。当激光束照射到平整路面时,会形成连续的点云分布。如果前方出现一个缺失的井盖,激光束理论上会穿过洞口射向坑底或坑壁,产生明显的距离突变。然而,激光雷达的探测精度会随着距离的增加呈现出平方级的衰减。
根据物理建模分析,正障碍物在传感器视野中所占的张角与距离成反比,而负障碍物所占的张角则与距离的平方成反比。这意味着,一旦距离稍远,缺失井盖在激光雷达视野中可能只剩下寥寥数个点,甚至完全消失在点云的稀疏间隙中。此外,由于路面本身存在颠簸,许多点云处理算法为了保证系统的稳定性,会使用滤波器来平滑掉微小的距离跳变。在这种情况下,真实的深坑风险往往会被算法误认为是传感器的随机噪声而被直接过滤掉。
![]()
图片源自:网络
视觉传感器在面对缺失井盖时同样会出现很多问题。摄像头主要依赖图像的颜色对比度和纹理特征来识别障碍物。在理想光照条件下,缺失井盖形成的暗色区域与灰色路面有一定区分度,像是卷积神经网络这类的深度学习模型可以学习这种特定的模式。
但在现实中,雨后路面的积水倒影、建筑物的深色阴影、新修补的路面沥青,甚至是一个散落的黑色塑料袋,其视觉特征都与缺失的井盖极其相似。这种视觉上的二义性导致单目摄像头很难在远距离给出确定的深度判断。
此外,当车辆高速行驶时,视觉系统对地面几何形状的微小塌陷感知能力极弱,有时只有当车辆行驶到近处,阴影的几何结构发生明显变化时,系统才能意识到风险的存在,但此时留给车辆执行制动或避让的时间通常已经不足1.5秒,这很难让自动驾驶系统反应过来。
传感器类型
对负障碍物的探测原理
核心技术难点
环境敏感度
激光雷达(LiDAR)
探测点云连续性的中断与深度跳变
远距离点云极其稀疏,信号随距离平方级衰减
对光照不敏感,但在极低掠射角下容易丢失特征
摄像头(Camera)
基于颜色对比度、边缘纹理与运动推断深度
阴影、积水易造成误判,缺乏直接深度信息
极度依赖光照,在黄昏或夜晚探测距离大幅缩短
毫米波雷达(Radar)
检测金属边缘或空洞边缘的微弱多普勒反射
垂直分辨率不足,难以区分地表接缝与真实空洞
对天气鲁棒性强,但无法提供精细几何轮廓
为了缓解物理层面的探测缺陷,有些技术方案提出了改进的硬件布置方案,如将激光雷达以40度左右的倾角向下安装,将盲区从3米缩小到0.2米左右,并显著提升地面点云的密度。然而,对于乘用车而言,这种布置会影响远距离正障碍物的探测。因此,目前的智驾系统更多依赖于多模态传感器融合,即利用激光雷达提供精确但稀疏的距离参考,再结合摄像头捕捉到的高分辨率纹理,通过算法将两者的优势互补。
从显式识别到占用网络的维度跨越
传统的自动驾驶感知逻辑高度依赖于“白名单”,即需要为自动驾驶系统定义如汽车、行人、自行车、交通锥等各种障碍物类型。如果路面上出现了一个不在白名单内的物体,或者一个形状怪异的井盖缺失口,传统的规则模型可能会将其归类为“背景”而视而不见。这种基于目标检测的模式在处理缺失井盖这类“非标准障碍物”时表现就不尽如人意。
占用网络(Occupancy Network)的引入标志着感知维度的一次跨越。这项技术不再试图识别前方“是什么”,而是关注空间“是否被占用”。系统将车辆周围的三维空间切分为数以万计甚至百万计的微小体素(类似于三维的像素点)。通过融合摄像头和激光雷达的数据,系统会实时预测每一个体素被占据的概率。在一个平整的道路场景中,路面以上的体素应该是空的,而路面以下的体素是满的。当路面出现井盖缺失时,该区域的几何平面就会发生坍缩,原本应该处于“路面层”的体素会显示出不寻常的空缺或下陷。这种感知方式不依赖于预先定义的标签,因此对于从未见过的深坑或道路损毁具有极强的通用性。
![]()
图片源自:网络
以华为的ADS 3(参数丨图片).0系统为例,其核心的GOD(通用障碍物识别)神经网络已经实现了从2D感知向3D语义占用的全面演进。该系统不仅能识别道路上的具体物体,还能对整个场景的几何结构进行实时建模。通过GOD网络,车辆能够理解路面的连续性,识别出即便是极小尺寸的异常凸起或凹陷。如果系统检测到前方的路面体素概率分布发生了异常跳变,即使无法确定那是缺失的井盖还是路面裂缝,也会将其标记为不可通行的区域,从而触发避让或减速策略。
占用网络的一个关键技术细节是深度估计的准确性。在纯视觉方案中,像是特斯拉的占用网络,系统需要通过连续的多帧图像来推断物体的三维占据情况。由于视频流中包含了时间维度,系统可以利用车辆移动产生的视差来构建路面的深度图。这种基于时序的深度感知能力,使智驾系统在面对一些视觉特征模糊的缺失井盖时,能够通过前后帧的关联来修正判断。例如,当一个远处的阴影随着车辆靠近而展现出特定的几何深度特征时,占用网络会迅速将其占用的体素概率从低置信度提升为高风险等级。这种能力的提升,使得车辆在非结构化道路(如没有车道线的乡村小路或施工区域)也能表现出较强的避障能力。
端到端架构在处理非标准障碍物时的逻辑重构
在感知技术不断进化的同时,决策规划层也在经历一场深刻的变革。传统的自动驾驶架构是模块化的,感知模块将识别到的结果(如“左前方5米处有一个深坑”)以结构化数据的形式传递给规划模块。规划模块再根据预设的If-else规则决定是刹车还是绕行。在这种模式下,感知的一点点微小误差可能会在后续环节被放大。如果感知模块对井盖缺失的识别置信度在50%上下波动,规划模块可能会在刹车和加速之间反复横跳,导致车辆行驶极不稳定。
端到端(End-to-End)架构则打破了这种模块间的隔阂。在端到端模式中,系统不再依赖于显式的数据接口,而是通过一个大型的神经网络,直接将摄像头捕捉到的像素数据或激光雷达的点云数据映射为车辆的控制指令(如转向、制动、油门)。这种架构最核心的优势在于“全局最优”。系统在训练过程中学习的是数以千万公里的高质量人类驾驶数据。对于一个老司机来说,他不需要在脑子里先识别出“井盖缺失”这四个字,而是通过视觉观察到前方路面颜色或纹理的异常,结合对周围交通流的判断,下意识地打方向避让。
![]()
模块化与端到端示意图,图片源自:网络
端到端模型通过模仿学习,能够习得这种处理复杂环境的驾驶直觉。在处理井盖缺失场景时,端到端系统展现出了更强的泛化能力。由于模型是在海量真实道路数据上训练的,其中必然包含了各种人类避让坑洼、积水或不明物体的案例。系统在学习过程中,会将“路面视觉异常”与“轻微转向避让”建立起高维的关联。即便模型从未在训练集中见过完全一模一样的井盖缺失样本,但只要它识别到了路面完整性遭到破坏的特征,就能在隐空间中产生类似避让动作的决策输出。这种从数据中学习到的规律,比人工编写的规则更能应对千变万化的长尾场景。
当然,每当提到端到端,就不得不聊一下它最显著的问题,即“黑盒”特性。由于决策过程完全发生在神经网络的内部权重中,开发者很难解释为什么车辆在某个时刻选择了避让,而在另一个相似的时刻却选择了直冲。
为了解决可解释性问题,目前行业内出现了“广义端到端”或“模块化端到端”的趋势。这种方案在保持端到端全局优化能力的同时,在内部保留了感知、预测等任务模块的显式输出。通过这种方式,可以监控模型内部的特征图,确认系统是否真的“看”到了路面的深坑,从而为安全验证提供依据。这种兼顾灵活性与可解释性的架构,正是目前智驾系统应对极窄、极端场景的主流演进方向。
数据闭环与现实挑战中的安全性验证
理论上的技术领先并不能直接等同于现实中的完美操作。在实际应用中,井盖缺失这类场景依然是智驾系统非常容易“翻车”的地方。同一系统在不同交通场景中,对于井盖缺失这类场景也会有不一样的表现。这种表现不一致的核心原因在于数据分布的偏差。
虽然端到端系统学习了海量数据,但其中绝大多数是正常行驶的数据。缺失井盖在全量行驶数据中可能只占十万分之一甚至更低。如果训练集中缺乏足够多的、覆盖各种光照和角度的井盖缺失样本,神经网络就无法对这一特定的视觉模式产生足够的敏感度。
此外,舒适度与安全性的平衡也是一大难点。如果系统对路面的微小特征过于敏感,频繁地为了躲避小石子或色块而大幅摆动方向盘,会极大地损害驾乘舒适性,甚至导致侧向车辆的误解和追尾风险。因此,智驾系统必须在内部进行精确的收益评估,是选择承受一时的震动碾过去,还是冒着侧碰的风险进行大角度避让。

图片源自:网络
为了攻克这些难题,自动驾驶公司需建立一整套复杂的数据闭环体系。当一辆搭载智驾系统的车辆在现实中遭遇深坑导致剧烈颠簸时,车辆的加速度传感器会捕捉到异常信号,并自动将前后的视频片段回传至云端。云端的大型计算集群会对这些失效案例进行自动标注和强化训练。通过不断向模型灌输这些“负面案例”,系统识别井盖缺失的置信度会随着迭代而稳步提升。
同时,像NVIDIA的Omniverse这类物理仿真平台也可以用来生成大量的合成数据。在虚拟世界里,可以随意放置上千种不同形状、深度、位置的缺失井盖,并模拟各种极端天气条件,以此来训练模型的几何理解能力,这极大地弥补了真实世界数据的稀缺性。
此外,道路缺陷管理也可以融入智能驾驶的生态。通过移动激光扫描(MLS)数据,相关机构可以对城市数以万计的井盖进行自动化监测。如果智能车辆在行驶过程中通过感知系统发现了井盖丢失,这一地理坐标信息可以实时同步给云端地图。当下一辆车经过同一位置时,即使它的本地传感器受限于视距无法看清深坑,系统也可以结合地图提供的先验信息提前预减速或绕行。这种单车智能与群体智慧的结合,或许是解决井盖缺失等隐蔽性障碍物的最终途径。
最后的话
综上所述,现阶段的智能驾驶系统,特别是采用了占用网络和端到端感知的先进系统,已经在技术路径上解决了井盖缺失的识别问题。通过将路面完整性作为感知目标,系统不再受限于特定物体的定义。然而,受限于传感器在掠射角下的物理瓶颈、环境光影的强干扰以及数据训练的覆盖度,目前任何一家智驾系统都无法承诺百分之百的避让成功率。在高速行驶或光线极差的极端条件下,井盖缺失依然属于可能导致陷车甚至事故的高危场景。对于用户而言,理解智驾系统的物理局限性,并保持随时接管的意识,依然是现阶段安全出行的必要前提。随着端到端模型权重的不断优化和数据闭环的加速滚动,机器对道路“负空间”的理解深度终将超越人类的视觉极限。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.