10月28日消息,浪潮信息AI团队在ICCV 2025自动驾驶国际挑战赛(Autonomous Grand Challenge 2025)端到端自动驾驶赛道(NAVSIM v2)中夺冠,综合得分EPDMS为53.06。据悉,本赛道以环视纯视觉输入评估轨迹预测与行为规划能力,围绕行车安全、前进效率、避障、可行驶区域、驾驶舒适度等九项指标进行综合考量,旨在避免模型“单项突优”。该赛题分两阶段:第一阶段采用真实场景数据,第二阶段基于真实场景通过Gaussian Splatting生成合成场景,同时引入会随自车动作动态反应的“背景交通参与者”,以测试模型在复杂、高交互环境中的决策稳定性与泛化能力。
据了解,浪潮信息团队提出的SimpleVSF(Simple VLM-Scoring Fusion)框架,面向端到端决策中的“语义理解—轨迹规划”衔接难题,采用VLM(视觉-语言模型)增强打分与“双重融合”决策机制:其一,将前视图像与车辆状态输入VLM生成“加速、右转”等认知指令,编码为数值特征后与感知信息融合进入评分网络,据介绍,该机制单模型性能提升约2%,在多评分器融合中提升约6%;其二,权重融合器对多评分结果进行定量加权,VLM选择融合器对候选最优轨迹进行可视化后作最终语义裁决,据称融合结果相较单一模型整体提升约10%。据介绍,框架还配合扩散模型生成多样候选轨迹、以ViT-L提取环境特征,并结合Qwen2.5VL进行语义理解,强化系统鲁棒性与场景适应能力。
据悉,团队此前在22—23年nuScenes 3D目标检测(纯视觉及多模态)榜单与2024年CVPR自动驾驶挑战赛“Occupancy & Flow”赛道亦有夺冠表现。(定西)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
