网易首页 > 网易号 > 正文 申请入驻

浪潮信息AI团队获ICCV 2025 自动驾驶竞赛"端到端自动驾驶"赛道冠军

0
分享至

北京2025年10月28日/美通社/ -- 近日,在ICCV 2025自动驾驶国际挑战赛(Autonomous Grand Challenge 2025)中,浪潮信息AI团队凭借其提出的创新框架"SimpleVSF",以53.06的EPDMS综合得分,在端到端自动驾驶赛道中夺得冠军。该项目创新构建以鸟瞰视图感知轨迹预测为核心、视觉-语言多模态大模型辅助判断的融合方案,发挥大模型泛化能力,突破现有端到端自动驾驶模型在复杂交通场景"难以自主判断"的局限,实现性能领先,为高动态、高交互交通环境下的智能决策提供了全新思路。

浪潮信息AI团队斩获端到端自动驾驶赛道第一名

ICCV2025自动驾驶挑战赛是自动驾驶与具身智能领域极具影响力的国际赛事。本届比赛共设三大赛道,此次浪潮信息AI团队所登顶的端到端自动驾驶赛道(NAVSIM v2 End-to-End Driving Challenge)是ICCV2025最受关注的赛道之一。比赛以NAVSIM v2数据驱动仿真框架作为评估平台,主要考验纯视觉环视相机输入的轨迹预测与行为规划能力,要求在保证行车安全性的前提下,优化车辆的前进效率、避障能力、可行驶区域、驾驶舒适度等九项关键指标,避免模型只在某一单项上表现突出的缺陷。该赛道吸引了来自中国、韩国、瑞典的多家头部智驾企业及知名高校与研究机构。

端到端自动驾驶:挑战基于语义理解的类人决策

当前,端到端自动驾驶(End-to-End Autonomous Driving)通过端到端优化有效减少了传统模块化方法中各组件间的误差累积与信息损失,被广泛认为是实现智能驾驶的重要发展方向。然而,端到端自动驾驶系统在复杂现实路况中的决策能力仍不理想,主要问题在于:现有方法虽能准确识别车辆、车道等实体元素,却难以理解如礼让行人、拥堵跟车等高层次语义与场景常识。因此,在复杂长尾场景下,系统往往仅能依据数据关联做出反应,而无法真正解读交通参与者意图或交互逻辑,从而出现次优决策,限制了其在真实开放道路中的可靠性与泛化能力。

在此基础上,如何将深层语义认知能力融入轨迹规划流程,成为了更深层次的技术挑战。首先,将视觉语言模型输出的抽象认知指令,转化为驱动控制系统所需的具象数值化特征,本身就是一个复杂的表示学习问题。其次,在轨迹选择阶段,如何平衡数据驱动的量化评分与知识驱动的语义判断,确保所选轨迹不仅在数学上最优,也在语义和场景常识上合理安全,成为感知与决策间的关键障碍。

本届赛题旨在提升端到端自动驾驶模型在复杂动态环境中高效可靠决策的能力。竞赛分为两阶段:第一阶段采用真实场景数据,第二阶段则基于真实场景通过Gaussian Splatting技术生成合成场景,以测试模型对"非真实但物理合理"场景的泛化能力;同时引入"反应式背景交通参与者",即周围车辆和行人不再是预先设定、机械运动的,而是会根据自车的实时行为做出动态、仿真的反应,这要求模型具备更深层次的交互式预测与意图理解能力,而非简单的轨迹外推。

NAVSIM v2端到端自动驾驶赛题任务概览

EPDMS 53.06分,SimpleVSF框架让自动驾驶模型"懂场景、会思考"

在端到端自动驾驶赛道中,浪潮信息AI团队所提出的SimpleVSF(Simple VLM-Scoring Fusion)框架,有效弥合了传统轨迹规划与视觉语言模型语义理解之间的关键鸿沟,推动自动驾驶决策从"纯几何式"向"认知式"转变。该框架通过引入VLM(Vision-Language Model)与双重融合决策机制,赋予系统深层的场景理解与推理能力,从根本上解决了现有方案在复杂交通语义认知上的不足,成为应对NAVSIM v2等高难度挑战、实现高鲁棒性驾驶的关键。其主要技术创新包括:

  • VLM增强打分机制,决策质量与场景适应性显著提升

通过将前视图像与车辆状态输入VLM模型,生成"加速、右转"等认知指令,再经编码器转换为数值特征,与感知特征融合后输入评分网络。该机制使轨迹评估不再局限于几何信息,更融入了对交通意图与场景语义的理解,从而显著提升了系统在复杂与长尾场景下的决策质量与鲁棒性。实验表明,此VLM增强打分机制为单一模型带来2%的性能提升,在融合决策中提升幅度达到6%。

SimpleVSF算法架构图

  • 双重融合决策机制,量化权衡与语义裁决能力双重突破

权重融合器作为定量聚合的核心,采用固定权重与动态权重相结合的策略,对多个评分器给出的分数进行精准的加权融合,确保最终轨迹在各项量化指标上达到最优。

基于VLM的选择融合器则将各评分器选出的最优轨迹进行视觉渲染,并交由VLM进行最终评判,利用其高层次语义理解能力,选择出最符合上下文场景、最安全合理的轨迹路径。

融合机制的引入使决策效果显著提升,融合后的结果相比单一模型性能提升达10%。

基于VLM的轨迹选择方法

  • 更坚实的基础模型协同,系统性能与鲁棒性全面提升

该框架采用扩散模型生成高质量的多样化候选轨迹,奠定规划基础;运用ViT-L等先进视觉骨干网络进行高效、鲁棒的环境特征提取,为下游任务提供可靠表征;并引入Qwen2.5VL系列视觉语言模型,利用其在场景理解与指令生成方面的语义优势,确保系统整体性能基础的坚实与领先。

基于VLM自动驾驶决策系统的算法创新,"SimpleVSF"算法框架成功登顶端到端自动驾驶赛道(NAVSIM v2 End-to-End Driving Challenge)榜单,以53.06的EPDMS综合得分创造了本赛道的最高成绩,为探索更高级别的端到端自动驾驶技术提供了有力的支撑与经验。

浪潮信息AI团队此次夺冠,是继22、23年登顶nuScenes 3D目标检测纯视觉及多模态榜单,24年在CVPR自动驾驶国际挑战赛"Occupancy & Flow"赛道夺冠后的又一重要成果。未来,浪潮信息AI团队将践行多角度切入,发挥算法、算力融合的AI全栈优化能力,推动自动驾驶领域的技术创新发展。

* 备注:文内所涉术语解释如下

扩展预测性驾驶模型评分(The Extended Predictive Driver Model Score,EPDMS):该指标综合考量轨迹预测与真实轨迹的贴合度、碰撞风险、可行驶区域规范性、车道居中性、通行效率及舒适性等多个维度,全面反映自动驾驶系统的综合表现;

高斯泼溅(Gaussian Splatting):一种新兴的三维场景表示与渲染技术;

鸟瞰视图(Bird's Eye View,BEV):是指将特征信息转化至鸟瞰视角;

自车(ego-car):在自动驾驶领域指代当前车辆自身,通常作为运动主体参与轨迹规划、环境感知等任务;

鲁棒(Robust):是指系统在一定的参数摄动下,维持其它某些性能的特性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘晓庆太超前!几句话点评王家卫《花样年华》,简直字字珠玑

刘晓庆太超前!几句话点评王家卫《花样年华》,简直字字珠玑

温柔娱公子
2025-11-14 17:15:03
宋佳获得金鸡奖最佳女主角

宋佳获得金鸡奖最佳女主角

界面新闻
2025-11-15 21:48:28
999元,华为Mate80 定金突然曝光,很炸裂啊

999元,华为Mate80 定金突然曝光,很炸裂啊

科技堡垒
2025-11-16 11:37:11
全运会金牌榜更新:山东笑傲榜单,三个省挂零,孤岛在哪?

全运会金牌榜更新:山东笑傲榜单,三个省挂零,孤岛在哪?

老糿尾声体育解说
2025-11-17 02:11:17
7轮10分!世界杯扩军后,他们反而出局了!无缘连续参加3届世界杯

7轮10分!世界杯扩军后,他们反而出局了!无缘连续参加3届世界杯

小火箭爱体育
2025-11-16 11:23:57
高市一刻也等不了了!一架专机飞抵中国,这次派的高官,很有讲究

高市一刻也等不了了!一架专机飞抵中国,这次派的高官,很有讲究

寻墨阁
2025-11-12 21:14:07
一人一城!NBA现役实现该成就的概率:4人100%,两人80%字母仅50%

一人一城!NBA现役实现该成就的概率:4人100%,两人80%字母仅50%

篮球圈里的那些事
2025-11-14 18:18:05
民生银行的一份债务数据,暴露了80后的集体困境

民生银行的一份债务数据,暴露了80后的集体困境

黑噪音
2025-11-16 07:30:27
元朝逃回草原之后,为啥没能再打回中原?不是不想是家底全败光了

元朝逃回草原之后,为啥没能再打回中原?不是不想是家底全败光了

铭记历史呀
2025-10-27 14:13:37
浙江某私募员工老鼠仓赚了8800多万

浙江某私募员工老鼠仓赚了8800多万

财叔有料
2025-11-16 23:39:37
1996年,姚文元出狱后,向中央提两个请求,第二个被一口回绝

1996年,姚文元出狱后,向中央提两个请求,第二个被一口回绝

雍亲王府
2025-11-15 21:50:03
广州教授临终捐空房产,养女整理遗物发现旧婚书,翻开后瘫坐在地

广州教授临终捐空房产,养女整理遗物发现旧婚书,翻开后瘫坐在地

兰姐说故事
2025-05-08 17:00:07
家里托关系找的工作有多抽象?网友:真离谱,这是什么家人

家里托关系找的工作有多抽象?网友:真离谱,这是什么家人

解读热点事件
2025-11-14 00:10:03
民进党下追杀令,国民党有“叛徒”,郑丽文赴大陆前,遭岛内围剿

民进党下追杀令,国民党有“叛徒”,郑丽文赴大陆前,遭岛内围剿

牛锅巴小钒
2025-11-15 12:24:11
这是我见过的最震撼的变脸,堪称医学奇迹

这是我见过的最震撼的变脸,堪称医学奇迹

听风听你
2025-11-14 22:26:32
世预赛:英格兰2-0收官!8战全胜进22球0失球,凯恩梅开二度

世预赛:英格兰2-0收官!8战全胜进22球0失球,凯恩梅开二度

念洲
2025-11-17 03:11:11
神兽为何变成了淫兽?

神兽为何变成了淫兽?

最爱历史
2025-11-16 19:41:07
斯诺克赛程:19局10胜决出冠军,小特拒绝决赛3连败,新王或登基

斯诺克赛程:19局10胜决出冠军,小特拒绝决赛3连败,新王或登基

刘姚尧的文字城堡
2025-11-16 08:01:12
王清海:黄芪和它巧搭配,血管不堵、气血通畅,大小疾病绕道走!

王清海:黄芪和它巧搭配,血管不堵、气血通畅,大小疾病绕道走!

蜡笔小小子
2025-11-16 16:25:55
NBA战报:凯尔特人121-118险胜快船,哈登空砍37分

NBA战报:凯尔特人121-118险胜快船,哈登空砍37分

懂球帝
2025-11-17 07:29:05
2025-11-17 07:51:00
美通社PRNewswire incentive-icons
美通社PRNewswire
全球最大的商业新闻通讯社
59473文章数 12195关注度
往期回顾 全部

科技要闻

营销话术反噬信任,雷军不该只是一怒了之

头条要闻

5名中国游客在巴厘岛车祸死亡 伤者:司机一点伤没有

头条要闻

5名中国游客在巴厘岛车祸死亡 伤者:司机一点伤没有

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

本地
手机
家居
公开课
军事航空

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

手机要闻

iPhone Air并非年度更新产品 2026年很可能没有iPhone Air 2

家居要闻

现代简逸 寻找生活的光

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

海军四川舰顺利完成首次航行试验

无障碍浏览 进入关怀版