网易首页 > 网易号 > 正文 申请入驻

端到端智驾新SOTA|KnowVal:懂法律道德、有价值观的智能驾驶系统

0
分享至



一个智能驾驶系统,在迈向高阶自动驾驶的过程中,应当具备何种能力?除了基础的感知、预测、规划、决策能力,如何对三维空间进行更深入的理解?如何具备包含法律法规、道德原则、防御性驾驶原则等知识?如何进行基本的视觉 - 语言推理?如何让智能系统具备世界观和价值观?

来自北京大学王选计算机研究所王勇涛团队的最新工作 KnowVal 给出了一种有效可行的方案。



  • 论文标题:KnowVal: A Knowledge-Augmented and Value-Guided Autonomous Driving System
  • 论文链接:
  • https://arxiv.org/abs/2512.20299

本工作提出了一种新型自动驾驶系统 KnowVal,该系统通过感知模块与知识检索模块的协同作用,实现视觉 - 语言推理能力。

团队构建了涵盖交通法规、防御性驾驶原则与道德考量的综合驾驶知识图谱,并为其开发了高效的基于大型语言模型的检索机制。通过设计集成世界模型与价值模型的规划器,从而实现价值对齐决策。同时构建了人类偏好数据集用于训练价值模型。

实验表明,KnowVal 兼容现有的端到端和 VLA 方法,在 nuScenes 数据集上实现了最低碰撞率,并在 Bench2Drive 基准测试中取得了最先进的性能表现。



KnowVal 系统框架:

开放三维感知与知识检索

相互引导的视觉 - 语言推理

相比于当前主流的端到端自动驾驶系统和视觉 - 语言 - 动作(VLA)系统,KnowVal 将视觉 - 语言范式升级为开放三维感知 - 知识检索范式,并通过感知和检索的相互引导,实现了基础的视觉 - 语言推理:



检索引导的开放世界感知

通过自动驾驶领域专用感知和开放式三维感知,能够抽取常见实例与长尾实例的 3D 目标检测结果与实例特征,以及面向开放世界的全场景占据栅格预测与体素特征,抽取特征保证了整个系统的特征传递与可导;同时,通过利用轻型 VLM 实现的抽象元素理解,能够对上一时间帧知识检索分支要求的信息进行补充,针对「是否是隧道、桥梁场景?是否是夜间场景?」等抽象概念进行自然语言描述。

感知引导的知识图谱检索

将感知信息进行自然语言化,对包含了法律法规、道德原则、防御性驾驶原则等知识的知识图谱进行检索,得到多条相关性由高到低排列的知识条目以及其 Token。

基于世界预测和价值模型的轨迹规划

通过规划模块和世界模型模块的多轮迭代,得到多条候选自车轨迹、对应的其他物体的运动预测与隐式世界状态。价值模型以上述信息为输入,针对每条候选轨迹和检索得到的知识,进行价值评估,最终选定规划轨迹。

该系统的各个模块之间保持了显式结果和隐式特征的共同传递,是可端到端微调的 3D 视觉 - 语言 - 动作框架。

驾驶知识图谱构建与知识检索



作者团队收集了多样化的驾驶相关资源——包括国家现行交通法律法规、防御性驾驶原则、道德准则以及经验知识访谈——并依据文本结构构建了初始的知识森林。

随后利用大语言模型抽取实体并定义节点与边,形成结构化的知识图谱。在推理过程中,KnowVal 生成富含三维感知信息的自然语言查询,通过实体抽取、知识条目过滤与向量化,从知识图谱中检索相关条目,并按相关性降序进行排序。

价值模型构建与

基于价值模型的轨迹规划



KnowVal 提供了一种与现有端到端和 VLA 模型兼容的改造方式,针对其轨迹规划 Transformer 或 RNN 进行改造,引入对自车查询叠加的多条预设高斯噪声和多样性约束损失函数,使其具备生成多样化候选轨迹的能力。

KnowVal 构建了一个大规模驾驶价值偏好数据集,用以训练价值模型。数据集选取了多个自动驾驶真实场景数据,通过规划模型预测和随机生成的方式获取多条轨迹,并保存其相应的场景状态(隐式特征向量与显式鸟瞰渲染图),并利用前述的检索方法得到多条知识,为每个轨迹 - 知识对进行介于 -1 到 1 之间的价值评分标注,最终得到包含 16 万个轨迹 - 知识对的数据集。

模型推理时,该模块以构造的多条自车特征和感知得到的实例特征与作为查询,以感知得到的全部信息作为键 - 值,通过规划模块和世界模型模块的多轮迭代,得到多条候选自车轨迹、对应的其他物体的运动预测与隐式世界状态;价值模型以上述信息为输入,针对每条候选轨迹和检索得到的每条知识,进行价值评估,并计算每条轨迹的降序加权平均分数,以最终选定规划轨迹。

实验结果

作者团队将 KnowVal 框架应用至 GenAD、HENet++ 与 SimLingo 三个基线模型,并在 nuScenes 开环端到端驾驶基准和 Bench2Drive 闭环端到端驾驶基准上进行了测试。KnowVal 范式能够在 nuScenes 上取得最低的驾驶碰撞率,并在 Bench2Drive 上取得最高的驾驶分数和成功率。





现有基准测试对于法律和道德行为的评估并不够全面,因此,作者也提供了几个定性分析样例,以说明 KnowVal 的实际效果:



上图中两个样例,前者是在 nuScenes 真实数据上通过场景编辑得到,测试智能驾驶系统是否能够在路过积水时减速慢行、以免溅到行人;后者是在 CARLA 模拟器中隧道场景进行的测试,测试智能驾驶系统是否会遵循「隧道内 / 实线车道不能变道」的法律法规。实验结果说明,原本无法正确处理这些情况的端到端智驾模型,增加了 KnowVal 的知识检索与价值评估后,能够正确应对这些情形。

作者介绍

该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的 VDIG (Visual Data Interpreting and Generation) 实验室,第一作者为北京大学博士生夏仲禹,通讯作者为博士生导师王勇涛副研究员。VDIG 实验室近年来在 CVPR、NeurIPS、IJCV、ICCV、ICML、AAAI、ECCV 等顶会顶刊上有多项重量级成果发表,多次荣获国内外 CV 领域重量级竞赛的冠亚军奖项,与国内外知名科研机构和企业广泛开展合作。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一旦国家开启一级战备,老百姓需牢记三点,关键时刻能保命

一旦国家开启一级战备,老百姓需牢记三点,关键时刻能保命

一网打尽全球焦点
2026-01-07 19:22:18
3:2逆转!薛飞死磕张本,能否再演3:0横扫好戏?

3:2逆转!薛飞死磕张本,能否再演3:0横扫好戏?

卿子书
2026-01-15 14:32:55
香港知名主持人宣布和同性爱人订婚,激动到落下男儿泪

香港知名主持人宣布和同性爱人订婚,激动到落下男儿泪

冷紫葉
2026-01-16 12:41:16
西贝将大规模关停102家门店,集中在一二线城市

西贝将大规模关停102家门店,集中在一二线城市

界面新闻
2026-01-15 14:50:22
2026年,是“尽快买房”还是“再等一等”?马云和李嘉诚不谋而合

2026年,是“尽快买房”还是“再等一等”?马云和李嘉诚不谋而合

巢客HOME
2026-01-16 08:30:03
TA:科尔本想选小瓦格纳;只因想要运动天赋连续选了库明加及怀斯曼

TA:科尔本想选小瓦格纳;只因想要运动天赋连续选了库明加及怀斯曼

懂球帝
2026-01-16 10:33:06
为什么伊朗的流血,没能点燃世界的愤怒——错过这次,还要等多久

为什么伊朗的流血,没能点燃世界的愤怒——错过这次,还要等多久

桂系007
2026-01-14 23:48:15
世界第一,055B型驱逐舰,1.7万吨级王牌,到底有多强悍?

世界第一,055B型驱逐舰,1.7万吨级王牌,到底有多强悍?

今墨缘
2026-01-15 08:26:48
越扒越有,被人民网点名后,闫学晶又被曝身份造假,成名史太精彩

越扒越有,被人民网点名后,闫学晶又被曝身份造假,成名史太精彩

奇思妙想草叶君
2026-01-14 21:18:53
锦江区砂砂舞惊雷:包间惊魂与舞客们的20小时拘留

锦江区砂砂舞惊雷:包间惊魂与舞客们的20小时拘留

成都人的故事
2026-01-15 21:40:03
“棋圣”,落子

“棋圣”,落子

中国新闻周刊
2026-01-15 14:09:48
1994年大案:“变态色魔”王万明,他的荒淫无耻,比你想的更恶劣

1994年大案:“变态色魔”王万明,他的荒淫无耻,比你想的更恶劣

叹为观止易
2026-01-16 10:22:49
公安部A级通缉犯在狱中被揪出,隐瞒13年身份曝光:涉嫌贩卖毒品7500余克,妻儿出现让其卸下伪装

公安部A级通缉犯在狱中被揪出,隐瞒13年身份曝光:涉嫌贩卖毒品7500余克,妻儿出现让其卸下伪装

大风新闻
2026-01-15 18:07:04
凑凑火锅郑州门店清零?呷哺呷哺回应

凑凑火锅郑州门店清零?呷哺呷哺回应

鲁中晨报
2026-01-15 14:11:08
输上海40分!杜锋有4个败笔,是广东队输球的主要因素

输上海40分!杜锋有4个败笔,是广东队输球的主要因素

体育哲人
2026-01-16 11:53:45
油轮背后的静默屠杀:中方七十二小时的底层逻辑重构

油轮背后的静默屠杀:中方七十二小时的底层逻辑重构

宇视天下
2026-01-15 23:14:30
重庆合川呆呆爆火后续!满屋堆成山的礼物全部化成整个村的温暖

重庆合川呆呆爆火后续!满屋堆成山的礼物全部化成整个村的温暖

南方健哥
2026-01-15 15:15:05
卡尼赴京吃晚宴,中方高规格接待!现场安排特殊,交易迎来窗口期

卡尼赴京吃晚宴,中方高规格接待!现场安排特殊,交易迎来窗口期

傲傲讲历史
2026-01-16 02:58:55
为什么感觉美国在走向衰落?那是因为你是中国人

为什么感觉美国在走向衰落?那是因为你是中国人

扶苏聊历史
2025-12-19 10:02:54
中央把话说透了:真正的公务员,是这8类人,很多人搞错了

中央把话说透了:真正的公务员,是这8类人,很多人搞错了

搬砖营Z
2026-01-12 21:10:19
2026-01-16 13:23:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12128文章数 142541关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

特朗普终于拿到诺奖 马查多或为换取委内瑞拉总统宝座

头条要闻

特朗普终于拿到诺奖 马查多或为换取委内瑞拉总统宝座

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

态度原创

健康
教育
旅游
数码
房产

血常规3项异常,是身体警报!

教育要闻

“我们是驴吗?”小学老师晒学校午餐,学校餐饮管理引深思

旅游要闻

强降雪将至!雪后去撒欢儿,郑州及周边滑雪场推荐→

数码要闻

内存条价格涨幅超三倍,存储市场已进入“超级牛市”阶段

房产要闻

突发!商业用房购房贷款最低首付比例下调至30%

无障碍浏览 进入关怀版