像加塞、急刹,碰撞这样的边缘场景在现实中发生概率极低,但一旦发生就可能导致重大事故。如何在这类场景中安全驾驶就成为了自动驾驶落地的“最后一公里”。
与此同时,这类边缘场景数据的稀缺,正在成为制约自动驾驶模型性能提升的关键因素。一方面,这类场景本就罕见,难以获取大规模的训练数据;另一方面,风险高、采集难,也抬高了数据成本。对数据驱动的自动驾驶来说,缺乏这种对应场景的“极限磨练”,在现实道路上“翻车”几乎不可避免。
为此,来自OpenDriveLab、上海交大、浙大、复旦、Zenseact 和广汽研究院的联合团队,提出 Nexus 框架,通过解耦扩散模型,分块建模局部的噪声演化过程,来模拟这类难、偏、怪的边缘场景,从而提高自动驾驶汽车在这些场景的可靠性。
自动驾驶的最大难题,不是跑得快,而是自动驾驶汽车能不能在各类边缘场景(corner cases)中跑得稳。
一、什么是 Nexus?
Nexus 就像一个聪明的“场景生成器”,它能根据预设目标快速构建出包含多车交互、突发变道、急刹、碰撞等交通场景,而且比此前的方法更灵活、更可靠。
此前的做法要么是一次性生成整个视频,但存在生成慢、对目标难以把控的问题;要么是一帧帧预测,虽然快,但却容易出现“场景崩溃”。
Nexus 的创新在于:将场景划分为区块,单独建模每个局部的噪声演化过程,再通过状态间约束将它们串成整体,这样既保证了局部合理,又能全局协同边生成边调整,根据每一帧的新信息动态更新后续内容,确保场景既逼真又可控。
二、双管齐下:既要实时高效,又要目标可控
Nexus 的设计目标很明确:生成的场景既要满足实时性,又要满足可控性。
传统扩散模型在“去噪”时,对全部未来时刻一次性处理,速度又慢,又难以干涉中间过程;
自动回归方法虽然能即时更新,却缺乏目标状态的指引。
这两类传统方法导致模型无法兼顾交互性和可控性,而 Nexus 的两大核心创新正解决了这一问题。
1. 噪声状态的“解耦”扩散建模:既快又听话
Nexus 并不是让整个场景⼀次性扩散,⽽是将整体场景划分为多个轨迹单元,每个单元在⾃⼰的时间轴上独⽴扩散噪声状态。然后再通过⾏为规则和逻辑约束,协同各个单元。从⽽使建模速度⼤幅提升,且每条轨迹都能精确引导。
2.噪声感知的调度机制:像“动态滑窗”⼀样顺序生成
Nexus 根据各区块的噪声强度动态决定⽣成顺序,类似滑动窗⼝式优化。优先处理“最模糊”的部分,逐步收敛到清晰合理的全局场景。这⼀做法使得⽣成时⻓更短,时序⼀致性更好,避免局部误差向全局扩散。
Nexus-Data:540 小时边缘场景库
为了在边缘场景中有更好的表现,Nexus 团队还构建了包含数千个⾼危瞬间、总时⻓达 540 ⼩时的 Nexus-Data 数据集,覆盖加塞、碰撞、逼停等多种边缘场景,为模型训练提供充分的“极限考验”。
三、实验效果:大幅降低误差,提升准确率
轨迹误差降低 42%,生成的场景更加自然、精准
生成数据用于训练后,规划准确率提升 20%
支持闭环测试、策略学习、仿真评估等实际环节,真正能落地的生成方案
四、边缘场景生成表现
五、基准测试对比(nuPlan数据集)
Nexus-Full 在控制精度、安全性、稳定性三个维度均超越已有方法,同时保持合理的推理时间,达到了SOTA。
任务为基于 2 秒历史预测 8 秒轨迹,含/不含目标引导。
Nexus 支持闭环场景生成,能作为自动驾驶智能体的交互式仿真环境。智能体在生成场景中进行规划,Nexus 则根据其动作实时更新环境,从而实现感知—决策—反馈的闭环。
闭环交互式场景生成性能对比(Scol/Sp)
此外,Nexus 不仅能“生成”,还能作为数据引擎为模型训练提供更多关键场景,提升模型实战表现。
使用合成数据进行数据增强的对比实验。
Nexus通过解耦扩散模型突破动态场景生成的技术瓶颈,代码与部分数据集已开源,详情参考OpenDriveLab官网。
llustration From IconScout By IconScout Store
-The End-
本周上新!
扫码观看!
“AI技术流”原创投稿计划
TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。
投稿内容
// 最新技术解读/系统性知识分享 //
// 前沿资讯解说/心得经历讲述 //
投稿须知
稿件需要为原创文章,并标明作者信息。
我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励
投稿方式
发送邮件到
melodybai@thejiangmen.com
或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。
关于我“门”
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
bp@thejiangmen.com
点击右上角,把文章分享到朋友圈
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.