网易首页 > 网易号 > 正文 申请入驻

英伟达投下自动驾驶重磅炸弹!首次开源VLA模型Alpamayo-R1

0
分享至

车东西(公众号:chedongxi)
作者 | Janson
编辑 | 志豪

英伟达要用“因果推理”重塑L4自动驾驶?!

车东西12月3日消息,日前,英伟达(NVIDIA)研究团队正式发布并开源全新的视觉-语言-动作(VLA)模型Alpamayo-R1,并明确宣布计划在未来的更新中开源该模型及部分核心数据集。


▲Alpamayo-R1对应的数据集已上传至开源社区

目前,该模型对应的数据集也已上传至开源社区,总大小约100TB,这也是英伟达首次将VLA模型进行开源。


▲Alpamayo-R1模型架构

这一举措不仅打破了高端自动驾驶模型的封闭高墙,更标志着端到端自动驾驶技术从单纯的“模仿行为”迈向了具备深层“因果思考”的新阶段。

对于自动驾驶行业而言,Alpamayo-R1的出现直击了当前最令人头疼的痛点——长尾场景(Long-tail scenarios)下的安全性。

英伟达此次带来的 Alpamayo-R1正是为了终结这一困境,而其交出的实测成绩单也足够令人信服。


▲Alpamayo-R1相对基线的提升明显

在针对极高难度长尾场景的测试中,AR1的规划准确率相比仅有轨迹预测的基线模型提升了整整12%;

在闭环仿真测试里,AR1成功将车辆冲出道路的事故率降低了35%;

与其他车辆或行人的近距离危险遭遇率也大幅减少了25%。

更值得一提的是,即便在集成复杂的推理大脑后,该模型在NVIDIA RTX 6000 Pro Blackwell车载硬件上依然保持了99毫秒的端到端超低延迟,完全满足了实时自动驾驶的严苛需求。

一、解决自动驾驶端到端黑盒问题 引入因果链数据集

过去几年,基于模仿学习的端到端大模型虽然通过堆砌数据量取得了显著进步,但它们本质上更像是一个只会死记硬背的“黑盒”。

这些模型能够精准模仿人类驾驶员的操作,却缺乏对场景的因果理解。它们知道“前面有车要刹车”,却不知道“为什么要刹车”。

这种知其然不知其所以然的缺陷,导致车辆在面对从未见过的高风险复杂路况时,往往表现脆弱,决策逻辑甚至自相矛盾。

为了让AI真正学会像人类老司机一样思考,英伟达并没有选择在现有模型上修修补补,而是从最底层的数据构建开始了一场革命。


▲因果链推理演示

为了解决传统数据集中描述模糊、缺乏逻辑关联的问题,研究团队构建了一套全新的“因果链”(Chain of Causation, CoC)数据集。

这套数据集的核心在于教会模型建立“观察-原因-决策”的严密逻辑闭环。它不再让AI生成诸如“天气晴朗、路面宽阔”这类无关痛痒的旁白。

在这套模型下,提示词可明确指出“因为左侧有车辆正在强行并线,且前方有行人横穿,所以我决定减速避让”。

这种数据构建方式不仅消除了因果混淆,更有效提升了模型的逻辑性。

二、引入新架构 平衡模型性能

在强大的数据支撑下,Alpamayo-R1采用了一种模块化且高效的架构设计,巧妙地平衡了“慢思考”与“快行动”。

其大脑由英伟达专为物理AI打造的Cosmos-Reason视觉语言模型驱动,负责处理复杂的环境理解和逻辑推理。

而行动则交由一个基于流匹配(Flow Matching)技术的动作专家解码器来控制。

这种分工合作的机制,让模型既能利用大语言模型的广博知识进行深思熟虑,又能通过扩散模型生成丝般顺滑且符合车辆动力学的行驶轨迹,完美解决了大模型通常反应迟钝的弊病。

不过,真正让Alpamayo-R1与众不同的,是其在训练阶段引入的强化学习(RL)机制。


▲推理-动作高一致性将提升奖励

在监督学习教会模型基本的驾驶技能后,研究人员引入了一个更为严苛的“判卷老师”——利用更大规模的推理模型作为批评者(Critic),对AR1的表现进行打分。

这个阶段的训练目标非常明确——要求模型言行一致。

对此,该模型中的奖励函数不仅看重车辆是否开得安全,更看重模型嘴上说的推理逻辑与实际做出的驾驶动作是否吻合。

如果模型推理说“因为红灯要停车”,但实际动作却在加速,它就会受到严厉惩罚。


▲采用强化学习新模式后质量显著提升

这种训练方式让AI的解释不再是一种事后的敷衍,而是真正成为了指导车辆行动的决策纲领,推理质量因此提升了45%,推理与行动的一致性也提高了37%。

在论文的最后还有一个小彩蛋,致谢中排在第一位的正是英伟达自动驾驶负责人吴新宙。


▲吴新宙在致谢第一位

结语:英伟达首次开源VLA模型

随着 Alpamayo-R1 的发布及后续开源计划的推进,英伟达不仅展示了一条通往 L4 级自动驾驶的务实技术路径,更为整个开源社区注入了强劲动力。

当自动驾驶汽车开始能够清晰地解释自己的每一个决策逻辑时,我们距离那个真正安全、可信的自动驾驶未来,或许只剩下最后的一公里。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗伊斯兰革命卫队称美以大学将成“合法袭击目标”

伊朗伊斯兰革命卫队称美以大学将成“合法袭击目标”

新京报
2026-03-29 07:26:06
155亿赔偿落地!澳洲认赔止损,巴拿马震动,全球投资规则再警示

155亿赔偿落地!澳洲认赔止损,巴拿马震动,全球投资规则再警示

世界圈
2026-03-29 02:40:03
这是今天娱乐圈最让人悲痛的消
​息!

这是今天娱乐圈最让人悲痛的消 ​息!

果妈聊娱乐
2026-03-29 13:33:21
中组部人社部联合发文:公职人员违纪待遇标准,一次讲全

中组部人社部联合发文:公职人员违纪待遇标准,一次讲全

解说阿洎
2026-03-29 01:30:48
连樱花都不敢看,谈何文化自信?别让“恐日症”锁死中国的春天

连樱花都不敢看,谈何文化自信?别让“恐日症”锁死中国的春天

涛哥锐评
2026-03-27 19:49:57
伊朗自己都没想到,摸了这么大个奖!美军出现大战损,E3G被毁?

伊朗自己都没想到,摸了这么大个奖!美军出现大战损,E3G被毁?

共工之锚
2026-03-29 14:26:08
副部级高官任上落马,任职地多名前下属被查

副部级高官任上落马,任职地多名前下属被查

中国新闻周刊
2026-03-29 09:44:48
张雪峰追悼会现场画面流出:前妻和现任均现身,11女儿哭倒在现场

张雪峰追悼会现场画面流出:前妻和现任均现身,11女儿哭倒在现场

博士观察
2026-03-28 10:31:10
魂归故里,长眠桑梓!张雪峰安葬地选址原因披露

魂归故里,长眠桑梓!张雪峰安葬地选址原因披露

史海流年号
2026-03-29 12:14:27
国务院食安办、市场监管总局约谈相关地方市级人民政府负责人 督办“3・15”晚会曝光问题整改

国务院食安办、市场监管总局约谈相关地方市级人民政府负责人 督办“3・15”晚会曝光问题整改

新京报
2026-03-28 19:17:17
体检都出毛病了,连马拉松参赛资格都被取消,当事人硬是不信邪。

体检都出毛病了,连马拉松参赛资格都被取消,当事人硬是不信邪。

岁月有情1314
2026-03-29 08:19:26
歼20总设计师被除名:顶头上司受贿7亿判死缓,事发全过程被还原

歼20总设计师被除名:顶头上司受贿7亿判死缓,事发全过程被还原

博士观察
2026-03-28 21:02:35
海航空姐合影,各个肤白貌美大长腿

海航空姐合影,各个肤白貌美大长腿

微微热评
2026-03-29 12:34:00
油价下跌2.79元/升,近4年最大下降后全涨回来,下次4月7日调价

油价下跌2.79元/升,近4年最大下降后全涨回来,下次4月7日调价

猪友巴巴
2026-03-28 15:35:03
界面调查|一位“90后”网约车司机之死:被骗网贷、被催债和致命的绝望

界面调查|一位“90后”网约车司机之死:被骗网贷、被催债和致命的绝望

界面新闻
2026-03-29 10:33:24
这4个小时是“黄金睡眠时间”,错过了很难补回来

这4个小时是“黄金睡眠时间”,错过了很难补回来

齐鲁壹点
2026-03-07 05:15:12
上海知名主持周瑾:从不做饭全靠外卖,真实家庭状态令人意外

上海知名主持周瑾:从不做饭全靠外卖,真实家庭状态令人意外

日落于西
2026-03-28 21:21:53
女教师被碾压致死后续!5人联合作案,销毁铁证,凶手势力不简单

女教师被碾压致死后续!5人联合作案,销毁铁证,凶手势力不简单

青橘罐头
2026-03-28 07:13:38
苹果加这两样煮水喝,沾床就睡!连打雷都叫不醒!

苹果加这两样煮水喝,沾床就睡!连打雷都叫不醒!

阿天爱旅行
2026-03-29 00:12:41
这面相太好了,妥妥旺夫相,膀大腰圆气血足,穿着干净舒服!

这面相太好了,妥妥旺夫相,膀大腰圆气血足,穿着干净舒服!

情感大头说说
2026-03-29 14:19:10
2026-03-29 16:11:00
车东西
车东西
未来汽车看这里。
6015文章数 6407关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

美军地面战"数周速决"方案披露 欲复刻"42天灭伊"神话

头条要闻

美军地面战"数周速决"方案披露 欲复刻"42天灭伊"神话

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

张凌赫事件持续升级!官方点名怒批

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

艺术
健康
数码
房产
公开课

艺术要闻

2025江南如画——中国油画作品展 | 入选作品选刊(二)

干细胞抗衰4大误区,90%的人都中招

数码要闻

OPPO Pad mini打造小屏旗舰巅峰!搭载 8.8 英寸 2.8K 高刷屏+骁龙 8 Gen5

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版