贾浩楠 发自 副驾寺
智能车参考 | 公众号 AI4Auto
One model to rule them all !
黄仁勋刚刚在CES上“核爆”整个车圈和自动驾驶圈:英伟达最新VLA模型,完全开源。
![]()
老黄嘴上没说“rule”,但心里最期盼的毫无疑问是这样。
野心更是藏也藏不住:
英伟达,不但要打掉自动驾驶研发门槛、砍掉车企自研预算,还要更进一步,做整个物理AI浪潮的“安卓”。
老黄CES发功:VLA大模型全开源
今日凌晨CES 2026火热开幕,当下AI浪潮最炙手可热的明星玩家之一——老黄代表英伟达做的主题演讲,顺理成章成为第一日最受关注的热点。
整体我们最后总结,先看跟智能汽车自动驾驶紧密相关的part:
老黄宣布开源了英伟达最新的自动驾驶大模型Alpamayo。
Alpamayo不是常说的端到端,相反是为解决端到端缺陷而生:只会模仿驾驶行为,不理解因果关系。
![]()
当然会造成一系列实际体验上的痛点,比如迎面来车违规左转、行人突然闯入、临时施工、交通标志被遮挡等等,L2+高频用户一定深有体会。
先看Alpamayo的疗效:
![]()
规划精度提升12%、越界率降低35%、近碰率降低25%、推理-行动一致性提升37%、端到端延迟降低到99ms。
大白话:提升主要体现在以往最容易出错的「长尾场景」中 —— 也就是说,它更接近「真正会判断的司机」。
现场演示中,老黄给出了一段Alpamayo全程零接管点到点的Demo:
![]()
留意Demo中的关键信息,后面要考~
Alpamayo跟以往所有端到端、VLA完全不同的地方:具备视觉-语言-动作模型的一切要素,但核心是推理能力。
核心工作3点,首先就是Chain of Causation(因果链)数据集。
创新在于全新的数据标注体系(当然离不开人工),每一段驾驶数据不仅有“做了什么”,还有“为什么这样做”。
在“因果”上下功夫,基本上避免了以往数据集行为描述模糊、因果关系混淆、行为推理与因果关系脱节等等问题。
模型本体则是基于英伟达的Cosmos Reason模型,去年CES上老黄首次揭幕,是专为物理AI(Physical AI)设计的推理视觉语言模型:
![]()
整体结构上最大的特点是基于因果结构化推理而非自由叙事,意思是模型必须依据历史可观测证据,解释操作的安全性与合规性——这是第二个重要创新点:
![]()
第三点是轨迹输出阶段,对应动作部分,引入了基于扩散模型的轨迹解码器,能在实时约束下生成连续、动态可行的驾驶轨迹。该模块结合语言推理输出与物理约束,实现从推理到控制的无缝衔接:
![]()
Alpamayo当然可以算作VLA模型,但又和业内现在常见的“端到端+大语言模型外挂”的VLA有根本不同,它完全原生,基础是英伟达去年CES上发布的Cosmos基础世界模型中的Cosmos Reason。
Cosmos系列是英伟达链接AI和物理世界的“中间层”,给千行百业提供最基础的物理AI“安卓”模板——“通才”型世界模型。
![]()
基座模型的训练方法——扩散模型和自回归模型,其中基于扩散的WFM,预训练包括“文本到世界生成预训练”以及“频到世界生成预训练”;基于自回归的WFM,预训练则包括“下一个token生成”以及“文本条件的视频到世界生成”。
对应到Alpamayo,预训练其实就是CoC数据集的训练过程。
所以Alpamayo与其说强调VLA的能力,倒不如说是老黄卖力吆喝这套推理模型的架构范式和训练方法。
研究真正的价值,其实是CoC数据集的全新标注体系,以及可以利用思维链推理场景因果关系的大模型路线。
![]()
实际上在上个月的AI顶会NeurIPS上,Alpamayo就已经由英伟达自动驾驶负责人吴新宙公布,同时强调了Alpamayo架构开放可以兼容各种大模型,合作方完全可以不用英伟达的Cosmos Reason,换成自研大模型也一样work。
时隔一个月,老黄CES上再提Alpamayo,核心依然是更进一步开源开放:除了核心算法、数据集之外,Alpamayo配套工具链同步开放。
毕竟,老黄早就多次阐述,物理AI是英伟达认定的下一阶段人工智能“风口”,其中最关键的环节,就是构建链接物理世界和AI的“中间层”。
老黄一夜打掉自动驾驶门槛
与之前仅开源代码不同,英伟达这次开源了Alpamayo从数据到部署的完整资源。
并且英伟达自动驾驶模型的开源,绝不仅仅是供科研圈参考之用,而是亮相即开源、开源即量产:
![]()
刚刚说的Demo中的关键信息,你发现了吗——演示车辆没有遮挡车标,三叉星辉赫然在目!
没错,英伟达正式从一个底层算力芯片Tier 2,转变成了自动驾驶软硬全栈供应商,类似生态位,参考国内的华为、地平线。
奔驰第一个吃螃蟹,新款奔驰CLA首发搭载英伟达Alpamayo方案,最快明年北美上路。
这是老黄“核弹”的第一波冲击:一夜打掉车企自研预算。
多模态大模型、强推理能力世界模型,指明了一条自动驾驶“破2到3”、“破2到4”的可操作路径,眼下正被越来越多的玩家认可、押注,自动驾驶技术、方案呈现出阶段性收敛。
对于车企来说,短期可能还有大厂不甘心外采,但长期看技术和体验的细微差异,远不如顶级供应商品牌号召力、大众消费者认可来得强大。
![]()
毕竟AI越来越有千行百业底层“基础设施”的性质,而基础设施最便捷高效的投资建设方式,肯定不是各自为战。
另一方面,既然汽车鼻祖、百年老店奔驰都能放下偶像包袱,其他车企又有什么必要再坚持呢?
老黄“核弹”的第二波冲击,同样从技术范式革新的底层逻辑出发,但受冲击的,则是当下炙手可热的Robotaxi赛道:
![]()
CES演讲中,老黄讲了英伟达Robotaxi的的产品方案,但更加强调的是Robotaxi生态。
在底层硬件层,统一芯片、传感器的驱动接口,直接适配英伟达的算法,避免硬件不兼容的研发内耗。
核心算法层面,Alpamayo提供L4级自动驾驶的基础能力,支持玩家通过API进行定制场景优化,比如在校园场景中强化行人识别,在高速场景中优化变道逻辑等等。
至于上层功能接口,有实力的出行平台可以介入自有APP,而英伟达也可以在底层直接开放,只需接入接口就能快速上线Robotaxi服务。
借助英伟达方案,大量本来没有实力进军Robotaxi的传统网约车平台、出租车公司、车企,现在“开箱即用”了。
![]()
如果说马斯克力推的多模态大模型路线对所有传统L4都是一次前所未有的技术挑战的话,英伟达开源Alpamayo,其实是一次整个Robotaxi商业模式的冲击——
传统L4玩家自持车队、自建平台的成型窗口期,越来越短了。
老黄开始构建、力推车圈、自动驾驶圈的新游戏规则:英伟达成为“安卓”,相对封闭的特斯拉则是“苹果”。
黄仁勋,物理AI时代“教父”?
One model to rule them all,意味着车企造L2+、L3量产车、甚至Robotaxi,跟造手机一样简单。
英伟达成为燃油车时代的博世角色,只要是造车、出行相关,就绕不开。
甚至,老黄的野心不止在车圈、自动驾驶圈。
老黄CES演讲始终有一条主线——下一阶段All in物理AI。
底层逻辑从质疑大语言模型的Scaling Law入手,提出模型“多思考比多看书可能更有用”,所以英伟达押注了强推理理解能力的世界模型路线,即Cosmos系列模型家族。
![]()
Alpamayo只是其中一环,相当于四个轮子的机器人,而整个技术体系覆盖Agent/机器人/自动驾驶/AI4S。
比如具身智能领域,老黄直接扔下了一套针对物理AI(Physical AI)的开源全家桶——模型、框架及基础设施,应有尽有。
![]()
其中Cosmos Reason 2和Alpamayo同源的,同样是让机器像人一样看懂世界并进行逻辑推理。
当然少不了英伟达传统优势项目——Vera Rubin硬件平台,第一次把CPU、GPU、网络、存储、安全,当成一个整体来设计。
核心思路就是:不再堆卡,而是把整个数据中心变成一台AI超算,达到Blackwell GPU性能的5倍之多。
![]()
结合老黄最近的一系列动作,比如收购Groq补齐推理能力、收购AI21 Labs增强大语言模型….快速补齐英伟达在GPU之外的AI能力。
连点成线,英伟达所有的动作,都是为了构件式构建链接物理世界和AI的“中间层”。
千行百业,甚至没有强AI算法能力的公司、个人,都可以用强大的基座模型和流程工具打造属于自己的产品。
老黄CES上前所未有直言不讳:
![]()
“未来所有应用,建在AI之上”。
人类的第四次生产力革命——AI浪潮,老黄野心早就不止是“教主”,而是“教父”了。
One more thing
英伟达All in物理AI,还有一个最直接的证据:
和去年发布50系显卡不同,今年同样是“消费电子展”CES,但老黄压根没提显卡的事。
毕竟,PC玩家为英伟达贡献的营收,怎么能和千行百业投资物理AI基础设施相比呢?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.