来源:市场资讯
(来源:芝能汽车)
2026年的中国智能辅助驾驶的竞争越发激烈,从头部新势力自研,到华为、Momenta、地平线、卓驭、轻舟和元戎等辅助驾驶第三方企业来拓展市场。
从技术层面正在从端到端的大力出奇迹,“依赖数据覆盖的工程问题”,转向“基于物理世界建模的基础模型问题”。
对于第三方企业,如何在技术方向和成本结构上找到自己的路,很重要。
卓驭通过原生多模态基础模型,试图用一套统一的移动智能基座打穿跨车型、跨场景、跨垂类、跨国家的智能移动能力,来找到自己的前路。
![]()
01
智能辅助驾驶
从工程问题走向世界建模问题
智能辅助驾驶过去十年的技术路径,本质可以分为三代:
◎ 第一代是基于规则与高精地图的小模型体系,本质是专家系统,通过人为编码与规则约束实现安全与可控,但泛化能力极弱,必须依赖“开城”逐步适配;
◎ 第二代是端到端中模型,通过数据驱动将感知、预测与决策部分融合,通用能力显著提升,但其本质仍是对驾驶行为的拟合,在跨地域、跨场景时依然高度依赖数据覆盖;
◎ 而当前正在发生的第三次技术变化,是以原生多模态基础模型为代表的大模型,核心变化从“更大”的模型转向更智能,建模对象从“驾驶行为”转向“物理世界本身”。
即通过统一表征学习物体运动、交互逻辑与空间约束,使智能辅助驾驶从一个依赖工程适配的问题,转变为一个世界建模问题。
![]()
中国智能辅助驾驶企业需要在竞争下拿到更多的载体,大规模出海拓展装机量。
面对东南亚、欧洲等复杂且差异化显著的交通系统,传统“逐城适配”的方式成本无法承受;
智能辅助驾驶从乘用车开始,向商用重卡、客车、无人物流车、Robotaxi等多垂类扩展,不同载体在动力学与使用场景上的差异,使得“为每一种车重做一遍”的模式不可持续;
随着行业进入规模化阶段,成本成为决定性因素,如果不能在底层实现统一建模,智能辅助驾驶将长期停留在“项目制行业”,无法形成真正的平台化能力。
02
原生多模态基础模型
改变了什么
从技术底层来看,原生多模态基础模型的变化并不是简单的“从V到A去掉语言”,而是发生在三个更深层的维度:
◎ 首先是在表征层,传统VLA体系需要将视觉信息转译为语言或语义token再进行推理,这一过程不可避免带来信息损耗与延迟,
而原生多模态模型通过地图等统一表征的输入,消除了语义翻译带来的延迟与信息损耗,实现语义与物理理解的高度统一,没有“拼接感”,从而拥有更高的性能天花板与更强的泛化能力。
◎ 其次是在学习目标上,从过去的“预测人类驾驶行为”转向“预测物理世界状态转移”,即模型不再只是模仿驾驶,而是理解物体如何在三维空间中运动与交互,从而直接输出可行的运动轨迹;
◎ 最后是在数据结构上,原生多模态基础模型的技术内核,是在底层完成对物理世界通用规律的预训练,支持视频、文本、动作、语音、地图等多模态信息的统一表征输入。
除智能驾驶专属数据外,还覆盖互联网数据及各类移动机器人数据,形成以移动传感器为中心的海量数据训练体系。
通过预训练阶段的海量跨领域、跨国家知识输入,使模型能够学习更通用物理规律,在不同垂类和地域中仅需简单激活即可高效运作。
这种变化带来的直接结果,是泛化能力的来源发生改变。
过去泛化依赖数据覆盖,即“见过才能做”,而在新的范式下,泛化更多依赖于对世界规律的抽象能力。
可以理解为“理解了就能做”,其本质可以概括为:泛化能力等于统一表征能力、数据多样性以及物理约束一致性的共同作用,这也是为什么行业开始强调“世界模型”和“物理AI”,因为只有在这个层面,跨场景、跨垂类的能力迁移才具备工程上的可行性。
在能力层面:
◎ 原生多模态基础模型首先改变的是跨城市泛化方式,传统方案需要针对每一个城市进行交通规则、道路结构与标识系统的适配,本质上是在“记忆环境”。
而新的模型通过学习交通行为的抽象规则,实现对不同城市交通系统的统一理解,使新城市部署从“重新训练”转变为“直接迁移”,尽管并非完全零成本,但泛化成本已经从线性下降到接近常数级;
◎ 其次是在跨垂类层面,卓驭强调同一套模型可覆盖乘用车、商用重卡、客车等不同载体。
这背后的关键并非简单复用,而是在模型中统一完成感知与决策,而将控制层进行参数化解耦,使模型学习的是“如何在物理空间中规划安全轨迹”,而不是“如何驾驶某一类车辆”,从而具备跨动力学系统的迁移能力;
◎ 最后是在跨国家与复杂场景层面,通过引入跨区域、多密度交通数据,模型能够在不同分布之间保持稳定表现,尽管极端长尾场景仍需少量校准,但整体泛化成本已经出现非线性下降趋势。
03
从项目制到平台化
的成本函数变化
![]()
技术的变化决定了能力上限,真正的价值体现在成本结构的重构上。
传统智能辅助驾驶本质是项目制逻辑,每进入一个新城市或新车型,都需要重新进行数据采集、规则适配与验证,其成本函数近似为“场景数量 × 车型数量”的线性增长。
而在原生多模态基础模型框架下,成本结构发生根本变化:前期需要投入巨大的固定成本用于预训练,包括算力、数据与算法,但一旦模型建立,其在不同场景、不同载体上的部署成本将迅速下降,边际成本趋近于零,从而形成类似操作系统或云平台的规模效应。
卓驭的策略也变得清晰,通过跨垂类(乘用车、商用重卡、客车、Robotaxi)、规模化量产(超过50款车型、130+项目),从而加速模型收敛,并在更短时间内摊薄基础模型的固定成本。
这种路径一旦成立,将形成明显的结构性优势,即后进入者不仅要追赶模型能力,还要追赶数据规模与成本曲线。
在产业层面,原生多模态基础模型并不能独立成立,其必须依赖真实场景中的规模化验证与数据回流。
因此卓驭在本次发布会中强调与34家客户的合作,通过多车型、多场景的量产验证,形成持续的数据飞轮,同时验证模型在不同工程条件下的稳定性。
这一点对于大模型路线尤为关键,因为只有在真实道路环境中持续运行,模型才能不断逼近物理世界的复杂性,从而完成从“技术闭环”到“产业闭环”的跃迁。
小结
如果说过去十年,智能辅助驾驶的竞争是“谁能把一个城市做好”,那么未来十年,竞争将变成“谁能用一套模型,在最多场景中稳定运行”。
在这个过程中,行业将逐渐分化为两类公司,一类仍停留在场景工程与局部优化层面,另一类则通过基础模型与数据飞轮演化为“移动物理AI基础设施”,而卓驭此次发布的原生多模态基础模型,也是一次重要的尝试。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.