一家不造车的科技公司,正在尝试让从轿车到重卡、从中国到海外的所有移动工具,共享同一套“会思考”的底层大脑。
2026年北京车展上,当绝大多数展台还在比拼单车的算力、激光雷达线数和城区NOA“开城”数量时,一家低调的智能驾驶方案供应商——卓驭科技,发布了一项可能重新定义行业竞争规则的技术:首个原生多模态基础模型。
![]()
用更通俗的话说,这套模型试图让搭载它的任何移动载体(乘用车、重卡、客车、物流车、Robotaxi),在不同国家、不同路况下,无需大量本地化适配就能“开箱即用”,并且直接达到“好用”甚至“满分”的水平。
原生多模态,更安全、更省心、更便宜
卓驭发布的原生多模态基础模型,它在预训练阶段就融入了海量跨领域数据(不只是驾驶数据,还包括互联网视频、各类移动机器人数据等),让模型直接学习物理世界的通用规律。
![]()
官方将其称为 “移动物理AI” 的技术内核,核心特点是:多模态统一输入(视频、文本、动作、语音、地图),在底层完成语义与物理理解的高度融合,没有传统VLA方案中“先翻译、再决策”的延迟和信息损耗。
这样,就意味着智驾体验不再“挑地方”。过去,即使你买了一辆号称支持城区NOA的车,到了三四线城市或乡镇,功能可能直接不可用。而原生多模态模型因为预训练阶段已经学习了大量非标准化场景(包括非铺装路面、室内外等多种环境),有望实现全国乃至全球范围内的“零泛化”直接可用。
![]()
卓驭计划今年内将该模型推送至乘用车和重卡,并作为出海的基础模型。
从参数规模看,端到端3.0/4.0模型仅有数千万到数亿参数,而真正的“大模型”具备涌现能力。卓驭表示,该模型可以蒸馏部署到不同算力平台——高配车用Thor芯片,中低配也能通过简化版本获得核心能力。
![]()
这意味着,15万级的轿车和50万级的旗舰SUV,在智驾底层逻辑上不再有代际鸿沟。
此外,卓驭已经将激目2.0(舱内激光雷达+视觉融合)和原生多模态模型引入商用车。今年6月,搭载高悟性端到端4.0的重卡将量产交付;9月,采用更先进原生多模态模型的宇通客车将量产。对于经常跑高速的卡车司机和乘坐大巴的乘客,这将显著降低因疲劳、盲区导致的事故风险。
从红旗到解放,从乘用车到物流车
技术再好,不能量产就是空谈。卓驭的优势在于,它已经搭建了从低算力到高算力的完整量产链条。
![]()
乘用车领域,已累计量产超50款车型,定点车型三位数。基于高通8775芯片的单芯片舱驾一体方案已经上车;搭载8650/8775芯片的车型,将于今年4月起OTA升级高悟性端到端4.0。而原生多模态基础模型的首批体验车正在北京车展进行试乘(基于英伟达Thor平台+11V视觉+激目2.0)。
![]()
红旗品牌方面,红旗司南组合驾驶辅助已在HS6、天工05/06量产,端到端4.0上半年OTA;下半年上市的红旗越野将搭载卓驭高性能激光雷达;概念车天工S则采用基于原生多模态基础模型的全新一代架构,支持L3/L4。商用车方面,解放J7鹰途和J6重卡的NOA产品下半年上市,搭载激目2.0和端到端4.0。
此外,今年7月启动城配物流试运营;Robotaxi搭载双Thor芯片的三冗余L4控制器,搭载原生多模态模型,预计下半年试运行。
![]()
当前智能驾驶竞争分为两大阵营:一是车企自研(如小鹏、理想、蔚来、比亚迪),二是供应商方案(华为、卓驭、Momenta等)。卓驭这条技术路线值得关注的点在于:它试图用一个大模型通吃乘用车、商用车、无人车等多个垂类,甚至横跨不同国家。如果成功,将极大降低车企和运营方的二次开发成本,加速智驾的全球普及。
![]()
当然,消费者也需要理性看待。“开箱95分”不等于100分,复杂长尾场景仍然需要持续迭代;此外,模型在海外实际路况下的表现、法规适配等问题还有待验证。但至少,卓驭给出的方向是清晰的:智能驾驶的下半场,不再是比拼谁“开城”多,而是谁能让智驾像水电一样,接入即用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.