网易首页 > 网易号 > 正文 申请入驻

智驾终局:VLA与WA的“强脑”之争

0
分享至



智驾领域的“终场哨”尚未吹响,真正的终局属于那些能把“说话”和“想象”融合成“思考”的玩家。

原创ⓒ新熵 新能源车组

作者丨茯神 编辑丨思原、九黎

当理想i8在暴雨中的山区公路上自动识别出被冲垮的路肩,平稳减速并规划出绕行路线时;当小鹏P7 Ultra仅凭视觉传感器就精准避让了横穿马路的流浪猫与突发变道的货车时,智能驾驶行业悄然迎来了一场技术革命的临界点。

新能源汽车的市场淘汰赛已进程过半,从电池续航、充电速度到座舱智能化,竞争之下市场早已进入红海,甚至智驾能力也正从争议不断的“加分项”转变为决定车企生死的“生存项”。

今年8月,理想、小鹏、元戎启行在两周内先后宣布VLA(Vision-Language-Action)大模型上车,规划帧率从10Hz跳到20Hz,端到端时延压进100ms。或许就在同时,华为在松山湖实验室里正演示着,一辆搭载激光雷达的轿车在仿真机里连续“想象”未来5秒,把自己从暴雨+锥桶+逆行三轮车的死局中救了出来,用的正是WA(World Action)世界模型。



▲ 图/小红书截图

两条不同的路线,却是同样的终局。VLA让汽车“开口说话”,WA让汽车“动脑想象”。谁先把“说话”变成“思考”,谁就在新能源淘汰赛的最后一节拿到发球权。

后端到端时代



在智能驾驶行业的早期发展阶段,硬件无疑是竞争的核心所在。车企们深知,要想让车辆具备智能驾驶的能力,首先得让车辆“看”得见、“听”得清、“反应”得快。因此,它们在传感器、芯片等硬件上投入了大量的资金和精力。

传感器就如同车辆的“眼睛”和“耳朵”,能够感知周围的环境信息。激光雷达、摄像头、毫米波雷达等不同类型的传感器各有优劣,车企们需要根据自身的技术路线和成本预算进行选择和搭配。

芯片则是车辆的“大脑”,负责对传感器采集到的数据进行快速处理和决策。高性能的芯片能够提供强大的计算能力,支持复杂的算法运行,从而实现更高级的智能驾驶功能。英伟达、英特尔等芯片巨头,推出的自动驾驶芯片在算力、功耗等方面不断取得突破,为智能驾驶的发展提供了有力的支持,自然成了车企们争相合作的对象。



▲ 图/英伟达旗舰智驾芯片Thor

然而在之前的硬件竞赛逻辑里,车企们普遍认为“传感器数量决定感知能力”,但这种思路很快陷入了高成本与低效率的双重困境。以激光雷达为例,2020年一颗高性能激光雷达的成本超过1万美元,搭载3颗激光雷达的车型仅硬件成本就增加3万美元,这直接导致早期智驾车型的售价普遍超过50万元,难以进入主流市场。

小鹏P7早期版本因搭载两颗激光雷达,售价较同配置无激光雷达版本高出8万元,上市后月销长期徘徊在3000辆以下,直到推出简化激光雷达配置的版本才实现销量突破。



2019年,作为端到端路线的先行者,特斯拉为智能驾驶技术的发展开辟了一条新的道路。该路线的核心思想是通过大量实际路测数据训练模型,让车辆直接从传感器输入到控制输出,实现自动驾驶技术的快速迭代。

特斯拉利用其庞大的车队规模和广泛的用户群体,收集了海量实际路测数据,这些数据涵盖了各种不同的路况、天气条件和驾驶场景。再通过对这些数据的分析和训练,自动驾驶模型不断优化和改进,最终实现自动辅助导航驾驶、自动变道、自动泊车等一系列高级功能。

国内车企在看到端到端路线的成功之后,随即纷纷效仿。它们加大了在数据采集和模型训练方面的投入,希望能够在这场智能驾驶的竞赛中占据一席之地。

不过,端到端路线并非完美无缺,它在处理长尾场景时存在着明显的局限,比如突然出现的行人、违规行驶的车辆、恶劣天气下的道路状况等。由于这些场景在实际路测中出现的频率较低,端到端模型很难通过少量的数据进行充分的学习和训练,因此在面对这些情况时往往难以做出准确的判断和决策。

VLA闪电逆袭



端到端路线的局限,为VLA路线的崛起埋下了伏笔。

2023年底,理想汽车率先提出VLA技术概念,其核心是通过整合视觉、语言、行动三种模态,让智驾系统像人类一样“观察、推理、决策”。

与端到端的“数据映射”不同,VLA系统能够将视觉感知到的信息转化为语言描述,再通过语言模型进行逻辑推理,最后输出具体的行动指令。

在智能驾驶的赛道上,“先发优势”曾被视为不可逾越的壁垒。华为早在2019年就推出了ADS(高阶智能驾驶系统),凭借激光雷达+高精地图的组合,一度成为行业技术标杆;百度Apollo更是从2013年就开始布局智驾,累计投入超过500亿元。然而,VLA路线的出现,让理想、小鹏等“后发者”实现了闪电逆袭,彻底改写了行业竞争格局。



理想用户在日常使用汽车的过程中,车辆会持续收集各种驾驶数据,包括道路信息、交通状况、驾驶行为等。这些数据不仅数量庞大,而且涵盖了多种不同的场景和情况,为VLA模型的训练提供了丰富的素材。通过对这些数据的分析和挖掘,理想汽车的研发团队能够深入了解用户的需求和驾驶习惯,针对性地对VLA模型进行优化和改进,提高模型的准确性和适应性。

小鹏汽车则在算力方面加大投入,构建起强大的云端训练集群,为VLA模型的高效训练提供了有力支持。

其研发团队可以利用云端训练集群同时运行多个模型训练任务,大大提高了训练效率。此外,云端训练集群还具有可扩展性,能够根据研发需求随时增加计算资源和存储容量,满足VLA模型不断迭代和优化的需求。



当然,并不是所有玩家都有理想、小鹏的体量。成立于2019年的元戎启行,2024年也选择“All in VLA”。不妨这样算一笔账:做10万辆车、每车每天跑50公里、回传率20%,一年就能攒到18亿公里数据,刚好跨过“冷启动死亡谷”。

为了抢时间,元戎把DeepRoute IO 2.0平台开放给五个定点合作项目。今年8月26日,元戎发布VLA量产版本,对于年销量较低且资金不充裕的企业而言,这几乎是唯一可选的“船票”。VLA让中小车企第一次有机会用低成本复制头部体验,错过就没了。

WA才是终极?



与全民VLA的喧嚣不同,华为、蔚来却选择了一条更为“激进”的技术路线——WA(World Model,世界模型)。

WA路线的核心逻辑是,让智驾系统通过云端模拟数据构建一个“数字孪生世界”,从而实现对真实世界的深度理解。与 VLA 的“从数据到决策”不同,WA试图让系统“先理解世界,再作出决策”,这种思路被不少专家视为智驾的“终极答案”。

华为ADS研发负责人王军,曾用一个生动的比喻解释WA的优势:“如果把智驾系统比作学生,VLA是通过做海量习题来应对考试,遇到没见过的题目就会束手无策;而WA是先理解知识点,无论遇到什么新题目,都能通过规律推导得出答案。”蔚来的李斌也曾在内部邮件中称:“WA让车拥有‘想象力’,而不是‘记忆力’。”

从理论上看,WA系统能够从根本上解决VLA系统对数据的依赖,尤其是在处理长尾场景时,具备更强的通用性和适应性。

不过,这些优势目前还是基于理论,想要实现商业化落地,WA路线仍需突破资金、数据、模拟与现实平衡的三重考验,也使其暂时成为了“巨头专属”。

构建数字孪生世界,涵盖硬件设备、软件研发、场景建模等多个领域。华为在WA路线上的投入已超过200亿元,其中仅数字孪生平台的服务器集群就耗资50亿元,每年的电力和维护成本高达8亿元;蔚来为了研发WA系统,专门成立了 “世界模型实验室”,截至2024年,累计投入超过150亿元,占其总研发费用的40%。



▲ 图/华为

这种级别的资金投入,将绝大多数中小车企拒之门外。某新势力车企创始人曾坦言:“我们不是不想做WA,而是做不起。仅构建基础的数字孪生场景,就需要至少50亿元,这相当于我们3年的研发预算,根本无法承担。”相比之下,VLA路线的研发投入仅为WA的十分之一,更适合资金有限的企业。

VLA让汽车先学会“说话”,WA让汽车再学会“想象”。前者或许是眼下的赛点,后者则可能是三年之后的终点。对于理想、小鹏,VLA是逆袭的通行证;对于华为、蔚来来说,WA是护城河的奠基石。而更多年销量不过十万辆的品牌,只能在窗口期里拼命挤上船,哪怕船票是成为“代工厂”。

驾领域的“终场哨”尚未吹响,真正的终局,属于那些能把“说话”和“想象”融合成“思考”的玩家。在这场没有硝烟的战争中,只有那些既能把握当下市场需求,又能洞察未来技术趋势的企业,才能在新能源汽车的淘汰赛中笑到最后。

参考资料:

经济观察报,《理想的VLA“长征”》

虎嗅,《新一轮智驾PK,迈入实战时刻》

远川汽车评论,《让一部分辅助驾驶先学会思考》

42号车库,《元戎启行发布VLA模型,起点是让AI学会害怕?》

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场3-1让那不勒斯登顶意甲!孔蒂激活曼联弃将:首秀14分钟进球

一场3-1让那不勒斯登顶意甲!孔蒂激活曼联弃将:首秀14分钟进球

球场没跑道
2025-09-14 08:26:37
意外!外滩晨跑姑娘陷争议,真相竟是穿内衣起红疹

意外!外滩晨跑姑娘陷争议,真相竟是穿内衣起红疹

甜柠聊史
2025-09-08 10:49:42
台湾演员艾悠日本下海!有东西啊!

台湾演员艾悠日本下海!有东西啊!

贵圈真乱
2025-09-08 10:32:06
中超24轮积分榜:前3突破50分,9队破30分提前保级,降级4选2

中超24轮积分榜:前3突破50分,9队破30分提前保级,降级4选2

中超伪球迷
2025-09-14 21:35:17
于东来惨了!被央媒表扬不到两天,却三次力挺西贝,口碑迅速崩盘

于东来惨了!被央媒表扬不到两天,却三次力挺西贝,口碑迅速崩盘

奇思妙想草叶君
2025-09-14 13:56:12
事发辽宁!她从银行取出32万后,被公安锁定……紧急提醒!

事发辽宁!她从银行取出32万后,被公安锁定……紧急提醒!

沈阳生活圈i
2025-09-14 13:17:19
老少恋的“残酷现实”,终于在74岁郭台铭身上体现得淋漓尽致

老少恋的“残酷现实”,终于在74岁郭台铭身上体现得淋漓尽致

牛牛叨史
2025-09-14 03:40:08
因为一只鸡,全红婵大哥把广东人架在火上烤……

因为一只鸡,全红婵大哥把广东人架在火上烤……

躺倒鸭
2025-09-15 09:15:08
太炸裂!女子坐到纹身展评委身上做不雅动作!多方回应

太炸裂!女子坐到纹身展评委身上做不雅动作!多方回应

恪守原则和底线
2025-09-15 05:30:04
24岁小伙爱上51岁大妈,大妈性欲高还虐待他,结果被小伙砍成5段

24岁小伙爱上51岁大妈,大妈性欲高还虐待他,结果被小伙砍成5段

胖胖侃咖
2024-04-22 08:00:09
石破茂刚辞职,日本对华对抗动作已摁不住了:沿海地区被导弹覆盖

石破茂刚辞职,日本对华对抗动作已摁不住了:沿海地区被导弹覆盖

荷兰豆爱健康
2025-09-14 15:14:04
退休两年后,徐文龙落马

退休两年后,徐文龙落马

政知新媒体
2025-09-14 10:26:53
四川省的这个村庄,还存在一妻多夫制奇葩婚制,真是女人的天堂

四川省的这个村庄,还存在一妻多夫制奇葩婚制,真是女人的天堂

牛牛叨史
2025-09-06 23:41:41
雷军:我们要认真向特斯拉学习,除了特斯拉,比我们好的没有!网友:“天下造车,唯马与雷尔!”

雷军:我们要认真向特斯拉学习,除了特斯拉,比我们好的没有!网友:“天下造车,唯马与雷尔!”

大白聊IT
2025-09-14 10:43:28
联盟最有钱的10位老板:蔡崇信122亿第7,3人超300亿,第一1515亿

联盟最有钱的10位老板:蔡崇信122亿第7,3人超300亿,第一1515亿

你的篮球频道
2025-09-14 10:40:38
隔壁开发商想借一下花园搭个脚手架?!搭完不走了!法院判赔5万镑却成空!

隔壁开发商想借一下花园搭个脚手架?!搭完不走了!法院判赔5万镑却成空!

英国那些事儿
2025-09-13 23:23:00
厨师戴大金链子炒菜,贾国龙睡不着,才两天,西贝无人生意惨淡

厨师戴大金链子炒菜,贾国龙睡不着,才两天,西贝无人生意惨淡

小彭聊社会
2025-09-15 01:01:48
为了永留美国,在联合国大楼举牌抹黑中国的张晓宁,终于“圆梦”

为了永留美国,在联合国大楼举牌抹黑中国的张晓宁,终于“圆梦”

来科点谱
2025-09-15 09:10:34
宋喆近况曝光:躲在小县城蜗居,骑着破电驴,彻底被马蓉抛弃了

宋喆近况曝光:躲在小县城蜗居,骑着破电驴,彻底被马蓉抛弃了

坦然风云
2025-09-08 00:05:12
《乔布斯传》:真正厉害的人,早已把人生调成了极简模式,聚焦不是选择,而是删掉99%的东西

《乔布斯传》:真正厉害的人,早已把人生调成了极简模式,聚焦不是选择,而是删掉99%的东西

芝士圈
2025-09-11 13:57:35
2025-09-15 10:27:00
新熵 incentive-icons
新熵
洞察商业变量,探寻商业本质。
4761文章数 64515关注度
往期回顾 全部

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

头条要闻

罗永浩:送10万现金至西贝总部并直播 兑现悬赏公告

头条要闻

罗永浩:送10万现金至西贝总部并直播 兑现悬赏公告

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

“预制菜大战”100小时

科技要闻

发布会再提乔布斯,苹果高调回归设计初心

态度原创

家居
健康
旅游
数码
游戏

家居要闻

原木风格 温馨舒适氛围

内分泌科专家破解身高八大谣言

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

数码要闻

初探苹果 AirPods Pro 3 无线耳机:佩戴更舒适、降噪更卓越

R星官方招聘谈《GTA6》:史上最大规模电子游戏

无障碍浏览 进入关怀版