网易首页 > 网易号 > 正文 申请入驻

特斯拉、华为与新势力决胜:世界模型大战

0
分享至

都是“世界模型”(World Model)惹的祸。比如,作为读者的你,WM、WEWA、VLM、VLA你能分清吗?



确实,在“端到端”大模型火了之后,“世界模型”的出现,让高端智驾的概念变得丰富和复杂起来。然而,问题也就出现了。怎么才算真正的“世界模型”呢?还有跟VLA是个什么关系?

最近有人“打假”。“不知道中国有哪些友商真正做出VLA而不是做成一个变形的VLA,我现在所看到的部分公司,是做一个嫁接的VLA,从我所了解的信息来看,中国把VLA真正做出来的,只有我们一家。”

这是8月27日何小鹏在全新小鹏P7发布会后群访时爆出来的一番话。虽然没说明对象,但是,在小鹏之前宣布VLA量产上车的,只有理想。

不仅如此,还有对VLA和世界模型都不满意,说要做WEWA的。

就在同一天,华为智能汽车解决方案BU CEO靳玉志出来讲,“我们不会走向VLA的路径。我们认为这样的路径看似取巧,其实并不是走向真正自动驾驶的路径。”

原因在于,“华为更看重WA,也就是World Action,中间省掉Language这个环节……直接通过Vision 这样的信息输入控车,而不是把各种各样的信息转成语言,再通过语言大模型来控制车。”



所以,我们得回答一个问题,小鹏为什么炮轰友商的VLA?华为怎么也喷VLA?

在车端,在云端?

先说下VLA(视觉-语言-行为大模型)。实际上,在VLA火之前,端到端+VLM基本是智驾行业主流技术方案之一。我们可以这样理解,VLA是在端到端+VLM基础之上的技术进化形态,解决了端到端+VLM的一些局限性。

同样,在一定程度上,VLA“原生融合”的更高级模式也有赖于端到端+VLM“外挂”模式的技术积累。

不过,虽然VLA有很好的可解释性,可空间的感知能力很弱,这也是华为省掉Language这个L的原因。华为直接上了WA(World Action)。

有人反对就有人同意,元戎启行就很挺VLA。元戎启行的CEO周光发布自家的VLA模型时,称“VLA模型的下限已超过端到端的上限”。周光也称,“语音控车只是VLA的基础能力,最难的是思维链(Chain of Thought, CoT)和长时序推理。这才是VLA真正的核心能力。”



再说小鹏汽车,为啥炮轰友商,说自己才是真的VLA?原因不好说,但小鹏发布的全新P7车型,在硬件配置上进行了大幅升级,一口气搭了三颗图灵芯片,而且计划9月通过OTA上车VLA。

当然,理想跟小鹏不同,是在车端用快慢双系统,快系统为端到端E2E,慢系统的VLM(Vision-Language Model,视觉语言模型)部署参数为22亿(2B)。

随后,理想还在端到端+VLM的基础上升级,英伟达2025春季GTC大会上理想自动驾驶技术研发负责人贾鹏说,理想从零开始设计和训练基座模型,它将支持理想实现MindVLA(Vision-Language-Action,视觉-语言-行动)智驾算法模型的量产上车。

实际上,理想所谓的基座模型就是世界模型,部署在云端,以“仿真训练+场景验证”为核心,作为端到端+VLM系统的“考试系统”。理想用了车端的VLA这个概念来做营销而已。

但很明显,小鹏对于部署在车端搞VLA是嗤之以鼻的,因为参数量根本不够。李力耘认为,车端的“端到端”模型很小,有些东西很难学进去,但通过云端大模型的能力,能够真正有一些智能“涌现”。



而此前2025款小鹏X9上市发布会上,小鹏汽车自动驾驶副总裁李力耘就表示,小鹏正在研发720亿(72B)参数的超大规模自动驾驶大模型,即“小鹏世界基座模型”。

小鹏世界基座模型是一个以大语言模型(LLM)为骨干网络,使用海量驾驶数据训练的多模态大模型,具备视觉理解、链式推理和动作生成能力。小鹏的方法,是通过云端蒸馏小模型的方式,将基座模型部署到车端。从云端到车端。

李力耘还表示,“真的就是大道参数图片)至简,因为暂时不去考虑部署的问题,先通过最简单的模型、最纯粹的架构、最海量的数据,达到一个真正超越涌现的、你未曾想到的,可能在现在‘端到端’看来都是惊喜、未来都是日常的这样一个能力的涌现,这是我们最大的不一样。”

我们不能忽略一点,行业进化过程中,好不容易才从两段式端到端进化到一段式端到端,VLA也好,世界模型也好,都是在尝试和试错阶段的新方法,本来没什么对错。现在为这个争,其实还是因为博弈。

对于这些概念,地平线的相关负责人则在HSD体验日上就我的问题表示,“不管是我们现在讲的端到端,加VLM还是VLA,还是World Model,本质上它都是一个端到端。只是说,我觉得在国内,大家过于去强调新的理念和概念。”

“外挂”的对与错

说起来,“世界模型”这个做法(概念很早就有了)是谁提出来的呢?特斯拉。马斯克提出了“世界大模型”这个做法。



这个世界模型的作用是什么?是特斯拉为了实现全球范围內所有路况的自动驾驶,在感知跟决策中间,嵌入了一个AI大模型,主要是构建一个虚拟环境,以便进行自动驾驶能力的学习和验证。

做法是,首先将真实世界的数据转化为虚拟环境,就是所谓“重建”。然后,虚拟环境帮助系统在不同条件下进行能力验证和优化,即“生成”数据。这个“外挂”AI大模型与决策规划控制部分紧密相连。

而在国内,首先提出这个概念的是蔚来。2024 NIO IN(蔚来科技创新日)上,蔚来智能驾驶研发副总裁任少卿发布蔚来世界模型(NIO World Model,简称NWM),并宣布蔚来智驾从“感知驱动”转入“认知驱动”。

当然,虽然都叫世界模型,马斯克的WM,和蔚来提出的NWM,华为提出的WEWA,还是有差异的。

具体而言,蔚来的世界模型是想一步到位,直接在车端构建一个平行世界引擎。换句话说,采用云端训练+车端推理的双架构,直接通过生成式模型(如SORA)生成轨迹规划,也就是从原始的传感器数据直接生成控制指令,跳过L这个语言中间层。



这里插一句,根据比较专业的说法,世界模型,就是视频生成加prompt控制。而视频生成有四大类型,基于对抗网络GAN的,基于扩散模型的,基于自回归模型(基本上就是transformer)的和基于掩码的。

其中,扩散模型再分为Stable Video Diffusion(SVD)和Stable Diffusion(SD)两种,据说特斯拉就是用的SVD。而大名鼎鼎的SORA则是复合型,SORA模型的核心组成包括DiT、VAE和ViT(这个太专业了,略过不提)。

蔚来的设想是“无需人工标注”。底层逻辑,是把“感知-决策-控制”整合为统一的生成式模型,然后一切都在车端瞬间完成。

但这一设想和操作有个BUG。这对车端的算力需求极高,且生成式模型的实时优化问题并未完全解决。直到2025年5月底,NWM才正式全量推送。革命尚未成功,同志仍须努力呀!

而华为提出的云端+车端的WEWA模型和蔚来的WM其实原理一样,其中,云端的WE(World Engine,世界引擎)相当于“AI驾校”,车端的WA(World Action Model,世界行为模型)则是采用一段式端到端架构的“AI驾驶大脑”。



从算力来说,华为WA总参数规模相当于80亿参数(8B)模型,实际激活等效20亿参数(2B)模型的算力负担,华为讲,车端算力消耗降低75%。请注意这个数据,可以跟理想对比一下。

其实,说到底,生成式世界模型之所以被用来解决智驾的数据难题,是在于以世界模型生成Corner Case数据,让智驾系统在这个虚拟环境中通过“状态→动作→奖励”的循环来优化感知和决策能力。而且,需要车端和云端的共同作用。所以,既然讲的角度不一样,那还不如是骡子是马拉出来溜溜再说。

相对于VLA,地平线的相关市场负责人是这么讲的,“我可能会更看好World Model一些。同时,还是回到那个点,所有新技术的采纳,最终要看产品的收益在哪?因为这些东西它万变不离其宗,到最后都是一个端到端的模型。如果你带不来收益,那我就不太会去用。”

还有一点是比较现实的,“所有的新方法,它的好处是什么?它前50%的收益是好拿的,后50%的收益是贼难拿的。但是,你像端到端这种,你的整个收益没有拿好的情况下,去拿别的收益的话,也会有很多问题。所以,最终我觉得评判的标准就一个,这个方法在产品上的收益高不高?”

《自动驾驶,世界模型是唯一解?》

《开炒VLA,“端到端”过气了?》

《忽如一夜春风来,家家都喊“端到端”》

《“端到端”求L4,无异缘木求鱼》

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳一地铁口“摩的”扎堆揽客,网友吐槽:家都进不去!

深圳一地铁口“摩的”扎堆揽客,网友吐槽:家都进不去!

极目新闻
2025-09-16 20:09:53
清代知县带7人上任,被吃掉5人!古代的老虎能泛滥到什么程度?

清代知县带7人上任,被吃掉5人!古代的老虎能泛滥到什么程度?

收藏大视界
2025-09-10 18:10:03
这个波斯人的名字,成了无数程序员的梦魇!

这个波斯人的名字,成了无数程序员的梦魇!

码农翻身
2025-09-16 08:59:29
曾经溢价3万,如今价格暴跌,二手小米YU7害惨黄牛

曾经溢价3万,如今价格暴跌,二手小米YU7害惨黄牛

优视汽车
2025-09-14 10:46:10
15年后《斯巴达克斯》演员现状,蛇蝎美人变导演,谁是人生赢家?

15年后《斯巴达克斯》演员现状,蛇蝎美人变导演,谁是人生赢家?

半糖甜而不腻
2025-09-16 09:25:54
打脸来得太快!石平太郎在华资产被曝,上千万资产全被冻结

打脸来得太快!石平太郎在华资产被曝,上千万资产全被冻结

书雁飞史oh
2025-09-16 18:49:22
战术板:阿莫林的战术为何无法在曼联奏效?

战术板:阿莫林的战术为何无法在曼联奏效?

奥拜尔
2025-09-16 16:07:59
“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

梁讯
2025-09-14 19:15:18
刘强东“请客”菜单:一共15道菜,现场做“黄狗猪头肉”,还有品鉴茅台

刘强东“请客”菜单:一共15道菜,现场做“黄狗猪头肉”,还有品鉴茅台

红星资本局
2025-09-16 20:49:07
火爆!广州11区民政局均已约满

火爆!广州11区民政局均已约满

鲁中晨报
2025-09-16 10:59:04
高速能跑140km/小时?网传新政引热议

高速能跑140km/小时?网传新政引热议

大象新闻
2025-09-16 12:47:03
重大突破!英国发明治秃神器,20天长出90%毛发!

重大突破!英国发明治秃神器,20天长出90%毛发!

趣味探索
2025-07-11 23:47:13
以色列猛攻加沙城 多国呼吁中止其联合国会员国资格

以色列猛攻加沙城 多国呼吁中止其联合国会员国资格

环球网资讯
2025-09-16 14:39:14
《灼灼韶华》直到褚韶华一刀杀陈二顺,才知,她为何爬上军阀的床

《灼灼韶华》直到褚韶华一刀杀陈二顺,才知,她为何爬上军阀的床

宇林网络
2025-09-14 18:09:36
陷入癫狂:美国老罗引发全行业大清洗

陷入癫狂:美国老罗引发全行业大清洗

美第奇效应
2025-09-14 23:46:52
84-77赢澳洲豪强!徐杰34分11板6助,杜锋大赞2人,赛后数据出炉

84-77赢澳洲豪强!徐杰34分11板6助,杜锋大赞2人,赛后数据出炉

老吴说体育
2025-09-17 00:29:25
惊爆!张雨绮直播卖内裤引热议,是她穿过的内裤?网友:真不尴尬吗?

惊爆!张雨绮直播卖内裤引热议,是她穿过的内裤?网友:真不尴尬吗?

八卦王者
2025-09-16 14:29:35
布莱德・皮特以 Cliff Booth 身份重返大银幕 黄色工装装尽显范儿

布莱德・皮特以 Cliff Booth 身份重返大银幕 黄色工装装尽显范儿

述家娱记
2025-09-16 12:13:22
惊!任贤齐东莞街头吃濑粉被无视!老板娘:明星能当饭吃?

惊!任贤齐东莞街头吃濑粉被无视!老板娘:明星能当饭吃?

椰青美食分享
2025-09-16 00:55:47
“嘎子谢孟伟”公开道歉!警方已介入

“嘎子谢孟伟”公开道歉!警方已介入

第一财经资讯
2025-09-15 23:18:25
2025-09-17 01:11:00
汽车公社 incentive-icons
汽车公社
汽车公社和一句话点评聚合平台
9505文章数 13431关注度
往期回顾 全部

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

头条要闻

清华学霸小红书晒1.67亿元年薪被查 美司法部:他在逃

头条要闻

清华学霸小红书晒1.67亿元年薪被查 美司法部:他在逃

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

科技要闻

2025款Apple Watch全系怎么选?

态度原创

旅游
本地
数码
时尚
公开课

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

本地新闻

云游忻州 | 慢时光!老街逛吃,烟火气超上头~

数码要闻

AMD 推三款锐龙 PRO 9X45 商用桌面处理器,可选 6 / 8 / 12 核心

当女将军成为内娱偶像剧时尚单品,我们更怀念穆桂英

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版