网易首页 > 网易号 > 正文 申请入驻

何小鹏立“赌约”:明年8月底前达到特斯拉FSD效果!理想高管回应宇树王兴兴质疑,多家车企押注的VLA,靠谱吗?

0
分享至

12月11日,小鹏汽车董事长何小鹏发文称,小鹏汽车的VLA 2.0(Vision-Language-Action,视觉语言动作模型)将在下个季度发布,“因为是第一个版本,所以压力很大”。

此外,何小鹏还与公司自动驾驶团队立下特别“赌约”:若2026年8月30日前,小鹏VLA系统在国内达到特斯拉FSD V14.2版本在硅谷的整体效果,他将在硅谷筹建特色中国风味食堂。反之,自动驾驶负责人需在金门大桥完成裸跑挑战。


就在前一天,理想汽车自动驾驶研发高级副总裁郎咸朋在社交平台发布长文,回应宇树科技创始人王兴兴此前对VLA模型的质疑。

“我跟王兴兴观点最不一样的地方在于,他认为模型架构更重要,但我认为模型的关键是要与整个具身智能系统适配。在此基础上,数据是起决定意义的。”郎咸朋认为,“VLA就是自动驾驶最好的模型方案。”


近几年,辅助驾驶行业经历了多次“技术底座”的范式迁移——从企业普遍把激光雷达+高精地图奉为“黄金组合”,到引入BEV(鸟瞰图)+Transformer摆脱高精度地图,再到端到端将辅助驾驶带入AI时代,企业普遍按照这个路径来推进辅助驾驶功能。

但进入2025年,行业在辅助驾驶的发展方向上出现了VLA与世界模型的“分歧”,而理想与小鹏就是选择VLA方案的代表。


两技术派别“各执一词”

据了解,VLA被业内视为端到端方案的“智能增强版”。其名称中的V代表视觉感知(Vision),A代表动作执行(Action),而中间的L则是大语言模型(Language Model)。V负责实时感知环境,A负责输出具体控制指令,L则像“中台”一样,把感知信息转译为可供A执行的规划与决策。

清华大学车辆与运载学院助理研究员颜宏伟表示:“VLA是多模态大模型驱动的智能体架构,其核心突破在于引入思维链,通过语言模型实现对环境理解与决策推理的可解释性。”

“VLA模型融合了语言模型,具备强大的思维链能力,能摆脱传统端到端模型的黑盒难题,并将信息串联、分析,从而推理出因果关系。此外,它天然集成海量知识库,泛化能力更强,能够更好地适应复杂多变的真实道路环境。”元戎启行CEO周光认为。

不过,王兴兴在今年8月的一次演讲中则表示:“我个人对VLA模型还是保持比较怀疑的态度。”在他看来,VLA模型是一个相对比较傻瓜式的架构,在和真实世界交互时,它的数据质量、能采集的数据是不太够用的。

郎咸朋则认为,空谈架构不如看疗效。在自动驾驶领域,脱离了海量真实数据谈模型架构都是空中楼阁,“我们之所以坚持VLA,是因为我们拥有数百万辆车构建的数据闭环,这让我们能在当前算力下,把驾驶水平做到接近人类”。


图片来源:理想汽车官网

郎咸朋称,要想做好自动驾驶,必须先把自动驾驶当作完整的具身智能系统对待,每一部分在研发过程中要相互配合才能将价值发挥出来。此外,他还认为,模型的关键是要与整个具身智能系统适配,在此基础上,数据是起决定意义的。在机器人领域获取数据相对困难,但在自动驾驶领域,特别是建立起数据闭环能力的车企来说并不是大问题。

尽管郎咸朋表明了机器人领域与汽车领域有别,车企搭建数据闭环并非难事,仍有一些汽车背景的公司并未踏上VLA这条路径。比如,华为智能汽车解决方案BU CEO靳玉志就表示:“我们不会走向VLA的路径。这样的路径看似取巧,其实并不是走向真正自动驾驶的路径。”

“华为更看重WA(世界行为模型),也就是World Action,中间省掉Language这个环节……直接通过Vision这样的信息输入控车,而不是把各种各样的信息转成语言,再通过语言大模型来控制车。”靳玉志进一步解释称,华为乾崑自研的WEWA架构包含云端的世界引擎(WE)与车端的世界行为模型(WA)。其中,WE负责海量数据训练与场景生成,WA则实现车端的实时环境推理与拟人化决策。

据悉,“世界模型”源自人类对环境的认知机制,指的是AI系统通过感知数据构建一个对物理世界的内部模拟,从而具备预测、推理和生成合理行为链的能力。在辅助驾驶中,它不再只是“看见”世界,而是理解世界,预测未来可能发生的情况,并提前做出决策。例如,它不仅能识别前方有一辆自行车,还能预测它是否会突然变道,从而提前减速或避让。

除华为外,蔚来、商汤等企业也都在此技术路线上进行布局。


VLA与世界模型未来有望深度融合

需要注意的是,尽管不同企业对于VLA和世界模型两种技术“各执一词”,但两者并不矛盾。

国海证券在研报中表示:“VLA与世界模型在技术上并非同级或对立关系。我们将发展路径分为两派,实质上是产业玩家在实现端到端能力之后,在能力优化侧重点上出现了分化。”

“双方技术融合趋势明显,双方均在向对方领域渗透。例如,VLA 引入强化学习与仿真优化动作生成。”国海证券表示。

理想汽车董事长李想在去年底的直播中也提到,VLA可以拆解为预训练、后训练和强化学习三个层面。强化学习中最重要的一步就是在世界模型里闭环学习,引入舒适度、碰撞、交通规则等规则来打磨、反馈,让VLA比人类开得更好。

“世界模型的高算力需求(训练和推理都是)决定了它更适合在云端做数据生成和极度逼真的仿真测试和强化训练,这也是理想目前正在做的。”郎咸朋说。

小马智行CTO楼天城则表示:“我了解大部分公司两种技术都用,比如Waymo也用了谷歌Gemini大语言模型。世界模型和VLA模型不是一个维度的东西,而是交错的。这两个东西不矛盾、不冲突,机器人领域非常多。我认为想要做百辆无人车以上,世界模型最关键。对其他公司(而言),可能做VLA模型卖车最关键。大家选择不同的路线是因为目标不同。”

值得一提的是,既向C端卖车,又计划推出Robotaxi的小鹏,有将两种技术融合的趋势。在11月5日的2025 AI DAY小鹏科技日上,小鹏汽车正式发布了第二代VLA。第一代VLA的方案是V到L再到A,第二代VLA是V+L到A,也就是把L转移到了输入端。


图片来源:小鹏汽车官网

“第一代VLA模型中间涉及两次语言转换,这会带来大量信息损耗,比如一段1200多字的文字描述也无法精准地‘翻译’一个十几秒的视频,而以视觉为核心,则把模型看到的世界直接转换成运动轨迹。”何小鹏说。

11月7日的上海进博会上,小鹏汽车自动驾驶产品高级总监袁婷婷分享了她对小鹏二代VLA架构的理解:“小鹏的二代VLA既是VLA模型,也是世界模型。”

在其展示的PPT中,世界模型是作为二代VLA的一个记录器存在的:当V和L作出车辆运动轨迹和动作决策时,这个决策会被记录到世界模型中;同时,与这个决策一同被记录的,还有决策前的车辆状态,即V和L形成的感知信号。也就是说,小鹏二代VLA在用其VLA数据训练世界模型。

在小米汽车主任科学家陈龙看来:“一个管‘抽象思考’,一个管‘物理感知’,完全没必要拉踩!VLA+WM的结合,才是通往更强通用具身智能。”

对于辅助驾驶底层技术的演进,国元证券方面认为,未来,VLA与世界模型的深度融合,有望成为高阶智驾系统实现类人驾驶决策能力的关键拐点。

长安汽车智能驾驶高级总工程师则表示,在未来2至3年内,辅助驾驶的技术架构还将迎来1至2轮迭代,到2028年有望收敛至相对稳定的状态。

(声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。)

记者|孙磊

编辑|段炼裴健如 杜波

校对|黄博文

|每日经济新闻 nbdnews 原创文章|

未经许可禁止转载、摘编、复制及镜像等使用

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
渔村逆袭?“电诈恶魔”陈志老婆是四川人,150亿比特币沾满血泪

渔村逆袭?“电诈恶魔”陈志老婆是四川人,150亿比特币沾满血泪

豆腐脑观察局
2025-11-17 06:50:03
郎平做梦也没想到,曾获5连冠女排队长杨锡兰,今会在瑞士当保安

郎平做梦也没想到,曾获5连冠女排队长杨锡兰,今会在瑞士当保安

青史楼兰
2025-12-31 09:14:30
白银大涨7%,创历史新高

白银大涨7%,创历史新高

每日经济新闻
2026-01-13 07:36:26
伊朗外长:伊朗不寻求战争,但已做好战争准备

伊朗外长:伊朗不寻求战争,但已做好战争准备

新华社
2026-01-12 16:51:04
索马里风云突变,中方反应迅速调整行程,王毅外长过门不入

索马里风云突变,中方反应迅速调整行程,王毅外长过门不入

阿器谈史
2026-01-13 12:16:06
不差钱!中超最贵锋线诞生:总价值4500万,高居联赛第一!

不差钱!中超最贵锋线诞生:总价值4500万,高居联赛第一!

国足风云
2026-01-13 09:51:57
公司上司请领导吃饭叫我结账,账单显示1万5,我想都不想直接走人

公司上司请领导吃饭叫我结账,账单显示1万5,我想都不想直接走人

白云故事
2025-04-17 11:25:03
董卓巅峰时阵容有多牛?麾下两个顶级谋士、三位元帅、十余名猛将

董卓巅峰时阵容有多牛?麾下两个顶级谋士、三位元帅、十余名猛将

铭记历史呀
2025-12-16 18:54:04
陈星旭的帅气被低估了,飞机上遇到他被他的颜值震撼,当场路转粉

陈星旭的帅气被低估了,飞机上遇到他被他的颜值震撼,当场路转粉

情感大头说说
2026-01-13 00:31:48
天道:低级人活在情绪里,中级人活在价值里,高级人活在觉醒里

天道:低级人活在情绪里,中级人活在价值里,高级人活在觉醒里

洞见
2026-01-09 21:19:55
携程大面积误发离职通知引发争议,员工回应

携程大面积误发离职通知引发争议,员工回应

大象新闻
2026-01-12 20:13:09
尼克松访华时留意到 “打倒美帝国主义” 的标语,毛主席用风趣的话语化解尴尬,尼克松听后爽朗大笑

尼克松访华时留意到 “打倒美帝国主义” 的标语,毛主席用风趣的话语化解尴尬,尼克松听后爽朗大笑

清风鉴史
2025-12-20 18:40:22
她不愿意被潜规则,演了近百部戏观众却叫不出她名字,42岁仍单身

她不愿意被潜规则,演了近百部戏观众却叫不出她名字,42岁仍单身

丁丁鲤史纪
2025-12-27 16:10:28
6800元买的古钱币,多年后同一家机构鉴定变“假货”?男子起诉卖家和鉴定机构,法院判决公布→

6800元买的古钱币,多年后同一家机构鉴定变“假货”?男子起诉卖家和鉴定机构,法院判决公布→

封面新闻
2026-01-13 00:37:07
章泽天首播选址刘嘉玲2.6亿豪宅,60岁嘉玲姐气场全开

章泽天首播选址刘嘉玲2.6亿豪宅,60岁嘉玲姐气场全开

老腘的世界视角
2026-01-13 08:42:10
警惕!国内高层渗透的间谍,已经转向身份普通的保洁员、外卖员等

警惕!国内高层渗透的间谍,已经转向身份普通的保洁员、外卖员等

扶苏聊历史
2026-01-11 08:25:03
“世界第一烈酒”的崛起之路,对我国酒企有何启示?

“世界第一烈酒”的崛起之路,对我国酒企有何启示?

虎嗅APP
2026-01-13 01:45:13
国乒新教练班子空留两岗位是最大看点 马龙樊振东或以双重身份回归

国乒新教练班子空留两岗位是最大看点 马龙樊振东或以双重身份回归

劲爆体坛
2026-01-12 19:22:18
伊朗抗议者亲手击毙下令射杀群众的伊朗军官

伊朗抗议者亲手击毙下令射杀群众的伊朗军官

桂系007
2026-01-12 00:31:50
刘浩存 内娱165最强比例王

刘浩存 内娱165最强比例王

草莓解说体育
2026-01-13 11:26:17
2026-01-13 13:12:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1455410文章数 2721652关注度
往期回顾 全部

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

头条要闻

印度企业未能获得中国技术 叫停大项目

头条要闻

印度企业未能获得中国技术 叫停大项目

体育要闻

阿隆索得知下课后先是惊讶 然后表示如释重负

娱乐要闻

周杰伦以球员身份参加澳网,C位海报公开

财经要闻

中国一口气申报20万颗卫星,意味着什么?

科技要闻

每年10亿美元!谷歌大模型注入Siri

态度原创

家居
时尚
本地
旅游
游戏

家居要闻

现代简逸 寻找生活的光

走过那个夏天,甜茶终于站上金球奖之巅

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

旅游要闻

这座暖冬惬意小城,让你实现美食自由!

黑旗&波斯王子RE真要来了?网站疯狂更新!

无障碍浏览 进入关怀版