网易首页 > 网易汽车 > 正文

李想的“阳谋”:用VLA司机大模型构建随车代驾

0
分享至
只要人类需要司机,VLA就有存在意义,VLA的诞生不仅是理想汽车的“技术宣言”,更预示交通领域生产力革命的起点。更大的蓝图是绘制一张世界模型的“大网”,基于现有交通路线规划的VLA是验证并构建这张“大网”所闯出的第一关。

版权声明:本文版权为网易汽车所有,转载请注明出处。 

网易汽车5月9日报道 在理想AI Talk第二季的访谈中,李想以“从动物进化到人类”为隐喻,揭示了理想汽车在自动驾驶领域的终极野心——将AI从“辅助工具”升维为“生产工具”,而 VLA(视觉-语言-行动)司机大模型正是这一跃迁的核心载体



理想AI Talk第二季:VLA司机大模型重构辅助驾驶底层

讲真,这场技术访谈包含大量AI技术术语,对于公众来说,理解门槛着实不低。看似李想对于AI的态度有些“疯魔”和捉摸不透,实际背后深意并非只是给你我上的AI科普课堂,更多的是面向行业投资人、AI业内精英人才的“誓师宣言”+“英雄令”,终极目标是抢得下一阶段商业先机与实现全社会的AI生态重构。

理想AI Talk第二季:VLA司机大模型重构辅助驾驶底层

与此同时,我们也能够看到理想当红L序列的全面焕新,应用VLA司机大模型的L系列于今年下半年就将落地AD Max辅助驾驶平台。同时为即将发布的纯电SUV理想i8造势,引导公众看清VLA=下一代自动驾驶技术这一风向标。

理想AI Talk第二季:VLA司机大模型重构辅助驾驶底层

主持人提问提到了近期大模型的动态,坦率地说只有中美两国具备改写全球AI动向的势能,李想谈到拥抱DeepSeek的过程比预想的要快许多,这意味着摒弃理想自研的语言模型,收获的是理想VLA(视觉语言行动模型)推出进程加快。作为回馈全行业,理想将星环OS做开源,颇有向DeepSeek致敬的深意,一定程度上也缓解了行业无限内卷的紧迫感,让更多厂商能够依靠开源快速武装自身科技力和智能水平。

理想AI Talk第二季:VLA司机大模型重构辅助驾驶底层

上文让我感受最深的两个字就是:“胸怀”,唯有具备降维打击的技术信心,才能像学霸一样奔赴下个考场的路上将高分作答的试卷公开给旁人,我们再来深度谈谈VLA的行业意义:从端到端+VLM的“双系统”到VLA的“三位一体”,这便是VLA的技术进化论。

理想VLM司机模型破解模型黑盒 (来源:网易汽车)

·端到端+VLM的局限:机械性与割裂感

理想汽车的辅助驾驶曾经历两代架构:

- 规则驱动(昆虫阶段):依赖高精地图与预设算法,如同蚂蚁遵循固定路线,无法应对复杂路况(如道路施工)。这里指代的是基于规控的辅助驾驶,例如早期高精地图指引的NOA。

- 端到端+VLM(哺乳动物阶段):大模型学习人类驾驶行为,但语言与视觉模型分立,导致决策黑箱、极端场景失效。例如,面对ETC车道时,视觉语言模型(VLM)因缺乏空间感知能力,难以处理多车道选择(如京承高速的十几个ETC入口),需依赖人工接管。  这里指代的是当下理想AD Max和AD Pro呈现的辅助驾驶能力。

而理想AI Talk第二季中,浓墨重彩地分享VLA,是理想将要奔赴下一阶段自动驾驶架构的目标。

VLA是解决自动驾驶的终极架构吗? (来源:网易汽车)

·VLA的突破类人智能的三大跃升

VLA的核心在于多模态深度耦合,将视觉、语言、动作三大能力整合为统一架构:

- 感知升维:3D视觉+高清2D图像构建物理世界“全息地图”,超越传统VLM的平面化理解;

- 决策拟人:通过“思维链推理”(Chain of Thought)模拟人类驾驶逻辑,例如根据导航软件运行逻辑动态调整路线,而非机械执行指令;

- 执行闭环:本地模型处理常规指令(如“左转”),云端协同解决复杂需求(如“避开拥堵找停车场”),实现自然语言交互的“司机Agent”形态。

翻译成人话就是:你的辅助驾驶系统是一个Agent(智能体),它能够听懂你给到的指示,你可以吩咐代驾司机一样干预正在NOA状态中的车辆行驶轨迹。非常重要的一环就是打通Agent与辅助驾驶系统的协作能力。

端到端+VLM与VLA - 技术对比
架构 感知能力 决策逻辑 交互方式
端到端+VLM 二维图像依赖 黑箱推理 单向指令执行
VLA 3D+2D全息建模 思维链动态推理 自然语言对话
网易汽车

Tips:什么是多模态

多模态(Multimodality)是指集成和处理两种或两种以上不同类型的信息或数据的方法和技术。在机器学习和人工智能领域,多模态涉及的数据类型通常包括但不限于文本、图像、视频、音频和传感器数据。多模态系统的目的是利用来自多种模态的信息来提高任务的性能,提供更丰富的用户体验,或者获得更全面的数据分析结果。

看到这里,想必你与我一样十分好奇理想的VLA司机大模型是如何训练养成,到底靠不靠谱呢?





VLA的训练哲学是从“驾校”到“老司机”,李想谈到将VLA的训练类比人类学车过程,分为三阶段:

1. 预训练(常识学习):

- 构建32B参数的视觉语言基座模型,学习交通规则与物理世界常识;

- 通过模型压缩(蒸馏)为轻量版,适配车端芯片实时运行。

2. 后训练(技能培训):

- 注入驾驶行为数据,模拟驾校“跟车学习”;

- 新增轨迹预测功能,预判未来4-8秒道路变化。

3. 强化训练(实战磨砺):

- 安全校准:通过人类接管数据剔除危险行为(如加塞);

- 性能强化:在虚拟世界模型中模拟数亿公里极端场景,优化舒适性(G值控制)、零事故率、交规合规性。

只要人类需要司机,VLA就有存在意义,VLA的诞生不仅是理想汽车的“技术宣言”,更预示交通领域生产力革命的起点。更大的蓝图是绘制一张世界模型的“大网”,基于现有交通路线规划的VLA是验证并构建这张“大网”所闯出的第一关。

据悉,业内先锋技术公司大有投注VLA大模型的趋势,比如精密制造中机器人领域,华为通过智驾3.0融合VLA模型与通用障碍物检测(GOD)网络,提升无高精地图区域的定位能力。百度Apollo:基于文心大模型增强VLA的交通场景理解准确度。智元机器人:与Physical Intelligence(PI)合作,推进动态环境下的长周期复杂任务解决方案。


现在您理解了为啥理想反复强调自己是一家AI公司,现阶段VLA大模型是AI的技术前沿,全行业都在等待从辅助工具到生产工具的AI时刻,届时人类的生存活动将会与AI深度捆绑。

热门车型推荐

1

奔驰E级 (合资)

  • 厂商指导价(万):44.01~59.98万
  • 级别: 中大型车
  • 上市时间:2004年
  • 在产车型:20款
  • 排量(L):2.0 AT
  • 油耗(L):--
2

威兰达 (合资)

  • 厂商指导价(万):17.18~26.48万
  • 级别: SUV
  • 上市时间:2020年2月28日
  • 在产车型:23款
  • 排量(L):2.0~2.5 CVT
  • 油耗(L):--
3

别克GL8 (合资)

  • 厂商指导价(万):23.29~53.39万
  • 级别: MPV
  • 上市时间:2000年
  • 在产车型:34款
  • 排量(L):2.0 AT
  • 油耗(L):--
相关推荐
热点推荐
背着中国,韩国偷偷倒卖稀土给美国!结果美国收到后直接认怂了

背着中国,韩国偷偷倒卖稀土给美国!结果美国收到后直接认怂了

小撇说事
2025-05-14 09:01:28
总决赛33分惨案!广厦3-1北京夺赛点,周琦隐身 新秀22+5成奇兵

总决赛33分惨案!广厦3-1北京夺赛点,周琦隐身 新秀22+5成奇兵

环太平洋老正太
2025-05-14 21:39:37
浙江区划调整构想!柯桥划入杭州,温州升级为副省级

浙江区划调整构想!柯桥划入杭州,温州升级为副省级

城市生态圈
2025-05-15 00:00:08
光刻机“闹剧”结束了!荷兰正式宣布,人民日报的呼吁该重视了

光刻机“闹剧”结束了!荷兰正式宣布,人民日报的呼吁该重视了

谷盟
2025-05-13 10:08:42
华为昇腾芯片遭美国全球禁止使用

华为昇腾芯片遭美国全球禁止使用

经济观察报
2025-05-14 14:40:10
重大资产重组!开盘一字涨停封单112万手,6万股东激动地快哭了

重大资产重组!开盘一字涨停封单112万手,6万股东激动地快哭了

八百者也
2025-05-14 12:59:00
讣告!又一知名女星在家中去世,终年54岁,曾是无数人白月光…

讣告!又一知名女星在家中去世,终年54岁,曾是无数人白月光…

财经三分钟pro
2025-01-11 14:11:06
仅播4集,热度破23000,不愧是你们苦苦盼了两年的权谋剧

仅播4集,热度破23000,不愧是你们苦苦盼了两年的权谋剧

体育官已上任
2025-05-14 08:32:22
歼10刚在印巴一战成名,国安部就抓捕出卖我国战机间谍,不容原谅

歼10刚在印巴一战成名,国安部就抓捕出卖我国战机间谍,不容原谅

凡知
2025-05-14 16:26:56
刚给美国送完钱,沙特转脸和中国签57项协议,特朗普赚钱却失人心

刚给美国送完钱,沙特转脸和中国签57项协议,特朗普赚钱却失人心

阿绐聊社会
2025-05-15 00:33:49
赖清德称台湾与日本“像家人”,国台办:背叛民族,令人不齿

赖清德称台湾与日本“像家人”,国台办:背叛民族,令人不齿

政知新媒体
2025-05-14 11:34:21
北京外援空篮失手引争议,许利民愤怒,曾凡博无奈挠头!

北京外援空篮失手引争议,许利民愤怒,曾凡博无奈挠头!

大昆说台球
2025-05-15 02:03:07
签了,签了!好久不见,NBA第一詹吹

签了,签了!好久不见,NBA第一詹吹

鬼魅突破上篮
2025-05-15 00:00:00
以色列真狠啊!数十枚钻地弹定点清除:小辛瓦尔和保镖被屠戮一空

以色列真狠啊!数十枚钻地弹定点清除:小辛瓦尔和保镖被屠戮一空

闻识
2025-05-14 16:32:35
想想都可怕,心疼男人真的会倒霉一辈子

想想都可怕,心疼男人真的会倒霉一辈子

枫尘余往逝
2025-05-14 00:30:21
吴彦祖想给网友拍照,网友没认出直接拒绝,得知真相后肠子悔青了

吴彦祖想给网友拍照,网友没认出直接拒绝,得知真相后肠子悔青了

史行途
2025-05-14 09:14:02
官方:库里恢复良好并开始球场训练,将于周日再次接受评估

官方:库里恢复良好并开始球场训练,将于周日再次接受评估

懂球帝
2025-05-15 01:25:02
儿子控诉父母不给生活费,曝国企法务高管贪腐,母亲发声:已断亲

儿子控诉父母不给生活费,曝国企法务高管贪腐,母亲发声:已断亲

小人物看尽人间百态
2025-05-14 09:53:39
闹大了!原来这件事是真的,事发上海…

闹大了!原来这件事是真的,事发上海…

慧翔百科
2025-05-12 09:04:07
张维迎:如果不按规则来行动,就不可能享受人类合作带来的好处

张维迎:如果不按规则来行动,就不可能享受人类合作带来的好处

尚曦读史
2024-11-26 21:50:03
2025-05-15 02:56:49

汽车要闻

配猎鹰驾驶辅助系统/轴距超3米 风云A9L预计6月交付

头条要闻

印度外交部声称明确反对中国对藏南地区命名 中方驳斥

头条要闻

印度外交部声称明确反对中国对藏南地区命名 中方驳斥

体育要闻

NBA最被低估球员,带队爆杀东部第一

娱乐要闻

赵丽颖赵德胤恋爱时间线被扒!

财经要闻

中美互降关税:企业抢发货 货代频爆单

科技要闻

腾讯开始靠AI赚钱 马化腾:贡献是实质性的

态度原创

房产
旅游
数码
亲子
公开课

房产要闻

狂降40万!海口这个改善盘杀出好价?你想多了!

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

数码要闻

暗影骑士·擎7 S评测:AI 战神如何征服学习与游戏?

亲子要闻

以为正常,其实是孩子过敏的表现,很多家长都不知道

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×