网易首页 > 网易号 > 正文 申请入驻

DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

0
分享至

来源:市场资讯

(来源:机器之心Pro)


在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 ——“监督稀疏”。


这一问题直指当前 VLA 模型的 “七寸”:其输入是高维、稠密的视觉信息流,但其监督信号却往往是低维、稀疏的驾驶动作(如路径点)。那么即便使用 PB 级的海量数据,VLA 模型的巨大潜力也无法被有效释放。

正当业界热议这一瓶颈时,一支来自国内顶尖学术机构与华为合作的团队,已经悄然给出了破解这一难题的 “锦囊”。一篇名为 《DriveVLA-W0: World Models Amplify Data Scaling Law in Autonomous Driving》的新工作,为解决这一 “监督稀疏” 提供了极具洞见的解决方案。该研究提出,世界模型(World Model)是解锁 VLA 数据规模定律(Data Scaling Law)的关键钥匙。


VLA 的 “监督赤字”:Data Scaling Law 为何在自动驾驶失效?

自动驾驶领域的研究者普遍希望复现 Data Scaling Law 在 LLM 上的成功:通过扩大模型参数和数据规模,实现自动驾驶性能的飞跃。

但 DriveVLA-W0 指出,VLA 模型面临着与 LLM 截然不同的困境:“监督赤字”(Supervision Deficit)。

一个数十亿参数的 VLA 模型,其输入是高维、稠密的视觉信息流,但其监督信号却往往是低维、稀疏的驾驶动作(如路径点)。模型的大部分表征能力被浪费,导致其无法充分学习驾驶环境的复杂动态。

研究团队的实验证实了这一点:在稀疏的动作监督下,VLA 模型的性能会随着数据量的增加迅速饱和,Data Scaling Law 的效应在此大打折扣。

破解之道:用世界模型提供 “稠密” 的自监督信号

如何填补这一 “赤字”?DriveVLA-W0 的答案是:与其依赖稀疏的 “动作”,不如让模型学习稠密的 “世界”。

研究团队创造性地引入了世界模型,将 “预测未来图像” 作为一项稠密的自监督训练任务。


传统 VLA(左)仅依赖稀疏的动作监督。DriveVLA-W0(右)则额外引入了稠密的视觉预测任务,迫使模型理解环境。

当模型被要求去预测下一帧的完整视觉画面时,它必须去学习和理解这个世界的真实运行规律 —— 例如,其他车辆的运动趋势、行人与车辆的交互关系等。

这一设计为 VLA 模型提供了远比 “动作” 更丰富和稠密的学习信号,从根本上缓解了 “监督赤字” 问题。

核心贡献:世界模型 “放大” 了 Data Scaling Law

如果说解决 “监督赤字” 是这项工作的起点,那么其更核心的贡献在于发现了:世界模型能够显著 “放大”(Amplifies)数据规模定律。


在 700K 到 70M 的数据规模上,DriveVLA-W0(红线)的性能提升斜率显著优于基线(蓝线),展现了更强的扩展潜力。

研究团队在高达 7000 万帧的内部大规模数据集上进行了严格的 Scaling 实验。结果清晰地显示:

基线模型(仅动作监督): 随着数据量增大,性能提升迅速放缓。

DriveVLA-W0(世界模型): 性能随着数据量增加,实现了持续且显著的提升,与基线模型的性能差距越拉越大。

在 70M 帧的规模下,世界模型的加入,使模型的碰撞率降低了20.4%。这证明了世界模型带来的 “质变”,是单纯堆砌动作数据所无法企及的。

兼顾性能与效率:轻量级 MoE 专家

DriveVLA-W0 并非一个不考虑落地的 “学术模型”。针对 VLA 大模型在自动驾驶中面临的 “高延迟” 痛点,团队还提出了一种轻量级的 MoE“动作专家”(Action Expert)架构。

该设计在不牺牲性能的前提下,显著降低了模型的推理延迟,仅为基线 VLA 的 63.1% ,为 VLA 模型的实时部署提供了可能。


结语

这项研究工作不仅为特斯拉等行业先行者提出的 “真问题” 提供了清晰的解题思路,也为自动驾驶乃至整个具身智能领域,展示了世界模型在 “生成” 之外的另一条核心价值路径 —— 作为强大的自监督引擎,撬动 VLA 模型的 Data Scaling Law。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么国产JY-27雷达,在国外局部冲突中多次被美以摧毁?

为什么国产JY-27雷达,在国外局部冲突中多次被美以摧毁?

阿龙聊军事
2026-01-07 17:06:49
51年,彭老总下狠心枪决周总理女婿,总理急电:罪不致死押回国内

51年,彭老总下狠心枪决周总理女婿,总理急电:罪不致死押回国内

谈古论今历史有道
2026-01-09 09:30:03
曝南大博士东思嘉自杀身亡,年仅33岁,长得漂亮,多次获奖学金

曝南大博士东思嘉自杀身亡,年仅33岁,长得漂亮,多次获奖学金

热点菌本君
2025-08-27 00:02:04
特朗普势在必得格陵兰岛,欧洲还能争取何种“交易”?

特朗普势在必得格陵兰岛,欧洲还能争取何种“交易”?

澎湃新闻
2026-01-09 18:09:09
乌方公布据称为“榛树”导弹残骸照片 披露俄军袭击细节

乌方公布据称为“榛树”导弹残骸照片 披露俄军袭击细节

环球网资讯
2026-01-09 21:41:11
没有一个人敢上前的,都躲的远远的!

没有一个人敢上前的,都躲的远远的!

太急张三疯
2026-01-07 04:08:36
日本人的祖先究竟是谁?美国教授拿出DNA,日本人懵了

日本人的祖先究竟是谁?美国教授拿出DNA,日本人懵了

马探解说体育
2026-01-09 18:22:53
全球用户大面积中招:鼠标突然就“坏了”!不少人按到“手抽筋”,重装卸载也不管用,罗技回应

全球用户大面积中招:鼠标突然就“坏了”!不少人按到“手抽筋”,重装卸载也不管用,罗技回应

每日经济新闻
2026-01-08 20:15:12
越战的始作俑者黎笋,死后越南人如何评价他?昔日路线被全面抛弃

越战的始作俑者黎笋,死后越南人如何评价他?昔日路线被全面抛弃

浩渺青史
2026-01-10 12:40:24
玄彬哭红眼李政宰捧遗像,韩国半个影坛为噎死的老影帝长跪不起

玄彬哭红眼李政宰捧遗像,韩国半个影坛为噎死的老影帝长跪不起

安宁007
2026-01-09 19:28:49
王腾名下多家公司以梦命名

王腾名下多家公司以梦命名

雷达财经
2026-01-11 01:05:00
一天内,杭州两位38岁宝爸带娃时倒下!医生:这些都是导火索

一天内,杭州两位38岁宝爸带娃时倒下!医生:这些都是导火索

杭州之声
2026-01-10 18:19:51
震惊!江苏一企业发声明,将一员工从主管调至保洁,月薪降至4500

震惊!江苏一企业发声明,将一员工从主管调至保洁,月薪降至4500

火山詩话
2026-01-09 06:43:51
明朝的强弩不过能射50步远,为什么战国时期的强弩却能射600步?

明朝的强弩不过能射50步远,为什么战国时期的强弩却能射600步?

铭记历史呀
2026-01-09 06:15:36
酒店暗藏摄像头,保洁阿姨透露:进门先拔电视插头,有人还知情!

酒店暗藏摄像头,保洁阿姨透露:进门先拔电视插头,有人还知情!

八斗小先生
2025-12-01 09:25:30
突发公告!周末17家A股上市公司发布重大利空消息,看看都有哪些?

突发公告!周末17家A股上市公司发布重大利空消息,看看都有哪些?

股市皆大事
2026-01-10 14:46:58
41分+45分+55分!联盟第1!FMVP没有水货,他要重返全明星

41分+45分+55分!联盟第1!FMVP没有水货,他要重返全明星

世界体育圈
2026-01-10 21:01:37
2027大年初一上映!郭帆宣布《流浪地球3》刘德华杀青

2027大年初一上映!郭帆宣布《流浪地球3》刘德华杀青

3DM游戏
2026-01-10 15:07:06
工作三年可分房,我也想去新疆养三文鱼

工作三年可分房,我也想去新疆养三文鱼

南风窗
2026-01-08 14:40:13
经过2025年,局面愈加明朗:中国的盟友,有且只有两个!

经过2025年,局面愈加明朗:中国的盟友,有且只有两个!

远方风林
2026-01-05 07:55:08
2026-01-11 03:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1982386文章数 5212关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

教育
家居
艺术
数码
公开课

教育要闻

表现不好,还不接受批评的学生,怎么教育比较合适?

家居要闻

木色留白 演绎现代自由

艺术要闻

601米,150亿美元!沙特目前第一高楼是它!

数码要闻

熊猫主题圈粉老外,长虹AI家电亮相CES,东方元素成顶流

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版