网易首页 > 网易号 > 正文 申请入驻

解决特斯拉「监督稀疏」难题

0
分享至

来源:市场资讯

(来源:机器之心)


在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 ——“监督稀疏”。


这一问题直指当前 VLA 模型的 “七寸”:其输入是高维、稠密的视觉信息流,但其监督信号却往往是低维、稀疏的驾驶动作(如路径点)。那么即便使用 PB 级的海量数据,VLA 模型的巨大潜力也无法被有效释放。

正当业界热议这一瓶颈时,一支来自国内顶尖学术机构与华为合作的团队,已经悄然给出了破解这一难题的 “锦囊”。一篇名为 《DriveVLA-W0: World Models Amplify Data Scaling Law in Autonomous Driving》 的新工作,为解决这一 “监督稀疏” 提供了极具洞见的解决方案。该研究提出,世界模型(World Model)是解锁 VLA 数据规模定律(Data Scaling Law)的关键钥匙。


  • 论文标题:DriveVLA-W0: World Models Amplify Data Scaling Law in Autonomous Driving

  • 论文链接:https://arxiv.org/abs/2510.12796

VLA 的 “监督赤字”:Data Scaling Law 为何在自动驾驶失效?

自动驾驶领域的研究者普遍希望复现 Data Scaling Law 在 LLM 上的成功:通过扩大模型参数和数据规模,实现自动驾驶性能的飞跃。

但 DriveVLA-W0 指出,VLA 模型面临着与 LLM 截然不同的困境:“监督赤字”(Supervision Deficit)。

一个数十亿参数的 VLA 模型,其输入是高维、稠密的视觉信息流,但其监督信号却往往是低维、稀疏的驾驶动作(如路径点)。模型的大部分表征能力被浪费,导致其无法充分学习驾驶环境的复杂动态。

研究团队的实验证实了这一点:在稀疏的动作监督下,VLA 模型的性能会随着数据量的增加迅速饱和,Data Scaling Law 的效应在此大打折扣。

破解之道:用世界模型提供 “稠密” 的自监督信号

如何填补这一 “赤字”?DriveVLA-W0 的答案是:与其依赖稀疏的 “动作”,不如让模型学习稠密的 “世界”。

研究团队创造性地引入了世界模型,将 “预测未来图像” 作为一项稠密的自监督训练任务。


传统 VLA(左)仅依赖稀疏的动作监督。DriveVLA-W0(右)则额外引入了稠密的视觉预测任务,迫使模型理解环境

当模型被要求去预测下一帧的完整视觉画面时,它必须去学习和理解这个世界的真实运行规律 —— 例如,其他车辆的运动趋势、行人与车辆的交互关系等。

这一设计为 VLA 模型提供了远比 “动作” 更丰富和稠密的学习信号,从根本上缓解了 “监督赤字” 问题。

核心贡献:世界模型 “放大” 了 Data Scaling Law

如果说解决 “监督赤字” 是这项工作的起点,那么其更核心的贡献在于发现了:世界模型能够显著 “放大”(Amplifies)数据规模定律。


在 700K 到 70M 的数据规模上,DriveVLA-W0(红线)的性能提升斜率显著优于基线(蓝线),展现了更强的扩展潜力。

研究团队在高达 7000 万帧的内部大规模数据集上进行了严格的 Scaling 实验。结果清晰地显示:

基线模型(仅动作监督): 随着数据量增大,性能提升迅速放缓。

DriveVLA-W0(世界模型): 性能随着数据量增加,实现了持续且显著的提升,与基线模型的性能差距越拉越大。

在 70M 帧的规模下,世界模型的加入,使模型的碰撞率降低了 20.4%。这证明了世界模型带来的 “质变”,是单纯堆砌动作数据所无法企及的。

兼顾性能与效率:轻量级 MoE 专家

DriveVLA-W0 并非一个不考虑落地的 “学术模型”。针对 VLA 大模型在自动驾驶中面临的 “高延迟” 痛点,团队还提出了一种轻量级的 MoE “动作专家”(Action Expert)架构 。

该设计在不牺牲性能的前提下,显著降低了模型的推理延迟,仅为基线 VLA 的 63.1% ,为 VLA 模型的实时部署提供了可能。


结语

这项研究工作不仅为特斯拉等行业先行者提出的 “真问题” 提供了清晰的解题思路,也为自动驾驶乃至整个具身智能领域,展示了世界模型在 “生成” 之外的另一条核心价值路径 —— 作为强大的自监督引擎,撬动 VLA 模型的 Data Scaling Law。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京4道怪菜,北京人喝酒的最爱,外地人吃完感叹:那叫一个地道

北京4道怪菜,北京人喝酒的最爱,外地人吃完感叹:那叫一个地道

涛哥美食汇
2025-11-17 09:55:51
波克罗夫斯克成侵略军坟场;乌法达成“历史性”战机交易

波克罗夫斯克成侵略军坟场;乌法达成“历史性”战机交易

近距离
2025-11-17 10:55:07
美股存储芯片股大幅拉升,美光科技涨超5%,再创历史新高

美股存储芯片股大幅拉升,美光科技涨超5%,再创历史新高

每日经济新闻
2025-11-17 22:54:04
车型更新后,浦东机场穿梭巴士被吐槽体验下滑、效率变慢

车型更新后,浦东机场穿梭巴士被吐槽体验下滑、效率变慢

上观新闻
2025-11-17 06:55:04
宛宛类卿!黄晓明新签艺人撞脸赵薇!被造谣亲自下评论区回应

宛宛类卿!黄晓明新签艺人撞脸赵薇!被造谣亲自下评论区回应

小邵说剧
2025-11-15 16:16:02
当45岁宋佳与45岁张柏芝站在一起!我才明白什么叫顶级自律

当45岁宋佳与45岁张柏芝站在一起!我才明白什么叫顶级自律

湘村大余
2025-10-20 18:01:50
终于能用了!国行 iPhone 已经可以强行开启苹果 AI 功能

终于能用了!国行 iPhone 已经可以强行开启苹果 AI 功能

XCiOS俱乐部
2025-11-17 19:16:40
中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

粤语音乐喷泉
2025-11-16 15:59:04
白大拿对张伟丽有些失望:我原本觉得她像比特犬,能不断疯狂输出

白大拿对张伟丽有些失望:我原本觉得她像比特犬,能不断疯狂输出

杨华评论
2025-11-17 20:05:35
入乡随俗!广东新援入队仪式来了 球迷调侃这才是正式加盟

入乡随俗!广东新援入队仪式来了 球迷调侃这才是正式加盟

胖子喷球
2025-11-17 21:34:08
澳洲地产大亨之子重病赴华求治,老中医开口一句令男子彻底傻眼

澳洲地产大亨之子重病赴华求治,老中医开口一句令男子彻底傻眼

红豆讲堂
2025-10-14 09:30:03
又笑又跳,福建女排爆冷3-1击败卫冕冠军进4强,输球还一肚子气

又笑又跳,福建女排爆冷3-1击败卫冕冠军进4强,输球还一肚子气

真理是我亲戚
2025-11-17 19:05:58
埃安i60售10.98万起,增程第一枪,但银河E5很难打

埃安i60售10.98万起,增程第一枪,但银河E5很难打

车动态
2025-11-17 21:37:49
12月见!新机官宣:搭载骁龙8 Gen5+7000mAh!

12月见!新机官宣:搭载骁龙8 Gen5+7000mAh!

科技堡垒
2025-11-16 11:48:39
社评:中国公民需谨慎前往日本的四个原因

社评:中国公民需谨慎前往日本的四个原因

环球网资讯
2025-11-17 00:03:43
若不是日媒披露,我都不敢相信,中国真的强大到了如此地步

若不是日媒披露,我都不敢相信,中国真的强大到了如此地步

全金猫眼
2025-10-31 22:10:03
昆明城改荒诞剧:老板潜逃、契税消失,还有业主警察帮忙维稳

昆明城改荒诞剧:老板潜逃、契税消失,还有业主警察帮忙维稳

法治边角料
2025-11-17 12:06:01
王思聪成功和懒懒分手,回国的懒懒被曝变卖奢侈品,网友吐槽太贵

王思聪成功和懒懒分手,回国的懒懒被曝变卖奢侈品,网友吐槽太贵

娱乐团长
2025-11-16 15:45:42
他升任外交部领导后,多次泄露机密,从外交精英到背叛者!

他升任外交部领导后,多次泄露机密,从外交精英到背叛者!

野蛮不失女人心
2024-10-02 08:40:45
“曾经的骄傲,变成了这副德行”,家长晒211女儿变化,看清现实

“曾经的骄傲,变成了这副德行”,家长晒211女儿变化,看清现实

妍妍教育日记
2025-11-17 17:50:34
2025-11-18 04:31:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1408993文章数 4536关注度
往期回顾 全部

科技要闻

京东外卖要“独立” 刘强东还宣战“点评”

头条要闻

该聊聊琉球问题了 日本国内集体破大防

头条要闻

该聊聊琉球问题了 日本国内集体破大防

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

教育
本地
游戏
数码
公开课

教育要闻

课后延时服务引发诸多矛盾,该考虑取消了!

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

魔坛节奏丨魔兽操作之神,Happy 4-3力克浪漫夺得少帅杯冠军

数码要闻

铭瑄AMD B850 / X870主板新品确认对未来处理器支持

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版