网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

小鹏北大VLA论文入选顶会！用“小模型”跑赢大模型，推理提速4倍

2025-12-29 14:07:19　来源: 车东西

北京举报

0

分享至

车东西（公众号：chedongxi）
作者｜ Janson
编辑｜志豪

端到端自动驾驶大模型可以“脱离云端、直接上车”了？！

车东西12月29日消息，日前，北京大学与小鹏汽车团队的最新研究成果FastDriveVLA被人工智能顶会AAAI 2026收录。

▲小鹏官宣此次获奖信息

这次双方研究的内容并非实验室里的纸上谈兵，而是通过一个参数量仅为0.07B（7000万）、计算开销几乎可以忽略不计的即插即用模块ReconPruner，硬生生将VLA大模型的整体计算量（FLOPs）削减了7.5倍。

要知道，车端算力“寸土寸金”，它打通了高性能AI算法与量产硬件之间的“天堑”。

这意味着原本需要昂贵算力集群支撑的端到端大模型，现在已经具备了在英伟达等主流车载芯片上实现低延迟、高响应运行的能力。

AAAI2026作为人工智能领域的CCF-A类顶级会议，北京大学与小鹏汽车的研究论文被这样的顶会收录，也说明了其研究内容的价值。

一、车机算力有限让AI学会“只看重点”

在智驾系统进入“端到端”时代的当下，VLA模型展现出的拟人化推理能力也让自动驾驶进入到一个新高度，但随之而来的“算力黑洞”也让工程师们倍感头疼。

举个例子，为了让AI看清复杂的十字路口，系统必须将高清图像切碎成数以千计的Token喂给大模型。

这样就造成了一个问题——视觉Token的通胀，在毫秒必争的驾驶决策中，庞大的计算量直接导致了车机“跑不动、反应慢”，甚至可能出现因推理延迟导致的系统卡顿。

此前，业界并非没有尝试过对这些Token进行“剪枝”去重，但效果不稳定，像盲人摸象。

▲三种剪枝策略对比

传统的注意力剪枝法（Attention-based）过度依赖文本指令，但在自动驾驶场景下，简单的驾驶指令往往无法提供足够的辨识权重，导致系统为了追求极致速度，可能会在不经意间删掉远处微小的红绿灯或障碍物。

而另一类基于相似度的剪枝法（Similarity-based）则过于追求视觉上的多样性，它们可能会为了保留独特性而记录路边的野花和天空的流云，却忽略了对决策至关重要的、平淡无奇的路面信息。

对此，北京大学和小鹏汽车团队合作的FastDriveVLA引入了极其朴素的“人类驾驶直觉”。

就像老司机在开车时，视网膜会自动过滤掉高耸的建筑和空旷的天空，瞳孔始终锁定的只有路面、行人和周边的车辆。

这种对“前景信息”的专注，正是FastDriveVLA的方案逻辑核心，AI不再对整张图像进行全量计算，而是精准捕捉并保留关键的前景Token。

这种思维转变，让AI对算力的要求减少7.5倍，也避免了算力的浪费。

二、ReconPruner 一个0.07B的“超级过滤器”

能实现上边的这种效率的提升，离不开ReconPruner这个参数量仅为0.07B的微型模块。如果说VLA模型是整车智驾的“大脑”，那么ReconPruner就是一个敏锐且轻量化的视觉中枢。

在AI领域，优化庞大的模型通常意味着动辄数万美元的重新训练成本，但ReconPruner这7000万参数的量级对于动辄3B起步的VLA主模型来说几乎可以忽略不计。

▲FastDriveVLA总体架构

它能够以即插即用的方式无缝集成到Qwen2.5-VL等大模型上，这种设计不仅极大地降低了量产部署的门槛，也让现有的智驾模型可以低成本升级，而无需修改主模型。

但真正让ReconPruner产生质变的，是一套被称为“对抗重建（AFBR）”的设计逻辑。

这套策略本质上是系统要求ReconPruner利用选中的Token尝试还原画面，如果它选出的Token确实包含了车辆、车道线等核心前景，重建出的画面质量就会更高。

反之，如果它关注了背景，重建结果就会不理想。

为了防止AI在这一过程偷懒，研究团队还引入了对抗博弈机制，强制要求模块必须在前景和背景之间做出明确的价值判断。

在这种严苛的训练下，ReconPruner被打磨成了一个能精准锁定关键驾驶目标的过滤器。

而支撑起这套“视觉本能”的基础，则是北大与小鹏团队潜心构建的nuScenes-FG数据集。

▲nuScenes-FG数据集

这套包含24.1万对高质量标注图像的数据集，对复杂的交通环境进行了像素级的拆解，将车辆、行人和道路边界等关键前景从杂乱的背景噪声中剥离出来。

正是这些海量的、带有标准答案的教材，喂出了AI的驾驶直觉，让FastDriveVLA能够在大模型处理海量视觉流的瞬间，精准切中影响安全的核心关键。

三、计算量缩减7.5倍 AI反而变聪明了？

在科技产品的迭代逻辑中，人们往往习惯了性能越高，功耗越高的直觉，但FastDriveVLA在测试场拿出的硬核数据，却展示了一种“反直觉”的进化。

从算力开销来看，FastDriveVLA对冗余信息的修剪堪称“暴力”。在nuScenes基准测试中，VLA模型的整体算力开销（FLOPs）从原始的38.2T骤降至5.1T，整整实现了7.5倍的缩减。

▲不同模型效率分析

这种算力压力的释放直接反馈在了推理速度上，这套模型在预填充阶段（Prefill）实现了3.7倍的提速，而解码阶段（Decode）也提升了1.3倍。

对于智驾系统而言，这省下的每一毫秒，都是为突发情况争取时间。

除此之外，性能的反常识增长也是这个模型的关键能力。

▲不同模型的性能对比

实验数据显示，在将视觉Token剪枝25%的情况下，FastDriveVLA在L2轨迹预测误差和路面边界交集率等核心指标上，超过了未经过任何剪枝的完整模型。

这就引发了一个值得思考的问题，为什么小模型反而比“大模型”更聪明？

从这个模型设计原理中不难看出，当下，冗余信息往往是AI决策的干扰项，当AI分配算力去处理天上的云朵（参数丨图片）、路边的写字楼或无关紧要的植被时，这些背景噪声都在稀释大模型的逻辑推理能力。

▲不同算法的“眼力”对比

FastDriveVLA就像是一个专业降噪器，通过过滤掉这些噪声，让大模型得以专注核心任务。

这也让AI的规划逻辑从过去的“博而不精”，进化成了如今可以对相关场景实现“精准打击”。

结语：VLA效率再提升

小鹏与北大的这项研究让已经上车的VLA模型，跑得更轻盈、更聪明。

FastDriveVLA的出现，本质上是对算力不足恐惧症的化解，在智能驾驶的下半场，竞争不再仅仅取决于谁的模型参数更大，而在于谁能更高效地利用每一分车载算力。

可以说，这种通过复刻人类驾驶的方法，让ReconPruner 这种极轻量化模块不仅解决了感知层面的噪声干扰，更打通了顶层算法与底层硬件之间的效能壁垒。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

万亿思考模型夺下IMO金牌，无缝接入OpenClaw！一句话手搓丐版PS

新智元 2026-02-15 12:17:21
3 跟贴 3
Seedance一骑绝尘背后：中国AI春节前为何“杀疯了”？

澎湃新闻 2026-02-15 07:50:28
99 跟贴 99

对话原力灵机周而进：模型2.4B就够用，关键是“具身原生”

量子位 2026-02-13 13:51:04
0 跟贴 0

AI战事正酣，都在等梁文锋

36氪 2026-02-15 11:50:21
8 跟贴 8
大模型三箭齐发、芯片岗位低调招聘，字节跳动不只想赢下AI“春节档”

每日经济新闻 2026-02-15 09:35:33
2 跟贴 2

OpenAI高管：工程师变成“魔法师”，AI将开启新一轮创业狂潮

华尔街见闻官方 2026-02-15 16:00:24
0 跟贴 0

AI遇上最强春节档 Token通胀已成必然？

财联社 2026-02-15 17:23:09
0 跟贴 0
大模型的下半场，属于拥有云+AI全栈引擎的玩家

量子位 2026-01-30 03:29:45
0 跟贴 0

极佳视界斩获全球第一后，GigaBrain-0.5M*再进化

机器之心Pro 2026-02-14 15:39:15
0 跟贴 0
震撼！OpenAI神秘模型连破6道前沿难题，奥特曼：AI在造「新知识」

新智元 2026-02-15 16:45:42
12 跟贴 12
万亿思考模型新速度！蚂蚁开源Ring-2.5-1T

量子位 2026-02-14 11:16:17
0 跟贴 0
几天手搓的Claude Code拓麻歌子火了：成本几乎为0，一句话做硬件时代来了

爱范儿 2026-02-15 17:13:57
0 跟贴 0
使命反复“变脸”，马斯克的商业帝国到底在追逐什么

环球网资讯 2026-02-15 10:05:21
48 跟贴 48
行业最大规模具身数据集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟贴 0
千问总裁吴嘉回应千问爆火：坚信中国的AI应用领域会走在世界前列

华尔街见闻官方 2026-02-15 18:57:23
0 跟贴 0
行业最大规模具身数据集！出自简智机器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟贴 0
MiniMax发布M2.5模型：1美元运行1小时，价格仅为GPT-5的1/20，性能比肩Claude Opus

华尔街见闻官方 2026-02-13 10:14:27
37 跟贴 37
眼睛看到未必是真，视觉假象暗藏玄机，眼睛真的会骗人

搞笑君来了 2026-02-14 00:00:00
0 跟贴 0
透视高层住宅：从建设到衰败的资产逻辑。一起来听听

竖笛小魔王 2026-02-15 04:08:45
20 跟贴 20
L2玩家搭上L4的直通车

燃擎频道 2026-02-15 15:00:57
0 跟贴 0
美媒发出感慨：美国过时了中国出乎意料成了热门

环球时报 2026-02-15 12:00:05
9766 跟贴 9766
编程已死，键盘长草！Claude Code之父对谈Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
62 跟贴 62
字节跳动Seed发布NL2Repo-Bench仓库级长程代码生成基准

机器之心Pro 2026-02-13 10:19:29
0 跟贴 0
初恋重逢，14年后的不同人生轨迹

守你如初p 2026-02-14 01:49:59
0 跟贴 0
字节豆包2.0发布：推理成本降一个数量级，正面对标GPT-5和Gemini 3

华尔街见闻官方 2026-02-14 17:29:39
66 跟贴 66
高手之间的对决，主要输在硬件上

疯兔看剧 2026-02-12 16:07:47
1 跟贴 1
川大通报王竹卿事件调查结果:停止其研究生招生资格

新华社 2026-02-14 20:04:10
1736 跟贴 1736
小鸟从小比较娇贵，必须要手养它才行，有了模型养几十只不是问题

发怒的福猫 2026-02-13 13:39:20
2 跟贴 2
汽车厂：DeepSeek已成牛夫人，千问和豆包才是小甜甜

燃擎频道 2026-02-14 18:43:10
0 跟贴 0
就爱看大张伟说段子，全程无逻辑吐槽，阎鹤祥笑到起不来身

琴音似君语 2026-02-14 08:19:45
1 跟贴 1
喜报！钦北区法院3篇论文获奖

钦北法院 2026-02-15 09:59:52
0 跟贴 0
赵雅芝孙俪：两位冯程程43年人生与事业轨迹的回顾

格仔娱乐圈 2026-02-15 13:37:00
0 跟贴 0
新民艺评·金刺猬｜卜翌：盛名之下，为什么《御赐小仵作2》“不好看”了？

上观新闻 2026-02-15 11:07:12
2 跟贴 2
农学院学姐毕业论文跑了，悬赏5000块寻鹅只为毕业

即使没有换位思考 2026-02-15 17:58:18
1 跟贴 1
一千多个模型都指向一个通用子空间

机器之心Pro 2025-12-16 18:23:47
0 跟贴 0
仿真落地三难点：物理、视觉、交互

量子位 2025-12-12 04:34:09
0 跟贴 0
开源多模态推理「破壁」时刻：MMFineReason助力4B逆袭30B

机器之心Pro 2026-02-13 15:51:35
0 跟贴 0
好神奇！视觉的错位冲击，在看就要睡着了

讲事的少少 2026-02-15 10:45:49
1 跟贴 1
全景视觉的Depth Anything来了！

机器之心Pro 2025-12-29 16:54:58
0 跟贴 0
川大严查教师学术不端，28篇论文涉造假

悬崖边上的爱情 2026-02-15 13:51:21
1 跟贴 1

让中国人闻风丧胆的柬埔寨，为什么是东南亚最可怕的国家？

让中国人闻风丧胆的柬埔寨，为什么是东南亚最可怕的国家？

奇思妙想生活家

2026-02-15 10:09:13

钱再多有什么用？52岁刘强东上千亿身家，儿子却是他一生的遗憾

钱再多有什么用？52岁刘强东上千亿身家，儿子却是他一生的遗憾

墨印斋

2026-01-31 16:37:48

“谁会买你老公的大头照？”宝妈创业开超市，最终败给了低认知

“谁会买你老公的大头照？”宝妈创业开超市，最终败给了低认知

妍妍教育日记

2026-02-12 18:48:38

4 大新升级！新 iPhone 官宣：2月19日，即将发布

4 大新升级！新 iPhone 官宣：2月19日，即将发布

科技堡垒

2026-02-14 10:29:51

拖了十年不发证，C919收起讨好硬刚欧美适航霸权？直接掀桌改规则

拖了十年不发证，C919收起讨好硬刚欧美适航霸权？直接掀桌改规则

大卫聊科技

2026-02-15 11:28:05

1949年，毛人凤抓了400多名共产党，卢汉左右为难，想到了一个人

1949年，毛人凤抓了400多名共产党，卢汉左右为难，想到了一个人

墨说古今

2026-02-09 23:42:18

绿地集团子公司破产

地产微资讯

2026-02-15 17:37:25

米兰冬奥会赛程全掌握！一键收藏，观赛不迷路→

米兰冬奥会赛程全掌握！一键收藏，观赛不迷路→

海外网

2026-02-04 15:03:52

西甲最新积分战报：塞尔塔补时绝平，皇马狂轰4球，巴萨掉到第2

西甲最新积分战报：塞尔塔补时绝平，皇马狂轰4球，巴萨掉到第2

足球狗说

2026-02-15 06:49:07

退休金，正在悄悄改变中国家庭的命运？

退休金，正在悄悄改变中国家庭的命运？

宝哥精彩赛事

2026-02-14 18:42:10

破防了！山东一男子回老家过年，到了门口，发现邻居帮他贴对联

破防了！山东一男子回老家过年，到了门口，发现邻居帮他贴对联

魔都姐姐杂谈

2026-02-15 18:36:04

没苦硬吃！严宽老婆带75岁公婆坐火车回娘家，全程18小时菜摆两桌

没苦硬吃！严宽老婆带75岁公婆坐火车回娘家，全程18小时菜摆两桌

小徐讲八卦

2026-02-15 06:19:20

郑钦文退赛

环球时报国际

2026-02-15 18:44:02

“00后”陈某某被押赴刑场执行死刑

“00后”陈某某被押赴刑场执行死刑

闪电新闻

2026-02-07 16:53:35

45岁富哥“北京肖哥”去世，前一天还晒老婆，死因曝光仇人都惋惜

45岁富哥“北京肖哥”去世，前一天还晒老婆，死因曝光仇人都惋惜

嫹笔牂牂

2025-12-31 07:07:52

马俊仁：被国家队开除，如今怎么样了

马俊仁：被国家队开除，如今怎么样了

鲸探所长

2026-02-09 16:49:55

写在虎蛟归来之际

天下说法

2026-02-15 16:51:04

廖昌永：年轻时娶富家女，岳父母不嫌他穷，现连任音协主席有本事

廖昌永：年轻时娶富家女，岳父母不嫌他穷，现连任音协主席有本事

查尔菲的笔记

2025-12-04 12:19:20

稻香村、全聚德、北冰洋北京西站里有一条“老字号通廊”

稻香村、全聚德、北冰洋北京西站里有一条“老字号通廊”

新浪财经

2026-02-15 00:10:40

中国空军从俄乌冲突中吸取经验：歼20决不能再打火箭弹了！

中国空军从俄乌冲突中吸取经验：歼20决不能再打火箭弹了！

掉了颗大白兔糖

2026-02-15 15:00:15

未来汽车看这里。

5917文章数 6401关注度

往期回顾全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

杭州女子5年前在医美机构充值8万 5年后尴尬了

头条要闻

杭州女子5年前在医美机构充值8万 5年后尴尬了

体育要闻

最戏剧性的花滑男单，冠军为什么是他？

娱乐要闻

河南春晚被骂上热搜！大量广告满屏AI

财经要闻

谁在掌控你的胃？起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅：段建军离任，李德思接棒

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

房产

亲子

游戏

公开课

教育要闻

五年级求面积，中点是解题关键

房产要闻

三亚新机场，又传出新消息！

亲子要闻

年夜饭这盘“毒饺子”，正在悄悄毁了无数娃，很多家长却毫不知情

颗秒一切质疑之后，瓦手率先引爆春节档

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版