网易首页 > 网易号 > 正文 申请入驻

小米正式发布并全面开源自动驾驶模型Xiaomi OneVL

0
分享至

5月13日,@小米技术 宣布正式发布并全面开源自动驾驶模型Xiaomi OneVL:一步式潜空间语言视觉推理框架。它将VLA、世界模型和潜空间推理三大技术路线统一到同一框架中,让大模型推理“又快又准”:精度上超越显式思维链,速度上对齐“仅答案”预测,推理延迟最低仅0.24秒,为传统VLA自回归推理的5.4%,为量产车端实时部署提供了可行路径。


1、Xiaomi OneVL:让大模型推理“既快又准”

今年 3 月,小米正式发布全新小米 XLA 认知大模型架构,标志着小米辅助驾驶技术路线从“感知与模仿”迈向“理解与推理”。相比传统 VLA,XLA 强调更丰富的多模态认知输入,以及更强的场景认知、行为推理与真实世界理解能力。

在 XLA 的技术方向下,一个核心问题随之浮现:当大模型具备了推理能力,如何让这种推理既快又准?

行业过往的解决方案都有明显的缺陷:显式思维链(CoT)能显著提升轨迹规划质量,但逐 token 生成带来的额外时延,也对真实驾驶场景中的实时决策提出了更高挑战;而跳过推理直接输出答案,又会丢失关键的因果判断能力。

为了解决这些缺陷,此前行业内提出了潜空间思维链(Latent CoT)作为核心推理机制——用高维机器语言替代逐字生成的文本推理,在保持认知质量的同时大幅压缩推理时延。

而今天,小米技术研发团队在 Latent CoT 的基础上进一步探索自动驾驶大模型中的潜空间推理问题,正式推出——Xiaomi OneVL:一步式潜空间语言视觉推理框架。

作为 XLA 架构中 Latent CoT 能力的首次学术验证,Xiaomi OneVL 是首个在精度上超越显式思维链、在速度上对齐“仅答案”预测的潜在推理方案,并实现了 VLA 与世界模型的统一。


通过“语言推理 + 视觉未来预测”的双重监督,Xiaomi OneVL 将可解释性与世界模型的未来预测能力统一到 latent reasoning 中,为自动驾驶大模型探索出一条新的精度—效率平衡路径。

从这个意义上说,Xiaomi OneVL 进一步验证了 XLA 架构方向的技术潜力:真正面向现实世界的辅助驾驶,不只要看见当下,更要理解因果、预判未来,并在有限时间内完成高质量决策。

从家庭场景的具身智能到城市道路的辅助驾驶,小米正推动智能技术向“可用、可信、可扩展”的现实世界稳步迈进,为小米“人车家全生态”注入核心技术动能!


2、三项关键技术,统一 VLA、世界模型、潜空间推理三大技术路线

过去,VLA 和世界模型是自动驾驶领域两条相对独立的技术路线:VLA 专注于理解场景并输出驾驶动作,世界模型专注于预测未来场景的演变。Xiaomi OneVL 通过潜空间推理,首次将两者统一到同一套框架中。

它的核心洞察是:自动驾驶要压缩的,不只是语言推理,而是对未来世界变化的理解。 驾驶决策真正依赖的,并不只是“前方有车”“道路变窄”这样的语义描述,而是车辆运动、道路几何、障碍物演变等时空因果信息。压缩语言,丢掉的恰恰是最关键的因果结构;而压缩成“对未来视觉世界的预测”,才保留了真正决定驾驶结果的东西。

基于这一洞察,Xiaomi OneVL 提出三项关键技术。简单来说:让模型用自己的“内部语言”思考、让它学会预测未来画面、并把整个推理过程压缩到一步完成。

双模态 latent token,各司其职:视觉 latent token 编码“场景的物理因果结构”,语言 latent token 编码“驾驶意图的语义表达”,让模型“在心里想清楚”,而不是“边说边想”。

双辅助解码器,训练时用、推理时丢:视觉解码器预测未来 0.5s / 1s 的画面,让模型同时具备世界模型的未来预测能力;语言解码器重建人类可读的思维链文字,保障可解释性——两个解码器在训练中提供双重监督信号,推理时全部移除,零额外开销;

「预填充式」一步推理,快到极致:推理时丢掉两个解码器,所有 latent token 直接预填充进上下文,一次并行完成,延迟和“仅答案”模型几乎一致,比显式 CoT 最高快 2.3 倍。

3、多基准全面 SOTA,刷新潜在推理方法性能上限

在涵盖感知、推理与规划的多个主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限:

在 ROADWork、Impromptu、Alpamayo-R1 三项基准上均达到 SOTA,并在 NAVSIM 上取得优越性能,PDM-score 达到 88.84,首次在潜空间推理中超越显式 CoT(88.29);

目前唯一在所有基准上超越显式自回归 CoT 的隐式推理方法;

挂载 MLP 回归头变体,延迟进一步压到 0.24s(4.16 Hz),仅为 VLA 自回归推理的 5.4%,为量产车端实时部署提供了可行路径。

消融实验进一步验证,压缩物理世界的动态信息能带来显著的性能提升。


同时,Xiaomi OneVL 能为模型决策提供语言和视觉双维度的可解释性——既能用文字说明“为什么这样开”,也能用预测画面展示“接下来会发生什么”,将 XLA 所追求的“理解与推理”能力,真正落到了可验证、可解释的工程实践中。


为模型决策提供语言以及视觉的可解释性

(都市现场)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿特金森:哈登在最后展示了老将的冷静,这是我们签他的原因

阿特金森:哈登在最后展示了老将的冷静,这是我们签他的原因

懂球帝
2026-05-14 15:05:24
扎心!月入8000丈夫离婚前入不敷出,离婚后月余5000、年存近十万

扎心!月入8000丈夫离婚前入不敷出,离婚后月余5000、年存近十万

火山詩话
2026-05-12 07:32:35
陈都灵,瘦的让人心疼

陈都灵,瘦的让人心疼

陈意小可爱
2026-05-01 10:53:54
退休金达到这个数,你就超过了80%的老人!晚年生活直接上档次

退休金达到这个数,你就超过了80%的老人!晚年生活直接上档次

娱乐圈的笔娱君
2026-05-14 18:22:54
吃中国饭砸中国锅,改岛国国籍拿高薪,这3位下场一个比一个惨

吃中国饭砸中国锅,改岛国国籍拿高薪,这3位下场一个比一个惨

黑翼天使
2026-05-14 12:27:06
王曼昱首盘输球,马琳冲上去一把抱住她,全场没人看懂。邓亚萍一句话点透:这不是技术,是心态出了要命的问题

王曼昱首盘输球,马琳冲上去一把抱住她,全场没人看懂。邓亚萍一句话点透:这不是技术,是心态出了要命的问题

乒乓助手
2026-05-14 00:07:37
从20亿腰斩到10亿,央视仍坚决不接盘,世界杯这回真慌了!

从20亿腰斩到10亿,央视仍坚决不接盘,世界杯这回真慌了!

李砍柴
2026-05-13 19:20:44
“吃20个饺子用8张餐巾纸” 饺子店老板发视频吐槽被指格局太小

“吃20个饺子用8张餐巾纸” 饺子店老板发视频吐槽被指格局太小

闪电新闻
2026-05-14 09:58:40
美媒曝重磅交易!火箭倾其所有换杰伦·布朗,重建班底或大换血

美媒曝重磅交易!火箭倾其所有换杰伦·布朗,重建班底或大换血

体育见习官
2026-05-14 07:19:10
28亿美元!被字节逼到无路可走的喜马拉雅终于卖给了腾讯

28亿美元!被字节逼到无路可走的喜马拉雅终于卖给了腾讯

传心财经
2026-05-13 17:38:12
广州毒保姆何天带:一年杀8位老人,扬言:老人活多久我说了算

广州毒保姆何天带:一年杀8位老人,扬言:老人活多久我说了算

莫地方
2026-05-14 01:05:05
抛弃马杜罗的恶果显现,特朗普称在认真考虑,让委内瑞拉彻底消失

抛弃马杜罗的恶果显现,特朗普称在认真考虑,让委内瑞拉彻底消失

慢歌轻步谣
2026-05-14 20:55:24
佩林卡:任何球队都渴望拥有詹姆斯 我们只想尊重他的决定

佩林卡:任何球队都渴望拥有詹姆斯 我们只想尊重他的决定

北青网-北京青年报
2026-05-13 21:52:20
黑龙江省第十四届人民代表大会常务委员会关于接受隋洪波辞去黑龙江省人民政府副省长职务的请求的决定 (2026年5月13日黑龙江省第十四届人民代表大会常务委...

黑龙江省第十四届人民代表大会常务委员会关于接受隋洪波辞去黑龙江省人民政府副省长职务的请求的决定 (2026年5月13日黑龙江省第十四届人民代表大会常务委...

黑龙江新闻网
2026-05-14 11:16:52
毛主席率领的800人,朱德率领的800人,谁的开国将帅更多

毛主席率领的800人,朱德率领的800人,谁的开国将帅更多

微野谈写作
2026-05-13 11:40:08
“给儿子吃得大脑缺氧了!”一顿全碳水早餐,暴露了宝妈的低认知

“给儿子吃得大脑缺氧了!”一顿全碳水早餐,暴露了宝妈的低认知

妍妍教育日记
2026-05-14 13:30:26
2006年,张顺兴8小时取3命,枪决前笑着接受采访:我走了,谢谢

2006年,张顺兴8小时取3命,枪决前笑着接受采访:我走了,谢谢

莫地方
2026-05-14 00:50:05
皇马训练视频疯传,“姆巴佩帮”和“维尼修斯帮”似乎泾渭分明

皇马训练视频疯传,“姆巴佩帮”和“维尼修斯帮”似乎泾渭分明

懂球帝
2026-05-14 01:38:38
编外人员“清退”开始,城管协管、辅警、护士教师都在其中

编外人员“清退”开始,城管协管、辅警、护士教师都在其中

巢客HOME
2026-05-14 05:55:06
大局已定!国乒亚运会名单8人入选,樊振东被弃用,王皓正面表态

大局已定!国乒亚运会名单8人入选,樊振东被弃用,王皓正面表态

胡一舸南游y
2026-05-14 20:21:03
2026-05-14 21:32:49
齐鲁壹点 incentive-icons
齐鲁壹点
找记者,上壹点!
646286文章数 83149关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

老人携带170万"现金"到银行存款 柜员发现全是练功券

头条要闻

老人携带170万"现金"到银行存款 柜员发现全是练功券

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

本地
艺术
数码
时尚
家居

本地新闻

用苏绣的方式,打开江西婺源

艺术要闻

美国务卿鲁比奥点赞中式美学,实景令人惊叹!

数码要闻

三星承诺将打造更节能的智能家电,旗下产品可帮用户“省电费”

大热天,阔腿裤配什么上衣更清凉?

家居要闻

精神奢享 对话塔尖需求

无障碍浏览 进入关怀版