网易首页 > 网易号 > 正文 申请入驻

小米发布并开源首代机器VLA大模型!刷新多项SOTA

0
分享至

快科技2月12日消息,小米正式发布并开源首代机器人VLA大模型——Xiaomi-Robotics-0。

该模型拥有47亿参数,核心解决了传统VLA模型推理延迟、真机动作不连贯的行业痛点,兼具视觉语言理解与高性能实时执行能力,可在消费级显卡上实现实时推理,在仿真测试和真机任务中均刷新多项SOTA成绩。


Xiaomi-Robotics-0采用Mixture-of-Transformers(MoT)混合架构,通过"视觉语言大脑+动作执行小脑"的组合,实现感知、决策、执行的高效闭环,兼顾通用理解与精细动作控制。

视觉语言大脑(VLM):以多模态VLM大模型为底座,能精准理解人类模糊自然指令,同时捕捉高清视觉输入中的空间关系,是模型的"决策核心";

动作执行小脑(Action Expert):嵌入多层Diffusion Transformer(DiT),不直接输出单一动作,而是生成高频、平滑的"动作块",并通过流匹配技术保障动作精准度,让机器人动作更具物理灵活性。


为避免模型学动作丢失基础理解能力,小米设计了跨模态预训练+后训练的两阶段训练方法,让模型既懂常识又精通体力活。

跨模态预训练:先通过多模态与动作数据混合训练,引入Action Proposal机制让VLM的特征空间与动作空间对齐;再冻结VLM专注训练DiT,使其从噪声中恢复精准动作序列,保障动作的平滑性;

后训练:这是解锁物理智能的核心,采用异步推理模式从机制上解决真机"动作断层"问题;同时引入Clean Action Prefix保障动作轨迹时间连续性,通过Λ-shape Attention Mask让模型聚焦当前视觉反馈、摆脱历史惯性,大幅提升机器人对环境突发变化的响应能力。


实测该模型在多维度测试中均展现出行业领先水平,实现"仿真通、真机强、多模态能力不丢失"的突破。

仿真测试:在LIBERO、CALVIN、SimplerEnv三大主流仿真测试的所有Benchmark中,对比30种现有模型均取得当前最优结果;

真机任务:在双臂机器人平台部署后,面对积木拆解、叠毛巾等长周期、高难度任务,展现出极高的手眼协调性,能灵活处理刚性积木和柔性织物等不同材质物体;

多模态能力:保留了VLM本身的物体检测、视觉问答、逻辑推理等能力,在具身相关基准测试中表现优异,弥补了传统VLA模型重动作、轻理解的短板。



小米已将Xiaomi-Robotics-0的技术主页、开源代码、模型权重全量开放,相关资源可分别在GitHub、Hugging Face等平台获取,为全球具身智能领域的开发者和研究机构提供免费技术支持。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
望月海辉:我非常想参加世界杯,但我的水平想入选日本队很难

望月海辉:我非常想参加世界杯,但我的水平想入选日本队很难

懂球帝
2026-02-12 18:06:07
春节前车厘子现大面积“翻车”,消费者吐槽收到“陈年僵尸果”,专家:今年春节较晚,受卖家赌涨价压货影响

春节前车厘子现大面积“翻车”,消费者吐槽收到“陈年僵尸果”,专家:今年春节较晚,受卖家赌涨价压货影响

海峡网
2026-02-12 15:30:12
谢贤前女友又曝猛料!谢霆锋娶张柏芝并不是因为爱她,隐瞒所有人

谢贤前女友又曝猛料!谢霆锋娶张柏芝并不是因为爱她,隐瞒所有人

离离言几许
2026-02-12 00:04:17
一场追思会,戳穿翁帆沉默两个月真相,原来杨振宁生前真的没说错

一场追思会,戳穿翁帆沉默两个月真相,原来杨振宁生前真的没说错

来科点谱
2025-12-15 09:06:33
郭沫若想让月薪100的溥仪当助理,岂料溥仪用5个字,让对方红了脸

郭沫若想让月薪100的溥仪当助理,岂料溥仪用5个字,让对方红了脸

混沌录
2026-02-13 00:11:33
【关注】山西一副县长被查!

【关注】山西一副县长被查!

山西圈儿
2026-02-13 12:18:32
詹姆斯28+10+12创NBA神迹,里夫斯替补18分,湖人三杀独行侠

詹姆斯28+10+12创NBA神迹,里夫斯替补18分,湖人三杀独行侠

钉钉陌上花开
2026-02-13 13:28:36
揭秘亚洲最穷国:当地女性惊人开放,游客秒变土豪,无不想去定居

揭秘亚洲最穷国:当地女性惊人开放,游客秒变土豪,无不想去定居

明天后天大后天
2026-02-07 11:10:14
陈冲弃养的中国双胞胎,25年无下落?萝莉岛300万页文件让人不安

陈冲弃养的中国双胞胎,25年无下落?萝莉岛300万页文件让人不安

壹月情感
2026-02-10 23:43:27
大清朝第一罪人:不是鳌拜,不是吴三桂,竟是陪康熙35年的忠臣!

大清朝第一罪人:不是鳌拜,不是吴三桂,竟是陪康熙35年的忠臣!

边城少爷
2026-02-10 10:30:04
台湾终极解决方案:土地回归中国,人员往来自由,逃走不是中国人

台湾终极解决方案:土地回归中国,人员往来自由,逃走不是中国人

赵钇是个热血青年
2026-02-11 20:16:05
“资助不起装什么孙子!”2006年,贫困大学生向海清向媒体怒斥

“资助不起装什么孙子!”2006年,贫困大学生向海清向媒体怒斥

百态人间
2026-02-05 15:42:49
暴降90%!英伟达Blackwell架构将AI推理成本压缩至十分之一

暴降90%!英伟达Blackwell架构将AI推理成本压缩至十分之一

IT之家
2026-02-13 14:20:11
特斯拉7年低息背后是硬通货:保值率领先,八年电池几乎无衰减

特斯拉7年低息背后是硬通货:保值率领先,八年电池几乎无衰减

特空间
2026-02-13 14:20:27
差58席独裁!阿努廷向为泰党递刀:入伙或滚出政坛

差58席独裁!阿努廷向为泰党递刀:入伙或滚出政坛

风信子的花
2026-02-13 11:49:32
游戏结束,中方持续大规模抛售美债,贝森特:不希望与中国脱钩

游戏结束,中方持续大规模抛售美债,贝森特:不希望与中国脱钩

混沌录
2026-02-12 23:48:10
关羽败走麦城的时候,路过马超封地,为什么马超不出手相助呢?

关羽败走麦城的时候,路过马超封地,为什么马超不出手相助呢?

铭记历史呀
2026-02-11 11:45:38
上海百万富翁外卖员:日工作12小时,5年送16万单

上海百万富翁外卖员:日工作12小时,5年送16万单

书写传奇
2026-01-21 23:07:17
都体:切利克拒绝罗马280万欧年薪报价,国米有意免签

都体:切利克拒绝罗马280万欧年薪报价,国米有意免签

懂球帝
2026-02-13 12:22:11
中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

阿器谈史
2026-01-30 08:40:58
2026-02-13 14:56:49
快科技 incentive-icons
快科技
一起关注每日科技热点
105407文章数 260020关注度
往期回顾 全部

科技要闻

DeepSeek更新后被吐槽变冷变傻?

头条要闻

中方罕见评价日本选举 发出“极其严厉的预警”

头条要闻

中方罕见评价日本选举 发出“极其严厉的预警”

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

米兰冬奥摘银 谷爱凌再遭美国网友网暴

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

数码
亲子
游戏
艺术
军事航空

数码要闻

SK海力士将展示14.4Gbps LPDDR6内存,三星升级至12.8Gbps

亲子要闻

妈妈和宝宝还没有出产房,孕妇的妈妈在角落默默流泪,婆婆喜笑颜开的等着儿媳和孙子出产房

多人合作清洁游戏《哥布林女仆大扫除》公布 2026 年更新路线图,农历新年主题抢先看

艺术要闻

书法大师的神作现身,引发网友热议!

军事要闻

多次成功应对外舰、外机挑衅 太原舰展示052D硬核实力

无障碍浏览 进入关怀版