说实话,看到小米开源这个机器人模型的时候,我第一反应是:雷总,又来“致敬”行业了?
但仔细一看参数和论文,嚯,这次好像不是玩票的。
2月12号,小米悄没声儿地把他们首代机器人VLA大模型 Xiaomi-Robotics-0 给开源了,扔到了GitHub上。
这动作,怎么说呢,有点“不讲武德”。
要知道,现在搞机器人“大脑”(也就是大模型)的,无论是波士顿动力的老牌玩家,还是特斯拉的Optimus团队,那都是藏着掖着,技术细节捂得比啥都严实。
小米倒好,直接掀桌子,把代码和模型全给你摆桌面上。
“来,都看看,咱就这么干的。”
这魄力,在现在的环境下,真不多见。
这玩意儿到底是个啥?
简单说,它就是给机器人用的“GPT”。
VLA,视觉-语言-动作模型。你给它看(视觉),跟它说(语言),它就能理解并做出相应的动作。
比如你指着桌上的苹果说“拿给我”,它得先“看见”苹果,再“听懂”你的指令,最后规划路径、控制机械臂“拿起来”。
这一整套流程,现在这一个模型就想包圆了。
小米这个Xiaomi-Robotics-0,参数量是47亿。
47亿,在动辄千亿、万亿参数的聊天大模型面前,听起来像个“弟弟”。
但你要知道,这是给机器人实时控制用的,参数不是越大越好,而是越快、越准越好。
它追求的不是跟你吟诗作对,而是在80毫秒内给出动作指令,控制频率高达30Hz。
这什么概念?
就是几乎无延迟。你眨下眼要100毫秒,它在你眼皮子底下已经完成了一次思考和动作规划。
更关键的是,它宣称在消费级显卡RTX 4090上就能“跑得飞起”。
这就把门槛从“国家级实验室”拉到了“高端游戏玩家”级别。
以前你想研究这个?先准备几百万的专用计算卡和服务器吧。
现在,理论上,你有一张4090,就能跑起来试试。
这简直就是对机器人研究圈的“技术平权”宣言。
当然,光快没用,还得能干细活。
根据论文,它在LIBERO、CALVIN这些业内公认的仿真测试集上,刷新了好几项SOTA(最高水平)。
最让我觉得有点东西的是,它强调能处理“刚柔性物体”。
刚体好理解,杯子、盒子。柔性物体就难了,比如一件衣服,一条数据线,一个塑料袋。
机器人抓取这些软趴趴、会变形的东西,难度指数级上升。
小米这个模型展示的双臂机器人,能相对精准地操作这些玩意儿, 这说明它的视觉理解和动作生成的精度,确实上了个台阶。
不是那种只能做几个固定体操动作的“样子货”。
那么问题来了,小米为啥要开源?做慈善吗?
肯定不是。
首先,抢生态位。 在机器人操作系统和核心模型领域,现在还没有一个绝对的“安卓”。
特斯拉有自己的路线,但不开放。其他家各自为战。
小米这时候把一套看起来不错的“基础模型”开源,就像当年安卓开源一样,是在吸引全球的开发者、研究机构、甚至竞争对手,来基于它的框架做开发。
用的人多了,标准就可能由它来定。生态一旦形成,后来的玩家就得跟着它的规则玩。
其次,用全球的智慧,帮它迭代。
机器人技术太难了,单靠一家公司闭门造车,进展缓慢。
开源出去,成千上万的开发者会用它,会发现问题,会提出改进方案,甚至会有分支创新。
小米就能站在这个“巨人集群”的肩膀上,用最低的成本,获取最快的技术进步。
这算盘,打得我在上海都听见了。
最后,当然是为自家的机器人产品铺路。
小米的铁蛋机器狗已经出了两代,人形机器人“铁大”也亮相过。
未来这些产品要真正走向市场,一个聪明、廉价、可大规模部署的“大脑”是核心。
先通过开源把模型打磨成熟,降低成本,等时机一到,往自己的硬件里一装,产业链优势瞬间就出来了。
这招“软件开源,硬件收费”,在手机和IoT领域,小米玩得太熟了。
现在不过是复制到机器人赛道而已。
当然了,夸了半天,也得泼点冷水。
仿真测试刷榜,和现实世界干活,那是两码事。
p>实验室里操作成功率99%,到了你家杂乱无章的客厅,面对你没见过的家具、调皮的孩子和跑来跑去的宠物,成功率能剩多少?
这是个巨大的问号。
现实世界的“长尾问题”无穷无尽,这才是机器人落地最大的拦路虎。
另外,47亿参数模型在4090上能跑,也只是“能跑”。
真要部署到成千上万的消费级机器人上,对芯片的算力、功耗、成本要求依然苛刻。
从“能跑”到“好用且便宜”,还有很长的路要走。
p>最后,也是最关键的一点:开源是一把双刃剑。
你开放了,友商就能看光你的技术底牌,甚至在此基础上做出比你更好的东西。
小米有没有信心,在开放的竞争环境中,始终保持领先?
这非常考验其后续的研发和工程化能力。
总的来说,小米这一步棋,走得相当大胆,也相当聪明。
它不像是在做一个具体的机器人产品,更像是在为下一个时代的“机器人安卓系统”投下种子。
在特斯拉等巨头选择封闭开发的时候,小米选择了拥抱开源社区。
p>这场“开放”与“封闭”的路线之争,谁会更胜一筹?现在还很难说。
但可以肯定的是,小米Xiaomi-Robotics-0的开源,就像往平静的湖面扔下了一块巨石。
它极大地降低了机器人AI的研究门槛,势必会吸引更多人才和资源涌入这个赛道,加速整个行业的发展。
对于我们这些看客来说,绝对是好事。
也许用不了几年,我们讨论的就不再是“机器人会不会普及”,而是“你家的机器人,用的是小米系,还是特斯拉系?”
好戏,才刚刚开场。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.