阿里巴巴也加入了构建“物理AI”的竞赛,推出了一款专门给现实世界的机器人提供动力的新模型。
这家中国科技巨头周二发布了RynnBrain,这是一个专门帮机器理解空间、物体和运动的人工智能系统。
这一发布说明阿里巴巴正在加快机器人领域的布局,这块早就吸引了英伟达、谷歌这些美国公司的大笔投资。
阿里巴巴达摩院发布的一段简短的演示视频里,一个机器人识别出水果然后放进篮子中。这个任务看起来挺简单的。
但其实背后的智能一点儿也不简单。机器人必须识别物体、追踪位置,并实时规划精准动作。
阿里巴巴将RynnBrain定位为基础性“具身AI”模型。这一类别包括机器人、自动驾驶汽车以及其他直接跟物理环境打交道的机器。
随着和美国竞争越来越激烈,中国已把物理AI当成国家头等大事来抓。
专为现实记忆而生
RynnBrain 专注于解决现有机器人模型的一个主要弱点:空间和时间记忆差。
传统的具身AI系统常常遗忘物体的位置或误判场景。阿里巴巴表示,RynnBrain通过时空记忆解决了这两个问题。
这种能力让机器人能记起物体以前在哪,并预测它们接下来会如何移动。
该系统还支持全局回顾。机器人在选择下一步行动之前可以回顾过去的操作。这种方法有助于减少复杂任务中的错误。
物理空间推理多了一层。RynnBrain将基于文本的逻辑与空间线索相结合。这种混合方法让机器人的推理更贴近真实环境。
阿里巴巴用Qwen3-VL视觉语言系统训练了这个模型。达摩院使用名为RynnScale的自定义架构对其进行了优化。
该公司表示,这么搞没多花算力,训练速度就翻了一倍。
模型更小,机器人更快
这次发布了阿里巴巴所说的业界首个300亿参数的混合专家具身AI模型。
别看它参数多,推理时只激活30亿个参数。阿里巴巴说,这效率让它的表现比720亿参数的大家伙还猛。
推理需求一降,机器人动作更顺溜,决策也更快。
这些优势在实际部署中很关键,毕竟功耗和延迟限制经常拖后腿。
性能测试的结果很牛。
阿里巴巴说,RynnBrain在16个开源具身智能基准测试中破了纪录。这些测试测了它们对环境的感觉、空间推理和完成任务的能力。
阿里巴巴说,RynnBrain比谷歌的Gemini Robotics ER 1.5和英伟达的Cosmos Reason 2这些系统都强。
除了RynnBrain之外,达摩院还发布了七个完全开源模型。里面有基础版,还有针对商业优化过的版本。
阿里巴巴说,推出这些东西就是为了让搞机器人的人更容易上手研究。
开放了大家都能用,可能让制造业、物流和服务行业更快用上机器人技术。
达摩院还搞了个新评估框架,叫RynnBrain-Bench。
该基准测试针对具身智能测试中一直存在的空白。
它主要聚焦精细的时空任务,而不是静态图像识别。
此举让阿里巴巴更深入地参与了包括美国科技巨头和创业公司在内的全球竞争。
随着机器人走出实验室和模拟环境,像RynnBrain这样的具身智能模型可能会决定机器在现实世界中怎么运作。
眼下,阿里巴巴也想占个位子。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.