网易首页 > 网易号 > 正文 申请入驻

谷歌发布Gemini Robotics On-Device,实现机器人AI模型本地运行

0
分享至

谷歌 DeepMind 于 6 月 24 日正式发布了 Gemini Robotics On-Device 模型,这是一个专为机器人设计的人工智能系统,最大的特点是可以完全在机器人设备本地运行,无需依赖云端连接,从而赋予机器人前所未有的自主性与灵活性。

此前,包括谷歌在内的许多机器人系统,都采用一种混合架构:在机器人上部署一个较小的模型以处理快速响应,同时将需要复杂推理和规划的“重脑力活”交由云端强大的服务器处理。这种方式虽然可行,但其弊端也显而易见。它不仅对网络连接的稳定性和速度提出了极高要求,任何网络延迟或中断都可能导致机器人反应迟缓甚至停摆;同时,将传感器数据(尤其是来自家庭或医疗等隐私敏感环境的视觉数据)上传至云端,也引发了持续的隐私和安全顾虑。

新发布的 Gemini Robotics On-Device 模型,正是为了解决这些核心痛点而生。它是一个完全集成的视觉语言动作(VLA,vision-language-action model)模型,能够同时处理视觉输入、自然语言指令和动作输出。这一切复杂的“思考”过程,如今都可以在机器人自身的计算单元上完成。

谷歌 DeepMind 的机器人技术主管 Carolina Parada 在介绍中解释道,这一进步得益于 Gemini 模型本身强大的多模态理解能力。“这就像 Gemini 能够写诗、总结文章、编写代码一样。”她表示,“它同样能够生成机器人的动作。”这种生成式的 AI 能力,使得机器人不再局限于通过强化学习对特定任务进行漫长而刻板的训练,而是能够对全新的、从未见过的指令和场景进行泛化理解和响应,极大地提升了机器人的通用性。

与前代需要云端协同的 Gemini Robotics 系统相比,On-Device 模型在自主性上实现了质的飞跃。它让机器人摆脱了网络的束缚,能够在网络信号不佳甚至完全没有网络的“离线”环境中独立工作。这为其在一些特殊场景的应用打开了想象空间,例如在偏远地区的勘探、信号被屏蔽的工厂车间,或是在对数据隐私有极高要求的医疗保健环境中辅助病人。在这些场景下,本地化处理不仅保证了操作的连续性和可靠性,也确保了所有敏感数据都保留在设备本地,最大限度地保护了隐私。

在性能方面,即使完全在本地运行,Gemini Robotics On-Device 在多项泛化能力基准测试中,其表现也已非常接近需要云端支持的、更强大的旗舰版 Gemini Robotics 模型,并显著优于之前的其他本地化模型。它不仅能完成像折叠衣物、整理手提袋这类日常任务,甚至可以应对“系鞋带”这种对机器人来说历来是巨大挑战的精细操作。

更值得关注的是该模型的可适应性和通用性。谷歌强调,Gemini Robotics On-Device 是其首个开放给开发者进行微调的机器人 VLA 模型,开发者可以根据自己的特定需求和应用场景,对模型进行定制化训练。研究表明,仅需 50 到 100 个新的任务演示(通常通过遥操作机器人完成),模型就能快速学习并掌握新技能,展现出强大的“快速任务适应”能力。

为了证明其跨平台的通用性,谷歌展示了该模型在不同物理机器人上的应用成果。虽然模型最初主要在谷歌自家的 ALOHA 双臂机器人上进行训练,但团队成功地将其适配到了多种第三方机器人上,包括德国 Franka Emika 公司的双臂协作机器人,以及由 Apptronik 公司开发的备受瞩目的人形机器人 Apollo。在演示中,Apollo 机器人在接收到“把黑色 T 恤放进礼品袋”或“把魔方放进礼品袋”等指令后,能够准确地识别目标物体并完成相应的操作。

不过,除了对其能力的赞许,许多网友也对其安全性产生了担忧。当一个强大的 AI 模型被赋予了控制物理实体的能力后,如何确保其行为安全、可控、可预测,便成为重中之重。Parada 坦言,生成式 AI 在输出上存在一定的随机性,这在聊天机器人中可能只是生成一些无伤大雅的怪异文本,但对于一个物理机器人而言,则可能引发严重的安全问题。

对此,谷歌强调,他们发布的 On-Device 模型本身只是一个核心的 VLA,并不包含完整的安全框架。谷歌建议并推荐开发者复制其内部团队所采用的多层安全策略。这包括将本地模型与标准的 Gemini Live API 连接,利用其内建的安全层进行语义和内容审查,以过滤掉不安全或不恰当的指令。同时,至关重要的是,开发者需要在机器人硬件层面部署一个低级别的安全控制器,对机器人的动作范围、力度等关键参数进行实时监控和限制,作为最后一道防线。谷歌也鼓励开发者利用其发布的语义安全基准和进行“红队演练”(red-teaming),在部署前充分暴露和修复模型的潜在安全漏洞。

目前,谷歌已经启动了一个“受信任的测试者计划”,邀请感兴趣的开发者和研究人员申请使用全新的 Gemini Robotics On-Device 模型及其配套的软件开发工具包。该工具包还集成了 MuJoCo 物理模拟器,方便开发者在部署到真实机器人之前,在虚拟环境中进行大量的测试和调试。

从长远来看,这次发布的模型还只是一个开始。Parada 透露,当前的 Gemini Robotics 模型是基于 Gemini 2.0 版本构建的,而谷歌的机器人团队通常比核心的 Gemini 模型开发进度晚一个版本。考虑到最新的 Gemini 2.5 的性能提升,其下一代机器人模型的性能也有望将获得提升。

参考资料:

1.https://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-local-robotic-devices/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曾经是“白月光”,如今却令人崩溃的5个装修设计,我家中了一半

曾经是“白月光”,如今却令人崩溃的5个装修设计,我家中了一半

Home范
2026-02-17 14:45:03
鲁尼:图赫尔长约在手,英格兰不必再受曼联传闻影响

鲁尼:图赫尔长约在手,英格兰不必再受曼联传闻影响

生活点滴集oiu
2026-02-17 14:22:49
美“空军一号”紧急变脸,200亿军售悬了?台当局这回真要天塌了

美“空军一号”紧急变脸,200亿军售悬了?台当局这回真要天塌了

眼界看视野
2026-02-17 14:11:59
风流成性这一次,再多的名利都救不了40岁的“海王”孙骁骁

风流成性这一次,再多的名利都救不了40岁的“海王”孙骁骁

丁羂解说
2026-02-17 13:23:46
年前陕西一老人向儿子要1万元被拒后掀桌砸碗  更多细节曝光

年前陕西一老人向儿子要1万元被拒后掀桌砸碗 更多细节曝光

阿SIR观察
2026-02-17 09:27:37
印度首富太太同框约旦王后,象牙白纱丽尽显雍容,小儿媳却惹争议

印度首富太太同框约旦王后,象牙白纱丽尽显雍容,小儿媳却惹争议

译言
2026-02-17 07:10:28
“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

复转这些年
2026-01-27 03:00:03
“亲戚给儿子500元红包,她家两娃我咋给?”高情商回应,很体面

“亲戚给儿子500元红包,她家两娃我咋给?”高情商回应,很体面

凝妈悟语柠橙妈妈
2026-02-07 13:11:50
“钱退回来,这是夫妻共同财产!”女子回娘家被嫂子堵在屋里要钱

“钱退回来,这是夫妻共同财产!”女子回娘家被嫂子堵在屋里要钱

一丝不苟的法律人
2026-02-14 21:21:39
权威网站力挺B费!欧洲最佳阵容引热议,曼联大腿入围实至名归

权威网站力挺B费!欧洲最佳阵容引热议,曼联大腿入围实至名归

体坛鉴春秋
2026-02-17 13:52:01
海外玩家纠结:花两周工资买《黑神话:悟空》值吗?

海外玩家纠结:花两周工资买《黑神话:悟空》值吗?

游民星空
2026-02-16 12:30:37
如果引进星链市场,会对中国的很多行业造成巨大的冲击。

如果引进星链市场,会对中国的很多行业造成巨大的冲击。

林子说事
2026-02-16 21:19:35
这就是为什么不要欺负底层员工的原因!网友:1600万结款直接报废

这就是为什么不要欺负底层员工的原因!网友:1600万结款直接报废

另子维爱读史
2026-02-01 20:32:25
新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

南权先生
2026-01-26 15:41:26
揪心!谷爱凌脑出血休克,癫痫发作濒死边缘,母亲泪崩曝细节

揪心!谷爱凌脑出血休克,癫痫发作濒死边缘,母亲泪崩曝细节

古事寻踪记
2026-02-06 07:13:45
热搜爆了!机器人“扎堆”上春晚,背后概念股抢先看,谁是下一个“宇树”?

热搜爆了!机器人“扎堆”上春晚,背后概念股抢先看,谁是下一个“宇树”?

每日经济新闻
2026-02-17 00:23:36
大清皇后孟古青被废后回家生龙子,皇帝想接回,娘家:接就出兵

大清皇后孟古青被废后回家生龙子,皇帝想接回,娘家:接就出兵

比利
2026-02-15 21:02:28
“别指望几百块体检啥都能查出来!”2025年一体检机构老总如是说

“别指望几百块体检啥都能查出来!”2025年一体检机构老总如是说

有书
2026-02-16 22:45:03
狗粮!杨瀚森晒与漂亮女友共度情人节,搂着女友蜂腰脸贴着脸秀恩爱

狗粮!杨瀚森晒与漂亮女友共度情人节,搂着女友蜂腰脸贴着脸秀恩爱

818体育
2026-02-16 17:54:07
萨拉赫终于妥协!利物浦两大核心并肩作战,斯洛特帅位稳了?

萨拉赫终于妥协!利物浦两大核心并肩作战,斯洛特帅位稳了?

锐评利物浦
2026-02-16 23:44:47
2026-02-17 15:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16280文章数 514615关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

蔡磊又踏入一个本命年:我已经一年不知道吃的是什么

头条要闻

蔡磊又踏入一个本命年:我已经一年不知道吃的是什么

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春晚三大感人瞬间:周深于和伟上榜

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

艺术
手机
健康
教育
公开课

艺术要闻

这幅字调查百人,无人识别,竟如此难懂!

手机要闻

同比下滑7%,Pro占比51%,vivo X300系列这数据如何

转头就晕的耳石症,能开车上班吗?

教育要闻

高考红包数字揭秘!这样送才吉利

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版