网易首页 > 网易号 > 正文 申请入驻

刚刚,谷歌发布机器人最新「大脑」模型!思考能力SOTA,还能「跨物种」学习

0
分享至

新智元报道

编辑:定慧

【新智元导读】谷歌最新发布的Gemini Robotics 1.5系列模型,让机器人真正学会了「思考」,还能跨不同具身形态学习技能。这意味着,未来的机器人将成为和人类协作、主动完成复杂任务的智能伙伴。

谷歌又给机器人「换大脑」了!

刚刚,DeepMind发布了针对机器人和具身智能的Gemini Robotics 1.5系列家族模型,专为机器人和具身智能打造的新一代「大脑」。

Gemini Robotics 1.5系列包括Gemini Robotics 1.5Gemini Robotics-ER 1.5

  • Gemini Robotics 1.5,最先进的视觉-语言-行动模型,能将视觉信息和指令转化为机器人的运动指令以执行任务。

  • Gemini Robotics-ER 1.5,最强大的视觉-语言模型,能够对物理世界进行推理,直接调用数字工具,并创建详细的多步骤计划来完成任务。

它们结合在一起,就构建出一个强大的智能体框架。

在下面这个1分40秒的视频,谷歌的研究科学家让两个机器人完成了两个不同任务。

第一个任务是垃圾分类。

请Aloha根据旧金山的垃圾分类标准,把物品分到堆肥(绿桶)、回收(蓝桶)和垃圾(黑桶)里。

Aloha通过查阅规则并观察物品,完成了分类任务。

第二个任务是打包行李。

请Apollo帮忙打包去伦敦旅行的行李,并放入针织帽。

Apollo还主动查询天气,提醒伦敦多天会下雨,并贴心地把雨伞也放进包里。

整体看下来,在最新系列模型的加持下,现在机器人已经越来越有科幻电影里的那味了!

为实体任务开启智能体体验

想象一下,一个机器人不仅能看懂你家客厅的杂物,还能规划、思考并亲手收拾干净。

Gemini Robotics 1.5正是朝这个目标迈出的关键一步。

它让机器人具备「思考后行动」的能力,能在复杂环境中像人类一样理解、推理并完成多步骤任务。

这一突破,有望打开通用机器人的新时代。

Gemini Robotics-ER 1.5擅长在物理环境中进行规划与逻辑决策,拥有顶尖的空间理解能力,支持自然语言交互,可评估任务成功率与进度,并能直接调用谷歌搜索等工具获取信息或使用任何第三方用户自定义功能。

随后,Gemini Robotics-ER 1.5会为Gemini Robotics 1.5提供每一步的自然语言指令,后者则运用其视觉与语言理解能力直接执行具体动作。

Gemini Robotics 1.5还能协助机器人反思自身行为,以更好地解决语义复杂的任务,甚至能用自然语言解释其思考过程——这让它的决策更加透明。

这两款模型均基于核心Gemini模型家族构建,并通过不同数据集进行微调以专精于各自职能。

当它们协同工作时,可显著提升机器人对长周期任务和多样化环境的泛化能力。

先理解「环境」再「行动」

Gemini Robotics-ER 1.5是首个为具身推理优化的思维模型。

它在学术和内部基准测试中均实现了最先进的性能表现。

下面展示了Gemini Robotics-ER 1.5的部分能力,包括物体检测与状态估计、分割掩码、指向识别、轨迹预测以及任务进度评估与成功检测。

三「思」而后「行」

传统上,视觉-语言-动作模型直接将指令或语言规划转化为机器人的运动。

但Gemini Robotics 1.5不仅能翻译指令或规划,如今还能在行动前进行思考。

这意味着它能以自然语言生成内部推理与分析序列,从而执行需要多步骤或更深层语义理解的任务。

在下面这段3分40秒的视频,谷歌的科学家展示了机器人如何去完成更复杂的任务。

比如第一段将不同颜色的水果分类放到对应的盘子里。机器人需要能感知环境、分析颜色并逐步完成动作。

第二段Apollo被要求帮助分类洗衣物和打包物品。它能自主思考并在执行中展现出链式任务规划与反应能力,例如调整篮子来更好地捡起衣物,或对临时变化作出即时反应。

跨越不同形态的具身机器人学习

机器人形态各异、大小不一,具备不同的感知能力和自由度,这使得将从一个机器人学到的动作迁移到另一个机器人变得困难。

Gemini Robotics 1.5展现出卓越的跨具身学习能力。

它能将从一个机器人学到的动作迁移到另一个机器人,无需针对每种新形态专门调整模型。

这一突破加速了新行为的学习进程,助力机器人变得更智能、更实用。

在下面这段2分钟的视频里,谷歌科学家展示了不同「物种」机器人之间如何泛化学习。

在Gemini Robotics 1.5中,一个模型可以跨多个机器人使用。

比如Aloha在衣柜场景中已有经验,而Apollo从未见过,却能通过迁移学习完成开门、拿衣服等全新动作。

这展示了「跨具身学习」的潜力。

未来,不同场景中的机器人(如物流、零售)可互相学习,从而大大加快通用机器人研发的进程。

参考资料:

https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

侃球熊弟
2026-03-26 00:36:57
何超琼不愧是丰腴美人,穿白色低胸连衣裙凹凸有致,老了更撩人!

何超琼不愧是丰腴美人,穿白色低胸连衣裙凹凸有致,老了更撩人!

蓓小西
2026-03-17 08:39:55
美议员喊话特朗普:如果北京不答应美国要求,就不准中国做一件事

美议员喊话特朗普:如果北京不答应美国要求,就不准中国做一件事

让心灵得以栖息
2026-03-26 05:03:07
谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

温读史
2026-03-26 10:41:06
伊朗拒绝美国停战方案并提出伊方5项条件

伊朗拒绝美国停战方案并提出伊方5项条件

新京报
2026-03-25 23:58:14
甘油三酯"祸首"被发现,是猪油的12倍?专家叹息:还有人天天在吃

甘油三酯"祸首"被发现,是猪油的12倍?专家叹息:还有人天天在吃

芳芳历史烩
2026-03-23 11:04:46
为何伊朗突然变得这么强大呢?

为何伊朗突然变得这么强大呢?

农夫史记
2026-03-24 20:10:11
宋喆直播卖枣笑塌全网!百万流量零成交,满屏王宝强弹幕扎心到爆

宋喆直播卖枣笑塌全网!百万流量零成交,满屏王宝强弹幕扎心到爆

誮惜颜a
2026-01-13 01:12:10
中方未收道歉,日本自卫官被转移,沉默24小时后,小泉进次郎发文

中方未收道歉,日本自卫官被转移,沉默24小时后,小泉进次郎发文

策略述
2026-03-26 18:23:11
成都“牵手门”事件女主现今状况曝光,太惨了......

成都“牵手门”事件女主现今状况曝光,太惨了......

许三岁
2026-03-17 07:34:05
国产笔记本CPU偷梁换柱翻车!官方终于回应:生产失误、全额退款

国产笔记本CPU偷梁换柱翻车!官方终于回应:生产失误、全额退款

快科技
2026-03-25 10:14:04
最自私的人是什么样的?网友:我爸58岁得癌,拆迁180万全部花光

最自私的人是什么样的?网友:我爸58岁得癌,拆迁180万全部花光

火山詩话
2026-03-24 17:32:57
刚开业一周,上海德云社竟然被投诉了!

刚开业一周,上海德云社竟然被投诉了!

天津人
2026-03-26 11:12:18
迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

福建平子
2026-03-26 09:00:29
特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

每日经济新闻
2026-03-26 19:25:48
德黑兰街头忽然空了:巴斯基帐篷被遗弃,民兵连夜跑了,为什么?

德黑兰街头忽然空了:巴斯基帐篷被遗弃,民兵连夜跑了,为什么?

老马拉车莫少装
2026-03-24 22:55:20
港口管控升级!滞留中国巴拿马船暴涨3倍,巴拿马政府吃不消了

港口管控升级!滞留中国巴拿马船暴涨3倍,巴拿马政府吃不消了

肖兹探秘说
2026-03-26 20:07:23
一夜暴跌25%!小马哥最怕的事还是发生了:年轻人正在从腾讯溜走

一夜暴跌25%!小马哥最怕的事还是发生了:年轻人正在从腾讯溜走

潮鹿逐梦
2026-03-21 11:54:42
突发 广州白云 番禺多家法务公司 法律咨询公司被一锅端,上百人被抓

突发 广州白云 番禺多家法务公司 法律咨询公司被一锅端,上百人被抓

石辰搞笑日常
2026-03-26 17:28:25
曾经世界上最大的城市,差点取代北京成为中国首都,如今怎样?

曾经世界上最大的城市,差点取代北京成为中国首都,如今怎样?

抽象派大师
2026-03-14 14:00:04
2026-03-26 23:52:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
手机
艺术
家居
军事航空

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

手机要闻

OPPO K15 Pro 系列定档,岚影呼吸灯搭配金属中框

艺术要闻

哪一座桥不是风景?

家居要闻

傍海而居 静观蝴蝶海

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版