网易首页 > 网易号 > 正文 申请入驻

谷歌又发两款全新 AI 模型:能指挥机器人整理桌面、折纸,操作异常丝滑

0
分享至

作者 | 冬梅

美国当地时间 3 月 12 日,谷歌 DeepMind 团队宣布推出两款基于 Gemini 2.0 的机器人模型:一个是 Gemini Robotics,这是一个先进的视觉 - 语言 - 动作 (VLA) 模型,建立在 Gemini 2.0 的基础上,并增加了物理动作作为新的输出方式,用于直接控制机器人;另一个是 Gemini Robotics-ER,这是一个具有先进空间理解能力的 Gemini 模型,使机器人专家能够利用 Gemini 的具身推理 (ER) 能力运行自己的程序。

谷歌在官方博客中称,“在 Google DeepMind,我们在 Gemini 模型如何通过跨文本、图像、音频和视频的多模态推理解决复杂问题方面取得了进展。然而,到目前为止,这些能力主要局限于数字领域。为了使人工智能在物理领域对人类有用和有帮助,它们必须展示‘具身’推理——像人类一样理解和响应我们周围世界的能力——以及安全地采取行动来完成任务。”

谷歌 DeepMind 已在 Gemini Robotics 模型方面,和 Apptronik、Agile Robots、Agility Robots、Boston Dynamics 和 Enchanted Tools 等展开合作。

谷歌强调,为了对人类有用和有帮助,机器人的人工智能模型需要具备三个主要特质:它们必须具有通用性,这意味着它们能够适应不同的情况;它们必须具有交互性,这意味着它们能够理解指令或环境变化并快速做出反应;它们必须具有灵巧性,这意味着它们可以做人们通常用手和手指可以做的事情,比如小心地操纵物体。

具体来讲,这些模型能做什么?

DeepMind 发布了一系列演示视频,展示了配备 Gemini Robotics 的机器人如何折叠纸张、完成更精细的抓取动作以及响应语音命令执行其他任务。

DeepMind 实验室称,Gemini Robotics 经过训练,可以泛化各种不同机器人硬件的行为,并将机器人可以“看到”的物品与它们可能采取的行动联系起来。

谷歌表示:“虽然我们之前的工作在这些领域取得了进展,但 Gemini Robotics 在所有三个轴的性能上都迈出了实质性的一步,使我们更接近真正的通用机器人。”

值得一提的是,谷歌 DeepMind 正在与 Apptronik 合作“打造下一代人形机器人”。它还向“受信任的测试人员”开放了 Gemini Robotics-ER 模型,包括 Agile Robots、Agility Robotics、Boston Dynamics 和 Enchanted Tools。谷歌方面表示:“我们非常专注于打造能够理解物理世界并能够对物理世界采取行动的智能。我们非常高兴能够在多个实施例和许多应用中利用这一点。”

https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/?utm_source=keywordsnippet&utm_medium=referral

https://www.theverge.com/news/628021/google-deepmind-gemini-robotics-ai-models

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
金价闪崩创纪录,创40年最大跌幅,普通人何时进场?一招就搞定

金价闪崩创纪录,创40年最大跌幅,普通人何时进场?一招就搞定

丁蓳解说
2026-05-16 05:02:48
U17亚洲杯-万项破门 中国队3比1逆转沙特晋级四强

U17亚洲杯-万项破门 中国队3比1逆转沙特晋级四强

体坛周报
2026-05-16 03:32:18
53岁逆天身材连20岁都嫉妒!从哥伦比亚村姑到红毯女王的开挂人生

53岁逆天身材连20岁都嫉妒!从哥伦比亚村姑到红毯女王的开挂人生

东方不败然多多
2026-05-16 05:04:37
在迪士尼花2000多买「插队特权」怎么激怒普通游客?“排队3小时快要昏厥突然有人插到你前面”

在迪士尼花2000多买「插队特权」怎么激怒普通游客?“排队3小时快要昏厥突然有人插到你前面”

Vista氢商业
2026-05-15 15:21:52
欢迎宴会企业家座位曝光:马斯克、黄仁勋与海信集团贾少谦、福耀玻璃曹晖等同桌吃饭,波音CEO和中国商飞董事长、国航董事长同席

欢迎宴会企业家座位曝光:马斯克、黄仁勋与海信集团贾少谦、福耀玻璃曹晖等同桌吃饭,波音CEO和中国商飞董事长、国航董事长同席

大风新闻
2026-05-15 08:42:09
马斯克为什么不四处合影,拉关系,结交人脉啊,菜真就那么好吃?

马斯克为什么不四处合影,拉关系,结交人脉啊,菜真就那么好吃?

老方
2026-05-15 11:37:48
乌克兰低成本武器多由手工焊接或胶带缠绕 防长:都是消耗品,随时会被击落或炸毁

乌克兰低成本武器多由手工焊接或胶带缠绕 防长:都是消耗品,随时会被击落或炸毁

红星新闻
2026-05-15 18:47:49
女娃被锁车里绝望喝光3瓶水,都没有等到打麻将的父母想起她

女娃被锁车里绝望喝光3瓶水,都没有等到打麻将的父母想起她

第四思维
2025-07-15 13:16:45
今夜,美股大跌500点,欧洲集体跳水,白银暴跌9%!利率风暴,席卷全球

今夜,美股大跌500点,欧洲集体跳水,白银暴跌9%!利率风暴,席卷全球

中国基金报
2026-05-16 00:19:39
小米17T系列定档5月28日,三款新机配置全曝光

小米17T系列定档5月28日,三款新机配置全曝光

摸鱼算法
2026-05-15 03:11:35
捅你一刀,是为了你好

捅你一刀,是为了你好

柴差说
2026-05-14 17:27:50
国宴火了:不追求奢华,只把食材本味/烹饪功底/摆盘美学做到极致

国宴火了:不追求奢华,只把食材本味/烹饪功底/摆盘美学做到极致

魔都姐姐杂谈
2026-05-15 15:06:00
注意!日本机场狂查,大姐8个箱子被海关扒穿,当场罚到沉默!

注意!日本机场狂查,大姐8个箱子被海关扒穿,当场罚到沉默!

东京在线
2026-05-15 16:30:30
为何美国精英一到中国,瞬间收敛随性画风,全员变正经?

为何美国精英一到中国,瞬间收敛随性画风,全员变正经?

荆楚寰宇文枢
2026-05-15 23:18:56
NBA历史总薪资榜:詹姆斯第一,杜兰特、库里、哈登分列2-4名

NBA历史总薪资榜:詹姆斯第一,杜兰特、库里、哈登分列2-4名

懂球帝
2026-05-16 01:22:05
6战5胜!泰国公开赛国羽战报:石宇奇决胜局险胜,陈雨菲横扫晋级

6战5胜!泰国公开赛国羽战报:石宇奇决胜局险胜,陈雨菲横扫晋级

郝小小看体育
2026-05-15 18:38:06
我国取得重大找矿突破!

我国取得重大找矿突破!

证券时报
2026-05-15 21:07:11
两老人捡十几年破烂存五六万,这都下得去手!真正的“骗子”是谁

两老人捡十几年破烂存五六万,这都下得去手!真正的“骗子”是谁

走读新生
2026-05-15 15:05:17
四季酒店什么来头?能让特朗普2026年访华放弃了国宾馆

四季酒店什么来头?能让特朗普2026年访华放弃了国宾馆

翰林冷知识
2026-05-14 23:15:40
“奶奶经常用嘴咬我,”10岁儿子说出真相,妈妈当场崩溃报警

“奶奶经常用嘴咬我,”10岁儿子说出真相,妈妈当场崩溃报警

一丝不苟的法律人
2026-05-14 23:17:13
2026-05-16 05:55:00
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12381文章数 51889关注度
往期回顾 全部

科技要闻

直降千元起步!苹果华为率先开启618让利

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

腾讯掉队,马化腾戳破真相

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

旅游
时尚
家居
教育
军事航空

旅游要闻

藏在沈阳闹市的金色秘境!2 万㎡油菜花全开,地铁直达还免费

顶级团队拍出来的作品不如素人,问题出在哪儿了?

家居要闻

110㎡淡而有致的生活表达

教育要闻

老师掌掴多名学生后续,系一名书法教师,当地公布处罚结果

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版