网易首页 > 网易科技 > 网易科技 > 正文

操作太丝滑了!谷歌AI让机器人具备"微操黑科技"

0
分享至

谷歌新型AI模型能控制机器人折纸 (来源:网易科技报道)

3月13日消息,美国时间周三,Google旗下DeepMind实验室宣布推出两款用于控制机器人的全新人工智能模型:Gemini Robotics与Gemini Robotics-ER。公司声称,这些模型能为多种形态的机器人赋予精细运动技能与环境适应能力,显著提升其在物理世界中的交互效率,推动人形机器人助手等应用落地。

值得注意的是,尽管用于机器人平台的硬件在稳步发展(尽管并非总是如此),如何确保人工智能系统能够安全精准控制机器人应对未知场景始终是行业难题。业内所谓的“具身智能”不仅是英伟达等科技巨头的“登月计划”,更是开启通用机器人劳工时代的关键钥匙。

谷歌开发的新模型基于Gemini 2.0大语言模型,针对机器人应用特别增加了相关功能。其中Gemini Robotics整合了谷歌所称的“视觉-语言-行动”(Vision-Language-Action, VLA)能力,可处理视觉信息、理解语言指令并生成物理动作指令。而Gemini Robotics-ER则侧重于“具身推理”,提升空间认知能力,可无缝接入现有的机器人控制系统。

比如,Gemini Robotics可以命令机器人“将香蕉放进篮子”,其会利用摄像头获取场景图像识别香蕉,进而控制机械臂成功完成动作;也可以命令机器人“折纸狐狸”,系统则会运用如何精细折叠纸张的知识完成任务。

2023年,谷歌开发的RT-2模型在迈向通用机器人能力的道路上迈出重要一步——通过利用互联网数据帮助机器人理解语言指令并适应新场景,其在未知任务中的表现较前代模型翻倍。两年后,Gemini Robotics看似又取得了重大进展,不仅在理解指令方面表现出色,还能执行RT-2无法应对的复杂物理操作。

RT-2只能复现训练过的物理动作,但Gemini Robotics的灵活性实现了质的飞跃,能够完成折纸、零食封装等高难度任务。从仅仅理解指令的机器人,到能够执行精细物理任务的机器人,这一转变表明DeepMind正在逐步解决机器人领域最大挑战:如何让机器人将人工智能认知转化为现实世界中的精准动作。

泛化能力大幅提升

DeepMind表示,新推出的Gemini Robotics系统展现出更强的泛化性——即执行未经专门训练的新任务的能力,其表现远超此前的AI模型。公司称,Gemini Robotics在全面泛化基准测试中的表现“较同类最优模型性能提升超过两倍”。这种泛化能力至关重要,意味着机器人未来可无需针对每个场景专门训练即可适应新情境,甚至能在不可预测的真实世界环境中运行。

这点尤其重要,因为目前人们对人形机器人的实用性和能力仍有疑虑。去年10月份,特斯拉高调演示Optimus Gen 3人形机器人,宣称能完成多项物理任务,但有几台机器人被证实是由人工远程操控的,这使得人们对特斯拉自主人工智能的实际能力表示担忧。

谷歌则试图打造真正的“通用型机器大脑”。为此,谷歌宣布与总部位于得克萨斯州奥斯汀的Apptronik合作,基于Gemini 2.0构建下一代人形机器人。尽管这一模型主要在双机械臂平台ALOHA 2上进行训练,但谷歌表示,Gemini Robotics可用于控制不同类型的机器人,其中包括Franka机械臂以及类似于Apptronik Apollo人形机器人等更复杂的系统。

虽然人形机器人这一应用对于谷歌基于大语言模型的生成式人工智能来说较为新颖,但值得玩味的是,谷歌早在2013至2014年间就曾收购过几家机器人公司,其中还有打造出知名人形机器人的波士顿动力(Boston Dynamics,现属于现代集团),不过后来又悉数出售。此次与Apptronik开展的新合作,似乎是谷歌在探索人形机器人领域的新尝试,而非此前战略的延续。

其他公司也在紧锣密鼓地研发人形机器人硬件,比如Figure AI在2024年3月份为自家人形机器人筹得大额融资,前Alphabet子公司波士顿动力则在去年4月份推出一款灵活的新型Atlas机器人。但迄今为止,业界尚未出现真正能使机器人实用化的人工智能控制系统。谷歌还宣布,通过“可信测试者”计划向波士顿动力、Agility Robotics 和 Enchanted Tools等公司有限开放Gemini Robotics-ER的使用权限。

安全性与局限性

在安全性方面,谷歌提到采用“多层次、整体性的策略”,保留防碰撞和力度限制等机器人传统安全机制。公司还受阿西莫夫“机器人三定律”的启发,推出“机器人宪法”框架,并在此基础上发布了ASIMOV安全数据集,帮助研究人员评估机器人行为的安全性影响。

全新的ASIMOV数据集表明谷歌希望通过标准化方法来评估机器人安全性,不仅仅局限于防止物理伤害。这一数据集旨在帮助研究人员测试人工智能模型对机器人在不同场景中行为后果的认知能力。根据谷歌公告,ASIMOV数据集将“帮助研究人员在真实世界场景中严谨衡量机器人行动的安全性影响。”

谷歌并未宣布新模型的可用性时间表或商业应用层面的具体计划,目前这些模型仍处于研究阶段。尽管谷歌发布的演示视频展示了人工智能的惊人进步,但在控制环境下的实验仍然难以完全反映这些系统在现实世界中的真实表现。(辰辰)

相关推荐
热点推荐
中国外交官已全部离开立陶宛,立总理对华递交建议书,想重建关系

中国外交官已全部离开立陶宛,立总理对华递交建议书,想重建关系

律便利
2025-07-03 15:20:03
74岁老汉上山采药救下怀孕母狼,当晚院中阵阵狼嚎,打开门后慌了

74岁老汉上山采药救下怀孕母狼,当晚院中阵阵狼嚎,打开门后慌了

温情邮局
2025-12-05 15:21:29
马竞天坑球员 7200万欧引进 现身价200万欧 外租赫罗纳8场0球

马竞天坑球员 7200万欧引进 现身价200万欧 外租赫罗纳8场0球

智道足球
2025-12-14 17:33:39
光刻机巨头开始慌了,中国造不成光刻机,但是要造一个光刻工厂

光刻机巨头开始慌了,中国造不成光刻机,但是要造一个光刻工厂

井普椿的独白
2025-12-14 18:40:49
A股:股民听我一句劝,周末突发两大利好,下周将迎大级别行情?

A股:股民听我一句劝,周末突发两大利好,下周将迎大级别行情?

夜深爱杂谈
2025-12-14 16:29:17
气愤!英媒公开贬低中国足球:充满劣根性,只会给球队带来灾难

气愤!英媒公开贬低中国足球:充满劣根性,只会给球队带来灾难

国足风云
2025-12-14 16:09:07
一个军走出三位大区司令,连警卫员都干到正国级,老军长见面却只喊他小王

一个军走出三位大区司令,连警卫员都干到正国级,老军长见面却只喊他小王

老杉说历史
2025-12-11 19:56:06
罕见!重庆江北机场,客流负增长!

罕见!重庆江北机场,客流负增长!

民航之翼
2025-12-13 17:57:16
偌大的海南岛面积足有3.4万平方公里,为啥却少有大型港口呢?

偌大的海南岛面积足有3.4万平方公里,为啥却少有大型港口呢?

向航说
2025-12-12 00:40:02
妻子从情夫家被送进ICU,医生催签字,我拨通了她爸妈的电话

妻子从情夫家被送进ICU,医生催签字,我拨通了她爸妈的电话

张道陵秘话
2025-12-12 10:59:13
1只就判刑! 青岛一家艺术中心杀3只, 做菜卖给客人

1只就判刑! 青岛一家艺术中心杀3只, 做菜卖给客人

万象硬核本尊
2025-12-14 18:22:32
脑梗的源头被查出,肥肉没上榜,第1名很多人可能每天都在吃!

脑梗的源头被查出,肥肉没上榜,第1名很多人可能每天都在吃!

全球军事记
2025-11-29 13:46:37
CBA新赛季!广东队4名球员,令人无比期待

CBA新赛季!广东队4名球员,令人无比期待

体育哲人
2025-12-14 17:15:38
哪个瞬间你秒懂了别人暗示?网友:医生暗示男孩就说脑壳有点大

哪个瞬间你秒懂了别人暗示?网友:医生暗示男孩就说脑壳有点大

带你感受人间冷暖
2025-12-13 00:15:04
河南天气大转折,新一轮雨雪过程酝酿中!河南未来三天天气详情

河南天气大转折,新一轮雨雪过程酝酿中!河南未来三天天气详情

夜深爱杂谈
2025-12-14 16:27:45
扎哈罗娃:俄罗斯对欧盟报复行动很快就到

扎哈罗娃:俄罗斯对欧盟报复行动很快就到

参考消息
2025-12-14 11:24:04
四川2名干部任代理市(区)长

四川2名干部任代理市(区)长

金台资讯
2025-12-14 15:38:20
为什么反感满清的情绪,会在今天突然集中爆发?

为什么反感满清的情绪,会在今天突然集中爆发?

西域都护
2025-12-13 23:55:19
万达:年底前还有8座万达广场开业

万达:年底前还有8座万达广场开业

观点机构
2025-12-14 17:52:05
为何翁帆那么怀念杨振宁,原因在一个称呼上,比老公、丈夫更深情

为何翁帆那么怀念杨振宁,原因在一个称呼上,比老公、丈夫更深情

以茶带书
2025-12-14 14:20:53
2025-12-14 20:12:49

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

体育要闻

马刺终结雷霆:以勇猛,以文班亚马

娱乐要闻

何晴生前最大谣言!没有再婚嫁廖京生

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

教育
旅游
健康
手机
公开课

教育要闻

必看!华南理工考点(4414)应试须知!

旅游要闻

“来宜泸耍一路”走进成都社区 百万粉丝达人带你“尝鲜”川南风味

甲状腺结节到这个程度,该穿刺了!

手机要闻

别急着更新iOS 26.2正式版:升级体验后,不吐不快!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×