网易首页 > 网易号 > 正文 申请入驻

波士顿动力与谷歌DeepMind携手赋予Spot推理能力

0
分享至


机器人技术令人惊叹,却也令人沮丧——它们几乎能完成你交代的任何任务,前提是你得以正确的方式下达指令。不久前,"正确方式"意味着编写代码。尽管我们已经摆脱了那种僵化的限制,但易用性与任务复杂度之间仍然存在一种令人头疼的反比关系。

AI曾承诺改变这一现状。其核心理念在于:当AI被具身化地植入机器人——赋予AI软件一个存在于现实世界的物理载体——这些机器人便将具备推理与理解能力。这仍属前沿领域,尽管我们已在研究场景中见到了大量具身AI的案例,但要找到能让推理型机器人稳定创造商业价值的应用场景并不容易。波士顿动力是少数几家能在一定规模上实现腿式机器人商业化部署的公司之一,目前已有数千台机器人投入实际运营。近日,该公司宣布其四足机器人Spot正式搭载谷歌DeepMind的Gemini Robotics-ER 1.6——这是一款高级具身推理模型,为复杂任务带来了更强的可用性与智能化水平。

尽管相关视频展示的是Spot在家庭场景中的表现,但此次合作的核心聚焦于腿式机器人少数已被证明具有商业可行性的应用领域之一:巡检。也就是说,在工业设施中四处游走,确认没有任何东西处于即将失控的危险状态。搭载新AI后,Spot现在能够自主识别危险碎片或泄漏物,读取复杂的仪表和液位计,并在需要理解周围环境时调用视觉-语言-动作模型等工具。

波士顿动力Spot业务副总裁兼总经理Marco da Silva在一份新闻稿中表示:"Gemini Robotics ER 1.6等技术的进步,标志着机器人在更好地理解和运作于物理世界方面迈出了重要一步。仪表读取和更可靠的任务推理等能力,将使Spot能够完全自主地感知、理解并应对现实世界中的各种挑战。"

"推理"和"理解"这两个词越来越频繁地被用于AI和机器人领域,但正如丰田研究院的Gill Pratt近期指出的那样,这些词对机器人在实际中意味着什么,并不总是清晰的。谷歌DeepMind机器人业务负责人Carolina Parada在接受采访时解释说:"我们衡量理解能力的基准是:系统给出的回答应当与人类的反应一致。"要让机器人可靠、安全地执行任务,机器人对世界的理解方式与人类保持一致至关重要。否则,人类给机器人下达的指令与机器人实际执行任务的方式之间,可能会出现偏差。

波士顿动力的演示视频就是一个潜在问题的典型案例。其中一条指令是让Spot"回收客厅里的易拉罐"。从视频来看,它完成了任务,但在执行过程中是横向夹持易拉罐的——如果罐内还有残余液体,后果可想而知。人类会凭借多年的生活经验自然而然地避免这种情况,但机器人目前尚不具备这类世界常识。

Parada表示,Gemini Robotics-ER 1.6会从安全的角度处理类似情况。"如果你让机器人给你端杯水,它会推理出不能把水杯放在桌子边缘,以免摔落。我们通过ASIMOV基准来追踪这一能力,其中包含大量以自然语言描述的、机器人不应做的事情示例。"当前版本的Spot在操作过程中尚未启用这些语义安全模型,但未来计划让其在持握物体时具备相应的安全推理能力。

Gemini Robotics-ER 1.6作为机器人高级推理模型,与机器人本身作为物理世界接口之间,目前似乎仍存在一定脱节。1.6版本的新功能之一是"成功检测",该功能整合多个摄像角度,以更可靠地判断Spot是否已成功抓取物体。如果完全依赖视觉来完成物体交互,这无疑是个好方案;但机器人其实还有许多成熟的抓取成功检测方式,例如触觉传感器和力传感器,而1.6版本目前并未使用这些手段。这背后的原因,折射出机器人领域尚未攻克的一个根本难题:如何在需要物理数据的情况下训练模型。

Parada解释说:"目前,这些模型严格来说只支持视觉输入。网络上有大量关于如何拾取一支笔的视觉信息。如果我们拥有足够多的触觉数据,完全可以学习这项技能,但互联网上几乎没有触觉传感相关的数据。"使用Spot新巡检功能的客户将被要求与波士顿动力共享数据,这正是获取此类数据的来源之一。

拥有付费客户这一事实,使波士顿动力在依赖AI进行商业化部署的腿式机器人领域显得颇为罕见。而这些客户必须能够信任机器人——这在涉及AI时始终是一大难题。da Silva在采访中表示:"我们对此非常重视。我们通过面向少数客户的Beta计划来推出DeepMind的新能力,以了解可能出现的问题,并且只会主动推广那些我们有把握能正常运作的功能。"像Spot这样的机器人需要达到一定的实用门槛,好在现实世界并不苛求完美。da Silva说:"设施中大多数关键基础设施都会配备仪表来告知你是否出现了问题。但也有很多未被仪表监测的地方,一旦疏忽同样可能引发故障。我们发现,80%以上的准确率是让用户不会感到烦躁的门槛。低于这个水平,机器人基本上就像在'狼来了',操作人员会开始无视它。"

da Silva与Parada都认为,机器人巡检领域仍有大量改进空间。正如Parada所指出的,Spot作为可规模化商业平台的独特地位,为探索Gemini Robotics-ER 1.6等模型如何发挥最大价值提供了宝贵机会,并可将这些经验应用于其他具身AI平台,包括波士顿动力的Atlas。这是否意味着Atlas将成为下一代工业巡检机器人?大概不会。但如果这些来自真实世界的经验能让我们离安全可靠、能够收拾衣物、遛狗、且不会弄得一团糟地清理易拉罐的机器人更近一步,那确实值得所有人为之期待。

Q&A

Q1:Gemini Robotics-ER 1.6是什么?它给Spot带来了哪些新能力?

A:Gemini Robotics-ER 1.6是谷歌DeepMind开发的高级具身推理模型。搭载该模型后,Spot能够自主识别危险碎片或泄漏物、读取复杂工业仪表和液位计,并在需要时调用视觉-语言-动作模型来理解周围环境,从而在工业设施巡检中实现更高程度的自主操作。

Q2:Spot在执行任务时如何保证安全性?

A:Gemini Robotics-ER 1.6从安全角度出发设计了推理机制,例如不会将水杯放在容易摔落的桌边。谷歌DeepMind通过ASIMOV基准进行追踪,该基准包含大量自然语言描述的"机器人不应做的事"。不过,当前版本的Spot在物体操作方面尚未完全启用语义安全模型,这一功能计划在未来版本中加入。

Q3:为什么Spot目前只依赖视觉传感器,而不使用触觉或力传感器?

A:主要原因是训练数据匮乏。互联网上存在大量视觉数据,但触觉传感相关的数据极为稀少,导致模型无法从中学习。为解决这一问题,使用Spot新巡检功能的客户需要向波士顿动力共享使用数据,以帮助逐步积累物理交互数据,支撑未来模型的训练与优化。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李昊又一逆天扑救!门线极限神扑,媒体人狂赞:国足该场场首发

李昊又一逆天扑救!门线极限神扑,媒体人狂赞:国足该场场首发

奥拜尔
2026-04-17 19:24:25
2-0!1-1!中超太刺激,升班马三连胜挡不住,山东泰山主场又丢分

2-0!1-1!中超太刺激,升班马三连胜挡不住,山东泰山主场又丢分

小徐讲八卦
2026-04-18 05:57:03
建国曝汪小菲猛料,全和S家有关,张兰傻眼,马筱梅痛哭真相大白

建国曝汪小菲猛料,全和S家有关,张兰傻眼,马筱梅痛哭真相大白

萌姐
2026-04-16 22:55:50
3-0横扫!意甲领头羊踢疯了,领先那不勒斯12分,甩开米兰15分

3-0横扫!意甲领头羊踢疯了,领先那不勒斯12分,甩开米兰15分

足球狗说
2026-04-18 04:46:28
中国建筑中标阿联酋首个高铁项目

中国建筑中标阿联酋首个高铁项目

GA环球建筑
2026-04-17 22:16:10
胡锡进给沃尔沃汽车做广告,评论区全翻车了……

胡锡进给沃尔沃汽车做广告,评论区全翻车了……

麦杰逊
2026-04-17 11:51:26
采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

千秋文化
2026-04-15 20:18:32
《浪姐7》一公人气排名,乌兰图雅第4,张月第2,冠军评论区沦陷

《浪姐7》一公人气排名,乌兰图雅第4,张月第2,冠军评论区沦陷

娱乐圈笔娱君
2026-04-17 18:07:51
意甲最新积分战报:科莫爆冷3场不胜,国米大胜扩大领先优势

意甲最新积分战报:科莫爆冷3场不胜,国米大胜扩大领先优势

足球狗说
2026-04-18 05:19:43
放弃冰球转行当导演!65岁英达砸数千万培养终成空,英如镝曾喊话内涵巴图

放弃冰球转行当导演!65岁英达砸数千万培养终成空,英如镝曾喊话内涵巴图

喜欢历史的阿繁
2026-04-16 15:40:35
稀土牌打空了?日本公布重大技术突破,对华进口连续两月挂零

稀土牌打空了?日本公布重大技术突破,对华进口连续两月挂零

究竟谁主沉浮
2026-04-17 22:02:25
“阿莫西林”是消炎药?提醒:真正的消炎药只有这2种,别用错了

“阿莫西林”是消炎药?提醒:真正的消炎药只有这2种,别用错了

39健康网
2026-04-16 17:35:53
大瓜!董事长的私生子

大瓜!董事长的私生子

挖掘机007
2026-04-17 20:30:22
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
阿尔斯通股价大跌36%

阿尔斯通股价大跌36%

每日经济新闻
2026-04-17 15:24:39
李宇春咋穿成这样?为艺术献身我真的看不懂!

李宇春咋穿成这样?为艺术献身我真的看不懂!

可乐谈情感
2026-04-18 00:15:49
一朝曼城,终身蓝月!席尔瓦发文告别自由身离队,却遭瓜帅吐槽

一朝曼城,终身蓝月!席尔瓦发文告别自由身离队,却遭瓜帅吐槽

夜白侃球
2026-04-17 10:38:55
台北买房无望,马筱梅吐槽北京房子旧,楼上装修太吵,人设崩塌了

台北买房无望,马筱梅吐槽北京房子旧,楼上装修太吵,人设崩塌了

八斗小先生
2026-04-17 11:14:22
特斯拉 Optimus 人形机器人首批量产机型在上海超级工厂正式交付

特斯拉 Optimus 人形机器人首批量产机型在上海超级工厂正式交付

新浪财经
2026-04-17 17:41:19
有福之人:不是拥有的多,是计较的少

有福之人:不是拥有的多,是计较的少

疾跑的小蜗牛
2026-04-17 22:03:05
2026-04-18 06:28:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17750文章数 49699关注度
往期回顾 全部

科技要闻

7家头部平台被罚没35.97亿元

头条要闻

伊朗拒绝将浓缩铀运往国外 特朗普发声

头条要闻

伊朗拒绝将浓缩铀运往国外 特朗普发声

体育要闻

中超-泰山1-1海港 杨希处子球克雷桑任意球扳平

娱乐要闻

刘德华挚友潘宏彬离世 曾一起租房住

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

又快又稳的开挂动力! 阿维塔06T全系搭分布式电驱

态度原创

亲子
时尚
数码
公开课
军事航空

亲子要闻

谁给女性带来的压力更大——男人还是孩子?

今日热点:许光汉否认和周子瑜恋情;郝熠然与诚实一口终止合作……

数码要闻

库克都没想到:MacBook Neo卖爆了!官网交付已排到5月

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美宣布黎以停火10天 以方称不会撤军

无障碍浏览 进入关怀版