网易首页 > 网易号 > 正文 申请入驻

波士顿动力机器狗搭载谷歌AI,可自主读取仪表数据

0
分享至


波士顿动力公司旗下四足机器人Spot,如今已能在工厂和仓库中自主巡检,并精准读取模拟温度计和压力表上的数值。这一能力的实现,得益于谷歌DeepMind最新发布的机器人AI模型——该模型专为提升机器人在与物理环境交互时的"具身推理"能力而设计。

新模型的核心能力

谷歌DeepMind于4月14日发布的Gemini Robotics-ER 1.6模型,被定位为"面向机器人的高层次推理模型",能够规划并执行复杂任务。此外,该模型还解锁了精准读取压力表等复杂仪器的能力,并支持通过视镜对罐体和管道内部进行可视化检测。这一性能突破,正是谷歌DeepMind与波士顿动力长期合作的成果。

波士顿动力一直致力于在各类工业场所测试四足及人形机器人的实际应用潜力,其中包括母公司现代汽车集团旗下的汽车制造工厂。目前,机器人"犬"Spot正作为巡检机器人在工业设施中开展试验,负责全面巡查。这类巡检任务需要机器人具备"复杂视觉推理"能力,以解读各类仪表盘上的多根指针、液位刻度、容器边界、刻度标记及文字信息。

模型技术解析

为应对上述任务,Gemini Robotics-ER 1.6模型为机器人赋予了"智能体视觉"能力,将视觉推理与代码执行相结合,构建出一个"视觉草稿板",用于检测和处理图像信息。这一智能体视觉能力最早于2026年1月在谷歌Gemini 3.0 Flash模型中引入。

据报道,智能体视觉的引入使机器人在仪表读取任务上的表现大幅提升——从上一代Gemini Robotics-ER 1.5模型的23%跃升至Gemini Robotics-ER 1.6的98%。相比之下,Gemini 3.0 Flash的准确率仅为67%。

值得注意的是,即便不启用智能体视觉,Gemini Robotics-ER 1.6基础版在仪表读取任务中仍能达到86%的准确率。这得益于该模型采用的一种"逐点标注"机制,能够逐一定位图像中的各类元素,从而处理计数或特征识别等复杂任务。同时,该模型还具备增强版"多视角推理"能力,支持机器人整合多路摄像头数据,更全面地理解周围环境。

谷歌DeepMind给出了一个具体性能对比案例:在一张物品杂乱堆放的图像中,Gemini Robotics-ER 1.6能够准确识别锤子、剪刀、画笔、钳子及各类园艺工具的数量;而旧版Gemini Robotics-ER 1.5则无法准确计数锤子和画笔,完全忽略了剪刀的存在,甚至凭空"识别"出了一辆并不存在的手推车——原因仅仅是手推车出现在了任务请求的识别列表中。这表明新版模型的"幻觉"问题有所改善,尽管与人类对环境的理解水平相比,仍存在相当大的差距。

谷歌还将Gemini Robotics-ER 1.6定位为"迄今最安全的机器人模型",称其"大幅提升了对物理安全约束的遵从能力"。该模型不仅能够执行安全指令,还能在处理液体或特殊材料时做出更安全的操作决策。此外,新模型还能更准确地识别不同场景下人体受伤的风险,例如幼童将异物插入电源插座等情况。

未来应用前景

该模型真正的价值,将随着机器人企业和研究人员深度测试其能力而逐步显现。目前,机器人在执行高度专业化、重复性强的任务时效率最高——无论是流水线上的装配作业,还是仓库中高度协同的搬运动作。以谷歌为代表的科技企业正寄望于最新的AI模型,帮助机器人从"专用工具"进化为能够在复杂、非结构化的真实环境中自主运作的"通用劳动者"。当然,这一前景也伴随着更高的风险:一旦出现意外,机器人可能对人类造成伤害或财产损失。

无论如何,这款最新模型或许正在将我们推向一个新的未来——届时,机器人将能够扫描整个房间,并自主作出准确的判断与响应。

Q&A

Q1:Gemini Robotics-ER 1.6模型的仪表读取准确率有多高?

A:Gemini Robotics-ER 1.6在启用智能体视觉后,仪表读取准确率可达98%,相比上一代Gemini Robotics-ER 1.5的23%大幅提升。即使不启用智能体视觉,基础版准确率也能达到86%。作为对比,Gemini 3.0 Flash的准确率仅为67%。

Q2:波士顿动力的Spot机器人在工业场景中主要承担哪些任务?

A:Spot机器人目前主要承担工业设施巡检任务,包括读取压力表、温度计等模拟仪表数值,通过视镜检查罐体和管道内部状态,以及全面巡查工厂运行情况。这类任务要求机器人具备复杂视觉推理能力,能够识别多根指针、液位刻度、刻度标记及文字信息等。

Q3:Gemini Robotics-ER 1.6在安全性方面有哪些改进?

A:谷歌将Gemini Robotics-ER 1.6定位为"迄今最安全的机器人模型",主要改进包括:大幅提升对物理安全约束的遵从能力、在处理液体或特殊材料时能做出更安全的操作决策,以及更准确地识别人体受伤风险,例如能识别幼童将异物插入电源插座等危险场景。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子因噪音过敏住5年隔音舱:自己设计,已接上百个订单,帮噪音受困者找回睡眠

男子因噪音过敏住5年隔音舱:自己设计,已接上百个订单,帮噪音受困者找回睡眠

半岛官网
2026-04-16 11:20:50
大快人心!浙江4057座寺庙,密集关停整顿,网友:乱象早该根治

大快人心!浙江4057座寺庙,密集关停整顿,网友:乱象早该根治

我不叫阿哏
2026-04-16 10:53:56
不出3年,贬值最快的不是现金,是这4样东西,早知道早省钱!

不出3年,贬值最快的不是现金,是这4样东西,早知道早省钱!

老特有话说
2026-04-15 15:15:15
心梗是喝茶喝出来的?医生:即使是铁打的心脏,这几种茶也要少喝

心梗是喝茶喝出来的?医生:即使是铁打的心脏,这几种茶也要少喝

医学原创故事会
2026-04-16 23:44:09
北京首钢VS山东男篮!李楠复出首秀,许利民拒绝输球,央视直播

北京首钢VS山东男篮!李楠复出首秀,许利民拒绝输球,央视直播

体坛瞎白话
2026-04-16 08:36:11
中国向伊朗提供紧急人道主义援助

中国向伊朗提供紧急人道主义援助

新华社
2026-04-16 23:43:04
现场签约!越南对华作出保证,苏林坐上离京高铁,临走前献出重礼

现场签约!越南对华作出保证,苏林坐上离京高铁,临走前献出重礼

孤单是寂寞的毒
2026-04-16 22:21:07
零跑D19卖22万:谁给它的勇气?

零跑D19卖22万:谁给它的勇气?

摸鱼算法
2026-04-16 20:52:14
最大规模!英国宣布:提供12万架

最大规模!英国宣布:提供12万架

环球时报国际
2026-04-16 23:12:26
医院遇丈夫扶女人进产科,正要发火,护士说了一句,我抱丈夫痛哭

医院遇丈夫扶女人进产科,正要发火,护士说了一句,我抱丈夫痛哭

云端书馆
2026-04-15 09:19:50
醒醒吧!就算台湾愿意和平回归,台湾也不可能允许解放军对台驻军

醒醒吧!就算台湾愿意和平回归,台湾也不可能允许解放军对台驻军

小噎论事
2026-04-17 02:23:08
文章的面馆 刚火3天就翻车?遭围观 被差评 跌落神坛的他太难了

文章的面馆 刚火3天就翻车?遭围观 被差评 跌落神坛的他太难了

乡野小珥
2026-04-16 13:48:14
失业第183天,北京户口的隐形代价,非京籍失业者的自救围城

失业第183天,北京户口的隐形代价,非京籍失业者的自救围城

右耳远闻
2026-04-15 16:22:05
解禁复出!你好,李楠!已经等了整整3年

解禁复出!你好,李楠!已经等了整整3年

篮球实战宝典
2026-04-16 23:14:02
坐后座不系安全带,北京一市民晒出罚单!

坐后座不系安全带,北京一市民晒出罚单!

家住东西城
2026-04-16 19:32:29
中国11人进世锦赛,张安达请客,5人小团体聚餐,跟赵心童开玩笑

中国11人进世锦赛,张安达请客,5人小团体聚餐,跟赵心童开玩笑

球场没跑道
2026-04-16 13:43:29
受贿数额特别巨大 湖北省政协原副主席周先旺被提起公诉

受贿数额特别巨大 湖北省政协原副主席周先旺被提起公诉

新京报
2026-04-16 10:04:47
新加坡已经成功预测中美冲突:一旦爆发,美称中国不能攻打美本土

新加坡已经成功预测中美冲突:一旦爆发,美称中国不能攻打美本土

老范谈史
2026-04-17 01:29:33
极氪8X明日上市:明星企业家扎堆试驾

极氪8X明日上市:明星企业家扎堆试驾

大象新闻
2026-04-16 14:29:01
保罗社媒嘲讽快船附加赛出局:他真的死透了

保罗社媒嘲讽快船附加赛出局:他真的死透了

懂球帝
2026-04-17 01:10:12
2026-04-17 05:08:49
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
3306文章数 169关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普宣布黎以将停火后 以军大规模空袭黎巴嫩

头条要闻

特朗普宣布黎以将停火后 以军大规模空袭黎巴嫩

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

艺术
房产
手机
数码
公开课

艺术要闻

你绝对想不到!这幅油画背后的美丽故事!

房产要闻

人人人人!封关后首届消博会,挤爆了!

手机要闻

OPPO Find X10:8000mAh超大电池+双2亿影像,中屏机皇实锤!

数码要闻

荣耀史上最短发布会,发布荣耀史上最强MagicBook数字系列

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版