网易首页 > 网易号 > 正文 申请入驻

给波士顿动力机器狗装上ChatGPT后,会发生什么?

0
分享至

波士顿动力的「大黄狗」Spot 可以说是网红机器人的典范。

会巡逻、会搬砖、会跳舞 Spot 自诞生以来就吸引了全世界机器人爱好者的目光,谁能拒绝像这样一条动作灵活、姿态憨厚,还会卖萌的机器狗呢。

经过多年的发展,卖萌已经不再是 Spot 的「主业」,根据波士顿动力的介绍,Spot 现在能帮助人类完成一些特定场景下的工作,例如在跨洋轮船上检测仪表、参与地势复杂的勘测或救援工作等等。

如果给 Spot 这么灵活的身躯,装上一个像 ChatGPT 这么聪明的大脑,会发生什么?

人工智能专家 Santiago Valdarrama 还真做出来了这么一条拥有「最强大脑」的 Spot。

用 ChatGPT 大幅简化人机交互

Santiago 在 Twitter 上分享了他与改造版 Spot 互动的视频,这可能是史上第一条会讲话、会聊天的机器狗。

在演示视频中可以看到,Spot 并不仅仅是装了个「Siri」那么简单,当它在回答人类问题时,它的身体也会随着语句的内容和语调一起摆动,看上去就像是科幻片中的 Wall-E 走进了现实。

当你问到一些「Yes Or No」的简单问题时,它还会用「点头」「摇头」等身体语言代替语音来回答你,由此可见 Spot 远不是内置了一个智能音箱那么简单。

接入 ChatGPT 后,Spot 最大的变化就是听得懂人话,并且能够和使用者用自然语言交流。

Santiago 演示了一个场景,他跟 Spot 说因为它太碍事导致房间太拥挤了,让它往后稍稍,话音刚落 Spot 就理解了 Santiago 的意思,往后退了几步。

怎么样,是不是已经有科幻电影中呼唤机器人工作那味了。

过去操作 Spot 需要用类似无人机的大型遥控器或者用电脑输入复杂的指令,而现在 ChatGPT 的加入赋予了 Spot 强大的自然语言理解能力,动动嘴就能与机器人交互。

在这个过程中,ChatGPT 担任了人类与机器人之间的翻译,把人类输入的「人话」变成机器能看懂的指令,再把机器人的反馈用实际行为或者「人话」表达出来。

Santiago 介绍,他们把 Spot 的文件输进了 ChatGPT,并向其解释了文件的结构以及如何读取这个文件,从而实现了与 Spot 语音对话和操作。

操作员与 Spot 之间的交互被大幅简化,人们可以直接问它:「你的电量还有多少?」,然后 Spot 就会用语音的方式回答,这其中用到了 Google 文字转语音的技术,再把 ChatGPT 的答复经 Spot 的「口」讲出来。

Spot(或者说内置的 ChatGPT)会根据实际情况来回答问题,例如当你问它接下来要完成什么任务时,它会根据设定好的任务列表来作答,这在很大程度上避免了 ChatGPT 编造事实的情况。

当操作者给 Spot 下达像转向 90 度、前进 1 米这样的命令时,Spot 会联动内部的传感器和定位系统,精准地响应这些命令,不会说因为「大脑过于发达」而失去控制。

有趣的是,当你问它「你是谁?」的问题时,它会回答「我是 OpenAI。」,而不是机器狗 Spot。

Santiago 所在的公司 Levatas 是一家与波士顿动力合作的 AI 公司,专门帮助企业探索如何利用机器人解决实际问题的解决方案。

Santiago 认为,给 Spot 装上 ChatGPT 最大的实际意义,是把原本只有技术人员才能处理的复杂数据变成了任何人都能看得懂、听得懂的自然语言。

机器人每次在执行任务前,都要输入冗长的指令集;在结束工作后,还会产生大量的数据,只有最专业的技术人员才能从这些数据中分析出问题。

但现在通过 ChatGPT,简单的两句话就能搞定。

当机器人的操作门槛变低之后,机器人的使用场景就会随之变得丰富起来。

AI 大模型的潜力不容小觑

「最强大脑」版 Spot 并不是一蹴而就的,在一个月前,Santiago 曾发布一个视频介绍了一条能「听懂人话」的 Spot,其用到的是 OpenAI 另一个重要 AI 模型 Whisper。

在这个「初版」智能 Spot 中,Santiago 更详细地介绍了其中的原理:

Whisper 可以高效地把语音实时转换成文字,转换的正确率和速度都非常可观。通过把 Whisper 与 Spot 的 SDK 结合在一起,它可以从人类说的话中提取关键文字,然后通过 SDK 向 Spot 发送命令。

只需要向它说句话,就可以让 Spot 离开充电坞,起身去检查仪表是否出现问题,大大降低了人类的操作成本。

Santiago 的实践从一个很好的角度回答了一个被广泛讨论的问题:ChatGPT 一类的大语言模型到底有什么意义?

一开始,人们认为 ChatGPT 就是一个单纯文本生成式 AI,它有着比较强的自然语言理解能力,可以写文章、写报表,虽然不那么靠谱,但也算惊艳。

后来人们发现只要给 ChatGPT 恰当的指令,它可以代替人类自动得完成编程或者文字处理等工作,犹如一台基于自然语言运转的计算机。

OpenAI 发布了插件集功能后,ChatGPT 可以与许多互联网的应用结合在一起,把很多跨平台的操作用对话整合在了一起,变成了互联网的新入口。

微软发布的 Copilot 则启发了人们对下一阶段人机交互的想象:图形操作界面并不一定是永远合理的范式,许多我们习以为常的操作都可以被对话代替。

再回到 Spot 上时,我们就能比较清晰地看出大语言模型的意义:简化人机交互,赋予机器人更高级的智能。

无论是把 ChatGPT 当作新的互联网入口,还是当作控制具备学习能力、问题分析能力和执行高精度操作能力的工业机器人的遥控器,本质上都是把复杂的指令集变成自然语言,降低操作成本。

这种赋能将使未来的工业机器人不仅仅成为指令执行的工具,更能具备与人类大脑相当的智能水平。

就像图形界面把复杂的命令行变成了一个个直观的图标,现在点按不同图标的复杂操作又变成了一句简单的话,人类正在从图形用户界面走向一个新的阶段:自然语言用户界面。

在这个阶段,大语言模型将成为工业机器人的关键技术,它将简化人机交互,提高生产效率,进一步推动人类社会的科技发展。

并且在某些情况下,语言模型在理解语言时甚至会比人类表现得更好。普林斯顿大学的教授 Arvind Narayanan 在他一篇博客中提到了他的一个亲身案例。

Arvind Narayanan 为 ChatGPT 接上了语音交互,给自己快要四岁的女儿使用。就和所有孩子一样,他的女儿也充满好奇心,经常问 ChatGPT 各种问题。

让他感到意外的是,当他告知 ChatGPT 它在和一位小朋友说话时,ChatGPT 变得很善于表达同理心。

女儿:「关灯后会发生什么事?」 ChatGPT:「关了灯之后,会变得很黑,也可能会有点让人害怕。但不用担心!有很多东西能帮助你在黑暗中感到安全和舒适。」

《彭博社》专栏作家 Parmy Olson 指出,微软和 Google 都忙着把大模型用在搜索引擎上,但却没看到,和作为一个事实提供者相比,ChatGPT 更合适做情感陪伴者。

Olson 还让 ChatGPT 去做了情商测试,结果居然比她自己和同事都好。正因为 ChatGPT 是用网络上文字素材训练的,数据中会有大量错误信息,但这也让它更善于模仿共情。

这些案例都充分说明了,大语言模型对自然语言的理解能力其实有着很大的应用潜力。

借助如此强大的理解能力,我们可以利用大语言模型真正实现又一次的人机交互革新,同时大语言模型的出现为机器人的发展带来了新的可能性。

大语言模型可以让机器人可以更好地理解和处理指令,更快地学习和适应新的任务和环境。

《纽约客》在封面文章 《黑暗工厂》(Dark Factory)中提到,目前工业机器人一个共同的难点,就是设计一个像人手一样的「末端执行器(end effector)」,让机器人能以不同的力度抓取大小形状各异的物体。

如果这个技术难题得到解决,机器人能完成更多精细的工作,很多领域自动化的程度也会大大提高。比如各种水果的采摘可以实现自动化,富士康的流水线也不再需要这么多工人了。

未来的工业机器人不仅仅应该是指令执行的工具,更应具备与人类大脑相当的智能水平,具备学习能力、问题分析能力和执行高精度操作的能力。

在工业生产线上,「肌肉发达」的工业机器人更加灵活高效,能够更好地应对各种生产问题,提高生产效率和质量。例如,在汽车制造领域,大语言模型可以为机器人赋予更强的智能和认知能力,使其能够更好地完成多样化的任务。

在医疗机器人领域,机器人可以通过自然语言处理技术与医生和病人进行交流,提供更好的医疗服务。

大语言模型为机器人行业带来了一颗强大的大脑,为机器人创造了出更泛化的应用场景,这很有可能会成为第四次工业革命的技术核心。而「语音版」Spot,便是这场技术变革迸发出的第一缕火花。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

萌神木木
2025-11-09 20:07:33
孙悦:湖人包机我坐科比旁边,因为那是队友挑剩下的位置

孙悦:湖人包机我坐科比旁边,因为那是队友挑剩下的位置

懂球帝
2025-11-10 09:14:37
特朗普41岁次子讲述原生家庭:父亲定下六不准,母亲“又美又凶”

特朗普41岁次子讲述原生家庭:父亲定下六不准,母亲“又美又凶”

法老不说教
2025-11-07 15:24:59
第二个“恒大”出现!年营收7000亿,曾经是广东第一大民企

第二个“恒大”出现!年营收7000亿,曾经是广东第一大民企

墨印斋
2025-11-08 15:28:54
数百人在内蒙古一菜地“免费摘白菜”,菜农损失近百万,知情人:有少数人还钱菜农没收

数百人在内蒙古一菜地“免费摘白菜”,菜农损失近百万,知情人:有少数人还钱菜农没收

潇湘晨报
2025-11-09 12:43:19
笑不活!湖南一女生在商场上厕所,看到穿裙子的标志,就冲了进去

笑不活!湖南一女生在商场上厕所,看到穿裙子的标志,就冲了进去

火山诗话
2025-11-10 07:29:48
低价“银行直供房”激增,有房产低于市价25%

低价“银行直供房”激增,有房产低于市价25%

第一财经资讯
2025-11-09 22:19:17
2-1!日本爆大冷:掀翻欧洲冠军+7分夺小组头名,世少赛20队出线

2-1!日本爆大冷:掀翻欧洲冠军+7分夺小组头名,世少赛20队出线

侃球熊弟
2025-11-10 03:37:42
长沙不雅视频后续!女医生同款睡裙超22万人购买,幕后偷拍者曝光

长沙不雅视频后续!女医生同款睡裙超22万人购买,幕后偷拍者曝光

壹月情感
2025-11-09 18:01:35
朱元璋为啥不愿传位给朱棣?史学家:其实谁都可以,唯独朱棣不行

朱元璋为啥不愿传位给朱棣?史学家:其实谁都可以,唯独朱棣不行

掠影后有感
2025-11-10 08:02:51
“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄 丨封面头条

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄 丨封面头条

封面新闻
2025-11-09 18:45:20
医院17分钟视频瓜后续,疑似因吃醋被偷拍,女方与前夫合影被扒

医院17分钟视频瓜后续,疑似因吃醋被偷拍,女方与前夫合影被扒

大双
2025-11-09 22:52:39
联盟第一!雷霆19分逆转灰熊达成10胜 亚历山大35+7+6

联盟第一!雷霆19分逆转灰熊达成10胜 亚历山大35+7+6

醉卧浮生
2025-11-10 09:24:08
京东第一辆车,价格定了

京东第一辆车,价格定了

扬子晚报
2025-11-09 20:34:08
雷军这回栽了,小米法务被这个女人拿捏,太打脸

雷军这回栽了,小米法务被这个女人拿捏,太打脸

公子麦少
2025-11-07 14:39:17
烟台宝马车女司机死得太惨!知情人:家里有小朋友在等她下班回家

烟台宝马车女司机死得太惨!知情人:家里有小朋友在等她下班回家

魔都姐姐杂谈
2025-11-09 20:05:54
高市早苗疯言台湾问题,日本国内有人惊恐万状!

高市早苗疯言台湾问题,日本国内有人惊恐万状!

新民晚报
2025-11-10 10:18:20
31岁女子为嫁高富帅与母亲互殴,女主鞠躬道歉:他出轨了,卖房钱都给他了

31岁女子为嫁高富帅与母亲互殴,女主鞠躬道歉:他出轨了,卖房钱都给他了

潇湘晨报
2025-11-10 11:00:20
藏不住了!刘涛台球桌造型惊艳全网,她的魅力勾魂顶不住!

藏不住了!刘涛台球桌造型惊艳全网,她的魅力勾魂顶不住!

喜欢历史的阿繁
2025-11-10 10:30:24
九江一架风力发电机叶片空中断裂,目击者称“玻璃纤维满天飞”,当地:正在处理

九江一架风力发电机叶片空中断裂,目击者称“玻璃纤维满天飞”,当地:正在处理

极目新闻
2025-11-10 11:38:48
2025-11-10 12:16:49
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
37999文章数 2600138关注度
往期回顾 全部

科技要闻

存储芯片大厂涨价50%!华强北一天一个价

头条要闻

牛弹琴:特朗普宣布要发钱了 每个美国人至少2000美元

头条要闻

牛弹琴:特朗普宣布要发钱了 每个美国人至少2000美元

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

郝蕾风波升级?

财经要闻

俄罗斯大幅加税 中国汽车出口骤降58%

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

家居
健康
数码
游戏
本地

家居要闻

现代自由 功能美学居所

超声探头会加重受伤情况吗?

数码要闻

显卡自由:四块RTX 5090组装主机!几乎占据整个机箱

沙盒模拟RPG《历史的终结》12月登陆SteamEA

本地新闻

这届干饭人,已经把博物馆吃成了食堂

无障碍浏览 进入关怀版