网易首页 > 网易号 > 正文 申请入驻

波士顿动力狗gogo回来了!“五条腿”协同发力

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

机器狗搬轮胎,“五只腿”齐发力!



波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。

搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。

而且,搬起轮胎后,它还能将轮胎滚动到指定位置。



甚至还能把一个轮胎叠到另一个轮胎上面(还会用头帮忙顶一下)。



这一方法克服了传统操作策略(如摇操)在不同机器人形态学结构上的迁移限制,并通过分层控制实现了机器狗四肢与全身的协调动力学操作。



网友表示,狗子快去回收站去搬轮胎吧!



这是怎么做到的?

结合采样与学习的动态全身操作

总的来说,结合采样与学习的动态全身操作(Combining Sampling and Learning for Dynamic Whole-Body Manipulation)利用强化学习与基于采样的控制(sampling-based control)相结合的方法,使机器人能够执行需要手臂、双腿和躯干协同配合的动态力交互任务。

为应对复杂的操作任务,研究采用了分层控制(hierarchical control)方法,将控制问题划分为两个互补且同步的层级。

在低层,基于强化学习的运动策略直接控制电机力矩,以实现平衡、稳定性与运动执行。

高层控制则根据任务类型而有所不同:

  • 对于轮胎扶正、拖拽与堆叠等任务,系统采用基于采样的控制,通过模拟潜在的未来情境来发现最优操作策略。
  • 对于轮胎滚动任务,则使用强化学习来捕捉维持物体稳定运动所需的细微动力学特征与反应性控制机制。

所有的高层方法,最终都会输出包括底盘速度、姿态参数(包括滚转、俯仰、高度 )、腿部控制以及手臂动作等指令。

在采样控制中,采样控制器通过并行模拟多个未来情境,寻找最有效的操作策略,从而选择最能实现任务目标的动作。

对于那些需要精确施力和多接触协调的任务,系统会运行32个并行CPU线程,每个线程使用MuJoCo模拟未来几秒内的不同动作序列。



与直接采样原始轨迹不同,研究在样条曲线空间(space of splines)中进行采样,这种方式能生成更平滑、更自然的运动轨迹,同时降低搜索空间的维度。

该控制器展现出源自物理仿真的机会性行为。在轮胎扶正过程中,控制器自主发现了复杂的操作策略:机器人通过Spot Arm与前腿动作的协调,产生足够的杠杆力以抬起沉重的轮胎。

为了适应多样的初始构型,机器人可能使用手臂、前腿、身体,或这些部位的组合来灵活调整操作策略。

值得一提的是,系统并未预设任何固定的操作模式。这种多肢体、多接触的行为,是在采样过程中优化自然涌现的结果,而非通过显式编程设定接触顺序实现的。

此外,控制器会根据实验室空间中机器人与轮胎的当前构型动态调整策略。

在具体的强化学习策略方面,研究通过PPO算法在IsaacLab中训练得到的运动策略。



这一策略为高层控制提供了稳健的低层控制抽象,能够在多种操作场景中保持平衡,从而使高层控制问题更易处理。

在轮胎滚动任务中,研究利用强化学习来应对难以精确建模的复杂摩擦与接触动力学。

其采用非对称演员-评论家(asymmetric actor-critic architecture)方法,在单块GPU上经过约24小时训练,得到高层技能策略。

该策略接收的观测状态包括机器人、轮胎与目标之间的相对姿态,以及关节位置与速度。奖励函数则根据物体几何形状及其与环境的空间关系,计算期望的躯干与末端执行器位置,引导策略学习达到目标姿态。



训练得到的轮胎滚动策略使机器人能够动态调整其躯干与Spot Arm的位置,以稳定控制滚动的轮胎,防止其倾倒,并将其引导至目标位置。

最后,为解决从仿真到现实的差距,训练过程中引入了随机化,包括对物体的质量、摩擦系数与形状等属性进行随机变化。

实测表现

正如我们开头提到的,在轮胎扶正任务中,机器人最佳成绩为3.7秒,平均每个轮胎用时5.9秒,几乎达到人类在该任务中的操作速度。



这一表现远超传统的准静态假设。

在准静态假设下,机器人操作物体时速度很慢,加速度产生的惯性被忽略,关节驱动力矩主要依赖静态平衡。

而在这篇研究中,机器狗能够高效搬运重达15千克的轮胎——远超其夹持器的峰值举升能力(11 千克)和持续能力(5 千克)。

这说明机器人通过动态协调全身动作,将运动与操作紧密耦合,拓展了操作范围,超越了传统的拾取与放置方式。

此外,研究表明,将高层控制与低层控制分离能够显著简化控制问题。

高层控制器无需在拥有数十个自由度的系统中推理关节力矩、接触力以及稳定性约束,而是仅在一个简化的动作空间中工作,该空间由底盘速度和姿态参数构成,其将执行细节交由运动控制器处理,从而极大降低了复杂度。

分层控制架构使得高层控制器能够专注于任务完成,而无需显式地推理平衡约束或地面接触。

由此,学习得到的运动抽象层让高层控制更简单、计算更可行,控制器只需专注于“在哪里”和“如何操作物体”,无需处理复杂的低层动力学细节。

[1]https://rai-inst.com/resources/blog/combining-sampling-and-learning-for-dynamic-whole-body-manipulation/

[2]https://x.com/rai_inst/status/1978113805604258161

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙产电影《寻秦记》爆火 上映三天票房过亿

浙产电影《寻秦记》爆火 上映三天票房过亿

农城浪子
2026-01-13 16:12:35
59岁女子诞下4斤4两男婴:大女儿定居国外,我和丈夫常感到寂寞……

59岁女子诞下4斤4两男婴:大女儿定居国外,我和丈夫常感到寂寞……

都市快报橙柿互动
2026-01-13 12:22:41
追觅科技俞浩叫板黄仁勋,他们毕竟老了,追觅生态将做到一百万亿美金!

追觅科技俞浩叫板黄仁勋,他们毕竟老了,追觅生态将做到一百万亿美金!

娱乐八卦木木子
2026-01-13 11:01:45
广东双杀劲敌登顶积分榜!胡明轩爆发,奎因手冷,郭昊文空砍20分

广东双杀劲敌登顶积分榜!胡明轩爆发,奎因手冷,郭昊文空砍20分

萌兰聊个球
2026-01-13 21:44:05
宋美龄价值2亿的麻花手镯,戴到离世:第一任主人仅花费4万大洋

宋美龄价值2亿的麻花手镯,戴到离世:第一任主人仅花费4万大洋

史之铭
2026-01-13 22:55:09
特朗普计划“斩首”哈梅内伊!伊朗称24小时研发核弹?

特朗普计划“斩首”哈梅内伊!伊朗称24小时研发核弹?

项鹏飞
2026-01-12 19:41:25
穆帅弟子成为皇马新主帅,皇马新帅执教风格,与穆帅一样

穆帅弟子成为皇马新主帅,皇马新帅执教风格,与穆帅一样

福酱的小时光
2026-01-13 15:56:40
一场闹剧!邦本宜裕重签辽宁铁人,延边龙鼎成唯一“受害者”

一场闹剧!邦本宜裕重签辽宁铁人,延边龙鼎成唯一“受害者”

体坛鉴春秋
2026-01-13 22:51:03
闫学晶彻底栽了,最惨的不是她,也不是她儿子,是一个没关联的人

闫学晶彻底栽了,最惨的不是她,也不是她儿子,是一个没关联的人

阿废冷眼观察所
2026-01-14 02:08:16
知名童星刚满18就立即加入OnlyFans,一天赚290万美元

知名童星刚满18就立即加入OnlyFans,一天赚290万美元

随波荡漾的漂流瓶
2026-01-11 18:03:40
剧终!南京博物院 剧本只能写到省委调查组进驻西康宾馆

剧终!南京博物院 剧本只能写到省委调查组进驻西康宾馆

八斗小先生
2025-12-24 09:47:17
相恋八周年纪念日,女友在陪初恋 ,我不哭不闹提分手,她却慌了

相恋八周年纪念日,女友在陪初恋 ,我不哭不闹提分手,她却慌了

夜色醉人故事集
2024-11-04 17:55:02
52票赞成47票反对!美投票结果刚出来,特朗普下令出兵?俄英失声

52票赞成47票反对!美投票结果刚出来,特朗普下令出兵?俄英失声

环球报姐
2026-01-13 13:31:58
特大新闻!中国4艘舰艇抵达美国家门口!俄:只有中国能让美沉默

特大新闻!中国4艘舰艇抵达美国家门口!俄:只有中国能让美沉默

爱吃醋的猫咪
2026-01-12 21:58:17
合川杀猪饭刚结束,榜一大哥坐不住了,上门邀请呆呆参加公司活动

合川杀猪饭刚结束,榜一大哥坐不住了,上门邀请呆呆参加公司活动

天天热点见闻
2026-01-13 12:31:28
办公室来了个挂职副书记,3个月后他走前突然对我说:保重

办公室来了个挂职副书记,3个月后他走前突然对我说:保重

星宇共鸣
2026-01-10 09:32:29
取消2万亿出口退税,这一次我站胡锡进

取消2万亿出口退税,这一次我站胡锡进

冰川思想库
2026-01-13 12:10:22
事件升级!司晓迪晒开房记录,16个男顶流被锤!内娱彻底玩完

事件升级!司晓迪晒开房记录,16个男顶流被锤!内娱彻底玩完

情感大头说说
2026-01-14 00:01:15
香烟新助燃剂引发争议,涨价背后真相曝光

香烟新助燃剂引发争议,涨价背后真相曝光

老特有话说
2026-01-12 19:10:22
性生活不伤肾,豆制品不伤肾,真正伤肾的事一再被你忽略!30条建议送给肾友们

性生活不伤肾,豆制品不伤肾,真正伤肾的事一再被你忽略!30条建议送给肾友们

掌上肾医
2026-01-12 19:16:03
2026-01-14 03:24:49
量子位 incentive-icons
量子位
追踪人工智能动态
12011文章数 176358关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

特朗普:已取消所有与伊朗官员的会谈

头条要闻

特朗普:已取消所有与伊朗官员的会谈

体育要闻

他带出国乒世界冠军,退休后为爱徒返场

娱乐要闻

蔡卓妍承认新恋情,与男友林俊贤感情稳定

财经要闻

"天量存款"将到期 资金会否搬入股市?

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

数码
教育
艺术
本地
公开课

数码要闻

PC硬件全线涨价?这几款RTX 50系游戏本竟敢“逆势”维持原价

教育要闻

江苏模特艺术学校在哪?精准地址揭秘!

艺术要闻

461米!14亿美元!越南第一高楼,形如“竹捆”

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版