网易首页 > 网易号 > 正文 申请入驻

波士顿动力狗gogo回来了!“五条腿”协同发力

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

机器狗搬轮胎,“五只腿”齐发力!



波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。

搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。

而且,搬起轮胎后,它还能将轮胎滚动到指定位置。



甚至还能把一个轮胎叠到另一个轮胎上面(还会用头帮忙顶一下)。



这一方法克服了传统操作策略(如摇操)在不同机器人形态学结构上的迁移限制,并通过分层控制实现了机器狗四肢与全身的协调动力学操作。



网友表示,狗子快去回收站去搬轮胎吧!



这是怎么做到的?

结合采样与学习的动态全身操作

总的来说,结合采样与学习的动态全身操作(Combining Sampling and Learning for Dynamic Whole-Body Manipulation)利用强化学习与基于采样的控制(sampling-based control)相结合的方法,使机器人能够执行需要手臂、双腿和躯干协同配合的动态力交互任务。

为应对复杂的操作任务,研究采用了分层控制(hierarchical control)方法,将控制问题划分为两个互补且同步的层级。

在低层,基于强化学习的运动策略直接控制电机力矩,以实现平衡、稳定性与运动执行。

高层控制则根据任务类型而有所不同:

  • 对于轮胎扶正、拖拽与堆叠等任务,系统采用基于采样的控制,通过模拟潜在的未来情境来发现最优操作策略。
  • 对于轮胎滚动任务,则使用强化学习来捕捉维持物体稳定运动所需的细微动力学特征与反应性控制机制。

所有的高层方法,最终都会输出包括底盘速度、姿态参数(包括滚转、俯仰、高度 )、腿部控制以及手臂动作等指令。

在采样控制中,采样控制器通过并行模拟多个未来情境,寻找最有效的操作策略,从而选择最能实现任务目标的动作。

对于那些需要精确施力和多接触协调的任务,系统会运行32个并行CPU线程,每个线程使用MuJoCo模拟未来几秒内的不同动作序列。



与直接采样原始轨迹不同,研究在样条曲线空间(space of splines)中进行采样,这种方式能生成更平滑、更自然的运动轨迹,同时降低搜索空间的维度。

该控制器展现出源自物理仿真的机会性行为。在轮胎扶正过程中,控制器自主发现了复杂的操作策略:机器人通过Spot Arm与前腿动作的协调,产生足够的杠杆力以抬起沉重的轮胎。

为了适应多样的初始构型,机器人可能使用手臂、前腿、身体,或这些部位的组合来灵活调整操作策略。

值得一提的是,系统并未预设任何固定的操作模式。这种多肢体、多接触的行为,是在采样过程中优化自然涌现的结果,而非通过显式编程设定接触顺序实现的。

此外,控制器会根据实验室空间中机器人与轮胎的当前构型动态调整策略。

在具体的强化学习策略方面,研究通过PPO算法在IsaacLab中训练得到的运动策略。



这一策略为高层控制提供了稳健的低层控制抽象,能够在多种操作场景中保持平衡,从而使高层控制问题更易处理。

在轮胎滚动任务中,研究利用强化学习来应对难以精确建模的复杂摩擦与接触动力学。

其采用非对称演员-评论家(asymmetric actor-critic architecture)方法,在单块GPU上经过约24小时训练,得到高层技能策略。

该策略接收的观测状态包括机器人、轮胎与目标之间的相对姿态,以及关节位置与速度。奖励函数则根据物体几何形状及其与环境的空间关系,计算期望的躯干与末端执行器位置,引导策略学习达到目标姿态。



训练得到的轮胎滚动策略使机器人能够动态调整其躯干与Spot Arm的位置,以稳定控制滚动的轮胎,防止其倾倒,并将其引导至目标位置。

最后,为解决从仿真到现实的差距,训练过程中引入了随机化,包括对物体的质量、摩擦系数与形状等属性进行随机变化。

实测表现

正如我们开头提到的,在轮胎扶正任务中,机器人最佳成绩为3.7秒,平均每个轮胎用时5.9秒,几乎达到人类在该任务中的操作速度。



这一表现远超传统的准静态假设。

在准静态假设下,机器人操作物体时速度很慢,加速度产生的惯性被忽略,关节驱动力矩主要依赖静态平衡。

而在这篇研究中,机器狗能够高效搬运重达15千克的轮胎——远超其夹持器的峰值举升能力(11 千克)和持续能力(5 千克)。

这说明机器人通过动态协调全身动作,将运动与操作紧密耦合,拓展了操作范围,超越了传统的拾取与放置方式。

此外,研究表明,将高层控制与低层控制分离能够显著简化控制问题。

高层控制器无需在拥有数十个自由度的系统中推理关节力矩、接触力以及稳定性约束,而是仅在一个简化的动作空间中工作,该空间由底盘速度和姿态参数构成,其将执行细节交由运动控制器处理,从而极大降低了复杂度。

分层控制架构使得高层控制器能够专注于任务完成,而无需显式地推理平衡约束或地面接触。

由此,学习得到的运动抽象层让高层控制更简单、计算更可行,控制器只需专注于“在哪里”和“如何操作物体”,无需处理复杂的低层动力学细节。

[1]https://rai-inst.com/resources/blog/combining-sampling-and-learning-for-dynamic-whole-body-manipulation/

[2]https://x.com/rai_inst/status/1978113805604258161

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
神舟二十号救援方案定了吗?航天博主暗示:或发射神二十二去接人

神舟二十号救援方案定了吗?航天博主暗示:或发射神二十二去接人

火星一号
2025-11-08 18:26:35
全运会乒乓球:男单8强对阵出炉!世界冠军0-4出局

全运会乒乓球:男单8强对阵出炉!世界冠军0-4出局

大眼妹妹
2025-11-10 16:26:00
医疗圈再爆大瓜,网友态度意外反转,评论区真相惊人!

医疗圈再爆大瓜,网友态度意外反转,评论区真相惊人!

麦芽是个小趴菜
2025-11-09 11:33:00
李斌谈被网暴:现在CEO的一个责任就是要娱乐大家,还不能让大家说说你吗,现在蔚来法务部经常干活

李斌谈被网暴:现在CEO的一个责任就是要娱乐大家,还不能让大家说说你吗,现在蔚来法务部经常干活

极目新闻
2025-11-10 16:10:20
斯基拉:尤里奇将很快被解雇,预计未来几小时内宣布

斯基拉:尤里奇将很快被解雇,预计未来几小时内宣布

懂球帝
2025-11-10 15:15:08
特朗普41岁次子讲述原生家庭:父亲定下六不准,母亲“又美又凶”

特朗普41岁次子讲述原生家庭:父亲定下六不准,母亲“又美又凶”

法老不说教
2025-11-07 15:24:59
缅甸政府将拆除KK园区148栋建筑,其中包括KTV、医院和SPA会所,已拆除101栋

缅甸政府将拆除KK园区148栋建筑,其中包括KTV、医院和SPA会所,已拆除101栋

红星新闻
2025-11-09 18:35:50
相当炸裂!网传某大厂领导裁掉一个边缘员工,然后和她结婚了

相当炸裂!网传某大厂领导裁掉一个边缘员工,然后和她结婚了

星河也灿烂
2025-10-30 16:46:24
谁能想到?一个县城品牌,成了中产新宠,把波司登逼到墙角!

谁能想到?一个县城品牌,成了中产新宠,把波司登逼到墙角!

渔樵文史
2025-11-08 21:50:03
美驻日大使:如果中国不按美国的意愿行事,就让十四亿人陷入饥荒

美驻日大使:如果中国不按美国的意愿行事,就让十四亿人陷入饥荒

荆楚寰宇文枢
2025-09-28 21:58:22
台风“凤凰”移入南海,广东启动应急响应!广西的天气将是......【930新闻眼】

台风“凤凰”移入南海,广东启动应急响应!广西的天气将是......【930新闻眼】

930老友记
2025-11-10 22:08:27
莱因克尔:里沙利松脱衣庆祝有点愚蠢了,真庆幸我以前不这样

莱因克尔:里沙利松脱衣庆祝有点愚蠢了,真庆幸我以前不这样

懂球帝
2025-11-11 01:33:05
外媒:叙利亚对“伊斯兰国”分支组织开展先发制人行动

外媒:叙利亚对“伊斯兰国”分支组织开展先发制人行动

参考消息
2025-11-09 19:13:05
刚刚!中美大利好!全线大涨

刚刚!中美大利好!全线大涨

中国基金报
2025-11-10 16:14:35
回顾:河北一家惨遭灭门,4名女子体内有同一人DNA,牵出两代恩仇

回顾:河北一家惨遭灭门,4名女子体内有同一人DNA,牵出两代恩仇

历来都很现实
2024-10-08 00:12:04
你敢信吗?全世界只有我们和日本自己,还执着地叫着“天皇”!

你敢信吗?全世界只有我们和日本自己,还执着地叫着“天皇”!

南权先生
2025-11-06 19:35:03
山东女子打麻将输钱,自愿与三名牌友发生关系抵债,是否构成犯罪

山东女子打麻将输钱,自愿与三名牌友发生关系抵债,是否构成犯罪

四月十九
2024-09-03 17:10:30
马斯克认错:特斯拉4680电池干电极工艺是"重大失误",竞争对手已领先

马斯克认错:特斯拉4680电池干电极工艺是"重大失误",竞争对手已领先

新浪财经
2025-11-08 12:26:51
一手好牌打的稀烂!贾静雯人财两空,事实证明她看男人的眼光真差

一手好牌打的稀烂!贾静雯人财两空,事实证明她看男人的眼光真差

青史楼兰
2025-11-10 17:35:52
江苏13市前三季度GDP出炉:三城已破万亿,苏北双雄增速领跑

江苏13市前三季度GDP出炉:三城已破万亿,苏北双雄增速领跑

上观新闻
2025-11-10 16:02:06
2025-11-11 03:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
11650文章数 176329关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

德军司令:柏林已做好与莫斯科开战的准备

头条要闻

德军司令:柏林已做好与莫斯科开战的准备

体育要闻

重返诺坎普!梅西:希望有一天能回来

娱乐要闻

51岁周迅的现状 给中年女性提了个醒?

财经要闻

北大医药董事长被抓 巨额资金去向不明

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

健康
亲子
本地
公开课
军事航空

超声探头会加重受伤情况吗?

亲子要闻

杰森谈到在中国和在美国上班区别,这回答让我和妈妈都挺意外

本地新闻

这届干饭人,已经把博物馆吃成了食堂

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美媒承认:乌重镇即将被攻克

无障碍浏览 进入关怀版