网易首页 > 网易号 > 正文 申请入驻

波士顿动力狗gogo回来了!“五条腿”协同发力

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

机器狗搬轮胎,“五只腿”齐发力!



波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。

搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。

而且,搬起轮胎后,它还能将轮胎滚动到指定位置。



甚至还能把一个轮胎叠到另一个轮胎上面(还会用头帮忙顶一下)。



这一方法克服了传统操作策略(如摇操)在不同机器人形态学结构上的迁移限制,并通过分层控制实现了机器狗四肢与全身的协调动力学操作。



网友表示,狗子快去回收站去搬轮胎吧!



这是怎么做到的?

结合采样与学习的动态全身操作

总的来说,结合采样与学习的动态全身操作(Combining Sampling and Learning for Dynamic Whole-Body Manipulation)利用强化学习与基于采样的控制(sampling-based control)相结合的方法,使机器人能够执行需要手臂、双腿和躯干协同配合的动态力交互任务。

为应对复杂的操作任务,研究采用了分层控制(hierarchical control)方法,将控制问题划分为两个互补且同步的层级。

在低层,基于强化学习的运动策略直接控制电机力矩,以实现平衡、稳定性与运动执行。

高层控制则根据任务类型而有所不同:

  • 对于轮胎扶正、拖拽与堆叠等任务,系统采用基于采样的控制,通过模拟潜在的未来情境来发现最优操作策略。
  • 对于轮胎滚动任务,则使用强化学习来捕捉维持物体稳定运动所需的细微动力学特征与反应性控制机制。

所有的高层方法,最终都会输出包括底盘速度、姿态参数(包括滚转、俯仰、高度 )、腿部控制以及手臂动作等指令。

在采样控制中,采样控制器通过并行模拟多个未来情境,寻找最有效的操作策略,从而选择最能实现任务目标的动作。

对于那些需要精确施力和多接触协调的任务,系统会运行32个并行CPU线程,每个线程使用MuJoCo模拟未来几秒内的不同动作序列。



与直接采样原始轨迹不同,研究在样条曲线空间(space of splines)中进行采样,这种方式能生成更平滑、更自然的运动轨迹,同时降低搜索空间的维度。

该控制器展现出源自物理仿真的机会性行为。在轮胎扶正过程中,控制器自主发现了复杂的操作策略:机器人通过Spot Arm与前腿动作的协调,产生足够的杠杆力以抬起沉重的轮胎。

为了适应多样的初始构型,机器人可能使用手臂、前腿、身体,或这些部位的组合来灵活调整操作策略。

值得一提的是,系统并未预设任何固定的操作模式。这种多肢体、多接触的行为,是在采样过程中优化自然涌现的结果,而非通过显式编程设定接触顺序实现的。

此外,控制器会根据实验室空间中机器人与轮胎的当前构型动态调整策略。

在具体的强化学习策略方面,研究通过PPO算法在IsaacLab中训练得到的运动策略。



这一策略为高层控制提供了稳健的低层控制抽象,能够在多种操作场景中保持平衡,从而使高层控制问题更易处理。

在轮胎滚动任务中,研究利用强化学习来应对难以精确建模的复杂摩擦与接触动力学。

其采用非对称演员-评论家(asymmetric actor-critic architecture)方法,在单块GPU上经过约24小时训练,得到高层技能策略。

该策略接收的观测状态包括机器人、轮胎与目标之间的相对姿态,以及关节位置与速度。奖励函数则根据物体几何形状及其与环境的空间关系,计算期望的躯干与末端执行器位置,引导策略学习达到目标姿态。



训练得到的轮胎滚动策略使机器人能够动态调整其躯干与Spot Arm的位置,以稳定控制滚动的轮胎,防止其倾倒,并将其引导至目标位置。

最后,为解决从仿真到现实的差距,训练过程中引入了随机化,包括对物体的质量、摩擦系数与形状等属性进行随机变化。

实测表现

正如我们开头提到的,在轮胎扶正任务中,机器人最佳成绩为3.7秒,平均每个轮胎用时5.9秒,几乎达到人类在该任务中的操作速度。



这一表现远超传统的准静态假设。

在准静态假设下,机器人操作物体时速度很慢,加速度产生的惯性被忽略,关节驱动力矩主要依赖静态平衡。

而在这篇研究中,机器狗能够高效搬运重达15千克的轮胎——远超其夹持器的峰值举升能力(11 千克)和持续能力(5 千克)。

这说明机器人通过动态协调全身动作,将运动与操作紧密耦合,拓展了操作范围,超越了传统的拾取与放置方式。

此外,研究表明,将高层控制与低层控制分离能够显著简化控制问题。

高层控制器无需在拥有数十个自由度的系统中推理关节力矩、接触力以及稳定性约束,而是仅在一个简化的动作空间中工作,该空间由底盘速度和姿态参数构成,其将执行细节交由运动控制器处理,从而极大降低了复杂度。

分层控制架构使得高层控制器能够专注于任务完成,而无需显式地推理平衡约束或地面接触。

由此,学习得到的运动抽象层让高层控制更简单、计算更可行,控制器只需专注于“在哪里”和“如何操作物体”,无需处理复杂的低层动力学细节。

[1]https://rai-inst.com/resources/blog/combining-sampling-and-learning-for-dynamic-whole-body-manipulation/

[2]https://x.com/rai_inst/status/1978113805604258161

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最新消息:2026年1月全国青年失业人口数据发布——

最新消息:2026年1月全国青年失业人口数据发布——

叶初七
2026-02-28 16:39:21
又一个“扶弟魔”!订婚宴上彩礼临时涨价38万,男方被逼直接退婚

又一个“扶弟魔”!订婚宴上彩礼临时涨价38万,男方被逼直接退婚

丫头舫
2026-02-28 11:22:55
当庭炮轰!希拉里火力全开:没坐过爱泼斯坦飞机,要查就查特朗普

当庭炮轰!希拉里火力全开:没坐过爱泼斯坦飞机,要查就查特朗普

爱吃醋的猫咪
2026-03-01 15:17:00
41岁终娶王文娟,晚年却崩溃大哭,孙道临背后不为人知的故事

41岁终娶王文娟,晚年却崩溃大哭,孙道临背后不为人知的故事

往史过眼云烟
2026-02-14 19:30:45
春节前将牛肉饭忘在办公室!节后牛肉饭长出15厘米高“黑色丛林”!

春节前将牛肉饭忘在办公室!节后牛肉饭长出15厘米高“黑色丛林”!

天津人
2026-02-28 07:09:58
罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

来科点谱
2026-01-23 11:08:02
周末重点速递丨节后主线将更加清晰!券商关注四大主线;商业航天快速发展,火箭及卫星制造率先受益

周末重点速递丨节后主线将更加清晰!券商关注四大主线;商业航天快速发展,火箭及卫星制造率先受益

每日经济新闻
2026-03-01 11:15:47
博主:超级杯后国安不返京,将回到苏州继续备战中超

博主:超级杯后国安不返京,将回到苏州继续备战中超

懂球帝
2026-03-01 11:45:32
蒋万安,之所以红得发紫、惹人喜爱,正因为他与其他市长们不一样

蒋万安,之所以红得发紫、惹人喜爱,正因为他与其他市长们不一样

奇思妙想生活家
2026-03-01 12:47:37
白宫发布特朗普监控对伊朗行动照片

白宫发布特朗普监控对伊朗行动照片

环球网资讯
2026-03-01 07:26:09
知名好莱坞演员在自家谷仓内身亡:汽车搭电时突然自燃,曾获5届拳击冠军

知名好莱坞演员在自家谷仓内身亡:汽车搭电时突然自燃,曾获5届拳击冠军

红星新闻
2026-02-27 17:33:09
伊朗伊斯兰革命卫队发布4号公告:位于科威特的大量美军人员伤亡

伊朗伊斯兰革命卫队发布4号公告:位于科威特的大量美军人员伤亡

环球网资讯
2026-03-01 06:22:06
妲己豪门男友染脏病的瓜?

妲己豪门男友染脏病的瓜?

香港内地文娱
2026-02-27 18:22:41
美以袭击伊朗,资源战争打响

美以袭击伊朗,资源战争打响

泽平宏观展望
2026-03-01 15:15:25
美论坛:一旦美突然向中国发射200枚核弹,中国有能力反击吗

美论坛:一旦美突然向中国发射200枚核弹,中国有能力反击吗

安珈使者啊
2026-02-27 11:51:18
破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

另子维爱读史
2026-01-16 21:03:12
哈梅内伊遇害细节曝光,内奸和间谍送情报,已渗透到伊朗最高层

哈梅内伊遇害细节曝光,内奸和间谍送情报,已渗透到伊朗最高层

石江月
2026-03-01 13:12:21
明查·持续更新|伊朗陆军总司令生死反转,游戏画面又被传成冲突画面

明查·持续更新|伊朗陆军总司令生死反转,游戏画面又被传成冲突画面

澎湃新闻
2026-02-28 19:06:28
西安市委常委、统战部部长贠笑冬接受纪律审查和监察调查!

西安市委常委、统战部部长贠笑冬接受纪律审查和监察调查!

高陵潮生活
2026-03-01 11:15:47
母亲80大寿三姐只送5斤排骨,饭没吃完三姐就走,母亲追到大门口

母亲80大寿三姐只送5斤排骨,饭没吃完三姐就走,母亲追到大门口

人间百态大全
2026-03-01 06:40:03
2026-03-01 15:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
12211文章数 176398关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

专家:伊朗局势可参考委内瑞拉 反美力量将进一步削弱

头条要闻

专家:伊朗局势可参考委内瑞拉 反美力量将进一步削弱

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

小米汽车2月交付超20000台 雷军:为新SU7量产作准备

态度原创

房产
亲子
本地
公开课
军事航空

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

亲子要闻

宝宝起床气严重,“硬碰硬”相当不靠谱,5招赶走起床气

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国以色列联合袭击伊朗 实时战况

无障碍浏览 进入关怀版