网易首页 > 网易号 > 正文 申请入驻

如何让人形机器人“行稳致远”?这篇顶级期刊的论文提出了新方法

0
分享至

随着人形机器人行业的快速发展,其在现实生活中的应用也愈发变得可能。如何在适应不同的地面环境的同时,还能保证机器人的行走安全,是一个亟待解决的课题。

日前,优必选科技与代尔夫特理工大学丁加涛博士、香港中文大学(深圳)林天麟教授(兼任深圳市人工智能与机器人研究院智能机器人中心主任)、利兹大学黄艳龙教授合作,联合发表了论文《Safe and Adaptive 3-D Locomotion via Constrained Task-Space Imitation Learning》。该论文针对人形机器人安全步行,通过线性化3D捕获条件并结合任务空间的模仿学习,实现人形机器人在不需要大量示教数据的情况下,快速获得稳定、安全的行走步态。

该论文于2023年1月被《IEEE/ASME机电一体化汇刊》(IEEE/ASME Transactions on Mechatronics,简称“TMECH”)收录,该期刊由美国电子电气工程师协会(IEEE)和美国机械工程师协会(ASME)共同主办,是机电工程领域的顶级期刊。

摘要概述:

近年来,双足步行控制得到了广泛研究,其中被动安全(即双足快速制动而不会摔倒)是实现人形机器人走向实际应用必须要首先解决的关键问题。本文通过将安全性约束集成到模仿学习框架中,赋予人形机器人安全行走能力并使之具备环境适应性。

与之前基于非线性的、耦合的捕获动力学的方法不同,该论文通过选取适当的极值将 3D 捕获条件线性化,然后将它们整合到最新的受限模仿学习框架中。此外,文中提出了一种启发式规则来定义控制点,从而实现自适应步态的学习。所提出的框架不需要手动生成步行参考轨迹,允许机器人从少量示教轨迹中快速地学习运动技能,并能将学到的技能应用到新的3D 场景中。

与深度强化学习不同,该框架避免了大量迭代优化,也避免了从模拟到真实迁移(sim-to-real transfer)的难题。由于在任务空间进行学习,所得到的步行控制策略可以快速迁移到不同的样机上。

背景简介:

针对人形机器人安全步行,领域内已经从保持平衡和避免障碍等方面进行了研究。最近,被动安全概念引起了广泛关注。该任务不仅要求人形机器人在行走过程中能够保持平衡,还要能在迈出有限步甚至零步后紧急制动,即满足N步或零步捕获约束。

现有的工作大都假设机器人行走过程中保持竖直高度恒定,以此获得N步或零步捕获能力。而在3D步行任务(例如,爬楼梯或穿过不平地形)中,垂直高度的变化是不可避免的。针对此问题,现有一些工作从调整“运动的发散分量”(DCM) 角度出发,试图将2D的N/零步捕获拓展到3D。然而,这些工作通常涉及非线性或隐式约束,并且其中大多数需要对质心(CoM)或压力中心(CoP)轨迹进行额外的简化。

此外,为实现N /零步捕获步态的求解,现有的工作依赖于有约束的模型预测控制或者其他的非线性规划方法,但需要在事先通过手动获取参考轨迹。不同于数值优化方法,示教学习(也称为模仿学习)使得模仿人类/机器人现有的步态成为可能。比如,部分研究者使用动态运动基元 (DMP)和核化运动基元(KMP)生成鲁棒的步行模式。然而,他们都未能考虑安全性约束。

本文方法:

为了在保证安全的情况下实现自适应 3D 双足步行,本文首先推导出满足安全行走要求的线性、解耦条件;其次,将可行性约束(包括安全性约束)与受限模仿学习相结合,提出一个能够在满足安全约束的同时模仿示教运动的步态学习框架;最后,借助线性倒立摆 (LIP)模型,定义任务空间中的控制点,以实现自适应步态的学习。

3D 捕获条件

图1展示了本文使用的线性化策略的基本思想。

图1:安全行走所允许的捕获区域(capture region)的近似:“Act. Capture region”表示使用变化的自然频率计算的捕获区域。“Max.”和“Min.”对应的最大和最小捕获区域由固有频率的边界值计算得到。

考虑安全性约束的受限模仿学习

参考文献[2]提出了一种可以处理线性约束的模仿学习方法(LC-KMP)。该方法通过求解以下约束优化问题实现对示教轨迹的学习。

上式中各物理符号的意义参见论文全文和参考文献[2].

在本文中,为了获得一定的鲁棒性,我们使机器人同时学习未来两步的运动。其中在第一步中遵循一步捕获条件,在第二步中考虑零步捕获条件。与大多数忽略双足支撑阶段的工作不同,本文在构造公式(5)中的约束条件时,显性地考虑了单/双足支撑阶段的切换,如图2所示。此外,除捕获条件外,本文还考虑了质心运动等可行性约束。

图2:考虑双足支撑的行走动作。在第二步的末尾,我们只考虑单腿支撑,行成更加严格的安全性保证。

基于启发式规则的控制点选取

LC-KMP的另一大特点是可以通过选取适当的控制点,从而生成满足不同任务需求的轨迹。本文针对双足步行学习任务,在两步运动中定义四个期望点,其中第一点和第四点用于确定开始和结束状态,而第二点和第三点用于满足任务需求。为了满足安全性约束,在每个时刻分别选取CoM位置、速度和加速度。对于水平运动,使用LIP模型确定参考运动状态,见图3。对于高度变化,采用启发式规则进行参考状态的选取,见图4。

优必选Walker2 真机实验

为验证方法的有效性,研究团队在优必选的Walker2人形机器人上进行了大量实验。首先采集Walker2机器人周期行走生成的步态数据作为示教。然后,使用上述的框架生成针对不同任务需求的3D步态。测试任务包括在非平整地面上行走(图5第二行)、上台阶(图5第三行)和直膝行走(图5第四行)等。实验数据表明,该算法能够满足不同任务需求,生成满足安全性需求的双足步态。并且,在不同的任务下,机器人都能够实现单腿急停。

图5:机器人平整地面上示教行走(第一行)和不同任务下安全行走:不平地面行走(第二行), 上台阶(第三行)和直膝行走(第四行)。机器人头顶上方的红色箭头指示运动方向。

小结

在本文中,我们为双足步行开发了一个考虑约束的模仿学习框架。该框架能够处理包括线性化的安全约束在内的大量可行性约束。实验表明,所提出方法可以从少量的2D(无竖直高度变化)场景演示中学习行走技能,并在严格遵守安全限制的前提下泛化到新的3D场景。

我们认为,这一方法未来还能够应用到人形机器人更复杂、更高维的动作中(如跑步或跳跃等),并在这个过程中确保机器人的动作安全。这也是提升人形机器人环境适应能力的一次正向尝试。

完整的结果和分析参见全文:

https://ieeexplore.ieee.org/document/10049251

参考文献:

[1] T. Koolen, T. De Boer, J. Rebula, A. Goswami, and J. Pratt,“Capturability-based analysis and control of legged locomotion, part 1:Theory and application to three simple gait models,”Int. J. Robot. Res.,vol. 31, no. 9, pp. 1094–1113, July 2012.

[2] Y. Huang and D. G. Caldwell, “A linearly constrained nonparametricframework for imitation learning,” in Proc. IEEE Int. Conf. Robot.Autom., 2020, pp. 4400–4406.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3天死1000人,法国急购3万台空调,中国空调爆单,不打贸易战了?

3天死1000人,法国急购3万台空调,中国空调爆单,不打贸易战了?

古史青云啊
2026-06-30 11:31:42
男子在KTV饮酒后猝死,家属索赔143万;KTV和两名同饮者被判共赔偿58万,判决书披露详情

男子在KTV饮酒后猝死,家属索赔143万;KTV和两名同饮者被判共赔偿58万,判决书披露详情

大风新闻
2026-06-30 18:04:02
国家出手仅3天,谢娜再迎噩耗,终究是遭到了跨界捞金的反噬

国家出手仅3天,谢娜再迎噩耗,终究是遭到了跨界捞金的反噬

丁丁鲤史纪
2026-06-30 17:25:45
迎来第一波“失业潮”的不是教师,不是医生,而是这四个行业!

迎来第一波“失业潮”的不是教师,不是医生,而是这四个行业!

职场资深秘书
2026-06-28 14:27:05
员工因体味大被公司开除,人事还发了个“流汗尬笑”表情,当事人委屈称:我工作认真业绩好,马上就转正了

员工因体味大被公司开除,人事还发了个“流汗尬笑”表情,当事人委屈称:我工作认真业绩好,马上就转正了

大风新闻
2026-06-30 10:01:10
原新华社记者唐师曾,现病情危重处于“生命的边缘”

原新华社记者唐师曾,现病情危重处于“生命的边缘”

转型Media人
2026-06-29 23:12:15
6.29-7.2将要上市的6款新车

6.29-7.2将要上市的6款新车

鸭梨说车
2026-06-29 17:57:50
2026高考成绩公布后,张桂梅式教育被批,再次证明:父母放任不管的代价,远比想象中更残酷......

2026高考成绩公布后,张桂梅式教育被批,再次证明:父母放任不管的代价,远比想象中更残酷......

二胡的岁月如歌
2026-06-27 18:18:29
美国大满贯爆冷!上届女单亚军一轮游出局,孙颖莎强势拿下开门红

美国大满贯爆冷!上届女单亚军一轮游出局,孙颖莎强势拿下开门红

暖心萌阿菇凉
2026-07-01 00:21:42
成都突发车祸致3死1伤!警方通报:女司机驾车撞电动车后又撞桥墩

成都突发车祸致3死1伤!警方通报:女司机驾车撞电动车后又撞桥墩

听心堂
2026-06-30 22:37:52
传奇作家阿特伍德首次体验AI:垃圾进垃圾出,还撒了谎

传奇作家阿特伍德首次体验AI:垃圾进垃圾出,还撒了谎

赴一场山海啊
2026-06-29 00:53:36
李谷一大胆开麦,揭晓宋祖英走上高位的真相,观众:原来如此!

李谷一大胆开麦,揭晓宋祖英走上高位的真相,观众:原来如此!

温读史
2026-06-29 11:35:49
俄Yandex地图把普京瓦尔代官邸卫星图打码,3.3平方公里被糊掉

俄Yandex地图把普京瓦尔代官邸卫星图打码,3.3平方公里被糊掉

桂系007
2026-06-30 23:50:12
一掷千金的“大哥”越来越少!女主播群体从深圳迁到惠州路边帐篷

一掷千金的“大哥”越来越少!女主播群体从深圳迁到惠州路边帐篷

火山詩话
2026-06-29 04:37:21
内马尔为何在巴西踢日本时!一分钟都没上,主帅赛后首次给出答案

内马尔为何在巴西踢日本时!一分钟都没上,主帅赛后首次给出答案

余憁搞笑段子
2026-06-30 19:21:22
就1500万特例!关于詹姆斯和勇士之间的拉扯,说白了就是一出闹剧

就1500万特例!关于詹姆斯和勇士之间的拉扯,说白了就是一出闹剧

老梁体育漫谈
2026-06-30 22:33:51
3年6400万+球员选项!维金斯降薪留队,西蒙斯要重返NBA

3年6400万+球员选项!维金斯降薪留队,西蒙斯要重返NBA

世界体育圈
2026-06-30 21:58:23
单打32强出炉!国乒4人出局;日乒仅一人输球;韩国男单仅剩独苗

单打32强出炉!国乒4人出局;日乒仅一人输球;韩国男单仅剩独苗

莼侃体育
2026-06-30 16:08:12
沈腾一家阿那亚度假,7岁儿子身高抢镜,王琦专心啃鸡爪更富态了

沈腾一家阿那亚度假,7岁儿子身高抢镜,王琦专心啃鸡爪更富态了

星星没有你亮
2026-06-30 21:27:41
WTT大满贯:冷门成灾!四位冠军出局,17岁黑马出世,曼昱处境不妙

WTT大满贯:冷门成灾!四位冠军出局,17岁黑马出世,曼昱处境不妙

童叔不飙车
2026-06-30 01:30:02
2026-07-01 01:08:49
优必选科技
优必选科技
智能服务机器人领导者
90文章数 48关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

德国足球,脸都不要了

娱乐要闻

黄晓明沦陷!羡慕周杰伦能降住昆凌

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

艺术
亲子
本地
旅游
教育

艺术要闻

18幅 现当代著名画家作品

亲子要闻

写了赋能孩子压根不看,还要坚持下去吗?

本地新闻

贵州小城的新目标:举办“村超”世界杯!

旅游要闻

张园东区首开区亮相 详细版攻略来啦!

教育要闻

责任在谁?家长投诉:老师强制打印作业,教育局明确回复

无障碍浏览 进入关怀版