大数据文摘受权转载自头部科技
文丨谭梓馨
今年春晚期间,人形机器人的舞台协同编排与运动控制技术无疑展现出了巨大飞跃,但如何捕捉人类高动态动作的敏捷性与自适应性,仍是一个开放性难题。

特别是在复杂多变环境下的敏捷跑酷运动,不仅要求底层控制具备鲁棒性,还需要类人的动作表现力、长时程技能组合能力,以及基于感知的决策能力。
近日,来自 亚马逊FAR、加州大学伯克利分校、卡内基梅隆大学和斯坦福大学团队联合 提出一种感知驱动的仿人机器人跑酷框架(PHP),该模块化框架可让仿人机器人在高难度障碍赛道上,基于视觉自主完成长时程跑酷任务。
![]()
研究人员在宇树G1人形机器人上开展了大量真实环境实验,验证了本框架的有效性:机器人可完成翻越高达1.25米(为自身身高的96%)障碍物等高动态跑酷技能,并能在长时程多障碍穿越中,通过闭环控制实时适配障碍物扰动,展现出当前业界顶尖的实时敏捷、自适应全身跑酷效果。
框架背后的创新点
在复杂地形中实现类人运动的敏捷性与适应性,仍是人形机器人领域的核心挑战,跑酷任务尤其凸显了几个关键挑战:
第一,机器人必须完成高动态、多接触的技能,例如翻越接近或超过自身身高的墙体,或是在极短时间内跃过障碍物。这要求在仿人机器人庞大、高维的动作空间中实现高效控制。
第二,这些技能必须与视觉等外部感知紧密耦合,以适应环境变化,并对突发扰动做出快速响应。
此外,要想从单一动作泛化到复杂障碍赛道的连续穿越,机器人必须将多种高动态技能整合到单一视觉运动策略中,而随着所需技能的数量与多样性增加,这一难度会急剧上升。
![]()
这个最新框架首先采用运动匹配策略——将其建模为特征空间中的近邻检索问题,把重定向后的人类基础动作单元组合成长时程运动学轨迹,该框架可灵活拼接、平滑切换复杂技能链,同时保留人类动态动作的优雅与流畅性。
随后,针对这些组合动作训练基于运动追踪的强化学习专家策略,并结合数据集聚合(DAgger)与强化学习方法,将其蒸馏为单一、仅依赖深度信息的多技能学生策略。
至关重要的是,感知与技能组合的结合实现了自主式、场景感知决策:机器人仅依靠机载深度传感器与离散二维速度指令,即可自主选择并执行跨越、攀爬、腾跃、滚下等动作,以应对不同几何形状与高度的障碍物。
研究人员表示,这套可扩展方案能够实现仿真到现实的零样本迁移,使实体机器人自适应穿越复杂地形。
像人一样自适应爬墙越障
在此框架的加持下,人形机器人在某些场景的敏捷度大幅提升。
如高墙攀爬性能对比,针对1.25米高墙(为机器人身高的96%),机器人从蹬地时刻算起,仅用3.63秒便登上平台,速度与人类水平相当。
![]()
具备高动态跑酷技能,机器人翻越一个高0.4米、长0.5米的障碍物,从蹬地到再次着地仅用时0.8秒,向前行进距离超过2米(为自身身高的154%),该动作的前向峰值速度可达3.41m/s,平均速度2.53m/s,体现出机器人在接触切换过程中具备出色的动量保持能力。

从1.25米高台下落着陆时,机器人还会通过下肢关节屈曲缓冲冲击并稳定姿态。
本框架的一大核心优势在于:即便训练数据仅包含单障碍穿越,策略仍能泛化到复杂的多障碍赛道中。
机器人会将跨步、低墙攀爬、高墙攀爬等多种技能组合,在包含多个障碍的赛道上连续奔跑,验证了闭环自适应能力。

视觉运动策略可在线生成动作过渡,实现全程流畅的技能切换,策略会自动调整接近方式与动作时机,以响应障碍变化,持续完成穿越任务,这些结果证明了本策略在长时程地形穿越中的强适应性。
还有很大优化空间
研究人员在对比实验中发现,稠密化运动匹配对于生成连贯的长时程参考轨迹至关重要,并能让策略学习到丰富多样的接近条件。
结合强化学习的蒸馏方法,可高效地将单技能、含特权信息的专家策略迁移为多技能、仅依赖深度信息的学生策略。
![]()
这项研究的一作吴臻目前是亚马逊前沿人工智能与机器人部门(FAR)的应用科学家实习生,在北京大学获得学士学位,斯坦福大学获得硕士学位,研究方向是人形机器人和角色动画。
不过,目前该框架仍缺乏语义化场景理解,研究人员表示,引入语言等更丰富的条件信号,能实现对动作多样性与风格的更精细控制。
此外,现实场景中的机器人性能也受限于感知与硬件:高速运动时,短距、窄视场相机无法提前充分观测障碍物几何形状,导致机器人必须在感知不确定的情况下做出决策。
展望未来,更优的传感方案与语义场景理解或许能大大降低这种不确定性,并支持更丰富的环境推理和交互。
GPU 训练特惠!
H100/H200 GPU算力按秒计费,平均节省开支30%以上!
扫码了解详情☝
点「赞」的人都变好看了哦!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.