网易首页 > 网易号 > 正文 申请入驻

通研院团队斩获CoRL 2025杰出论文奖:系中国籍团队首次获此殊荣

0
分享至

国际机器人学习大会(Conference on Robot Learning, CoRL)是全球人工智能与机器人领域的顶级学术会议之一,其研究成果直接引领机器人学习方向的技术前沿。近年来,伴随具身智能热潮的兴起,机器人学习领域的关注度持续攀升,CoRL会议也成为全球顶尖团队展示核心突破的关键平台。

在2025年CoRL会议上,大会共计收到近千篇投稿,经过严格评审,最终收录264篇论文。其中,北京通用人工智能研究院团队的论文“UniFP: Learning a Unified Policy for Force and Position Control in Legged Loco-Manipulation” 从全球顶尖研究中脱颖而出,成功斩获大会最高奖项 ——杰出论文奖。这一成果具有里程碑意义,是CoRL会议创办以来,首次由全中国籍学者团队摘得该奖项,标志着中国在机器人学习与具身智能领域的研究已跻身全球领先行列。



UniFP:足式机器人首个力-位统一控制算法

本研究的核心成果是提出了UniFP(Unified Force and Position Control Policy),这是足式机器人领域内,首个能够在单一框架下统一处理力控制与位置控制的算法,彻底改变了传统机器人需分别设计力、位控制策略的局限。

该方法借鉴了生物力学中的阻抗控制原理。简单来说,当机器人的末端执行器(如机械手)与环境接触时,系统会像弹簧-质量-阻尼器系统一样响应:接触力越大,产生的位移也越大。通过调节系统的刚性、阻尼和惯性参数,机器人可以展现出从刚性到柔顺的不同交互特性。

基于这一原理,研究人员推导出了一个统一的控制公式,使得单个策略能够根据不同的命令配置,在位置跟踪、力控制和阻抗控制等多种模式间灵活切换。这就像人类手臂可以根据任务需求,自如地在“精确移动”和“用力推拉”之间转换。更关键的是,UniFP通过一个力估计器实现了“无传感器力感知”:它利用机器人的历史状态信息(如姿态、角速度、关节角度)和动作数据,反向估算出机器人受到的合外力。

这意味着机器人不再是“机械地走完预设路径”,而是能像人类通过肌肉感知负重一样,主动 “感知” 环境作用力,并实时调整动作以回应环境变化。


UniFP整体框架

具体而言,UniFP的统一策略由神经网络构建,其架构包含三个相辅相成的核心模块,共同形成 “感知-决策-执行” 的完整控制闭环。

观测编码器:它接收并处理机器人连续一段时间(如32个时间步长)的历史状态信息,包括机器人状态(姿态、角速度、关节角度、历史动作)与命令(位置、力、速度)等。

状态估计器:这是策略实现力感知的核心。它从编码器的信息中,估算出无法直接测量的关键状态,包括当前外力、末端位置、基座速度等关键变量。这是整个研究的精髓——机器人不再需要力传感器,而是通过观察自身关节的微小变化和运动状态,像人类通过肌肉酸痛感知负重一样,“推断”出自己正在受力。

执行器:它综合编码器的历史信息和状态估计器提供的“体感”,最终计算出当前应该发送给各个关节电机的控制命令(动作)。

▍从仿真到实机,全场景验证多功能性

为了验证这一方法,研究团队在仿真环境Isaac Gym中创造了各种各样的接触场景,包括不同的位置指令、力指令和外部干扰力的组合。通过让机器人在这些多样化场景中学习,并通过跟踪奖励函数进行优化,策略逐渐掌握了如何从可观察的状态变量中提取出力的信息。

在仿真训练完成后,研究团队在Unitree B2-Z1四足机械臂平台上开展实机测试,UniFP展现出令人瞩目的多功能操作能力:

精准的力控制:在实验中,研究人员让机器人抓握一个2.5公斤的哑铃。当没有力指令时,机械臂在重力作用下自然下垂。但当给予一个向上的力指令(25牛顿,约等于抵消哑铃重力)时,机器人能稳稳地托住哑铃,手臂不再下垂。这证明了其力控制的精确性。



自适应的力追踪:在力追踪模式下,机器人会像具有“顺从性”一样,跟随外力的方向移动。一旦外力消除,它会保持在位移后的位置,而不是返回原始目标。这种行为类似于当我们推动一个人的手时,对方放松手臂任我们移动的场景。

柔顺的阻抗控制:在阻抗控制模式下,机器人会对外力做出“推回来”的响应——偏离目标位置越远,机器人施加的抵抗力就越大。研究团队在“人机拔河”实验中生动展示了这一能力:当人类拉扯机器人的末端执行器时,机器人会根据被拉离目标位置的距离,施加相应的回拉力。

▍力感知模仿学习:从“看”到“感”的飞跃

如果说UniFP的力-位统一控制是“基础能力突破”,那么其与模仿学习的结合,则显著提升了机器人在接触密集型任务中的学习效率,是这项研究最具影响力的延伸创新。

模仿学习是让机器人通过观察专家演示来掌握新技能的方法,类似于人类通过观察学习。然而,大多数现有的模仿学习方法仅关注位置轨迹,而忽略了接触力信息。这导致学习的策略在接触密集型任务中表现不佳。

研究团队利用统一力-位置策略作为基础遥操作系统,收集了包含丰富接触力信息的操作数据。这些数据随后用于训练基于扩散的力感知模仿学习策略。结果表明,这种力感知方法在四项具有挑战性的接触密集型任务中(擦拭黑板、打开橱柜、关闭橱柜和打开被遮挡的抽屉)比仅依赖位置信息的传统方法成功率高出约39.5%。



为了验证方法的通用性,研究团队在Unitree B2-Z1四足机械臂平台和Unitree G1人形机器人上进行了广泛实验。结果显示,统一策略能够适应不同的机器人形态和任务需求。

该研究在Unitree B2-Z1四足操控平台和Unitree G1人形机器人上开展了七项实验任务。在擦黑板任务中,位置控制的策略要么擦不干净,要么用力过大,而UniFP能保持稳定的接触压力,把黑板彻底擦干净。在开关柜门任务中,视觉方法根本无法识别微小的推拉式弹簧,而UniFP通过力估计器准确地触发开关。在抽屉被遮挡的场景下,基线方法成功率急剧下降到0.3,而UniFP借助力感知将成功率提升到0.76。



更值得关注的是,UniFP并不局限于某一种机器人形态,展现出极强的泛化能力。研究团队除了在Unitree B2-Z1四足机械臂平台上验证,还将其部署到Unitree G1人形机器人上,同样实现了稳定控制。这意味着UniFP成为首个 “同时跨任务、跨形态、跨平台” 的统一力-位控制策略,打破了传统机器人控制算法需定制开发的行业瓶颈。

论文链接:https://arxiv.org/html/2505.20829v2

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

一盅情怀
2026-04-07 16:21:17
马杜罗被捕后暴瘦13公斤

马杜罗被捕后暴瘦13公斤

烽火观天下
2026-04-07 12:34:13
美国的枪店老板,为什么不怕顾客买完枪后朝他射击?

美国的枪店老板,为什么不怕顾客买完枪后朝他射击?

心中的麦田
2026-04-06 19:26:47
时隔6年,那个曾扬言让中国给全世界道歉,被央视开除的阿丘怎样了

时隔6年,那个曾扬言让中国给全世界道歉,被央视开除的阿丘怎样了

阅微札记
2026-04-07 15:01:54
1996年,施瓦辛格喝醉了在家休息,看到200斤的佣人在做家务……

1996年,施瓦辛格喝醉了在家休息,看到200斤的佣人在做家务……

岁月有情1314
2026-04-07 15:49:39
国防部正式将“台独首恶”赖清德,定为民族败类!

国防部正式将“台独首恶”赖清德,定为民族败类!

愿你余生安好嘴角带笑
2026-03-30 08:40:31
小鹏汽车法务部回应四川广元单车碰撞事故

小鹏汽车法务部回应四川广元单车碰撞事故

IT之家
2026-04-07 17:07:22
男子跳湖救下溺水孩子后默默离开,“我正好在就下去了”

男子跳湖救下溺水孩子后默默离开,“我正好在就下去了”

澎湃新闻
2026-04-06 20:28:27
张雪早年最大的贵人被扒出:数十次借钱救命,从没收过一分学费

张雪早年最大的贵人被扒出:数十次借钱救命,从没收过一分学费

科技头版Pro
2026-04-07 14:49:16
王楚钦夺得世界杯冠军成全了多少人?樊振东张本智和都得发来贺电

王楚钦夺得世界杯冠军成全了多少人?樊振东张本智和都得发来贺电

罗纳尔说个球
2026-04-06 16:43:41
陈光标变现大劳捐千万后续!曝嫣然已退款,原因炸裂,果然有猫腻

陈光标变现大劳捐千万后续!曝嫣然已退款,原因炸裂,果然有猫腻

亿通电子游戏
2026-04-07 17:54:26
英媒:伊朗消息人士称伊朗拒绝“临时停火”

英媒:伊朗消息人士称伊朗拒绝“临时停火”

新华社
2026-04-07 20:00:05
卡斯尔19+11+13马刺战胜76人收获60胜,文班亚马17分伤退

卡斯尔19+11+13马刺战胜76人收获60胜,文班亚马17分伤退

湖人崛起
2026-04-07 10:32:12
陈丽华去世仅2天,几百亿遗产分配曝光!仨子女和迟重瑞恐难获得

陈丽华去世仅2天,几百亿遗产分配曝光!仨子女和迟重瑞恐难获得

小梊搞笑解说
2026-04-07 20:18:19
网传乌克兰基辅大学迎新照,满屏美女让网友直呼诡异

网传乌克兰基辅大学迎新照,满屏美女让网友直呼诡异

消失的电波
2026-04-07 16:54:04
曝全红婵遭霸凌:282人微信群长期辱骂她 多位队友在群内但未制止

曝全红婵遭霸凌:282人微信群长期辱骂她 多位队友在群内但未制止

风过乡
2026-04-07 06:13:04
2名飞行员和5亿美元哪个更重要?

2名飞行员和5亿美元哪个更重要?

山河路口
2026-04-06 12:12:25
伊朗首都响起密集爆炸声

伊朗首都响起密集爆炸声

新华社
2026-04-07 15:55:05
东北3岁小网红继续做吃播,父母是真不想上班

东北3岁小网红继续做吃播,父母是真不想上班

九方鱼论
2026-04-07 05:02:58
研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

黯泉
2026-04-01 17:28:39
2026-04-08 00:03:00
机器人大讲堂 incentive-icons
机器人大讲堂
立德机器人平台,是一个集媒体品牌、智库咨询、投资孵化、引智招商为一体的机器人垂直领域服务平台
6437文章数 4580关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

特朗普恐吓4小时摧毁伊朗 伊朗称"打穿"海法未见拦截

头条要闻

特朗普恐吓4小时摧毁伊朗 伊朗称"打穿"海法未见拦截

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

本地
教育
艺术
数码
亲子

本地新闻

跟着歌声游安徽,听古村回响

教育要闻

好的亲子关系,父母只需做好这几点 #家长必读 #孩子教育

艺术要闻

美丽风光看不尽

数码要闻

OPPO ColorOS共创者星球2026年第1期高票建议采纳情况公布

亲子要闻

春天娃长个黄金期,喝对黑豆水,个子悄悄往上窜

无障碍浏览 进入关怀版