网易首页 > 网易号 > 正文 申请入驻

波士顿动力新作!首创「坐标系转移接口」,提升机器人泛化分层智能

0
分享至

新智元报道

编辑:LRST

【新智元导读】美国东北大学和波士顿动力RAI团队提出HEP框架,首创「坐标系转移接口」,将高层策略的泛化能力与低层策略的灵活性无缝耦合,实现「少数据」下的高效学习与强泛化。该框架通过分层结构、空间对称性自然泛化和创新型体素编码器,显著提升机器人在复杂任务中的表现。

在机器人智能操作领域,数据稀缺和泛化难题长期困扰着AI的落地应用。

大多数方法或依赖大量数据,或在环境稍有变化时表现失灵。

如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景?

美国东北大学和波士顿动力RAI团队的研究人员提出HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创「坐标系转移接口」,将高层策略的泛化能力与低层策略的灵活性无缝耦合,实现「少数据」下的高效学习与强泛化。

论文地址:https://openreview.net/pdf?id=nAv5ketrHq

项目代码:https://codemasterzhao.github.io/HierEquiPo.github.io/

坐标系转移接口实现了高层泛化能力与低层灵活性的无缝融合,为机器人少样本、高鲁棒、多场景泛化部署开辟了全新路径。

主要贡献

1. 极简高效的分层结构——高层模块负责全局子目标(keypose)预测,低层模块基于局部坐标自主优化轨迹;

2. 空间对称性自然泛化——在T(3)(平移)与SO(2)(平面旋转)群下均保持等变性,显著降低对示例数量的依赖;

3. 创新型体素编码器——采用堆叠体素(Stacked Voxel)+SO(2)等变网络,高效编码三维视觉信息,兼顾细节与计算速度。

方法概述

HEP框架由三部分组成:

1. 高层策略:它首先读取机器人感知到的三维点云信息,然后预测出一个粗略的目标位置,也就是「关键姿态」。

2. 坐标系转移接口:接着,它会把全局点云和上述关键姿态一起,转换到一个以关键姿态为中心的局部坐标系里,让后续处理都基于这个「局部视角」进行。

3. 低层策略:最后,低层策略在这个局部坐标系中,通过对体素化后的三维视觉特征进行等变扩散运算,生成连续、精细的机器人动作轨迹

开放/闭环兼容:同一接口支持一次性输出(Open‑loop)与逐步反馈(Closed‑loop)两种控制模式;

轻量高效:高层仅需预测平移向量,降低计算与学习难度,增强泛化性;低层专注细节,通过坐标系转移接口从高层强化泛化性。

核心创新点

坐标系转移接口(Frame Transfer)

设计思路:高层策略给出任务的「参考坐标」,低层策略在此基础上自主优化执行细节。

这样的设计不仅释放了低层的灵活性,也将高层的泛化能力、抗干扰性自洽地传递到底层,实现了「泛化性与鲁棒性」的一体式提升。

优势包括:

灵活性,低层可在局部坐标系内自主调整执行细节;

泛化性,高层对全局变换的适应能力,通过坐标系转移接口无损传递到低层;

简化高层,只需预测平移,避免在高维SE(3)空间中做精确规划。

T(3)与SO(2)等变性的实现

T(3)等变示意图

SO(2)等变示意图

当旋转和沿xyz轴的平移发生时,模型预测的轨迹也能确保发生相应的平移和旋转

高层:使用SO(2)‑等变3D U-Net对离散化平移概率图进行预测,因此拥有SO(2)‑等变性和T(3)等变性

低层:基于堆叠体素编码器提取局部特征,结合SO(2)‑等变扩散策略,因此拥有SO(2)等变性

系统:在论文附录中给出完整的等变性证明(Proposition 4.2&4.3)通过坐标系转换,SO(2)等变性被保存,T(3)等变性可以从高层传递到低层,使得整个系统拥有SO(2)XT(3)的等变性

创新型体素编码器(Stacked Voxel Representation)级

原理:将点云按体素网格分组,以等变PointNet聚合每个体素内点的特征,组成c×D×H×W的等变体素图。

优势包括:

细节保留,相比传统下采样,更好保留局部几何信息;

计算友好,点云‑卷积混合结构,平衡速度与精度;

等变性,理论保证在T(3)×SO(2)变换下保持一致性。

仿真实验

数据集:30个RLBench任务,每个任务用100条演示训练。

对比基线:3D Diffuser Actor、Chained Diffuser、Equivariant Diffusion Policy。

开环结果:HEP在30任务中有28项胜出,平均提升+10%。

闭环结果:在10个长程任务上,HEP平均提升+23%,显著优于单级方法。

消融分析

去除等变结构:性能降24%;

去除坐标系转移:性能降16%;

去除堆叠体素:性能降10%;

充分验证各模块贡献。

真实机器人实验

分层策略在复杂长程任务上优势显著

在真实机器人上,HEP分层框架仅用30条演示数据,就学会了包括移锅盖、加清洁剂、擦洗等多步协作的鲁棒「洗锅」任务,明显优于非分层方法。

坐标系转移接口:泛化性与鲁棒性的传递桥梁

理论保障:证明了坐标系转移接口能将高层对空间变化的适应能力无损传递至低层,策略整体更易扩展至新场景。

在Pick&Place任务上,HEP仅凭一次演示,低层扩散模型即可实现1-shot泛化学习,显著提升了数据效率。

在环境变化和引入无关物体的扰动测试下,HEP成功率较传统方法提升高达60%。

接口设计带来未来扩展可能

坐标系转移接口对低层策略仅施加软约束,这不仅保证了灵活性,也为未来引入VLM或Cross-embodiment等多模态、跨平台高层策略作为决策规划器提供了天然接口。

参考资料:

https://openreview.net/pdf?id=nAv5ketrHq

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杜月笙晚年找算命先生算命,算命先生一席话,杜月笙吓得浑身颤抖

杜月笙晚年找算命先生算命,算命先生一席话,杜月笙吓得浑身颤抖

千秋文化
2026-04-01 20:28:29
爆了!打出来了!33分10板10助4断!开拓者快交易杨瀚森!

爆了!打出来了!33分10板10助4断!开拓者快交易杨瀚森!

贵圈真乱
2026-04-06 11:35:40
中年夫妻更年期太扎心!网友吐槽,丈夫55岁内退,对啥都没兴趣了

中年夫妻更年期太扎心!网友吐槽,丈夫55岁内退,对啥都没兴趣了

火山詩话
2026-04-06 15:55:10
南京博物院事件真相来了:果然,那些人真狗啊!

南京博物院事件真相来了:果然,那些人真狗啊!

李月亮
2026-02-10 20:58:01
麦当劳推出“一指神器” 边吃汉堡边打游戏

麦当劳推出“一指神器” 边吃汉堡边打游戏

3DM游戏
2026-04-05 17:24:04
与黑鹰行动相比,美军此次成功解救飞行员,是川普军事改革的胜利

与黑鹰行动相比,美军此次成功解救飞行员,是川普军事改革的胜利

壹家言
2026-04-06 07:52:53
抓李镇全头发被罚下,米特里策社媒致歉:我失去了冷静没控制好自己

抓李镇全头发被罚下,米特里策社媒致歉:我失去了冷静没控制好自己

懂球帝
2026-04-06 15:04:10
控糖新选择:山姆大罐燕麦,糖尿病友的健康“主食宝藏”

控糖新选择:山姆大罐燕麦,糖尿病友的健康“主食宝藏”

南通濠生活
2026-04-06 00:10:23
中朝边境鸭绿江口现状:朝鲜领土正在不断增加,中方却在逐渐减少

中朝边境鸭绿江口现状:朝鲜领土正在不断增加,中方却在逐渐减少

普览
2026-02-26 21:29:19
王楚钦两度绝境反击,感人话语催泪,松岛发文点名三人

王楚钦两度绝境反击,感人话语催泪,松岛发文点名三人

格斗社
2026-04-06 14:11:36
65场限制让最佳阵容大洗牌!名嘴力挺马刺卡斯尔:亲眼看完我服了

65场限制让最佳阵容大洗牌!名嘴力挺马刺卡斯尔:亲眼看完我服了

仰卧撑FTUer
2026-04-06 15:43:05
杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

千秋文化
2026-04-01 20:35:51
李宇春咋穿成这样?为艺术献身我真的看不懂

李宇春咋穿成这样?为艺术献身我真的看不懂

老吴教育课堂
2026-04-05 16:36:25
场均33.5分,得分王没了。
因为只打了64场。

场均33.5分,得分王没了。 因为只打了64场。

岁月有情1314
2026-04-06 18:33:58
张本智和父亲怒斥:请别再骂我儿子,他比99%的中国人都优秀!

张本智和父亲怒斥:请别再骂我儿子,他比99%的中国人都优秀!

拳击时空
2026-04-06 06:37:58
离婚10年,男子朋友圈刷前妻发讣告携子连夜奔丧:忘不了老人的好

离婚10年,男子朋友圈刷前妻发讣告携子连夜奔丧:忘不了老人的好

丫头舫
2026-04-06 10:10:58
中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

独醉笑清风
2026-04-06 14:22:28
情人关系早已过时!2026最火的两性关系

情人关系早已过时!2026最火的两性关系

风起见你
2026-04-06 18:48:09
不怪国内那么多人想娶她,确实漂亮。

不怪国内那么多人想娶她,确实漂亮。

情感大头说说
2026-04-05 18:05:23
脑梗最危险信号,原来不是手脚麻,而是频繁出现这6个症状

脑梗最危险信号,原来不是手脚麻,而是频繁出现这6个症状

白话电影院
2026-04-06 18:19:45
2026-04-06 19:35:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14908文章数 66753关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

特朗普咆哮式发帖威胁伊朗 美政界人士:他像精神错乱

头条要闻

特朗普咆哮式发帖威胁伊朗 美政界人士:他像精神错乱

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

艺术
房产
亲子
健康
军事航空

艺术要闻

草书入门的“最强宝典”!因内容太妙,作者不敢留名,比学王羲之都靠谱

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

亲子要闻

宝蓝和爸爸叔叔一起去找被藏起来的奇趣蛋,还吃了美味的冰淇淋~

干细胞抗衰4大误区,90%的人都中招

军事要闻

伊朗:在C-130运输机残骸中发现一具美军士兵遗体

无障碍浏览 进入关怀版