网易首页 > 网易号 > 正文 申请入驻

NTU MARS Lab提出A2A新范式,实现机器人高性能单步动作生成

0
分享至



在机器人领域,扩散策略(Diffusion Policy)已经成为了标准模仿学习策略和 VLA 动作生成范式,但其「从随机噪声中迭代解噪」的机制带来了不容忽视的推理延迟。如果机器人不再从随机高斯噪声开始「盲猜」,是否可以基于「刚刚做了什么」来预测「下一步做什么」呢?

新加坡南洋理工大学 MARS Lab 提出Action-to-Action (A2A) Flow Matching新范式:以历史机器人轨迹而非随机噪声作为生成起点,打破了生成速度与精度的双重瓶颈,实现了更高训练效率、极速推理响应及卓越的泛化表现。



  • Website:https://lorenzo-0-0.github.io/A2A_Flow_Matching
  • ArXiv:https://arxiv.org/pdf/2602.07322
  • Code:https://github.com/JIAjindou/A2A_Flow_Matching

背景

扩散策略已成为机器人多模态动作建模的主流方法,但其依赖从随机噪声中进行多步迭代解噪,推理延迟较高,在实时控制场景中构成关键瓶颈。虽然现有工作尝试优化噪声初始化,但仍未摆脱「从噪声到数据」的长程生成路径。

这种「去噪」思维源自图像生成,但并不完全适用于机器人控制。与缺乏先验的图像合成不同,机器人拥有持续反馈的自身状态信号,具有显著的物理一致性与运动连续性。A2A 的核心洞察在于:既然扩散模型本质是学习分布间的映射,为何不将起点更换为信息密度更高、距离目标分布更近的历史状态先验?

核心范式

A2A 策略的设计逻辑极具直觉:将动作生成的基准从「随机噪声」切换为「动作历史」



传统扩散策略往往采取 Noise-to-Action 机制,而 A2A 则直接在更具相关性的历史与未来动作分布间建立联系。为了更进一步拉近分布距离,我们在潜空间完成 Flow Matching 学习。具体地,在 Flow 训练目标函数中



与传统 Flow Matching 不同之处在于,我们将初始分布由高斯噪声替换为历史 Action 的编码信号,进而使得流型梯度极易被神经网络捕捉。

实验证明,这种设计使得起点与终点的物理距离极近且分布高度对齐。得益于极短的传输路径,A2A 仅凭轻量级 MLP 架构与单步 Euler 积分即可快速生成高质量动作。



评估

在多项仿真(ManiSkill, RLBench, LIBERO)与真实 Franka 机器人任务中,A2A 展现出了极佳的训练效率、推理速度、以及泛化能力。

首先训练效率方面,A2A 展现出极快的收敛速度,仅需少量训练轮次即可达到稳定的 100% 成功率。在 5 类仿真任务中,其成功率全面领先于 8 种主流方法,并在有限数据下也能够维持高性能表现。





此外,推理速度方面,A2A 实现了亚毫秒级的极致推理速度,平均延迟仅约 1ms,在单步推理模式下延迟更是低至 0.56ms,比传统扩散策略快 20 倍,比常规流匹配方法(10 步)快 5 倍。



最后,A2A 极大提升了视觉泛化性。例如,实验中将抓取木块换成从未见过的发光方块,传统扩散和流匹配策略均会彻底失效,而 A2A 仍可维持 80% 的高成功率。



无论是面对场景随机化(Level 1)、灯光扰动(Level 2)还是视角切换(Level 3),A2A 的成功率均领先于现有算法 。这归功于 A2A 的解耦策略,将动作历史作为稳固的先验,减少了对易受干扰视觉特征的依赖。



提升空间与发展潜力

A2A 目前训练过程涉及多个训练目标,如何进一步简化训练目标值得进一步探索。此外,A2A 的逻辑普适于各类具有时间连续性的任务。研究团队将其扩展至视频生成领域,提出了F2F(Frames-to-Frames) 范式。通过在潜空间将历史帧映射至未来帧,F2F 生成的图像质量指标(PSNR、SSIM 等)显著优于传统的确定性回归基准,展现了广阔的具身智能应用前景。

主要作者信息

贾金豆:新加坡南洋理工大学 MARS Lab 博士后,研究方向包括 VLA、扩散生成模型等。以第一作者在 IJRR、TRO、ICLR oral、RAL、TAES、CEP、ICRA 等期刊会议上发表多篇论文。个人主页:https://jiajindou.github.io/

李根:新加坡南洋理工大学 MARS Lab 博士后,研究方向包括具身智能、VLA 等。在 NMI、CVPR、ICCV 等顶级期刊与会议发表多篇论文。个人主页:https://reagan1311.github.io/

杨剑飞:新加坡南洋理工大学机械与宇航学院和电子与电气工程学院双聘助理教授,博士生导师,MARS Lab 主任,主要研究方向为多模态具身智能。曾在加州大学伯克利分校、哈佛大学和东京大学进行学术研究。个人主页:https://marsyang.site/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
车圈代言人都玩谐音梗?小米SU7请了舒淇,莫文蔚来了,古天乐道了,网友喊话余承东和于谦代言小米YU7

车圈代言人都玩谐音梗?小米SU7请了舒淇,莫文蔚来了,古天乐道了,网友喊话余承东和于谦代言小米YU7

极目新闻
2026-03-25 18:54:45
媒体报道蔡正元将于近期在岛内入狱服刑,国台办回应

媒体报道蔡正元将于近期在岛内入狱服刑,国台办回应

澎湃新闻
2026-03-25 12:27:03
国家出手!成品油价临时调控,每升少涨8毛5

国家出手!成品油价临时调控,每升少涨8毛5

大象新闻
2026-03-23 15:49:01
核圈失守!以色列防空神话被击穿,伊朗打击圈冲出中东近4000公里,美以伊三方棋局彻底乱了!

核圈失守!以色列防空神话被击穿,伊朗打击圈冲出中东近4000公里,美以伊三方棋局彻底乱了!

国是直通车
2026-03-22 16:00:02
杜兰特&伦纳德2选1?我是杜兰特忠实粉丝,但我还是会选伦纳德

杜兰特&伦纳德2选1?我是杜兰特忠实粉丝,但我还是会选伦纳德

懂球帝
2026-03-26 00:02:19
《浪姐7》糊咖扎堆,大牌只有两位,3人成流量担当,4人有黑马相

《浪姐7》糊咖扎堆,大牌只有两位,3人成流量担当,4人有黑马相

八卦南风
2026-03-25 17:32:20
最后一节拯救了球队!但掘金后场核心在前三节的表现都非常平庸?

最后一节拯救了球队!但掘金后场核心在前三节的表现都非常平庸?

稻谷与小麦
2026-03-26 00:45:27
第五代五菱新车官宣:3月27日,正式上市

第五代五菱新车官宣:3月27日,正式上市

高科技爱好者
2026-03-25 23:09:03
伊朗军方称击落美军F-18战机

伊朗军方称击落美军F-18战机

财联社
2026-03-26 01:36:08
张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

离离言几许
2026-03-25 15:07:06
湖北男童在房后池塘溺亡,母亲曝光监控,却被姑姐反咬:你克的

湖北男童在房后池塘溺亡,母亲曝光监控,却被姑姐反咬:你克的

离离言几许
2026-03-24 15:56:35
蔡崇信133亿第六!现役最富有的五位NBA老板:鲍尔默超第二885亿

蔡崇信133亿第六!现役最富有的五位NBA老板:鲍尔默超第二885亿

你的篮球频道
2026-03-25 14:15:30
摩根大通CEO竟鼓吹: 打赢这场战,才好跟中国对垒

摩根大通CEO竟鼓吹: 打赢这场战,才好跟中国对垒

观察者网
2026-03-25 16:56:10
9分钟0分1板,赢20分的局正负值为负,这就是曾有望进NBA的选手?

9分钟0分1板,赢20分的局正负值为负,这就是曾有望进NBA的选手?

弄月公子
2026-03-25 08:42:03
终于有了结果,曾医生能保住医院的工作,最应该感谢的三位贵人!

终于有了结果,曾医生能保住医院的工作,最应该感谢的三位贵人!

凌风的世界观
2025-11-14 08:38:31
定了!又有明星来东莞开演唱会!

定了!又有明星来东莞开演唱会!

东莞好生活
2026-03-25 22:14:51
海湾国家转向?“沙特、阿联酋反对停战”

海湾国家转向?“沙特、阿联酋反对停战”

观察者网
2026-03-25 18:53:10
伊朗一高级官员说对美国停战提议做出“消极回应”

伊朗一高级官员说对美国停战提议做出“消极回应”

每日经济新闻
2026-03-26 00:10:55
一年流出视频294部的小宝到底探过多少朵花?

一年流出视频294部的小宝到底探过多少朵花?

挪威森林
2026-01-25 17:18:42
中国代表呼吁以全球治理倡议为引领,完善全球人权治理

中国代表呼吁以全球治理倡议为引领,完善全球人权治理

新华社
2026-03-25 18:01:05
2026-03-26 02:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12598文章数 142593关注度
往期回顾 全部

科技要闻

红极一时却草草收场,Sora宣布正式关停

头条要闻

伊朗:正在搜捕逃亡美军

头条要闻

伊朗:正在搜捕逃亡美军

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

管涛:中东局势如何影响人民币汇率走势?

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

房产
时尚
本地
数码
军事航空

房产要闻

41亿!259亩!建学校…三亚这个大城更,最新方案曝光!

女人过了40岁别胡乱穿衣,赶紧看看这些日系穿搭,舒适又耐看

本地新闻

来永泰同安 赴一场春天的约会

数码要闻

苹果macOS 26.4新增“慢速充电器”提示

军事要闻

伊朗重申非交战国家船只可安全通过霍尔木兹海峡

无障碍浏览 进入关怀版