网易首页 > 网易号 > 正文 申请入驻

NTU MARS Lab提出A2A新范式,实现机器人高性能单步动作生成

0
分享至



在机器人领域,扩散策略(Diffusion Policy)已经成为了标准模仿学习策略和 VLA 动作生成范式,但其「从随机噪声中迭代解噪」的机制带来了不容忽视的推理延迟。如果机器人不再从随机高斯噪声开始「盲猜」,是否可以基于「刚刚做了什么」来预测「下一步做什么」呢?

新加坡南洋理工大学 MARS Lab 提出Action-to-Action (A2A) Flow Matching新范式:以历史机器人轨迹而非随机噪声作为生成起点,打破了生成速度与精度的双重瓶颈,实现了更高训练效率、极速推理响应及卓越的泛化表现。



  • Website:https://lorenzo-0-0.github.io/A2A_Flow_Matching
  • ArXiv:https://arxiv.org/pdf/2602.07322
  • Code:https://github.com/JIAjindou/A2A_Flow_Matching

背景

扩散策略已成为机器人多模态动作建模的主流方法,但其依赖从随机噪声中进行多步迭代解噪,推理延迟较高,在实时控制场景中构成关键瓶颈。虽然现有工作尝试优化噪声初始化,但仍未摆脱「从噪声到数据」的长程生成路径。

这种「去噪」思维源自图像生成,但并不完全适用于机器人控制。与缺乏先验的图像合成不同,机器人拥有持续反馈的自身状态信号,具有显著的物理一致性与运动连续性。A2A 的核心洞察在于:既然扩散模型本质是学习分布间的映射,为何不将起点更换为信息密度更高、距离目标分布更近的历史状态先验?

核心范式

A2A 策略的设计逻辑极具直觉:将动作生成的基准从「随机噪声」切换为「动作历史」



传统扩散策略往往采取 Noise-to-Action 机制,而 A2A 则直接在更具相关性的历史与未来动作分布间建立联系。为了更进一步拉近分布距离,我们在潜空间完成 Flow Matching 学习。具体地,在 Flow 训练目标函数中



与传统 Flow Matching 不同之处在于,我们将初始分布由高斯噪声替换为历史 Action 的编码信号,进而使得流型梯度极易被神经网络捕捉。

实验证明,这种设计使得起点与终点的物理距离极近且分布高度对齐。得益于极短的传输路径,A2A 仅凭轻量级 MLP 架构与单步 Euler 积分即可快速生成高质量动作。



评估

在多项仿真(ManiSkill, RLBench, LIBERO)与真实 Franka 机器人任务中,A2A 展现出了极佳的训练效率、推理速度、以及泛化能力。

首先训练效率方面,A2A 展现出极快的收敛速度,仅需少量训练轮次即可达到稳定的 100% 成功率。在 5 类仿真任务中,其成功率全面领先于 8 种主流方法,并在有限数据下也能够维持高性能表现。





此外,推理速度方面,A2A 实现了亚毫秒级的极致推理速度,平均延迟仅约 1ms,在单步推理模式下延迟更是低至 0.56ms,比传统扩散策略快 20 倍,比常规流匹配方法(10 步)快 5 倍。



最后,A2A 极大提升了视觉泛化性。例如,实验中将抓取木块换成从未见过的发光方块,传统扩散和流匹配策略均会彻底失效,而 A2A 仍可维持 80% 的高成功率。



无论是面对场景随机化(Level 1)、灯光扰动(Level 2)还是视角切换(Level 3),A2A 的成功率均领先于现有算法 。这归功于 A2A 的解耦策略,将动作历史作为稳固的先验,减少了对易受干扰视觉特征的依赖。



提升空间与发展潜力

A2A 目前训练过程涉及多个训练目标,如何进一步简化训练目标值得进一步探索。此外,A2A 的逻辑普适于各类具有时间连续性的任务。研究团队将其扩展至视频生成领域,提出了F2F(Frames-to-Frames) 范式。通过在潜空间将历史帧映射至未来帧,F2F 生成的图像质量指标(PSNR、SSIM 等)显著优于传统的确定性回归基准,展现了广阔的具身智能应用前景。

主要作者信息

贾金豆:新加坡南洋理工大学 MARS Lab 博士后,研究方向包括 VLA、扩散生成模型等。以第一作者在 IJRR、TRO、ICLR oral、RAL、TAES、CEP、ICRA 等期刊会议上发表多篇论文。个人主页:https://jiajindou.github.io/

李根:新加坡南洋理工大学 MARS Lab 博士后,研究方向包括具身智能、VLA 等。在 NMI、CVPR、ICCV 等顶级期刊与会议发表多篇论文。个人主页:https://reagan1311.github.io/

杨剑飞:新加坡南洋理工大学机械与宇航学院和电子与电气工程学院双聘助理教授,博士生导师,MARS Lab 主任,主要研究方向为多模态具身智能。曾在加州大学伯克利分校、哈佛大学和东京大学进行学术研究。个人主页:https://marsyang.site/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
学医后才知道,保护心血管最好的运动,不是快走慢跑,而是这个

学医后才知道,保护心血管最好的运动,不是快走慢跑,而是这个

垚垚分享健康
2026-03-26 13:09:39
奥恰洛夫:我从圈内听说,樊振东明年甚至有可能再换一次俱乐部

奥恰洛夫:我从圈内听说,樊振东明年甚至有可能再换一次俱乐部

懂球帝
2026-03-26 11:24:21
巴蒂:曾想成为大罗那样的前锋但我做不到;哈兰德让我很惊讶

巴蒂:曾想成为大罗那样的前锋但我做不到;哈兰德让我很惊讶

懂球帝
2026-03-26 11:02:09
一路走好!中医大师黄贵华疑因心脏骤停去世,和张雪峰有相同习惯

一路走好!中医大师黄贵华疑因心脏骤停去世,和张雪峰有相同习惯

冷紫葉
2026-03-26 18:24:16
英国以国家安全为由否决了中企在苏格兰建厂计划,外交部:中英经贸绿色合作的本质是互利共赢,不应受到泛政治化、泛安全化的冲击

英国以国家安全为由否决了中企在苏格兰建厂计划,外交部:中英经贸绿色合作的本质是互利共赢,不应受到泛政治化、泛安全化的冲击

潇湘晨报
2026-03-26 16:25:20
美军继续调兵,伊朗已在哈尔克岛布雷备战!鸽派将军们坚持打下去

美军继续调兵,伊朗已在哈尔克岛布雷备战!鸽派将军们坚持打下去

鹰眼Defence
2026-03-26 16:06:38
美军第82空降师3000人出兵,危急时刻,伊朗特种兵亮剑56冲和FPV

美军第82空降师3000人出兵,危急时刻,伊朗特种兵亮剑56冲和FPV

沧海旅行家
2026-03-26 13:11:41
高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

大风新闻
2026-03-26 18:19:03
蛊惑人心 1:独狼瘸东

蛊惑人心 1:独狼瘸东

金昔说故事
2026-03-26 19:57:07
经济学家巴曙松被带走调查?港交所回应

经济学家巴曙松被带走调查?港交所回应

澎湃新闻
2026-03-25 20:01:16
60年前,金门战役里被俘的3000名我军将士,如今都怎么样了

60年前,金门战役里被俘的3000名我军将士,如今都怎么样了

老范谈史
2026-03-17 09:58:57
纪念张雪峰的三个理由

纪念张雪峰的三个理由

阿亮评论
2026-03-25 09:20:28
骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

鱼崖大话篮球
2026-03-26 11:49:12
A股最惨股票!43个跌停从106元跌到0.07元,股民被连根拔起

A股最惨股票!43个跌停从106元跌到0.07元,股民被连根拔起

财经市界
2026-03-10 08:42:16
小米把这套系统藏了15年,今天终于拔了插头

小米把这套系统藏了15年,今天终于拔了插头

我是一个粉刷匠2
2026-03-26 10:29:50
以军对伊朗基础设施发动大规模打击

以军对伊朗基础设施发动大规模打击

新华社
2026-03-26 12:29:02
大意了!张雪峰不同时段坐姿,证明他越来越疲惫了,可惜错过了

大意了!张雪峰不同时段坐姿,证明他越来越疲惫了,可惜错过了

魔都姐姐杂谈
2026-03-26 10:53:11
“14天12板”!000908,复牌后上演“地天板”

“14天12板”!000908,复牌后上演“地天板”

大众证券报
2026-03-26 17:58:54
浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

独角showing
2025-12-31 21:08:57
男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

念洲
2026-03-26 13:12:32
2026-03-26 20:31:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12606文章数 142594关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
家居
教育
房产
游戏

皮衣+裙,高级到炸

家居要闻

傍海而居 静观蝴蝶海

教育要闻

2026人工智能时代下的教育课堂变革

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

《迷你金属2》4月开启开发版测试 军事题材战略模拟

无障碍浏览 进入关怀版