来源:市场资讯
(来源:CAAI认知系统与信息处理专委会)
你是否想过,为什么人类换一辆新车开,几分钟就能上手,而无人机换个螺旋桨,就得重新调参甚至重新训练控制算法?这是因为当前主流的强化学习控制策略高度“过拟合”单一平台,环境稍有变化就会失效。为了解决这一痛点,来自纽约大学等机构的研究团队提出了RAPTOR——一个面向四旋翼控制的基础策略(Foundation Policy)。它通过元模仿学习和极轻量级的循环神经网络,实现了对从32克到2.4公斤、不同电机类型、不同桨叶数、不同飞控固件的10种真实无人机的零样本自适应控制,为通用机器人控制开辟了新道路。
重要结果:一个模型,10种平台,多种极端条件轻松应对
研究团队在10种真实四旋翼和2种模拟器上对RAPTOR进行了全面测试。这些平台涵盖了32g至2.4kg的重量范围、1.75~12的推重比、有刷/无刷电机、软/硬机架、2/3/4叶螺旋桨,以及PX4、Betaflight、Crazyflie等不同飞控。令人惊讶的是,仅含2084个参数的三层循环神经网络,就能在零样本下稳定控制所有这些平台,甚至在推重比超出训练范围两倍(12 vs 5)的飞行模拟器上也能保持控制。
![]()
在轨迹跟踪任务中,RAPTOR实现了0.07~0.29米的均方根误差,与为单一平台专门训练的SOTA策略相当。它还能抵抗强烈戳击(倾斜超过90°后恢复)、在机顶放置重物时自适应补偿、在7~10米/秒的风中稳定飞行,甚至在同时更换1~3个不同桨叶(两叶与三叶混装)时仍然精准跟踪轨迹。此外,RAPTOR可以在中空激活:无人机以4.5米/秒飞行时一键启用策略,隐藏状态重置后仅需毫秒级自适应即可恢复悬停。这些结果证明,RAPTOR具备前所未有的跨平台泛化能力和鲁棒性。
️ 具体方法:两步蒸馏 + 极简递归网络
RAPTOR的核心方法分为预训练和元模仿学习两个阶段。首先,研究团队设计了一个覆盖真实四旋翼动力学参数(质量、臂长、推力曲线、惯性矩阵、电机延迟等)的宽泛分布,从中随机采样1000个虚拟四旋翼,并针对每一个独立训练一个教师策略(使用SAC算法,全状态观测,3层64维网络)。这1000个教师各自专精于一个平台,但由于它们相互独立,预训练可以在1000个CPU核心上仅需31分钟即可完成全部训练。
第二阶段,研究者将所有教师的行为蒸馏成一个学生基础策略。学生策略无法直接观测动力学参数和电机状态,只能看到历史观测与自身动作序列。为此,学生采用了一个门控循环单元(GRU),隐藏维度仅为16,总参数量2084。训练时,学生通过在线采样(前10个epoch使用教师rollout作为预热,之后完全on-policy)预测教师的电机指令,强制其在隐藏状态中隐式推断当前无人机的动力学参数。线性探针实验证实,仅用学生隐藏状态的线性变换就能高精度预测推重比(R²=0.949)。这种通过上下文推理实现隐式系统辨识的能力,使RAPTOR能够零样本适应未见过的平台。
未来展望:从四旋翼到更多机器人
尽管RAPTOR已展现出惊人的泛化能力,研究团队指出了几个值得深化的方向。第一,Sim2Real中的延迟问题:飞控固件和状态估计链路的延迟会显著影响循环策略的表现,未来可以通过在训练中随机化延迟或直接采用IMU原始数据实现更彻底的端到端控制。第二,对线速度观测的过度依赖:目前策略严重依赖线速度进行隐式辨识,而实际部署中线速度常有延迟或漂移,加入加速度计噪声或直接增加加速度观测可以提升鲁棒性。第三,域随机化范围仍有局限:对于推重比>5的超敏捷无人机(如Flightmare),跟踪误差会增大,未来可进一步拓宽动力学参数分布。第四,加入轨迹前瞻:当前策略缺乏对参考轨迹未来信息的利用,这是进一步提升高速轨迹跟踪精度的关键。
RAPTOR的成功证明,即使是极小规模的神经网络,也能通过广阔的域随机化和元模仿学习获得通用且自适应的控制能力。这项工作不仅为四旋翼控制提供了即插即用的基础策略,也为其他机器人系统(如腿足机器人、机械臂)迈向“基础策略”时代提供了可复用的方法论。研究者已将全部代码、1000个教师策略和交互式网页仿真开放,期待社区在此基础上构建更强大、更通用的机器人控制基础模型。
论文信息: Jonas Eschmann et al., “RAPTOR: A foundation policy for quadrotor control”, Science Robotics, 2026.
项目主页:https://raptor.rl.tools
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.