网易首页 > 网易号 > 正文 申请入驻

一套算法控制机器人军团!纯模拟环境强化学习,Figure学会像人一样走路

0
分享至

新智元报道

编辑:编辑部 HXs

【新智元导读】Figure公司通过强化学习,成功实现机器人的自然步态。利用高效物理模拟器,仅用几小时完成相当于多年训练的数据,训练出的策略无需额外调整即可「零样本」迁移至真实机器人。

现在训练机器人,都不需要真实数据了?

刚刚,Figure提出了一种全新的基于RL的端到端网络。

只需要在纯模拟环境中进行训练,用几个小时生成模拟数据,就能让Figure 02像人类一样自然行走了!

该方法的亮点如下:

  • 在模拟环境中运用强化学习,让机器人不断试错,学会像人类一样走路。

  • 通过高保真物理模拟器,仅用几个小时,就模拟出多年的数据。

  • 将模拟中的域随机化与机器人上的高频扭矩反馈相结合,无需微调,就能把模拟环境中的策略应用于真实机器人。

更让人惊喜的是,一个神经网络策略就能控制一大批机器人!

通过一个高保真物理模拟器,Figure最新的机器人仅用几个小时,就能模拟出几年的数据。

为了把模拟环境的训练成果应用到真实机器人上,团队采用了两种办法。

一是在模拟训练时进行域随机化,让机器人接触不同的物理属性;二是在真实机器人上安装高频扭矩反馈装置。

这样一来,模拟环境中训练好的策略,无需任何微调,就可以「零样本」迁移到真实硬件上。

在强化学习中,控制器通过不断试错,根据奖励信号来调整自己的行为。

Figure在高保真模拟环境中训练RL控制器,运行数千个具有不同参数和场景的虚拟人形机器人。

这种多样化的训练,使训练出的策略能直接用在真实的Figure 02机器人上,走出稳健的人类步伐。

Figure基于RL的训练方法,大大缩短了开发时间,在现实世界中表现也很稳定。

强化学习训练

用强化学习方法,在GPU加速的物理模拟环境中,训练行走控制器。

这个模拟环境效率超高,短短几个小时就能收集到相当于数年的模拟训练数据。

在模拟器中,数千个Figure 02机器人并行训练,每个机器人的物理参数都不一样。

它们会遇到各种各样的情况,像不同的地形,执行器动力学变化,以及被绊倒、滑倒和推搡等。

这时,一个神经网络策略学习控制所有的机器人。

人形机器人有个很大的优势,它的硬件平台通用性很强,能执行类似人类的任务。

不过,RL训练出来的策略,有时不是最佳的,没办法让机器人走出人类走路的感觉,比如脚跟先着地、脚尖蹬地,手臂摆动和腿部动作的配合。

所以,在训练时,会奖励那些走路轨迹像人的机器人,把偏好融入学习中。

这些轨迹为策略允许生成的行走风格建立了先验条件。

除了走路轨迹像人,研究者还设置了其他奖励条件,比如优化机器人速度跟踪、功耗更低,更好地应对外界干扰和地形变化。

从模拟到现实的跨越

最后一步,是把模拟环境中训练好的策略应用到真实的机器人上。

模拟机器人只是高维机电系统的近似,在模拟环境中训练的策略只能保证在这些模拟机器人上有效,不一定能在真实机器人上正常工作。

为解决这个问题,在模拟训练时,采用域随机化技术,随机改变每个机器人的物理属性,让策略能适应各种不同的情况。

这有助于策略零样本泛化到真实机器人上,而无需任何额外的微调。

同时,在真实机器人上,用千赫兹速率扭矩反馈控制,来修正执行器模型的误差。

这样,即使机器人之间有些差异,如地面摩擦力不同,或受到外界推搡,这个策略都具有鲁棒性,能让Figure 02机器人像人一样行走。

可以看到,10个Figure 02机器人用得都是同一个RL神经网络。

说明现有的策略不用再做调整,就能推广到大批机器人,对未来的大规模商业应用是个好消息。

Fi‍gure Robotics

Figure Robotics是一家新兴的机器人公司,专注于开发通用人形机器人,旨在通过先进的人工智能扩展人类能力。

公司专注于构建像人类一样学习和推理的机器人。

Figure Robotics一开始与OpenAI合作,然而在内部人工智能(Helix)方面取得「重大突破」后,于2025年2月结束了合作,Figure Robotics转为自主开发Helix VLA模型。

Figure 02具有肉眼看起来最接近未来成熟形态的外形设计。

简直和威尔史密斯《I,Robot》中的机器人如出一辙,浑圆的面罩模型也避免了恐怖谷效应。

身高和体重也完美模拟一个成年男性。

当机器人能像人类一样学会自然行走,是否意味着也能像人一样学会其他「自然」动作?

更加重要的一个「隐喻」是,目前所有的人形机器人都是按照人类的形态打造的。

这更加方便了未来机器人与人类生活的融合。

除了自然行走,机器人还有很多「人类技能」需要学习,但他们已经在路上了。

参考资料:

https://x.com/Figure_robot/status/1904534311589785885

https://www.figure.ai/news/reinforcement-learning-walking

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
熊园:10月经济全面降温的背后

熊园:10月经济全面降温的背后

首席经济学家论坛
2025-11-15 18:20:53
年终争冠战对阵出炉:阿卡首进决赛!第16次战辛纳,近8次交手7胜

年终争冠战对阵出炉:阿卡首进决赛!第16次战辛纳,近8次交手7胜

我爱英超
2025-11-16 06:04:25
钟嘉欣否认婚变,谈起老公笑得花枝乱颤,正在准备庆祝结婚10周年

钟嘉欣否认婚变,谈起老公笑得花枝乱颤,正在准备庆祝结婚10周年

有范又有料
2025-11-15 17:23:14
春困时的松弛感

春困时的松弛感

瞳叔捏影儿
2025-11-15 23:28:31
上下半场判若两人,杨瀚森8+13助队完成20分逆转,听朱芳雨怎么说

上下半场判若两人,杨瀚森8+13助队完成20分逆转,听朱芳雨怎么说

邹维体育
2025-11-15 12:17:31
2025年11月17日十二生肖每日运势详解(精华版)

2025年11月17日十二生肖每日运势详解(精华版)

AI智能体
2025-11-16 10:53:18
于和伟羽绒服成焦点,红毯规矩被打破?300元涨幅背后藏着什么?

于和伟羽绒服成焦点,红毯规矩被打破?300元涨幅背后藏着什么?

勺哥乡村味道
2025-11-14 12:53:01
菲律宾台风危机!受灾人超百万,中方宣布援菲,马科斯被要求辞职

菲律宾台风危机!受灾人超百万,中方宣布援菲,马科斯被要求辞职

奇思妙想生活家
2025-11-16 10:46:05
图片报:利物浦通牒科纳特不续约就冬窗走人+签格伊 拜仁恐难免签

图片报:利物浦通牒科纳特不续约就冬窗走人+签格伊 拜仁恐难免签

画夕
2025-11-16 10:31:21
上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

霹雳炮
2025-10-17 21:31:29
真相大白,狗咬人死者妹妹撒谎,监控流出,四人在门口乱砸乱扔!

真相大白,狗咬人死者妹妹撒谎,监控流出,四人在门口乱砸乱扔!

鋭娱之乐
2025-11-15 12:34:30
“默茨撑不到任期结束,就得垮”

“默茨撑不到任期结束,就得垮”

观察者网
2025-11-16 08:43:13
中芯国际CEO:存储涨价对逻辑代工有两大致命影响

中芯国际CEO:存储涨价对逻辑代工有两大致命影响

21世纪经济报道
2025-11-15 22:37:49
时光服预约人数即将到达500万,官方蓝贴解释为什么锁阵营,热修钱太多BUG,玩家怒建70个联盟号

时光服预约人数即将到达500万,官方蓝贴解释为什么锁阵营,热修钱太多BUG,玩家怒建70个联盟号

山西三炮
2025-11-16 07:44:58
亚朵大战全季,传统五星级酒店输麻了

亚朵大战全季,传统五星级酒店输麻了

IC实验室
2025-11-13 15:50:52
13年河南男子偷情被岳母发现,岳母:想让我保密就答应我一个条件

13年河南男子偷情被岳母发现,岳母:想让我保密就答应我一个条件

五元讲堂
2024-09-13 12:47:57
50多年后终于明白,当年苏联挖穿地球,为何挖到12262米就停了

50多年后终于明白,当年苏联挖穿地球,为何挖到12262米就停了

博览历史
2025-11-12 16:28:15
贝索斯晒“新格伦”火箭升空画面 马斯克:太美了

贝索斯晒“新格伦”火箭升空画面 马斯克:太美了

快科技
2025-11-15 16:33:38
启动发射任务!神舟二十二号载人飞船即将出发,为何这么急迫?

启动发射任务!神舟二十二号载人飞船即将出发,为何这么急迫?

科学黑洞v
2025-11-16 10:45:47
国防部开始介入,日本下场只有一个,解放军4舰已启航,目标明确

国防部开始介入,日本下场只有一个,解放军4舰已启航,目标明确

荷兰豆爱健康
2025-11-16 10:51:32
2025-11-16 12:03:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13878文章数 66249关注度
往期回顾 全部

科技要闻

谁在炒作全固态电池?

头条要闻

牛弹琴:中国看透了高市早苗 采取前所未有的反制措施

头条要闻

牛弹琴:中国看透了高市早苗 采取前所未有的反制措施

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

宋佳二封,易烊千玺拿奖张艺谋乐开花

财经要闻

中国县城的打工人,快被AI培训班包围了

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

艺术
教育
时尚
数码
军事航空

艺术要闻

广州白云机场T3亮相,为什么大家都觉得像“甲虫”?

教育要闻

花钱存钱,家长必看的人生感悟

今年冬天最流行的4组叠穿,让你美出新高度!

数码要闻

苹果2026 iPad路线图曝光:三款新品齐发,mini迎来史诗级升级

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版