网易首页 > 网易号 > 正文 申请入驻

智元发布Act2Goal方案:世界模型让机器人真正懂得如何达成目标

0
分享至

IT之家 12 月 31 日消息,智元机器人今日宣布发布 Act2Goal 方案,世界模型让机器人真正“懂”得如何达成目标。


据了解,Act2Goal 是一个新的操作算法,也是一种让机器人“以终为始”的全新思维方式。不同于传统机器人机械地执行死板指令,Act2Goal 引入了“目标条件世界模型”。Act2Goal 的核心在于将目标条件世界模型与动作生成策略统一于端到端框架,实现对任务演化过程的结构化理解。在每次操作前,系统不仅感知当前状态和目标状态,还通过世界模型预测从当前到目标的未来视觉轨迹,为动作专家提供连续、多尺度的规划依据。

IT之家附官方介绍如下:

给机器人一张“目标照片”,它就能自己想办法把面前的场景变成照片里的样子吗?

智元具身研究中心给出了肯定的答案。

Act2Goal—— 这不仅仅是一个新的操作算法,更是一种让机器人“以终为始”的全新思维方式。

不同于传统机器人机械地执行死板指令,Act2Goal 引入了“目标条件世界模型”。这意味着,机器人不再只是“看一步走一步”,而是拥有了预见未来的能力 —— 在真正动手之前,它已经在大脑中构建了从现状通往目标的完整因果链条。这种将视觉推理与动作控制合二为一的端到端架构,让 Act2Goal 能够在从未见过的环境和物体面前,展现出惊人的零样本泛化能力。

更令人兴奋的是,Act2Goal 具备“自我进化”的本能。它不需要人类手把手教(无奖励信号),就能在真实世界的交互中,快速“复盘”自己的行为轨迹。实验数据显示,面对高难度的陌生任务,Act2Goal 仅需数分钟的在线自我磨练,成功率就能从 30% 提升至 90%。

所见即所向,让机器人的每一次行动,都精准地通往目标。


在视觉信息能够直接反映任务目标的场景中,使用目标图像作为条件输入能够更直观地指导机器人动作。然而,当面临长时序操作、复杂物体交互或训练数据分布外环境时,这类方法往往难以保持稳定性能。现有目标条件策略通常只关注当前状态与目标状态,而缺乏对两者之间任务过程的显式建模,主流方法多采用直接映射的范式,将当前观测与目标状态输入策略网络以预测动作,这使得机器人难以判断执行进度,也容易在任务延长或环境变化时出现误差累积。Act2Goal 通过在动作生成之前引入目标条件世界模型,对从当前状态到目标状态的演化过程进行建模,并生成一系列中间视觉状态作为任务进程的结构化表征,为机器人动作提供明确操作锚点,使机器人能够更稳定地执行长时序任务。


01、端到端目标条件策略:从目标感知到动作规划的统一

Act2Goal 的核心在于将目标条件世界模型与动作生成策略统一于端到端框架,实现对任务演化过程的结构化理解。在每次操作前,系统不仅感知当前状态和目标状态,还通过世界模型预测从当前到目标的未来视觉轨迹,为动作专家提供连续、多尺度的规划依据。通过这种方式,目标不再是静态终点,而是一条可感知、可跟随的演化路径,从而显著提升长时序操作的稳定性与泛化能力。这一范式带来了两个关键优势:

长时序任务中保持高精度与全局对齐:端到端设计结合多尺度时间规划,使机器人既能精确执行短期动作,又能保持整体目标方向一致。

零样本泛化与快速适应新场景:系统能够在未见过的物体、目标配置或复杂环境中稳定执行,并通过在线自我提升机制快速适应新任务,进一步增强鲁棒性和可扩展性。

02、多尺度时域哈希(MSTH):兼顾短期精细操作与全局合理规划

为了在长时序任务中同时处理精细动作和全局规划,Act2Goal 引入了多尺度时域哈希(Multi-Scale Temporal Hashing, MSTH)机制。系统将规划过程划分为:

  • 短时精细段(Proximal):连续高频采样,用于精确控制机械臂动作;
  • 长时粗粒段(Distal):自适应采样,用于全局路径规划和目标对齐。

这种设计使机器人在复杂操作中能够兼顾局部动作精度与整体目标方向,有效防止误差累积和目标偏离。

MSTH 可同时应用于世界模型的视觉规划与动作专家模块的动作规划。


目标驱动的世界模型基于 MSTH 规则生成操作视频

03、离线模仿学习

为了让 Act2Goal 具备强大的泛化能力,系统首先通过大规模离线模仿学习进行训练。系统微调预训练的世界模型,使其能够生成从当前状态到目标状态的多视角、多尺度视觉轨迹,并遵循 MSTH 规则。动作生成模块与世界模型联合训练,通过参考轨迹预测生成可执行动作。这种联合训练保证了视觉轨迹预测不仅真实可信,而且能够有效指导动作生成,为动作规划奠定基础。系统对整个端到端模型进行行为克隆微调,使从视觉感知到动作生成形成完整闭环。通过以上训练,Act2Goal 学会根据当前状态和目标状态预测未来轨迹,并生成可执行动作,从而具备良好的泛化能力和长期操作稳定性。


部署 Act2Goal 模型的 G01 机器人在多个域外任务上展现出色性能

04、在线自我提升

尽管离线训练使系统具备较强的泛化能力,但在真实环境中面对新任务、未知物体或复杂操作链时,机器人仍可能遇到性能下降。为此,Act2Goal 引入在线自我提升机制,利用回顾性经验重放(HER)实现自主性能优化。

在执行过程中,机器人会自动收集每一步的状态、动作及执行结果,并将轨迹重新标注为新的目标示例,存入回放缓冲区。无论任务是否成功完成,系统都能利用这些数据进行端到端微调,仅更新新增的 LoRA 层参数,基础模型保持冻结。通过这一机制,机器人能够在未见过的环境和目标中快速适应,实现零样本泛化与长期稳定操作,为复杂任务提供强大的鲁棒性和可扩展性。


部署 Act2Goal 模型的机器人在线练习绘制未见过的图案,持续提升性能

Act2Goal 的核心贡献在于重新审视了目标条件操作中的一个基本问题:从当前状态到目标状态之间,机器人是否真正理解过程?通过在策略中显式引入目标条件世界模型,并结合多尺度时间建模与深度融合机制,我们为目标条件机器人操作提供了一种新的建模范式。我们相信,这种“先理解世界如何变化,再决定如何行动”的思路,将为更通用、更可靠的机器人系统提供重要支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
假如人类消失后,地球需要多久,才能彻底抹去人类存在的痕迹?

假如人类消失后,地球需要多久,才能彻底抹去人类存在的痕迹?

半解智士
2025-12-31 22:42:07
人心不足蛇吞象。靠赵本山走红的闫学晶,终因荒唐行为自食苦果

人心不足蛇吞象。靠赵本山走红的闫学晶,终因荒唐行为自食苦果

桑葚爱动画
2026-01-01 20:14:59
12月30日,解放军公布驻幻影2000机场的实时画面:让台军彻底死心

12月30日,解放军公布驻幻影2000机场的实时画面:让台军彻底死心

云上乌托邦
2025-12-31 12:14:57
男人注意:女人若有过很多男人,多半有这5个表现,别傻傻看不清

男人注意:女人若有过很多男人,多半有这5个表现,别傻傻看不清

伊人河畔
2025-12-04 11:27:19
美邀3方在北京开会,日本刚入座,就收到噩耗,俄军行动准时开始

美邀3方在北京开会,日本刚入座,就收到噩耗,俄军行动准时开始

素年文史
2026-01-01 20:13:25
詹姆斯将落选全明星?想多了!3大理由证明他再次入选仍毫无悬念

詹姆斯将落选全明星?想多了!3大理由证明他再次入选仍毫无悬念

田瑞华
2026-01-01 18:52:52
年纪越大越要管住嘴,少吃萝卜白菜,多吃这3样,强免疫走路如风

年纪越大越要管住嘴,少吃萝卜白菜,多吃这3样,强免疫走路如风

江江食研社
2025-12-31 18:30:05
谈判受挫后 特朗普转发批评普京的社论

谈判受挫后 特朗普转发批评普京的社论

新浪财经
2026-01-01 05:46:01
美国为何对中国保持克制?你绝对想不到的原因!

美国为何对中国保持克制?你绝对想不到的原因!

枫冷慕诗
2025-12-03 18:25:42
10位同学已相继逝去!70后网友发帖感慨,已订好车票,马上进站了

10位同学已相继逝去!70后网友发帖感慨,已订好车票,马上进站了

另子维爱读史
2025-12-31 23:44:07
美媒:不管中国认不认,中方已经输掉关税战,7万亿数据狠狠打脸

美媒:不管中国认不认,中方已经输掉关税战,7万亿数据狠狠打脸

星星会坠落
2026-01-01 19:50:08
强盗都不装了,美国在芯片上安装“追踪定位”?中国仅用一招化解

强盗都不装了,美国在芯片上安装“追踪定位”?中国仅用一招化解

霁寒飘雪
2026-01-01 19:37:26
欧盟跌下神坛?真相很残酷:当中美俄不再供养,欧盟就原形毕露了

欧盟跌下神坛?真相很残酷:当中美俄不再供养,欧盟就原形毕露了

娱乐的硬糖吖
2026-01-01 13:34:24
新一代乌克兰年轻人主动参军抗战,用青春换民族的未来!

新一代乌克兰年轻人主动参军抗战,用青春换民族的未来!

知兵
2025-10-02 15:07:28
1979年,杨显东参观完大寨后怒批陈永贵:他骗全国人民,骗党中央

1979年,杨显东参观完大寨后怒批陈永贵:他骗全国人民,骗党中央

帝哥说史
2025-12-19 06:25:03
欧媒:中国什么都不想买,什么都想自己造,欧洲快被逼得没活路了

欧媒:中国什么都不想买,什么都想自己造,欧洲快被逼得没活路了

墨兰史书
2025-11-29 17:35:03
李湘带女儿澳门跨年!脖子戴3层珍珠项链,手戴100克拉钻戒好晃眼

李湘带女儿澳门跨年!脖子戴3层珍珠项链,手戴100克拉钻戒好晃眼

小小李娱
2025-12-30 17:44:57
央视怒批,国务院点名封杀!这几位蒙骗老百姓的大网红,彻底凉凉

央视怒批,国务院点名封杀!这几位蒙骗老百姓的大网红,彻底凉凉

大鱼简科
2025-09-02 19:34:00
电讯报:爱德华兹对魔笛的成功判断,使红军相信维尔茨能成功

电讯报:爱德华兹对魔笛的成功判断,使红军相信维尔茨能成功

懂球帝
2026-01-01 18:26:11
虽然毛主席活了83岁,保健医生却说:其实主席不具备长寿条件

虽然毛主席活了83岁,保健医生却说:其实主席不具备长寿条件

芊芊之言
2025-11-25 00:28:46
2026-01-01 21:03:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
322515文章数 606856关注度
往期回顾 全部

科技要闻

特斯拉Model 3车主首度全程自驾横穿美国

头条要闻

女子称奶奶去世公司不批假被逼离职 公司法人:害群之马

头条要闻

女子称奶奶去世公司不批假被逼离职 公司法人:害群之马

体育要闻

2026,这些英超纪录可能会被打破

娱乐要闻

跨年零点时刻好精彩!何炅飞奔拥抱

财经要闻

巴菲特「身退,权还在」

汽车要闻

一汽-大众2025年整车销量超158万辆 燃油车市占率创新高

态度原创

时尚
数码
亲子
房产
公开课

2025年,记住她们的名字!

数码要闻

微星两款32寸4K QD-OLED显示器新品重磅推出!纯黑表现提升达40%

亲子要闻

这三种儿科检查,可以当面拒绝医生!

房产要闻

实景暴击!海口这个顶流红盘,抛出准现房+顶级书包双王炸!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版