网易首页 > 网易号 > 正文 申请入驻

推理成功率暴涨 30%!极佳视界发布全新世界模型GigaWorld-Policy

0
分享至



近日,极佳视界(GigaAI)正式发布全新的「世界-动作模型」(World-Action Model,简称 WAM)—— GigaWorld-Policy。这款模型直击现有具身大模型「推理慢、训练难」的行业痛点,交出了一份堪称惊艳的成绩单:推理速度飙升 10 倍,训练效率提升 10 倍,真机任务成功率更是大幅上涨了 30%。GigaWorld-Policy 的发布,不仅全面刷新了主流 WAM 模型的性能上限,更意味着由世界模型驱动的机器人,真正迈入了「高频实时闭环控制」的落地新纪元。



  • 项目主页:https://gigaai-research.github.io/GigaWorld-Policy/
  • 论文:https://arxiv.org/pdf/2603.17240
  • 代码:https://github.com/open-gigaai/giga-world-policy



视频地址:https://mp.weixin.qq.com/s/1TtkZLC-gS4RoH8cyod7Zg?click_id=41

破局跨模态耦合:

「动作为中心」架构让推理提速 10 倍

传统的 WAM 架构往往深陷于「视频预测」的泥潭中:在推理阶段需要同时生成未来视觉画面与动作,这种跨模态的深度耦合带来了极高的计算延迟。为了打破这一瓶颈,GigaWorld-Policy 另辟蹊径,创新性地提出了一种「以动作为中心(Action-Centered)」的模型范式。

该架构基于极佳视界轻量级世界模型 GigaWorld-0.5 打造,在底层结构上实现了多模态表征的统一。它将视觉观测、机器人状态以及动作序列映射到同一个嵌入空间中,通过单一的 Transformer 主干网络进行协同建模,彻底消除了传统多分支架构中的模态割裂感。其最核心亮点在于「训繁推简」的混合策略:

  • 训练期「加码」:模型引入了因果掩码(Causal Mask)机制,将动作 Token 与未来视觉 Token 进行统一建模。这使得动作预测任务能够充分享受未来视觉动态带来的高密度监督信号。
  • 推理期「减负」:在实际部署中,模型果断舍弃了沉重的视频预测分支,仅保留轻量化的动作生成模块。

这种「卸下包袱」的设计,从根本上规避了结构性计算冗余。与 Motus、Cosmos Policy 等当前主流模型相比,GigaWorld-Policy 在保证高质量策略输出的同时,推理速度实现了 10 倍的跨越式提升,其紧凑的多视角拼接表征也大幅降低了显存占用,为工业级的大规模部署铺平了道路。





视频地址:https://mp.weixin.qq.com/s/1TtkZLC-gS4RoH8cyod7Zg?click_id=41

压榨视频数据价值:

分层训练法带来 10 倍效率飞跃

如何用更少的数据、更短的时间训练出聪明的「具身大脑」?GigaWorld-Policy 给出的答案是三段式高效训练 Pipeline,将海量视频数据的价值挖掘到了极致:

  • 通用物理世界预训练:首先,利用海量互联网视频数据,让 GigaWorld-0.5 建立起对通用物理规律和视觉动态的基础认知。
  • 具身场景沉浸式微调:随后,引入数千小时涵盖第一人称、真机及仿真的多源操作视频。在这一阶段,模型专攻「具身交互」场景,掌握特定空间下的时空演变规律。
  • 极小样本的动作对齐:最后,在拥有强大「世界观」的基础上,仅需极少量的真机动作标签数据进行训练,即可将预训练世界模型与机器人的动作预测精准对齐,快速打通「观测 - 动作 - 未来视觉」的因果映射。

这种「基础能力大规模预训练 + 任务适配小样本微调」的分层范式,相较传统 VLA 训练方案,实现了整体训练效率 10 倍提升。



真机实测霸榜:

成功率绝对值暴涨 30%

抛开理论数据,真机实操才是检验具身智能的唯一标准。在涵盖了抓取、装配、物品整理等多种典型机器人任务的严苛评测中,GigaWorld-Policy 在「成功率 - 推理速度」的权衡曲线上找到了当前行业的最优解,是唯一同时实现高成功率与高实时控制频率的模型。

  • 成功率断层领先GigaWorld-Policy 在真机任务中的平均成功率逼近 85%。面对 Cosmos-Policy 等强劲对手,其成功率绝对值提升了超过 30%。即便对比某些主打极速推理的 Pi 系列模型,它依然凭借对物理世界规律的深刻理解稳占上风。
  • 跨越实时控制门槛:对比 Motus,GigaWorld-Policy 不仅大幅缩减了显存占用,更实现了 10 倍的推理提速。这种毫秒级的响应能力至关重要——只有高效的执行速度,机器人才能游刃有余地应对现实环境中的动态干扰和执行误差,这也是其高成功率的底层基石。



GigaWorld-Policy 的诞生,是对传统具身智能策略学习的一次重要范式重构。它切中了传统 WAM 架构「推理延迟高、视觉与动作表征耦合过深」的问题。在训练时,利用未来视频生成为动作学习提供密集的动力学约束;在推理时,则轻装上阵,实现了效率与性能的双重跃升。GigaWorld-Policy 让世界模型在机器人领域的落地应用更具实用性,也为机器人在真实物理世界中的实时、高效操控,提供了一套极具价值的全新解法。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
奥运冠军全红婵的真实困境:最大的敌人原来是她

奥运冠军全红婵的真实困境:最大的敌人原来是她

君好伴读
2026-04-09 22:36:33
“台独”顽固分子萧美琴发表声明!

“台独”顽固分子萧美琴发表声明!

安安说
2026-04-10 12:18:00
天啊!看到1987年春晚观众席的迟重瑞,才懂陈丽华为啥一见钟情

天啊!看到1987年春晚观众席的迟重瑞,才懂陈丽华为啥一见钟情

观察鉴娱
2026-04-09 09:36:18
被问针织比基尼透不透气?你穿一次不就知道了!

被问针织比基尼透不透气?你穿一次不就知道了!

飛娱日记
2026-04-06 09:14:56
陈丽华,吃到“唐僧肉”的女首富

陈丽华,吃到“唐僧肉”的女首富

难得君
2026-04-08 08:36:45
江学勤的“伊朗赢学”,不过是满纸荒唐言

江学勤的“伊朗赢学”,不过是满纸荒唐言

冰川思想库
2026-04-09 11:57:47
"我不要活了!"上海一阿婆崩溃,买了近30年的保险全被退!警方:若继续持有价值百万

"我不要活了!"上海一阿婆崩溃,买了近30年的保险全被退!警方:若继续持有价值百万

台州交通广播
2026-04-09 22:32:54
露馅了!阿奇王子奔跑在草地,两年不长高引热议,梅根解释不清

露馅了!阿奇王子奔跑在草地,两年不长高引热议,梅根解释不清

夜深爱杂谈
2026-04-10 11:45:48
证据实锤!网暴全红婵和王楚钦的,是同一批人!检察日报出面撑腰

证据实锤!网暴全红婵和王楚钦的,是同一批人!检察日报出面撑腰

橙星文娱
2026-04-10 10:30:42
日媒:日官员称高市或突然辞职,去留凭自民党大佬,下任首相已定

日媒:日官员称高市或突然辞职,去留凭自民党大佬,下任首相已定

二爷台球解说
2026-04-09 17:30:18
痛心 | 余红李牺牲!年仅45岁!

痛心 | 余红李牺牲!年仅45岁!

天津广播
2026-04-10 10:25:57
巴萨向欧足联申诉:裁判违反规则,巴萨已多年受害

巴萨向欧足联申诉:裁判违反规则,巴萨已多年受害

体坛周报
2026-04-10 09:40:44
一周竟然7次,32岁男子心源性猝死,妻子:劝了很多次,就是不听

一周竟然7次,32岁男子心源性猝死,妻子:劝了很多次,就是不听

健康之光
2026-04-08 10:56:55
男演员最新声明:已退出美国国籍,正式成为中国公民

男演员最新声明:已退出美国国籍,正式成为中国公民

美芽
2026-04-08 18:02:54
台湾票房冠军大陆遇冷,观众开始抵触“催泪”?

台湾票房冠军大陆遇冷,观众开始抵触“催泪”?

观察者网
2026-04-09 16:58:07
吃完了宴席,两岸在上海谈妥,对赖清德改了称呼,郑丽文一锤定音

吃完了宴席,两岸在上海谈妥,对赖清德改了称呼,郑丽文一锤定音

影孖看世界
2026-04-09 19:54:02
哈梅内伊家族有多富?

哈梅内伊家族有多富?

律法刑道
2026-04-09 11:45:27
“新型啃老”席卷全国:孩子不工作也不伸手要钱,家长担心毁一生

“新型啃老”席卷全国:孩子不工作也不伸手要钱,家长担心毁一生

寻墨阁
2026-04-03 07:53:18
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
日本真的想和中国开战吗?为什么它不敢挑衅美国和俄罗斯?

日本真的想和中国开战吗?为什么它不敢挑衅美国和俄罗斯?

枫冷慕诗
2026-04-09 11:36:34
2026-04-10 14:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12721文章数 142621关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

夏克立婚内出轨 曾参加《爸爸去哪儿》

财经要闻

爱尔眼科一院长被指猥亵 总部:已被停职

汽车要闻

全新一代理想 L8 五座旗舰+5C增程系统 三季度交付

态度原创

家居
数码
本地
公开课
军事航空

家居要闻

复古风格 自然简约

数码要闻

解决显卡烧接口!华硕推新款供电线:单线承载17A 直接免费送

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:对美国与伊朗达成和平协议“非常乐观”

无障碍浏览 进入关怀版