网易首页 > 网易号 > 正文 申请入驻

推理提速 10 倍,成功率暴涨 30%!极佳视界发布全新世界模型GigaWorld-Policy

0
分享至

来源:市场资讯

(来源:机器之心)

近日,极佳视界(GigaAI)正式发布全新的「世界-动作模型」(World-Action Model,简称 WAM)—— GigaWorld-Policy。这款模型直击现有具身大模型「推理慢、训练难」的行业痛点,交出了一份堪称惊艳的成绩单:推理速度飙升 10 倍,训练效率提升 10 倍,真机任务成功率更是大幅上涨了 30%。GigaWorld-Policy 的发布,不仅全面刷新了主流 WAM 模型的性能上限,更意味着由世界模型驱动的机器人,真正迈入了「高频实时闭环控制」的落地新纪元。


  • 项目主页:https://gigaai-research.github.io/GigaWorld-Policy/

  • 论文:https://arxiv.org/pdf/2603.17240

  • 代码:https://github.com/open-gigaai/giga-world-policy

破局跨模态耦合:

「动作为中心」架构让推理提速 10 倍

传统的 WAM 架构往往深陷于「视频预测」的泥潭中:在推理阶段需要同时生成未来视觉画面与动作,这种跨模态的深度耦合带来了极高的计算延迟。为了打破这一瓶颈,GigaWorld-Policy 另辟蹊径,创新性地提出了一种「以动作为中心(Action-Centered)」的模型范式。

该架构基于极佳视界轻量级世界模型 GigaWorld-0.5 打造,在底层结构上实现了多模态表征的统一。它将视觉观测、机器人状态以及动作序列映射到同一个嵌入空间中,通过单一的 Transformer 主干网络进行协同建模,彻底消除了传统多分支架构中的模态割裂感。其最核心亮点在于「训繁推简」的混合策略:

  • 训练期「加码」:模型引入了因果掩码(Causal Mask)机制,将动作 Token 与未来视觉 Token 进行统一建模。这使得动作预测任务能够充分享受未来视觉动态带来的高密度监督信号。

  • 推理期「减负」:在实际部署中,模型果断舍弃了沉重的视频预测分支,仅保留轻量化的动作生成模块。

这种「卸下包袱」的设计,从根本上规避了结构性计算冗余。与 Motus、Cosmos Policy 等当前主流模型相比,GigaWorld-Policy 在保证高质量策略输出的同时,推理速度实现了 10 倍的跨越式提升,其紧凑的多视角拼接表征也大幅降低了显存占用,为工业级的大规模部署铺平了道路。


压榨视频数据价值:

分层训练法带来 10 倍效率飞跃

如何用更少的数据、更短的时间训练出聪明的「具身大脑」?GigaWorld-Policy 给出的答案是三段式高效训练 Pipeline,将海量视频数据的价值挖掘到了极致:

  • 通用物理世界预训练:首先,利用海量互联网视频数据,让 GigaWorld-0.5 建立起对通用物理规律和视觉动态的基础认知。

  • 具身场景沉浸式微调:随后,引入数千小时涵盖第一人称、真机及仿真的多源操作视频。在这一阶段,模型专攻「具身交互」场景,掌握特定空间下的时空演变规律。

  • 极小样本的动作对齐:最后,在拥有强大「世界观」的基础上,仅需极少量的真机动作标签数据进行训练,即可将预训练世界模型与机器人的动作预测精准对齐,快速打通「观测 - 动作 - 未来视觉」的因果映射。

这种「基础能力大规模预训练 + 任务适配小样本微调」的分层范式,相较传统 VLA 训练方案,实现了整体训练效率 10 倍提升。


真机实测霸榜:

成功率绝对值暴涨 30%

抛开理论数据,真机实操才是检验具身智能的唯一标准。在涵盖了抓取、装配、物品整理等多种典型机器人任务的严苛评测中,GigaWorld-Policy 在「成功率 - 推理速度」的权衡曲线上找到了当前行业的最优解,是唯一同时实现高成功率与高实时控制频率的模型。

  • 成功率断层领先:GigaWorld-Policy 在真机任务中的平均成功率逼近 85%。面对 Cosmos-Policy 等强劲对手,其成功率绝对值提升了超过 30%。即便对比某些主打极速推理的 Pi 系列模型,它依然凭借对物理世界规律的深刻理解稳占上风。

  • 跨越实时控制门槛:对比 Motus,GigaWorld-Policy 不仅大幅缩减了显存占用,更实现了 10 倍的推理提速。这种毫秒级的响应能力至关重要——只有高效的执行速度,机器人才能游刃有余地应对现实环境中的动态干扰和执行误差,这也是其高成功率的底层基石。


GigaWorld-Policy 的诞生,是对传统具身智能策略学习的一次重要范式重构。它切中了传统 WAM 架构「推理延迟高、视觉与动作表征耦合过深」的问题。在训练时,利用未来视频生成为动作学习提供密集的动力学约束;在推理时,则轻装上阵,实现了效率与性能的双重跃升。GigaWorld-Policy 让世界模型在机器人领域的落地应用更具实用性,也为机器人在真实物理世界中的实时、高效操控,提供了一套极具价值的全新解法。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看见女邻居出轨,她上门找我求保密,我说:可以,但有一个条件

看见女邻居出轨,她上门找我求保密,我说:可以,但有一个条件

千秋文化
2026-05-10 19:41:24
NBA巨星又要当爹!妻子第四次怀孕,前三胎全是男孩,期待小公主

NBA巨星又要当爹!妻子第四次怀孕,前三胎全是男孩,期待小公主

科学发掘
2026-06-02 19:00:30
男人无论年纪,和心爱女人突破亲密界限这件事,从来都绕不开

男人无论年纪,和心爱女人突破亲密界限这件事,从来都绕不开

加油丁小文
2026-04-05 09:30:08
亚马尔带女友度假,颜值身材无可挑剔,18岁身家过亿,已是超巨

亚马尔带女友度假,颜值身材无可挑剔,18岁身家过亿,已是超巨

可乐谈情感
2026-06-01 13:12:28
北京时间6月2日下午,国乒传来王楚钦、梁靖崑、樊振东的重要消息

北京时间6月2日下午,国乒传来王楚钦、梁靖崑、樊振东的重要消息

法老不说教
2026-06-02 20:21:04
101万亿债务压顶!全民化债浪潮袭来,收入受影响普通人该咋办?

101万亿债务压顶!全民化债浪潮袭来,收入受影响普通人该咋办?

今朝牛马
2026-06-02 21:24:29
山东烟台一男子报警称自己强奸了女友,警方:该男子酒后与女友因琐事争执,为发泄个人情绪谎报警情,被行政拘留5天

山东烟台一男子报警称自己强奸了女友,警方:该男子酒后与女友因琐事争执,为发泄个人情绪谎报警情,被行政拘留5天

环球网资讯
2026-06-02 21:03:56
里克·阿德尔曼离世,79岁名人堂教练留下1042胜

里克·阿德尔曼离世,79岁名人堂教练留下1042胜

元气满分吖
2026-06-03 01:44:40
为防关键议员被捕,菲参院强改规则允许远程投票遭抵制!开后门?

为防关键议员被捕,菲参院强改规则允许远程投票遭抵制!开后门?

顾史
2026-06-03 02:05:12
你的低成本爱好是什么?这届网友居然就这样水灵灵的省下这么多钱

你的低成本爱好是什么?这届网友居然就这样水灵灵的省下这么多钱

夜深爱杂谈
2026-06-02 10:49:13
罗马诺爆料!曼联全力挖角皇马巨星,有望成B费之后队史最佳引援

罗马诺爆料!曼联全力挖角皇马巨星,有望成B费之后队史最佳引援

林子说事
2026-06-03 00:42:49
糯米立大功!医生发现:坚持吃糯米一段时间,身体或迎来5个变化

糯米立大功!医生发现:坚持吃糯米一段时间,身体或迎来5个变化

橘子约定
2026-05-13 21:25:24
太尴尬了!9个姐妹聚餐,临时倡议各邀请一男生,竟然无一人到场

太尴尬了!9个姐妹聚餐,临时倡议各邀请一男生,竟然无一人到场

火山詩话
2026-04-19 08:06:38
豆包预计6月下旬正式收费 每月最低68元 你还会继续用吗?

豆包预计6月下旬正式收费 每月最低68元 你还会继续用吗?

TechWeb
2026-06-02 09:19:35
长安启源再回应“司机激活智驾40秒后撞上货车致3人身亡”

长安启源再回应“司机激活智驾40秒后撞上货车致3人身亡”

闪电新闻
2026-06-02 19:48:23
明明有着大好前途,却为了名利甘作情妇,最终事情败露前途尽毁

明明有着大好前途,却为了名利甘作情妇,最终事情败露前途尽毁

三农老历
2026-06-02 17:01:18
没想到,被中国授予最高荣誉仅1天,武契奇因一句话实现口碑暴涨

没想到,被中国授予最高荣誉仅1天,武契奇因一句话实现口碑暴涨

流史岁月
2026-06-01 14:10:57
关于文章被处理的通知

关于文章被处理的通知

言立方
2026-04-15 18:22:17
百度最强视觉识别模型来了!仅0.9B,文档解析能力超越Gemini、GPT

百度最强视觉识别模型来了!仅0.9B,文档解析能力超越Gemini、GPT

智东西
2026-06-02 19:27:57
不少婴儿孕妇中招,央视再曝新毒物!长期用会致癌,已流窜至全国

不少婴儿孕妇中招,央视再曝新毒物!长期用会致癌,已流窜至全国

潋滟晴方DAY
2026-06-03 02:10:24
2026-06-03 05:11:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3443304文章数 7779关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

健康
艺术
家居
数码
教育

违规干细胞应用,暗藏致命隐患!

艺术要闻

抖音砸60个亿,要盖一座“不像医院”的医院?

家居要闻

流线型轮廓 包容多元身形

数码要闻

HPB散热加持!三星HBM5预计2028年实现量产

教育要闻

“没选上少先队,我女儿疯了”,无理取闹的家长,养不出正常孩子

无障碍浏览 进入关怀版