网易首页 > 网易号 > 正文 申请入驻

极佳视界斩获全球第一后,GigaBrain-0.5M*再进化

0
分享至

机器之心发布

具身世界模型新一代原生范式重磅登场!继具身基础模型 GigaBrain-0.1 斩获 RoboChallenge 全球第一后,性能更强大的 GigaBrain-0.5M* 又来了。



作为依托世界模型实现自我进化的 VLA 大模型,GigaBrain-0.5M* 在家庭叠衣、服务冲煮咖啡、工业折纸盒等多个真实机器人任务中,均实现数小时零失误、持续稳定运转


https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ

GigaBrain-0.5M* 作为一款基于世界模型条件驱动(World Model-Conditioned)的 VLA 大模型,以世界模型对未来状态与价值的预测结果作为条件输入,可显著提升模型在长时程任务中的鲁棒性。

在此基础上,GigaBrain-0.5M* 创新引入人在回路(Human-in-the-Loop)持续学习机制,系统依托经人工筛选与校正的模型推演轨迹开展迭代训练,基于真实环境交互反馈持续优化决策策略,最终实现「行动 — 反思 — 进化」的闭环式持续学习与自主迭代升级



  • 论文链接:https://arxiv.org/pdf/2602.12099
  • 项目链接:https://gigabrain05m.github.io/

01

基于世界模型的强化学习训练范式

在 GigaBrain-0.5M* 的研发中,极佳视界提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程

  • 基于大规模机器人操作数据完成世界模型预训练,实现对未来状态及对应价值的精准预测;
  • 以世界模型输出的未来状态预测与价值评估为条件,对策略网络进行微调,以指引动作决策;
  • 将条件化策略部署至真实物理环境,依托人在环干预机制,采集模型自主推演轨迹数据;
  • 利用经筛选后的有效轨迹数据集,联合优化世界模型与决策策略,实现模型持续学习与自主进化。



02

数小时连续零失误执行

在与 AWR、RECAP 等主流模仿学习与强化学习基线方法的系统对比中,GigaBrain-0.5M* 展现出显著优势,在相同任务设定下,相较于由 π*0.6 由所提出的 RECAP 基线,任务成功率提升近 30%,并实现了稳定可靠的模型效果。

尤其在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain‑0.5M* 均实现接近 100% 的任务成功率,并可稳定复现成功执行轨迹,充分彰显出卓越的策略鲁棒性。




https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ


https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ


https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ

03

高效且准确的价值预测

实验结果表明,基于世界模型的价值预测方案在执行效率与预测精度上,均优于 π*0.6 所提出的 VLM 方案。该方案的核心优势源自对未来状态的显式建模与世界模型单步降噪机制,可为价值函数提供关键的时序上下文支撑,让价值估计实现更高效、更精准、更稳定的输出。

以叠衣服任务为例:任务初期,机械臂反复调整衣物姿态时,预测价值呈现合理波动;当衣物摆正、进入稳定叠放阶段,价值曲线稳步上升;若中途出现干扰物,价值骤降以反映任务受阻;待干扰物被移除后,价值迅速恢复增长趋势。这种与任务物理进程高度对齐的价值演化,正是世界模型提供「认知先验」的直接体现。




https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ

04

上万小时的训练数据

GigaBrain-0.5M* 的基座模型 GigaBrain-0.5 基于总计 10,931 小时的多样化机器人操作数据进行预训练,其中 61%(6,653 小时)由自研具身世界模型 GigaWorld 高保真合成,覆盖纹理迁移、视角变换、人手到机械臂映射等丰富场景;剩余 39%(4,278 小时)源自真实机器人采集,确保策略在物理世界中的可执行性。

海量数据的引入显著拓展了模型的任务覆盖广度与策略鲁棒性,使其在面对复杂、长时程操作任务时具备更强的泛化能力;而 GigaWorld 生成的合成数据则有效突破了真实采集的长尾瓶颈。通过可控地生成新纹理、新物体位姿与新观测视角下的训练样本,增强了模型在分布外场景中的适应性,为具身智能走向开放世界奠定了数据基石。



公司及团队介绍

极佳视界是一家具身智能和通用机器人公司,围绕「基模 - 本体 - 场景」三位一体,为工业、商业、家庭等场景提供软硬一体的具身智能机器人解决方案,推动通用机器人服务千行百业、走进千家万户。

公司核心团队包括清华、北大、中科院、中科大、WashU、CMU 等全球知名院校顶尖研究人员,以及来自微软、三星、地平线、百度、博世等全球知名企业高管,核心团队在物理 AI 方向兼具业内领先的研究能力和大规模的产业落地经验

极佳视界是国内第一家布局世界模型的科技公司,以世界模型平台 GigaWorld、通用具身大脑 GigaBrain、原生本体 Maker 构建闭环生态,致力实现 10-100 倍以上的数据、训练、测试全链路效率提升,推动通用具身智能机器人、通用自动驾驶等物理 AGI 大规模爆发。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
匈塞高铁通车炸锅!老外彻底酸了:这才是中国速度!

匈塞高铁通车炸锅!老外彻底酸了:这才是中国速度!

王二哥老搞笑
2026-02-14 18:48:03
十年前,桑兰能成功索要18亿美金的赔偿,如今想要二胎却很困难?

十年前,桑兰能成功索要18亿美金的赔偿,如今想要二胎却很困难?

北有南栀
2026-02-07 18:05:03
大衣哥女儿婚礼寒酸,背靠厕所拜父母,新郎愁容满面,亲戚白眼多

大衣哥女儿婚礼寒酸,背靠厕所拜父母,新郎愁容满面,亲戚白眼多

观察鉴娱
2026-02-14 09:29:37
张碧晨首度晒娃!女儿都这么大了,网友喊话赵丽颖:赶快定娃娃亲

张碧晨首度晒娃!女儿都这么大了,网友喊话赵丽颖:赶快定娃娃亲

八卦王者
2026-02-14 11:48:01
北控管理层对排名满意,张庆鹏得到认可,张帆及2名球员说明一切

北控管理层对排名满意,张庆鹏得到认可,张帆及2名球员说明一切

林子说事
2026-02-14 15:39:28
65岁大姐宁愿出钱请保姆,也不帮儿子带娃,谁知10年后她后悔了

65岁大姐宁愿出钱请保姆,也不帮儿子带娃,谁知10年后她后悔了

惟来
2026-02-13 17:33:11
特朗普称以总统应为不赦免内塔尼亚胡“感到羞愧”,赫尔佐格回击:我才是以色列总统

特朗普称以总统应为不赦免内塔尼亚胡“感到羞愧”,赫尔佐格回击:我才是以色列总统

环球网资讯
2026-02-14 00:19:07
闺蜜大婚我随了5000,她回礼雨伞,看见伞柄刻着地址和6个数字

闺蜜大婚我随了5000,她回礼雨伞,看见伞柄刻着地址和6个数字

磊子讲史
2026-01-23 16:54:49
穿破的外套仅退款后续:女子身份被扒,真容曝光社死,单位被牵连

穿破的外套仅退款后续:女子身份被扒,真容曝光社死,单位被牵连

离离言几许
2026-02-14 15:56:41
谁能想到,马云对美团王兴的复仇,一等就是整整十年

谁能想到,马云对美团王兴的复仇,一等就是整整十年

流苏晚晴
2025-12-29 18:31:44
1923年,婉容让孙耀庭伺候沐浴,她解开衣衫,孙耀庭:奴才肚子痛

1923年,婉容让孙耀庭伺候沐浴,她解开衣衫,孙耀庭:奴才肚子痛

浩渺青史
2026-02-11 15:12:31
王兴的年关:美团预期亏损超233亿,淘宝闪购强攻

王兴的年关:美团预期亏损超233亿,淘宝闪购强攻

科技浮世绘
2026-02-13 22:57:07
球员锦标赛签表出炉!希金斯罗伯逊陷死亡1/4区,赵心童签运绝佳

球员锦标赛签表出炉!希金斯罗伯逊陷死亡1/4区,赵心童签运绝佳

世界体坛观察家
2026-02-14 16:19:03
2月14日俄乌最新:历史性的演讲

2月14日俄乌最新:历史性的演讲

西楼饮月
2026-02-14 16:44:27
云南省纪委监委通报:9名党员、公职人员被公安机关查获

云南省纪委监委通报:9名党员、公职人员被公安机关查获

上观新闻
2026-02-14 14:37:09
表达强烈不满和坚决反对!外交部驻港公署约见英国、美国、澳大利亚等国和欧盟驻港机构负责人

表达强烈不满和坚决反对!外交部驻港公署约见英国、美国、澳大利亚等国和欧盟驻港机构负责人

扬子晚报
2026-02-14 14:55:03
原云上贵州大数据(集团)有限公司董事长徐昊被双开

原云上贵州大数据(集团)有限公司董事长徐昊被双开

界面新闻
2026-02-14 09:36:30
长江十年禁渔已过半程:刀鱼群归,鲥鱼无影?生态修复路在何方?

长江十年禁渔已过半程:刀鱼群归,鲥鱼无影?生态修复路在何方?

向航说
2026-01-16 01:00:03
上海嘉闵线项目塌陷:中国中铁子公司40天身负23起执行案

上海嘉闵线项目塌陷:中国中铁子公司40天身负23起执行案

财中社
2026-02-14 14:34:13
谁敢信?两年前28连败的鱼腩,现在是联盟第一了!

谁敢信?两年前28连败的鱼腩,现在是联盟第一了!

柚子说球
2026-02-14 16:44:06
2026-02-14 19:59:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12310文章数 142567关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

俄中将遇袭细节:身中3枪 将袭击者的枪举到头顶高度

头条要闻

俄中将遇袭细节:身中3枪 将袭击者的枪举到头顶高度

体育要闻

金博洋:天才少年的奥运终章

娱乐要闻

吴克群变“吴克穷”助农,国台办点赞

财经要闻

春节抢黄金,谁赚到钱了?

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

游戏
房产
手机
公开课
军事航空

Game Freak重申《轮回之兽》内部团队规模很小

房产要闻

三亚新机场,又传出新消息!

手机要闻

iPhone 18 Pro系列前瞻:灵动岛缩小、可变光圈加持,2nm芯片性能跃升

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

外媒:特朗普一旦下令攻击伊朗 行动或持续数周

无障碍浏览 进入关怀版