网易首页 > 网易号 > 正文 申请入驻

更强大的GigaBrain-0.5M*来了,世界模型原生的新一代范式登场!

0
分享至

具身世界模型新一代原生范式重磅登场!继具身基础模型GigaBrain-0.1斩获 RoboChallenge 全球第一后,性能更强大的GigaBrain-0.5M*又来了。作为依托世界模型实现自我进化的 VLA 大模型,GigaBrain-0.5M*在家庭叠衣、服务冲煮咖啡、工业折纸盒等多个真实机器人任务中,均实现数小时零失误、持续稳定运转。

GigaBrain-0.5M* 作为一款基于世界模型条件驱动(World Model-Conditioned)的 VLA 大模型,以世界模型对未来状态与价值的预测结果作为条件输入,可显著提升模型在长时程任务中的鲁棒性。在此基础上,GigaBrain-0.5M* 创新引入人在回路(Human-in-the-Loop)持续学习机制,系统依托经人工筛选与校正的模型推演轨迹开展迭代训练,基于真实环境交互反馈持续优化决策策略,最终实现 “行动 — 反思 — 进化” 的闭环式持续学习与自主迭代升级



论文链接:https://arxiv.org/pdf/2602.12099

项目链接:https://gigabrain05m.github.io/

01 基于世界模型的强化学习的训练范式

在 GigaBrain-0.5M* 的研发中,我们提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程

  • 基于大规模机器人操作数据完成世界模型预训练,实现对未来状态及对应价值的精准预测;
  • 以世界模型输出的未来状态预测与价值评估为条件,对策略网络进行微调,以指引动作决策;
  • 将条件化策略部署至真实物理环境,依托人在环干预机制,采集模型自主推演轨迹数据;
  • 利用经筛选后的有效轨迹数据集,联合优化世界模型与决策策略,实现模型持续学习与自主进化。



02数小时连续零失误执行

在与 AWR、RECAP 等主流模仿学习与强化学习基线方法的系统对比中,GigaBrain-0.5M* 展现出显著优势,在相同任务设定下,相较于由π*0.6由所提出的RECAP 基线,任务成功率提升近 30%,并实现了稳定可靠的模型效果。

尤其在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain‑0.5M* 均实现接近 100% 的任务成功率,并可稳定复现成功执行轨迹,充分彰显出卓越的策略鲁棒性。



03 高效且准确的价值预测

实验结果表明,基于世界模型的价值预测方案在执行效率与预测精度上,均优于π*0.6所提出的VLM方案。该方案的核心优势源自对未来状态的显式建模与世界模型单步降噪机制,可为价值函数提供关键的时序上下文支撑,让价值估计实现更高效、更精准、更稳定的输出。

以叠衣服任务为例:任务初期,机械臂反复调整衣物姿态时,预测价值呈现合理波动;当衣物摆正、进入稳定叠放阶段,价值曲线稳步上升;若中途出现干扰物,价值骤降以反映任务受阻;待干扰物被移除后,价值迅速恢复增长趋势。这种与任务物理进程高度对齐的价值演化,正是世界模型提供“认知先验”的直接体现。



04 上万小时的训练数据

GigaBrain-0.5M* 的基座模型 GigaBrain-0.5 基于总计 10,931 小时的多样化机器人操作数据进行预训练,其中 61%(6,653 小时)由自研具身世界模型 GigaWorld 高保真合成,覆盖纹理迁移、视角变换、人手到机械臂映射等丰富场景;剩余 39%(4,278 小时)源自真实机器人采集,确保策略在物理世界中的可执行性。海量数据的引入显著拓展了模型的任务覆盖广度与策略鲁棒性,使其在面对复杂、长时程操作任务时具备更强的泛化能力;而 GigaWorld 生成的合成数据则有效突破了真实采集的长尾瓶颈。通过可控地生成新纹理、新物体位姿与新观测视角下的训练样本,增强了模型在分布外场景中的适应性,为具身智能走向开放世界奠定了数据基石。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美元命运早已定格?如果美国衰落了,犹太资本将转移到这两个国家

美元命运早已定格?如果美国衰落了,犹太资本将转移到这两个国家

花寒弦絮
2026-02-15 20:10:07
经济下行,小偷又开始冒头了,女子火车上熟睡,8000元手机被偷

经济下行,小偷又开始冒头了,女子火车上熟睡,8000元手机被偷

文青大叔说
2026-02-14 17:08:16
国铁集团:网传今年春运绿皮车严重超员视频系历史画面拼凑

国铁集团:网传今年春运绿皮车严重超员视频系历史画面拼凑

财联社
2026-02-15 20:17:04
离过年只剩两天!湖南湘钢突发爆炸,大火烧足12小时,原因查明

离过年只剩两天!湖南湘钢突发爆炸,大火烧足12小时,原因查明

冷月侃娱乐
2026-02-15 14:34:14
中国正加速抛售美债,美专家:中国用了新抛售方式,完全无法干预

中国正加速抛售美债,美专家:中国用了新抛售方式,完全无法干预

似水流年忘我
2026-01-29 01:24:08
中戏再曝大瓜!网友称18级、19级考生,除名字外成绩一模一样

中戏再曝大瓜!网友称18级、19级考生,除名字外成绩一模一样

社会酱
2026-02-14 17:03:52
台湾政坛爆出大消息!傅崐萁直接对外宣布:蓝白合作彻底破局!

台湾政坛爆出大消息!傅崐萁直接对外宣布:蓝白合作彻底破局!

达文西看世界
2026-02-15 19:28:30
央视肖晓琳:退休5个月,在美国儿子家逝去,临终26字遗言太深刻

央视肖晓琳:退休5个月,在美国儿子家逝去,临终26字遗言太深刻

古事寻踪记
2026-02-06 07:06:55
蒋万安四岁时与母亲黄美伦的合影,母亲年轻时漂亮又有气质

蒋万安四岁时与母亲黄美伦的合影,母亲年轻时漂亮又有气质

大江
2026-01-09 16:27:54
拒绝百万年薪,入职25万事业编,效力辽篮18年的韩德君赚到多少钱

拒绝百万年薪,入职25万事业编,效力辽篮18年的韩德君赚到多少钱

揽星河的笔记
2026-01-25 20:19:21
珍宝岛冲突后中国过度战备后遗症

珍宝岛冲突后中国过度战备后遗症

河山历史
2025-12-25 11:27:27
A股:周日下午传来3个核弹级消息!节后或将会迎来更大级别大行情?

A股:周日下午传来3个核弹级消息!节后或将会迎来更大级别大行情?

股市皆大事
2026-02-15 13:05:33
8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

今朝牛马
2026-02-01 21:14:04
足总杯:1-2大冷门,英超球队遭低级别英甲球队逆转,惨遭淘汰

足总杯:1-2大冷门,英超球队遭低级别英甲球队逆转,惨遭淘汰

侧身凌空斩
2026-02-15 01:01:43
巴尔韦德回应踢翻冷藏箱:这就是我每次后悔当时没射门的样子

巴尔韦德回应踢翻冷藏箱:这就是我每次后悔当时没射门的样子

懂球帝
2026-02-15 11:04:09
北京市2026年常规小客车指标配额10万个,另增发新能源指标8万个

北京市2026年常规小客车指标配额10万个,另增发新能源指标8万个

IT之家
2026-02-15 11:00:05
谷爱凌:安排不公平

谷爱凌:安排不公平

南方都市报
2026-02-15 11:39:35
建筑行业已经恐怖如斯?

建筑行业已经恐怖如斯?

黯泉
2026-02-14 22:39:14
48岁保洁阿姨睡在公司1个月,老板打开了监控,第2天送给她20万

48岁保洁阿姨睡在公司1个月,老板打开了监控,第2天送给她20万

秀秀情感课堂
2025-12-12 14:20:05
西部格局剧变!雷霆让出联盟第一,湖人大胜 20 分,开拓者掀翻快船

西部格局剧变!雷霆让出联盟第一,湖人大胜 20 分,开拓者掀翻快船

林子说事
2026-02-15 16:38:35
2026-02-15 20:55:00
创业邦 incentive-icons
创业邦
关注创新经济及其推动者。
15814文章数 112007关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

美国常驻北约代表:中国一个电话就能搞定俄乌冲突

头条要闻

美国常驻北约代表:中国一个电话就能搞定俄乌冲突

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

本地
家居
游戏
时尚
公开课

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

家居要闻

中古雅韵 乐韵伴日常

崩铁4.0开局梦回匹诺康尼?下车遭雷击,火花版来古士搞事太欢愉

多巴胺失宠了?过年这样穿彩色时髦又减龄

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版