网易首页 > 网易号 > 正文 申请入驻

刚刚,最佳VLA模型GigaBrain-0开源:世界模型驱动10倍数据,真机碾压SOTA

0
分享至

新智元报道

编辑:犀牛

【新智元导读】国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0重磅发布。

近日,在湖北武汉东湖高新区,极佳视界湖北人形机器人创新中心完成战略合作签约,并联合发布端到端VLA「具身基础模型」GigaBrain-0

这是国内首个利用「世界模型」生成数据实现真机泛化的视觉-语言-动作(VLA)基础模型,旨在通过世界模型为中心,无论在数据侧还是模型侧,彻底改变通用机器人大脑的开发方式

GigaBrain-0拥有当前最先进的VLA模型架构,同时支持图像、点云、文本、本体状态的输入,输出结构化的任务规划和运动规划,并在大规模的数据上完成预训练,可以实现更精准的移动导航和长序列的复杂操作。

搭配极佳视界自研「世界模型平台GigaWorld」,构建最完整的具身数据体系,可以快速实现多种本体上复杂的机器人移动操作任务。后续GigaBrain-0将全面开源。

项目链接:https://gigabrain0.github.io/

论文链接:https://arxiv.org/pdf/2510.19430

01 核心算法架构升级

针对当前机器人操作中的精准度不足和推理能力不足的问题,GigaBrain-0重点提升了3D空间感知能力和结构化的推理能力,通过引入这两项关键能力,GigaBrain-0可以完成更精准的移动导航和更长序列的复杂操作,具备更强泛化性,全球首次通过一脑多形、一段式端到端全身控制模型、一镜到底完成衣物整理类复杂、柔性、长程移动操作任务!

1. 3D空间感知能力:加入Depth输入,更精准的移动导航

GigaBrain-0通过加入深度信息的输入,提升了物体3D位置和空间3D布局的感知能力,这两点对于精确的双臂操作和精确的移动导航至关重要。

2. 结构化推理能力:更稳定的长程、复杂任务表现

GigaBrain-0通过引入子目标拆解和机械臂末端轨迹输出,改进了自身在开放场景中的任务规划和运动规划能力,极大提升了复杂、长程任务的成功率:

  • 子目标拆解:模型在推理过程中,可以同时输出子任务的自然语言描述,让GigaBrain-0对于长程任务的分解更合理。

  • 末端轨迹输出:模型在推理过程中,增加了机械臂末端执行器运动路径在图像平面上2D投影的输出,增强GigaBrain-0整体的全局动作规划能力。

02 全球首个「世界模型」驱动的

最全数据体系

世界模型无论在数据侧还是模型侧,对于具身智能都有极其关键的价值。极佳视界通过「世界模型」为中心,打造了全球首个最全具身智能数据体系,具体包括:

  • Sim2Real Transfer Data: 利用Isaac Sim等仿真环境合成多样化的机器人操作数据,通过GigaWorld的Sim2Real变换,实现逼真的外观渲染,同时保留原始场景几何和动作语义。

  • Real2Real Transfer Data: 将真实世界机器人采集的视频重新渲染成外观几何上不同但物理上合理的变体,通过文本提示来控制前景及背景的材质、表面纹理、光照条件,同时保持机器人动作和交互的一致性。这有效地将真实数据的多样性提高了约10倍。

  • View Transfer Data: 利用GigaWorld的3D空间场景重建能力,将单个真实采集的数据片段生成新视角的数据片段。

  • Video Generation Data: GigaWorld可以根据单个输入图像和不同的文本提示生成多样化的具身机器人操作视频,并通过逆动力学模型推断出相应的机器人动作序列,合成训练数据。

  • Human Transfer Data: 通过视频变换和运动学重定向,将大规模第一人称视频中的人手替换为机械臂,生成稳定且可由机器人执行的动作序列。

我们在多个任务上验证了世界模型生成数据对于具身机器人真机操作任务的价值,结果表明通过增加世界模型生成的数据进行预训练和后训练,GigaBrain-0的真机操作成功率可以持续提升,并且全球首次实现了连续柔性复杂长程操作的开放世界泛化

同时,通过混合世界模型生产的数据和真机采集数据,GigaBrain-0可以快速完成特定本体上的任务适配和泛化。

通过「世界模型」驱动的具身最全数据体系,极佳视界将持续迭代具身大模型,加速走向物理世界通用智能

03 高效的一脑多形跨本体适配

极佳视界联合湖北人形机器人创新中心共同完成大规模预训练数据的采集,数据覆盖了工业、商业、办公、家居、实验室这5类场景,细分为超市、酒店大堂、咖啡店、奶茶店、便利店、餐厅、仓库搬运、工业流水线、茶水间、住宅、公寓家居、会议室、办公室工位、实验室这14个具体场景。

结合场景丰富的预训练数据和先进的模型架构,GigaBrain-0拥有优秀的任务规划能力,进一步借助「极佳世界模型平台」,极佳视界可以在不同的本体上快速实现复杂的机器人操作任务。

极佳视界联合湖北人形机器人创新中心,全球首次基于高集成度人形机器人本体,一镜到底实现实时、长程、复杂、柔性操作

接下来双方将有更深入的合作。

04 实验结果

GigaBrain-0通过真实机器人实验进行了评估,包括灵巧操作任务(如叠衣服、整理卷纸)、长程任务(如收拾桌面、倒饮料)和移动操作任务(如搬运箱子、拾取衣物)。

实验结果表明,GigaBrain-0的成功率显著优于现有SOTA方法。

关于极佳

极佳视界专注「世界模型平台 x 具身基础模型」双轮闭环走向物理世界通用智能

在「世界模型」方向,极佳视界是国内技术创新和产业落地的领跑者,相关产品技术广泛应用于自动驾驶、具身智能、内容创作等相关方向。

在「具身大脑」方向,极佳视界通过全球领先的「世界模型平台」提供大规模高质量闭环数据,相比纯真机数据训练效率提升1-2个数量级以上,同时真机效果达到国内领先。

极佳视界由黄冠博士带领团队于2023年创立,是国内第一家专注「世界模型 x 具身大脑」方向的科技公司

公司核心团队包括清华、北大、中科院、中科大、WashU、CMU等全球知名院校顶尖研究人员,以及来自微软、三星、地平线、百度、博世、NBC环球影业等全球知名企业高管,核心团队兼具业内领先的研究能力和大规模的产业落地经验。

极佳视界是国内少有在「世界模型」和「具身大脑」方向都拥有世界级综合实力的团队,在自动驾驶世界模型方向已经和多个头部主机厂达成签约合作,在具身世界模型、具身大脑等方向已经和多个具身本体、终端公司达成签约合作,应用于科研、教育、展览、数据采集、工业、服务、家庭等多个场景。

极佳视界致力通过「世界模型平台 x 具身基础模型」,创造物理世界通用智能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
动真格了?国际足联做出新决定,世界杯版权有转机,央视下定决心

动真格了?国际足联做出新决定,世界杯版权有转机,央视下定决心

揽星河的笔记
2026-05-13 17:35:03
突传噩耗!香港知名商人在家中烧炭身亡,公司面临巨大财政压力

突传噩耗!香港知名商人在家中烧炭身亡,公司面临巨大财政压力

情感大头说说
2026-05-13 17:16:43
4只皮皮虾事件后续:出租车司机被开除,顾客坚持认为司机收了钱

4只皮皮虾事件后续:出租车司机被开除,顾客坚持认为司机收了钱

映射生活的身影
2026-05-13 16:55:14
刘雨鑫打卡潮汕天价海鲜!同款濑尿虾对标三亚,价格真相大白

刘雨鑫打卡潮汕天价海鲜!同款濑尿虾对标三亚,价格真相大白

行者聊官
2026-05-11 12:23:14
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

黯泉
2026-05-03 20:25:37
武汉大学“分裂”奇观:东武大与西武大,善良与邪恶对抗

武汉大学“分裂”奇观:东武大与西武大,善良与邪恶对抗

红色少女主播
2026-05-13 16:15:27
小米增程SUV谍照曝光:车头挂小米Logo,非独立子品牌

小米增程SUV谍照曝光:车头挂小米Logo,非独立子品牌

三言科技
2026-05-13 19:32:06
男子连续2晚嫖娼同一个女孩,邻居撞破并举报他俩,女孩承认收钱

男子连续2晚嫖娼同一个女孩,邻居撞破并举报他俩,女孩承认收钱

汉史趣闻
2026-05-12 14:52:03
你见过多少赌博做局内幕?网友:全是精心套路,根本赢不了

你见过多少赌博做局内幕?网友:全是精心套路,根本赢不了

另子维爱读史
2026-05-13 07:43:50
这就尴尬了,三星用EUV造的4nm芯片,与中国的7nm差不多

这就尴尬了,三星用EUV造的4nm芯片,与中国的7nm差不多

互联网.乱侃秀
2026-05-13 10:48:55
一声叹息!场均1.2分,姚明最后一个NBA队友,今夏可能也要退役了

一声叹息!场均1.2分,姚明最后一个NBA队友,今夏可能也要退役了

球毛鬼胎
2026-05-13 17:41:37
火箭中锋申京和女友社媒相互取关,疑似分手

火箭中锋申京和女友社媒相互取关,疑似分手

懂球帝
2026-05-13 10:45:10
落后5分!凌晨3点 曼城追分之战:哈兰德冲击5连斩+金靴

落后5分!凌晨3点 曼城追分之战:哈兰德冲击5连斩+金靴

叶青足球世界
2026-05-13 19:54:51
A股:今天突破4240点,做好准备了,明天周四大概率这样走!

A股:今天突破4240点,做好准备了,明天周四大概率这样走!

明心
2026-05-13 15:01:22
多尔衮定律该扩大了!网传山东聊城继父与继女的养老对话,引争议

多尔衮定律该扩大了!网传山东聊城继父与继女的养老对话,引争议

火山詩话
2026-05-12 10:47:02
广厦G3半场碾压山西!三外齐爆,孙铭徽效果拉满,山西攻守拉胯!

广厦G3半场碾压山西!三外齐爆,孙铭徽效果拉满,山西攻守拉胯!

篮球资讯达人
2026-05-13 20:33:30
合肥市庐阳区委常委、政法委书记周茂斌接受纪律审查和监察调查

合肥市庐阳区委常委、政法委书记周茂斌接受纪律审查和监察调查

环球网资讯
2026-05-13 18:19:06
世界杯历史进球差了快80个 阿根廷为什么永远追不上巴西和德国?

世界杯历史进球差了快80个 阿根廷为什么永远追不上巴西和德国?

体坛八点半的那些事儿
2026-05-13 18:23:15
太平军攻南京有多惨烈?将军祥厚及五千旗兵全部被杀,满人被屠尽

太平军攻南京有多惨烈?将军祥厚及五千旗兵全部被杀,满人被屠尽

老范谈史
2026-05-11 19:45:11
12岁男孩确诊癌症晚期!研究证实:这5种添加剂正在升高癌症风险……

12岁男孩确诊癌症晚期!研究证实:这5种添加剂正在升高癌症风险……

环球网资讯
2026-05-11 14:21:45
2026-05-13 21:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15202文章数 66865关注度
往期回顾 全部

科技要闻

腾讯一季度营收1964.6亿元 同比增9%

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

教育
艺术
数码
手机
军事航空

教育要闻

长检匠心:融智聚力护成长 长沙未检共探协同保护新路径

艺术要闻

乾隆 “翻车” 名画刷屏!

数码要闻

Framework官方简报:DDR5内存成本趋稳 SSD库存告罄面临大幅涨价

手机要闻

好消息:安卓17已正式发布!坏消息:留给开发者的时间不多了!

军事要闻

沙特被指3月曾对伊朗发动多次“报复性”空袭

无障碍浏览 进入关怀版