网易首页 > 网易号 > 正文 申请入驻

刚刚,稚晖君又开源了

0
分享至



GO-1的核心创新是ViLLA架构。

作者 |江宇

编辑 |漠影

机器人前瞻9月23日报道,智元机器人今日宣布全面开源其通用具身基座大模型GO-1(Genie Operator-1)。这是全球首个基于Vision-Language-Latent-Action (ViLLA)架构的具身智能模型,向全球开发者免费开放。


GO-1的核心创新是ViLLA架构。传统的VLA(Vision-Language-Action)模型直接从图像和文本预测动作,而ViLLA在两者之间引入“隐式动作标记”(latent action tokens),相当于为机器人构建一个“中间语义层”。

其共有三层结构:

1、VLM多模态理解层(基于InternVL2.5-2B):处理多视角图像、语言指令和力觉信号。

2、Latent Planner隐式规划器:利用latent tokens完成长时序规划,解决复杂任务。

3、Action Expert动作专家:基于扩散模型输出高频率的低层次连续动作序列。


▲GO-1三阶段训练机制示意图

这种设计使模型能先抽象理解“动作语义”,再转化为具体操作,提高了跨场景与跨机器人平台的泛化能力。

GO-1的训练依托于AgiBot World Colosseo数据集。该数据集由100余台双臂人形机器人采集而成,包含超过100万条操作轨迹,覆盖217类任务、87项技能和106种场景,构建于家庭、零售、工业、餐饮、办公五大环境中,总面积超过4000平方米,涉及对象超过3000种。

与以往主要集中在短时、单一任务的数据不同,该数据集突出长时序操作,轨迹平均时长在30至60秒之间,并包含“倒水”“折叠衣物”等高复杂度任务。


其采集过程采用human-in-the-loop机制,所有数据均经过人工校验,甚至包括失败数据也会被标注和保留,以提升模型对异常情况的鲁棒性。


基于这一数据集训练的策略在真实复杂任务上的表现,比Open X-Embodiment数据集提升约30%,在未见场景中也展现出显著的泛化能力。


此外,GO-1在“倒水”“补货”等需要指令理解与位置泛化的任务上,成功率明显优于RDT和π0模型。在引入latent planner之后,其复杂任务的平均完成率额外提升了0.12分。


同时,该模型性能随着数据规模呈现幂律扩展关系,验证了持续提升的可能性。在相同任务下,人工校验过的数据比未校验数据带来了0.18分的性能增益。


除了真实数据集上的实验,GO-1也在仿真与真机评测中进行了验证。在Genie Sim和Libero两大主流仿真平台上,模型均取得领先成绩。在Genie G1真机实验中,其表现同样优于其他SOTA模型。


▲GenieSim仿真评测结果


▲Libero仿真评测结果

虽然GO-1基于AgiBot G1机器人数据预训练,但在松灵机器人、Franka机械臂等平台测试中也展现了良好的迁移效果。GIA模型采用通用数据接口(兼容LeRobot格式),便于开发者在不同硬件上进行微调与部署。


与此同时,智元机器人还推出了一站式开发平台Genie Studio,覆盖数据采集、管理、训练、仿真、部署等全流程,内置GO-1基座模型和完整工具链,支持真机一键编译与部署,旨在降低开发门槛并提升效率。


GitHub地址:

https://github.com/OpenDriveLab/AgiBot-World

Huggingface地址:

https://huggingface.co/agibot-world/GO-1

论文:

https://arxiv.org/abs/2503.06669

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
德国医疗展200名中国人食物中毒,有人腹泻40多次,涉事餐厅回应:只是肉没完全煮熟

德国医疗展200名中国人食物中毒,有人腹泻40多次,涉事餐厅回应:只是肉没完全煮熟

都市快报橙柿互动
2025-11-20 20:47:44
2909亿身家有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身家有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

牛牛叨史
2025-11-20 02:07:53
万人痛批咏梅落选“金鸡奖”,陈道明当年的话,终于有人信了

万人痛批咏梅落选“金鸡奖”,陈道明当年的话,终于有人信了

八卦南风
2025-11-18 11:15:09
新华保险原董事长李全被判死缓!五道口同学帮集体落幕!

新华保险原董事长李全被判死缓!五道口同学帮集体落幕!

一口娱乐
2025-11-20 06:08:11
如果对日本出手,我们必须要想清楚的三个问题

如果对日本出手,我们必须要想清楚的三个问题

枫冷慕诗
2025-11-20 17:17:36
16GB+1TB!新机官宣:11月21日,正式发售上市!

16GB+1TB!新机官宣:11月21日,正式发售上市!

科技堡垒
2025-11-18 10:53:01
爆单!黄仁勋:卖光了!

爆单!黄仁勋:卖光了!

每日经济新闻
2025-11-20 16:26:06
中央批准:中候补任副省级城市市委书记!浙江三地市委书记近期调整

中央批准:中候补任副省级城市市委书记!浙江三地市委书记近期调整

上观新闻
2025-11-20 17:48:08
英伟达美股盘前涨近6%

英伟达美股盘前涨近6%

财联社
2025-11-20 17:02:05
马斯克的AI聊天机器人Grok发表否认“大屠杀”言论,遭法国调查

马斯克的AI聊天机器人Grok发表否认“大屠杀”言论,遭法国调查

IT之家
2025-11-20 22:25:07
三局逆转险胜!王祉怡首夺全运会女单金牌,陈雨菲遗憾无缘三连冠

三局逆转险胜!王祉怡首夺全运会女单金牌,陈雨菲遗憾无缘三连冠

全景体育V
2025-11-20 18:35:46
100个张家界“野人”,要断了全国减肥营的财路

100个张家界“野人”,要断了全国减肥营的财路

金错刀
2025-11-19 10:03:00
突发!罗晋父亲去世,围绕唐嫣的争议已解开,他们的婚姻没问题

突发!罗晋父亲去世,围绕唐嫣的争议已解开,他们的婚姻没问题

裕丰娱间说
2025-11-20 18:50:32
全运会万米争议一幕:被套圈选手为第1名领跑,成绩双双被取消

全运会万米争议一幕:被套圈选手为第1名领跑,成绩双双被取消

全景体育V
2025-11-20 15:07:42
“双手插兜”照片火遍全网,快来看日本网民大破防

“双手插兜”照片火遍全网,快来看日本网民大破防

这里是东京
2025-11-19 17:09:09
河南一男子开奥迪上班,被婚车车队当成头车:后面跟7台奥迪,一下车都懵了,带了一窝

河南一男子开奥迪上班,被婚车车队当成头车:后面跟7台奥迪,一下车都懵了,带了一窝

潇湘晨报
2025-11-20 16:21:23
越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

DrX说
2025-11-19 14:42:09
刚恢复14天,中国通知日本全面禁止,中方埋伏笔,下步反制将出炉

刚恢复14天,中国通知日本全面禁止,中方埋伏笔,下步反制将出炉

影孖看世界
2025-11-19 17:35:26
广东模特大赛冠军诞生后,我笑死在评论区

广东模特大赛冠军诞生后,我笑死在评论区

清书先生
2025-11-19 16:02:32
发生了啥?全球股市只有A股在跌,恒生科技快进入熊市了,中国银行新高

发生了啥?全球股市只有A股在跌,恒生科技快进入熊市了,中国银行新高

看财经show
2025-11-20 16:52:45
2025-11-20 23:40:49
机器人前瞻
机器人前瞻
专注于机器人报道的媒体
221文章数 4关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

头条要闻

媒体:中日之间交锋继续 全世界都是"当事方"

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

艺术
手机
房产
时尚
游戏

艺术要闻

陈洪绶:花鸟册二十开

手机要闻

ColorOS 16月更大放送:AI声音克隆、传送门,一文看懂细节变化!

房产要闻

超95亿!三亚巨量资产,突然甩出!

全球颜值最高女孩集体掀桌,网友:太爽了

SIE社长:对PlayStation品牌在日本衰落深感危机

无障碍浏览 进入关怀版