网易首页 > 网易号 > 正文 申请入驻

稚晖君推具身基座模型!智元新人形机器人即将发布

0
分享至


机器人前瞻(公众号:robot_pro)
作者 许丽思
编辑 漠影

机器人前瞻3月10日报道,今天,智元机器人发布首个通用具身基座模型——智元启元大模型Genie Operator-1(GO-1)。该模型提出了Vision-Language-Latent-Action(ViLLA)框架,该框架由VLM(多模态大模型)+MoE(混合专家)组成,具有采训推一体,小样本快速泛化、“一脑多形”的跨本体应用、持续进化、人类视频学习等突出优势。

另外,智元还预告了,未来几个月会推出基于强化学习的仿真模型,新的人形机器人也即将亮相。

一、小样本快速泛化,快速适配不同本体

ViLLA框架包含了VLM(多模态大模型)+MoE(混合专家)。

具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能力。

MoE中的隐动作专家模型是整个大模型中隐式的规划器,作为第一个专家模型,它利用到了互联网上的大规模人类操作和跨本体操作视频,让模型具备动作的理解能力。

MoE中作为动作预测器的动作专家模型,利用高质量的仿真数据、真机数据,让模型具备了动作的精细执行能力。


Genie Operator-1有五大方面特点:

  • 采训推一体:搭配智元软硬件一体化框架,可以实现数据采集、模型训练、模型推理的无缝衔接。
  • 小样本快速泛化:具有强大的泛化能力,使得后训练成本非常低,能够在极少数据甚至零样本下泛化到新场景、新任务。
  • 一脑多形:是一个通用机器人策略模型,能够在不同机器人形态之间迁移,快速适配到不同本体。
  • 持续进化:搭配智元一整套数据回流系统,可以从实际执行遇到的问题数据中持续进化学习。
  • 人类视频学习:可以结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解。
二、吸纳海量知识数据,一句语言指令让机器人直接执行任务

智元机器人的Genie Operator-1(GO-1),基于具身领域的数字金字塔所构建:

底层是互联网的大规模纯文本与图文数据,可以帮助机器人理解通用知识和场景。

在这之上是互联网的大规模人类操作/跨本体视频,可以帮助机器人学习人类或者其他本体的动作操作模式。

更上一层则是仿真数据,用于增强泛化性,让机器人适应不同场景、物体等。金字塔的顶层,则是高质量的真机示教数据,用于训练精准动作执行。

在此基础上,机器人就可以成全面的“基础教育”和“能力培训”,天然能适应新的场景,可以轻松面对多种多样的环境和物体,快速学习新的操作。

GO-1所采用的由VLM+MoE组成的ViLLA框架,可以将输入的多相机的视觉信号和人类语言指令,直接输出机器人的动作执行。和与Vision-Language-Action(VLA)模型相比,ViLLA通过预测Latent Action Tokens(隐式动作标记),弥合了图像-文本输入与机器人执行动作之间的鸿沟。

比如,用户用平常讲话的方式告诉机器人要做的事情,比如“挂衣服”,模型就可以拆解成一些几个步骤来处理:

首先,模型可以根据看到的画面,以及所学习过互联网的大规模纯文本和图文数据,能理解“挂衣服”在此情此景下的含义和要求;

其次,模型学习过互联网的人类操作视频和其他机器人的各种操作视频,所以能知道挂衣服这件事通常包括哪些环节;

然后,模型学习过仿真的不同衣服、不同衣柜、不同房间,模拟过挂衣服的操作,所以能理解环节中对应的物体和环境并打通整个任务过程;

最后,因为学习过真机的示教视频,机器人就能精准完成整个任务的操作。

GO-1可以让机器人应用到更多的场景中。早上刚起床,机器人会帮忙倒上一杯水、烤下吐司,还可以去一些活动现场,负责检票、发放物料的活。



在商务会议中,面对人类发出的“帮我拿一瓶饮料”“帮我拿一个苹果”的语音指令,GO-1可以让机器人快速相应。


值得一提的是,GO-1还可以通过数据回流,持续进化:比如,机器人做咖啡的时候不小心把杯子放歪了,后续就可以从遇到这个问题数据中持续进化学习,直到成功完成任务。

结语:具身智能加速迈向通用化、开放化与智能化

一直以来,具身智能面临着场景和物体泛化能力不足、缺乏语言理解能力做不到指令的泛化、无法快速学习新技能、实现跨本体的部署等问题。

GO-1的出现,为机器人代替人类完成工作生活中的各种事情,提供了强大的脑力支持。从准备餐食、收拾桌面这样的家庭场景任务,到接待访客、发放物品这类办公和商业场景的常见工作,再到工业等更多场景的其他操作任务,通用具身基座大模型都可以快速实现。这也意味着具身智能从单一任务到多种任务、从封闭环境到开放世界、从预设程序到指令泛化加速迈进,让机器人走向更多不同场景、适应多变的真实世界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
知名户外主播发生意外,Z疮发作大便失禁,恶臭难挡被取笑

知名户外主播发生意外,Z疮发作大便失禁,恶臭难挡被取笑

新游戏大妹子
2026-05-27 12:54:49
黑海舰队航空总部遭摧毁!曝乌克兰地面部队强登克里米亚

黑海舰队航空总部遭摧毁!曝乌克兰地面部队强登克里米亚

项鹏飞
2026-05-27 20:21:40
这5种药不宜长期服用,可能破坏身体免疫力!很多人都不知道

这5种药不宜长期服用,可能破坏身体免疫力!很多人都不知道

芹姐说生活
2026-05-24 14:15:40
建行前副行长席荣贵被查:躲到房企做CEO拿500万年薪,以为从此安全降落

建行前副行长席荣贵被查:躲到房企做CEO拿500万年薪,以为从此安全降落

新浪财经
2026-05-27 04:41:16
迪马济奥丨预测伊劳拉上任米兰阵型:踢4-2-3-1

迪马济奥丨预测伊劳拉上任米兰阵型:踢4-2-3-1

米兰圈
2026-05-27 07:57:01
恩佐:希望我的名字能在世界杯名单上;梅西的情况?我不知道

恩佐:希望我的名字能在世界杯名单上;梅西的情况?我不知道

懂球帝
2026-05-27 01:04:25
天津市一栋2层的联排别墅拍卖,才77.2万元竟然流拍了

天津市一栋2层的联排别墅拍卖,才77.2万元竟然流拍了

坠入二次元的海洋
2026-05-27 19:08:00
双标实锤!Kimi误判老外秒解封,国内付费用户炸锅

双标实锤!Kimi误判老外秒解封,国内付费用户炸锅

雷科技
2026-05-27 17:21:04
主角:直到楚嘉禾爬上刘红兵的床,才懂易青娥两段婚姻为何告终

主角:直到楚嘉禾爬上刘红兵的床,才懂易青娥两段婚姻为何告终

慢半拍sir
2026-05-20 21:42:39
今天,市场出现几大异象——道达投资手记

今天,市场出现几大异象——道达投资手记

每日经济新闻
2026-05-27 19:16:04
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
创纪录的空袭中戏剧性的一幕

创纪录的空袭中戏剧性的一幕

西楼饮月
2026-05-26 11:14:36
咋回事?跳号了?神舟二十二号乘组消失了?原因让人肃然起敬!

咋回事?跳号了?神舟二十二号乘组消失了?原因让人肃然起敬!

Thurman在昆明
2026-05-25 15:28:25
这个国家没有军队,一半收入完全依赖中国,活得却比谁都要滋润!

这个国家没有军队,一半收入完全依赖中国,活得却比谁都要滋润!

掠影后有感
2026-05-27 10:15:15
伊美谅解备忘录初步非正式文件内容披露

伊美谅解备忘录初步非正式文件内容披露

新华社
2026-05-27 20:08:05
深圳交警发布情况通报

深圳交警发布情况通报

新浪财经
2026-05-27 21:04:18
巴拿马外长傻眼,抢先单方面造势,结果王毅见了三拨人,他没排上

巴拿马外长傻眼,抢先单方面造势,结果王毅见了三拨人,他没排上

无情有思可
2026-05-27 20:17:18
海底捞“急刹车”:紧急叫停“携宠就餐”,全国门店禁止宠物入内!

海底捞“急刹车”:紧急叫停“携宠就餐”,全国门店禁止宠物入内!

职业餐饮网
2026-05-26 21:06:15
黄仁勋:AI时代孩子学什么专业没那么重要 真正要紧的是会不会用AI

黄仁勋:AI时代孩子学什么专业没那么重要 真正要紧的是会不会用AI

快科技
2026-05-26 22:36:05
哈马斯消息人士证实军事领导人奥达身亡

哈马斯消息人士证实军事领导人奥达身亡

财联社
2026-05-27 18:07:06
2026-05-27 22:47:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11912文章数 117085关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

武契奇夫人到上海面料市场定制西服 点名要用国产羊毛

头条要闻

武契奇夫人到上海面料市场定制西服 点名要用国产羊毛

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

数码
亲子
本地
公开课
军事航空

数码要闻

38g超轻+方形传感器 雷鸟V4 AI拍摄眼镜图赏

亲子要闻

一个视频让我狂笑三次,哈哈哈!

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以军称已打死哈马斯新任军事领导人

无障碍浏览 进入关怀版