网易首页 > 网易号 > 正文 申请入驻

智元开源具身数据集AGIBOT WORLD 2026,让数据采集走进真实世界

0
分享至





文:智元AGIBOT

排版:前沿在线 编辑部

在计算机视觉领域,“ImageNet时刻”的出现曾经改变了一切。它不仅提供了数据,更定义了一个时代的研究范式。今天,具身智能同样站在这样的临界点上。

2024年末,智元发布具身智能行业首个百万真机数据集AGIBOT WORLD时,我们尝试为这个领域提供一个新的起点。而现在,随着研究不断深入,新的需求也变得更加明确:研究者和开发者需要的,不再只是数据量,而是能够真实承载物理世界复杂性的高质量数据。

基于这样的创新研究需求,智元机器人正式开源——AGIBOT WORLD 2026 数据集,首个覆盖具身智能全域研究的开源数据集。

该数据集基于海量真实场景,围绕五大具身领域研究主题构建,每个主题均设有专属采集方法与精细化的标注体系,以精准支持不同细分领域研究者的需求。数据集将分五个阶段持续开源,覆盖更多主题与场景,旨在为具身领域提供覆盖广泛、即取即用的高质量真实数据。同时,我们通过数字孪生技术,在仿真环境中1:1重建真实场景并采集数据,仿真数据同步开源。

我们希望通过全新的具身数据集明确一个更深远的方向:让机器人走出实验室,在真实世界中呼吸、学习、进化。

项目主页:agibot-world.com

开源地址:huggingface.co/datasets/agibot-world/AgiBotWorld2026



具身数据,不再是“理想环境”的产物

长期以来,机器人数据往往诞生于高度控制的环境之中。标准的样板间、整洁的桌面、预设的初始位置、可预期的操作路径,让模型能够快速学习,却难以适应真实世界的复杂性。

而现实却从来不是这样的。一个普通的家庭厨房,可能同时存在遮挡、杂乱摆放、光照变化和动态干扰;一个商业空间中的任务,也往往需要在不确定条件下完成多步骤操作。正是在这些细节之中,机器人被真正赋予作业能力。

AGIBOT WORLD 2026的所有数据均采集自100%真实环境。覆盖商业空间、酒店餐饮、家居、安防场景、工业物流等场景,复杂任务与随机干扰并存,每一次操作都发生在真实世界的上下文之中。这意味着,数据不再是“被设计”的,而是“被经历”的。也正因如此,每一条数据都天然具备迁移到真实应用中的价值。





新一代硬件采集,灵巧本体丰富末端

数据的质量,不仅取决于场景,也取决于采集它的“身体”。

AGIBOT WORLD 2026基于智元新一代以工业级标准打造的精灵G2通用机器人完成采集。这一硬件平台搭载高性能关节执行器、多类型传感器、高性能域控制器,支持高精度力控作业,并提供丰富的二次开发接口。结合Swift Picker夹爪与智元OmniHand五指灵巧手,同步采集多视角RGB(D)、触觉、LiDAR点云、IMU及全身关节状态、力传感器等多模态传感数据。

在同一任务中,机器人不仅“看到”,还“感受到”,并实时记录自身的运动与反馈。这种多模态的统一采集,使得数据天然具备更强的表达能力,也更贴近真实部署时的系统状态。





让数据真正“像机器人在做事”

在采集方面,更进一步的问题是:数据是否真的反映了机器人“完整地在执行任务”?我们这一点上做了关键突破。

首先,全身控制(Whole Body Control)的引入,让机器人不再只是局部执行动作,而是像人一样以完整的身体参与任务。机械臂、腰部与手部在统一控制下协同运作,动作更加连贯自然,也更接近人类在现实世界中的行为方式。很多过去依赖“拼接动作”的任务,现在可以被一体化完成,这种能力会直接体现在数据之中。

与此同时,超视距遥操作构建了一种全新的采集方式。数采员可以跨地域地实时控制机器人,并通过第一视角,与机器人共享同一感知空间,使操作过程更加直观与连续。人不再是“外部指挥者”,而是“在机器人身体中行动”,这种一致性,使采集到的数据天然具备更强的可迁移性,也成为释放全身控制能力的最佳范式。

在更微观的层面,力控采集的引入进一步改变了数据的表达方式。数据不再只是运动轨迹的记录,而是包含了真实的接触与力反馈信息。机器人在“触碰世界”的过程中所感受到的变化,被完整保留下来,从而使模型能够学习柔顺操作、复杂接触乃至精细的物理交互。

当这三种能力共同作用时,数据不再只是“动作的集合”,而是一次完整的、真实发生的物理行为过程。



工业级标准,让数据可用可靠

所有数据在进入AGIBOT WORLD 2026数据集之前,都经历了严格的验证流程。原始数据采集完成后,都将通过算法策略训练与真机测试,确保数据采集的有效性。所有数据均进入严格的 DaaS工业质检流水线,依据统一标准进行多轮筛查与清洗,每一个环节都围绕一个目标展开:确保交付结构清晰、标注精准、可直接用于模型训练的高质量数据。

这也是智元始终坚持的一个原则——数据不仅要“看起来正确”,更要“用起来可靠”。





五大阶段逐步登场,正式开源第一期“模仿学习”主题

创新自由采集范式

人类通过观察与模仿掌握复杂技能,而机器人同样可以借助专家示范,快速建立对任务的理解与执行能力,学习并泛化复杂的物理交互技能。这便是具身研究领域的关键方向之一“模仿学习”。AGIBOT WORLD 2026开源的第一期,正是围绕这一研究方向展开。

不同于传统固定脚本的采集方式,我们引入了智元创新的“自由采集范式”。数据采集员在真实场景中,根据实时情况灵活设计操作流程,使数据自然覆盖不同物体种类、不同操作顺序与不同动作路径的组合,全面覆盖多维度泛化需求。机器人通过灵活移动底盘、头部运动、腰部旋转及升降俯仰等拟人运动机制,实现了高效、自然且极具迁移价值的数据构建。

这样的采集范式让数据不再只是“标准答案”,而是一种具有泛化能力的经验集合。

数据标注体系创新:从“动作”到“理解”

真实数据只是起点,更关键的是如何让机器人真正“理解”。

在AGIBOT WORLD 2026数据集中,我们围绕具身智能的核心问题,构建了一套覆盖多层级的标注体系。一个任务不再只是简单的动作序列,而是被拆解为从目标描述到步骤执行,再进一步细化到原子技能(如抓取、放置)、2D边界框等属性标注的完整结构。机器人不仅可以看到“做了什么”,还可以理解“为什么这么做”。

更重要的是,我们在数据中完整保留了错误修正过程的轨迹记录。现实世界中,没有任何操作是完美的,真正的智能体,必须具备在失败中调整路径的能力。当这些过程被记录、被标注、被学习,模型才开始兼具任务精准性与自主纠错能力的鲁棒性。



具身智能的下一阶段,会发生在真实世界里。它发生在我们每个人每天生活的厨房、商场、超市里,也发生在每一个需要被自动化与智能化的场景中。智元推出 AGIBOT WORLD 2026 所做的,是为这一阶段提供技术底座。我们希望这不仅是一个数据集,更是一个起点。一个让机器人从“可以被展示”,走向“可以被使用”的起点。

今天,我们正式向全球研究者、开发者开源 AGIBOT WORLD 2026 数据集。无论是学术界、还是产业界,都可以基于这一数据基础,探索更真实、更可靠的具身智能能力。如果说过去的机器人更多停留在实验室,那么接下来,它们将真正进入现实世界。

而这一切的发生,正从数据开始。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
偷了机场114盏灯!没留照片、指纹、DNA的机场大盗被抓

偷了机场114盏灯!没留照片、指纹、DNA的机场大盗被抓

环球网资讯
2026-04-22 17:00:50
医院的专家号刚放出就瞬间“秒空”,上海三甲医院紧急报警!警方:对倒卖医院号源犯罪团伙的李某、郑某等人依法刑事拘留

医院的专家号刚放出就瞬间“秒空”,上海三甲医院紧急报警!警方:对倒卖医院号源犯罪团伙的李某、郑某等人依法刑事拘留

大风新闻
2026-04-22 15:12:13
反转了,女子踹保安反被扇续:警方立案,保安丢工作,知情人爆料

反转了,女子踹保安反被扇续:警方立案,保安丢工作,知情人爆料

奇思妙想草叶君
2026-04-22 23:59:15
太惨了!燃油车再迎大降价:最大跌幅50%,豪华车带头“跳水”

太惨了!燃油车再迎大降价:最大跌幅50%,豪华车带头“跳水”

沙雕小琳琳
2026-04-23 02:29:16
取消午休,改成16点下班,你愿意吗?网友吵翻!

取消午休,改成16点下班,你愿意吗?网友吵翻!

鲁中晨报
2026-04-22 14:28:23
出海更难了!俄朝图们江公路大桥合拢,预计今年6月正式通车

出海更难了!俄朝图们江公路大桥合拢,预计今年6月正式通车

全城探秘
2026-04-22 16:41:13
直播实证“北京到上海,中间只充一次电”,疑又是公关败笔

直播实证“北京到上海,中间只充一次电”,疑又是公关败笔

TMT流程审计
2026-04-22 21:32:37
世锦赛战报:2-10!中国5人出局了,16强基本定14席火箭vs希金斯

世锦赛战报:2-10!中国5人出局了,16强基本定14席火箭vs希金斯

小火箭爱体育
2026-04-22 22:37:51
曾高喊打败美帝:如今却全家跑去美国,84岁活成这样,引人热议!

曾高喊打败美帝:如今却全家跑去美国,84岁活成这样,引人热议!

小莜读史
2026-04-20 22:58:35
随着哈兰德一剑封喉+比分1-0,曼城3连胜,反超阿森纳升至第一

随着哈兰德一剑封喉+比分1-0,曼城3连胜,反超阿森纳升至第一

侧身凌空斩
2026-04-23 04:53:16
昔日夫妻变仇人!陈妍希申请强制执行,陈晓的沉默,彻底撕碎体面

昔日夫妻变仇人!陈妍希申请强制执行,陈晓的沉默,彻底撕碎体面

夸大其词的说
2026-04-23 01:29:02
连车企的名字都不敢报道,这样的新闻有什么意义

连车企的名字都不敢报道,这样的新闻有什么意义

林中木白
2026-04-21 15:51:28
平顶山学院,请向两年前被开除的保安道歉

平顶山学院,请向两年前被开除的保安道歉

文案的闲话
2026-04-22 16:34:34
伊朗“内鬼” 竟是路由器

伊朗“内鬼” 竟是路由器

每日经济新闻
2026-04-22 13:52:09
太火爆!上海已约满,名额一扫而空!能保命!

太火爆!上海已约满,名额一扫而空!能保命!

看看新闻Knews
2026-04-22 22:12:53
为啥很多店没生意,却一直在营业?网友:普通人怕是开不了茶叶店

为啥很多店没生意,却一直在营业?网友:普通人怕是开不了茶叶店

带你感受人间冷暖
2026-04-22 02:21:30
宁德时代狂丢王炸:满电6分钟,最高续航1500km,猛建超换一体站

宁德时代狂丢王炸:满电6分钟,最高续航1500km,猛建超换一体站

超电实验室
2026-04-22 09:23:32
伊朗用“不怕死”三个字,劝退特朗普

伊朗用“不怕死”三个字,劝退特朗普

国是直通车
2026-04-22 20:00:08
阿联酋动作真快!刚结束访华就高调宣布:上万亿美元重仓押注中国

阿联酋动作真快!刚结束访华就高调宣布:上万亿美元重仓押注中国

大鱼简科
2026-04-22 17:09:16
台湾专家赖岳谦:印度确实有一点比中国强很多,那就是——嘴。

台湾专家赖岳谦:印度确实有一点比中国强很多,那就是——嘴。

荆楚寰宇文枢
2026-04-22 23:16:37
2026-04-23 06:32:49
前沿在线 incentive-icons
前沿在线
前沿在线官方账号,关注AI、机器人、智能车等前沿领域;
167文章数 1235关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

伊朗议长:不可能重新开放霍尔木兹海峡

头条要闻

伊朗议长:不可能重新开放霍尔木兹海峡

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

蜜雪冰城泰国代言人 被扒出辱华黑历史

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

亲子
本地
数码
艺术
健康

亲子要闻

兼顾专业哺喂与绿色环保,贝亲发布自然实感净澈系列奶瓶

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

数码要闻

大疆DJI Osmo Mobile 8P体验:「单兵创作者」的终极方案

艺术要闻

蓝得这么美!

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版