网易首页 > 网易号 > 正文 申请入驻

开源1万小时具身智能数据,这家公司是为了什么?

0
分享至

机器之心发布

想象一下,你正在训练一个未来的家庭机器人。你希望它能像人一样,轻松地叠好一件衬衫,整理杂乱的桌面,甚至系好一双鞋的鞋带。但最大的瓶颈是什么?不是算法,不是硬件,而是数据 —— 海量的、来自真实世界的、双手协同的、长程的、多模态的高质量数据。

因此为了整个具身智能探索加速,开源集合成为了大家的共同选择,从谷歌 Open-X Embodiment、智元 AgiBot Digital World,到智源 RoboCOIN 与它石智航的 World In Your Hands,都在试图构建更庞大、更完善的数据集合,并开源给到全行业。

但在 1 月 6 日,有一家公司将这件事做到新高度,进行了超过 1 万小时、接近百万 clips 的具身数据集合开放,这是行业最大规模、也是泛化程度最高的开源数据集合,它就是简智机器人的 “10Kh RealOmni-Open DataSet”



(下载地址为:https://huggingface.co/datasets/genrobot2025/10Kh-RealOmin-OpenData,其他数据正在陆续上传。国内也与阿里魔搭、百度百舸合作,方便国内用户下载。)

这批数据集合和之前不同点在哪儿?

总体规模大,这个体量甚至已经超越很多具身公司自己所储备的数据,而在量大的同时,这个数据集合还期望它更加“实用”

首先需要它具备足够强的 “技能深度”,在简智开源数据集合中,没有选择去发散的扩充技能数量,而是聚焦在 10 个常见家庭任务集合中,从而对应每一项技能都有超过 1 万 Clips 规模的数据覆盖,这使得其不只是总体规模的最大,也是单个技能的行业最多

其次是质量、模态的要求,这决定这些数据是否真正能被模型消化理解,而画面的超大 FOV、清晰的画质是基础,保证可以全方位录制到周围的环境和人的操作细节,简智这次数据集合的像素达到 “1600*1296”“30fps” 的水平

在这之上轨迹的精度是数据质量的关键,厘米级的轨迹精度对人来说可能足够精细,但对于机器人来说则需要达到毫米级别,因此简智这次开源数据对比行业,一方面具备了大多数不具备的轨迹信息,同时通过高精度 IMU 硬件和云端重建与还原,进一步将轨迹提升到亚厘米级别。而在模态上,作为夹抓类的技能采集,夹抓的开合角度、位移也都在集合中包含。



而在技能方面,单手在实际场景中可以完成的任务优先,因此难得是在数据集中,99.2% 都是 “双手、长程任务”,这也让它变得更落地—— 以第一批数据为例,平均 clips 长度为 1min37s。这意味着,它记录的不是一张张静态快照,而是从 “拿起散乱 T 恤” 到 “叠放整齐” 的完整过程,是动作逻辑与因果的连续学习。



最后则是在相同技能下,数据的场景、目标泛化上需要足够丰富,人员的操作要足够自然,而非单一场景的重复、动作僵硬重复,这样才能让模型在真实的生活中,应对家庭环境、目标类型千变万化。简智这批数据来自 3000 个真实的家庭规模采集,以叠衣服为例,不同的衣服种类、平铺的位置等多重因素变量都包含在其中,弥补了传统 “数采工厂” 方案过于单一的问题。



为什么有底气开源这么大批量数据?

在这些大规模、高质量、泛化程度高数据的背后,其实一套完整的 “数据生产链条”,在这方面简智也有自己的一套方法论,完成从采集设备到云端平台,再到数据的二次迭代的闭环,这也使得简智在 2 个月时间内就积累了近百万小时规模的数据。



这其中,Gen DAS Gripper是能完成简智规模化采集的首要触点,它相比传统的数据采集、UMI 等方案来看,可以更容易、快速地部署,不需要做任何的场地布置;同时全栈自研的 ISP 图像处理、CMOS 传感器,保证图像高质量、清晰。

同时可以做到基于车规级 IMU、双手设备同步,实现双手技能的高精度坐标对齐,异构数据时间误差小于 1ms

在设备端,具备超强压缩能力:将数据体积压缩至原大小的 2%,同时打通在线上传通道,实现分钟级快速上传,大幅提升数据流转效率。

Gen Matrix 则是中枢数据平台,它将收集后数据进行高精准的轨迹还原、对齐、清洗处理:将众多分散设备数据收集,超强轨迹还原、环境重建能力,轨迹真值误差小于 1cm,并将异构数据进行同步与清洗,保证数据质量,并具备自动化标注、切片等进阶能力,可以高并发处理海量数据源。这在具身行业也是领先的数据平台基建。

Gen ADP(AI Data Pipeline)则是规模化、自动化数据产线,它是将 DAS 的数据完成自动化的脉搏。它将标注、加工流程自动化,让高质量数据的产出像流水一样持续、高速,2h 内完成采集与处理全过程。目前据简智公开信息,已经完成百万小时规模数据累计,并且每天以接近万小时规模增长



开源是一件需要持续做、加速做的事情

具身智能的未来,建立在高质量数据的基石之上。在今天来看,大家对于数据的格式、规范还尚不成熟,这大大的影响了模型方案的进步速度,因此开源数据持续、加速推进,能快速填补数据鸿沟、统一技术标准、降低研发门槛、推动生态协同与自主可控,最终加速具身智能从实验室走向规模化落地。

10Kh RealOmni-Open DataSet的开放,不仅是一份海量数据资源,更是一种通过共享加速创新的可能性。简智团队后续将继续加强数据基建建设,推出更多行业有益的数据、服务,形成 “数据共享 — 模型优化 — 场景落地 — 数据反哺” 的正向循环。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
退休后才明白:别人夸你“看起来真年轻”,千万别答“哪有哪有”

退休后才明白:别人夸你“看起来真年轻”,千万别答“哪有哪有”

心理观察局
2026-05-07 08:18:05
沈眉庄为什么拍完《甄嬛传》后,仍是18线演员,郑晓龙评:自己作

沈眉庄为什么拍完《甄嬛传》后,仍是18线演员,郑晓龙评:自己作

美芽
2026-05-07 12:12:22
跟队:巴尔韦德与楚阿梅尼关系已经恶化到近乎无法挽回的地步

跟队:巴尔韦德与楚阿梅尼关系已经恶化到近乎无法挽回的地步

懂球帝
2026-05-07 23:01:07
谁的青春动了?拉丁天后夏奇拉将在5月14日发布26世界杯歌曲《来吧》

谁的青春动了?拉丁天后夏奇拉将在5月14日发布26世界杯歌曲《来吧》

懂球帝
2026-05-08 01:20:06
1940年最完美的暗杀:“23名保镖贴身保护,但脑袋却被人砍掉”

1940年最完美的暗杀:“23名保镖贴身保护,但脑袋却被人砍掉”

纪实文录
2025-05-08 16:15:44
标普看涨期权爆量2.6万亿美元创新高!高盛交易员警告:市场进入“半非理性追涨模式”

标普看涨期权爆量2.6万亿美元创新高!高盛交易员警告:市场进入“半非理性追涨模式”

华尔街见闻官方
2026-05-08 00:04:03
一边倒怒批!郑智辱骂裁判被禁6场,舆论为何零同情?真相太扎心

一边倒怒批!郑智辱骂裁判被禁6场,舆论为何零同情?真相太扎心

罗掌柜体育
2026-05-07 12:08:01
《朝日新闻》:21所中国重点高校已官宣暂停赴日交换生项目

《朝日新闻》:21所中国重点高校已官宣暂停赴日交换生项目

荆楚寰宇文枢
2026-05-07 23:10:57
移交国际法庭前一天,波尔布特离奇暴毙,知情人:他不死会很麻烦

移交国际法庭前一天,波尔布特离奇暴毙,知情人:他不死会很麻烦

莫地方
2026-05-08 00:50:03
以色列议员窜台,中方还没动作,建交公报直接给了他一记重击

以色列议员窜台,中方还没动作,建交公报直接给了他一记重击

策前论
2026-05-07 20:43:57
中国股市唯一赚钱最快思路:半仓一只股,正反不断T,稳赚不亏!

中国股市唯一赚钱最快思路:半仓一只股,正反不断T,稳赚不亏!

股经纵横谈
2026-05-05 19:53:53
我国首位女航天员刘洋,结婚8年未生子,临行前给丈夫留下2条遗言

我国首位女航天员刘洋,结婚8年未生子,临行前给丈夫留下2条遗言

霁寒飘雪
2026-04-01 07:40:42
震惊,女同圈开始流行要彩礼后那些扮演男性的拉拉去嫁人生子了!

震惊,女同圈开始流行要彩礼后那些扮演男性的拉拉去嫁人生子了!

灯锦年
2026-05-07 21:43:58
接过MVP奖杯就入Zone?贺希宁爆砍32+5+4三分 刘玉栋为他加成?

接过MVP奖杯就入Zone?贺希宁爆砍32+5+4三分 刘玉栋为他加成?

颜小白的篮球梦
2026-05-07 22:07:11
郑智违规违纪,被处罚

郑智违规违纪,被处罚

极目新闻
2026-05-07 15:20:06
一代饮品传奇跌落神坛,巅峰营收50亿,如今身背21亿债务黯然退市

一代饮品传奇跌落神坛,巅峰营收50亿,如今身背21亿债务黯然退市

小兰聊历史
2026-04-26 06:09:36
歪打正着!一旦美欧把中国踢出全球供应链,那中国国运来了挡不住

歪打正着!一旦美欧把中国踢出全球供应链,那中国国运来了挡不住

混沌录
2026-05-06 23:01:06
世界会奖励多问一嘴的人!网友:任何人都是可以商量的

世界会奖励多问一嘴的人!网友:任何人都是可以商量的

另子维爱读史
2026-05-07 21:51:38
中国球迷可能看不了今年世界杯?FIFA称谈判还在进行中,天价转播权引争议

中国球迷可能看不了今年世界杯?FIFA称谈判还在进行中,天价转播权引争议

澎湃新闻
2026-05-07 21:04:26
租下 22 万颗英伟达 GPU 的同一天,Anthropic 向谷歌 TPU 承诺了 2000 亿美元

租下 22 万颗英伟达 GPU 的同一天,Anthropic 向谷歌 TPU 承诺了 2000 亿美元

钛媒体APP
2026-05-07 10:00:21
2026-05-08 06:16:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12939文章数 142644关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

伊朗武装部队:美军违反停火空袭伊朗 已反击

头条要闻

伊朗武装部队:美军违反停火空袭伊朗 已反击

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

手机
教育
房产
本地
游戏

手机要闻

0.5mm边框+2亿像素+8000mAh,小米这台AI概念机,每一项都离谱

教育要闻

高考地理中的潮光互补

房产要闻

负债23亿,抵押482亩地!海南这家巨头,惨遭拍卖!

本地新闻

用青花瓷的方式,打开西溪湿地

《远星物语》团队新作《皓白初晓》登Steam EA

无障碍浏览 进入关怀版