网易首页 > 网易号 > 正文 申请入驻

18岁创业者开源史上最大工厂视觉数据集,押注机器人从人类学习

0
分享至

不久前,年仅 18 岁的创业者 Eddy Xu 在社交媒体上宣布,其创办的 Build AI 正式开源 Egocentric-10K 数据集,这是一个包含 10,000 小时第一人称视角视频的数据集,记录了 2,153 名工厂工人在真实车间环境中的实际操作场景。数据集总容量达 16.4 TB,包含超过 10.8 亿帧画面,已在 Hugging Face 平台发布,采用 Apache 2.0 许可证,允许商业使用和修改。


图丨相关推文(来源:X)

Eddy Xu 在推文中写道:“历史上最大的第一人称视角数据集,机器人学习的数据扩展时代已经到来。”

Egocentric-10K 的视频全部来自真实工厂车间,而非实验室环境。工人们佩戴头戴式摄像设备,在日常工作中记录下从零件加工、分拣、组装、包装到检验的完整流程。数据统计显示,96.42% 的工作涉及至少一只手的操作,76.34% 需要双手协同,91.66% 包含主动的物体操纵动作。这些数字明显高于此前公开的同类数据集——例如 Ego4D 的手部可见率为 67.33%,EPIC-KITCHENS 则为 90.37%。


图丨与其他数据集的比较(来源:X)

视频以全高清 MP4 格式存储,按工厂和工人分类组织。每个视频片段都附带 JSON 格式的元数据,包括工厂编号、工人编号、视频时长、分辨率、帧率等信息。数据集采用 WebDataset 格式,支持流式加载和部分下载,研究者可以根据需要选择特定工厂或工人的数据进行训练。

Build AI 的创始人 Eddy Xu 的成长轨迹相当传奇。2021 年,还在读初三的他就带领 Great Neck 的机器人团队 1569A OMEGA 参加 VEX 机器人世界锦标赛,在 2 万支参赛队伍中获得第 32 名。这支队伍在队员家的地下室里运营,没有家长或专业教练指导,也没有资金赞助。


图丨Eddy Xu(来源:X)

后来 Eddy Xu 进入 Miller School of Albemarle,在那里他成为计算机编程课程的学生助教,开发了工程设计软件供学校的混凝土独木舟团队使用。他自学 Java 和 Python,在高中阶段就通过了 AP 计算机科学考试。

除此之外,他还有一些系列创业经历:筹集 12 万美元建立竞技机器人团队并赢得全国签名锦标赛,在 DECA 商业世界锦标赛的 20 万名竞争者中胜出,3 个月内出售一家拥有 17.8 万用户的教育科技初创公司。

2025 年初,他在哥伦比亚大学就读时开发了一款基于 Meta 智能眼镜的 AI 国际象棋系统。这个项目使用计算机视觉识别棋盘,结合象棋引擎实时提供最优走法,一度在社交媒体上引发热议。


图丨Eddy Xu 开发的 AI 眼镜(来源:X)

今年,Eddy Xu 从哥伦比亚大学辍学创办 Build AI。他在个人网站上写道:“我拒绝了超过 2,500 万美元的股权邀约来创办 Build。团队中的其他人也离开了学术界、顶级实验室和他们自己的公司加入进来。”而他为公司定下的使命也相当宏伟:“构建物理超级智能,为所有人带来富足”。

Build AI 在 9 月获得了 500 万美元融资,由 Abstract Ventures、Pear VC 和 HF0 三家早期投资机构共同领投,ZFellows 和 Alex Botez (正是使用 Xu 开发的国际象棋眼镜的那位棋手)作为天使投资人参与。

根据其官网描述,Build AI 是第一家“围绕扩展经济上有用的自我中心人类数据而专注打造的公司”,具体来说,其主要策略就是“制造记录设备并在全球企业中部署”。

所谓第一人称视角或自我中心视觉(egocentric vision),指的是从执行者自身视角捕捉的视觉信息。与传统的固定机位第三人称拍摄不同,这种视角记录了手部操作的细节、视线的移动轨迹以及身体与环境的互动方式。Meta 的研究项目 EgoMimic 已经证明,使用 Project Aria 智能眼镜收集的人类第一人称操作数据,能够显著提升机器人的任务成功率并实现场景泛化。

另一家知名的人形机器人公司 Figure AI 也采取了这种收集数据的方法。Figure AI 在今年 9 月宣布了“Project Go-Big”计划,通过与资产管理巨头 Brookfield 合作,在超过 10 万个住宅单元中收集人类日常活动的自我中心视频,用于训练其人形机器人 Figure 03。Figure AI 声称已实现“零样本人类到机器人迁移”,机器人仅通过观看人类视频就能学会执行导航任务,无需任何机器人专用训练数据。这种方法被 Figure 形容为“互联网规模的人形机器人预训练”。

除了依靠人类视频之外,业内也所采用的另一条线路则是从真实机器人交互中直接收集数据。我们不久前报道的 Generalist AI 即是这条路线的代表,其 GEN-0 模型据称使用了超过 27 万小时的机器人操作数据进行预训练,以每周 1 万小时的速度增长。

两种路径各有优劣。人类视频数据丰富且易于大规模采集,但存在实施差距(Embodiment Gap),人类的身体结构与机器人截然不同,如何将人类的动作映射到机器人上是个难题。机器人自身数据虽然不存在映射问题,但采集成本高昂,规模扩展困难。

Xu 曾表示,Build AI自成立以来已经“收集了比历史上任何公司都多的自我中心数据”,但关于这些数据的可用性等核心问题,我们目前尚不得而知。

正如其官网所表示的,这是一个“具有重大技术风险和低成功概率”的研究性押注。网站写道:“如果我们是对的,我们既能推进机器人研究,也能从根本上改善数十亿人的生活。”公司强调团队由独角兽创始人、机器人竞赛世界冠军和学术研究者组成,价值观是“紧迫感、雄心和技术卓越”。

目前,Egocentric-10K 数据集的完整版本和 3 万帧的评估子集都已在 Hugging Face 上公开。研究者可以使用 Python 的 datasets 库直接加载,也可以选择特定工厂或工人的数据进行实验。Build AI 表示,这个数据集的规模和质量还在持续增长中。

参考资料:

1.https://build.ai/

2.https://huggingface.co/datasets/builddotai/Egocentric-10K

3.https://x.com/eddybuild/status/1987951619804414416

4.https://www.eddy.build/

5.https://www.humanoidsdaily.com/feed/build-ai-open-sources-10-000-hours-of-factory-worker-video-to-scale-robot-learning

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏一男子把郎酒灌入茅台瓶,拿去找行家鉴定,结果鉴定为真品

江苏一男子把郎酒灌入茅台瓶,拿去找行家鉴定,结果鉴定为真品

涛哥美食汇
2026-01-15 09:03:28
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
特朗普计划“斩首”哈梅内伊!伊朗称24小时研发核弹?

特朗普计划“斩首”哈梅内伊!伊朗称24小时研发核弹?

项鹏飞
2026-01-12 19:41:25
不装了,拼多多再造了一个拼多多。

不装了,拼多多再造了一个拼多多。

纯洁的微笑
2026-01-15 12:19:58
特朗普:台湾属于中国,武统是中方的自由,但一动手美国会不高兴

特朗普:台湾属于中国,武统是中方的自由,但一动手美国会不高兴

兴史兴谈
2026-01-15 09:12:46
再次单场送出6血帽!完爆浙江顶级内线,球迷:他可以替换周琦了

再次单场送出6血帽!完爆浙江顶级内线,球迷:他可以替换周琦了

南海浪花
2026-01-15 08:20:15
“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

有书
2026-01-09 21:30:59
撤换吴宗宪?郑丽文最新任命曝光,张亚中被重用,侯友宜直接露馅

撤换吴宗宪?郑丽文最新任命曝光,张亚中被重用,侯友宜直接露馅

卷史
2026-01-14 19:39:49
流落中国的外国公主,如今拒绝回国:我是中国人,中国就是我的家

流落中国的外国公主,如今拒绝回国:我是中国人,中国就是我的家

鹤羽说个事
2026-01-05 11:05:27
离婚3年后,31岁董子健再次官宣喜讯,已是孙怡高攀不起的存在!

离婚3年后,31岁董子健再次官宣喜讯,已是孙怡高攀不起的存在!

素衣读史
2026-01-14 14:06:44
98年儿子被打死只赔3万,父亲用炸弹为儿复仇,法官判决出乎意料

98年儿子被打死只赔3万,父亲用炸弹为儿复仇,法官判决出乎意料

谈史论天地
2026-01-08 17:25:03
伟大的2-0,吴易昺进澳网正赛,中国男网4人出战创历史,狂揽70万

伟大的2-0,吴易昺进澳网正赛,中国男网4人出战创历史,狂揽70万

越岭寻踪
2026-01-15 12:46:24
郭德纲穿LV已经是最低调的了!现身一酒厂,个子不高感觉没有1米6

郭德纲穿LV已经是最低调的了!现身一酒厂,个子不高感觉没有1米6

乐悠悠娱乐
2026-01-15 09:49:27
殷桃两套大片美出圈!深V性感与浅蓝清新切换,46岁身材状态绝了

殷桃两套大片美出圈!深V性感与浅蓝清新切换,46岁身材状态绝了

章眽八卦
2025-12-20 12:29:42
辽宁男篮VS新疆!杨鸣拒绝3连败,赵继伟确定出战,央视直播

辽宁男篮VS新疆!杨鸣拒绝3连败,赵继伟确定出战,央视直播

体坛瞎白话
2026-01-15 08:22:30
陪嫁金条掉色,租的别墅,新娘厅官父亲、模特母亲是花钱雇的演员

陪嫁金条掉色,租的别墅,新娘厅官父亲、模特母亲是花钱雇的演员

诗意世界
2026-01-02 10:15:30
王健林预言成真!第3轮大涨来了?内行人:2026年房价或超出想象

王健林预言成真!第3轮大涨来了?内行人:2026年房价或超出想象

猫叔东山再起
2026-01-15 10:55:03
1972年,175位将军复出没人要,各大军区纷纷甩锅,周总理这招绝了

1972年,175位将军复出没人要,各大军区纷纷甩锅,周总理这招绝了

寄史言志
2026-01-08 18:02:14
张学良到了晚年才吐露心声:我这辈子从来不信迷信,然而在老虎厅除掉杨宇霆之后,我却不得不改变想法

张学良到了晚年才吐露心声:我这辈子从来不信迷信,然而在老虎厅除掉杨宇霆之后,我却不得不改变想法

清风鉴史
2025-12-26 17:05:13
美专家:中国不可怕,可怕的是中国塔里木盆地下藏着地下海洋!

美专家:中国不可怕,可怕的是中国塔里木盆地下藏着地下海洋!

青烟小先生
2025-11-28 21:22:03
2026-01-15 13:28:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16125文章数 514485关注度
往期回顾 全部

科技要闻

千问接入淘宝支付宝,大模型开卷办事能力

头条要闻

银币半年暴涨20倍 杭州有人一口气花30万买15公斤银砖

头条要闻

银币半年暴涨20倍 杭州有人一口气花30万买15公斤银砖

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

财经要闻

“疯狂的白银”,还能走多远?

汽车要闻

今年推出超40款新车,BBA要把失去的夺回来

态度原创

艺术
健康
手机
数码
家居

艺术要闻

历代书家集字春联大集合

血常规3项异常,是身体警报!

手机要闻

苹果称王,三星郁闷,国产第一还是小米

数码要闻

曜越钢炼S370 WS机箱上架:木纹装饰前面板,299元

家居要闻

自在自宅 个性自由

无障碍浏览 进入关怀版