网易首页 > 网易号 > 正文 申请入驻

我们去看了智元机器人的「数采厂」,等等!这不是《星球大战》片场吗?

0
分享至

文 | 田哲

编辑 | 苏建勋

2025年初,我们了解到一件事,国内具身智能独角兽“智元机器人”(就是B站知名UP主“稚晖君”当CTO的那家公司),在上海,建了一座“数据采集工厂”(简称“数采厂”)。

这是啥?为啥建?怎么采?一系列疑惑涌上我们心头,我们决定去看一看。

当然了,在去之前,我们对一家“数采厂”的工作流程,有一些非常刻板的想象——在堆满服务器黑盒子的昏暗房间,挂着黑眼圈、发量堪忧的程序员,机械地敲着键盘输入代码……

错错错!当《智能涌现》抵达智元机器人位于上海浦东的数采厂,发现现实和我们的想象,截然不同!

毫不夸张地说,这完全是美国电影《星球大战》的片场!

《星球大战》电影海报;图源网络

在这座3000平方米的数采厂中,不同主题的房间占据了工厂的绝大部分面积,每个房间都精心还原了现实生活的物件布局,机器人就在不同的场景中执行不同任务。

在卧室中,机器人乖巧地学习叠衣服。

机器人学习叠衣服;图源:智元机器人

在餐桌前,机器人把餐具挨个摆放整齐。

机器人摆放餐盘;图源:《智能涌现》拍摄

机器人还要学会打餐各式菜肴,并且不会手抖。

机器人正在用勺子舀鸡蛋;图源:《智能涌现》拍摄

而在商超收银台前,机器人一只手拿扫码器,另一只手拿着商品扫码。

智元机器人正在学习商品扫码;图源:《智能涌现》拍摄

参观结束后,《智能涌现》见到了数采厂负责人姚卯青,他也是智元机器人具身产品线总裁、研究院执行院长,负责数据驱动具身智能产品研发。

此前,姚卯青曾在Waymo、蔚来汽车等公司负责研发感知算法、端到端大模型。

姚卯青告诉《智能涌现》,机器人每完成一个动作,就相当于一条数据,数据将通过机器人的主机上传至云端,智元机器人团队将利用这些数据训练机器人的大模型,从而让机器人真正掌握一项技能,比如冲咖啡、熨衣服等。

为了让机器人快速学习技能,智元为它们安排了一对一教学老师——数据采集员,他们都是年轻有活力的小哥哥小姐姐,为了更好地教机器人完成动作,采集员也需要肢体协调,动作标准。

数据采集员们手持设备,手把手地控制机器人完成抓、握、放等动作。有时他们也会头戴VR设备,更精准地让机器人模仿学习人类动作。

据了解,现在智元数据采集工厂投放了近百台机器人,日均采集3-5w条数据。

而为了让机器人更快在不同环境中掌握尽可能多的技能,智元数据采集工厂模拟了家庭、零售、服务业、餐饮、工厂五个场景。

在这里,你能发现商超内不仅有各类零食,还有葡萄酒、香烟,甚至连蔬果的价钱也标好了。

智元机器人模拟的商超;图源:《智能涌现》拍摄

也有一批机器人分散在各自“工位”,在桌前学习简单地叠衣服等技能。

机器人们在工位学习不同技能;图源:《智能涌现》拍摄

据了解,数采厂面积还将增加1000平方米,可增加更多场景的同时,也能根据客户需要定制化模拟场景。

不过,目前行业内少见打造如此多样场景的机器人公司,一个问题随之而来:智元机器人下决心打造数据采集工厂,这一过程是如何展开的?

为具身智能机器人,打造数据养料场

对于大多数初创公司而言,将高额资金建设一座工厂用于数据采集,风险无疑是巨大的,而智元机器人似乎没有犹豫,仅仅用了一个多月就完成搭建数据采集工厂。

促使智元机器人不惜高成本打造数采厂,这背后,行业现存数据量在供给侧上的巨大空白。

2024年6月,智元机器人决定研发机器人具身智能大模型,这需要海量数据以训练大模型。

姚卯青告诉《智能涌现》,机器人通过数百条数据学会一个技能,这些动作往往都是长程任务,比如冲泡咖啡,熨衣服等。

他们曾试图寻找行业内的开源数据库,但发现高质量、统一格式的数据几乎不存在。即使行业内开源了百万条由真实机器人收集的训练数据集,但是这些数据实际上由不同公司、不同型号规格的机器人采集,数据质量较低,达不到智元的要求。

姚卯青表示,不同传感器和形态的数据差异过大,将削弱整体训练效果,比如一个六轴机械臂的数据在七轴灵巧手机器人上几乎无法复用,因此需要统一标准的数据。

而让智元下决心建设数采厂,这个过程也很简单。

姚卯青表示,智元机器人采集了几千条数据用于训练算法,虽然能让机器人顺利完成某个动作,但是无法泛化——如果改变物体种类、颜色甚至光线,都将影响机器人再次完成同样的动作。因此智元机器人决定建设工厂大规模采集数据。

不同房间的机器人正在采集数据;图源:《智能涌现》拍摄

数采厂未来将源源不断为机器人学习提供数据养料。据了解,智元数据采集工厂投入使用两个多月,就采集了超百万量级真机数据集,采集任务超一千种,每个任务都包含几百条数据,一些特别难的长程任务可达几千条。

“不久后我们将拥有超千万条数据。”姚卯青笑着说。

探寻机器人的Scaling Law

在采集数万条机器人重复动作后,智元机器人收获了一些意外之喜:机器人能够在未经训练的情况下,根据要求控制倒水量;只教了机器人几十次,就能学会叠裤子。

这正是智元机器人想要打造的机器人——能够自主理解人类指令和外部环境,并能适应复杂的环境。

智元希望机器人能够更换不同品牌、型号的咖啡机配件;图源:《智能涌现》拍摄

过去数十年,机器人的控制往往依赖人们的预设规则,向机器人输入情况描述以及应对方式的规则,机器人在相应情况下完成操作。然而机器人遇到的情况千变万化,难以依靠提前输入规则就能让机器人应对所有情况。

在大模型应用爆发后,让机器人从冰冷的躯体有了智力,能够理解世界和人类。而智元机器人正在研发的,是具备端到端大模型的机器人,通用能力更强且反应速度更快。

机器人从接受指令到完成动作通常有三个步骤:感知外部环境,做出决策、控制肢体执行任务,信息在这一链条传递中可能出现失真,从而影响机器人完成动作。

但端到端大模型,不需要分模块,更不依赖精准测量,就像人类超车前,不会下车测量两车之间的距离,再进行超车。

智元机器人对端到端大模型机器人的设想是,机器人能够接受人类的复杂指令,比如让机器人从远处取来手机,或者从冰箱里拿一包薯片。这些指令不仅考验着机器人对任务的理解能力,还要求机器人能够识别物体,并完成移动到相应地点、取物,返回,提交物品。

但是达到这一状态并不容易。姚卯青表示,需要不断向大模型投喂数据,数据量越大,大模型在某一场景表现会更接近人类,他预估的数据量为几千万条到1亿条,机器人的Scaling Law远未到来。

《智能涌现》了解到,机器人需要软硬件结合,仅有其中之一都难以让机器人技术迅速发展。美国的硬件成本较高,因此美国机器人初创公司大多只研发算法。中国已有供应链优势,结合数据和自研的硬件,会让算法、硬件、软件快速迭代。

姚卯青相信,中国机器人技术的整体进度已与美国不相上下,因为美国的人工成本比国内高出十倍,还得从中国采购各种零部件。

智元机器人用更低的成本和高效的迭代速度,拓展了场景模拟和数据采集规模,那些在美国机器人公司看来“遥不可及”的技术,正在中国的数据采集工厂不断流淌的数据中,一点点接近成为现实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军特种部队抵达叙利亚,伊朗边境枪声密集:数千援军已进入伊朗

美军特种部队抵达叙利亚,伊朗边境枪声密集:数千援军已进入伊朗

松林看世界
2026-01-18 07:17:39
美国承认插手台海会吃大亏,鲁比奥:没了中国全球日子都不好过

美国承认插手台海会吃大亏,鲁比奥:没了中国全球日子都不好过

兴史兴谈
2026-01-17 08:54:21
患儿家长深夜突然求人买新衣服,志愿者秒懂!服装店女老板赶来开门,事后还退回衣服钱

患儿家长深夜突然求人买新衣服,志愿者秒懂!服装店女老板赶来开门,事后还退回衣服钱

潇湘晨报
2026-01-17 21:58:30
双色球、大乐透将变更游戏规则,有何不同?变更后中奖更容易吗?

双色球、大乐透将变更游戏规则,有何不同?变更后中奖更容易吗?

之乎者也小鱼儿
2026-01-16 23:31:42
轰39+4+7!创NBA纪录,无解的不是赢球,而是杜兰特评价谢泼德

轰39+4+7!创NBA纪录,无解的不是赢球,而是杜兰特评价谢泼德

小彭美识
2026-01-17 19:08:20
北京今天上午小雪持续,道路结冰黄色和持续低温黄色预警中

北京今天上午小雪持续,道路结冰黄色和持续低温黄色预警中

界面新闻
2026-01-18 07:18:26
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
日本对中国最大的筹码已经没用了!中日贸易战,谁的损失更大?

日本对中国最大的筹码已经没用了!中日贸易战,谁的损失更大?

扶苏聊历史
2026-01-18 08:20:03
意大利承包商再惹祸!砸列车导致32死,泰总理怒吼:拉黑!

意大利承包商再惹祸!砸列车导致32死,泰总理怒吼:拉黑!

丁隗解说
2026-01-16 21:23:58
罗马诺丨合同已经准备就绪

罗马诺丨合同已经准备就绪

米兰圈
2026-01-17 08:59:36
2026年半月内三位名人离世,最小年仅17岁,愿一路走好

2026年半月内三位名人离世,最小年仅17岁,愿一路走好

史鹷的生活科普
2026-01-18 06:23:12
越南少将大实话:当年中国撤军为啥不追?不是不想,是一份绝密命令让人不得不服

越南少将大实话:当年中国撤军为啥不追?不是不想,是一份绝密命令让人不得不服

老杉说历史
2026-01-14 20:31:37
钱再多有什么用,聂卫平遗孀现状,给所有“老少恋”夫妻提了个醒

钱再多有什么用,聂卫平遗孀现状,给所有“老少恋”夫妻提了个醒

小白兔YY
2026-01-17 03:20:18
司晓迪爆出了与鹿晗的真相,网友:关晓彤我连心疼你都有时差

司晓迪爆出了与鹿晗的真相,网友:关晓彤我连心疼你都有时差

动物奇奇怪怪
2026-01-16 08:41:25
中纪委明确饭局红线:公职人员,这5类饭局别碰

中纪委明确饭局红线:公职人员,这5类饭局别碰

娱乐督察中
2026-01-16 16:25:33
8年前,那个3岁识千字、6岁夺央视冠军山东神童王恒屹,如今怎样

8年前,那个3岁识千字、6岁夺央视冠军山东神童王恒屹,如今怎样

梦史
2026-01-14 10:21:55
邯郸女子赤裸惨死家中,死后频繁约人上门,警方打开床板后傻眼

邯郸女子赤裸惨死家中,死后频繁约人上门,警方打开床板后傻眼

碎碎纪实
2026-01-16 15:33:38
到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

另子维爱读史
2026-01-09 22:18:04
伊朗诺奖得主:1979年推翻国王,我后悔了-国家自困45年

伊朗诺奖得主:1979年推翻国王,我后悔了-国家自困45年

桂系007
2026-01-18 00:07:30
中戏院长主动投案!闫学晶儿子学籍疑云反转?背后牵扯不简单?

中戏院长主动投案!闫学晶儿子学籍疑云反转?背后牵扯不简单?

复转这些年
2026-01-14 18:39:16
2026-01-18 08:52:49
36氪 incentive-icons
36氪
让一部分人先看到未来
150444文章数 2847783关注度
往期回顾 全部

科技要闻

两枚火箭发射失利,具体原因正排查

头条要闻

美国因格陵兰岛问题对欧洲8国加关税 多国反击特朗普

头条要闻

美国因格陵兰岛问题对欧洲8国加关税 多国反击特朗普

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

游戏
手机
房产
家居
公开课

LPL春季赛:Photic终结比赛,IG击败JDG,迎来赛季首胜

手机要闻

红魔11 Air:AI游戏圈搜,哪里不会圈哪里?

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

家居要闻

岁月柔情 现代品质轻奢

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版