网易首页 > 网易号 > 正文 申请入驻

人形机器人交付元年,行业从卷模型转向拼数据

0
分享至



2026 年 4 月,斯坦福 HAI 发布的《AI Index Report 2026》揭示了具身智能的残酷现状:机器人操控在仿真环境中的成功率高达 89.4%,但在真实家庭场景中骤降至 12%。

这 77 个百分点的“迁移鸿沟”(Sim-to-Real Gap)成为行业当下所有动作的注脚:特斯拉在 2025 年 Q4 财报会上坦言,Optimus 目前的首要任务并非干活,而是通过实地运行进行数据采集;“十五五”规划纲要明确提出统筹布局具身智能实训场;不到一年时间,国内在建或建成的具身智能训练场接近 30 家。

最强势的玩家、最高层的政策、最密集的基础设施投入,全部围着同一件事打转:那 77 个百分点要靠什么补上。

去年比模型,今年比数据

步入 2026 年,具身智能的行业叙事发生了变换。

最直观的体现,在于全球权威机构对“人形机器人数据”地位的重新定义。《麻省理工科技评论》在 2026 年度 AI 洞察中,将其列为当下最重要的命题。其核心逻辑在于:大语言模型靠海量文本学会了生成语言,那人形机器人能不能靠海量运动数据学会在真实世界里干活?

然而,描述人类运动方式的数据集远不像互联网文本那样现成。智元机器人创始人之一、觅蜂科技 CEO 姚卯青曾在 4 月的一场发布会上给出一组对比数据,大语言模型 GPT-5 训练语料折合约 100 亿小时,而全行业汇聚的高质量具身数据仅约 50 万小时,差距以万倍计。

乐聚机器人技术总监王松也曾深度剖析具身智能行业的核心痛点。他指出,当前人形机器人产业发展面临本体与小脑技术趋于成熟,但“大脑”进化严重受阻于数据的困境。真机数据是模型落地的最后一步,也是关键一步,而训练场则是规模化、系统化生产真机数据的基础设施。

为了凑出这个数据集,全行业开始走出实验室:在中国的训练场,工人穿戴外骨骼和 VR 设备重复着枯燥的动作;在阿根廷和印度,零工们通过拍摄家务视频换取报酬......

这种集体转向并不是偶然。“我们可以参考自动驾驶做一个粗略的对照。训练一个 L4 级自动驾驶模型,所需数据量通常以百万小时计;而人形机器人的自由度、操作复杂度、场景多样性比自动驾驶高出 1 到 2 个数量级,对应的数据规模差距也在这个量级。也就是说,训练一个具备开放世界泛化能力的具身基座模型,所需真机数据量大致在数百万到上千万小时之间。”王松表示。

那能不能用仿真来补?

仿真擅长足式运动等刚体动力学任务,但在“接触丰富”(contact-rich)的场景下力有不逮。2025 年的一项研究指出,仿真器难以建模零件形变、非线性摩擦及柔性物体(如衣物、流体)的物理特性。工业精密装配或家庭折叠衣物时,由于建模成本和算力开销甚至高于真机采集,仿真无法完全替代现实。

在真实部署的“最后一公里”,真机数据仍是跨不过的门槛。仿真环境是理想化的,而现实充满变量:光照改变、物体移位或杯子重了 50 克,都可能导致模型失效。补齐 77% 的成功率缺口,依靠的不是更大规模的模型,而是覆盖多变量、多样本的真机数据。

这一行业共识,在乐聚的实践中得到了最直接的验证:400 条高质量真机数据训练效果远超 1,300 条低质量数据,模型迭代时长由 7-10 天缩短至 2-3 天,整体飞轮效率提升 3 至 4 倍,设备部署成功率从不足 60% 提升至 90% 以上。

此外,乐聚率先跑通了真机数据的商业化闭环。依托规模化训练场体系,数据服务成为独立业务,落地服务一汽、海晨物流、兆丰等实体企业。其以真实产业场景、成熟商业交易,切实证明:真机数据既是技术迭代的核心抓手,也是具身智能走向规模化商用的关键支撑。

机器人的“练兵场”

采集真机数据并不容易,单台机器人动辄数十万的成本、关节磨损的维护开销,以及低效的遥操作,使得数据采集成为一种高壁垒的行为。

这也是为何数据“训练场”已从企业内部设施演变为具身智能产业的公共基础设施。2025 年以来,建设具身智能训练场这一产业共识正在快速转化为国家层面的战略部署,“十五五”规划纲要明确提出统筹布局具身智能实训场,推进虚实融合协同训练。

根据中国信通院联合清华大学电子工程系发布的《具身智能发展报告(2025年)》,国内已建成或计划在建的训练场已接近 30 家。石景山人形机器人数据训练中心作为目前全国最大的中枢,通过“采集-清洗-标注”的全流程闭环,年产高质量训练数据超 600 万条;上海张江则聚焦异构机器人训练,计划形成千万级数据集,力图打破不同本体间的数据孤岛。

头部企业在这场数据飞轮竞争中表现尤为激进。

比如,乐聚在全国参与建设了十个训练场,年产真机数据 2,500 万条。数据覆盖轮臂、灵巧手、全身运控全维度,横跨工业、商服、家庭、康养四大类,共 219 种场景、1,751 个任务、5,592 个物体。

LET 数据集全平台下载量突破 100 万次。60,000 分钟真机数据免费开源,另有数万小时真机数据已交付行业客户——从开源影响力到商业变现,一面服务开源生态,一面服务具身基模数据产业。

根据公开信息,其近期发布的训练场 2.0,提出了 LET 三级数据体系,覆盖轮臂、灵巧手与全尺寸人形,并要求全信号同步误差控制在 10ms 以内,并通过 1:1 还原智能制造和智慧物流场景,极大地缩短了模型在现实环境中的进化周期。这种“训练场模式”不仅压低了单条数据的生产成本,更实现了跨本体、跨场景的知识迁移。

而更深层的战略在于与模型厂商的深度绑定。作为蚂蚁灵波等核心团队的合作伙伴,乐聚为其 LingBot-VLA 模型提供了覆盖多种构型的万小时真机数据。这种合作不仅让乐聚的数据深度嵌入了主流算法的成长路径,也让其硬件本体成为了模型训练的标配载体。加上近期推出的科研框架 2.0,通过降低动作采集门槛来赋能整个科研圈,乐聚的野心已经很明显:不只是卖机器人,而是要成为具身智能时代那个不可或缺的基座平台。

抢滩真机数据

其他公司如智元试图通过独立实体觅蜂科技来解决行业的数据荒漠问题;宇树招股书显示,计划将近一半的募资投向模型和数据;京东规划建设大规模数据采集中心,计划两年内储备千万小时级优质数据......

海外巨头的动向同样印证了这一趋势。特斯拉在工厂内部署大规模 Optimus 真机测试与数据采集体系,以真实产线场景反哺模型迭代;Figure AI 则通过真实工业产线长期部署与多样化真实世界环境数据采集,构建了高效的数据飞轮,持续反哺模型的迭代升级......

要训练一个真正通用的机器人“大脑”,高质量的真机数据是必不可少的燃料。《2026 全球具身智能产业投资风向标》中明确提到, 2026 年是具身智能的交付元年,投资应聚焦具备“真机数据闭环”的团队;最早构建“场景-数据-成本”自强化飞轮的企业,将获得定义未来的非对称优势。

当然,在现阶段,仿真数据在大规模预训练和策略探索中依然不可替代,行业仍需面对真机与仿真的闭环对齐、数据隐私、以及跨平台复用等现实难题。但目前的共识已经非常明确:要补上那 77 个百分点的成功率差距,不能只靠增加模型的参数规模,必须靠覆盖更多场景、更多变量、甚至更多失败样本的真机数据。

真机数据的稀缺是行业最大的制约,但同时也是最大的机会点。在这一轮竞速中,谁能率先通过训练场模式实现高效、低成本的数据获取,谁就更有机会率先跑通通用人形机器人的量产之路。

1.https://www.caict.ac.cn/kxyj/qwfb/bps/202601/P020260130541978285206.pdf

2.https://www.ndrc.gov.cn/fggz/fzzlgh/gjfzgh/202603/U020260317369114704096.pdf

3.https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf

4.https://www.technologyreview.com/2026/04/21/1135656/humanoid-data-robot-training-ai-artificial-intelligence/

5.http://jjckb.xinhuanet.com/20260202/47b05862a0e340abab5a516775917bc0/c.html

运营/排版:何晨龙

注:封面/首图由 AI 辅助生成

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖清德回台不到24小时,卢秀燕付出代价,鲁比奥:送台当局一句话

赖清德回台不到24小时,卢秀燕付出代价,鲁比奥:送台当局一句话

潋滟晴方DAY
2026-05-06 20:30:13
薪资退回15年前!东莞一厂长哭诉,仅过2年 如今接受薪水减半工作

薪资退回15年前!东莞一厂长哭诉,仅过2年 如今接受薪水减半工作

火山詩话
2026-05-07 12:01:39
拉什福德祝贺曼联重返欧冠!更衣室没给其留位置,回归大门被关死

拉什福德祝贺曼联重返欧冠!更衣室没给其留位置,回归大门被关死

罗米的曼联博客
2026-05-07 10:55:06
“老婆,这女子和你好像”,四川男子随手刷短视频,竟是妻子失散38年的姐姐;女子:不计较父母将自己送人

“老婆,这女子和你好像”,四川男子随手刷短视频,竟是妻子失散38年的姐姐;女子:不计较父母将自己送人

大象新闻
2026-05-07 11:50:04
台湾省人均GDP四万美元,超过日韩,但为什么给人感觉比较落后

台湾省人均GDP四万美元,超过日韩,但为什么给人感觉比较落后

狐狸先森讲升学规划
2026-05-06 05:35:03
置换了2辆车,才知道旧车卖给给4S店和车贩子的差别,都是真心话

置换了2辆车,才知道旧车卖给给4S店和车贩子的差别,都是真心话

侃故事的阿庆
2026-05-07 07:27:26
发现没?军方明显越来越“不耐烦”了,说的都是外国人能听懂的话

发现没?军方明显越来越“不耐烦”了,说的都是外国人能听懂的话

蜉蝣说
2026-05-07 10:37:56
三星One UI 8.5正式版5月11日起全球更新,首批名单公布

三星One UI 8.5正式版5月11日起全球更新,首批名单公布

IT之家
2026-05-07 13:35:06
广东男子打麻将猝死,牌友从他身上跨过,家属索赔28万:法院判了

广东男子打麻将猝死,牌友从他身上跨过,家属索赔28万:法院判了

起喜电影
2026-05-06 19:38:17
骑士消息:哈登状态堪忧,悍将自信发声,G2出场情况更新

骑士消息:哈登状态堪忧,悍将自信发声,G2出场情况更新

冷月小风风
2026-05-07 11:47:55
美法官公布“爱泼斯坦遗书”:他们调查了我一个月,什么也没发现!美媒:没署名没日期!美商务部长接受问询,曾承认登上爱泼斯坦私人岛屿

美法官公布“爱泼斯坦遗书”:他们调查了我一个月,什么也没发现!美媒:没署名没日期!美商务部长接受问询,曾承认登上爱泼斯坦私人岛屿

每日经济新闻
2026-05-07 09:21:10
瓦伦丁哭崩!中国老板一键结清奖金,多少老板被狠狠打脸

瓦伦丁哭崩!中国老板一键结清奖金,多少老板被狠狠打脸

童叔不飙车
2026-05-06 13:58:47
这不是我们的战争——法国船只在霍尔木兹海峡遭袭,数名船员受伤

这不是我们的战争——法国船只在霍尔木兹海峡遭袭,数名船员受伤

老王说正义
2026-05-07 00:06:55
陈慧琳演唱会穿三角裤衩,五十多了合适吗?不愧是女神

陈慧琳演唱会穿三角裤衩,五十多了合适吗?不愧是女神

西楼知趣杂谈
2026-05-01 22:23:05
上海,一女子把房子借给男同事住了10年,想要回房子却被拒绝:“我花640万买的,这是我的房子,不搬!”法院判了

上海,一女子把房子借给男同事住了10年,想要回房子却被拒绝:“我花640万买的,这是我的房子,不搬!”法院判了

励职派
2026-05-06 19:31:38
成人片非教科书!持久力1小时?随时再升旗?医揭成人片7大迷思

成人片非教科书!持久力1小时?随时再升旗?医揭成人片7大迷思

孤独的独角兽影视
2026-05-07 10:00:20
调查发现:那些常年喝中药的人,到70岁后,大多变成了这样!

调查发现:那些常年喝中药的人,到70岁后,大多变成了这样!

芹姐说生活
2026-05-06 14:04:20
华蓥山事故后续:家属含泪签下和解协议,210万真的能抚平伤痛吗

华蓥山事故后续:家属含泪签下和解协议,210万真的能抚平伤痛吗

今朝牛马
2026-05-06 20:51:33
吴彦祖:被李美琪“折磨”到抑郁流泪,终遇恩爱23年的Lisa S

吴彦祖:被李美琪“折磨”到抑郁流泪,终遇恩爱23年的Lisa S

橙星文娱
2026-05-05 09:59:29
中国展现强硬姿态后,国际足联知道怕了,紧急派出高管到中国求情

中国展现强硬姿态后,国际足联知道怕了,紧急派出高管到中国求情

老鼜尾声电影解说
2026-05-07 11:54:16
2026-05-07 14:20:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16672文章数 514924关注度
往期回顾 全部

科技要闻

凌晨突发!马斯克租22万块GPU给“死敌”

头条要闻

北京三位女大学生青海自驾游2死1伤 伤者一审获刑4年

头条要闻

北京三位女大学生青海自驾游2死1伤 伤者一审获刑4年

体育要闻

阿森纳巴黎会师欧冠决赛!5月31日开战

娱乐要闻

小S阿雅重返大S母校,翻看大S毕业照

财经要闻

特朗普:美伊“很有可能”达成协议

汽车要闻

理想为什么不做轿车,有了解释……

态度原创

教育
本地
游戏
手机
公开课

教育要闻

高考倒计时30天,华南理工杨中民校长向您发出诚挚邀约!

本地新闻

用青花瓷的方式,打开西溪湿地

靠说话打架的游戏,是怎么让人喊出“爷青回”的?

手机要闻

消息称三星正研发MH1全息屏,苹果Spatial iPhone将首发

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版