![]()
“机器人大脑跟不上?建具身智能数据基座
具身智能领域存在一个有趣现象:在视频与展会的“秀场”中,机器人表现“炸裂”,跳舞、格斗无所不能;但在实际应用中,可能连简单的端茶倒水都做不了。
其实,这是当前具身智能产业普遍存在的“大小脑”发展失衡问题:机器人本体与小脑运动控制技术日趋成熟,但“大脑”的迭代进化相对滞后。换句话说,四肢发达,头脑简单。
某种程度上,传统AI像“应试教育”,训练完就定型,而真正的具身持续学习则倡导“素质教育”,与时俱进。4月28日,乐聚机器人正式发布数据采集训练场2.0。在这里,既像是一个“学校”——学习各种技能,又像是一个培训实习的“工厂”,即机器人在各行业正式“上岗”前,从这里学习、练习各类技能。
从“教机器人干活”到“让机器人自己学会干活”,悄然间,乐聚也在从单纯的“造机器”加速向更深层次的“养数据”转身。
![]()
机器人大脑跟不上?
建具身智能数据基座
从春晚再到马拉松赛跑,人们也在持续追问,从“能动”到“能用、可用、好用”,到底还缺点什么?
问题的关键是数据。数据是具身智能的“燃料”,是算法、算力之外决定智能系统能力上限的关键变量。如果具身智能机器人“答非所问”,跑步时会因自身不稳而摔倒,这些都与缺乏高质量数据有关。
机器人对数据到底有“饥渴”?数据显示,截至2026年初,全球高质量真实物理交互数据总量仅约50万小时,不足大语言模型训练数据的两万分之一。
相比大语音模型是“数据越多、参数越大、能力越强”,具身智能的数据是物理世界的反馈——力矩、摩擦、形变——不能在仿真里完美生成,也不能在互联网上随便爬取。
比如说,摘草莓,人操作起来很容易的一件事,但对具身智能机器人来说,却繁琐无比:机器人需先识别果实位置,再调整机械臂角度完成抓取,最后将果实放入容器,仅摘取力度就要反复试验:力度过小果实无法脱落,过大则会造成损伤。这背后,需要大量数据和多模态的AI训练。
![]()
当“量”的边际收益递减时,行业自然转向“质”的基础设施建设。于是,具身智能的叙事规则正发生变化,从2025年“谁的模型更大、运动能力越强”,转变为2026年“谁的数据基础设施更强”;去年行业还在拼模型参数量和预训练数据规模,今年头部企业和地方政府则在加速建训练场。
继具身智能首次写入2025年政府工作报告后,“十五五”规划纲要也明确提出,统筹布局具身智能实训场,推进虚实融合协同训练。
地方层面也在同步落地:四川省“十五五”规划专项提出加快建设大模型训练场、具身智能机器人训练场。北京石景山40余家“政产学研用”单位成立具身智能数据要素产业联盟,这是从“各建各的”走向“协同作战”的信号。
就在4月底,广东省人民政府办公厅印发《广东省加快推进人工智能全域全时全行业高水平应用行动方案》。方案提出,重点布局人形机器人设计制造,推动人工智能与机器人“大脑”“小脑”及机身协同研发,突破多模态感知融合、自适应决策等关键技术。
其中还特别提及,支持广州、深圳等地建设具身智能训练场体系,为模型研发与验证提供数据训练和验证支撑。
在此之前,乐聚已搭建了国内最大的人形机器人数据训练中心,训练场聚焦工业智造、智慧家庭、康养服务及5G融合四大前沿场景,建立高质量的技能模型库。
在这里,人形机器人“夸父们”日复一日地“上学”,通过动作捕捉、VR遥操作、真机数据采集,掌握20余项原子技能,执行成功率超过95%。从“能走”到“会干”,从“听话”到“懂你”。
![]()
精度不够?
建高质量数据集
具身智能机器人的大脑要做的不是“能不能走”,而是“走到一个复杂环境里,能不能识别任务、理解场景、完成操作”。光照变了怎么办?物体从没见过的形状怎么办?力反馈超出预期怎么办?这些问题不是算法不够好,归根结底,还是训练数据不够多、不够广、不够高质量。
乐聚进一步丰富了产品矩阵,形成了多本体具身数据,首发LET三级具身数据矩阵,精准适配轮臂、灵巧手与全尺寸人形三大硬件平台。问题来了,真的需要这么多平台?
其实,没有哪一条是完美的路线,目前呈现出多条技术路线齐头并进,包括真机遥操作、便携采集、仿真合成等维度破解数据难题。
比如,遥操作真机采集是行业公认质量最高的方案。但成本仍是这条路线绕不开的问题——单小时有效数据成本价格不菲,而且操作员上手门槛极高。
便携采集是目前规模化速度最快的方向,但抓取物体该用多大力道?如何避开障碍?门把手旋转多少度才能开门?这些都需要机器人通过海量视觉、触觉与运动数据反复学习。
为了教机器人干活,训练场2.0把数据采集分成了三个不同的维度:
轮臂操作,轮臂机器人通过VR+全身增量遥操覆盖抓、拿、放等高频标准动作,满足规模化流水线作业;
灵巧手操作,搭载触觉灵巧手与腕部六维力传感器,聚焦捏、扣、握等五指精细交互,突破复杂手眼协同瓶颈;
全尺寸人形操作,整合搬、蹲、走等大范围拟人作业,实现多关节协同与全向移动控制。
触觉、数采和双臂协同被组合成可部署的操作栈,推动具身智能从“部件参数”转向“整机能否连续干活”。把每一次执行都变成下一轮训练数据,意味着未来高质量操作数据的供给速度,可能会比硬件参数更早拉开差距。
![]()
数据采集之路绝非一帆风顺。乐聚还打造端到端的一站式数据管理工具链,实现从采集到交付的工业化闭环,比如,在数据采集环节,保证全信号同步误差小于10ms,杜绝视觉、力觉与关节数据时序错位。
这什么意思?如果存在延迟过长,机器人关节会出现抖动,数控机床加工精度下降,灵巧手刚接触到草莓还没来得及停止就往前戳破了……
试想一下,当乐聚率先建成覆盖全场景的大规模真机实采数据集训练场,未来一台机器人能稳稳接住你递来的玻璃杯,那种精度背后,可能正是来自这片训练场默默积累的成果。
需求断层?
为大脑进化建“高速”
当机器人在虚拟世界中完成“通识教育”,再通过真机实训完成“专业深造”,大幅提升训练效率与泛化能力,就可以进一步走到真实场景中来。
训练场1:1还原了包裹分拣、钣金上料、日化翻瓶、商超货架拿取等核心作业流,“学徒”们也在努力学习分拣快递、料箱拆垛、端咖啡等等。
这意味着人形机器人从实验室走向真实世界的门槛正在消融,有望批量进厂“打工”,形成新的“通用劳动力”。
乐聚并没有独享这套底层基础设施,而是联合产业上下游,共建开放、透明、可持续的具身智能数据生态。这样的一条数据“高速公路”,其核心逻辑并非提供几间实验室那么简单,而是通过建设一个集中式、标准化的基础设施,将原本分散、昂贵的机器人数据采集与训练过程,转变为集约、经济的公共服务,吸引产业链核心企业在此集聚。
![]()
当前,中国发展具身智能的优势在于丰富的场景应用,可以通过训练场的产业带动,将上中下游企业紧密联结在一起,补齐灵巧手、电机、软件等产业链环节短板,让具身智能机器人产业从“单点突破”迈向“集群成势”。从制造车间到家庭空间,从物流作业到医疗康复,训练场将成为具身智能技术迭代的“孵化器”,推动人形机器人加速赋能千行百业。
面对行业的“数据墙”,乐聚修路架桥,并开放“数据工厂”,要成为机器人产业的数据与平台赋能者。或许,修筑道路、保障供给的“基建商”,工作不那么炫目,却实实在在地决定着行业能走多快、走多远。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.