网易首页 > 网易号 > 正文 申请入驻

摸底人形机器人“数据荒”:业内人称呈抢购状态,大型需求方“有多少要多少”

0
分享至

本文来源:时代周报 作者:朱成呈 闫晓寒


100多支战队、300余台人形机器人、超人类世界纪录的成绩,刚结束的北京亦庄人形机器人半程马拉松再掀热度。

与进步明显的运动控制相比,数据之渴正成为影响人形机器人“大脑”进步的关键障碍。

生成式AI把“写作”“辅助办公”等能力推向高点之后,物理AI正尝试迈进更难的一步,走进真实世界。不过,与互联网语料天然可获取不同,物理世界的数据既稀缺,也难以标准化,这使得具身智能从一开始就面临“无米之炊”。

3月16日,英伟达推出物理AI数据工厂。该数据工厂的核心逻辑是:希望通过一套参考架构,统一并自动化训练数据的生成、增强和评估流程,从而降低大规模训练物理AI系统的成本、时间和复杂性。“物理AI是AI革命的下一个前沿,其成功的关键在于生成海量数据的能力。”英伟达高管直言。

相比之下,国内企业的切入点更贴近落地路径。

“一个机器人只要在真实的环境里面运行,它每时每刻都在感知、推理、决策、控制,这背后都是持续的token的流动。”4月17日,智元联合创始人彭志辉在一场演讲中表示。在他看来,未来的机器人既会是一个执行器,也会是一个流量的入口,机器劳动者也是连接AI的模型与物理世界的接口,谁能率先把这个闭环跑通,谁就有机会定义下一代的生产力的平台。

这一判断对应着智元机器人的另一种路径:将数据供给本身定义为新的生产力的基础设施。其旗下公司觅蜂科技4月16日发布的一站式物理AI数据服务平台,试图以平台化方式提供数据生成、处理与调用能力,使数据像水电一样成为可持续供给的资源。

从英伟达试图用仿真“制造数据”,到智元机器人尝试以平台化方式“运营数据”,中美头部企业正在不同路径上回应同一个问题:如何让数据供给跟上机器走入现实世界的速度。

物理AI数据供不应求

物理AI数据有多稀缺?有业内人士表示,物理AI数据量仅为大语言模型的十万分之一。这一数量级差距,并非简单的“积累时间不够”,而是由数据生成机制的根本差异所决定。

“人形机器人与大语言模型之间在数据训练上存在显著落差。”TrendForce集邦咨询分析师曾伯楷向时代周报记者表示,大语言模型可通过网络文本进行大规模搜集与清洗,训练语料动辄达到数兆token,且具备高度可扩展性。相较之下,人形机器人所需的是结合视觉、动作、强制反馈与时序决策的‘具身数据’,取得成本高、标注困难,且高度依赖实体运行与场景覆盖。”

供给约束迅速传导至需求端。多位从业者的直观感受是,数据市场正呈现出近似“现货抢购”的状态。

“实际接触下来,大型需求方普遍是‘你有多少我就要多少’,甚至是‘什么时候有我就马上要’。”觅蜂科技董事长兼CEO姚卯青在接受包括时代周报在内的媒体采访时表示,当前数据供给明显跟不上需求增长,市场处于典型的供不应求阶段。

在姚卯青看来,数据的属性正在发生变化。从辅助性资源,转变为类似算力的基础生产要素。“数据会像算力一样,成为一种通用的底层资源,同时也具备投资属性和回报周期。”

从需求结构看,当前主要买方集中在几类主体:一是处于技术前沿的大模型团队,二是布局具身智能的海内外科技公司,三是快速迭代中的初创企业。尽管规模与资金实力不同,但共性在于对数据的高度依赖与紧迫需求。

这种格局与早期AI算力市场较为相似。在模型尚未收敛、应用路径尚不清晰的阶段,产业链利润率最先体现在“基础设施”环节。算力如此,数据亦然。

姚卯青将其归纳为一种“先行逻辑”:在技术探索期,只有足够规模的数据,才能支撑模型训练、方案验证与场景试错,进而推动应用的出现与扩散。

仿真与现实的鸿沟

国金证券研报认为,破解人形机器人“大小脑”成熟度低的问题根源在于数据。

根据数据金字塔理论,底层数据量庞大的互联网数据获取门槛最低,数量最多,但质量良莠不齐,同时缺乏物理语义对齐;中层仿真合成数据和人类视角的VR轨迹数据由于可以高效生成,获取成本不高,但仿真与现实之间存在不可忽视的物理差距,质量一般介于真实数据与互联网数据之间;上层真机数据一般通过遥操作采集,物理精准、任务语义完整,在任务泛化和精度要求上具有无可替代的价值,但获取成本高、标注难、数量少。

英伟达的解法是仿真数据,结合NVIDIA Cosmos 世界基础模型与 Omniverse 仿真技术,在虚拟世界中生成海量符合真实物理规则的合成数据。

但即便如此,仿真数据的边界依然清晰。

“仿真对真实世界的替代性仍存在边界,尤其在涉及精细操作、接触力学与长时序交互时,现实环境中的噪声、不确定性与极端情境,仍难以被完整建模,最终仍需真实数据进行校准与验证。”曾伯楷指出,产业实务上并不将仿真视为“替代”,而是“前置放大器”与“加速器”。为避免低质量仿真数据导致模型学习偏误,关键在于建立系统性的风险控制机制,如通过少量高质量真实数据进行迁移与微调,以及建构死循环数据回收流程,将实际运行中的失败案例回馈至训练系统。

换言之,仿真可以“扩展边界”,但无法“替代落地”。

从数据供给侧来看,市场也在形成分层结构。姚卯青向时代周报记者表示,目前公司并未将仿真数据作为主要交易品类。

在具体供给结构上,企业正根据需求动态调整产能。以觅蜂平台为例,其数据来源覆盖真机遥操作、无本体采集以及仿真数据等多种范式,但当前重心明显向成本更低、效率更高的“无本体采集”倾斜。

姚卯青透露,在公司年度约千万小时的数据规划中,超过60%至70%将来自无本体采集,真机数据则维持在200万至300万小时规模,用于高精度任务训练。

这一结构本身,正是现实约束的映射:在规模与真实性之间,行业仍不得不反复权衡。

曾伯楷认为,随着世界模型与行动模型的发展,未来一个重要方向,是让模型具备“辨识仿真与现实差异”的能力,而非单纯依赖数据一致性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
涉案金额2.6亿元!我国摧毁特大假酒网络

涉案金额2.6亿元!我国摧毁特大假酒网络

每日经济新闻
2026-04-19 15:31:45
康·克努佩尔刷新NBA新秀三分纪录

康·克努佩尔刷新NBA新秀三分纪录

热血体育社
2026-04-20 14:47:53
武汉院长双开细节曝光,卫健委督导刚走半年被带走,同事透露内情

武汉院长双开细节曝光,卫健委督导刚走半年被带走,同事透露内情

健身狂人
2026-04-20 11:05:41
CBA积分榜彻底乱套!北京上演“血洗”、深圳输球,辽粤对手出炉

CBA积分榜彻底乱套!北京上演“血洗”、深圳输球,辽粤对手出炉

林子说事
2026-04-20 13:05:00
常规赛30分、季后赛0分?NBA最大MVP笑话诞生

常规赛30分、季后赛0分?NBA最大MVP笑话诞生

茅塞盾开本尊
2026-04-19 19:29:00
日本突袭!28万亿市场,中国惨遭清场,高市早苗亮出3张底牌

日本突袭!28万亿市场,中国惨遭清场,高市早苗亮出3张底牌

古史青云啊
2026-04-20 11:37:06
泽连斯基终于放弃了川普

泽连斯基终于放弃了川普

互联网大观
2026-04-20 12:14:17
一个家庭最大的灾难不是贫穷,而是父母才50岁,就处于这种状态

一个家庭最大的灾难不是贫穷,而是父母才50岁,就处于这种状态

番外行
2026-04-20 12:45:53
你来一艘,我直接去一个编队!中国海军133舰队直插日本咽喉水道

你来一艘,我直接去一个编队!中国海军133舰队直插日本咽喉水道

闻识
2026-04-20 09:10:20
拜仁4-2逆转斯图加特!提前4轮卫冕德甲 第34次夺冠+近14年13冠

拜仁4-2逆转斯图加特!提前4轮卫冕德甲 第34次夺冠+近14年13冠

我爱英超
2026-04-20 01:38:28
欧洲教练首进NBA季后赛,猛龙要搞什么?

欧洲教练首进NBA季后赛,猛龙要搞什么?

体育硬核说
2026-04-20 14:48:03
无需再三警告!中方直接勒令停运,西方媒体全都傻眼了

无需再三警告!中方直接勒令停运,西方媒体全都傻眼了

智慧生活笔记
2026-04-20 12:09:54
穷人就算赚个三五百万,本质上还是穷人。

穷人就算赚个三五百万,本质上还是穷人。

流苏晚晴
2026-04-06 17:04:22
薛之谦把李雨桐送进去的真相!

薛之谦把李雨桐送进去的真相!

八卦疯叔
2026-04-20 09:48:06
厂妹的生活

厂妹的生活

微微热评
2026-04-19 09:02:11
如果世界上没有美国,战争会变多还是变少?

如果世界上没有美国,战争会变多还是变少?

深度报
2026-04-17 23:06:58
郑丽文之后,国民党大佬抵京!她的2个“必然”、狠狠打脸赖清德

郑丽文之后,国民党大佬抵京!她的2个“必然”、狠狠打脸赖清德

呼呼历史论
2026-04-19 15:51:45
就在今天!NBA传来火箭最新消息!杜兰特要负全部责任!

就在今天!NBA传来火箭最新消息!杜兰特要负全部责任!

夕落秋山
2026-04-20 08:16:36
雍正继位后,善待了废太子一家,为何不愿赦免囚禁14年的大阿哥?

雍正继位后,善待了废太子一家,为何不愿赦免囚禁14年的大阿哥?

铭记历史呀
2026-04-20 00:21:23
国安调整赛季目标,围绕蒙哥马利重建 客战拿分即可 林良铭争破荒

国安调整赛季目标,围绕蒙哥马利重建 客战拿分即可 林良铭争破荒

替补席看球
2026-04-20 14:24:42
2026-04-20 15:12:49
时代周报 incentive-icons
时代周报
影响有影响力的人
39802文章数 521781关注度
往期回顾 全部

科技要闻

蓝色起源一级火箭完美回收 客户卫星未入轨

头条要闻

媒体:伊朗刚说不谈 美国立即开打

头条要闻

媒体:伊朗刚说不谈 美国立即开打

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

鹿晗生日上热搜,被关晓彤撕下体面

财经要闻

月之暗面IPO迷局

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

房产
艺术
亲子
数码
军事航空

房产要闻

重磅!海口北站来了!多项信息曝光,过海时间将大幅缩短!

艺术要闻

王羲之《换鹅帖》尚在人间,惊艳无比!

亲子要闻

“疑似被鼠药污染”,国际知名婴幼儿食品多国下架

数码要闻

消息称谷歌无屏健身手环定名Google Fitbit Air

军事要闻

特朗普:美舰向伊朗货船开火炸出个洞

无障碍浏览 进入关怀版