网易首页 > 网易号 > 正文 申请入驻

仿真不稳、真机太贵?机器人数据最优解出现了吗

0
分享至

2025.07.28


本文字数:2822,阅读时长大约5分钟

作者 |第一财经 乔心怡 张甜甜

近期,加州大学伯克利分校副教授、Physical Intelligence(PI)的联合创始人Sergey Levine在一篇文章中提到,“机器人数据训练,真实世界数据不可或缺”,引起了行业讨论。

这一观点之所以引发关注,是因为它挑战了业界部分企业“以仿真数据替代真机”的做法。在训练成本高昂、数据获取难的背景下,企业该优先依赖成本低、速度快的仿真数据,还是回归真实环境、积累高质量的真机数据,成为摆在每一家具身智能公司面前的一道关键技术选题。

PI 曾被视为机器人领域的 OpenAI,也是国内不少企业的对标对象。7月28日,在2025年世界人工智能大会(WAIC)现场,第一财经采访了多位机器人企业的创始人和技术负责人,试图厘清一个核心问题:在机器人进入真实场景的关键时刻,什么样的数据才真正有价值?

业界难定孰优孰劣

“仿真数据很难涵盖所有物理世界中我们希望机器人完成的任务。”智元机器人合伙人、具身业务部总裁姚卯青表示,Sergey Levine 提出的“叉勺理论”与公司在实验中观察到的结论高度一致:部分局部任务可通过仿真训练完成,但大多数复杂任务仍需依赖真实数据。

“教会机器人使用勺子,可能要上百万次训练。”一位参展工程师举例说,“人类依靠经验学习,而机器人只能靠数据堆积。”

人类的智慧来自经验,而AI的智能来自数据。机器人是被海量数据“喂”聪明的。这些数据可能来自真实数据、仿真数据或互联网数据。

以银河通用为代表的仿真数据优先派,主张自己学得更快、成本更低,甚至能在零真实数据情况下启动。银河通用创始人王鹤曾在接受媒体采访时提到,通过“摇操”采集数据,即让真人戴上一些采集设备来完成机器人要学的动作,对于创业公司而言成本高昂,银河通用选择all in “Sim2Real(从仿真到真机的迁移)”,即主要依靠合成仿真数据。

在WAIC展会现场,第一财经记者看到了银河通用的机器人正在充当服务员,进行物品的拿放、递取。

“有机器人,就有数据;有数据,才有迭代。”擎朗智能CEO李通在接受第一财经记者采访时表示,相比做一两个demo,更关键的是把机器人真正部署到实际岗位上,让它们在真实任务中不断工作、不断犯错,从而积累起对模型训练真正有价值的数据。

在他看来,服务业的应用场景远比想象中更丰富,从餐饮、酒店、商超、机场、4S店、KTV到行政接待厅,每一个场景虽然任务各异,但底层的“动作元素”是可以被归类的——抓取、递送、避障、交互等基础能力构成了岗位的操作核心。“这些元素对大模型来说是可泛化的,但前提是要有足够丰富的真实数据支撑。”

李通强调,“机器人必须在一个明确岗位上达到万级部署量,才可能积累出对模型有效的数据。绝对不是一百台、两百台能解决的问题。”对于机器人落地岗位的选择,李通认为,真正适合规模化落地的岗位,必须是相对清晰、简单、边界明确的任务,而不是“既要干这个又要干那个”的复合型操作。“像抓取、递送这样的基础动作,虽然看似简单,但只要在真实环境中积累足够数据,就能为大模型提供高度泛化的训练素材”。

真实和仿真数据孰优孰劣,眼下或许还难以下定论。一位在WAIC现场的企业创始人告诉记者:“现在没人能说死,因为还没有人靠某种数据路径跑出一个通用智能的完全体。”


鱼和熊掌不可兼得

在机器人落地过程中,如何处理仿真与真机数据的结合,正成为行业普遍面临的一道技术难题。灵初智能联合创始人陈源培在接受第一财经记者采访时表示,这一问题并非首次出现,早在2023年、2024年公司向投资人汇报时,就明确指出“仿真和真机数据不能简单混合使用”。

“当模型成长到一定阶段,它会自动识别数据来源,并对不同来源的数据进行不同程度的权重处理。”陈源培解释说,例如,模型会先判断数据来自仿真还是真机,再决定用仿真做策略搜索,还是用真机做微调。这也意味着,数据混合本身存在技术限制,因此灵初的方案是将仿真用于大规模预训练,再通过少量真机数据完成“最后一公里”的打磨。

北京人形机器人创新中心品牌负责人告诉第一财经,目前公司对机器人进行训练时,仿真数据和真实数据的使用比例为7:3;国家地方共建人形机器人创新中心相关负责人告诉第一财经,公司目前有自建的数据采集中心,真实数据使用比例较高,和仿真数据大概占比为3:1。

在数据结构层面,业内普遍认为真实数据具有不可替代性,但高昂的采集成本是行业“必须面对的代价”。

智元机器人首席科学家、具身研究中心主任、上海创智学院副教授罗剑岚博士表示,目前是具身智能落地的早期阶段,仿真数据具备成本低、易获得的优势,“但仿真不是替代品,真机数据才是主舞台。目前智元所有的多模态大模型、VLA(视觉语言动作)模型100%使用的都是真机数据。”

无论选择何种数据进行机器人训练,业内都面临着“鱼和熊掌不可兼得”的困境。

成立仅一年半,自变量机器人目前正处于产品技术验证(PoC)阶段,与酒店、养老等多个行业客户联合开展项目测试,不断验证其技术在真实、非结构化环境中的高效部署能力。自变量机器人COO 杨倩强调:“我们的核心目标不是快速商业化,而是让机器人在真实场景中真正‘用起来’。”

她认为,仿真技术目前在机器人"下半身"的训练中仍占据主流,例如双足机器人的步态规划与运动控制等领域,仿真提供了不可或缺的低成本测试环境,其价值是毋庸置疑的。然而,当任务重心从"下半身"的移动转移到"上半身"的精细操作——即与商业应用紧密结合的、与物理世界进行复杂交互的任务时,依靠仿真能够到达的操作能力就非常有限。她告诉记者,一旦进入长链条、柔性和高度接触的交互任务,比如完成制作香囊、贴标、递送,仿真所需的工程开销、调参周期和计算成本是巨大的,甚至是不可能完成的。“相比之下,我们更倾向于直接在真实世界进行端到端的数据采集和训练,用较少人力在较短周期内完成训练与部署。”


“我们从训练到调优,只用了大约一周,就让机器人完成了完整制作任务。”她介绍说,“你可以认为它的单条数据很长、成本高,但放在这个复杂任务的学习效率上来看,仿真反而更‘划不来’。”

杨倩指出:“最终算得过账的,不只是采购成本,而是它在真实场景中能不能真正替代人来做事,甚至长期在人效比上能不能跑赢。”

当被问及如何看待同行对仿真路径的坚持时,杨倩表示:“与其在仿真世界里反复调参,不如让机器人直接在真实世界里试错成长。”在她看来,“任务定义”才是决定数据价值的核心变量,“真实数据并不一定贵,仿真数据也未必便宜”。

智元机器人同样明确押注真实数据。目前,智元通过自建专业数采工厂,形成全球最大数据集AgiBot World并开源,姚卯青说:“面对具身智能数据的荒漠,我们选择栽下第一棵树,愿其能成为一片森林。”同时,智元还发布行业首个通用具身基座模型——启元大模型,拥有“一脑多形”能力,可适配其他异构机器人本体。

微信编辑| 雨林

实习生| 小朱

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
过去30年的委内瑞拉:从西半球第三富裕国家到通货膨胀率3000%

过去30年的委内瑞拉:从西半球第三富裕国家到通货膨胀率3000%

知识圈
2026-01-06 19:30:03
韩国总统李在明结束访华

韩国总统李在明结束访华

齐鲁壹点
2026-01-07 19:46:16
王励勤保守布局!王皓马琳跟赛多哈无缘升职,秦志戬成总教练热门

王励勤保守布局!王皓马琳跟赛多哈无缘升职,秦志戬成总教练热门

老税系戏精北鼻
2026-01-06 16:00:45
兑奖最后一天!安徽542万元大奖得主仍未现身,体彩中心称将值守至凌晨零点

兑奖最后一天!安徽542万元大奖得主仍未现身,体彩中心称将值守至凌晨零点

红星新闻
2026-01-07 18:21:34
i茅台上线500ml飞天首日半小时内售罄,卖1399元的拼多多天塌了

i茅台上线500ml飞天首日半小时内售罄,卖1399元的拼多多天塌了

王新喜
2026-01-07 17:29:24
最讨厌的主持人排名:谢娜仅第六,张大大第二,第一无人质疑

最讨厌的主持人排名:谢娜仅第六,张大大第二,第一无人质疑

叶公子
2026-01-06 20:02:45
委内瑞拉,股市暴涨!

委内瑞拉,股市暴涨!

新浪财经
2026-01-07 16:02:03
曾消失的“广州第一鸡”清平鸡,今3家店能吃到,还是当年味道?

曾消失的“广州第一鸡”清平鸡,今3家店能吃到,还是当年味道?

珊姐姐
2026-01-07 12:16:29
真当中国不敢动手?中方向全世界宣布:推出1900亿大项目

真当中国不敢动手?中方向全世界宣布:推出1900亿大项目

烈史
2025-12-26 20:44:58
面临技术出口审查!Meta豪砸20亿美金收购Manus案或生变

面临技术出口审查!Meta豪砸20亿美金收购Manus案或生变

穿透
2026-01-07 18:40:10
非王皓!王励勤在等一人,奥运冠军将重回国乒,冲击洛杉矶6金王

非王皓!王励勤在等一人,奥运冠军将重回国乒,冲击洛杉矶6金王

卿子书
2026-01-07 08:08:18
多地城投大降薪!

多地城投大降薪!

黯泉
2026-01-06 22:42:14
马杜罗庭审纪实:“我无罪”、“我是战俘”,创可贴与被夺走的钢笔

马杜罗庭审纪实:“我无罪”、“我是战俘”,创可贴与被夺走的钢笔

澎湃新闻
2026-01-06 10:40:30
1949年林彪接父亲进京,老父亲吃过煮牛皮,朱德曾批示:给他吃特灶

1949年林彪接父亲进京,老父亲吃过煮牛皮,朱德曾批示:给他吃特灶

老杉说历史
2026-01-06 20:22:18
司晓迪高清照片无码流出,一人睡遍整个娱乐圈顶流?看完太炸裂了

司晓迪高清照片无码流出,一人睡遍整个娱乐圈顶流?看完太炸裂了

乌娱子酱
2026-01-06 14:19:18
纪实:25岁华裔女子遭男友强制塞高尔夫球,3小时后在痛苦中死去

纪实:25岁华裔女子遭男友强制塞高尔夫球,3小时后在痛苦中死去

谈史论天地
2025-09-11 14:59:38
午后猛拉!000798,涨停!这一板块突然爆发

午后猛拉!000798,涨停!这一板块突然爆发

证券时报e公司
2026-01-07 17:07:34
几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

梦史
2026-01-07 10:08:05
6连板!翻倍牛股,A股第一

6连板!翻倍牛股,A股第一

新浪财经
2026-01-07 16:25:42
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
2026-01-07 20:24:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
240654文章数 621135关注度
往期回顾 全部

科技要闻

精华!黄仁勋CES记者会:揭秘新款大杀器

头条要闻

三亚一游客被司机诱导就餐 点了4道海鲜花1868元

头条要闻

三亚一游客被司机诱导就餐 点了4道海鲜花1868元

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

燃油驾趣+智能电感双Buff 试驾全新奥迪Q5L

态度原创

本地
旅游
房产
家居
公开课

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

旅游要闻

冬日限定!伏羲大峡谷冰挂进行时!

房产要闻

最新!海口二手房,涨价房源突然猛增30%

家居要闻

宁静不单调 恰到好处的美

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版