网易首页 > 网易号 > 正文 申请入驻

仿真不稳、真机太贵?机器人数据最优解出现了吗

0
分享至

2025.07.28

本文字数:2822,阅读时长大约5分钟

作者 |第一财经 乔心怡 张甜甜

近期,加州大学伯克利分校副教授、Physical Intelligence(PI)的联合创始人Sergey Levine在一篇文章中提到,“机器人数据训练,真实世界数据不可或缺”,引起了行业讨论。

这一观点之所以引发关注,是因为它挑战了业界部分企业“以仿真数据替代真机”的做法。在训练成本高昂、数据获取难的背景下,企业该优先依赖成本低、速度快的仿真数据,还是回归真实环境、积累高质量的真机数据,成为摆在每一家具身智能公司面前的一道关键技术选题。

PI 曾被视为机器人领域的 OpenAI,也是国内不少企业的对标对象。7月28日,在2025年世界人工智能大会(WAIC)现场,第一财经采访了多位机器人企业的创始人和技术负责人,试图厘清一个核心问题:在机器人进入真实场景的关键时刻,什么样的数据才真正有价值?

业界难定孰优孰劣

“仿真数据很难涵盖所有物理世界中我们希望机器人完成的任务。”智元机器人合伙人、具身业务部总裁姚卯青表示,Sergey Levine 提出的“叉勺理论”与公司在实验中观察到的结论高度一致:部分局部任务可通过仿真训练完成,但大多数复杂任务仍需依赖真实数据。

“教会机器人使用勺子,可能要上百万次训练。”一位参展工程师举例说,“人类依靠经验学习,而机器人只能靠数据堆积。”

人类的智慧来自经验,而AI的智能来自数据。机器人是被海量数据“喂”聪明的。这些数据可能来自真实数据、仿真数据或互联网数据。

以银河通用为代表的仿真数据优先派,主张自己学得更快、成本更低,甚至能在零真实数据情况下启动。银河通用创始人王鹤曾在接受媒体采访时提到,通过“摇操”采集数据,即让真人戴上一些采集设备来完成机器人要学的动作,对于创业公司而言成本高昂,银河通用选择all in “Sim2Real(从仿真到真机的迁移)”,即主要依靠合成仿真数据。

在WAIC展会现场,第一财经记者看到了银河通用的机器人正在充当服务员,进行物品的拿放、递取。

“有机器人,就有数据;有数据,才有迭代。”擎朗智能CEO李通在接受第一财经记者采访时表示,相比做一两个demo,更关键的是把机器人真正部署到实际岗位上,让它们在真实任务中不断工作、不断犯错,从而积累起对模型训练真正有价值的数据。

在他看来,服务业的应用场景远比想象中更丰富,从餐饮、酒店、商超、机场、4S店、KTV到行政接待厅,每一个场景虽然任务各异,但底层的“动作元素”是可以被归类的——抓取、递送、避障、交互等基础能力构成了岗位的操作核心。“这些元素对大模型来说是可泛化的,但前提是要有足够丰富的真实数据支撑。”

李通强调,“机器人必须在一个明确岗位上达到万级部署量,才可能积累出对模型有效的数据。绝对不是一百台、两百台能解决的问题。”对于机器人落地岗位的选择,李通认为,真正适合规模化落地的岗位,必须是相对清晰、简单、边界明确的任务,而不是“既要干这个又要干那个”的复合型操作。“像抓取、递送这样的基础动作,虽然看似简单,但只要在真实环境中积累足够数据,就能为大模型提供高度泛化的训练素材”。

真实和仿真数据孰优孰劣,眼下或许还难以下定论。一位在WAIC现场的企业创始人告诉记者:“现在没人能说死,因为还没有人靠某种数据路径跑出一个通用智能的完全体。”

鱼和熊掌不可兼得

在机器人落地过程中,如何处理仿真与真机数据的结合,正成为行业普遍面临的一道技术难题。灵初智能联合创始人陈源培在接受第一财经记者采访时表示,这一问题并非首次出现,早在2023年、2024年公司向投资人汇报时,就明确指出“仿真和真机数据不能简单混合使用”。

“当模型成长到一定阶段,它会自动识别数据来源,并对不同来源的数据进行不同程度的权重处理。”陈源培解释说,例如,模型会先判断数据来自仿真还是真机,再决定用仿真做策略搜索,还是用真机做微调。这也意味着,数据混合本身存在技术限制,因此灵初的方案是将仿真用于大规模预训练,再通过少量真机数据完成“最后一公里”的打磨。

北京人形机器人创新中心品牌负责人告诉第一财经,目前公司对机器人进行训练时,仿真数据和真实数据的使用比例为7:3;国家地方共建人形机器人创新中心相关负责人告诉第一财经,公司目前有自建的数据采集中心,真实数据使用比例较高,和仿真数据大概占比为3:1。

在数据结构层面,业内普遍认为真实数据具有不可替代性,但高昂的采集成本是行业“必须面对的代价”。

智元机器人首席科学家、具身研究中心主任、上海创智学院副教授罗剑岚博士表示,目前是具身智能落地的早期阶段,仿真数据具备成本低、易获得的优势,“但仿真不是替代品,真机数据才是主舞台。目前智元所有的多模态大模型、VLA(视觉语言动作)模型100%使用的都是真机数据。”

无论选择何种数据进行机器人训练,业内都面临着“鱼和熊掌不可兼得”的困境。

成立仅一年半,自变量机器人目前正处于产品技术验证(PoC)阶段,与酒店、养老等多个行业客户联合开展项目测试,不断验证其技术在真实、非结构化环境中的高效部署能力。自变量机器人COO 杨倩强调:“我们的核心目标不是快速商业化,而是让机器人在真实场景中真正‘用起来’。”

她认为,仿真技术目前在机器人"下半身"的训练中仍占据主流,例如双足机器人的步态规划与运动控制等领域,仿真提供了不可或缺的低成本测试环境,其价值是毋庸置疑的。然而,当任务重心从"下半身"的移动转移到"上半身"的精细操作——即与商业应用紧密结合的、与物理世界进行复杂交互的任务时,依靠仿真能够到达的操作能力就非常有限。她告诉记者,一旦进入长链条、柔性和高度接触的交互任务,比如完成制作香囊、贴标、递送,仿真所需的工程开销、调参周期和计算成本是巨大的,甚至是不可能完成的。“相比之下,我们更倾向于直接在真实世界进行端到端的数据采集和训练,用较少人力在较短周期内完成训练与部署。”

“我们从训练到调优,只用了大约一周,就让机器人完成了完整制作任务。”她介绍说,“你可以认为它的单条数据很长、成本高,但放在这个复杂任务的学习效率上来看,仿真反而更‘划不来’。”

杨倩指出:“最终算得过账的,不只是采购成本,而是它在真实场景中能不能真正替代人来做事,甚至长期在人效比上能不能跑赢。”

当被问及如何看待同行对仿真路径的坚持时,杨倩表示:“与其在仿真世界里反复调参,不如让机器人直接在真实世界里试错成长。”在她看来,“任务定义”才是决定数据价值的核心变量,“真实数据并不一定贵,仿真数据也未必便宜”。

智元机器人同样明确押注真实数据。目前,智元通过自建专业数采工厂,形成全球最大数据集AgiBot World并开源,姚卯青说:“面对具身智能数据的荒漠,我们选择栽下第一棵树,愿其能成为一片森林。”同时,智元还发布行业首个通用具身基座模型——启元大模型,拥有“一脑多形”能力,可适配其他异构机器人本体。

微信编辑| 雨林

实习生| 小朱

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美股三大指数高开,美光、阿斯麦、博通大涨;重要锂矿供应国停止出口,锂矿股也大涨!加密货币大幅反弹|美股开盘

美股三大指数高开,美光、阿斯麦、博通大涨;重要锂矿供应国停止出口,锂矿股也大涨!加密货币大幅反弹|美股开盘

每日经济新闻
2026-02-25 23:22:05
晒晒从挪威房东身上学到的“装修妙招”,这几处装修,真该普及!

晒晒从挪威房东身上学到的“装修妙招”,这几处装修,真该普及!

装修秀
2026-02-25 11:40:05
1972年,何香凝临终恳求不火化遗体,周恩来含泪答应:不烧,不烧

1972年,何香凝临终恳求不火化遗体,周恩来含泪答应:不烧,不烧

大运河时空
2026-02-25 09:05:03
奥运冠军“拉拉链露胸”,让耐克绷不住了!

奥运冠军“拉拉链露胸”,让耐克绷不住了!

品牌营销报
2026-02-23 11:31:10
0-3惨败止步八强!陈熠/黄友政单局一度落后8分 于子洋首败来了

0-3惨败止步八强!陈熠/黄友政单局一度落后8分 于子洋首败来了

颜小白的篮球梦
2026-02-25 18:41:22
被对手贴脸挑衅,伊万-托尼:我这辈子都没闻过这么臭的口气

被对手贴脸挑衅,伊万-托尼:我这辈子都没闻过这么臭的口气

懂球帝
2026-02-25 12:49:05
你啥时候意识到钱的重要性?网友:钱能解决85%以上的鸡毛蒜皮事

你啥时候意识到钱的重要性?网友:钱能解决85%以上的鸡毛蒜皮事

带你感受人间冷暖
2026-02-23 01:22:30
万斯称美国已掌握证据表明伊朗试图重建核计划

万斯称美国已掌握证据表明伊朗试图重建核计划

每日经济新闻
2026-02-26 08:48:05
平顶山事件二次通报!真相竟是先打其他3人再暴打15岁女生!

平顶山事件二次通报!真相竟是先打其他3人再暴打15岁女生!

魔都囡
2026-02-25 10:57:52
8岁高考760分,智商230超过爱因斯坦,神童陶哲轩如今怎么样了?

8岁高考760分,智商230超过爱因斯坦,神童陶哲轩如今怎么样了?

户外阿毽
2026-02-26 06:16:12
看一次心动一次!大幂幂,永远的神

看一次心动一次!大幂幂,永远的神

阿废冷眼观察所
2026-02-25 11:49:20
潘春春:从陕北放羊娃到“中国波霸”的逆袭人生

潘春春:从陕北放羊娃到“中国波霸”的逆袭人生

小熊侃史
2026-02-15 07:30:14
贺子珍抱着外孙孔继宁的合影,照片中贺子珍笑得合不拢嘴

贺子珍抱着外孙孔继宁的合影,照片中贺子珍笑得合不拢嘴

大运河时空
2026-02-25 07:25:03
畸形审美?这4位男演员长相平平,却总当主角演帅哥,实在不理解

畸形审美?这4位男演员长相平平,却总当主角演帅哥,实在不理解

泪满过眼
2026-02-25 05:03:57
碰瓷!某企拿专利5天向宇树科技索赔8000万,最高法怒批;刘强东拟花50亿进入游艇行业,要让普通人也能买得起;小米起诉自媒体获赔500万元

碰瓷!某企拿专利5天向宇树科技索赔8000万,最高法怒批;刘强东拟花50亿进入游艇行业,要让普通人也能买得起;小米起诉自媒体获赔500万元

雷峰网
2026-02-25 10:54:12
孩子走丢到小卖铺求助,老板好心给其父母打电话,却被5人按倒

孩子走丢到小卖铺求助,老板好心给其父母打电话,却被5人按倒

另子维爱读史
2026-02-25 23:35:20
瓜子被点名!医生提醒:高血脂还常吃瓜子,很快或迎来3个后果

瓜子被点名!医生提醒:高血脂还常吃瓜子,很快或迎来3个后果

荆医生科普
2026-02-25 18:25:49
史上最乱伦成语“上蒸下报”

史上最乱伦成语“上蒸下报”

华人星光
2026-02-21 11:24:05
你永远想不到医院的八卦能有多炸裂?一件提神醒脑,两件直接撂倒

你永远想不到医院的八卦能有多炸裂?一件提神醒脑,两件直接撂倒

另子维爱读史
2026-01-22 18:21:09
党主席干不过地头蛇,郑丽文干不过“南霸天”

党主席干不过地头蛇,郑丽文干不过“南霸天”

雪中风车
2026-02-25 20:54:12
2026-02-26 09:23:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
244983文章数 621596关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

数码
本地
家居
旅游
公开课

数码要闻

Steam客户端获Beta测试版更新,改善硬件调查对多显卡系统识别

本地新闻

津南好·四时总相宜

家居要闻

艺居办公 温度与效率

旅游要闻

市花开了!主题公园今年有望启动

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版