网易首页 > 网易号 > 正文 申请入驻

机器人为啥还不能干活?还卡在这一关口

0
分享至



作者|深水财经社 乌海

“谁能把机器人用的大模型做出来,谁就是全世界最厉害的AI公司和机器人公司,我觉得完全足够拿诺贝尔奖。”近日,宇树科技创始人王兴兴在《扬声》节目访谈预告中的表态,再次将机器人大模型(业内多称具身大模型)推上舆论风口。

当下,人形机器人从展会热舞到工厂试跑,特斯拉喊出2026年百万台产能目标,国内厂商接连公布亿元订单,电商平台预约量突破百万,看似离“走进生活、真正干活”只有一步之遥。

但高盛最新调研显示,全球头部厂商试产规模尚不足千台,2026年全球实际产能仅1.2万台(中国新闻网,2025年12月6日)。

王兴兴口中的“关键一步”,正是能让机器人实现“感知-理解-推理-执行”闭环的机器人大模型,它相当于机器人的“超级大脑”,能让机器人摆脱预设程序束缚,在真实场景中自主应对变化、完成任务。

这场全球范围内的“造脑竞赛”已全面打响,为何始终难以突破?机器人“干活难”的症结,到底藏在何处?




全球三大梯队竞速

机器人大模型的核心是具身智能,强调通过“身体”与物理世界互动产生智能,而非仅在虚拟数据中“纸上谈兵”。目前全球研发格局分为三大梯队,各有侧重却均未实现“通用全能”。

第一梯队由国际科技巨头领跑,手握算力与数据双重优势。

谷歌是最早发力的玩家,2023年推出RT-2模型,首创视觉-语言-动作(VLA)统一建模,能直接输出机器人控制指令,零样本完成“捡香蕉放抽屉”等任务;2025年升级的RT-3模型,将推理延迟降至50ms内,在OpenEQA评测中拿下综合第一,还获得NeurIPS 2024最佳论文提名。

英伟达则走“仿真+真机”路线,依托Omniverse工业级仿真平台生成千亿级合成数据,结合真机数据训练Project GR00T模型,硬件与软件协同优化让推理效率提升400%,2025年在RoboBenchmark物理交互任务中夺冠,2026年已在比亚迪、宁德时代工厂部署适配模型的工业机器人。

特斯拉则将自动驾驶技术迁移至机器人领域,依托Dojo超算训练Optimus BotNet模型,通过4D世界模型实现动态场景实时规划,2026年CES展上展示了Optimus自主完成工厂装配任务的场景(前文问答整理)。

第二梯队是细分领域的“黑马”,聚焦特定场景突破。

国际端,Figure AI与OpenAI合作,研发的Figure Foundation Model(FFM)专攻人形机器人双手协同;

国内端,智元机器人推出启元大模型,构建“作业/交互/运动”一体三智体系,获图灵奖得主Yann LeCun认可,智平方的GOVLA模型则实现全身控制与移动轨迹统一输出。

第三梯队以宇树科技等企业为代表,走“轻量化+产业化”路线。

作为国内消费级机器人领军企业,宇树2026年1月开源UnifoLM-VLA-0大模型,融合动作预测头与动力学约束。但王兴兴也坦言,宇树的分层架构(LLM+LBM)更侧重实时控制与安全性,在通用泛化能力上仍有差距。

值得注意的是,即便头部玩家进展迅猛,目前全球主流模型仍处于智能L2初级阶段,仅能实现“固定任务+微调”,尚未具备自主泛化与应变能力。这意味着,没有任何一家企业能真正交出“能灵活干活”的机器人“大脑”。



四大难题卡住“造脑”进程

王兴兴将机器人大模型比作“诺贝尔奖级难题”,其实绝不是夸张。

相较于语言大模型,机器人大模型要兼顾虚拟推理与物理交互,每一步突破都需跨越技术、数据、成本的多重鸿沟,这也是机器人迟迟不能“干活”的核心原因。

首当其冲的是实时性与算力的矛盾。机器人在物理世界中操作,需10-100ms内完成“感知-决策-执行”闭环,否则会出现动作卡顿、碰撞等问题。

但目前主流大模型参数多在13B-34B之间,推理延迟难以降低。谷歌RT-3虽将延迟压缩至50ms,却依赖TPU v5e专用算力集群,这种算力成本极高,普通企业难以承担。

宇树通过轻量化设计将模型压缩至7B参数,实现延迟<100ms,但代价是牺牲了部分泛化能力,零样本适配率约75-80%,低于谷歌RT-3的90%以上。

其次是数据稀缺与“仿真-现实鸿沟”。数据是大模型的“燃料”,但机器人大模型需要的“视觉-语言-动作”多模态数据,采集难度远超文本数据。

纯真机数据采集成本极高,宇树仅340小时真机数据就耗费大量人力物力;纯仿真数据虽能通过英伟达Isaac Gym等平台批量生成,却存在“仿真与现实脱节”的问题。实验室中训练的动作,在真实场景中可能因路面不平、物体偏移而失效。

即便采用“仿真+真机”混合模式,也难以完全消除这种鸿沟,目前行业普遍面临“模型在实验室满分,在真实场景翻车”的尴尬(前文问答整理)。

更棘手的是物理直觉与泛化能力不足。人类能凭本能判断“杯子倾斜会漏水”“重物落地会砸坏东西”,但机器人需要通过海量数据学习物理规律,才能形成这种直觉。

2026年ShareRobot评测显示,具备物理直觉的模型在“突发障碍”任务中成功率,比传统模型高35%,但目前多数模型仍缺乏这种能力。

此外,跨场景、跨本体泛化也是难题。能在工厂装配的机器人,未必能适应家庭清洁;适配四足机器人的模型,很难直接迁移到人形机器人上。

最后是核心部件与成本瓶颈。机器人大模型的落地,离不开硬件支撑,但目前高精度触觉传感器量产良率不足60%,六维力传感器等核心部件国产化率低,依赖进口且面临断供风险。

有机构测算显示,当前单台人形机器人物料成本约40万元,而行业共识是成本需降至5万元以内才能盈利。成本高企导致企业难以大规模部署真机采集数据,进而制约模型迭代。



从“能干活”到“干好活”

尽管挑战重重,但机器人大模型的研发已进入加速期,政策、资本与技术的合力正在破解困局。

工信部已将人形机器人列为“未来产业十大重点方向”,计划建立创新体系,2026年专项补贴超50亿元;国内长三角、大湾区形成“100公里供应链圈”,绿的谐波、汇川技术等企业在减速器、驱动模块领域实现突破,推动核心部件国产化率提升至70%,成本下降60%。

技术路线上,“端到端VLA+世界模型”成为主流方向,谷歌、英伟达等企业正推动模型融入4D时空建模,让机器人具备“主动预测”能力,比如提前预判物体滑落轨迹,主动调整动作。

国内企业则侧重差异化突破,宇树通过开源UnifoLM-VLA-0,推动“硬件+模型”生态协同,降低行业研发成本,银河通用构建百亿级“机器人干活数据集”,提升物流分拣场景适配率至98.7%(前文问答整理)。

王兴兴曾在五年前就预判到AI对机器人行业的颠覆性,他始终坚持“实打实的需求在哪里,我们就解决什么问题”(36氪,2025年8月7日)。这种务实主义,或许正是破解“造脑难题”的关键——不必追求一步到位的通用模型,而是先在特定场景实现突破,通过“数据飞轮”持续迭代,逐步向通用能力演进。

业内普遍预测,2026-2028年,工业场景将率先实现机器人大模型规模化落地,2028年后逐步渗透至家庭服务领域。麦肯锡更是预测,2029年工业具身机器人密度将达60-200台/万平方米厂房。

从波士顿动力的Atlas跳街舞,到宇树H1奔跑跳跃,机器人的“身手”越来越灵活;从谷歌RT-3到宇树UnifoLM,机器人的“大脑”越来越聪明。

王兴兴口中的“诺贝尔奖级突破”,或许不会一蹴而就,但这场“造脑竞赛”的每一步进展,都在推动机器人从“实验室明星”走向“生产生活主力”。

阅读提示:

本文部分内容来源:东吴证券《机器人大模型行业深度报告》、IT之家、中新网报道

本文涉及均来源网络公开资料,可能与实际存在差异,请谨慎引用



作品声明:仅在头条发布,观点不代表平台立场

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
工信部出手,「降套餐」不用线下了!

工信部出手,「降套餐」不用线下了!

果粉俱乐部
2026-01-30 12:03:09
万人求出处的网红正式下海!

万人求出处的网红正式下海!

吃瓜党二号头目
2026-01-31 10:43:31
笑不活了!黑龙江大兴安岭,一只猞猁经过检查站时

笑不活了!黑龙江大兴安岭,一只猞猁经过检查站时

忠于法纪
2026-01-30 18:17:51
轰43分,几乎拿全队一半得分,打服沪蜜!球迷:国家队没你我不看

轰43分,几乎拿全队一半得分,打服沪蜜!球迷:国家队没你我不看

弄月公子
2026-01-31 12:12:17
普通正厅级干部调任国家局副局长属于提拔重用,主要原因有两个!

普通正厅级干部调任国家局副局长属于提拔重用,主要原因有两个!

小圣杂谈原创
2026-01-26 17:35:21
52年,毛主席发现孙中山铜像上有多个弹孔,怒问道:这是谁干的?

52年,毛主席发现孙中山铜像上有多个弹孔,怒问道:这是谁干的?

南书房
2026-01-31 07:45:06
如何看待牢A不认同罗翔的叙事逻辑?这个回答破万点赞,但也细思极恐

如何看待牢A不认同罗翔的叙事逻辑?这个回答破万点赞,但也细思极恐

文字里拾光
2026-01-28 20:06:11
山西有学校七八百元采购的护眼灯,其他区域采购同型号同品牌仅四百来元?县教体局财政局暂未回应

山西有学校七八百元采购的护眼灯,其他区域采购同型号同品牌仅四百来元?县教体局财政局暂未回应

大风新闻
2026-01-30 20:23:09
网上报名参加“网红”马尔代夫潜水团,16人被骗,组织者称“女朋友宫外孕要手术”等,拒不退款后失联;涉案超20万元,警方已立案

网上报名参加“网红”马尔代夫潜水团,16人被骗,组织者称“女朋友宫外孕要手术”等,拒不退款后失联;涉案超20万元,警方已立案

扬子晚报
2026-01-31 08:06:47
局势彻底变了!美舰遭强力拦截,解放军不再克制,台独退路全断!

局势彻底变了!美舰遭强力拦截,解放军不再克制,台独退路全断!

古事寻踪记
2026-01-31 07:13:30
东北女生晒春运“出国回家”攻略:连飞俄罗斯两地再坐船回黑龙江,比直飞还便宜

东北女生晒春运“出国回家”攻略:连飞俄罗斯两地再坐船回黑龙江,比直飞还便宜

上游新闻
2026-01-28 15:55:21
地球上离陆地最远的地方,为何连鱼类都无法生存?究竟有多可怕?

地球上离陆地最远的地方,为何连鱼类都无法生存?究竟有多可怕?

百科密码
2026-01-28 16:32:54
上海黄浦江中发现人棍女尸,四肢头颅都被砍断,腹中怀有九月男胎

上海黄浦江中发现人棍女尸,四肢头颅都被砍断,腹中怀有九月男胎

奇闻故事汇1989
2024-11-15 21:35:03
杨紫现在的脸,胡歌更显老,二搭肖战变了样,宋丹丹看了无话可说

杨紫现在的脸,胡歌更显老,二搭肖战变了样,宋丹丹看了无话可说

笑饮孤鸿非
2026-01-31 01:30:23
金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

不写散文诗
2026-01-30 15:15:56
今年腊月二十九除夕,四类人要穿红,3种人不要去拜年,有你吗?

今年腊月二十九除夕,四类人要穿红,3种人不要去拜年,有你吗?

阿龙美食记
2026-01-29 11:03:56
党蓁,升副部

党蓁,升副部

新京报政事儿
2026-01-30 17:26:08
村支书禹作敏:想当副总理只接待正部级,93年使400警察不敢进村

村支书禹作敏:想当副总理只接待正部级,93年使400警察不敢进村

百年历史老号
2024-04-04 21:46:50
小玥儿小菻菻还在北京,大S雕像揭幕礼,两个孩子依旧没有被邀请

小玥儿小菻菻还在北京,大S雕像揭幕礼,两个孩子依旧没有被邀请

甜柠聊史
2026-01-31 11:26:25
嫁黎明4年败光7亿家产,离婚后再嫁美国富豪,如今胖成大妈不敢认

嫁黎明4年败光7亿家产,离婚后再嫁美国富豪,如今胖成大妈不敢认

白面书誏
2026-01-03 21:31:21
2026-01-31 12:43:00
深水财经社 incentive-icons
深水财经社
没有调查就没有发言权!
5596文章数 13209关注度
往期回顾 全部

科技要闻

中国车企和特斯拉的下一战,战场已定

头条要闻

盒马"错配"致顾客误食水仙中毒 赔偿方案仍未达成一致

头条要闻

盒马"错配"致顾客误食水仙中毒 赔偿方案仍未达成一致

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

成龙入驻小红书,怼脸近照没有老年斑

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

本地
艺术
房产
时尚
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

艺术要闻

15位当代国外画家的16幅具象人物绘画

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

女友BELLA+封面 | Ginny&Jayna:连锁反应

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版