![]()
本报(chinatimes.net.cn)记者黄海婷 胡梦深 深圳摄影报道
5月7日,距离深圳一家具身智能企业宣布的“首批机器人进家庭”节点,还有18天。
在此之前,首届广东省人工智能应用对接大会刚刚落幕,华为昇腾、腾讯混元等AI成果集中亮相。而更早一周,该企业发布了全球首个基于世界统一模型架构(WUM)的具身智能大模型,并宣布其新一代机器人将于5月25日正式入户。
家庭场景,被业内称为具身智能的“终极考场”。这一考题的启动时间已从行业普遍预期的5至10年,骤然压缩至“当月”。这究竟是一家企业的技术突围,还是整个产业链系统性优势的集中释放?
“这不是偶然事件,而是技术成熟度、产业配套与市场需求三重共振的必然结果。”国研新经济研究院创始院长、智能经济首席专家朱克力对《华夏时报》记者表示,这是产业拐点的标志性事件,是中国硬科技从跟跑到并跑、部分领跑的缩影。
就在不久前,国家电网印发《2026年具身智能发展规划》,计划今年集中采购各类具身智能设备约8500台,总投资约68亿元。若计入南方电网及地方能源集团跟进采购,业内预计2026年电力行业具身智能总投资规模有望突破100亿元。产业需求端的信号已明确亮起。
家庭场景为何是最大瓶颈?
具身智能进家庭,第一个拦路虎并非算法,而是数据。
“当前行业已逐渐摆脱‘缺数据’的处境,但进入了‘缺好数据’的阶段。”深圳市人工智能与机器人研究院研究员、极数迭代CTO夏轩向《华夏时报》记者指出了核心症结。他解释,这源自三个底层瓶颈:数据维度上,需要专业、长时间、多场景的“纵向数据”,而当前多为非专业、短时间、单任务的“横向切片”;隐私约束上,家庭数据无法像互联网数据那样大规模汇聚;评估标准上,缺乏针对家庭服务机器人的评测基准,学术界仍在用工厂指标衡量家庭场景。
如何破解这一困局?深圳南山的产业链密度提供了独特解法。
夏轩用“密、快、狠”三个字概括了南山生态的优势,并强调这解决的是数据“谁来采、怎么采、采完怎么用”的全链条问题。“谁来采”——产业链密度大幅降低了试错成本,多家机器人企业与科研机构集中在半小时车程内,“一个数据采集需求,从提出到验证,两天就能跑通”。这种密度让“小步快跑”成为可能,而数据工程最忌讳的恰恰是“大步慢走”。
“怎么采”——硬件供应链支撑多样化采集方案。从相机模组、电机到深度传感器,上游企业的集聚让采集设备的定制成本大幅下降。“采完怎么用”——算力与大模型的协同。华为昇腾、腾讯混元提供底层算力,采集的数据可以就近上云、就近训练、就近部署。“这种地理上的压缩,本质上是迭代周期的压缩。”夏轩说。
然而,生态优势并不能自动转化为数据优势。夏轩也提醒:“深圳有好的‘工具’,但家庭场景的数据‘原料’依然稀缺。工厂可以开放产线,商场可以开放展厅,但家庭是私人空间,数据获取的门槛不在技术,而在信任与制度。”这正是家庭机器人入户需要跨越的关键坎。
模型“两难”之辩
如果说数据是燃料,那么模型就是引擎。此次引发行业关注的WUM架构,核心是从VLA(视觉-语言-动作)架构向世界统一模型的跨越。这一转变,折射出整个行业对“物理理解能力”的迫切需求。
夏轩将“跑酷”(预设轨迹)与“干活”(真实适应)之间的差距,概括为三个鸿沟:确定性、泛化性、容错性。“跑酷是开环控制,摔了重来。干活是闭环适应——环境在变、物体在动、人在干扰,每一步都要调整。这要求机器人具备世界模型,即对物理因果的理解能力。”
WUM架构的数据效率优势正体现在这几个维度:强物理先验让世界模型能用更少的数据学习技能;自监督学习降低了标注要求;家庭场景的长尾问题可通过世界模型的“想象”生成,而非逐一采集。
但理论的先进性与工程的可落地性之间,存在显著落差。夏轩坦承:“算力门槛上,世界模型需要更大的参数量、更长的训练时间;评估方面,VLA可用‘成功率’衡量,但WUM的‘世界理解能力’如何量化,目前缺乏行业标准;故障模式上,VLA失败了你知道是动作错了,但WUM失败了,可能是模型预测错了,也可能是执行器偏差,调试复杂度指数级上升。”
尽管挑战重重,夏轩仍对WUM方向给出审慎乐观的判断:“世界模型是正确方向。”但他强调,批量进家庭能够积累真实数据,更快跑通优化闭环。这折射出整个行业的共性命题:18天后的入户,不是成熟产品的亮相,而是一场真实环境下的“极限测试”。
广东凭什么领跑?
具身智能企业为何密集出现在深圳、东莞、广州一带?答案藏在广东的“半小时供应链”和长期产业布局中。
朱克力指出,南山设计“大脑”、珠三角制造硬件、家庭场景闭环验证数据,上下游不再是简单买卖关系,而是深度绑定的共创关系,实现了创意快速落地、技术快速迭代、产品快速优化。这种协同创新让广东在具身智能领域形成了独特竞争力。
但他也毫不回避地指出了行业共性的卡点:“核心零部件的自主可控仍需加强,部分高端传感器、精密减速器等仍有短板;基础软件与算法的原始创新能力有待提升;数据治理与安全合规体系尚不完善;高端人才供给仍有缺口。”这些短板,是整个中国具身智能产业在迈向大规模家庭落地前必须正视的“软肋”。
值得关注的是,此次WUM模型的发布,恰好踩在《广东省人工智能行动方案》出台之后。朱克力认为,这是政策牵引、企业主导、生态支撑协同发力的必然结果。“三者同向而行、同频共振,形成‘政策引导产业、产业孕育企业、企业突破反哺生态’的良性循环。”
从产业规模看,这一赛道的想象空间正在被数据验证。据行业预测,中国具身智能产业市场规模有望在2035年突破万亿元。
艾媒咨询CEO兼首席分析师张毅从商业维度指出,通用家务机器人已跳出单一清洁功能,依托统一模型加具身智能架构,具备了多任务交互能力,“意味着它已经跨入了一个平台级的新品类赛道”。而批量真实家庭入户,价值远大于单次舞台展示,“意味着从炫技走向实用,直接教育消费者,对行业商业化的全面提速意义重大”。
距离5月25日还有18天。第一批家庭机器人将敲开志愿者的家门。它们是会成为家庭期待的“新成员”,还是暴露更多“实习生”级别的笨拙?答案尚未可知。但可以确定的是,这道“终极考题”已经开卷,而广东的产业链正在为这场考试提供着独一无二的支撑。
夏轩在采访最后给行业留下一段值得深思的话:“家庭场景的复杂性、隐私约束、安全要求,是任何生态都无法替代的‘硬骨头’。不要低估‘从能用到好用’的距离。机器人进家庭,不是技术的终点,而是数据工程、伦理治理、商业模式综合考量的起点。”
责任编辑:徐芸茜 主编:公培佳
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.