来源:市场资讯
(来源:澎湃新闻)
机器人正式进入家庭提上日程。
4月21日,自变量机器人举行发布会,推出新一代机器人进家庭计划,宣布35天后,机器人将搭载新一代自研具身智能基础模型WALL-B入驻真实家庭。
自变量创始人兼CEO王潜在发布会上表示,当前机器人的核心瓶颈不在本体,而在智能。家庭环境中的每一秒都可能出现全新事件:猫何时跳上桌子、孩子把玩具扔在哪里、地毯的摩擦力与实验室地板完全不同。现有技术无法处理这种随机性和碎片化,机器人进入家庭也被视为“这个时代最难的技术问题之一”。
![]()
自变量创始人兼CEO王潜在发布会上
解决数据损耗:世界模型并非外挂模块
据自变量联合创始人兼CTO王昊介绍,WALL-B定位为基于世界统一模型架构(WUM,World Unified Model) 的具身智能基础模型,设计思路类似于Apple Silicon的统一内存架构,在苹果M1芯片之前的Mac上,CPU、GPU、内存各自独立,数据搬运产生的延迟和损耗成为性能瓶颈,苹果通过统一内存架构让所有处理单元共享同一块内存,性能由此大幅提升。
在机器人领域,VLA(视觉-语言-动作模型)就类似于M1之前的笔记本电脑架构,视觉模块、语言模块、动作模块各自为政,数据在模块之间搬来搬去,每搬一次就丢一次信息。WALL-B将视觉、语言、动作、物理预测等所有能力,放在同一个网络中从零开始联合训练、融为一体,消除了模块间的边界和数据搬运损耗。
王昊强调,世界模型并非一个单独的外挂模块,而是一种对物理世界未来的预测能力。“要解决数据损耗问题,不能简单累加模块,而是要补上预测能力。”
“糖水”与“牛奶”:看似最难的路反而可能最简单
“这个行业最大的秘密,不是算法,不是架构,不是硬件,数据才是。”王昊将来源于实验室的干净、稳定、可预测的数据比作“糖水数据”,用此类数据训练的模型,就像在泳池里学了10年游泳的人,一旦被丢进大海就会淹死。“它很甜,但除了甜并不会增加抵抗力,也不会提升体质。喝多了有可能还会增加患糖尿病的风险”,训练出的模型几乎不具备零样本泛化能力。
与之相对,源自真实家庭、复杂不可控且充满随机性的数据则是具身智能的“牛奶数据”。尽管采集过程“很苦、很慢、很贵”,但王昊认为,要想要做出真正具备零样本泛化能力的基础模型,这条看似最难的路反而可能是最简单的。为此,自变量团队进入了超过100个志愿者的家庭去训练模型。
![]()
自变量联合创始人兼CTO王昊在介绍WALL-B
完整工程闭环:机器人领域领先窗口或达三年以上
王潜在接受澎湃新闻等媒体采访时表示,机器人进家庭目前并非百分百只靠AI模型去做,有时候还是得有人去在安全性等方面兜底和接管,但除了地形限制、工具太过复杂等情况外,所有能够在物理上实现的事情,其实机器人都能做,“只要进入家庭,你就可以使唤它,不需要再考虑有什么是能做的,有什么是不能做的”。
王潜认为,企业长久的竞争力在于建立一个真正统一的闭环体系。相较于算法架构,模型背后的数据定义、采集、改造、后处理以及训练测评调整等完整的工程体系,才是最难被复制的部分。他以大模型行业为例称,OpenAI曾领先谷歌近两年,而在机器人领域,这样的领先时间窗口会更长,可能达到三年以上。
值得一提的是,在发布会上,王潜也正式宣布自变量于近日完成了B轮融资,由小米战投领投。此前有报道称,自变量完成了近20亿元的B轮融资,也成为国内公开披露的唯一一家被四家互联网大厂(字节、美团、阿里、小米)投资的具身智能企业。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.