网易首页 > 网易号 > 正文 申请入驻

“一脑多用”,自变量机器人精准实现跨场景多任务复杂精细操作

0
分享至

7月末,2025世界人工智能大会现场人潮涌动。智能终端展区H3馆内,两台名为“小量”和“小白”的通用轮式双臂机器人“量子1号”,成为全场焦点。一举一动,皆引参展者驻足。在复杂开放的会场环境下,只需简单的语音指令,“小量”就能根据参展者喜好,自主拿起对应颜色的香包,制作个性化香囊。任务全部完成后,还能把香囊精准递送到参展者手中。和“小量”同时执行任务的,是家务整理区的“小白”。它正在将废纸团、空饮料瓶等垃圾扔进垃圾桶,并把随机散落的衣物收纳进脏衣篓。家务整理完毕后,“小白”主动将存放在货架上的香囊材料放至补货台,等待“小量”过来拿取。

(来源:资料图)

8月初,在2025年世界机器人大会召开前夕,该公司同步发布新品——新一代具身轮式仿人形机器人“量子2号”。该机器人采用仿生拟人构型、轮式底盘设计和7自由度仿生机械臂,能精准覆盖0-2m立体作业空间,不仅能完美适配商业综合体及公共场所移动需求,还可实现多场景任务秒级切换,运动表现能与人类媲美。

(来源:资料图)

这家公司便是自变量机器人(X Square Robot),其成立于2023年12月,核心团队汇聚全球顶尖AI与机器人领域专家,致力于推动具身智能与机器人技术创新与发展。据了解,截至目前,该公司已完成7轮融资,累计金额超过10亿元人民币,融资节奏与规模均属国内具身智能领域第一梯队。

创始人兼CEO王潜。在清华大学先后获得学士和硕士学位,硕士期间,他发表论文成为全球最早提出Attention机制的研究者之一,该研究后来成为Transformer架构的核心。硕士毕业后,他赴美深造,在美国南加州大学攻读博士学位,聚焦机器人学习与人机交互研究。怀揣着对机器人技术的热情,他在回国后创立了这家具身智能企业。

自研完全端到端统一VLA模型,消除机器人从感知到动作生成的巨大鸿沟

自变量自研的完全端到端统一视觉-语言-动作(VLA,Vision-Language-Action)模型WALL-A。可以实现机器人自主感知、决策与高精度操作,解决从感知到最后动作生成之间的巨大鸿沟。

它的核心突破,主要体现在三个方面。

第一,强大的泛化能力。模型在部分未见过的物理场景中,无需针对新场景进行额外训练,已经能部分实现零样本泛化。

其二,具身思维链(CoT,Chain of Thought)。模型通过多步逻辑推理,将抽象任务拆解为可执行的子步骤,并能够根据实时变化调整行动策略。

其三,统一架构。将视觉、语言、动作等所有模态信息,转换为统一的token序列,再送入一个Transformer核心,从而实现端到端统一学习。这能让系统在面对新任务时,可以像人类一样思考和工作,不再依赖模块化的信息传递。

(来源:资料图)

目前,WALL-A模型已经能完成拉拉链、扣扣子等长序列复杂精细操作,并在展会前夕短短几天时间内学会香囊制作等长流程柔性物体处理,多机协作、跨任务切换及抗干扰场景。具体表现为:在简单任务中自主学习到了少量数据训练的动作模式;融合视觉、语言与动作实时进行推理规划;任务被打断或物体移位时,能依据环境修正动作以持续完成任务。

关于COT,必须指出的是,其在具身智能领域的应用与纯语言模型存在本质差异。如王潜所言,行业内多数声称采用COT的做法,其实是调用语言模型做high level的规划推理。

要想将COT真正引入具身世界,需要攻克两大核心难题。首先,多模态输入输出匹配。具身智能的COT需构建“输入-输出”闭环,即模型输出需能重新输入自身以形成思维链。

针对此,自变量机器人打造多模态理解生成一体化模型,突破常规VLA模型的局限,实现视觉、语言、动作等多模态的输入输出匹配,进而构建完整的思维链闭环。

“常规VLA模型输入的是视觉和语言,输出的是动作,但我们构建的长思维链,要求输出中包含语言和视觉。”王潜表示。

另外,还通过后训练方式,进一步提升模型对空间位置、任务的深入理解与规划能力,实现端到端的深度整合。

据王潜介绍,模型可输出完整思维序列与过程,除语言外,还能通过视觉、动作等多模态记录,且能根据人类提供的新信息重新思考,更贴近人类从思考到行动的逻辑;即便人类在交互中随时打断或干预,模型也能重新规划推理。

从模型能力看,现阶段难点仍聚焦于构建长思维链,需要进一步打通视觉、语言与行动的壁垒,实现机器人在行动中感知、感知中思考,融合物理反馈与行动思考过程,让思考结果及时转化为行动,以适应复杂的物理世界。

王潜解释道:“这需要融合物理与虚拟世界的思考、物理反馈与干涉动作,远比单纯多模态或语言模型中的CoT更复杂困难。”

可广泛应用在泛商业、康养、工业等场景,将助力未来机器人走入千家万户

“量子1号”在大会上重点展示的制作香囊任务引发关注。作为全场最难任务,该任务涵盖上下料、分拣、填充、贴标签等长序列流程,需处理柔性物体与高度不可控环境,且允许游客干扰以验证抗干扰与泛化能力。

该任务背后的核心技术能力体现在:模型仅需几天短训即能完成复杂任务;同一模型“一脑多用”,支持同步制作香囊、交互及自主移动上下料;清理垃圾、收纳脏衣服;多机器人协同补料;在物流和工业场景中的任务完成速度媲美人为操作;能判断人手状态、理解人类意图,实现精准避障与安全控制。

显然,“量子1号”能完成的任务已非常广泛。那么,自变量机器人又为何决定推出“量子2号”呢?

首先,解决负载问题。“量子2号”通过硬件升级,能应对高负载操作需求。

其次,拓展工作空间与操作范围。“量子2号”身高1.72米,再加上臂展长度,可触及0-2m的工作空间,且腰部采用折叠式设计,可实现类似人踮脚、弯腰等动作,能直接够到地面及高处,覆盖空间更全面。

另外,增强交互性与场景适配。“量子2号”配备交互屏,能提供更丰富的人机交互价值,更适配服务场景中的交互需求。

两款机器人均为轮式地盘构造。和传统双足机器人相比,它们的主要区别体现在结构复杂性、成本、安全性等方面。虽然后者更适应户外复杂地形,且因外形更接近人类,而更能满足人类对交互对象的情绪需求。但前者由于结构复杂度低,所以不管是成本还是安全性,都要比后者高,在室内场景下的表现更优。

基于此,从应用场景来看,自变量机器人可广泛应用于酒店、零售店等泛商业场景,养老机构等康养场景,以及工业和家庭场景。

据了解,目前该公司已与头部酒店、养老机构合作探索落地场景,包括清洁任务、基础服务等。

综上可以看出,自变量机器人既是一家基础模型公司,又是面向终端的产品公司。“我们期望未来机器人能走入千家万户,替代千行百业中需要人工完成的工作。”王潜表示。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
面相有这3个表现的人,90%以上有肝病,肝癌不除外!

面相有这3个表现的人,90%以上有肝病,肝癌不除外!

消化石医生
2026-04-11 06:34:41
2026北京高校排名“大洗牌”!北邮逆袭、北工大赶超,还有这些变化.....

2026北京高校排名“大洗牌”!北邮逆袭、北工大赶超,还有这些变化.....

京城教育圈
2026-04-18 21:00:35
章泽天背帆布包看展,她没戴耳饰,她的耳唇很宽厚,面相很有福气

章泽天背帆布包看展,她没戴耳饰,她的耳唇很宽厚,面相很有福气

悦君兮君不知
2026-04-18 12:52:20
国内暴跌35%,全球大跌19.1%,为什么大家都不买小米手机了?

国内暴跌35%,全球大跌19.1%,为什么大家都不买小米手机了?

科技松鼠
2026-04-16 16:00:08
手感平平而且防守表现不佳,太阳锋线大将的状态有些令人担心?

手感平平而且防守表现不佳,太阳锋线大将的状态有些令人担心?

稻谷与小麦
2026-04-19 00:43:07
状态下滑+2768万年薪!勇士离队首人或出炉,库里恐再失得力助手

状态下滑+2768万年薪!勇士离队首人或出炉,库里恐再失得力助手

大卫的篮球故事
2026-04-18 18:49:04
伊朗总统:美国多次违约 伊朗人民已对其完全失去信任

伊朗总统:美国多次违约 伊朗人民已对其完全失去信任

国际在线
2026-04-17 05:39:14
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
难怪我国措辞升级,驱离画面曝光,日舰舰炮上膛,载有反舰导弹

难怪我国措辞升级,驱离画面曝光,日舰舰炮上膛,载有反舰导弹

林子说事
2026-04-18 20:51:07
郑丽文返台后,岛内民调曝光,位列倒数第三,与沈伯洋几乎持平?

郑丽文返台后,岛内民调曝光,位列倒数第三,与沈伯洋几乎持平?

许穋很机智
2026-04-19 00:49:47
全网唱衰的下嫁!嫁普通人5年,前任是法拉利总裁,终究还是输了

全网唱衰的下嫁!嫁普通人5年,前任是法拉利总裁,终究还是输了

橙星文娱
2026-04-18 16:42:58
当伯纳乌需要铁腕:被放逐的穆里尼奥是否能成为皇马的答案?

当伯纳乌需要铁腕:被放逐的穆里尼奥是否能成为皇马的答案?

落夜足球
2026-04-18 21:21:22
第10艘船被拦!美军全面封锁,严禁中伊原油交易,中国打出反制牌

第10艘船被拦!美军全面封锁,严禁中伊原油交易,中国打出反制牌

云上乌托邦
2026-04-18 14:17:07
俄罗斯没想到,美国更没想到,中国几乎全部“关键”技术遥遥领先

俄罗斯没想到,美国更没想到,中国几乎全部“关键”技术遥遥领先

向日葵向阳西晒
2026-04-18 12:17:10
潘石屹熬不住了

潘石屹熬不住了

华商韬略毕亚军
2026-04-14 17:55:41
我国真正的大都市只有8座,其它城市不必再争,差距确实是非常大!

我国真正的大都市只有8座,其它城市不必再争,差距确实是非常大!

坠入二次元的海洋
2026-04-11 13:30:53
“姆巴佩的引援是一场灾难”

“姆巴佩的引援是一场灾难”

绿茵情报局
2026-04-18 20:48:02
赵岩昊遭王博当众怒吼径直离场,胡金秋拉都拉不住,谁之过?

赵岩昊遭王博当众怒吼径直离场,胡金秋拉都拉不住,谁之过?

砚底沉香
2026-04-18 20:15:25
华住会的大瓜!女客户怒了!

华住会的大瓜!女客户怒了!

挖掘机007
2026-04-18 20:11:38
黎笋长子曾坦言:越南当年敢打中国有3个原因,结果发现全是错觉

黎笋长子曾坦言:越南当年敢打中国有3个原因,结果发现全是错觉

顾史
2026-04-18 09:17:19
2026-04-19 02:20:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16595文章数 514889关注度
往期回顾 全部

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

头条要闻

伊朗革命卫队向油轮开火 伊朗最高领袖发声

头条要闻

伊朗革命卫队向油轮开火 伊朗最高领袖发声

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

刘德华回应潘宏彬去世,拒谈丧礼细节

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

本地
时尚
手机
健康
公开课

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

选对发型,真的能少走很多变美弯路

手机要闻

荣耀600系列参数、外观全曝光

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版