网易首页 > 网易号 > 正文 申请入驻

超越Pi0,多项任务第一:中国开源具身智能模型新纪录,叠洗碗巾、浇盆栽全胜任

0
分享至


机器人前瞻(公众号:robot_pro)
作者 李水青
编辑 漠影

机器人前瞻1月9日报道,近日,在真机基准测试平台RoboChallenge上,自变量机器人开源端到端具身智能基础模型WALL-OSS以54.69分的成绩,成功率35.33%,位列总分榜单第二,超越国际知名具身智能模型pi0。

在叠洗碗巾、按按钮、浇盆栽等多个具体任务中,WALL-OSS拿下单项第一,展现出在真实物理环境中的稳定执行能力。

在这样的“公开考场”中,WALL-OSS的表现成为一次来自中国开源具身智能模型的公开能力验证。

一、WALL-OSS 拿下多项第一

从RoboChallenge公布的榜单来看,参与评测的模型覆盖了多种技术路线与研发背景:既包括来自国际研究机构与创业公司的闭源模型,也有少量开源模型参与同台竞技。


▲RoboChallenge榜单情况

其中,自变量推出的WALL-OSS模型得分高于美国具身智能创企Physical Intelligence推出的模型pi0,逼近后者的最新开源模型Pi0.5,三者居于榜单前三位,都是开源模型。

在具体任务层面,WALL-OSS在多项精细操作任务中取得第一。

这些任务并不追求复杂场景堆叠,而是高度贴近真实世界中机器人的核心应用场景——物体识别、状态判断、动作连续执行与误差修正。这也是RoboChallenge设计任务的核心逻辑:用最“朴素”的任务,检验模型是否真的理解并适应物理世界。


▲RoboChallenge在按按钮任务中成功率达60%

整体趋势非常清晰——具身智能正在从“演示级别”走向可对比、可量化的工程阶段。

在这一背景下,WALL-OSS 的代表性进一步凸显。其在参数规模上作出取舍,通过4.2B参数体量,将具身智能模型的训练与部署门槛压到消费级显卡,大幅降低了落地成本。

二、为何开源模型的成绩更“货真价实”?

与大语言模型常见的榜单不同,具身智能测评本质上是一类完全不同的“考试”。

在RoboChallenge等平台上,评测任务提前公开,从形式上看更接近“开卷考试”。但最终的评分依据,并非模型生成的文本或中间结果,而是机器人是否在真实世界中完成了指定动作。

这意味着,模型需要应对的是:物理误差与环境噪声、传感器不确定性、连续动作中的累积偏差,以及大量未被显式建模的现实变量等。

真正决定成绩的,是模型在面对现实世界时的泛化能力与执行稳定性。

正是在这一规则下,开源模型的独特价值被进一步放大。

对比闭源模型,完全开源、公开代码与权重的模型而言,其成绩具备完全可复现性。外界可以清晰判断:模型是否依赖未公开模块,是否通过特殊工程手段规避难点,是否存在只针对评测任务的定向优化。

这使得评测结果更接近对模型基座能力的检验,而非团队工程技巧的展示。

从这个角度看,WALL-OSS在RoboChallenge上取得的成绩,并不仅是一个名次,更是一种技术透明度下的能力证明。这种“在阳光下竞争”的结果,也为行业提供了更可信的比较参照。


▲自变量机器人具身智能模型支持机器人叠衣服

三、做行业“基础设施”,开源凝聚生态之力

从开源技术路径来看,WALL-OSS并非通过压缩能力换取小体量,而是在架构层面做出了针对性设计。其核心技术路径包括:

1、通过 “共享注意力 + 专家分流” 的创新架构,解决视觉-语言模型向视觉-语言-动作模型迁移过程中常见的 “灾难性遗忘” 与 “模态解耦” 问题;

2、采用 “先离散、后连续、再联合” 的训练范式,在统一框架内融合了思维链推理能力与精细动作生成能力,避免了传统方案中理解与执行割裂的问题。

这种路径并不强调单一模块的极致性能,而是围绕“端到端”这一目标,确保模型在感知、推理与动作之间形成稳定闭环。

在当前具身智能生态中,不少方案仍停留在模块拼接阶段,或依赖闭源组件完成关键能力。相比之下,在同等参数规模下,WALL-OSS是少数真正实现理解—规划—执行一体化的开源统一模型之一。

这使其在生态层面具备明确定位——不仅是一个“可用模型”,更是一个可被二次开发、复现与扩展的基础能力底座。

从自变量机器人的策略来看,选择开源并非一次短期传播行为,而是对具身智能发展路径的判断。

具身智能的复杂度,决定了任何单一团队都难以在短时间内覆盖所有场景与问题。与其封闭迭代,不如通过开源方式,尽早建立可验证、可扩展的技术底座,让更多研究者与开发者在同一基础上探索。

在这一逻辑下,WALL-OSS更夯实了“基础设施”式的存在。其目标并非在短期内覆盖所有应用,而是试图为行业提供一个可靠、低门槛、可持续演进的起点。

结语:中国具身智能开源力量正在崛起

WALL-OSS在RoboChallenge上的表现传递出一个信号:中国团队不仅在参与这场竞赛,而且正在以开源、透明、可复现的方式,进入全球具身智能能力对比的主舞台。

随着真机评测、统一基准与开放生态逐步成熟,具身智能正在告别“概念展示期”,进入更残酷、也更真实的工程阶段。而在这一阶段,谁能提供稳定、可信的基础能力,谁就更有可能成为下一轮创新的起点。

从这个意义上看,WALL-OSS的出现,或许只是中国具身智能开源力量正在崛起的一个开始。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
天津一小学发布通知:明日停课1天!

天津一小学发布通知:明日停课1天!

天津人
2026-03-03 11:35:42
功夫大哥肢解大儿子续命

功夫大哥肢解大儿子续命

毒舌扒姨太
2026-03-02 22:47:22
电影院抓小三后续!为求刺激上演灯下黑?孩子也不是丈夫亲生的

电影院抓小三后续!为求刺激上演灯下黑?孩子也不是丈夫亲生的

社会酱
2026-03-01 20:43:29
一大批外国人被迫滞留新加坡:机场成“难民所”、陆路堵超2小时

一大批外国人被迫滞留新加坡:机场成“难民所”、陆路堵超2小时

新加坡万事通
2026-03-02 19:04:00
美大使馆被炸?报复一个接一个!英法德选边,普京下令出动运输机

美大使馆被炸?报复一个接一个!英法德选边,普京下令出动运输机

铁锤简科
2026-03-03 14:16:04
法官问为何不交物业费,业主反问:不交税违法,不交费违法吗

法官问为何不交物业费,业主反问:不交税违法,不交费违法吗

蜉蝣说
2026-02-03 16:31:54
人没本事,一看就知:没本事的人,每到春节,就会有3个通病

人没本事,一看就知:没本事的人,每到春节,就会有3个通病

聚焦最新动态
2026-02-28 09:53:49
2-1!穆帅有望逆袭:本菲卡不败差榜首7分,下轮赢波尔图或能争冠

2-1!穆帅有望逆袭:本菲卡不败差榜首7分,下轮赢波尔图或能争冠

体育知多少
2026-03-03 07:18:38
中国股市:换手率都到这个程度了,散户还傻傻分不出是进还是出?

中国股市:换手率都到这个程度了,散户还傻傻分不出是进还是出?

股经纵横谈
2026-03-03 10:54:30
女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

丫头舫
2026-02-10 22:18:05
真相大白?张柏芝隐瞒8年的三胎儿子,身份疑似曝光,谢霆锋赢了

真相大白?张柏芝隐瞒8年的三胎儿子,身份疑似曝光,谢霆锋赢了

老吴教育课堂
2026-03-03 07:52:30
亚洲首个倒下的国家要出现了?曾叫嚣取代中国,如今却步日本后尘

亚洲首个倒下的国家要出现了?曾叫嚣取代中国,如今却步日本后尘

八斗小先生
2026-03-02 15:56:32
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

医学科普汇
2026-01-29 06:25:03
委内瑞拉反对派领导人马查多称将尽快回国组织选举,美方反应冷淡

委内瑞拉反对派领导人马查多称将尽快回国组织选举,美方反应冷淡

澎湃新闻
2026-03-02 14:16:29
澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

第7情感
2026-02-23 20:45:16
特朗普夫人安理会上关注世界儿童 中方当面谴责

特朗普夫人安理会上关注世界儿童 中方当面谴责

看看新闻Knews
2026-03-03 11:31:37
李莉评论区被冲,过往言论被反复吐槽,伊朗半小时灭以,回旋镖!

李莉评论区被冲,过往言论被反复吐槽,伊朗半小时灭以,回旋镖!

眼光很亮
2026-03-01 15:39:43
伊朗允许外国留学生无需出境许可经陆路口岸离境

伊朗允许外国留学生无需出境许可经陆路口岸离境

闪电新闻
2026-03-02 15:57:15
哈登一战独创两大里程碑,历史第一神迹在望

哈登一战独创两大里程碑,历史第一神迹在望

大眼瞄世界
2026-03-02 22:57:56
伊朗已彻底认怂

伊朗已彻底认怂

仰望星空的一粒沙子
2026-03-02 09:55:15
2026-03-03 14:47:00
机器人前瞻
机器人前瞻
专注于机器人报道的媒体
379文章数 8关注度
往期回顾 全部

科技要闻

手机AI在MWC上卷出了新高度

头条要闻

特朗普:不担心美领土遭受袭击威胁 这是战争的一部分

头条要闻

特朗普:不担心美领土遭受袭击威胁 这是战争的一部分

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

借壳上市纳斯达克?小杨哥海外"洗白"之路

汽车要闻

长安汽车2月销量151922辆 环比逆势增长12.8%

态度原创

时尚
教育
家居
游戏
本地

普通人穿衣真的很简单!单品选对、搭配合理,大方舒适又得体

教育要闻

在学校吃午餐VS回家吃?半年后差距这么大!第3点很多家长没想到

家居要闻

万物互联 享科技福祉

《战神》新作回归动作本源?风格更接近《鬼泣》

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

无障碍浏览 进入关怀版