网易首页 > 网易号 > 正文 申请入驻

具身智能行业为什么需要开源模型评测?

0
分享至



从2025年春晚的表演破圈到人形机器人马拉松,再到年底的量产落地、商业闭环,具身智能的风向正在发生变化。

尤其当具身智能进入产业落地期,机器人表演式成功已经不足以满足业界对其能力的期待。产业端进入更加看重“机器人大脑”及其相应带来的泛化能力的阶段,因为真实世界不存在完全标准化的场景,无论在工业分拣、养老护理还是仓储物流等场景,机器人都要解决自主且稳定地与真实物理世界交互的问题。

——这正需要强大的具身智能模型能力作为支撑。那么,大规模落地应用到来前,我们如何评估具身智能模型这一“机器人大脑”的能力?

和大语言模型一样,具身智能模型同样需要建立开放公正的评价体系,以测评推动行业进步。Robochallenge是全球首个大规模、多任务的真机基准测试平台,意在为VLA模型在机器人上的应用提供评估标准。

值得关注的是,具身智能模型测评和大语言模型测评有非常大的差异。大语言模型的测评多为“闭卷答题”,以静态数据输出与文本、图像指标为主,不涉及物理交互与连续动作执行。而具身模型的测评更加侧重“感知-决策-执行”的物理闭环,在测评时需要提前公开任务,核心验证对象为视频动作序列和任务成功率,类似于“开卷考试+实操考核”。

因此,用公开代码的开源具身智能模型参与测评,才是是更货真价实、更有价值的。

RoboChallenge最新发布的测评结果显示,自变量开源端到端具身智能基础模型wall-oss以46.43分超越pi0,总分排名第二,仅次于pi0.5。

Pi0、pi0.5背后的公司Physical Intelligence主要团队成员来自伯克利、斯坦福等高校和谷歌专家等。自变量机器人创始人王潜为南加州大学博士学位,是全球最早在神经网络中提出Attention机制的研究者之一;CTO王昊则主导开发国内首个多模态开源大模型“太乙”、百亿级大语言模型“燃灯”及千亿级模型“姜子牙”。

具体来看,wall-oss在叠洗碗巾、挂口杯、按按钮、浇盆栽、移物入盒及开瓶器进抽屉等多个单任务中排名第一。

排名前三名,wall-oss是唯一一个国内开源具身基础模型。

开源模型把模型代码、训练数据乃至架构设计公开,让测评过程可全程复现,能够规避通过微调其他模型来“刷榜”的行为,可以更客观、真实地反映模型能力。这势必将引导各个具身智能玩家回归技术本身,用技术能力构建自身的核心竞争力。

同时,开源模型有助于技术透明迭代,能够加速具身智能行业创新。开放协作的“集体智慧”,远比封闭开发更能应对真实世界的复杂性、随机性。

自变量从成立以来,就致力于树立开源的标杆,让每次开源都对行业产生价值。去年9月,wall-oss模型正式开源,预训练模型权重、训练代码、数据集接口以及详细部署文档全部公开,开发者可以在自己的机器人上直接跑通闭环流程。

自变量机器人联合创始人兼CTO王昊此前曾公开谈及自变量坚持来源的初衷:“开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。一般的高校、或者一些小型的企业,他们可能没有能力去做基础模型,但是如果能够使用这些基础开源模型,他们就可以去做应用,把它用到各个方向,丰富整个生态,这也是一个非常重要的事情。”

在RoboChallenge发布测评结果之后,wall-oss提交的复现结果示例、微调代码也将在下周全部开源,让模型展现出的泛化能力、推理能力等有据可查。除了检验测试结果的真实性,开发者们也可以在平台上根据源代码和各个任务的微调代码,结合自己的数据完成复现微调。

这意味着,自变量提供的不仅仅是一个模型,而是一整套完整可复现的方案,这对具身智能基础模型的透明迭代和标准共建具有更深远的意义。

拥抱开源,是具身智能走向成熟的必经之路。只有把技术从封闭的实验室里解放出来,让更多人参与、验证、改进,才能真正突破单点创新的局限,具身智能才能真正从实验室走向真实世界。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李在明这一趟,直接把咱们当年流落在外的镇宅石狮子给扛回来了

李在明这一趟,直接把咱们当年流落在外的镇宅石狮子给扛回来了

鹤羽说个事
2026-01-09 14:29:02
“大尺度”新年挂历火了!活菩萨椰树怂了

“大尺度”新年挂历火了!活菩萨椰树怂了

李东阳朋友圈
2026-01-09 20:01:49
太魔幻了!诈骗头目陈志只是一只白手套,他背后的保护伞又是谁?

太魔幻了!诈骗头目陈志只是一只白手套,他背后的保护伞又是谁?

公子麦少
2025-10-22 14:43:48
联合国尚未收到美国退出31个联合国机构的正式通知

联合国尚未收到美国退出31个联合国机构的正式通知

新京报
2026-01-10 09:28:18
师胜杰:至死不肯戒酒,离世4年后,遗孀宋艳的坚持让人泪目

师胜杰:至死不肯戒酒,离世4年后,遗孀宋艳的坚持让人泪目

丰谭笔录
2026-01-10 07:40:11
中国向全球曝光美4400颗卫星围堵中国空间站

中国向全球曝光美4400颗卫星围堵中国空间站

花寒弦絮
2026-01-09 22:03:26
谢贤没想到,谢霆锋也没想到,两代人的痞气,在谢振轩身上消失了

谢贤没想到,谢霆锋也没想到,两代人的痞气,在谢振轩身上消失了

石场阿鑫
2026-01-08 17:13:03
28岁,女王风范,真空穿深V抹胸紧身裙,酥胸半露,性感又撩人

28岁,女王风范,真空穿深V抹胸紧身裙,酥胸半露,性感又撩人

吃瓜党二号头目
2026-01-10 10:53:15
苹果立大功!美研究发现:其天然成分黄酮类,可使肝脏年轻4.69岁

苹果立大功!美研究发现:其天然成分黄酮类,可使肝脏年轻4.69岁

思思夜话
2026-01-09 10:53:04
300亿没了?市值缩水9成,“茶饮第一股”被消费者狠狠上了一课

300亿没了?市值缩水9成,“茶饮第一股”被消费者狠狠上了一课

小熊侃史
2026-01-04 12:36:18
中美军事实力有多大差距?张召忠:我可以负责任地讲,别再被误导

中美军事实力有多大差距?张召忠:我可以负责任地讲,别再被误导

混沌录
2025-05-12 18:38:14
叶帅让胡耀邦送自己去机场,却一把将他拉上飞机,当即下令:起飞

叶帅让胡耀邦送自己去机场,却一把将他拉上飞机,当即下令:起飞

浔阳咸鱼
2026-01-08 06:35:06
美军绑架马杜罗当天,16艘油轮同时出港突围,仅一艘辽宁油轮被扣

美军绑架马杜罗当天,16艘油轮同时出港突围,仅一艘辽宁油轮被扣

安安说
2026-01-09 13:03:19
广湛高铁工地工人从桥面扔铁模板砸中一放牛老人致死,事故调查报告公布

广湛高铁工地工人从桥面扔铁模板砸中一放牛老人致死,事故调查报告公布

澎湃新闻
2026-01-09 18:42:27
湖人4分输雄鹿!詹姆斯空创第一历史纪录,东契奇25中8对不起老詹

湖人4分输雄鹿!詹姆斯空创第一历史纪录,东契奇25中8对不起老詹

毒舌NBA
2026-01-10 14:07:14
决胜局9:10逆转!陈熠3:2赢张本,多哈战早田成试金石

决胜局9:10逆转!陈熠3:2赢张本,多哈战早田成试金石

阿晞体育
2026-01-10 08:57:10
赵本山:我拯救了一个恶毒女人的演艺生涯,她却忘恩负义踩我上位

赵本山:我拯救了一个恶毒女人的演艺生涯,她却忘恩负义踩我上位

芳芳历史烩
2025-07-23 17:53:28
地下捐精有多乱!女的被约到宾馆,捐精者:直接怀孕只收800元

地下捐精有多乱!女的被约到宾馆,捐精者:直接怀孕只收800元

雍亲王府
2025-11-14 14:50:03
茅台产品全面降价!

茅台产品全面降价!

小鬼头体育
2026-01-10 13:10:06
马布里携妻子观战尼克斯 晒照发文:爱不再是感觉 而是呼吸的空气

马布里携妻子观战尼克斯 晒照发文:爱不再是感觉 而是呼吸的空气

Emily说个球
2026-01-10 12:19:24
2026-01-10 15:19:00
定焦One incentive-icons
定焦One
深度影响创新。
829文章数 1098关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

媒体:中国若在其任期统一特朗普不悦 中方回应滴水不漏

头条要闻

媒体:中国若在其任期统一特朗普不悦 中方回应滴水不漏

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

赵樱子称和蒋毅试婚三天:像试面膜

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

健康
亲子
本地
游戏
公开课

这些新疗法,让化疗不再那么痛苦

亲子要闻

大宝抵触二宝?二胎家庭,父母如何避免给孩子造成心理创伤?

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

拉瑞安确认《神界》新作不会再用AI生成概念艺术

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版