近日,由Dexmal原力灵机与Hugging Face共同发起的RoboChallenge组委会,这一开创性倡议吸引了从顶尖研究机构到前沿企业的广泛关注与参与。智源研究院、智元机器人、Qwen、星海图、自变量、清华大学、西安交通大学、GOSIM等国内外重要伙伴相继加入,共同推动具身智能评测生态的建设。
2025年11月20日,RoboChallenge组委会正式成立。这不仅意味着具身智能真机测评的开源协作迈入了标准化、规范化的新阶段,更标志着行业首次以“开放共同体”的共创模式,为具身智能技术的迭代与落地注入系统性新动能。
不过一场由评测引发的“乌龙事件”,让自变量机器人成为行业焦点。具身智能模型评测平台RoboChallenge对多款主流开源模型进行了真机测试,并更新了初步结果。基于Physical Intelligence(PI)构建的π0与π0.5表现亮眼,而国产开源模型的成绩则相对平淡。其中,自变量公司的WALL-OSS-Flow模型被一些自媒体单独拎出,以“零成功率”为标题进行批评与传播。
![]()
然而,真相很快浮出水面。RoboChallenge官方迅速全渠道辟谣,其官网主页明确标注:“请注意,以前显示的一些结果可能是临时的、部分的或仅用于调试目的。”事件的起因,是评测平台的本体暂时无法支持自变量模型主流的末端控制方式,数据回放与接口对齐尚在调试过程中,而调试阶段的截屏被误读为最终结果。
![]()
遗憾的是,误读传播还在继续。并且,在原文删除后,多平台密集出现了内容相似的批评文章,评论区涌现大量疑似水军的账号。有知情人士透露,自变量官网一度无法访问,疑似遭受黑客攻击。一场技术评测,意外演变成了一场舆论攻击。
这并非孤例。就在近期,小鹏机器人发布的IRON人形机器人,因动作过于流畅自然,被部分网友质疑是“真人套壳”。具身智能初创公司灵启万物发布的demo视频,则引发了技术路线之争:有KOL解读为运用了视觉语言模型(VLA)与强化学习,也有投资人认为其技术陈旧,甚至有自媒体用AI检测工具断言视频完全由AI生成。
这些接连不断的误读事件,折射出一个现实:作为扼住机器人行业发展咽喉的关键技术,具身智能模型似乎自带“招黑体质”。
误读根源:认知门槛与信息不对称
具身智能模型之所以自带“招黑体质”,与大众对它的认知门槛较高紧密相关。对于普通人而言,具身智能仿佛有一道无形的“壁垒”。大众难以理解,为何机器人能完成炫酷的舞蹈、跑步、格斗动作,却无法在工厂里精准地打好螺丝、做好家务。即便与行业有一定接触的媒体人、投资人,对于其中的技术原理也常常一头雾水,容易被误导。
信息不对称也是滋生误读和骗局的重要原因。媒体《蓝鲸财经》采访某大学机器人系统架构师报道称,国内有些初创公司,甚至是部分知名公司采用遥操作的方式拍摄demo,并将其包装成“全自主智能”,误导投资人判断。为应对此类骗局,某知名投资机构专门组建了理工科博士团队,以提高对技术问题的鉴别能力。专业人士尚且需要如此谨慎,普通大众面对市面上形形色色的具身智能模型信息,出现误读也就不足为怪了。
求真之道:真机验证与理性认知的重要性
面对层出不穷的误读,如何客观评估具身智能模型的真实水平,成为行业亟待解决的问题。无论是投资机构的资本决策,还是评测平台的专业测试,现场真机演示都是不可或缺的核心环节。清华交叉信息研究院助理教授高阳提出的测试方法颇具参考价值:对于号称能叠衣服的机器人,可将衣服团成一团随意摆放,观察其是否能完成任务,或测试其对裤子、外套等不同品类衣物的泛化处理能力。自变量创始人王潜也强调,视频demo存在诸多造假可能,唯有现场实时互动测试,进行一些人为干扰,才能真正检验模型的真实性能。
值得注意的是,评测平台的真机测试与展会现场的演示存在本质区别。前者需将模型部署到全新本体上,而跨本体适配过程中,数据迁移、接口打通等环节极易导致原模型能力损耗。以PI开源的π0和π0.5为例,国内企业尝试在其基础上微调后,效果并未显著优于其他开源方案,更无法复现PI团队在自有本体上的表现。这意味着,对具身智能模型的评估不能脱离硬件载体,更不能用单一标准简单评判,必须结合适配情况进行综合考量。
国家战略下的长跑:需要理性与耐心
今年以来,具身智能已成为一级市场最炙手可热的赛道之一,且投资结构出现显著变化:国资背景的产业基金与地方政府平台频繁现身,预示着更强的国家意志与长期布局。
政策层面信号已无比清晰。今年3月,“具身智能”首次被写入国务院政府工作报告;10月,“十五五”规划建议明确将其纳入未来产业重点布局。开源证券分析称,未来人形机器人产业将是“中美引领、全球共振”的宏大格局。
开源证券机械首席分析师孟鹏飞称,未来人形机器人产业将是中美引领、全球共振,是人类科技史上浓墨重彩的一笔。
具体到具身智能模型环节,中国则有着独到的竞争优势。
目前具身智能模型最大的卡点在于数据,它是模型迭代的核心燃料。而我国作为全球唯一拥有全部工业门类的国家,叠加丰富的民生场景,为具身智能模型提供了海量真实数据。同时中国的硬件、供应链、数采工人的工资都更便宜,更具有成本优势。
当前,尽管在估值与融资额上,中国初创企业与美国的PI、Figure等相比仍有差距,但以自变量为代表的自研基础模型创企对外展示的模型能力,已展现出与国际同行同台竞技的实力。这是中国在具身智能模型领域不容小觑的竞争力。
凡是承载战略价值的新兴科技,其成熟必将经历漫长的迭代与爬坡。具身智能,这项或将重塑生产力、走进千家万户的技术,值得我们以更长远的眼光审视。少一些急于求成的误读,多一些实事求是的求真精神;少一些冷嘲热讽的轻率,多一分允许探索、包容失败的耐心。 或许,这才是迎接一个智能机器人时代来临,应有的理性姿态。
免责声明:此文内容为广告或转载宣传资讯,相关素材由广告主提供,仅代表作者个人观点,与本单位无关。仅供读者参考并请自行核实相关内容。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.