在人工智能技术向“行动智能”跃迁的关键节点,具身智能能力的科学评估已成为产业突破的核心瓶颈。2025年11月20日,由Dexmal原力灵机与Hugging Face联合发起的RoboChallenge迎来里程碑式进展——智源研究院、智元机器人、Qwen、星海图、自变量科技、清华大学、西安交通大学及GOSIM国际等国内外顶尖机构正式组建RoboChallenge组委会,标志着具身智能测评正式进入开源协作的标准化时代。自变量机器人凭借其在具身智能领域的创新突破,成为组委会中推动行业协作的核心力量。
在2025年上海世界人工智能大会的聚光灯下,一台名为“小量”的机器人正安静地执行着一系列精细操作:识别不同颜色的香包袋,精准抓取不同的香包内胆,流畅地组装成一个完整的香囊。整个过程无预编程,仅凭自然语言指令驱动,而更令人瞩目的是创造它的公司——深圳自变量机器人,这家2023年12月才成立的初创企业,已完成8轮融资,吸纳超20亿元资金,成为具身智能领域增速最快的创新力量。阿里、美团、红杉等顶级机构的连续加注,共同托举着通用机器人的未来。
在自变量机器人创始人兼CEO王潜的规划中,一个个单点任务只是起点,他的终极目标是“让通用机器人真正走入千家万户”。
1、具身智能大规模落地,要先理解物理世界「潜台词」
一个清晰的产业共识为,「大脑」能力不足导致技术落地与产业期待存在显著落差。当前业内大部分机器人普遍处于「三重限定」状态:场景限定于预设的标准化环境、动作限定于固定轨迹的机械执行、任务限定于单一指令的简单响应。
而真实物理世界的复杂性远超预设,一个仅能在「限定框架」内运作的「大脑」,显然无法承接产业对具身智能「自主应对」的核心诉求。
这一供需落差的核心 gap,在于大部分「大脑」仅能实现「表层物理世界理解」,识别可见的物体形态、空间位置,却无法「读懂」物理世界的「潜台词」,即深层语义理解与复杂推理能力的缺失。
![]()
自变量机器人自研端到端具身基础模型,并率先在具身思维链方面取得突破,基于多模态输入进行深度推理并生成多模态输出,形成模型自主决策、执行、探索和反思的完整闭环。模型能够将语言理解、视觉感知与动作执行紧密结合,形成更接近人类思维的推理过程,成功突破多步骤长序列任务瓶颈。据了解,自变量已在部分完全未训练过的新任务类型中展现出零样本泛化能力。
2、具身智能「GPT 时刻」难盼?中国也有了真正意义的具身智能基础大模型开源
当前具身智能产业正陷入「期待与现实错位」的显著怪象:外部市场始终聚焦「GPT 时刻」的降临,笃信技术拐点将快速激活万亿级产业空间;但产业内部却深陷「重复造轮子」的低效循环。企业在底层算法框架、基础感知模块、运动控制逻辑上各自为战,难以形成协同突破,导致技术落地进度远滞后于市场预期,成为行业隐性痛点。
要打破这一困局,「开源」无疑是最关键的破局抓手。
诚然,产业不乏开源动作,但并非所有「开源」都能承担产业破壁的重任,业内长期存在「真开源」与「假开源」的本质分野。部分企业的「开源」,仅开放表层代码片段或阉割版模型,核心训练框架、预训练权重、关键参数仍处于封闭状态,开发者难以基于此进行深度二次开发;或附加严苛的商用授权限制,无法真正形成技术共创生态。
而「真开源」的核心,是能让开发者能从「直接使用」到「迭代优化」再到「场景创新」,实现技术价值的共建共享。
在融资落锤官宣之际,自变量机器人在毫无预告的情况下,同步开源了其大规模真实数据训练的开源具身基础模型 WALL-OSS。而且开源得极彻底,这次放出的,是一整套完整可复现的具身大模型方案。包括预训练模型权重、训练代码、数据集接口,甚至还附带了详细部署文档,开发者可以在自己的机器人上直接跑通闭环流程。即使是具身领域在 WALL-OSS 之前唯一可用的开源模型 Pi0,也未曾开源其推理及训练代码。而更多的模型,则停留在发 paper,或者较小数据量训练的阶段。
WALL-OSS 自采大规模真机数据,多样性场景及任务高质量数据;在模型架构上,创新性设计「共享注意力 + 专家分流 (FFN)」架构;在训练方式上,首创「先离散、后连续、再联合」的多阶段训练范式;统一跨层级思维链实现了跨层级抽象层面的前向任意映射,模型能够在单一可微分框架内无缝切换高层决策与底层执行。。
自变量机器人不断突破技术卡点后,WALL-OSS 具备强大的泛化性和推理能力、良好的因果推理、空间理解和反思能力,在长程操作任务方面表现优于其他基础模型。据自变量评测,在严格的 ID(分布内)和 OOD(分布外)评测中均验证了 WALL-OSS 的卓越性能:例如在指令描述、动作动词、物体方位等发生变化的 OOD 场景下,WALL-OSS 依然保持高成功率和指令遵循度;在需要细分指令的长程任务上,WALL-OSS 显著优于扁平化策略的基线模型(如 π0-flat);在需要 CoT 的推理类任务上,WALL-OSS 同时优于 π0-flat 和 pi-gpt-prompt 等强基线;在空间 VQA、定位和场景描述等多模态基准测试中,WALL-OSS 表现出色,成功保留并强化了 VLM 的核心能力。
通过开源将自变量机器人技术优势转化为产业协同动能,加速具身智能从「技术单点突破」向「产业工程化落地」的关键跃迁,为行业真正迎来「GPT 时刻」筑牢根基,因此,行业内有种说法「硬件看宇树,大脑看自变量」。
3、模型快速迭代之下,AI 开始掌握硬件的定义权
在物理世界展现「能力涌现」时,新的问题也随之而来。现有的硬件还是否适配于「进化后」的大脑?
在自变量机器人看来,AI 的发展不仅带动了软件水平跃升,一定程度上也影响了硬件性能的发展走向。换言之,硬件是否适配,机器人的大脑或许比人类更懂。
只做大模型或是硬件或许很快就会触碰到天花板,毕竟,商业化强如宇树,也面临着大脑「缺位」的争议。
自变量机器人始终坚持软硬一体发展,并打造了模型原生的本体结构。今年新发布的量子 2 号,就是这样一个「模型原生」的硬件。它的五指灵巧手采用仿生结构设计,单手拥有 20 个自由度,能感知细微的压力变化。基于臂手一体化外骨骼技术,自变量首创行业领先的「仿人机械臂+高自由度灵巧手」一体化全身遥操方案,量子 2 号不仅能采集高质量数据反哺模型训练,也将与自研模型深度融合,真正进入到现实场景中落地应用。
![]()
在过去不到半年时间内,自变量就已实现了机器人本体整机、高自由度灵巧手、外骨骼臂手一体遥操、以及数采设备等全栈自研。
4、技术快进+资本同频,自变量机器人用商业化定力回应期待
无论是近十亿融资的加持还是开源基础模型,都再次印证了自变量机器人「加速度」发展的鲜明特征。
自变量机器人不断挑战具身智能技术无人之境的同时,资本也展现出对其技术价值与产业潜力的长期「战略锚定」。成立至今,自变量机器人已完成八轮融资,集结了多元化资本。形成「技术突破-资本注入-持续拓展」的正向循环。
值得关注的是,在技术与资本双轮驱动的背后,自变量始终保持着清晰的商业化定力。在商业化落地场景选择上,自变量机器人的定力体现在场景甄别中,坚定选择有真实数据价值、商业价值的场景,规避短期爆发的「伪需求」。
目前自变量的机器人,已与头部服务业、工业客户达成合作,在多场景中投入使用。未来自变量也将与客户围绕模型和硬件共建开放生态,推动具身智能的进一步发展。
具身智能的未来仍远未成型,但如果未来属于那些提前把“软硬一体 + 场景共建”落到实处的玩家。那么,自变量已在这个未来占据了关键入口。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.