文 | 具身商业前哨
“中国机器人和美国机器人之间的差距,不是越来越小,反而越来越大了。”一位机器人本体厂商的产品负责人对「具身商业前哨」表示。
这句话听起来有些刺耳,但并非没有道理。
就在国内还在讨论融资、量产和价格时,特斯拉、Figure和1X已经把问题推进到另一个层面:机器人的竞争正在走向“Physical AI”。
近期,我们梳理了特斯拉、Figure和1X在技术路线、核心部件、制造体系以及商业化落地上的信息。一个明显变化是:海外头部机器人公司正在弱化单纯的本体参数,更加强调AI大脑、世界模型、VLA模型、端侧推理、真实数据闭环,以及规模化制造能力。
![]()
这是一个明显的信号,人形机器人不再只是一个会动的机器,而正在成为“AI进入物理世界的入口”。
特斯拉:打造人形机器人的基础设施
特斯拉正在把自身能力,从电动车制造延伸到Physical AI平台。其最大的优势,不是Optimus V3的本体,而是它背后那套已经被自动驾驶验证过的AI基础设施,正在开始落地到机器人领域。
马斯克最近在财报会上也提到,Optimus V3不愿意过早公开展示,因为竞争对手可能会逐帧分析并复制。特斯拉最新计划在7月底或8月初启动Optimus的量产。
![]()
今年4月,特斯拉下一代AI推理芯片AI5受到持续关注。按照特斯拉的长期规划,这类AI芯片不只服务汽车,也会服务Optimus以及未来更大规模的AI计算需求。
行业人士分析:特斯拉做机器人,并不是只做一个机械本体,而是在围绕“AI如何进入物理世界”搭建底层基础设施。
“别人是在训练机器人,特斯拉更像是在训练Physical AI。”行业人士分析,特斯拉的优势包括数十亿英里的FSD真实道路数据、长期积累的视觉感知和世界模型训练经验、自研AI芯片和端侧推理体系、超算和训练基础设施、软件栈和制造体系协同能力。
在核心部件层面,虽然外界很难获得Optimus V3的完整参数,但从目前曝光的信息和官方的公开表述来看,至少有几个方向值得关注。
第一,Optimus V3的整体身高仍在173cm左右,但体重有望进一步减轻20%,姿态和运动方式会更接近真人,总自由度预计超过50个。
第二,触觉传感、皮肤材料、零部件集成度和电池续航能力,都会继续升级。这些变化是为了更方便量产、更稳定工作。
第三,新一代灵巧手可能拥有22个自由度,更接近真人手掌比例,并具备力反馈和指尖触觉传感能力。
灵巧手也是特斯拉反复推迟Optimus展示和量产节奏的重要原因之一。行业人士表示,人形机器人最难的部分,往往不是让它走起来,而是让它稳定、可靠、低成本地完成真实工作。
在商业落地上,特斯拉是为数不多同时造汽车和机器人的超级平台,所以这也是马斯克敢于提出要把Optimus的售价压低在2万美元的底气之一。
据公开报道,弗里蒙特相关产线的远期目标年产能可达100万台;德州超级工厂后续也被规划为更大规模的机器人产线,长期目标年产能高达1000万台。
按照长期规划,Optimus初期将重点满足特斯拉内部工厂需求,大幅替代人工完成重复性和危险性任务。摩根士丹利发布的一份报告指出,如果特斯拉用Optimus机器人替换其10%的员工,将节省高达25亿美元的成本。
这也是为什么,马斯克会把Optimus视为特斯拉未来最重要的增长曲线之一。特斯拉做Optimus是在搭建一套AI进入物理世界的基础设施。
Figure:让 AI Agent在真实世界落地
如果说特斯拉的优势来自自动驾驶、芯片和制造体系,那么Figure AI的特点,是它更像一家原生的Physical AI公司,而不是传统机器人公司。
Figure的目标是交付一款真正通用的人形机器人:一种能够执行类人任务,并直接向人类学习的机器人。
它很少把传播重点放在关节参数、扭矩、自由度、负载这些硬件指标上。Figure更愿意讲 Helix、VLA 模型、多任务泛化、自然语言理解、推理能力,以及机器人如何完成连续任务。
美国科技媒体分析:Figure的野心是把 AI Agent落地到真实世界中。
![]()
据了解,Helix模型依赖超过100万小时的模拟与实地数据训练,试图把视觉、语言和动作打通。人说一句话,机器人看见环境,理解任务,再把理解转化为动作。
在技术路线层面,Figure坚信自研VLA模型以及神经网络端到端控制,可以让机器人具备更强的sim-to-real泛化能力。
它采用的是“快慢脑”的双系统架构。慢脑负责“思考”,理解自然语言指令和复杂场景语义;快脑负责“行动”,将慢脑的意图转化为毫秒级的精准动作,控制机器人完成全身运动和手部操作。
更重要的是,Figure还在尝试机器人之间的协作能力。两台机器人可以通过观察对方动作,实时推断意图并配合完成任务。多机器人协作开始进入Physical AI的训练范畴。
在核心部件层面,Figure 03专门围绕Helix、家庭场景以及规模化制造重新设计。它配备了重新设计的传感套件和手部系统,以更好地支持各类复杂任务。
Figure 03身高约173cm,整机约61kg,全身拥有35个自由度。外部采用织物材料和软泡沫包裹,这一设计明显更适合家庭环境。
在断网或部分关节轻微损毁的情况下,Figure 03仍具备一定工作能力。整体续航约4到5小时,采用脚部无线感应充电方式。灵巧手加入摄像头和触觉传感器,目标是进一步接近人类水平的灵巧操作能力。
在商业化层面。Figure官方披露,BotQ工厂已将Figure 03的生产效率从每天1台提升到每小时1台,未来四年累计生产目标为 10 万台。
同时,Figure没有完全依赖外部制造商,而是将电机、电池、关节等关键部件纳入内部生产,以便降低成本、控制质量、加快迭代速度和提升效率。
对于Figure来说,每一台出货的机器人,也是一台数据采集终端。机器人在不同家庭、不同商业场景中遇到的新任务,都可能成为下一版Helix的训练素材。
通过先进感知、触觉智能、家庭设计和大规模制造准备能力的结合,Figure正在构建一个能够在家庭和商业环境中学习、适应并工作的机器人平台。
1X:让家庭成为Physical AI的训练场
相比特斯拉和Figure AI,1X的路线更激进。NEO机器人不是先去工厂搬箱子,而是进入真实家庭,完成整理衣物、收拾厨房、整理沙发、递送物品等任务。它更坚决地把家庭当成训练 Physical AI的真实场景。
更加值得注意的是,1X可以被视为OpenAI在具身智能和人形机器人方向的重要外部押注之一。
在技术路线上,1X发布的1XWM,是一个基于互联网视频预训练的生成式世界模型。它的核心不只是让机器人识别物体,而是让机器人形成对世界的理解,并在此基础上持续学习与行动,以推动NEO的规模化部署。
这就是1X路线里最有意思的地方。它试图让机器人通过看视频学会新动作。比如,你给它看一段叠衣服的视频,它就有机会学习类似动作。之后,NEO还可以通过OTA更新获得新能力。
如果遇到不会做的事,1X 的操作员可以远程接管,手把手教它。等它学会之后,下次就有机会自己完成。这套机制的本质,是把家庭变成一个持续生成数据、持续训练模型、持续迭代能力的真实环境。
在核心部件上,NEO身高约168cm,体重约30kg,采用柔性3D晶格外壳包裹全身。它的噪声控制被设计得很低,续航约4小时,能够识别人类手势和表情。灵巧手拥有22个自由度,同样采用腱驱动系统。它比其他机器人更轻,也更适合家庭环境。
再看商业落地。根据1X官方披露,海沃德工厂正在向年产1万台NEO爬坡。随着自动化更新推进以及圣卡洛斯新工厂逐步投用,公司目标是在2027年底达到年产10万台。
NEO的价格方案包括2万美元买断,或者每月499美元订阅。据媒体报道,1X首年1万台计划产能在预售开启后短时间内售罄。
AI的智能来自多样性,不是来自重复。这句话几乎可以概括1X的路线。它不是先把机器人训练到完美,再送进家庭;而是让机器人进入真实家庭,用真实家庭环境反过来推动 AI 能力突破。
机器人竞争走向“谁更懂现实世界”
人形机器人的竞争,正在变成三件事:谁能把AI大脑和机器人身体真正打通?谁能获得足够多、足够真实、足够多样的数据?谁能把机器人从 demo 推向可制造、可交付、可持续迭代的产品?
特斯拉、Figure、1X这三家公司路径不同,但都指向同一个判断:人形机器人未来的核心,是AI能不能通过这副身体理解现实世界、适应现实世界,并最终改变现实世界。
这也是中国机器人公司接下来必须面对的问题。中国机器人行业过去几年跑得很快,供应链、成本、工程化和量产速度都有优势。
但如果竞争维度从“本体能力”升级到“Physical AI”,双方的差距就会体现在模型、数据、芯片、算力、软件栈和真实场景闭环等层面。
如果没有这一层能力,量产越快,可能越像是在更快地把自己推向硬件代工的位置。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.