![]()
新智元报道
编辑:元宇
【新智元导读】Figure 03这次不像是机器人,更像第一次真正「住进」了人类的厨房。
帮你洗碗的家务机器人来了?
刚刚,一段Figure 03在厨房干活的视频被网友刷爆了。

它是Figure AI推出的最新机器人,搭载了其最新的Helix 02系统。
与早期的Helix仅能控制上半身相比,Helix 02实现了全身级自主控制,显著提升了其在真实环境中自主决策和全身动作控制的能力。
在视频中,Figure03在厨房里「像人一样」干起活来,全程无需人工干预。
Figure03的一些小动作,直接把很多网友都看呆了。

比如,当它正准备转身把抓起的厨房用具放入洗碗机时,身旁打开的抽屉挡住了它的去路。
按照以往逻辑,机器人大概率会先放下手里的东西,转身,用手关上抽屉,再重新拿起碗碟。
但Figure 03只是身体顺势一转,用胯部轻轻一顶,就把抽屉关上了,动作丝滑如行云流水,就像人们在厨房中忙乱时的下意识动作一样。
不仅如此,它还会用脚抬起洗碗机门,这说明它已经具备了利用全身协作的能力,能够将整个身体作为工具,而不仅仅依赖双手。
![]()
Figure AI宣称,Helix 02是他们迄今为止能力最强的人形机器人模型,它采用了单一的神经系统,在整个房间范围内实现「灵巧、长时程的自主行为」。
Figure创始人Brett Adcock直言,「会跳舞的机器人并不稀奇,难的是实现智能控制」。
![]()
Figure 03所展现的「智能控制」突破,主要体现在以下核心能力上:
受限环境下的稳健操作:即便手持易碎品(如玻璃杯),机器人也能在移动中保持步伐稳定与抓握精准,确保物品平稳不晃动。
全程双手协同:在物体的拾取、传递、堆叠及放置过程中,双臂不再是独立运作,而是作为一个整体系统进行完美的协调配合。
跨尺度运动控制:基于同一神经网络,Figure 03既能执行毫米级的手指微操,又能驾驭房间尺度的全身移动,其动态控制范围跨越了四个数量级。
除上述运动控制外,Figure 03还展现了长时序的动作规划能力。
它能够按逻辑顺序执行包含移动与操作的复杂任务序列,并具备隐式的错误恢复机制,从而在数分钟的连续执行中保持任务状态不掉线。
Figure 03的自主性与未来感设计引发了热烈讨论。
推特用户Chubby盛赞其「拟人化」的步伐和设计是革命性的进步。
![]()
许多网友对Figure 03的自主性和设计而感到惊叹,认为这是革命性的进步。
然而,并非所有人都为此买单。
网友Zamiel Cano直言,在Tesla Optimus面前,其他机器人都显得「毫无价值」,并坚信Optimus终将主宰整个行业。
![]()
还有网友认为Figure 03只能做到在饭后清理餐桌、把餐具放进洗碗机这些还不够,还要能够规划餐食并订购食材。
告别「回合制」
把「走路+干活」揉成一个大脑
视频中的Figure03,展示了惊人的「全身协同」能力。
它不再把身体拆分成「走路的腿」和「干活的手」,而是像人一样,把整个身体当成一个统一的工具。
这标志着Helix02突破了几十年来传统机器人领域最棘手的难题之一:真正统一行走与操作。
因为在传统机器人的大脑里,走路和干活是两套完全分开的程序。
它们就像在玩回合制游戏:
第一回合:走到桌子前(停止腿部运动,站稳)。
第二回合:伸出手臂(锁定下盘,只动上半身)。
第三回合:抓住物体(收回手臂)。
第四回合:再次启动腿部(转身,走)。
这种模式不仅效率极低,而且充满了机械的僵硬感。
真正的自主性需要一个能够同时对全身进行推理的单一学习系统。
该系统能持续感知、决策并行动,比如在搬运物品的同时行走,在伸手够物时调整平衡,并实时从错误中恢复。
Helix02正是如此。
它第一次把人形机器人的「走路+干活」揉成一个大脑,实现了「行走-操作」的真正统一。
Helix 02在原有的系统1(System 1,S1)、系统2(System 2,S2)架构的基础上,新增了一个基础层:系统0(System 0,S0)。

每个系统都以自身的自然时间尺度运行。
S2(大脑)负责理解复杂的指令,缓慢地进行目标推理:解读场景、理解语言并规划行为序列。
S1(脊髓)负责敏捷的动作执行,快速思考,以200 Hz的频率将感知转化为全身关节的目标指令。
S0(小脑)负责稳健的身体控制,以1 kHz 的频率执行,负责全身的平衡、接触与协调。
![]()
S0
基于人类数据的「运动直觉」
S0为机器人提供「运动直觉」,它是一个用于机器人全身控制的基础模型,是Helix 02物理具身的核心基础。
当更高层级负责任务推理与规划时,S0确保每个动作都能平稳、安全且稳定地执行。
S0并非为行走、转向、蹲下或伸手等动作分别设计奖励函数,而是直接从大量且多样化的运动数据中学习追踪人体动作。
Figure投喂了超过1000小时的关节级重定向人类运动数据,而S0则是在不断的仿真模拟中,模仿这些人类的动作。

S0的出现,让Figure03直接获得了一种类似于人类「直觉」的能力。
![]()
S1
掌心长眼、触觉通神,它能为你捏起一颗药片

在最初的Helix中,S1只负责上半身控制,输入也仅限于关节状态和图像。
而在Helix 02中,S1连接了全部传感器,并直接控制整个机器人。
输入,通过头部摄像头、掌心摄像头、指尖触觉传感器,以及全身本体感知。
输出,通过覆盖整个机器人的关节级控制:包括双腿、躯干、头部、手臂、手腕以及每一根手指。
这种从感知到全身执行的一体化架构,让S1能把机器人自身状态与环境视为一个强耦合系统来整体推理。
如果说全身协同让Figure03的行动有了「人样儿」,那么手部操作的进化,则让它真正具备了「干细活」的能力。
比如处理类似洗碗、帮老人拿药这些家庭环境中极其细腻的任务,Helix02通过配合Figure03的新硬件,完美解决了这个问题。
其中,掌心摄像头和触觉传感器是Figure 03带来的新硬件能力。
掌心摄像头在物体被头部摄像头遮挡时,提供关键的手内视觉反馈。
每个指尖内嵌的触觉传感器能检测低至3克的力,灵敏到足以感知一枚回形针,从而实现具备接触感知、可精细调节力度的抓取。
这些感知能力真正释放了五指灵巧手的潜力,让Helix能应对需要多指精细控制的复杂操作。
在演示中,我们看到了Figure 03在灵巧任务中令人惊叹的场景:
任务1:拧开瓶盖
![]()
Figure03必须在施加持续且受控的旋转以拧下瓶盖时,保持瓶子的稳定,同时避免打滑或压碎容器。
这需要双手协调配合,并通过触觉调节握力与扭矩控制。
任务2:从药盒中找出并取出药片

Figure 03必须从药盒中定位并取出一粒小药片,而药片常常被遮挡无法被头部摄像头看到。
任务3:从注射器中精确推出5毫升液体
这需要手掌级别的视觉反馈以及触觉引导的精准抓取。
面对药盒里细小且不规则的药片,甚至是那些被遮挡的药片,Figure03没有丝毫犹豫。

Figure 03必须精确推进注射器活塞,以释放指定体积的液体,这需要具备触觉反馈的力控驱动,以及多指协同的稳定操作。
任务4:从杂乱的箱子中拾取金属零件

Figure 03必须从一堆相互重叠、遮挡且在交互过程中会移动的物体中取出小型金属部件。
这需要在杂乱环境中具备可靠的视觉抓取选择能力,并通过触觉确认抓取的稳固性。
在这些灵巧任务中,Figure03展示了完美的「分寸感」。
比如在拧瓶盖任务中,它能实时感知摩擦力的变化,施加连续且可控的旋转力。在处理注射器时,它更是能精确控制推注的体积。
这种指尖上的进化,意味着机器人终于可以胜任家庭场景的细腻任务,真正具备了「干细活」的能力。
这一切,都要归功于S1。
它是一个「全传感器输入,全关节输出」的强大视觉-运动策略层,它把眼睛看到的(头部和掌心)、手指摸到的(触觉传感器)、身体感受到的(本体感知),全部融合成一个整体,以每秒200次的频率指挥全身关节配合。
它让机器人不再是「盲人摸象」,而是真正的「眼手心合一」。
![]()
S2:场景理解与语言
系统2仍然是语义推理层:处理场景、理解语言,并为S1生成潜在目标。
Helix 02大幅扩展了S2所能指定的行为范围。
从以往「拿起番茄酱」这样简单操作,扩展到了一些更复杂的任务,比如走到洗碗机前并打开它、把碗端到台面上、回到顶层架子,拿起杯子……
S2无需规划底层的步态或具体指定如何协调手臂与腿部动作。
它生成一系列语义隐变量,由S1解释为运动指令,并由S0执行。
自主长时程移动操作
得益于对S1、S2、S0在运动能力、推理、感知、灵巧性等方面能力的全面整合,Helix 02能够执行连续的、持续数分钟的任务。
我们看到了S0负责稳健的身体控制,S1负责敏捷的动作执行,而S2则负责理解我们那些复杂的指令。
以前我们需要给机器人写代码才能让它动,现在,你只需要对它说:「把杯子放入洗碗机」。
S2会听懂这句话,把它拆解成「走到水槽」「拿起杯子」「走到洗碗机」「放好」等一系列意图;
S1会指挥手眼配合去抓杯子;S0则会确保在这个过程中,机器人不会因为踩到地上的水渍而滑倒。
如果说以前机器人是「计算」出来的平衡,现在机器人是「感觉」到了平衡。
它不再需要为每一个微小的动作写说明书,而是把人类千万年进化出来的「肌肉记忆」,直接装进了自己的神经网络里,真正实现了全身级自主控制。
这次Figure 03厨房秀,让人突然意识到机器人开始有「身体直觉」了。
也许当它真正量产走进人类厨房时,那个「今天谁洗碗?」的难题可能将不复存在了。
参考资料:
https://www.figure.ai/news/helix-02
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.