![]()
具身天工3.0:首个全尺寸托马斯回旋的人形机器人
“真正的力量,不是让人形机器人像人,而是让人类敢于变得更像自己。”
CyberRobo,是CyberDaily 人形机器人专栏
今年的春节,人形机器人密集出现在大众视野,舞台上的小个子机器人动作丝滑利索,整齐划一,给人们送上功夫、舞蹈等令人惊叹的表演。
但在热闹之外,北京人形机器人创新中心在春节前夕发布的具身天工3.0,则把焦点拉向另一个维度:全尺寸的人形机器人在高动态运动、触物交互式及灵巧精细操作能否兼顾?北京人形有了答案。
全尺寸 VS 小尺寸,托马斯回旋背后的极限能力与潜力
这个问题的背后是一个技术分野。春晚中的小尺寸人形机器人由于体量较轻,惯性小、冲击载荷低,即便在高速动作中出现误差,也更容易通过算法修正。而全尺寸机器人一旦进入高动态区间,问题会迅速放大:自重带来的惯性显著增加,落地冲击力成倍提升,关节扭矩需要更大,结构振动与控制系统之间的耦合也更加复杂。小尺寸和全尺寸在运控系统,可以说面对的是完全不同级别的物理约束。
因此,当近1.7米,体重62千克的具身天工3.0完成了「全球首个全尺寸人形机器人托马斯回旋」全流程动作时,其意义不仅仅是一次高难度动作的视觉冲击,更是全尺寸的本体是否仍具备工程稳定性的问题,尤其是未来面对极限场景的应用时。
托马斯回旋要求机器人在腾空瞬间,由臂、髋、膝、踝等多个关节协同,在毫秒级时间内输出足够大的旋转力矩以克服自重完成离地。空中阶段要控制旋转惯量与姿态稳定,双腿落地时要吸收数倍体重的冲击力,并通过踝、膝关节的缓冲机制分散能量。对可能存在的不平整地面,还要在极短时间内完成全身动态调整,重建平衡闭环。任何一个环节出现延迟或误差,都可能导致结构冲击放大或系统失稳。
在全尺寸平台上完成这一整套动作,意味着动力系统、结构强度、传感系统与控制算法已经能够在极端动态条件下闭环运行。可以说,它更接近一次完整的系统级压力测试,用来验证机器人在剧烈姿态变化和强冲击环境中的稳定性与可靠性。
这种能力并不只服务于娱乐表演等酷炫和展示场景,例如在仓储高位作业、建筑工地巡检和操作作业、户外复杂地形行走或灾害环境中同样适用,地面不平整、外力干扰和重心快速变化都是常态。而人形机器人如果无法在高冲击条件下快速恢复姿态,就难以进入真实环境。托马斯回旋提供的是能力边界的验证。
实现高速运动、全身协调与触物实时反应的不可能三角
如果说高爆发动作验证的是极限能力,那么具身天工3.0展示的第二个突破,则更直接关联在实际作业场景的能力:触物交互式全身高动态运动控制——将高速运动、全身协调与触物实时反应紧密协同。
在视频中可以看到,具身天工3.0完成单手跨越1米障碍、颠乒乓球、接住棒球、边走边拧瓶盖等动作。这些动作的共同点是:人形机器人在高速运动过程中,需要将外部物体纳入控制系统的实时闭环。自身姿态在持续变化,外部物体轨迹在变化,接触力也在变化,控制系统必须同步完成感知、预测、力反馈调节与全身协调。
以颠球为例,机器人不仅要预测物体弹跳轨迹,还要在移动中调整末端执行器位置与角度,接球动作要求在毫秒级完成轨迹修正与冲击吸收;边走边拧瓶盖,移动中进行电控柜毫米级操作,则需要在重心不断变化的情况下保持上肢精细控制。这类能力在小尺寸平台上实现难度相对较低,而在全尺寸人形机器人上,由于惯性与负载的提升,对实时控制与传感融合的要求就大大提高。
触物交互式全身高动态控制,本质上是一种环境耦合能力。人形机器人需要将自身关节运动,与外部物理世界的几乎纳入同一控制模型。这种能力决定了它是否能够在实用场景中有效,例如在移动中完成巡检调节,在动态的传送带上抓取移动零件,尤其是多工位,需要多人形机器人协同中连续交接物品,或者在人机协作场景中保持流畅的工作节奏。
持续作业能力的建立,是规模化部署的前提。
![]()
海外热议,具身天工3.0成为人形机器人的基础设施:开源,开放
当具身天工3.0发布后,迅速进入海外科技媒体与社交平台讨论区。雅虎、Interesting Engineering、路透等知名科技媒体跟进,引起社区广泛热议...“全尺寸平台完成高动态动作意味着什么,以及开放策略会给行业带来怎样的变化”...部分海外评论将其视为中国人形机器人从展示阶段迈向规模化实用的一个信号。
![]()
![]()
![]()
![]()
除了运动与控制能力,具身天工3.0同时推进开放策略。本体设计蓝图、运控框架、世界模型、具身VLM、跨本体VLA模型、具身数据集RoboMIND与仿真资产ArtVIP等核心成果,从2024年开始就陆续开放,硬件侧预留多类型扩展接口,兼容ROS2生态,软件侧支持主流通信协议,并提供配套开发文档与工具链。这种平台化思路降低了二次开发门槛,使合作方可以在成熟本体基础上专注场景创新。
当前人形机器人领域存在硬件封闭、软件不通、协议碎片化的问题,导致重复研发比例较高。开放接口和跨本体模型能力,使得具身天工3.0可以被视为人形机器人开发的基础设施。
正如X上的一些机器人创业者评论到:“具身天工3.0将行业的核心问题,从如何制造机器人转移到了决定用机器人来做什么。因为开源开放,它大幅降低了开发门槛,对所有开发者都是好事。”
![]()
![]()
人形机器人真正的挑战并非机械结构,而是如何把高层认知与底层控制打通。具身天工3.0背后依托高性能本体与具身智能系统“慧思开物”的协同。世界模型与VLM负责场景理解与任务拆解,VLA与导航系统负责实时执行与避障,实现感知、决策、执行的闭环连接。全尺寸高动态能力与具身大模型结合,使其既具备物理层面的爆发力,也具备认知层面的任务规划能力。
![]()
春节期间,舞台上的小尺寸机器人展示了人形机器人正在进入大众的生活空间,而全尺寸的天工在高动态与触物耦合能力上的突破,则把讨论拉回到工程系统部署的视角。尺寸决定负载,负载决定控制难度,控制难度又决定能否进入真实作业的现实环境。当具身天工3.0在成人大小/体重上完成极限动作与环境耦合控制时,技术量级已经发生变化。
当然,视频末尾出现的彩蛋,也值得一提:非侵入式脑机接口操控人形机器人翻阅杂志,人类一旁阅读...这种科幻式的人机协同,提供了一个未来的应用方向。例如从特殊人群的智能生活辅助到人形机器人数据采集与训练体系,无创脑机接口意念控制人形机器人的方案可以成为人类和具身系统的一部分。例如埃隆·马斯克的Neuralink已经成功测试植入式脑机接口控制机械臂,给瘫痪者喂食。
从全球视角看,人形机器人正在从展示性平台过渡到工程系统。全尺寸高动态控制与触物耦合能力,是进入复杂场景的物理前提,开放接口与平台化架构,是规模化应用的产业前提。
现在,具身天工3.0融合了这两个路径,使其成为一个值得持续观察的技术样本。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.