![]()
作者:吕鑫燚
出品:具身研习社
具身智能依旧悬而未决的是什么?
这要从具身智能的终局谈起:成为千行百业的生产力。这表明,它必须同时具备三种能力:大脑、运控、操作。三者缺一不可。
过去三年,行业已经交出了前两张答卷。
最明显的就是运控能力,从四足机器人的平稳行走,到双足机器人的上下楼梯,再到全身协同挑战高难度动作,开源算法和成熟的硬件供应链,已经让运控不再是高门槛的技术叙事,今天的机器人,拥有了历史上最丝滑的 "躯体"。
大脑也在以惊人的速度进化。模型带来的能力,让机器人能听懂自然语言指令,能识别复杂的场景,能进行简单的推理和规划。国内国外层出不穷的模型,让机器人的 "智商" 正在以月为单位迭代。
但最关键的第三环 ——操作能力,至今鲜少见到涌现。
这是一个反常识的事实,能运控、会规划的机器人并不能完全掌握操作本质。因为操作,是与物理世界的实时交互。它不是简单的 "看到 - 执行" 闭环,而是需要在充满不确定性的环境中,不断感知、调整、反馈、再调整的动态过程。它涉及到触觉与视觉的融合,涉及到对物体物理属性的理解,涉及到对微小误差的容忍和修正。
这才是具身智能真正的 "最后一公里",也是决定这场千亿级豪赌最终胜负的生死线。
橡木果的破局点正是在此。他们将人类繁杂的操作行为进行解构与抽丝剥茧,为机器人找到了那份「具身本能」。机器人不再依赖于海量数据堆砌出对物体的理解和执行,而是真正拥有“本能直觉”和“肌肉记忆”,和人一样在与环境的交互中“长”出操作能力。
![]()
视频示意:橡木果「抓混合物品」演示
这也是橡木果对未来的判断,“终局不是大脑的路线之争”橡木果发起人姜峣对具身研习社表示,未来的通用机器人会有千百种形态,也会搭载迥异的大脑模型。但本能可以跨越所有场景、任务,而这份操作能力,将成为整个产业最坚实的基座。
![]()
想要知道机器人究竟该如何掌握操作能力,要从人类的行为逻辑中找答案。
一个尚未牙牙学语的婴儿,他真正建立对世界的“操作认知”,凭的绝非语言的教导、视觉主导的“旁观”,而是实打实的触碰。这是一个高度统一的行为,不同文化、不同背景的人,都在以同样的姿势完成抓取物体,并根据物体形状、质量的不同实时调整抓取的力度。
这说明人类的操作存在本能,而这正是橡木果团队找到的具身智能操作入口。
在橡木果看来,本能并不直接规定具体的动作路径。而是为所有行为树立了一个内在的期望,一旦这个期望被确立,所有的动作行为都会自发地向这个目标持续收敛,在与物理世界的实时交互中不断调整,直到任务完成。
![]()
示意:橡木果「抓豆腐」演示
这个发现成为了橡木果整个技术路线的原点。基于此,橡木果又进一步拆解了三大本能。
- 定向本能:负责构建机器人与物体的初始接触关系。它与视觉系统协同工作,这一本能解决了 "找到物体" 的问题。
- 探索本能:这是最复杂、也最能体现 "智能涌现" 的本能。当机器人的手指接触到物体后,它会自动沿物体表面进行探索,寻找最稳定的接触构型。这种探索不是预设程序,也不是模仿学习,而是由 "建立稳定接触" 这一本能规律催生出的自主行为。
- 执行本能:负责推进操作的最终完成。它以 "滑移最小化" 和 "阻抗匹配" 为核心目标,根据触觉反馈实时调节电机电流(相当于人类的肌肉张力),无需任何训练数据。抓豆腐时自动调低增益,避免捏碎;抓锤子时自动调高增益,确保抓牢。
这三个本能有明显的应用优势,所有这些调控都完全依赖触觉信息的实时反馈,不需要任何训练数据;无论是两指夹爪、三指灵巧手还是五指拟人手,无论电机参数、传动结构有多大差异,本能库都能自动适配;所有决策都在端侧完成,不经过上层 "大脑",避免了系统性延迟。这让机器人能够像人类一样,对突发情况做出即时反应。
在此之前,整个行业都在沿着大模型的成功经验往前走:既然语言可以通过海量数据拟合出来,那么操作也一定可以。于是几乎所有人都在做同一件事:收集尽可能多的人类操作视频,训练尽可能大的模型,试图让机器人通过模仿学会所有动作。
这是一条从大模型时代延续下来的路径,也是一条看起来最顺理成章的路径。但这种架构埋下的缺陷,成为了具身智能商业化路上最大的拦路虎。
首先是数据问题,语言是单一模态,操作则是语言、视觉、触觉三个模态,如果纯靠数据完成将会迎来极大的数据量爆炸;其次,操作执行不能依赖于云端的大脑,而是在边缘端侧建立起极低延迟、功耗的模型,做到及时反应;最后就是产业落地的最大问题,现有架构的泛化性水平可以拿捏光照、颜色等环境变量,但要换个场景则很难完成。
而这些问题正在被「本能驱动」逐个击破。
可见,与其让机器人像一个复读机一样,死记硬背人类的每一个动作细节,不如直接赋予它类人的操作本能。让它像人一样,通过与物理世界的真实触碰和探索,自主地 "长" 出操作能力。
这是一个彻头彻尾的非共识。当全行业都在比拼谁的数据更多、谁的模型更大、谁的算力更强时,橡木果选择了新道路:从本能出发,生长出属于机器人自己的技能。
![]()
和「本能驱动」相匹配的,是一套全新的架构,橡木果将“任务和操作”彻底解耦,构建分层、独立、可协同的架构。
大脑完成任务理解、逻辑推理与高层规划,专注处理知识与规则层面的复杂性。而执行层交给本能驱动,由端侧自主决策模型Natus与通用操作技能模型Magis,处理物理交互、硬件适配与实时动作。
![]()
图片来源:橡木果
如此一来,本能驱动能拿捏所有操作任务流,且不需要根据硬件单独适配微调。
而这条架构的最关键突破为:零数据。
具体来看,Natus——橡木果的端侧自主决策模型,其部署在端侧,由触觉激发。就像人类的脊髓反射系统一样,能够在毫秒级时间内对触觉刺激做出反应。Natus不需要任何训练数据、微调,核心逻辑是依靠本能反射,来构建触觉感知与肌肉动作之间的映射关系,出厂即具备操作的本能。以人类的行为来看,上岗工作前,我们具备操作能力,也能够适应不同物体和工况的特点,所以在新的岗位上也能“一上来就会做”。
在橡木果的测试中,机器人在面对从未见过的各种不规则形态的物体,会沿其表面自主探索,实时调整抓取策略,直到建立稳定的接触构型后成功抓起;
![]()
示意:橡木果「抓异形物体」演示
面对倾倒了装有半瓶水的瓶子,它会反复试探重心,逐步调整抓力;
![]()
示意:橡木果「抓瓶子」演示
就算是,公认在最难的操作之一“极薄卡片状物体”任务中,机器人也能自主探索,尝试推、翘、扣等动作后,成功抓起。
![]()
示意:橡木果「抓卡片」演示
这些行为既不是写死的预设程序,也不是用百万小时人类操作视频喂出来的模仿产物,而是由底层本能直接催生出的行为涌现。
这种自下而上的涌现机制,让机器人不再是被禁锢在预设指令集里的提线木偶,而是拥有了在真实物理世界中自主 "生长" 出操作能力的可能。更关键的是,由本能催生的行为,带着更简洁与高效的标签。没有多余的抖动、试探等数据拟合留下的痕迹。而是精准且始终锚定核心目标,以最短路径向最终状态持续收敛。
而Magis——通用技能操作模型,其任务,就是将Natus在交互中产生的行为数据,通过触觉进行语义增强,再标注重量、质心的位置、物体的软硬度、抓取时的力分布与滑移趋势等物理属性,最终训练形成通用技能模型。
由此可见,这套流程中,对训练数据需求大幅降低,也从最深层开始让模型理解物理数据,提升视觉追踪的鲁棒性。
以抓香蕉为例,Natus 通过多次自主探索,最终完成香蕉的成功抓取。
![]()
示意:橡木果「抓香蕉」演示
这段尝试的过程中,被记录下的不只有视觉,还有基于触觉感知自动完成的语义打标(重120g,质心偏左,表皮粗糙,硬度中等。)当力学语义实时叠加到视频帧上,使得用于训练的 Magis 技能模型,能够真正“理解”物理世界的力学属性,而不仅仅是外观。机器人学到的不是单一的动作,而是知道如何找到最合适的位置、最恰当的力,越来越高效。
简而言之,这个过程中,一方面能转化为机器人的 "肌肉记忆",让它越做越快、越做越稳;另一方面用来训练通用操作技能模型,让它的泛化能力越来越强。一个零数据-升级-更好操作-再升级的操作能力闭环就实现了。
最终能实现跨本体、跨任务、跨场景、跨平台的泛化能力。从本能演变成技能。
这正是橡木果技术路线的最长护城河。
全球范围内除了橡木果, Genesis AI 也曾展现出本能反应,但这背后依然是数据驱动的模型在支撑。与很多同行不同,他们将硬件视为整个系统的基石而非附属品。不过,硬件磨损带来的性能衰减和真实数据的天然局限性,仍是包括 Genesis AI 在内的所有具身智能公司需要共同攻克的行业难题。
而橡木果对数据和硬件的无依赖,使其每一次操作都是一次新的探索,每一次探索都在优化它的能力。使用时间越长,它见过的物体越多,操作就越熟练,泛化能力就越强。
这条路线目前已经在产业化进程中得到应用侧的“用脚投票”。橡木果已经和全球头部化妆品ODM厂商的产线完成POC验证。毕竟谁不想在自家产线里疯狂加购一个不需要部署成本,能灵活换产线、还越用越好用的机器人。
具身智能的本质就是对人类的一次解构重塑,如何破局、哪条技术路线可行,人类已经给出答案了,它就藏在你每一次的“下意识”。
![]()
2026 年 3 月,橡木果机器人完成近亿元种子轮融资,领投方包括钱塘资本、普华资本等知名投资机构。
该笔融资是资本市场对“本能驱动”这一非共识技术路线投下的一张信任票,也标志着资本开始从技术本源探索智能涌现,去找寻产业内真正能成为生产力革新的入局者。
不过,这张信任票投的也不仅仅是橡木果八年来的技术坚守,而是一家兼具硬核技术基因、深刻产业理解与清晰商业逻辑的产业级公司。在探索技术的过程中,橡木果也同步自研了视触觉传感器,并成功产品化,其硅胶弹性体加微型相机的路线,能做到不依赖敏感元器件,通过图像重构反演物理量。
透过橡木果的技术路线可见,其在做的是产业内最务实也是行之有效的操作能力。它的野心从来不是做一个“看起来很炫”的机器人,也不是要颠覆 VLA、世界模型等现有技术路线,而是要做整个具身智能产业的通用操作底座,以一种底层基础设施的形态,赋能所有硬件厂商、模型公司。
在橡木果的产业蓝图中,VLA 或世界模型和本能驱动不是非此即彼的竞争关系,而是双向奔赴的互补关系。橡木果擅长的是底层的物理交互与操作执行。两者的协同,能让机器人既有长程任务规划能力,更有每一次精准操作的稳妥。加速具身智能从单场景poc验证走向真正大规模市场化落地。未来,橡木果的本能驱动将渗透到每一个需要与物理世界交互的角落。
正如姜峣表示,“橡木果的长期目标,是成为全球具身智能领域不可或缺的底层基座。” 不追求成为什么都做的全能选手,而是专注于构建最底层、最关键的操作基石。
过去几年,具身智能行业一直在争论一个问题:通用机器人什么时候才能到来?有人说需要十年,有人说需要二十年。但橡木果用自己的实践给出了一个不同的答案:通用机器人不会一夜之间出现,它会先拥有操作本能,不依赖于数据,不限制硬件、任务,当「本能驱动」开始重构操作边界,大脑的能力也将更好的发挥。
这就是橡木果正在做的事情——它在造一次次完美的 "操作能力"。这个能力不会取代任何人,它只会让每一个机器人都变得更有用。而当千行百业的机器人都拥有了操作本能,具身智能的时代才真正开始。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.