专访橡木果：零数据、冷启动，用"本能驱动"重构具身智能应用边界|触觉|视觉|机器人

分享至

作者：吕鑫燚

出品：具身研习社

具身智能依旧悬而未决的是什么？

这要从具身智能的终局谈起：成为千行百业的生产力。这表明，它必须同时具备三种能力：大脑、运控、操作。三者缺一不可。

过去三年，行业已经交出了前两张答卷。

最明显的就是运控能力，从四足机器人的平稳行走，到双足机器人的上下楼梯，再到全身协同挑战高难度动作，开源算法和成熟的硬件供应链，已经让运控不再是高门槛的技术叙事，今天的机器人，拥有了历史上最丝滑的 "躯体"。

大脑也在以惊人的速度进化。模型带来的能力，让机器人能听懂自然语言指令，能识别复杂的场景，能进行简单的推理和规划。国内国外层出不穷的模型，让机器人的 "智商" 正在以月为单位迭代。

但最关键的第三环 ——操作能力，至今鲜少见到涌现。

这是一个反常识的事实，能运控、会规划的机器人并不能完全掌握操作本质。因为操作，是与物理世界的实时交互。它不是简单的 "看到 - 执行" 闭环，而是需要在充满不确定性的环境中，不断感知、调整、反馈、再调整的动态过程。它涉及到触觉与视觉的融合，涉及到对物体物理属性的理解，涉及到对微小误差的容忍和修正。

这才是具身智能真正的 "最后一公里"，也是决定这场千亿级豪赌最终胜负的生死线。

橡木果的破局点正是在此。他们将人类繁杂的操作行为进行解构与抽丝剥茧，为机器人找到了那份「具身本能」。机器人不再依赖于海量数据堆砌出对物体的理解和执行，而是真正拥有“本能直觉”和“肌肉记忆”，和人一样在与环境的交互中“长”出操作能力。

视频示意：橡木果「抓混合物品」演示

这也是橡木果对未来的判断，“终局不是大脑的路线之争”橡木果发起人姜峣对具身研习社表示，未来的通用机器人会有千百种形态，也会搭载迥异的大脑模型。但本能可以跨越所有场景、任务，而这份操作能力，将成为整个产业最坚实的基座。

想要知道机器人究竟该如何掌握操作能力，要从人类的行为逻辑中找答案。

一个尚未牙牙学语的婴儿，他真正建立对世界的“操作认知”，凭的绝非语言的教导、视觉主导的“旁观”，而是实打实的触碰。这是一个高度统一的行为，不同文化、不同背景的人，都在以同样的姿势完成抓取物体，并根据物体形状、质量的不同实时调整抓取的力度。

这说明人类的操作存在本能，而这正是橡木果团队找到的具身智能操作入口。

在橡木果看来，本能并不直接规定具体的动作路径。而是为所有行为树立了一个内在的期望，一旦这个期望被确立，所有的动作行为都会自发地向这个目标持续收敛，在与物理世界的实时交互中不断调整，直到任务完成。

示意：橡木果「抓豆腐」演示

这个发现成为了橡木果整个技术路线的原点。基于此，橡木果又进一步拆解了三大本能。

定向本能：负责构建机器人与物体的初始接触关系。它与视觉系统协同工作，这一本能解决了 "找到物体" 的问题。
探索本能：这是最复杂、也最能体现 "智能涌现" 的本能。当机器人的手指接触到物体后，它会自动沿物体表面进行探索，寻找最稳定的接触构型。这种探索不是预设程序，也不是模仿学习，而是由 "建立稳定接触" 这一本能规律催生出的自主行为。
执行本能：负责推进操作的最终完成。它以 "滑移最小化" 和 "阻抗匹配" 为核心目标，根据触觉反馈实时调节电机电流（相当于人类的肌肉张力），无需任何训练数据。抓豆腐时自动调低增益，避免捏碎；抓锤子时自动调高增益，确保抓牢。

这三个本能有明显的应用优势，所有这些调控都完全依赖触觉信息的实时反馈，不需要任何训练数据；无论是两指夹爪、三指灵巧手还是五指拟人手，无论电机参数、传动结构有多大差异，本能库都能自动适配；所有决策都在端侧完成，不经过上层 "大脑"，避免了系统性延迟。这让机器人能够像人类一样，对突发情况做出即时反应。

在此之前，整个行业都在沿着大模型的成功经验往前走：既然语言可以通过海量数据拟合出来，那么操作也一定可以。于是几乎所有人都在做同一件事：收集尽可能多的人类操作视频，训练尽可能大的模型，试图让机器人通过模仿学会所有动作。

这是一条从大模型时代延续下来的路径，也是一条看起来最顺理成章的路径。但这种架构埋下的缺陷，成为了具身智能商业化路上最大的拦路虎。

首先是数据问题，语言是单一模态，操作则是语言、视觉、触觉三个模态，如果纯靠数据完成将会迎来极大的数据量爆炸；其次，操作执行不能依赖于云端的大脑，而是在边缘端侧建立起极低延迟、功耗的模型，做到及时反应；最后就是产业落地的最大问题，现有架构的泛化性水平可以拿捏光照、颜色等环境变量，但要换个场景则很难完成。

而这些问题正在被「本能驱动」逐个击破。

可见，与其让机器人像一个复读机一样，死记硬背人类的每一个动作细节，不如直接赋予它类人的操作本能。让它像人一样，通过与物理世界的真实触碰和探索，自主地 "长" 出操作能力。

这是一个彻头彻尾的非共识。当全行业都在比拼谁的数据更多、谁的模型更大、谁的算力更强时，橡木果选择了新道路：从本能出发，生长出属于机器人自己的技能。

和「本能驱动」相匹配的，是一套全新的架构，橡木果将“任务和操作”彻底解耦，构建分层、独立、可协同的架构。

大脑完成任务理解、逻辑推理与高层规划，专注处理知识与规则层面的复杂性。而执行层交给本能驱动，由端侧自主决策模型Natus与通用操作技能模型Magis，处理物理交互、硬件适配与实时动作。

图片来源：橡木果

如此一来，本能驱动能拿捏所有操作任务流，且不需要根据硬件单独适配微调。

而这条架构的最关键突破为：零数据。

具体来看，Natus——橡木果的端侧自主决策模型，其部署在端侧，由触觉激发。就像人类的脊髓反射系统一样，能够在毫秒级时间内对触觉刺激做出反应。Natus不需要任何训练数据、微调，核心逻辑是依靠本能反射，来构建触觉感知与肌肉动作之间的映射关系，出厂即具备操作的本能。以人类的行为来看，上岗工作前，我们具备操作能力，也能够适应不同物体和工况的特点，所以在新的岗位上也能“一上来就会做”。

在橡木果的测试中，机器人在面对从未见过的各种不规则形态的物体，会沿其表面自主探索，实时调整抓取策略，直到建立稳定的接触构型后成功抓起；

示意：橡木果「抓异形物体」演示

面对倾倒了装有半瓶水的瓶子，它会反复试探重心，逐步调整抓力；

示意：橡木果「抓瓶子」演示

就算是，公认在最难的操作之一“极薄卡片状物体”任务中，机器人也能自主探索，尝试推、翘、扣等动作后，成功抓起。

示意：橡木果「抓卡片」演示

这些行为既不是写死的预设程序，也不是用百万小时人类操作视频喂出来的模仿产物，而是由底层本能直接催生出的行为涌现。

这种自下而上的涌现机制，让机器人不再是被禁锢在预设指令集里的提线木偶，而是拥有了在真实物理世界中自主 "生长" 出操作能力的可能。更关键的是，由本能催生的行为，带着更简洁与高效的标签。没有多余的抖动、试探等数据拟合留下的痕迹。而是精准且始终锚定核心目标，以最短路径向最终状态持续收敛。

而Magis——通用技能操作模型，其任务，就是将Natus在交互中产生的行为数据，通过触觉进行语义增强，再标注重量、质心的位置、物体的软硬度、抓取时的力分布与滑移趋势等物理属性，最终训练形成通用技能模型。

由此可见，这套流程中，对训练数据需求大幅降低，也从最深层开始让模型理解物理数据，提升视觉追踪的鲁棒性。

以抓香蕉为例，Natus 通过多次自主探索，最终完成香蕉的成功抓取。

示意：橡木果「抓香蕉」演示

这段尝试的过程中，被记录下的不只有视觉，还有基于触觉感知自动完成的语义打标（重120g，质心偏左，表皮粗糙，硬度中等。）当力学语义实时叠加到视频帧上，使得用于训练的 Magis 技能模型，能够真正“理解”物理世界的力学属性，而不仅仅是外观。机器人学到的不是单一的动作，而是知道如何找到最合适的位置、最恰当的力，越来越高效。

简而言之，这个过程中，一方面能转化为机器人的 "肌肉记忆"，让它越做越快、越做越稳；另一方面用来训练通用操作技能模型，让它的泛化能力越来越强。一个零数据-升级-更好操作-再升级的操作能力闭环就实现了。

最终能实现跨本体、跨任务、跨场景、跨平台的泛化能力。从本能演变成技能。

这正是橡木果技术路线的最长护城河。

全球范围内除了橡木果， Genesis AI 也曾展现出本能反应，但这背后依然是数据驱动的模型在支撑。与很多同行不同，他们将硬件视为整个系统的基石而非附属品。不过，硬件磨损带来的性能衰减和真实数据的天然局限性，仍是包括 Genesis AI 在内的所有具身智能公司需要共同攻克的行业难题。

而橡木果对数据和硬件的无依赖，使其每一次操作都是一次新的探索，每一次探索都在优化它的能力。使用时间越长，它见过的物体越多，操作就越熟练，泛化能力就越强。

这条路线目前已经在产业化进程中得到应用侧的“用脚投票”。橡木果已经和全球头部化妆品ODM厂商的产线完成POC验证。毕竟谁不想在自家产线里疯狂加购一个不需要部署成本，能灵活换产线、还越用越好用的机器人。

具身智能的本质就是对人类的一次解构重塑，如何破局、哪条技术路线可行，人类已经给出答案了，它就藏在你每一次的“下意识”。

2026 年 3 月，橡木果机器人完成近亿元种子轮融资，领投方包括钱塘资本、普华资本等知名投资机构。

该笔融资是资本市场对“本能驱动”这一非共识技术路线投下的一张信任票，也标志着资本开始从技术本源探索智能涌现，去找寻产业内真正能成为生产力革新的入局者。

不过，这张信任票投的也不仅仅是橡木果八年来的技术坚守，而是一家兼具硬核技术基因、深刻产业理解与清晰商业逻辑的产业级公司。在探索技术的过程中，橡木果也同步自研了视触觉传感器，并成功产品化，其硅胶弹性体加微型相机的路线，能做到不依赖敏感元器件，通过图像重构反演物理量。

透过橡木果的技术路线可见，其在做的是产业内最务实也是行之有效的操作能力。它的野心从来不是做一个“看起来很炫”的机器人，也不是要颠覆 VLA、世界模型等现有技术路线，而是要做整个具身智能产业的通用操作底座，以一种底层基础设施的形态，赋能所有硬件厂商、模型公司。

在橡木果的产业蓝图中，VLA 或世界模型和本能驱动不是非此即彼的竞争关系，而是双向奔赴的互补关系。橡木果擅长的是底层的物理交互与操作执行。两者的协同，能让机器人既有长程任务规划能力，更有每一次精准操作的稳妥。加速具身智能从单场景poc验证走向真正大规模市场化落地。未来，橡木果的本能驱动将渗透到每一个需要与物理世界交互的角落。

正如姜峣表示，“橡木果的长期目标，是成为全球具身智能领域不可或缺的底层基座。” 不追求成为什么都做的全能选手，而是专注于构建最底层、最关键的操作基石。

过去几年，具身智能行业一直在争论一个问题：通用机器人什么时候才能到来？有人说需要十年，有人说需要二十年。但橡木果用自己的实践给出了一个不同的答案：通用机器人不会一夜之间出现，它会先拥有操作本能，不依赖于数据，不限制硬件、任务，当「本能驱动」开始重构操作边界，大脑的能力也将更好的发挥。

这就是橡木果正在做的事情——它在造一次次完美的 "操作能力"。这个能力不会取代任何人，它只会让每一个机器人都变得更有用。而当千行百业的机器人都拥有了操作本能，具身智能的时代才真正开始。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.