![]()
10月16日,智元机器人发布新一代轮式底盘双臂机器人精灵G2,正式进入精密制造业。精密制造业,被视为测试机器人泛化能力和硬件极限的关键。
这场发布会,和去年智元一口气发布5款机器人相比,节奏有些放缓,更强调商业化落地。早在发布会召开前一周,智元就已经宣布获得龙旗科技数亿元订单。
这家成立不到3年的机器人公司,无论从全栈布局路线,还是收购一家上市公司上纬新材,一直都备受关注。它的快速布局以及资本估值高涨,也侧面反映了2025年中国具身智能领域的火热。
不过市场上仍然有不小的疑问:智元为什么要做全栈产品线,能忙得过来吗?现在的具身机器人离真正的商业化还有多久?
发布会结束后,智元合伙人、机器人研究院执行院长、具身业务部总裁姚卯青做了一次线上分享。分享是以群访的方式,持续了近100分钟,大多问题聚焦在商业化上,并坦诚、开放地回答了此前外界对智元及相关行业的质疑。
姚卯青毕业于清华大学电子工程系,曾在Waymo、蔚来汽车等智驾部门担任重要职务,更是见证了智驾行业的商业化落地过程。2024年,看好具身智能的他加入智元,担任具身研究院执行院长,负责AI技术开发及软件研发工作。
加入智元一年多来,姚卯青给外界的形象是工作狂、务实。他很忙,16日上午参加线上发布会,结束后接受媒体群访,群访完又立即赶去参加宁波投产仪式,日程被安排得满满的。尽管如此,在整个群访中他的声音平稳,表达清晰。
姚卯青告诉我们,智元做机器人、做模型,不担心会像AI六小龙错过2024年模型重大技术路线突破。客观原因是,具身智能和纯模型不一样,依赖于硬件的设计,质量和规模化部署带来的数据,所以不太会毫无征兆地出现可落地级别的重大突破。
智元机器人成立时间不算长,但研发团队已经接近上千人。这也能解释,智元于2024年6月决定研发具身智能大模型,到今年3月就推出了智元启元模型GO-1,非常神速。
智元启元模型GO-1更专注抓取、放置和转运等基础任务,而不是复杂场景,是因为在工业场景中,抓取和转运是高频核心任务。姚卯青说,评价模型的好坏不能仅凭任务复杂度评判。
今年下半年开始,多家机器人公司纷纷宣布拿到大额订单,目前已经公布的单笔金额最高达到5亿元。7月,智元和宇树共同拿到中国移动的1.24亿元订单,到10月9日智元再次获得数亿元龙旗科技订单。
智元机器人正加速在工业领域的布局。今8月,智元还发布灵犀X2-W,用于工业作业场景。这也意味着,智元机器人远征系列、精灵系列、灵犀系列三大产品线,均涉入工业化场景。
不过,智元的订单多来自合资方或者投资方。姚卯青解释称,智元获得订单来自投资方或者合作方的逻辑,是客户确实有明确的应用需求,有很大的热情,想要引入机器人产线,所以才会在投资或合资层面提前布局,智元“所有的财务审计是经得起推敲的”。但不排除,市场上确实有些厂商“左手倒右手”的现象。
以下是姚卯青针对腾讯深网、36氪、亿邦动力、财经杂志、南方都市报、第一财经、白鲸实验室等多家访谈,为了文本表达的流畅,在不改变原意的情况下,对话稍微做了删减、整合和改动:
01
经济账支出基本能够打平
问:10月9日,智元官宣拿到龙旗科技数亿订单,G2机器人能够解决客户传统场景中的什么痛点?
姚卯青:对他们来讲,最大的痛点是用工难题——人员稳定性。大家有机会的话,可以去车间实地探访,工作极其枯燥,甚至可以用压抑来形容。人是被高度机械化的,卡在固定的时间,重复执行一个动作数百遍,然后到点休息,几分钟后,再回到工位重复上述动作。
这样的工作很难吸引年轻人,所以流动性很大。另外,消费电子这种批量生产的产品,会对一致性的要求很严格。采用具身机器人的话,就是执行固定程序,不会像人一样有情绪,能很好保证产能和品质的一致性。
问:龙旗科技使用 G2后,相比之前工厂的机械臂,G2给工厂带来的投入回报率能提高多少?
姚卯青:从投入产出比上看,具身机器人的ROI不及现有的传统自动化产线。具身智能机器人,更多的是替代上述枯燥、重复性工作岗位。
一个工位,正常一天两班、三班倒,按照一名工人5、6千元工资计算,加上一些隐性福利,在长三角,两班工人两年的支出差不多也有30多万。而随着机器人规模化量产,成本不断优化。投入服役一两年的机器人,在支出上可以和一个工位上的两班倒,或者三班倒的场景持平。

智元精灵G2正在做物流分拣
问:G2发布会里边已经展示了很多场景落地,比如工业搬运、精密操作、物流分拣、商业导览等能力,但目前普遍能够实现ROI的场景不多,未来一年,具身智能可以在哪些地方实现真实场景落地?
姚卯青:今年,很多具身公司都在尝试做一些真实场景部署,未来一到两年还是有许多可以落地的场景。我们认为,首先工业场景是一个非常大的市场,在工业场景里面,仍然有一个不可忽略的现实,许多工厂存在用工挑战,因为工作的枯燥、重复性,很难吸引人,导致用工不稳定。
这里有很大的部署机会。另外,工厂是一个相对可控、任务明确的作业环境,也有利于机器人的部署。
除了工业场景,在服务类场景上机会也很大。比如安检、巡检,以及机器自主执行和远程操控相结合的场景,还有现在大家常看到的一些偏向人机交互的文娱场景,如展厅讲解、展馆导览等。这些已经非常接近落地状态。
问:目前工业场景上对具身机器人的真实需求是很多的,你们是如何研判选择一条对精细化操作,要求更严格的复杂消费电子领域的?
姚卯青:我们选择复杂消费电子领域,如智能手机、电脑组装,是基于市场调研和技术壁垒分析,该领域对精细化操作,如毫米级精度,要求极高,能充分体现具身机器人的技术优势,同时消费电子行业在自动化方面的需求也很旺盛。
问:你们研判在工业场景的落地上深度替代,会有一个什么样的过程?
姚卯青:在工业场景落地中,深度替代会经历一个渐进过程,先从辅助性任务如搬运、分拣开始,积累数据和用户信任;然后过渡到半自动化精密操作,如元件插接;最终实现全流程替代,这需要克服技术集成、成本优化和人员培训等挑战。
问:今年很多具身公司都宣布拿到大单,订单落地场景,除了智元的工业场景,哪些场景是更扎实?哪些场景可能会更虚一些?
姚卯青:我觉得从场景角度来看,全尺寸人形机器人去做一些高负载、持续续航和高节拍作业,这个场景的概念成分会多一些。如果真去实地调研这些行业,了解客户需求的话,应该就知道不太合适,因为这些机器人续航、稳定性、速度很难胜任工厂的高强度要求。
还有室外场景对人形机器人也有挑战,因为这类机器人防护等级不够,很难防尘,防水,但四足高防护等级机器人做巡检巡逻,我觉得是可以的。
人形机器人还是先做室内任务明确、简单的场景,比较切合实际。
02
G2不是为特定合作伙伴而设计
问:G2还没有发布,但是龙旗的订单已经下了,这是不是意味着G2是一个面向特定场景的偏定制化产品,它在研发和设计上有多大程度受到了合作伙伴的影响?
姚卯青:我可以稍作澄清,G2这款产品,完全是根据市场需要覆盖的场景而设计,不是为特定的合作伙伴或场景定制化的。它的设计初衷就是为了足够通用,所以会有非常大的冗余设计,可以自如地接入到各种各样的场景。
龙旗跟我们很早就有合作,早在今年3月,他参与了智元的融资,我们双方就有一个非常好的沟通。
问: 关于订单这一块,除了合作方龙旗科技,之前智元也宣布过好几笔订单,比如和富临精工成立合资公司,还有一些大额订单,本身就是智元的合作公司。外界可能因此怀疑这种大额订单的含金量,在具身智能早期,这种玩法是必要的吗?
姚卯青: 这个逻辑是相反的。不是说因为合资、投资的原因,才来采购智元的机器人,而是因为合作方确实需要买智元的机器人,看好我们,才愿意做一些投资或者合资层面的布局,其实是这样一个逻辑。
我们是一个非常合规正规化经营的公司,所有的财务审计都是经得起推敲的。
问:智元在宣布拿下龙旗订单的同时,有没有新的量产目标公布?
姚卯青:智元机器人今年的量产目标是数千台。
问:量产过程中可能遇到什么难点?
姚卯青:量产过程中,供应链保供确实是一个最大的难题,供应商的供应量以及产品良率,都还在爬升过程。我们迭代很快,两代产品,留给供应商去做打样、验证、打磨和迭代的窗口很短。
这涉及到很多问题,包括供应商的产能规划,以及它的供应商管理,很多质量和工艺的提升。我们会紧密陪伴所有供应商一起成长。
问:智元产品迭代快,给供应商窗口短,能否分享某个印象深刻的供应商案例?
姚卯青:比如我们的力控臂,供应商每一版的打样周期都很短,在上一版的测试还未完全结束,下一版的设计优化工作已经提前启动。
问:你能具体讲述一下,如何管理供应商的吗?
姚卯青:我们会有严格的供应商准入流程,对其从管理、品质、工艺、供应链等多角度打分,欠缺的地方也会明确提出改进项,然后要求在一定时间内完成整改。
满足我们的准入机制后,也会持续对它交付的零部件,进行严格测试,在良率上会提出严格标准。如果发现一个批次内,比如说良率低于多少,那就会触发一些惩罚措施。我们也会进行飞行检查,在没有预先知晓的情况下,突击去看各方面的管理和规范情况。
我们会细化到对他们技术人员方案里的代码,一行一行去跟他讲要怎么改。甚至是团队能力有限时,还会帮供应商引入外部的资源提升,这是我们日常都在干的事情。
问:能不能分享下智元的交付情况?
姚卯青:实际财务数字,因为相关原因不能完全披露。但是我们今年整个交付数量,相比去年有一个数量级增长,这还是1月到9月的数据。从应用场景上看,围绕着科研教育、交互服务以及工业领域,都有比较大额的一些客户订单交付。
03
不担心错过具身模型的“DeepSeek时刻”
问:智元和一些大模型公司有合作,你们自己也研发大模型,你们和合作的模型公司之间是怎么分工的?
姚卯青: 我们现在还是以自己研发为主,其实没有太多和外界耦合性的研发工作。
问:具身智能模型目前并没有权威的测评集,有些具身模型可能会推出展现机器人在复杂场景的能力,而智元今年3月推出的具身模型GO-1,更擅长抓取、放置和转运,有投资人因此判断说不够智能,外界如何理解模型的好坏?
姚卯青:具身模型的好坏不能仅凭任务复杂度评判,而应关注其可靠性、效率和泛化能力。在工业场景中,抓取和转运是高频核心任务,GO-1通过优化运动规划和物体识别,在这些任务上实现了高成功率和低延迟,这为更复杂场景奠定了基础。
外界理解模型好坏时,我觉得应该从任务成功率、能耗比、自适应学习速度,以及在不同环境的稳定性等多个维度评估。智元通过内部基准测试和客户试点数据验证GO-1,未来我们也会参与行业标准制定,以透明化模型性能。
问:智元推出全栈研究,全产品,难免会导致精力分散,如何规避陷入大模型厂商2024年错过重大技术路线关键突破的窘境?
姚卯青:主观上来说,我们会保持对技术的敏感性,密切关注全球主要技术团队、学术会议,以及预印网站上的最新成果。客观原因是,具身智能技术依赖于硬件的设计,质量和规模化部署带来的数据,不太会毫无征兆地出现可落地级别的重大突破。
问:现在各家都在提VLA模型路线,但包括Figure03的Helix,似乎都没有发生质变。自动驾驶领域也一样,各家汽车厂商都说用到VLA,但外界体感并不明显,你怎么看这种技术范式的变化?
姚卯青:我觉得可以稍微展开说一下,自动驾驶的新概念确实比较多。VLA 、世界模型和车上部署的系统关联度不是很大,它可能是在一些辅助性环节,偶尔能触发一下,但在实时执行系统环节,还是以原来的方案为主。因为执行实时性任务有算力的局限性,也不太可能直接使用VLA 或者世界模型。
回到机器人领域,也是一样。有各种现实原因,要一步步走,不能一口吃成胖子。可以先在一些较为可控、简单的作业环境里应用和落地,在真实环境里证明自己,而不是仅仅停留在demo的发布。
我们比较看重发布最新成果的同时,能够让这些成果应用到真实场景,产生订单,带来收入。
问:现在具身智能的模型做成熟任务成功率比较高,但是做没学过、没见过的任务成功率很低,成功率太低意味着什么事都做不了。目前提高泛化能力的难点是什么?
姚卯青:提高泛化能力的核心难点在于,数据稀缺、Sim2Real(将机器人在仿真环境中的学习,无缝衔接到真实世界)的差距,以及模型架构限制。
展开来说,一个是真实世界任务多样性极大,收集足够多且高质量的训练数据,成本高,耗时长。二是,因为物理世界有摩擦、光线变化,仿真环境无法完全复现物理世界的复杂性,导致模型在真实场景中表现下降。第三个原因是,当前模型多基于监督学习或强化学习,对未知任务的推理能力有限。
问:智元具身模型用的数据里,真机数据大概占多少?
姚卯青:真机数据基本上还是一个大头吧,90%以上,这和自动驾驶倒是比较像的。实际落地智驾车厂也好,供应商方案也好,基本都是98%以上的真实数据,再配少量的仿真数据。
04
G2的升级和海外布局
问:精灵G2的宣传片,有展示它在博物馆的交互场景,之前远征 A2也在做交互场景,这两条产品线的定位会不会有点冲突。
姚卯青: 取决于客户的需求,有些客户喜欢双足的,觉得外形上拟人化更重要,那他可以选择我们的双足机器人。有一些对于它的稳定性续航和运行速度比较看重,就会选择轮式的机器人,这都是根据不同的客户需求,我们来去尽量覆盖。
问:今年以来,许多机器人公司都宣布进军工业场景,G2的独特性是什么?
姚卯青:因为工业产线上的交付,是要求机器人必须按照工业级的标准来打造。对G2而言,工业级是底线,很多环节和零部件的测试和下线都是按照车规级的标准做的,这会保证G2的稳定性和一致性。稳定性差,可能会突然造成产线突然停产,带来巨大经济损失。
第二个是工业领域场景操作上,G2配备了力控臂,是全球第一款搭载了七个自由度力控臂的人形机器人产品。在续航和补能要求也很高,不能运行一个小时,充电几个小时。
![]()
G1和G2对比
所以G2支持自主回充,没电了它自己会回充电桩充电。如果对补能要求严格的,还支持换电,做到在作业的过程中,不用停机就可以热插拔换电。我相信全球来讲,人形机器人产业,最后都会按照车和其他工业品的方式和标准来进行大规模生产。
问:G2相比G1上半身改动比较大,为什么要做出这样的改变?
姚卯青:这一次G2做重大的升级和改进,是基于G1落地后,在实际部署过程中发现的一些问题去做的升级,比如说机械臂用了力控,每个单关节都有力矩传感可以组合控制。这比较有利于工业的插接类场景,需要柔性控制的场景,就是可以在抓取、拿捏物体时,力度更灵活。
其次在腕部的第六第七关节的构型设计上也做了优化,使其更像人类,可以更灵活的进入狭小空间。比如超市上货时,货架之间的距离很挤,每一层空间也很有限,需要一个很灵活很短的手腕,帮你快速执行任务。
腰腿部也由原来的一个自由度,加到了三个自由度,平面旋转时可以实现前后弯腰和左右摇摆,不用依赖底盘的旋转就可实现。
问:G2相比G1 带给客户最直接变化和影响是什么?
姚卯青:效率就更高了,更灵活,允许更高速的完成一些动作,比如说底盘原来也不能横向移动,它需要转90度移动再转回来。现在它可以直接蟹形移动,甚至腰可以直接转180度,都不用转动底盘。
客户的层面来讲,整个生产节拍会提上来,更接近人的节奏。原来可能部署两台机器人才能干完的活,现在一台就能干完。
因为产品更稳定了,就减少了一些停线造成的损失,以及整个运维维修等售后成本,这些我觉得对于部署落地工业场景非常关键。
问:今年夏天在WAIC上,你说到智元在海外有一些规划和布局,是要进军海外市场吗?
姚卯青:海外是我们非常重视的市场,一个原因是,海外用工成本和用工难度,相比于中国来讲挑战更大。一些发达国家老龄化水平低,出生率也在严重影响着劳动人口的基数。
所以在这些市场里面,需求很明确,整体定价空间,以及我们最终能实现的利润率,也是比较友好的。今年已经开始在全球进行一些布局,包括在全球一些经销网络的建设,明年我们会期望能够在海外这块收入,达到公司整体收入的30%,甚至更多的一个比例。
问:短期就有在海外布局的计划吗?
姚卯青:有的,现在已经收到很多海外客户的需求。我们会在国内对产品进行一段时间的测试,保证一个很好的稳定性和可维护性,在低成本售后的支持情况下,会开启这些海外需求的一个交付过程。
其次是直销,我们也有一些渠道,依托我们的G2机器人,在他们的场景、品牌和市场下做一些定制化。然后联合推广这两个方向,现在正非常快速地推进中。
撰文 |刘培
编辑|八尺
「白鲸实验室」原创文章
转载、交流、合作请添加微信:liujiaquan2025
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.