网易首页 > 网易号 > 正文 申请入驻

直击人形机器人在工厂「打工」的 3 小时|对话智元机器人

0
分享至

商业漫谈

Jane's interview

机器人的「犹豫」和停顿,

恰恰是具身智能发展的标志。

文 | 卫诗婕

对话嘉宾:

王闯(智元机器人 通用产品线总裁)

杨曾(安努智能 工程算法总监)

邓扬 (富临精工 创新生产部负责人)

刚刚在上海举行的 waic 盛况空前,其中最受瞩目的就是机器人大乱斗。

这就不得不讲一个有趣的小故事:2024 的上海 waic ,主办方曾试图召集起几十家做人形机器人的公司,希望让人形机器人走个方阵——但当时只有两家机器人能支持长时间行走。转眼,2025 年的人形机器人走上了春晚跳舞,不仅如此,机器人还能跑马拉松、打鼓、写书法、甚至进工厂打工……

人形机器人能力飞跃的背后,其实有三点强支撑:

首先是深度学习,大模型的能力令机器人的力控突破了去年的瓶颈。

其次是公众注意力带来的舆论热度,资本也在今年快速涌入这个赛道,人形机器人行业的热度达到新高。

除此之外,也得益于产业链里极个别的头部公司团结在一起——过程中,人形机器人产业上游的供应链雏形被打造出来,中游的机器人集成商生长出来,最终催生了机器人落地到工厂的商用元年。

七月初,我在四川绵阳,主持了智元机器人全球首次工业场景作业的直播,也组织对话了一场圆桌,圆桌上的三位嘉宾,分别来自产业上下游的不同身位,他们的合作,恰好是因为相信同一种未来而拥抱在一起、进行贴身配合的典型案例。

那场发布会的主角,是一台名叫A2W 的轮式类人型工业级机器人。它的本体研发,是由最近在二级市场大热的明星人形机器人公司——智元所打造,经由另一家明星创业公司安努智能所部署,最终落地到汽零龙头上市公司富临精工的工厂内。

这场发布会,聚齐了上游本体研发公司、中游真机数据采集-工程化落地部署商、和下游工业领域的应用客户。其中,安努智能还接受了来自智元和富临精工的投资,本身就是产业上下游合力的一个产物。

在富临精工的绵阳工厂内,我和上述三家公司的代表——智元通用产品线总裁王闯、安努智能高级算法总监杨曾以及富临精工创新生产部负责人邓扬,进行了一场 3 小时的圆桌访谈。

(发布会现场,富临精工绵阳工厂内。从左至右分别为:卫诗婕、王闯、邓扬、杨曾。)

事实上,在这场发布会之前,我和身边看具身智能的投资人朋友曾反复讨论:大模型背后的深度学习能力,在今天的工业机器人领域,到底有多深的运用?后者在去年底悲观地告诉我,产业里几乎没有运用。这也一度让我对这场发布会产生许多怀疑和疑惑。

但最终,我们用三小时完整记录了一个通用具身机器人进入工厂作业的全过程。事实上,这个项目也才仅仅跑了半年。

在具身智能爆火的 2025,这期内容能够非常通俗地解释清楚:

为什么 2025,人形机器人爆火?

过去一年内,具身智能行业经历了怎样的发展?

什么是真 · 人形机器人?

大模型如何成为机器人的灵魂,具身智能如何走进工厂?

而对于业内人士来说,这期访谈中也有大量有价值的信息:比如来自最前线的应用情形、客户体验和一手的产业访谈。

我在去年11月曾经访谈过华为云 CTO 张宇昕(),他曾提到过,中国产业的丰富度和成熟度,是全球领先。华为认为,中国特色的 AI 道路,一定是与产业紧密结合。

两期内容组合,能够拼凑出一幅颗粒度更细的 AI 产业应用图。

以下为访谈节选,为方便阅读,作者进行了文本优化。

(完整版请观看视频版或收听播客版)

(️视频版可前往B站,播客版可前往小宇宙、苹果 Podcast 等,搜索同名账号《卫诗婕 商业漫谈Jane's talk》)

由于访谈全文较长(共 10745 字),可先参考目录:

1.2025,人形机器人为什么这么火?

去年waic,只有两家人形机器人能长时间行走

今年人形突飞猛进

机器人量产困难详解:供应链、技术、一致性

2.到底什么是具身智能?人形机器人究竟如何定义?

自动驾驶进入深水区,人才流向机器人领域

黄仁勋定义的具身智能:无人车、无人机、机器狗、人形机器人

什么是真·人形机器人?

3.智元的2024-2025: 从量产元年,到商业元年

机器人一天写130幅书法,手没有抽筋

人形的大规模亮相,给了客户信心

从量产到部署,要经历一个怎样的过程?

机器人集成部署的市场空间有多大?

智元 A2W,为什么选了一个「看着简单」的场景?

4.「机器人看起来效率慢了,其实是更聪明了」

算上人类工人吃饭休息的时间,机器人的效率快要追平了

通用机器人,和过去的工业级机器人有什么区别?

机器人的停顿,恰恰是具身智能发展的标志

5.真机数据为什么宝贵?那是制造业的壁垒

详解一台通用机器人部署到工厂的过程

采集的数据究竟是什么数据?

这些数据被用以训练什么样的模型?

智元工业落地的技术路线选择

6.未来三年内,机器人成本可能下降超50%

富临精工:我们需要打造一个人机交互的智慧工厂

高中毕业进厂打工的工人 VS 大学毕业进厂打工的工人

搭建一张场景天梯图

机器人未来三年内成本下降50%? 「我觉得保守了」

Jane's interview

01

2025,

人形机器人为什么这么火?

最新的AI能力加持了机器人的运控

卫诗婕:为什么 2025 年人形机器人这么火?

王闯 :几方面的原因。首先是 2025 的春晚(宇树机器人表演跳舞),让普通的老百姓真正看见了机器人的能力,普及度大大增强。第二也是很重要的,像智元这样的头部企业,我们和产业链的合作伙伴们一起,在 2024 年做到了人形机器人量产,并在 2025 年做到了商用部署,这是整个行业的一个共同进步。

第三,可能也是最重要的一点,AI 能力的演进——强化学习,极强地加持了机器人的控制力。也许你们不相信,2024 年上海举办 waic ,当时主办方召集了近 20 家做人形机器人的公司一起,希望人形机器人能列队走一个方阵。但当时,能真正长时间行走的只有两家(智元是其中之一),这个细节能够看出,截止到去年夏天,人形机器人整体的能力状态。但是 2025 年,我们看到了机器人跑马拉松、跳舞、格斗、表演……这背后其实是最新的 AI 能力加持了机器人的运控。

(智元研发的工业级机器人A2W,和人形机器人远征A2)

卫诗婕:机器人量产为什么这么困难?

王闯:人形机器人是个前沿方向, 它背后的产业链是相当不成熟的。比如人形机器人要用到的电关节——和过去传统工业机械臂所用到的关节很不一样:人形机器人对于关节的扭矩密度、减重、噪音要求都比较高,这些零件做不好,本体就无法有很强的稳定性;上游供应链里做的人少,人形机器人的出货量少,零部件价格就贵,一套下来就是负循环。

智元去年一个很大的主题,就是和供应链上下游伙伴们一起,打磨人形机器人零部件的成本和可靠性。先让供应链成熟起来。

再往下走,还有生产一致性的问题。比如像远征 A2(智元的人形机器人)——它有44个自由度。自由度越高,机器人能做的事情就越多,但其构造和所需零部件的精密程度也就越复杂。如此复杂的硬件加上智能化的要求,对生产一致性提出了很高的要求。整个生产过程中,对于检验和控制的要求都非常高。

打个比方:哪怕只是上肢的一点点误差,传导到末端,误差就会变得很大。如何通过本体和算法的统一设计,让机器人能够实现通用化的智能,需要很高的生产一致性。

还有一点,当把机器人生产出来后,如何用一套代码、一个模型,让所有的机器人都拥有几乎一致的性能。在汽车领域,这还相对好做。但是在人形机器人领域,这套算法需要我们自己从0到1 开发出来。去年年底的时候,我们的研发累计有 100 人左右就住在工厂,包括我自己。从去年到现在,光测试消耗的就有上百台机器人了。

去年是智元量产最艰难的一个冲刺阶段,我们可以看到到 2025,产线就已经跑得比较稳定了。智元走过的这条路,相信对整个行业有很大贡献。

邓扬 :我从零部件供应商的角度,也讲一讲,造人形机器人的电关节有多么难吧。

富临精工是一家汽车零部件供应商,但从2023年开始,我们也开始研发电关节,相当于我们的第二增长曲线。总结下来,造人形机器人的电关节有几个难点:

要追求电关节的高负载——说通俗一点就是,让关节越来越轻的同时,也让它越来越有力,让机器人有更大的力气。这就需要扭矩密度、功率密度这些维度数据的提升,这是第一个难点。

要追求机器人的应用,随着以后更多场景的开放,对于零部件关节的精度要求会越来越高。所以在设计和制造过程中,就需要一个输入和输出的闭环控制,这涉及到编码器的一些设计,从设计上也是一个难点。

在工厂应用,决定了机器人和其零部件需要有比较长的寿命这就要求关节要耐久。从材料的选型到制造的加工密度,都需要重新定。

Jane's interview

02

什么是真正的具身智能?

人形机器人不一定长得像人,

但得像人一样思考

卫诗婕 :邓主任的发言透露了一点,汽车领域的供应链有向人形机器人行业转移的现象,汽车领域的人才是否也是

杨曾博士 :是的。我在 2011 年加入了一家美资的 TIER 1,叫哈曼。在哈曼,我和团队一起开发出了当时哈曼历史上第一款可路测的 L3 的原型车。所谓智能汽车,其实也是一种机器人,但它对物理世界的影响是有限的,汽车只能在路上开,没有手臂,其实无法进入更多人的生活空间。

随着智驾进入深水区,这个行业的技术和产品已经趋于成熟,L2++已经开始大规模地商用化。L3 也在量产前夜,但这两年车市不是特别好,所以自动驾驶相关人才也会有一个溢出效应,会渐渐流向较热的具身智能领域。我也是其中之一,就这样加入了安努智能。

卫诗婕 :这是否意味着,具身智能领域将会增强很多算法方面的人才?

杨曾博士:是的。

卫诗婕 :先定义一下什么是具身智能?

杨曾博士 :根据英伟达黄仁勋的定义,截至目前,具身智能有四种形态:无人车、无人机、机器狗、人形机器人。其实这四种都是AI 加上一个身体。只不过身体会针对不同应用场景发生一些变化。

(智元研发的工业级机器人远征A2W,正在工厂内搬运料箱。)

卫诗婕 :A2W 能够算作人形机器人吗?

王闯 :通常人们认为机器人有两条腿的,才叫人形机器人,但其实 A2W 只是把腿变成了轮子——所以称之为轮式机器人。为什么变成轮子?因为工厂的地面平整,轮式又静音、效率又高,但是 A2W 的上半身其实跟 A2 一样,都是七个自由度的双臂。它也可以用夹爪,也可以用灵巧手,所以我们认为它也是人形机器人的一种。

卫诗婕 :人形机器人未必要长得像人形才能算,我认为标准在于它是否能像人一样去思考、辨别、决策、行动

王闯 :对。

卫诗婕 :为什么人形机器人是未来?这似乎很有争议——并非所有人都看好人形机器人是未来。

王闯:双足机器人跟人类的形态非常非常的像,如果它生活在人类生活的环境中,这就意味着,人类环境里所有的物理设施它都可以直接去用,比如说桌椅的高度、货架等,全部都是为人设计的,机器人自然而然就够得着,而无需对物理环境做任何的改造。且人类对于类人形的机器人,可能亲近感更强。

但机器人未必要是双足的,比如轮式更适合工厂,那么制造机器人的本体公司未必一定要做哪种形态。应该结合应用场景的需求去做改造。

智元希望做出通用的机器人,针对不同的场景,无需再去重新设计本体,无需再去改它的硬件。用一套模型能干很多不同的事情。这是我们想做的。

Jane's interview

03

智元的2025:

从量产元年,到商用元年

机器人部署,也能养出上市公司

卫诗婕:为什么 2024 是智元的量产元年,2025 就一跃进入了商用元年?

王闯 :其实上半年我们已经有不少的出货了,有一些客户想到的场景我们自己都没有想到,比如有一个客户开业,用好几台机器人一起敲鼓,还有不久前的 MWC 中国通讯峰会上,我们智元的机器人可以写书法,真的,他写的书法比我写得还要好,他一天写了 130 多幅书法, 手都没有抽筋,表现出了非常高的稳定性。机器人大规模的亮相和使用,也让客户越来越坚定信心,也让我们的上下游供应链伙伴坚定了信心。

今年是一个非常好的开始,2025 年,我们真正把有思考能力的机器人——也就是具身智能,带到客户的现场去。

卫诗婕 :是否要感谢这股深度学习的浪潮?

王闯 :对。机器人的交互突飞猛进,得益于大模型的加持。去年量产,今年商用,这样的速度是不可思议的。

卫诗婕 :从量产完成到真正部署到客户的工厂,要经过一个怎样的过程?

王闯:像智元这样的本体公司擅长做基座的能力、通用的算法,但是完成研发后,机器人到工厂实际部署的时候,会遇到很多挑战,其中的调试工作量很大,需要有人持续去提升机器人的能力,那些异常的数据也需要有人收集回来——所以,我们需要合作伙伴——安努智能这样的机器人集成供应商,会负责把机器人真正部署到甲方客户的工厂里。

卫诗婕:安努智能是专门做机器人部署的集成供应商吗?

杨曾博士 :是的。我们是一家人形机器人工程化量产落地的领先供应商。我们的股东里还包含巨星新材料,它是中国永磁体最大产能的企业。部署机器人这样的项目中的核心,主要基于智元对于本体底层的核心算法,加上安努智能定义的标杆流程和交付。

卫诗婕 :机器人的集成部署有多大的市场?能养出一个上市公司吗?

杨曾博士 :如果只单看协作式机器人的话,(集成商)上市公司里面已经有克来机电,江苏北人,他们的业务中有约70%都是基于系统集成,所以可以预见,具身智能的机器人部署,空间会更大,类似的公司会更多。

用一个金字塔形容,像智元这样优秀的本体公司可能有几个,安努这样的系统集成商可以有几百上千个,一起服务像富临精工这样几十万的工业领域生产者。

卫诗婕 :所以安努本身是产业上下游共同拥抱未来的一个产物?

邓扬:是的。

卫诗婕:智元和富临精工都投资了安努智能,你们三方是如何走到一起的?

邓扬 :富临精工是做大批量生产制造的企业,我们对场景的认知深度肯定更深刻。我们天天与我们的产品、机器设备、员工打交道。可我们没那么懂机器人本体的技术,但又想拥抱最新的机器人技术,所以我们先和智元碰到了一起。我们双方都发现,在研发后到落地的过程中,有一系列复杂的工作需要做,这需要专业的集成商,所以我们和智元都愿意投资安努智能——这样我们三方可以各自发挥优势,加速这件事的推进。

卫诗婕 :为什么最终选了料箱转运——这个场景似乎看起来很简单?

王闯 :A2W一开始就瞄准工业。我们团队心气比较高,一开始我们锁定了很多场景,并且想选其中最难的场景,准备大干一场。

我们最初想做一个场景叫「喷粉上下挂」,指的是建筑行业有很多五金零件,比如门的合叶,很多锁扣、锁芯、把手,需要工人把一个个零件挂到一个个挂钩上,有点类似超市的货架。这个场景里有1000+个零件,每个零件形状不同,要挂的位置也不同。最难的零件是一个五毫米的螺丝孔,要挂到一个三毫米粗的钩子上,这意味着机械臂去挂的时候容错空间只有两毫米。整个研发做了很久后,我们发现这个场景的标准化很差,精度要求高,技术的挑战很大。

后来我们又去探索了一个场景叫「阳极氧化上下料」,大概就是有一根长长的杆,还有许多弹簧,像是一个个戒指,后来我才知道那是手机摄像头的那个金属环。得把这些金属环挂到杆子上的挂钩上。后来我们发现,这个场景的一致性也很差——因为这些金属环都是手焊的,在阳极氧化环境里用久了都会有形变,所以每个环的形状不同,每个卡扣的松紧程度也不同。

经历了这两段尝试后,我们发现有些场景看似酷炫,实际上还不到技术去挑战这个场景的时机。最终我们选择做料箱转运,因为这是客户需求呼声最高的场景之一,同时技术也能达到。那就先从这个场景开始打穿、做深。

后来我们就和安努一起,在富临精工落地 A2W。这个项目全程三个多月时间,我们把最初 160 秒的搬运速度,做到了 40 秒。也逐渐做出了避障、泛化性。今天为什么做这个直播,就是想把阶段性的成果分享给全行业和公众,同时,我们的心态是开放的,技术还需要演进,也还存在不完美,但这很正常。

Jane's interview

04

思考过程,

正是具身智能发展的一个标志

看起来是机器人变慢了,

实际上是变聪明了

卫诗婕 A2W 落到车间之后,真正的使用感受是什么样子的?

邓扬 :目前来看, A2W 做搬运料箱,虽然节拍还没有达到人的速度,搬的没有那么快,但是有一个好处,是它可以24小时作业。它支持换电,算上人类吃饭休息的时间,它的效率几乎可以追平人类了。当然,后面有机会能把节拍做得更快。

有两方面我印象比较深刻:一个是感知避障,另一个是异常环境下,它会自动纠错,保证作业不中断。

但还是想讲一下我们工厂所面临的现实问题:工厂还是追求效益的,目前,机器人的成本压力还是比较大。因为目前一台机器人得几十万(元),所以,我们肯定希望机器人的节拍能够更加优化——现在是40秒搬一个箱子,再提升 10 秒的话,和人(搬箱子的效率)就差不多了。另一方面,我们公司现在有一个团队为机器人服务,再加上能耗,这些都是成本。

第二,我比较关心负载,目前机器人能够做到负载15公斤(王闯补充:双臂负重是25公斤),如果能做到30公斤,那我车间的活它就包圆了。

还有一点我关心的,如果机器人作业能更深入挖掘其他场景的价值,比如不止搬运料箱,还能运送物料、拣选、码垛,那整个工程的产线就都可以优化了。

王闯 :邓主任说得很好。首先,节拍优化到30秒是完全有可能。这只是开始。另外,不同的场景任务也在我们的规划中。智元在强化学习、模仿学习、数据驱动、端到端,都在布局。

我们认为工厂里有几个比较典型的场景,一个是料箱上下料,其次各种各样的分拣,还有一类是组装,这几个场景都很大,我们之所以选择料箱作为第一个落地的场景,是因为技术已经完全满足,这个场景的规模也够。有了大规模应用后,成本一定能下降到比较满意的程度。

卫诗婕 :A2W 这一批新型的人形机器人,跟过去的工业级机器人这些有什么区别

王闯:复合机械臂是固定编程,设定好程序后,它的节拍可以很高。但是 A2W 是被我们定义为用于柔性制造的通用机器人,我们希望它今天能干这个,明天能干那个,做什么事情都能自己学习、并闭环。同样一个本体,在不同场景中应用的时候,我们不需要在硬件上再进行额外的改造。

另外,通用性的机器人能自动识别环境异常并纠错,传统的复合工业机械臂做不到。举个例子,比如说如果工人码垛码得不是那么整齐,又或是料箱的颜色错了、又或是料架位置摆放得有点偏移,在等等的意外场景中,A2W 这样的通用机器人都能自己察觉到、并纠错、做出调整。

在我们今天的泛化性任务测试中可以看到,机器人在搬运料箱时发现缺了一个料箱,它先是「愣」了一下,那是在思考,随后他开始四处找寻这个缺失的料箱——就是用它「头部」的那个摄像头在到处扫描,直到找到那只被放错位置的料箱,然后他会开始思考计算——在什么位置搬、怎么搬最顺利,然后它才会移动到那只料箱的旁边,继续搬运。

这些都是复合机械臂做不了的。而这就是泛化性。

卫诗婕:目前料箱搬运这个场景,复合机械臂是不是也能做?而且似乎能做得比A2W这个通用机器人快?

王闯:料箱转运这个场景,目前复合机械臂确实也能做。但我刚才讲了,传统的机械臂没法像 A2W 那样,像人一样去思考。

卫诗婕:复合机械臂设定好程序后,能搬得很快,我们通常会以为它比较智能。但泛化性强的通用机器人的迟疑,停顿和思考,其实恰恰是智能的体现

王闯:没错,机器人中间那个思考过程正是具身智能发展的一个标志。具身智能,和以前的手机、汽车、互联网不同,这些科技都是工具,但是具身智能是人类的伙伴。但是这个伙伴现在还是个小孩,能力有限,目前有些情况它暂时处理不了,但是它已经能够帮人类处理一些重复、枯燥的事情。比如搬运料箱,一个箱子10公斤,如果让一个人一天搬800个箱子,很多工人会觉得很累,但是机器人能做。

(机器人创新背后的程序员们。)

Jane's interview

05

真机数据为什么宝贵?

那是制造业的壁垒

机器人进工厂,

必须做到准确率99.9%

卫诗婕 :要把 A2W 这样的机器人部署到工厂,过程是什么样的?会有哪些难点?

杨曾博士 :分成几步。

1. 首先要做现场的适配,对机器人工作的环境做一个地图的构建,其实就类似于——我们买了一台扫地机器人回家,得先完成地图建模。

2. 下一步,我们要对场景里重要的检测目标,比如料箱上的上料口,做视觉的注册。

3. 再进一步,就是要去优化末端执行器,比如加个夹爪,使它能够适应料箱的重量、宽度和抓取形态。

4. 之后通信也要打通。比如料箱运完了,需要提前通知物流部门,把空的托盘运走,再把满的运过来。

5. 之后两步都是比较耗时的工作,第一是要对节拍进行长期的优化,让机器人越干越快,这个过程我们要看如何优化整个机器人的工作流程,让它的动作可以尽量并行化——比如边移动边伸手抓取。第二要优化视觉模型,让机器人足够精确。

6. 最后,我们要做压力测试。针对真是工厂场景中的实际工况,做测试。这个过程会冒出很多很多的问题来。

卫诗婕 :机器人的部署周期一般会控制在多久?

杨曾博士 :由于富临精工这个项目是首次,我们花了三个多月。之后随着越来越多真机部署的数据被采集,模型和流程都会被优化,后面的客户和场景都有机会被提升效率。数据越采越多,这些数据用来反哺到一些集成经验或者甚至是本体的大脑,使得机器人的智能能力越来越上升,那么它在真实落地遇到的挑战就会越来越少,或者说我们解决挑战的周期就会越缩越短,它会形成一个正向循环。

卫诗婕:所以安努未来可能也成为一家做机器人大脑的公司吗?

杨曾博士:是的。

卫诗婕 :你们所说的「采集数据」,到底是什么数据?

王闯 :大概有四个部分,分别跟随机器人搬运料箱的四个步骤。

第一部分数据是识别千千万万种料箱——也就是作业的客体的数据;

第二个部分是操作数据,料箱很低的时候,机器人的腰是要弯下去的,不同箱子的抓取方式也不同,如何抓取式最优解——这些都是操作数据。和人一样,搬多了,就会了。

第三类是针对移动场景的环境数据,通俗讲,就要收集许多不同的地图。比如我们有个客户装修是黑色的,再比如各式奇怪的场景,有玻璃、围栏,或者场景经常变化,这些环境数据也是非常重要的。

第四类是放置数据,就是所有的作业最终指向一个怎样的场景,这也需要采集很多很多数据。

这四个方向的数据如果都能采集好,就有很大机会利用数据提升具身智能的能力。最终可能能够让客户很快地部署好心场景。就好比机器人碰到新场景时,内心会认为我早就见过了,不需要你再教我,我已经会了。

卫诗婕 :这些数据都是多模态数据,对吗?

王闯:是的。真机数据为什么宝贵?因为真机数据积累得足够多之后,它可以推测出一个工业现场的一个世界模型,这很宝贵,因为很多工厂的数据是很难采集到的。

卫诗婕:为什么?

邓扬 :对于制造业来说,很多工艺数据和核心参数,都是保密的,因为这是花很多年摸索出来的,这也是制造业的核心竞争力和壁垒。

卫诗婕:那么这些数据被用来训练一个什么样的模型?

王闯:还是从几个方面。第一方面是我刚才说的,收集很多料箱的数据,我们想把这个识别模型做得更准确。比如一个人站在100米外,这是自动驾驶领域里比较关心的,但是机器人关心的是,我看到了这个料箱,这个料箱离我有几十厘米,机器人把手伸出去,末端位置应该在哪里?抓哪里可以抓得比较紧,另一只手要如何协作?这些都需要识别,并让结果更精确。这就需要模型的精度更高。

第二方面类似于小脑:区别于传统机械臂或复合机器人,通用机器人搬一个箱子是全身控制——它看到一个低一些的箱子,知道手够不着了,就会把身体降下去;看到一个远处的箱子,它会规划说身体要前倾,利用多个自由度的全身协同控制。这种协同规划,也是模型重点的一部分。

卫诗婕:你刚才提到,最初 A2W 搬一个箱子需要 160 秒,目前训练到 40 秒,从 160 秒压缩到 40 秒,靠的是从实际场景中采集的数据吗?

王闯 :对。我们之前做过四种料箱,最开始时间更长,搬一个箱子需要 200 多秒。当我们做了这四种料箱后,发现这些积累的数据还挺有用的,在长时间测试里采集的各种各样的情形,比如不同关系的环境、不同箱子的颜色、位置、形状等等,在仿真环境里也做了各种各样的调整,我们先把真实环境中采集的数据输入到模型,再去采真机的数据去强化模型的能力。最终发现能力迭代得就很快。

卫诗婕:你们当下使用的技术是 VLA (Vision-Language-Action,视觉语言动作模型)吗?

王闯 :现在不算是 VLA,VLA 智元已经研究一段时间了。它的优势是对于不同场景的泛化性较强,可能比较适合超市场景,针对很多种不同零食能够抓取放到袋子里。但是劣势在于,对于工业场景来说,它并不能把某一项维度能力做到非常高。当然现在也有一些技术路线是用一些强化学习或者说垂直领域训练,来把成功率拉高,针对某一个特定场景去优化。但是这些对于工业场景来说仍然是不够的。90% 成功率对于工业客户来说,他们是不会满意的,他们必须要求成功率做到99.9%,这没什么商量余地,否则进不了工厂。

智元的思考是,为了率先实现工厂落地,我们认为当下用小参数模型+规则驱动+数据训练的方式,是更适合工业落地的。自动驾驶也一样,最开始用的是CNN,后面发展出了Bev、Transformer,使得它的全局视野就更好了;再之后就出现了occupancy 三维的避障,直至进化出端到端。

我们并不总是寻求非要用最先进、当下最前沿的技术去落地,而是希望交付给客户最好的效果。

卫诗婕 :有人认为,一个应届毕业生可能就几千块钱的月薪,而机器人售价几十万,二者能做的事情是一样的。

邓扬 :我们工厂并不是这样去思考的。我们公司所有基地加在一起,共超过5000名员工。我们首先想的是如何用机器人把繁重的体力劳动的活先干了,这样人就有更多时间去管理设备和机器人,这样的岗位不是随便什么人都能做的,他必须有他知识和经验的积累。这类岗位未来收入也会越来越高。

另外,我们更希望营造一个人机交互的智慧工厂。这是面向未来的。因为在未来,随着人口结构的变化,可以预见到会有人力缺口,我们也希望能布局未来。

卫诗婕:传统工业机器人 VS 通用机器人,可能就像高中毕业就进厂打工的人 VS 大学毕业生进厂打工。虽然看起来,前者目前比后者干活熟练且更快,但长远来看,具有更多通识+专业训练的人可能未来会学得更快。这是泛化性的潜力。

王闯:对,就是这样。

卫诗婕 :刚才的谈话中, 邓扬提到了目前已经筛选出四十多个场景等待机器人去攻破,王闯也提到了几个 benchmark,比如自由度和精度。工业中的场景成百上千,海量场景中如果要排列优先级,肯定需要一些 benchmark 来衡量不同场景的难度、和技术的适配性、所能带来的效益等。你们会用什么样的 benchmark 来排序这四十多个场景?

王闯 :以前组装电脑时,爱好者们会选择CPU和显卡,有一个CPU性能天梯图。我们现在就是想收集足够多的场景,去搭一个场景落地难易度的天梯图。

CPU 的天梯图想到简单,谁的跑分高,功耗有优势就排序高。但是机器人相对复杂,需要一个多维度的天梯图。

可能我们最终并不是看某一项单项维度,而是综合判断。比如今天手臂的自主闭环能实现的精度是正负五毫米,那要求精度在 5 毫米以内的场景我就先把它放一边,今年就先不做,等着技术的突破或新的零部件面世时,再做。

最后很可能是客户圈出场景,我们来分析是否可行,又或者客户要做某些场景,有可行性,那大家一起干。

卫诗婕 : 今天因为时间所限,没有办法再深入的一个关键点是,在去定义场景和定义机器人能力上限的过程中,到底有多少用到所谓的通用智能的泛化能力?不会是开着跑车送外卖吧?

王闯 :当然,如果成本没有优势,性能表现没有优势,是不可能上量的,也不可能真正商业化。

卫诗婕 :当下技术白天鹅不停出现——原本行业需要 3-5 年才能做成的事,或许在技术突破下,半年内就能做了。虽然很容易被打脸,但还是想请各位预言一下,未来1-3年通用机器人落地的速度?

杨曾博士 :工业领域里,模型突破可能还需要一些时间。安努会重点基于现有资源向更多场景和客户去拓展。过程中收集好数据,等待着模型突破的那一天。

邓扬:作为电关节的供应商之一,我觉得产业里会非常关注成本这个问题。不知道未来三年内,通用机器人的成本有没有可能下降50%?

王闯 :我觉得保守了,绝对保守了。

邓扬 :如果成本真的能下降 50%,即使模型训练还没有那么完美,我相信也有更多客户愿意尝试接受新鲜事物,也更愿意去推动整个人形机器人商业落地。成本是一个核心条件。

欢迎关注我的B站账号、播客账号和小红书、视频号

播客更新

互动问题

欢迎留言交流你对当下资本环境与中概股的看法,

感谢

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
嫣然回应陈光标捐千万!钱已收到,但无法解决租金,律师再曝猛料

嫣然回应陈光标捐千万!钱已收到,但无法解决租金,律师再曝猛料

云景侃记
2026-04-08 20:03:45
知情人士称若以色列持续袭击黎巴嫩 伊朗将考虑退出停火协议

知情人士称若以色列持续袭击黎巴嫩 伊朗将考虑退出停火协议

财联社
2026-04-08 22:52:05
断更三年!潘石屹突然发声:我命由我

断更三年!潘石屹突然发声:我命由我

新浪财经
2026-04-07 22:44:05
原江苏省卫生和计划生育委员会党组成员、副主任汪华被查

原江苏省卫生和计划生育委员会党组成员、副主任汪华被查

扬子晚报
2026-04-08 17:33:53
郑丽文一走,岛内立刻大乱,民进党疯狂抹黑,关键时刻洪秀柱出手

郑丽文一走,岛内立刻大乱,民进党疯狂抹黑,关键时刻洪秀柱出手

策略述
2026-04-08 18:16:38
CBA宁波外援贝兹利比赛中与队友发生冲突,赛后直接被开除

CBA宁波外援贝兹利比赛中与队友发生冲突,赛后直接被开除

懂球帝
2026-04-08 21:40:13
湖南这两座城市,名字像孪生兄弟,99%的外省人都分不清

湖南这两座城市,名字像孪生兄弟,99%的外省人都分不清

阿芒娱乐说
2026-04-08 14:45:31
跳水运动员全红婵涉嫌遭网暴,全红婵所在训练中心已向公安机关报警

跳水运动员全红婵涉嫌遭网暴,全红婵所在训练中心已向公安机关报警

界面新闻
2026-04-08 12:41:59
打了40天,没有输家?伊朗宣布大获全胜,特朗普宣布“完全胜利”

打了40天,没有输家?伊朗宣布大获全胜,特朗普宣布“完全胜利”

不掉线电波
2026-04-08 20:21:53
一场晚宴改变岛内风向,郑丽文勇敢表态获欣赏,萧旭岑被集体心疼

一场晚宴改变岛内风向,郑丽文勇敢表态获欣赏,萧旭岑被集体心疼

哄动一时啊
2026-04-08 17:23:03
大风315 | 在淘宝买卡萨帝冰箱,店家限时优惠又送高档电器,保温杯顶替冰箱发了货,冰箱没收到店铺已关闭

大风315 | 在淘宝买卡萨帝冰箱,店家限时优惠又送高档电器,保温杯顶替冰箱发了货,冰箱没收到店铺已关闭

大风新闻
2026-04-08 18:45:10
致13人死亡,西成铁路“8·22”重大垮塌事故调查报告公布

致13人死亡,西成铁路“8·22”重大垮塌事故调查报告公布

界面新闻
2026-04-08 19:18:18
日本要求伊朗尽快放人

日本要求伊朗尽快放人

环球时报国际
2026-04-07 22:35:35
79年撤军真相:越南用了十年才想明白中国拆走的不止是8000吨设备

79年撤军真相:越南用了十年才想明白中国拆走的不止是8000吨设备

掠影后有感
2026-04-08 10:00:45
伊朗总统,“言死明志”

伊朗总统,“言死明志”

中国新闻周刊
2026-04-08 20:14:05
全红婵报警:辱骂她的记者全家移民跑路,队友群里疯狂背刺!太惨

全红婵报警:辱骂她的记者全家移民跑路,队友群里疯狂背刺!太惨

眼光很亮
2026-04-08 15:05:35
霸凌全红婵群已解散,多个知名人士名单曝光,全是队友和朋友!

霸凌全红婵群已解散,多个知名人士名单曝光,全是队友和朋友!

眼光很亮
2026-04-08 12:25:48
酒局的二场,大家现在也不再去KTV了

酒局的二场,大家现在也不再去KTV了

微微热评
2026-04-08 20:33:28
1978年,陈丽华丈夫迟重瑞的留影,这年迟重瑞26岁

1978年,陈丽华丈夫迟重瑞的留影,这年迟重瑞26岁

有态度网友19uQxk
2026-04-08 07:24:14
伊朗宣布胜利:美国已原则上承诺撤出战斗部队、解除制裁、支付赔偿、承认海峡控制权等!特朗普也宣布胜利:伊朗可以重建了

伊朗宣布胜利:美国已原则上承诺撤出战斗部队、解除制裁、支付赔偿、承认海峡控制权等!特朗普也宣布胜利:伊朗可以重建了

每日经济新闻
2026-04-08 17:32:20
2026-04-08 23:07:00
卫诗婕商业漫谈 incentive-icons
卫诗婕商业漫谈
记录商业史和我们的时代。
23文章数 14关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

数码
艺术
教育
时尚
手机

数码要闻

雷神推出KG3089侧刻有线机械键盘:89键布局,129元

艺术要闻

齐白石『凌波仙子』

教育要闻

北京30学校入选!最新国家级特色学校名单出炉

50岁,我妈在恋综抢男人

手机要闻

雷军:REDMI K90 Max夺冠 4小时重载游戏不超37℃

无障碍浏览 进入关怀版