来源:新浪财经
![]()
新浪财经 康路 发自瑞士达沃斯
在第 56 届世界经济论坛年会(达沃斯)上,关于 AI 的讨论正在发生一个清晰的转向。相比过去两年围绕大模型参数、算力规模和生成能力的讨论,今年越来越多的共识指向一个更现实的问题:AI 如何真正进入物理世界,并形成可规模化的产业能力。
在这一背景下,“物理 AI(Physical AI)”“具身智能(Embodied AI)”等概念被频繁提及。与单一形态的人形机器人相比,这些概念更强调 AI 在真实环境中的感知、理解和执行能力。
参会的梅卡曼德机器人(Mech-Mind Robotics)创始人兼 CEO 邵天兰对新浪财经表示,物理AI 的提法之所以准确,在于它描述的不是外形,而是能力结构。在他看来,真正决定机器人是否具备产业价值的,不是是否“像人”,而是能否快速适应复杂多变的物理环境,能否完成真实任务,以及能否以足够低的成本实现快速部署。
“如果从这个角度看,物理AI 并不指向某一种具体形态,而是一套通用能力。”邵天兰说。这也是梅卡曼德长期以来的技术出发点。
理论上,制造业和物流行业对机器人的需求一直存在,但现实中,大规模部署始终推进缓慢。邵天兰认为,行业长期以来误判了真正的瓶颈。
“问题不在硬件。”他说,无论是速度、精度、负载能力还是单体成本,今天的机器人都已经具备可用性。真正限制规模化的,是部署难度。
在真实工业环境中,一个机器人系统要稳定运行,往往需要大量跨学科工程师参与,包括机械、电气、方案设计、调试、软件以及 AI 等多个环节。这种高度工程化的部署方式,很难复制,也很难摊薄成本,最终结果就是“算不过账”。
梅卡曼德所聚焦的,正是这一长期存在却被忽视的问题。通过提升机器人在真实环境中的感知、理解和自主决策能力,减少对人工工程调试的依赖,部署速度和经济性才有可能真正成立。
正是基于对部署问题的长期观察,梅卡曼德在公司定位上选择了一条相对克制的路径。
邵天兰介绍,梅卡曼德从一开始就明确自身边界。只做机器人的“眼睛、大脑和手”,不做整机,不做整条生产线解决方案,也不试图覆盖所有应用场景。
在他看来,机器人涉及机械、电气、控制、算法以及大量行业细节,没有任何一家公司能够在所有层级做到最优。如果试图“全栈”,资源必然被稀释,反而会削弱核心竞争力。
“长期成功的企业,往往不是‘什么都做’,而是在关键能力上形成不可替代性。”他说。
目前,梅卡曼德的客户已经横跨汽车、电池、光伏、3C 和物流等多个行业。邵天兰认为,不同行业的差异往往被高估,而机器人在感知、识别、定位和安全执行等方面的共性需求,反而被低估。
“就像人学习新技能一样,我们不是从零开始,而是在已有世界模型的基础上快速迁移。”他说。梅卡曼德的路径,正是先构建通用的基础能力,再用相对少量的数据完成对新场景的适配。
在一些被市场高度关注的方向上,邵天兰的判断同样保持克制。例如在“灵巧手”问题上,他并不认同完全复刻人类双手的复杂度是当前阶段的合理目标。
在他看来,机器人设计的核心目标不是模仿人类,而是完成任务。只要能够满足制造、物流等真实场景的需求,就不必为了形式复杂而增加系统成本和不确定性。
谈及未来,邵天兰将梅卡曼德的发展路径划分为三个阶段。短期内,制造和物流场景结合成熟机器人形态,已经进入高速增长阶段。中期,更多机器人形态将进入服务业。更远的未来,机器人能力进一步成熟后,才可能向更复杂的场景延展,比如家用。
“我们的节奏很简单。”他说,“销售一代、改进一代、研发一代。”
在一个充满技术想象和叙事张力的赛道里,邵天兰更愿意强调工程现实与边界意识。在他看来,正是这种克制、聚焦和可复制性,决定了物理AI 是否真的能够走出实验室,进入产业深水区。
附部分对话实录:
1.新浪财经:今年,英伟达CEO黄仁勋的演讲提到2025年AI模型的三大突破,其中一点就是物理AI。我之前去 CES (美国消费电子展)的时候也看到,很多中国厂商,尤其是做人形机器人的企业,展示了很多新的技术和应用场景。你其实在机器人领域已经做了很多年了,你怎么看现在这个阶段整个赛道的机遇和挑战?以及梅卡曼德是怎么定位的?
邵天兰:我觉得现在有一个非常明显的趋势,而且我觉得这个趋势是非常准确、也非常有意思的一个转变。这次在达沃斯,包括英伟达、黄仁勋,包括微软,还有很多创业公司,尤其是一些非常明星的独角兽公司,大家在讨论的时候,其实都非常重视 B端的 AI,也非常重视物理AI(Physical AI)。
你会发现一个很明显的变化,就是大家讨论的时候,更多会用 物理AI的概念,而不是直接说“人形机器人”。
我觉得这是一个非常准确的转变。因为以前大家一说机器人,最直观想到的就是人形机器人,觉得这是一个非常自然的方向。但如果你仔细去听这次很多人的表达,比如纳德拉(微软CEO),比如黄仁勋(英伟达CEO),他们其实更多用的是 Physical AI(物理AI) 这个词。
我为什么说这个词更准确?因为它不仅仅可以用于人形机器人,其实也可以用于各种各样的机器人形态。
比如说移动机器人、工业机器人、协作机器人等等。最重要的并不是这个机器人长得像不像人,而是它能不能快速适应新的环境,能不能完成复杂、变化的任务,以及能不能降低部署成本。
在我看来,对环境的适应、对任务的适应,以及快速部署,这三点才是物理AI真正带来的改变。
现在,有很多公司非常需要机器人。理论上,我们完全可以把机器人用在很多地方,比如工厂里干活,比如物流搬运。但现实是,为什么没有大规模用起来?并不是因为今天的机器人硬件不够好,速度不够快,精度不够高,负载不够大,也不是因为成本不够低。而是因为它不能够快速适应环境,也不能够低成本、非常快速地部署。
现实中往往是这样。你需要很多工程师,而且是跨学科的工程师。机械、电气、方案设计、调试、软件,甚至还要 AI 工程师。很多这样的人,要花很长时间去部署一套系统。
这样带来的结果非常简单:算不过账。
所以我们通过引入物理AI,让机器人能够感知环境、理解环境,更好地做出规划和决策。让机器人尽量不依赖工程师大量的人工工作,不依赖人的专业经验,就可以快速、简单地部署。
这次我在达沃斯参加了很多活动,既有超级巨头的领导人,也有很多创业公司的创始人。大家普遍对具身智能与各种机器人形态结合、并在真实场景中落地这件事,是非常乐观的。除了机器人公司,我还在一些活动里遇到了很多传统工业巨头。他们是需求方。他们非常明确地表达了,在很多非常具体的应用场景里,他们是真的需要机器人的,而且需求非常迫切。
这让我更坚定地认为,相比“人形机器人”,物理AI 是一个更加确定、也更加有价值的方向。
2.新浪财经:那 Embodied AI 一般怎么翻译?定义和边界是什么?
邵天兰:一般会翻成“具身智能”,但这里有一个非常大的误区。
很多人一想到具身智能,脑子里立刻浮现的就是人形机器人。但这其实是被“形态”绑架了。举个很简单的例子:狗形机器人是不是具身智能?是的。机械臂是不是具身智能?也是。
具身智能并不等于人形。它的本质是,它的输入和输出来自物理世界。
比如你跟 ChatGPT、豆包、DeepSeek 聊天,或者让它生成图片、分析文本,这些输入和输出大多还是在数字世界里。但如果一个系统通过任何形态的机器人,能够感知、理解并操作物理世界,那它就是具身智能。
3.新浪财经:所以大家一开始对“具身”这个词的想象,是比较局限的。
邵天兰:对。人形机器人对很多人来说是最直观的想象,但并不意味着它是唯一答案。
4.新浪财经:我在 CES (美国消费电子展)看到像 Boston Dynamics 的 Atlas,它可以 360 度旋转,号称可以在工厂里干活,但它其实也不是一个“很像人”的机器人。这是不是说明,双足并不一定是在工厂干活的必要条件?
邵天兰:我觉得这个问题要回到第一性原理。
为什么要用双足?一个很重要的原因是,有些环境是为人设计的。在这种环境下,双足是一个非常自然、也非常简单的解决方案。但反过来,如果这个环境本身并不是为人设计的,那就没有必要为了“像人”而去坚持双足。
我觉得最后一定要从需求出发,而不是从技术或者象征意义出发。
有些时候,大家可能出于资本市场、叙事或者展示的需要,会做一些“长得很像人”的机器人。但真正落地的时候,还是要因地制宜。没有任何一种机器人形态,可以适应所有场景。天上飞的、水里游的、地上跑的,都会有各自最合适的形态。
5.新浪财经:你刚才提到机器人“快速部署”的能力,这其实是你们公司一直在做的事情。你们是怎么做到的?这个能力是怎么演进出来的?
邵天兰:我们公司成立到现在大概九年时间。前四年,我们一共卖了大概一千台。后面四年,我们一共卖了大概一万台;而现在,我们已经进入了单年部署过万台的阶段。
我们认为,有几个点非常关键。
第一,我们对自己的边界定义得非常清楚,什么能做,什么不能做。第二,我们做的是标准化产品,而不是定制化解决方案。第三,我们通过大量真实数据的积累,包括真实世界的数据、仿真数据,以及互联网数据,让模型具备非常强的能力。
我认为,清晰的边界、标准化产品,以及大量现实数据反哺 AI 能力,是最重要的三件事。
6.新浪财经:所以你们的核心竞争力,其实就是“眼、脑、手”。
邵天兰:对。我们可以结合各种形态的机器人,不管是工业机器人、协作机器人,还是人形机器人。
我们让机器人通过高精度相机,快速、准确地感知三维环境。我们的算法不仅让机器人“看见”,还让它能够做出决策、完成动作。我们已经能让机器人完成非常多类型的任务,比如搬运、装配、切割、焊接、涂胶、打螺丝等等。通过标准化产品,结合各种设备,在大量应用场景中完成具体任务。
7.新浪财经:已经和很多大公司都有合作,比如车企?
邵天兰:我们现在在汽车、电池、锂电、光伏、3C 家电,以及物流领域,都有非常多的合作。我们也是一家全球化公司。除了中国,我们在欧美日韩、东南亚,都有非常成熟的业务。
8.新浪财经:怎么做到横跨这么多行业的?单一行业的数据和场景就很难啃。
邵天兰:因为我们解决的是共性问题。不管在哪个行业,机器人都需要通过高精度相机感知环境,识别物体,定位位置,并在不发生碰撞的情况下完成动作。
当然,每个行业、每个应用都有它的特殊性,但共性的部分其实更多。这就像人一样。我们修水管也好,组装家具也好,并不是从零开始学,而是在已有世界模型的基础上,用比较少的学习成本掌握新技能。我们在机器人眼睛和大脑上做的事情,本质也是如此。
9.新浪财经:现在很多中国厂商强调“全栈 AI”能力,你们为什么不这么做?
邵天兰:我们是完全不信“全栈”的。
我们只做我们擅长的事情。机器人涉及机械、电气、控制、算法和大量应用场景,没有任何一家公司能够真正做到全栈。如果一家公司试图全栈,我认为会出现三个问题:第一,资源被稀释,每个部分都很难做到最好。第二,通用性会被严重限制。第三,很难长期持续。历史上,不管是科技巨头还是制造巨头,其实都不是全栈。
10.新浪财经:你对“灵巧手”的阶段判断也很不一样。
邵天兰:如果目标是做一个和人手一样复杂的灵巧手,那我认为太早了,也不现实。但如果目标是完成制造、物流,甚至一部分家用场景,其实不需要那么复杂。
我自己做过实验,只用三个手指,只做简单动作,除了用筷子,生活几乎不受影响。机器人不是为了模仿人,而是为了完成任务。
11.新浪财经:那么,如果你去评估人形机器人公司的护城河,最重要看什么?
邵天兰:有没有一技之长。可以是算法、材料、电机、减速机、结构设计,任何关键点都可以,但一定要有不可替代性。但如果只是把东西攒起来,市场早期可能有价值,但成熟之后很难生存。
12:新浪财经:最后一个问题,你们怎么布局未来?短期和中长期的目标是什么?
邵天兰:短期,从制造、物流以及结合现有已经成熟的机器人形态,我认为已经会有一个相当可观的市场。此时此刻已经在高速增长了。不远将来,我们在一部分的服务业里面也可以结合更多形态来进行很多的探索。当然更远的未来,就是人形机器人要进入家用。
我们自己的说法很简单:就是销售一代,改进一代,研发一代。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.