网易首页 > 网易号 > 正文 申请入驻

AI+机器人!当机器人碰上大模型,将会带来哪些变革?

0
分享至

叠加AI大模型(特别是多模态AI大模型)的赋能,移动机器人的能力有望大幅提升。

注:原文为国信证券《人工智能行业专题:大模型带来机器人变革》,证券分析师:熊莉

进入2024年,机器人领域迎来了一场大爆发,科技巨头们纷纷带来惊艳的演示视频,展示出令人瞠目结舌的产品。

这其中,大部分视频展示的是外表酷似人形的“具身智能体”,它们可以完成各类复杂任务。

然而,这些演示视频也引发了不少的争议,有人怀疑这些机器人是否真的在自主执行任务。

例如斯坦福大学推出的Mobile ALOHA系统机器人,就被曝出是真人远程操作,在自主模式下曾多次“翻车”,可见AI机器人离落地应用还有很大差距

不过在工业制造、仓储物流等场景里,工业机器人已经在大模型(LLM)的加持下展现出一定的智能性与自主性。

在近期国投证券发布的报告《人工智能行业专题:大模型带来机器人变革》一文里,分析师以“AMR机器人”为例,介绍了大模型给工业机器人带来的影响与变革。

以下内容为报告重点内容精选:

一、AMR行业快速增长,软件和算法是核心

(镁客网注:在此部分,分析师介绍了AMR机器人的定义、技术路径、技术核心等内容,并介绍了英伟达等海外大厂的AMR机器人方案。)

移动机器人,指在复杂环境下工作,具有自行组织、自主运行、自主规划的智能机器人,主要可以分为自主移动机器人(AMR)、关节型机器人、人机协作机器人等。

根据GGII数据,从全球维度来看,22年全球移动机器人市场规模约292亿,预计27年增长至1874亿元,对应22-27年CAGR为45.07%;

从国内维度来看,22年中国移动机器人市场规模约97亿元,预计27年增长至462亿元,对应22-27年CAGR为36.74%,市场规模快速增长。

其中,自主移动机器人(AMR)是一种能够独立理解环境并在环境中移动的机器人。

AMR与其前身自动导引车 (AGV) 不同,后者依赖于轨道或预定义路径,并且通常需要操作员监督。而AMR使用一组复杂的传感器、人工智能、机器学习和计算来进行路径规划,以解释和导航其环境,不受有线电源的束缚。

AMR的背后有两大关键技术路径:

1、容器化的SDK工具集——包含感知、导航软件堆栈;好用的开发环境,模拟工具;后续优化升级Containers;

2、边缘微服务器支撑——包括无线通信,安全设备,协作SLAM Fleet管理。

AMR技术核心:

1、架构

(1)AMR本体能力:具备传感和智能路径规划,运动控制、安全和人机交互HMI,机器视觉和智能导航等能力, 赋能制造业向柔性化、智能化发展。

(2)云端交互任务处理:AMR本体通过网络(WIFI/以太)与云端计算中心交互,在云端完成数据分析,推理,模拟等工作,需要云端AI芯片支持(例如英伟达H100等)。

(3)架构组成:目前主要由控制系统、导航传感系统、驱动模块、安全监测模块、交互模块、通讯模块、动力模块(电池等)、执行机构(机械装置)组成,不同场景品类的机器人对配置要求不同。

2、硬件

硬件部分主要包括TMT零部件(控制系统相关硬件、导航传感器、驱动模块、通讯模块等)、电池(动力模块)、机械装置(执行机构等),随着定位导航、机器视觉、规划执行等环节对芯片需求的增长,以及激光雷达等新型传感器的应用,机器人中TMT零部件的价值量持续提升。

未来,AI将走出计算机,进而影响外部世界(物理世界),而机器人是AI最佳载体之一;随着智能机器人的发展,机器人传感器、执行器将同AI相结合,具备模拟(用于仿真的虚拟空间)、映射(实时地图创建能力)、自主(独立运行)等能力,需要强大的端侧算力支撑,移动GPU嵌入AMR本体是发展趋势。

3、软件、算法

在实际应用中,移动机器人通常以集群的方式系统完成特定任务;

未来,成百上千台机器人规划化集群作业是发展的必然趋势,即逐步从单体智能向群体智能演进,软件和算法成为构筑核心竞争力的壁垒,例如统一环境下完成作业调度、找到全局最优方案提升集群机器人工作总效率等。

因此分析师认为,随着行业应用场景的丰富和技术的发展,产品模块化、软件模块化将成为AMR发展的必然趋势

目前,端侧(即机器人本体)软件、算法主要有ROS 2、地图规划算法、AI算法、样点算法等,支撑路径规划、障碍躲避、运动控制等功能;

而云侧(及边缘)软件、算法主要有集群管理算法、训练、远端推理、远端SLAM、数据分析算法等,支撑算力调度、机器人集群协作、数据分析等功能。

目前,各头部厂商拥有自己的解决方案,技术路径随大模型的发展,快速迭代

以Intel为例,其提供相应的开发工具和平台,使开发者可以快速、低成本地搭建、管理AMR机器人。

除此以外,英伟达旗下的ISAAC集成式端到端解决方案、Jetson系列产品以及特斯拉的FSD+Dojo都是目前业内比较领先的解决方案。

值得一提的是,当前机器人价值链划分里面没有智能系统。

分析师认为,机器人是典型的机电软一体化产品,软件与硬件是相互限制又相互促进的矛盾体;边缘算力硬件将会制约机器人相关应用的发展,边缘算力硬件的突破使得机器人可以承载更强大的AI,同时机器人应用的发展会倒逼边缘算力硬件的提升。

当下的机器人智能停留在视觉(vision)阶段,机器人缺乏智能系统(即机器人的大脑)。

在未来,在AI对机器人赋能的大背景下,机器人可以逐步理解物理世界,未来有可能向具身智能方向发展,智能系统对机器人的重要性愈发凸显

二、巨变:多模态大模型赋能机器人

(镁客网注:在此部分,分析师介绍了多模态大模型如何赋能机器人。)

多模态大模型赋能机器人,主要体现为多模态感知多模态交互

多模态感知:通过多类型传感器的配合,机器人处理多个模态接收的信息,从而实现对文本、图像、视频、音频等模态信息的学习和理解。

多模态交互:用户可以同时使用语音、手势、文本等与机器人交互,同单模态交互相比,多模态交互具有减轻用户认知负担(交互更自然)、消除任 务歧义(交互更准确)、降低环境干扰(交互更加鲁棒)等优势,使交互更加灵活和高效。

此外,大语言模型(LLM)赋能机器人语义理解,从传统的关键词语义识别,进化到可以理解人类复杂的语音命令;同时,通过预训练大模型将“记忆”移植到智能机器人终端,机器人具备理解任务的能力。

由于机器人本体计算能力有限,需要通过强大的云端计算能力给机器人赋能。由此构成了“云-网-端”架构

“端”:是机器人本体及本体自身的控制系统,嵌入式AI芯片逐步替代传统嵌入式芯片,机器人本体的智能性快速提升;

“网”:主要指通过Wifi、5G及其他无线通信网络将机器人连接起来,实现机器人本体和云端大脑的连接;

“云”:通过机器学习,不断进化,进而使前端机器人本体的智能随之提升。

未来,随着模型植入机器人本体。云端大模型泛化出基本能力,并把这部分“记忆”植入机器人边缘端(通过蒸馏等方式压缩模型大小),进而机器人本体可以将识别到的视觉、雷达、语音交互数据进行处理,并规划动作,完成反馈。

注:分析师以Google RT2 为例,介绍了新模型如何赋能机器人执行各项任务。这是一个视觉-语言-动作(VLA)模型,符号理解、推理、人类识别等领域能力大幅提升,且泛化能力大幅提升。

三、国内机器人产业蓬勃发展

(镁客网注:在此部分,分析师介绍了国内机器人产业的最新情况。)

国内机器人产业:机器人产业链上游包括核心零部件、配套零部件和软件系统开发,中游为机器人本体的生产及系统集成,目前主要集 中在工业机器人和服务机器人领域,下游主要包括工业应用(汽车制造、家电制造、航空航天等)和服务应用(餐饮服务、酒店服务、医疗服务、物流服务等);近两年一些做算法的软件公司借助海外大模型的风,开始自研垂直小模型,并供给下游终端厂。

创业公司情况:根据中国机器人网统计数据,2023年中国机器人行业共发生134起融资事件,其中近亿/过亿元级融资事件52起,2023年融资金额总计为200亿元左右;2023年融资事件主要发生在工业机器人相关(37起左右)、医疗机器人(29起左右)、服务机器人(24起左右)、人形机器人(12起左右)等领域。

上市公司情况:目前上市公司以提供终端硬件为主,并逐步优化机器人软件(模型、算法等),提升机器人性能表现。

最后,研报列举了海康机器人等国内多家优秀机器人企业,这里就不详细展开介绍。

题图源:网络

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美联储威廉姆斯“放鸽”:当前货币政策立场足以推动通胀回落至2%

美联储威廉姆斯“放鸽”:当前货币政策立场足以推动通胀回落至2%

财联社
2026-06-26 06:24:04
不宣而战,特朗普下令,美军发起斩首行动,英法德俄失声

不宣而战,特朗普下令,美军发起斩首行动,英法德俄失声

影孖看世界
2026-06-25 17:59:33
随着青岛海牛爆大冷门4-2掀翻强敌,中超最新积分榜出炉

随着青岛海牛爆大冷门4-2掀翻强敌,中超最新积分榜出炉

俯身冲顶
2026-06-26 21:43:23
“建议取消私生子继承权!”专家话炸翻全网:凭什么要为背叛买单

“建议取消私生子继承权!”专家话炸翻全网:凭什么要为背叛买单

一丝不苟的法律人
2026-06-25 11:22:53
霍启山娜然的结婚瓜,有点炸

霍启山娜然的结婚瓜,有点炸

黎兜兜
2026-06-26 00:02:31
震惊了!坐飞机,发现了一名超像豆包的空姐

震惊了!坐飞机,发现了一名超像豆包的空姐

微微热评
2026-06-25 12:35:51
风波持续升级!谢娜当众痛哭仅3天,官方终于出手,直接“点名”

风波持续升级!谢娜当众痛哭仅3天,官方终于出手,直接“点名”

老羴学科普
2026-06-27 05:03:39
泰国租妻产业年赚数十亿美元,退休老头:租一个妻子,买一段晚年

泰国租妻产业年赚数十亿美元,退休老头:租一个妻子,买一段晚年

星星会坠落
2026-06-24 09:29:50
怀孕后发现丈夫在外有新家,我转头跟我妈说:撤资,让他公司破产

怀孕后发现丈夫在外有新家,我转头跟我妈说:撤资,让他公司破产

千秋文化
2026-06-14 19:12:51
伊朗高层突然传出“政变疑云”,佩泽希齐扬“逼宫”穆杰塔巴?

伊朗高层突然传出“政变疑云”,佩泽希齐扬“逼宫”穆杰塔巴?

天气观察站
2026-06-27 04:18:01
纳指收跌0.2% 芯片股下挫 西部数据大跌13%

纳指收跌0.2% 芯片股下挫 西部数据大跌13%

财联社
2026-06-27 04:24:14
“充会电”成最后遗言:33岁父亲为家赴泰,再现身已被按头打电话

“充会电”成最后遗言:33岁父亲为家赴泰,再现身已被按头打电话

奇思妙想草叶君
2026-06-27 03:05:24
央视催婚,樊振东择偶标准曝光,女神超20亿下月结婚,难怪这么拼

央视催婚,樊振东择偶标准曝光,女神超20亿下月结婚,难怪这么拼

梦史
2026-06-27 04:11:54
阿根廷好命! 在4强前可能不会遇传统豪门梅西会在约旦比赛上场

阿根廷好命! 在4强前可能不会遇传统豪门梅西会在约旦比赛上场

80后体育大蜀黍
2026-06-26 14:07:19
中方不见日大使,日企警告灾难将至,中日一旦开战,结果早已注定

中方不见日大使,日企警告灾难将至,中日一旦开战,结果早已注定

奥利奥变薄了的
2026-06-27 00:53:15
历史竟曾开了个玩笑:先倒下的不是乌克兰,而是百年中立的瑞士?

历史竟曾开了个玩笑:先倒下的不是乌克兰,而是百年中立的瑞士?

说历史的老牢
2026-06-24 07:25:52
美国大满贯:男单签位出炉!王楚钦首轮战周启豪,林诗栋肩负重任

美国大满贯:男单签位出炉!王楚钦首轮战周启豪,林诗栋肩负重任

富贵体坛说
2026-06-27 04:24:00
太亏了!安徽一高考生数学0分,总分458超过本科线,原因让人无语

太亏了!安徽一高考生数学0分,总分458超过本科线,原因让人无语

育学笔谈
2026-06-25 21:23:28
英格兰队遭重创!右路大腿接连伤退 两翼齐飞沦为空想

英格兰队遭重创!右路大腿接连伤退 两翼齐飞沦为空想

球事百科吖
2026-06-27 05:40:11
发达国家,碎了一地

发达国家,碎了一地

美第奇效应
2026-06-26 23:58:22
2026-06-27 06:24:49
镁客网 incentive-icons
镁客网
硬科技第一产业媒体,提供最有价值的行业观察。
5968文章数 9357关注度
往期回顾 全部

科技要闻

拿了500亿的梁文锋,只挖地基,不信销售

头条要闻

世界杯:塞内加尔5-0十人伊拉克 盖伊世界波双响

头条要闻

世界杯:塞内加尔5-0十人伊拉克 盖伊世界波双响

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

"索具龙头"领大额罚单

汽车要闻

11.99万起 捷途自由者7 PLUS/山海T1四驱版上市

态度原创

健康
亲子
数码
本地
公开课

“无糖汤圆”是否隐藏着健康陷阱?

亲子要闻

“人永远不知道自己的天赋技能点被随机点到哪了”

数码要闻

深夜突发!iPad/Mac全球大涨价,苹果成了AI受害者?

本地新闻

世界杯球迷节:比球赛更好玩的派对

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版