![]()
在人工智能(AI)技术持续演进的浪潮中,过去 AI 的创新与应用长期聚焦于数字世界,如算法优化、大模型训练、虚拟场景交互等,虽实现了认知智能的突破,却难以满足人类对 AI“进入物理现实、开展实体交互” 的深层需求。而具身智能的兴起,正成为推动 AI 从 “虚拟维度” 迈向 “物理维度” 的关键变革力量 —— 它以 “让智能体具备物理载体,并能与真实环境进行感知、决策、执行一体化互动” 为核心特质,为 AI 的产业化落地开辟了全新赛道。
![]()
从产业发展脉络看,具身智能已走过 “概念萌芽 — 技术突破 — 场景探索” 的关键阶段:其概念界定愈发清晰,“感知 - 决策 - 执行” 融合的技术原理逐步成型,多技术路线的探索方向日益明确,且在工业、服务、医疗等众多领域展现出商业化潜力;政策层面,欧美日韩等国家已抢先布局具身智能发展战略,中国也通过系列产业政策为行业赋能,营造了积极的发展环境;产业链维度,从整体生态概况,到人形机器人的竞争格局,再到芯片、传感器、AI 算法与大模型等核心环节,都已初步构建起产业基础,为具身智能 “商业化浪潮” 的到来提供了底层支撑。
在此背景下,深入剖析具身智能产业链的发展逻辑、全球政策导向与核心环节竞争格局,对于把握 “AI 走出数字世界,向物理现实深度渗透” 的产业新浪潮,具有重要的研究与实践意义。
一、具身智能产业概览
具身智能是实现未来通用人工智能的核心路径。当 AI 突破虚拟世界的边界,拥有实体 “身体” 并具备物理交互能力时,它正推动人工智能掀起第二次革命浪潮。在当前技术与产业发展中,谁能掌握具身智能及人工智能的核心技术与产业生态,谁就有望在未来全球经济格局中占据主导地位。
2025 年,“具身智能” 首次被纳入中国政府工作报告,成为培育未来产业的重点任务。从全球范围来看,英伟达、OpenAI 等国际科技巨头,以及腾讯、阿里、华为等国内企业均在积极布局这一领域;同时,特斯拉、Figure AI、智元机器人、宇树科技等厂商的人形机器人产品陆续落地,正式宣告 “AI 具身化” 时代已然来临。
一、具身智能概念解析
具身智能(Embodied Intelligence)是融合人工智能、机器人技术等多学科的前沿科技领域,也是人工智能发展的下一波浪潮。根据中国计算机学会(CCF)的定义,具身智能是依托物理身体开展感知与行动的智能系统。它通过智能体与环境的交互获取信息、理解问题、制定决策并执行行动,最终产生智能行为与环境适应性。
在此之前,人工智能多以数字形式存在,不具备视觉、触觉、听觉等真实感官体验,无法高效应对现实世界中的各类复杂场景。简单来说,具身智能的核心就是为 AI 配备 “身体”(如机器人),使其不再局限于计算机系统内处理数据与文字。借助 “身体” 上的传感器(类似人类的眼睛、耳朵等),具身智能能感知真实世界,再以类人类的方式理解周边情况、做出决策,驱动 “身体” 行动并完成具体任务。正因如此,具身智能被视作迈向更通用、更强大的人工智能(AGI)的关键一步。2024 年被业内称为具身智能 “元年”,英伟达首席执行官黄仁勋也曾明确表示,人工智能的下一波浪潮将是具身智能。
从概念构成来看,具身智能可拆解为 “具身” 与 “智能” 两部分,其中机器人是其主要应用场景。“具身” 意味着拥有实体身体,且能通过交互、感知、行动等能力完成任务;依据使用用途与场景的差异,具身智能呈现出多种形态,涵盖各类智能机器人、自动驾驶等,而人形机器人被认为是具身智能最理想的形态。“智能” 则指物理实体能够主动开展感知、理解、推理、决策、行动等一系列任务。
因此,具身智能也可通俗理解为:将 AI 技术植入各类物理身体(如机器人),让机器人等实体能够感知周围环境的变化,并据此做出相应决策。与传统工业机器人、协作机器人相比,具身智能更注重环境交互能力;相较于传统机器人,具身智能机器人具有智能化程度高、工作场景限制少、可自主规划复杂工作流程等特点。综上,具身智能体需同时具备三大核心要素:一是可感知、可触摸的 “身体”(即本体),二是能与周边环境互动沟通的能力(即环境交互),三是具备感知、思考与决策功能的 “大脑”(即智能)。
![]()
2、具身智能技术原理
具身智能的本质,是为机器人这类物理实体赋予人工智能能力,使其能够感知环境、自主学习,并与环境实现动态协同交互。具身智能技术的发展进程中,经历了从早期模块化 AI 算法集成,到由大模型驱动的统一技术框架的转变。在早期阶段,技术主要依靠集成多个 “小模型”,并辅以人工介入,根据具体场景或用途调用对应模型来完成任务。例如,在视觉层面,借助目标检测算法识别物体;在控制层面,运用传统机器人学习技术让机器人实现自主决策,通过这种方式满足机器人的应用需求,为其增加智能化元素。而随着大模型的问世,具身智能将各个模块的功能整合到统一框架中,依托大模型的知识理解与表达能力,实现自然语言交互、多模态信息的无感处理与转换,能够统一处理多种感官信息,融合运动经验执行操作,在通用性与泛化性上实现了重大突破。
![]()
具身智能技术体系通常可划分为 “感知 — 决策 — 行动 — 反馈” 四个核心功能模块,这四个模块共同构成一个动态闭环系统。该系统通过与环境的持续交互,完成环境模型的构建与更新、自主决策的制定、自适应行为的执行,并基于经验反馈实现自我学习与进化。
- 感知模块:依托视觉、听觉、触觉、力觉、本体觉等多模态传感器融合技术采集环境信息,利用深度学习模型实现跨模态融合与联合表征,构建对环境的时空与语义统一认知。其中,视觉负责目标检测、场景理解与行为预测;听觉支持语音指令解析与声源定位;触觉与力觉反馈则用于抓取控制、材质识别与交互安全。感知模块输出的结果,不仅为系统提供状态输入,还为决策模块提供可解释的语义与几何信息。
- 决策模块:作为具身智能的 “认知中枢”,主要负责解析感知模块传递的信息,生成高层任务规划与低层动作策略。当前,决策模块的主流技术路径正从传统的规则引擎与符号规划,向基于大模型的数据驱动决策转变。系统会综合考虑任务目标、环境约束与历史经验,通过分层决策架构输出可执行策略,并结合强化学习或模型预测控制技术实现实时动态调整。
- 行动模块:核心作用是将决策模块制定的策略转化为物理操作,具体涵盖移动导航与抓取操作两大方向。移动系统依靠路径规划与运动控制技术实现避障与位姿调整;操作系统则通过轨迹规划与柔顺控制技术实现精准交互。同时,系统会结合视觉伺服、力觉反馈等技术进行闭环调节,确保动作的精准性、安全性与稳定性。
- 反馈模块:通过闭环学习驱动系统不断进化。该模块会采集动作执行效果、环境响应等数据,利用强化学习、模仿学习或在线微调技术优化策略参数、更新模型权重;同时支持经验回放、技能抽象与迁移,实现系统的持续自适应迭代,提升任务执行的鲁棒性与通用性。
3、具身智能技术路线
具身智能的技术路线主要包含算法方案、训练方法、数据采集三个维度,具体内容如下:
- 算法方案:具身智能的算法方案可分为分层决策模型和端到端模型两条路线。目前,分层决策模型在业界更受青睐,但行业普遍认为,从长远发展来看,随着数据积累与算法进步,端到端模型将成为未来实现更高水平通用智能(AGI)的重要方向。
- 分层决策模型:被业界形象地称为 “大脑 - 小脑” 架构,以与 OpenAI 合作的 Figure 01 为典型代表。该模型将任务划分为不同层级,运用多个神经网络分别进行训练,再通过流程管线整合。顶层通常是大型多模态模型,负责高级认知、任务规划与语言理解,扮演 “大脑” 的角色;中间层是更专注于特定功能的策略网络,负责将高层指令转化为具体运动序列并生成动作指令,类似 “小脑” 的功能;底层则由机器人本体接收指令,执行具体的电机控制。分层模型的优势在于各模块功能明确,可解释性、可维护性与调试性相对较好;但传统模块化架构存在信息传递延迟、模块间耦合度高、算法迭代不同步等缺陷,这些都是分层模型需要重点解决的问题。
- 端到端模型:致力于通过一个统一的神经网络,直接将原始传感器输入(如摄像头图像)映射到最终输出(如驾驶轨迹或机器人动作),省去中间独立的感知、决策、规划模块,实现一体化决策。以谷歌的 RT - 2 为代表,该模型借助一个神经网络完成从任务目标输入到行为指令输出的全过程:先在大规模互联网数据上对视觉语言模型进行预训练,再在机器人任务上进行微调,结合机器人动作数据,打造出 VLA(视觉 - 语言 - 动作)模型。端到端模型的优势是简化系统架构、提高运行效率,还能减少模块间的误差积累;但该模型依赖海量高质量数据对 VLM 大模型进行预训练,计算资源消耗巨大,且机器人执行任务的实时性通常欠佳。
- 训练方法:具身智能的训练方法可分为模仿学习和强化学习两条路线。在实际研发过程中,单纯的模仿学习或强化学习,都难以独立支撑复杂的具身智能任务。目前,行业主流趋势是将两种方法结合,实现取长补短,形成更高效的训练范式。
- 模仿学习:智能体通过观察、模仿专家(如经验丰富的人类操作者或高性能系统)的行为来学习任务。其优势是能快速掌握专家策略,无需进行复杂探索;劣势是学习到的行为策略受限于专家数据,对于未接触过的情况,泛化能力较弱。
- 强化学习:智能体通过与环境交互,以最大化某种累积奖励的方式学习最佳行为策略。该方法的优点是可通过探索环境学习未知策略,能处理高度不确定、动态变化的环境;缺点是需要大量探索与试错,学习进程较为缓慢,且针对复杂任务,设计合适的奖励函数难度较高。
- 数据采集:具身智能的数据采集可分为基于仿真环境数据、基于真实世界数据两条路线。目前,业界逐渐形成共识:采用 “仿真数据为主,真实数据为辅” 的训练模式。
- 基于仿真环境的数据采集(Sim2Real):在仿真环境中让智能体学习技能和策略,再将其迁移到现实世界。这种方式的优势是可大规模获取数据,且成本较低;劣势是对仿真器要求较高,且仿真环境与真实世界存在差异,在迁移过程中性能会出现下降。
- 基于真实世界数据采集:直接从现实世界中获取数据进行学习,具体包括本体采集、遥操作(人类远程控制机器人执行任务)、动态捕捉、视频学习等方式。该方式的优点是数据更真实可靠;缺点是数据量较少、泛化性差,且通过机器本体和人类采集数据时,成本高、难度大、效率低。
具身智能产业经历了概念萌芽、理论发展、技术突破等阶段,目前正逐步迈向产业应用领域。
- 概念萌芽阶段(20 世纪 50 年代 - 90 年代):1950 年,图灵在探讨 “机器能否思考” 这一问题时,提出了人工智能的两条发展路径,此后逐渐形成离身智能、具身智能两大方向。1956 年,AI 概念正式诞生,符号主义在早期 AI 发展中占据主导地位,随后连接主义兴起,但这两种理论在处理复杂任务时,局限性逐渐凸显。20 世纪 80 年代,行为主义 AI 开始发展,该理论主张通过身体与环境的交互产生智能。这一时期,“具身” 机器人开展了早期实验,例如 1954 年麻省理工学院研制出首台可编程机械臂,1960 年首台工业机器人 Unimate 投入使用,拉开了具身智能探索的序幕。
- 理论发展阶段(20 世纪 90 年代 - 2022 年):AI 三大学派从各自分立研究逐步走向综合融合,为具身智能的发展奠定了基础。行为主义对计算智能的局限进行反思,推动了以 “底层智能” 为核心的研究;底层数学理论的深入研究使 AI 算法取得突破,深度强化学习、模仿学习、形态计算等理论及算法模型快速发展。同时,“具身” 机器人也迎来快速发展期,例如 1999 年日本索尼发布犬型机器人爱宝,2002 年丹麦 iRobot 公司推出家用扫地机器人 Roomba,2009 年后波士顿动力 Atlas 机器人亮相,2013 年后无人机、无人驾驶技术快速发展,这些都是该阶段的代表性产品。
- 技术突破阶段(2022 年 - 至今):自 2022 年底 ChatGPT 掀起大模型热潮以来,具身智能领域的技术实现取得重大突破,展现出巨大发展潜力。大模型显著提升了机器人的语言交互、环境感知及任务决策等能力。例如,2023 年出现的 VoxPoser 模型利用 ChatGPT 分解任务步骤,而 PaLM-E 则将传感器模态融入大语言模型,大幅增强了机器人的高层推理与指令泛化能力。2024 年起,人形机器人开始集中推出落地,特斯拉、Figure AI、优必选、宇树科技、智元机器人等国内外重点企业相继推出人形机器人产品,并进入汽车工厂、巡检、物流等场景开展实际测试,这标志着 “大模型 + 机器人本体” 的组合正从实验室走向生产线,同时其他形态的机器人本体也呈现出智能化升级的趋势。
目前,具身智能作为人工智能的重要分支,在多个领域展现出应用潜力,且逐步向产业化方向推进,受到科技界与产业界的广泛关注。微软、谷歌、英伟达等科技巨头以及众多高等院校均已开展相关研究。2024 年,具身智能已成为人工智能发展的重要方向,被视为科技界的新风向标。人形机器人等具身智能产品开始成为市场关注的明星产品,受到市场追捧,其产业应用进程正在不断加快。
![]()
5、具身智能应用领域
具身智能从根本上拓展了人工智能的应用边界。在当前科技驱动产业变革的背景下,具身智能有望广泛渗透到工业制造、自动驾驶、物流运输、家庭服务、医疗康养等多个关键领域,为各行业的智能化转型提供支撑。
![]()
![]()
6、具身智能商业化路径
数据是具身智能发展的核心,驱动着整个产业的发展。在2022年以前的小模型时代,算法的数量和质量对机器人更为关键,因为模型性能会随训练次数增加而趋于饱和,甚至可能出现过度拟合,需要通过算法调整找到最佳配置以避免性能下降。然而,进入大模型时代后,缩放定律明确显示,增加数据量能够持续驱动模型性能提升,数据的核心地位因此彻底凸显。
具身智能获取数据的关键在于实现商业化落地。与大模型可以从网络获取数据进行训练不同,具身智能若要具备高泛化性和可靠性,其底层模型的训练仍需依赖物理世界的精确数据。这类数据具有获取困难、成本高昂、标注复杂的特点,这也导致其产业化进程远慢于语言模型。获取真实物理世界数据的关键就在于商业化落地。具身智能企业普遍将“先把机器人卖出去或用起来”视为破局手段。只有实现商业化落地,才能形成“销售设备→现场运行→自动回传数据→模型迭代→性能提升→再次销售设备”的数据闭环。
根据1X副总裁Eric Jang在《All Roads Lead to Robotics》一文中的观点,目前具身智能的商业化路径主要包括三种:通用场景软硬结合、软件路径,以及垂直领域软硬结合。
![]()
——通用场景软硬结合
通用路线在技术上颇具挑战性,其商业模式是向企业端或消费端出售具备智能功能的完整机器人。此路径的关键在于运用通用的软硬件来应对多样且多变的使用场景。为此,一方面需要开发可重构的硬件,以便快速调整以适应不同的任务需求;另一方面要设计能够适配不同硬件配置与外围设备的通用软件,确保其在各类硬件上顺畅运行。1X、Figure以及特斯拉都采用此路径。
——软件路径
软件路径有助于机器人快速部署与迭代,其主流商业模式是向硬件厂商或综合型厂商开放API接口。该路径的关键在于研发跨实体基础模型,通过这一模型实现跨硬件平台的无缝兼容。
这一模式能够彻底打破传统机器人开发的局限:过去各硬件平台需要单独搭建软件开发流程,而现在开发者只需编写一次代码,便可在多种硬件上部署运行。无论是精密的人形机器人、高效的轮式机器人,还是灵活的无人机,都能共享同一套软件架构,这不仅大幅节省了开发时间与成本投入,还能随着机器人的大规模部署,使软件的边际成本逐步趋近于零。
——垂直领域软硬结合
在垂直领域,软硬一体方案可以将数据采集、压缩、加密、预处理全部集成到ASIC或FPGA芯片中,数据仅在片内流转,外部API无法读取原始信号,这有助于在细分数据方面积累竞争壁垒。高工机器人产业研究所所长卢瀚宸在2024年中国人形机器人技术应用峰会上强调,从长远来看,具备高壁垒的核心硬件将极具优势。在机器人领域,硬件与数据天然存在强绑定关系。企业可通过定制化处理器、专属通信接口等核心硬件,精准收集并处理对机器人性能起决定性作用的特定数据。这类数据因与硬件深度适配,往往难以被竞争对手复制。同时,硬件与软件的紧密集成能形成高度优化的协同系统,既提升了数据采集的实时性与精准度,又加快了数据处理效率,进一步强化了数据壁垒的不可替代性。
7、具身智能市场概况
具身智能市场规模持续扩大,其中中国市场占比预计将不断提升。随着核心技术的持续突破与产业链协同能力的增强,中国及全球具身智能市场正步入高速增长轨道。根据第二届中国人形机器人与具身智能产业大会发布的《2025人形机器人与具身智能产业研究报告》,2025年全球具身智能市场规模预计达到195.25亿元,至2030年预计将攀升至2326.3亿元,期间的复合年增长率高达64.18%。其中,中国市场表现尤为突出,2025年规模预计达52.95亿元,占全球总体规模的27%;到2030年,中国具身智能市场规模预计将达到1037.52亿元,约占全球的44.6%。另据国务院发展研究中心发布的《中国发展报告2025》,当前中国具身智能产业处于发展起步期,在具身智能大模型研发和产品制造方面具备较好基础,其市场规模有望在2030年达到4000亿元,并在2035年突破万亿元。
![]()
人形机器人已成为具身智能技术商业化落地的核心载体,但对其市场规模的预测存在较大分歧。人形机器人仍处于产业化初期,技术突破节奏与商业化进程尚不确定。市场规模取决于产品技术进步速度、大规模商业化进程以及下游应用渗透率,各机构对技术成熟度、量产降本速度及场景落地的判断有所不同。短期内,各机构对2030年前市场空间的预测分布在数十亿至千亿美元区间,其中以2030年达到百亿美元量级的预测为主流。
据中国信通院2024年底预测,中国人形机器人市场规模将从2024年的27.6亿元爆发式增长至2029年的750亿元,2035年有望突破3000亿元,年复合增长率超过90%。
2025年3月,英伟达发布了Isaac GROOT N1通用人形机器人基础模型,有望大幅优化机器人AI训练。在此前提下,国内研究机构集邦咨询预测,2028年全球人形机器人市场产值将接近40亿美元。
高盛在2025年2月的报告中指出,由于感知、决策与控制执行等方面的智能化水平尚未突破技术瓶颈,预计2027年全球人形机器人出货量仅为7.6万台,到2032年达到50.2万台,增速显著慢于市场预期。对应100万台的出货里程碑,高盛认为在最乐观的情景下最快也需到2028-2029年才能实现,而在基本情境下则需等到2034-2035年。
摩根士丹利在2025年6月的报告中预测,2025年中国人形机器人市场规模为3亿美元,到2030年将增至34亿美元,年复合增长率为63%。预计到2030年,中国将拥有25.2万台人形机器人,到2050年将增加到3.02亿台,占全球人形机器人总数的30%。
二、具身智能产业政策
具身智能技术融合了人工智能、高端制造、运动控制、感知决策等多个前沿领域,被认为是实现通用人工智能的关键途径,也是驱动未来经济增长的核心引擎。该技术对于推动全球实体经济向智能化转型、应对人口老龄化带来的结构性挑战,以及增强国防安全和战略自主能力都具有重要意义。
1、欧美日韩具身智能发展战略
具身智能正迅速成为全球主要经济体的战略焦点。早在2010年左右,各工业强国就已将机器人技术视为促进经济增长和创新的重点领域,并制定了相应的发展规划。近年来,美国、欧盟、日本、韩国等主要经济体更是将人工智能和具身智能视为赢得全球经济与科技竞争的关键,相继出台政策、加大投入,竞相布局这一未来产业。
美国:无论是拜登政府还是特朗普政府,都认识到人工智能是维护国家安全和经济竞争力的关键技术,致力于维持美国的技术领导地位并赢得AI竞争。自2009年起,美国顶尖高校与研究机构联合企业界定期发布《美国机器人路线图》,每四年更新一次。2024年的最新版本整合了来自工业界和学术界的60份白皮书,旨在为美国机器人技术未来十年的发展提供战略指导,并增强其市场竞争力。2023年5月,美国白宫科技政策办公室发布了更新版的《国家人工智能研发战略计划》,对2016年和2019年的版本进行了完善,并提出开发更强大、更可靠的机器人。2025年3月,以特斯拉、波士顿动力为代表的机器人企业在美国国会呼吁制定“国家机器人战略”。2025年7月23日,相关讨论进一步深入,特别提到扩大人工智能的军事应用规模,推动美国AI技术栈对外输出,从而建立以美国技术为核心的人工智能生态系统,并通过强化AI芯片出口管制来限制中国AI技术的发展等内容。
欧盟:2024年8月,欧盟《人工智能法案》正式生效,成为全球首部全面监管人工智能的法律。2025年4月,欧盟推出了“人工智能大陆行动计划”,作为该法案的配套战略,试图通过政策松绑、算力基础设施建设和行业应用推广三大支柱,扭转其在AI领域的落后局面。
德国:德国于2018年底推出《人工智能战略》,旨在使德国和欧洲在人工智能技术的开发与应用方面占据领先地位。2020年12月,德国对2018年版的《人工智能战略》进行了修订,计划到2025年,通过经济刺激和未来一揽子计划,将对人工智能的资助从30亿欧元增加到50亿欧元。2023年11月,德国联邦教研部发布了“机器人技术研究行动计划”,确定了基础研究、尖端技术研究、人才培养和智能机器人技术应用四个行动领域,以落实其《研究与创新未来战略》(2023年2月发布)和《人工智能行动计划》(2023年11月发布)。
英国:英国于2021年9月发布《国家人工智能战略》,提出了三个核心行动支柱。2025年1月,英国政府公布了“人工智能机遇行动计划”,旨在将英国打造为人工智能超级大国,承诺采取有利于创新的监管方式,安全可靠地开放公共数据,并创建人工智能增长区等。2025年2月,英国科学、技术和创新部发布了《智能机器战略2035》,概述了英国成为机器人领域全球领导者的路线图,提出在政府内部设立智能机器办公室,通过公共采购、联合工业项目和财政激励措施刺激需求,并创建“智能机器风险投资基金”。
法国:法国政府于2018年正式启动《国家AI战略》,计划通过三个阶段将法国打造成为全球AI领先国家。2025年2月,在巴黎举行的全球AI行动峰会期间,法国宣布启动《国家AI战略》第三阶段,旨在以托管全球AI基础设施为核心,提升法国在AI领域的吸引力,深入参与全球AI竞争。同时,法国发布了《让法国成为AI有影响力大国》报告,正式启动全面促进AI创新的新一轮行动。2021年10月,法国公布了“法国2030”投资计划,其中拨款8亿欧元用于发展机器人产业。
日本:2025年5月,日本通过了首部针对人工智能的法律《人工智能相关技术研究开发及应用推进法》,设立了以日本首相为首、全体内阁成员参加的“AI战略本部”,计划制定并推动“AI基本计划”。2025年9月,日本内阁府技术战略会议确定了人形机器人的长期开发方针,将在其“登月型研发计划”中开发通用人形机器人,力争在2030年前制造出原型机并掌握核心技术,在2050年前研发出能够通过学习进行自主判断、并具备与人类同等或更高体能的机器人。同月发布的“AI基本计划”草案指出“制定国家人工智能战略比以往任何时候都更加重要”,提出加速推进应用、战略性地加强开发能力、主导治理、持续向AI社会转型,旨在让日本成为“世界上最容易开发和应用AI的国家”。
韩国:2019年12月,韩国科学技术信息通信部发布了《人工智能国家战略》(初版),支持AI与机器人技术的融合;该战略的2023年度修订版将具身智能列为下一代AI三大前沿方向之一。2024年1月,韩国产业通商资源部公布了《第四个智能机器人基本计划(2024-2028年)》,提出了“K-Robot经济”概念,围绕强化核心竞争力展开布局。该计划旨在通过公私合作,在计划期内投资超过3万亿韩元,培育150家专业智能机器人企业,并在全产业领域大规模普及超过100万台机器人。2025年4月,韩国“K-人形机器人联盟”正式成立,该联盟由韩国政府、学界和机器人制造企业共同参与,集结了四十多家产学研机构,预计开发总投入超过1万亿韩元(约合50多亿人民币)。该联盟计划在2028年前开发出机器人AI基础模型,供联盟内的机器人制造集团联合使用。
2、中国具身智能产业政策
国家层面正大力支持具身智能发展。作为“新星”产业和未来产业,具身智能产业正逐渐成为我国推动产业转型升级、培育新质生产力的新赛道。国家层面高度重视其发展,通过将其写入政府工作报告、制定专项政策、推进创新机制和应用示范等多种举措,提供全方位支持。
![]()
![]()
![]()
重点城市也在加强培育和发展具身智能产业。随着“具身智能”首次被写入政府工作报告,并上升至国家战略高度,北京、上海、深圳、广州、杭州、苏州、宁波、无锡等多个城市在此之前后纷纷发布了专项规划政策。各地根据自身优势,制定了差异化的具身智能产业发展路径,形成了覆盖技术研发、场景开放、生态建设的系统性产业支持体系,旨在抢占这一新兴领域的制高点。
![]()
![]()
![]()
![]()
![]()
![]()
三、具身智能产业链
1、产业链概况
具身智能产业融合了先进技术、复杂系统集成和多元化应用场景,将推动人类社会进一步迈向智能化新时代。其产业链结构可划分为上游、中游和下游三个部分。
![]()
(一)产业链上游:硬件基础支撑
产业链上游是具身智能产业的核心硬件层,涵盖了芯片、传感器、控制器、电机(含伺服电机)、通信模组及能源管理系统。芯片作为核心计算单元,提供算力以支持复杂算法运行;传感器负责采集环境中的视觉、听觉、触觉等多维数据,实现智能感知;控制器高效处理数据并输出指令;伺服电机精准执行运动控制;通信模组保障设备间的协同与数据流转;能源管理系统则通过高性能电池与电源技术确保稳定供电。上游组件的性能与可靠性直接影响到中下游技术的实现与应用效果,是产业链的底层基石。
(二)产业链中游:技术开发与系统集成
中游环节聚焦于技术整合,通过AI算法、操作系统、云服务及中间件来激活硬件潜能。AI算法作为“智能中枢”,驱动数据分析与自主决策;操作系统提供统一的软件平台,支撑应用开发与管理;云服务扩展了算力与存储能力,支持大规模数据处理;中间件则连接异构系统,实现跨组件的高效协作。中游通过软硬件协同开发,将上游硬件转化为能够执行复杂任务的智能系统,并为下游应用提供技术解决方案,是推动产业链创新的技术引擎。
(三)产业链下游:主要产品与应用场景
下游环节是产业链的最终输出端,也是产业价值闭环的最后一环,涵盖了机器人、自动驾驶载具等主要产品,以及这些产品在工业制造、服务业、医疗康复、教育娱乐、交通出行、公共安全等领域的多元化应用场景。这一环节直接触达消费市场与企业端客户,完成技术成果向商业价值的转化,既是产业生态链的核心价值落脚点,也是驱动产品迭代与场景创新的关键枢纽。
主要产品:具身智能下游的核心产品主要包括机器人和自动驾驶载具两大类。机器人以服务型、工业型、医疗型、人形等类型为主,依托高精度传感器、智能算法及多模态控制技术,能够执行复杂环境下的精细化作业,显著提升服务效率、制造业自动化水平及医疗辅助的精准度。自动驾驶载具则聚焦于自动驾驶汽车、无人机与eVTOL(电动垂直起降飞行器),通过自主导航与协同控制技术优化交通出行、物流配送及城市空间利用效率,推动立体化智能运载体系的发展。
应用场景:具身智能产品深度赋能多个领域:在工业制造中应用于自动化产线、智能仓储及质量检测环节,驱动制造业智能化升级;在服务业通过部署客服、配送机器人来提升运营效率;在医疗领域借助康复机器人实现个性化治疗;在交通出行领域依托自动驾驶技术重构物流与客运模式;在公共安全领域则利用应急机器人强化灾害救援与安防能力,形成全场景协同的产业生态。
2、人形机器人竞争格局
具身智能产品企业以人形机器人为主,中美两国占据主导地位。根据摩根士丹利近期发布的人形机器人100强名单(涵盖整个产业链),中国和北美(包括加拿大)各有35家企业上榜,亚太地区(以日韩为主)有18家,欧洲等其他地区有12家。国外主要人形机器人企业包括特斯拉、美国的Figure AI(获微软、英伟达、亚马逊、Open AI等投资)、美国的波士顿动力(现被韩国现代收购)、挪威的1X Technologies(获Open AI投资)、美国的Agility Robotics(获亚马逊等投资)、美国的Apptronik、美国加州大学洛杉矶分校的RoMela、英国的Engineered Arts、加拿大的Sanctuary AI、西班牙的PAL Robotics、德国的Neura Robotics、韩国的Rainbow Robotics(获三星投资)、日本的本田ASIMO、美国的通用汽车等。
我国人形机器人企业可分为四类。国内已有超过80家企业推出了人形机器人产品,且数量仍在持续增加。各厂商根据自身在结构设计、控制算法、具身大模型等方面的技术积累,持续进行创新,并逐步尝试商业化落地应用的探索。根据技术路径、行业背景和产业链定位,国内布局人形机器人的企业可分为初创型企业、大型科技企业、整车企业以及传统机器人企业。初创型企业以宇树科技、智元机器人等为代表。大型科技企业包括华为、腾讯、小米、阿里巴巴(蚂蚁灵波科技)、字节跳动、大疆创新、科大讯飞、美的等,其中华为、腾讯主要通过资本、平台和生态合作进行布局。整车企业包括小鹏汽车(鹏行智能)、广汽集团、比亚迪、奇瑞、理想、长安、上汽等。
其中小鹏、广汽、比亚迪等已进入量产准备阶段,部分企业同时通过投资和合作来扩展技术生态。从传统机器人领域延伸过来的代表企业包括节卡机器人(协作机器人)、普渡科技(清洁、配送机器人)、越疆科技(工业机器人)、达闼科技(服务机器人)、傅利叶智能(医疗康复机器人)、猎户星空(服务机器人)、追觅科技(扫地机器人)等。
目前,国内人形机器人科创企业(不含大型科技集团和整车企业)大致可分为三个梯队,并初步形成了差异化格局:
第一梯队以估值达到10亿美元(约合70亿元人民币)以上的企业为主,包括智元机器人、宇树科技、傅利叶智能、银河通用、云深处、普渡科技、非夕科技等。这些企业均聚焦于高动态运动控制与仿生交互技术,其产品已进入迭代测试阶段。
第二梯队为目前或年内估值超过3亿美元、具备量产能力的硬件驱动企业,如星动纪元、智平方、逐际动力、星海图、众擎机器人、乐聚机器人等,其核心机型已进入小批量交付阶段。
此外,潜力层还覆盖了星空智能、穹彻智能、松延动力等企业。整体来看,头部企业依托资本与研发优势加速技术迭代,腰部厂商则通过差异化场景落地争夺市场空间,行业竞争正逐步向产品成熟度与商业化能力倾斜。
![]()
![]()
![]()
![]()
![]()
![]()
3、重点环节市场格局
(一)芯片
具身智能产业的发展离不开多元化芯片体系的支持,其产业链涵盖了从云端训练到终端执行的全链条硬件需求。所需芯片种类主要包括AI算力芯片、通用计算芯片、传感器接口芯片、存算一体芯片以及通信与互联芯片等。其中,AI算力芯片是支撑具身智能实现“感知-决策-执行”闭环的关键硬件,处于产业核心地位。根据部署位置与功能的不同,具身智能AI芯片可划分为云端训练芯片、云端推理芯片和端侧推理芯片三类。这三类芯片在设计目标、技术路线及应用场景方面均存在显著差异,共同支撑起具身智能系统在不同层级中的算力需求。
![]()
(二)传感器
传感器是具身智能系统(包括人形机器人)与外界进行感知交互的关键部件。具身智能通过配备多种传感器来实现对外部环境的感知和自身状态的监测,从而完成复杂的交互与操作任务。根据应用载体的不同,传感器的功能定位和应用场景存在显著差异。在机器人领域,传感器主要用于模拟人类的感知能力,以支持精细化操作和高水平人机交互,例如触觉传感器用于检测接触力、温度及物体滑动状态,六维力传感器则协助实现关节力矩的精确控制,从而完成抓取和装配等复杂任务。而在自动驾驶载具中,传感器更侧重于环境建模与动态障碍物规避,如激光雷达提供高精度三维点云以识别障碍,毫米波雷达凭借强大的穿透能力适应恶劣环境,超声波雷达则常用于近距离泊车检测。
![]()
对于具身智能而言,智能体的力感知能力以及与外部的触觉、视觉、听觉交互能力极为关键,其对应的传感器性能直接决定智能体的环境适应性与应用边界。在人形机器人中,力传感器、电子皮肤、视觉传感器和惯性传感器是支撑其迈向高度具身智能的核心元件。这些传感器不仅单位价值较高,还与人形机器人向智能化、仿生化和高自由度方向的发展密切相关,对整体性能起到决定性作用,因此具备显著的市场潜力与广阔的应用前景。
在各类机器人传感器中,六维力传感器因其能够同时检测三个方向的力和力矩,已成为实现高精度操作与力控交互的核心部件。全球领先企业主要集中在欧美,产业起步较早。自20世纪70年代初以来,国外便开始了对多维力传感器的研究。目前,全球机器人用多维力传感器的主要生产厂商包括美国的ATI、AMTI、JR3和Lord,瑞士的Kistler,德国的Schunk和HBM,以及加拿大的Robotiq和丹麦的OnRobot等。这些公司产品线丰富,定制化能力强,广泛覆盖多个下游应用领域。
国内对六维力传感器的研究始于20世纪90年代,近年来入局企业不断增多。目前主要厂商包括宇立仪器、坤维科技、鑫精诚、海伯森、蓝点触控、神源生智能及瑞尔特测控等。在协作机器人领域,六维力传感器的国产化率已处于较高水平。根据GGII数据,2022年坤维科技在该细分领域出货量位居第一,市占率约60%,其后分别为ATI、蓝点触控、宇立仪器(已进入特斯拉供应链)和鑫精诚等。各家国产厂商在不同下游应用中形成了各自的侧重和优势。
全球及中国六维力传感器主要企业如下表所示。
![]()
![]()
(三)AI 算法与大模型
AI算法是人工智能实现感知、推理与决策的核心方法集合,而大模型则是基于海量参数和复杂架构的算法高级形态,尤其依托深度学习与Transformer结构实现跨模态信息融合与通用任务处理。在具身智能领域,大模型作为一类关键的AI算法集成形式,显著提升了智能体对物理环境的交互与任务泛化能力,成为实现“感知-决策-行动”闭环的核心软件基础,并持续推动机器人及泛具身智能系统的发展。这类模型通常基于多模态架构,融合视觉、语言、动作等多种感知与决策模态,能够执行从高层任务理解到底层运动控制的各种功能。按其核心功能可大致分为感知与场景理解模型、任务与运动规划模型以及端到端控制模型三大类。典型应用涵盖机器人导航与避障、物体抓取与操作、人机交互与协同作业等,既支持工业自动化、仓储物流等企业级场景,也逐步渗透至家庭服务、教育陪伴等消费级领域。通过与专用AI芯片协同优化,具身智能大模型正朝着更低延迟、更高能效和更强泛化能力的方向演进。
在国际上,具身智能大模型的研究主要由谷歌、英伟达、Meta等科技巨头与斯坦福、伯克利等顶尖高校主导,聚焦于多模态融合、实时运动规划与端到端控制等核心能力。与此同时,国内也涌现出一批专注于具身智能大模型研发的企业与科研团队,呈现出高校背景团队与市场化科技公司并进的竞争格局。清华大学TSAIL团队等科研机构在强化学习与仿真训练方面底蕴深厚;智元机器人、有鹿机器人等企业侧重服务与家庭机器人产品的系统整合与落地;若愚科技、千识科技等创业公司则聚焦垂直场景,如工业巡检与家庭清洁,推动模型实用化与低成本部署;银河通用、穹彻智能等新兴力量致力于端到端抓取与人形机器人控制等前沿方向,展现出良好的技术创新能力。整体上,国内企业在模型的多模态融合、实时响应与场景适应性方面持续突破,逐步形成差异化竞争力。
![]()
![]()
➢ 如欲获取完整版PDF文件,可以关注钛祺汽车官网—>智库,也可以添加钛祺小助理微信,回复“报告名称: 2025具身智能产业链研究报告:AI走出数字世界,具身智能开启商业化浪潮 ”。
点击下方,查看近期热门行业研究报告
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.