在2026中关村论坛年会机器人餐吧里,一个场景让不少参观者驻足:顾客扫码下单后,系统自动拆分任务,6台来自不同厂商的机器人协同工作,分别完成咖啡制作、糖葫芦现穿、餐品抓取、配送上桌等服务,全程无人工干预,仅需两分钟,一份咖啡配甜点的套餐便可送至顾客手中。
把时间轴再向前推,在机器人“浓度”超高的2026年春晚舞台上,来自松延动力、银河通用、宇树科技、魔法原子的人形机器人翻跟头、盘核桃、演小品、秀歌舞,行云流水的表演让不少观众感叹:机器人真的“活”了。
这些贴近大众生活的前沿缩影,正是具身智能产业快速崛起的验证。今年政府工作报告明确提出培育发展具身智能等六大未来产业,这已是“具身智能”连续第二年出现在政府工作报告中。从首次写入时的“破冰”意义,到今年的再次强调,这一前沿技术正加速从实验室走向产业主战场。
行业预期更加明朗
根据行业普遍共识,具身智能是一种将人工智能与物理实体相结合,让智能系统具备感知、思考与物理交互能力的技术方向。当这一技术能力赋予机器人,便诞生了“具身智能机器人”。在众多形态中,人形机器人因其与人类环境、工具、场景的高度兼容性,被视为具身智能的最佳载体,也是当前产业竞逐的焦点。
具身智能产业在2025年实现了跨越式发展,其中人形机器人出货量已初具规模。知名咨询公司IDC发布的《全球人形机器人市场分析》显示,2025年全球人形机器人出货量约为1.8万台,同比增长约508%。
进入2026年,行业预期更加明朗。“这次参会,一个很直观的感受是人形机器人的商业化进程明显提速了。”在2026中关村论坛年会现场,一位长期关注硬科技的投资人士向《中国报道》记者感慨道。他表示,接下来将更多关注来自产业链上游核心零部件和下游应用场景方面的投资机会。而在同一场论坛的AI开源前沿分论坛上,“2026年将成为人形机器人量产并实现规模化应用的元年”这一判断,更是成为与会嘉宾的共识。
共识的背后,是量产数据的强力支撑。3月28日,我国人形机器人头部企业智元机器人的第10000台通用具身机器人“远征A3”正式下线。据披露,在过去一年半中,智元机器人的本体生产能力呈现指数级发展,短短15个月内即实现量产规模从千台到万台的十倍级跨越,刷新了全球人形机器人量产速度纪录。
高工机器人产业研究所数据显示,2026年国内人形机器人出货量有望攀升至6.25万台。这意味着,人形机器人正在从“实验室里的样品”变成“生产线上的产品”,真正迈入规模化应用的新阶段。
中国信通院发布的《具身智能发展报告(2025年)》显示,在工业制造、物流仓储、医疗康养和商业服务等场景,具身智能将成为生产工具,提升生产效率与质量,推动行业向智能化、柔性化转型。也有分析数据显示,2026年,从任务属性与产业落地来看,工厂与物流流水线是机器人最先实现规模化应用的主战场,工业渗透率有望突破15%,成为增长最快的应用领域。
“具身智能规模化应用将会在2026年开始,全面落地则需要5—10年。”银河通用联合创始人张直政表示,5年后银河通用将在高难度典型场景实现规模化应用,成为全栈发展的领跑企业,并以链主公司形态带动行业繁荣,扶持细分领域有特点、有专长的企业发展,为市场提供更全面的价值。
底层技术还需持续突破
“学术界已在受控环境下证明智能体可完成复杂任务,但从实验室到真实场景还有较大距离。”中国科学院自动化研究所多模态人工智能系统全国重点实验室副主任王亮告诉《中国报道》记者,未来的核心挑战,不仅要让机器人更聪明,还要让它在复杂多变的环境中可靠地工作。
王亮认为,具身智能要想快速走进大众生活,离不开底层技术的持续突破,首先是以大模型为基础的通用感知和决策能力的跃升。过去为每个任务训练专用模型,泛化能力较差,换一个场景就要重新来过,如今借助视觉语言模型等新范式,智能体开始具备跨场景、跨任务的泛化潜力,一旦这个方向取得实质性突破,具身智能的应用边界将极大拓宽。
“其次是机器人的物理理解能力。要在真实环境中可靠地工作,机器人必须对物理世界有基本的预测能力,包括理解物体的材质、重量、运动趋势等,这方面的进展将直接提升系统在复杂场景中的安全性和可靠性。此外,软硬件的协同设计也至关重要,算法的能力上限很大程度上取决于硬件的设计,反过来算法的进展也应驱动硬件迭代,真正能落地的产品,一定是两者深度耦合的结果。”王亮说。
三大方向的突破,均需要高质量的数据支撑。与传统AI“输入数据、输出答案”的线性模式不同,具身智能需要在物理交互中完成自主进化的闭环:机器人被部署到真实场景,在执行任务中收集行为数据,这些数据被用于模型训练与迭代,优化后的模型再部署到更多机器人上,从而收集更多、更高质量的数据。在这一闭环中,数据既是起点,也是驱动飞轮持续转动的“燃料”。
然而,目前的数据供给仍面临严峻挑战。《具身智能发展报告(2025年)》显示,行业普遍认为,要实现物理智能的涌现至少需要百万甚至千万小时的高质量真实行为互动数据。现阶段实际可用的数据量远远不够,且数据采集、处理和使用等环节仍面临突出问题。以采集环节为例,真实数据采集依赖场景搭建、专业设备和专家示教,且整个采集过程需要采集员进行人在环的质量把控,单次采集成本远高于图像或文本数据。
国内企业正致力于攻克相关难题。在中关村(海淀)具身智能创新产业园,记者探访了一座专门面向具身智能机器人的“数据工厂”——诺亦腾机器人,其在全球专业惯性动作捕捉市场中占据约70%的份额。
采访现场,一个简单的抓握瓶子动作,机器人要随着工作人员进行多次同步模拟,动作捕捉的不只是操作方式,还有指尖如何触碰、压力大小等信息。诺亦腾机器人副总裁李遥介绍,公司研发的高精度数据采集系统可采集人的运动、力触觉等多个模态的数据,精度达亚毫米级,已为宇树科技、智元机器人、小鹏等企业产出用于机器人算法训练的可用数据集。
在真实的数据采集之外,合成数据是破解供给难题的新思路。日前,全球领先的多模态生成式人工智能企业智象未来与诺亦腾机器人达成合作,二者将多模态大模型的毫米级可控视频生成能力与真实数据基础设施结合,以“真实数据+生成式视频数据”融合,预计年内可生成数万小时以上的具身智能视频数据,这将开辟出可规模化供应行业急需的高质量具身训练数据的新路径。
有望开启全新的“超级终端”时代
作为与物理实体结合的人工智能,具身智能有望催生颠覆性终端产品装备,开启一个全新的“超级终端”时代。
在2026中关村论坛年会预热集体采访环节,无界动力创始人兼CEO张玉峰从终端演进路径的角度分析了这一趋势。在他看来,过去20年间,通信终端经历了从功能机到智能机的跃迁,出行终端从传统汽车走向新能源汽车与智能网联汽车,具身智能正处在一个类似的转折点上——从功能型机器人迈向真正意义上的智能型机器人。
机遇当前,全球竞逐。不少发达国家已将具身智能纳入战略布局,科技巨头则在技术研发与产品落地上持续加码。
以美国为例,去年1月,美国启动“星际之门”计划,拟在4年内投入5000亿美元建设数据中心集群与半导体基础设施,支撑具身智能高算力需求;同年7月,发布《赢得竞争:美国人工智能行动计划》,以监管松绑为具身智能发展扫清制度障碍。美国企业方面,英伟达创始人黄仁勋在2025年消费电子展(CES)上指出,“人工智能的下一个前沿是具身智能”,并预测通用人形机器人的“ChatGPT时刻”即将到来;特斯拉将研发具备自主性的人形机器人列为优先事项,其官方微博今年2月发布的预告视频中,马斯克宣布,第三代特斯拉人形机器人即将与公众见面;OpenAI也重启机器人软件项目,并在消费硬件方向上展开布局。
面对加速升温的全球竞争,我国是否做好了准备?在张玉峰看来,答案不仅是肯定的,而且我们还手握一张“先手牌”。
张玉峰分析道,PC、家电等品类的标准和生态长期由海外国家定义,而我国新能源汽车的全产业链优势已为中国汽车产业赢得了全球话语权。如今在具身智能领域,得益于强大的硬件生态与供应链基础、广阔的场景纵深、丰富的AI人才资源,我国已经处于全球第一梯队,将迎来定义“超级终端”的历史性机遇。
数据提供了较为直观的佐证。从市场规模看,IDC预测数据显示,2026年,全球智能机器人硬件市场规模将逼近300亿美元,中国正成为这场增长的核心引擎。届时,中国具身智能机器人市场规模将突破110亿美元,服务和消费机器人厂商的全球出货占比超过85%,市场增速持续保持在120%左右。
来自产业方面的支撑也日益夯实。目前,我国人形机器人企业已经有150多家;长三角、粤港澳大湾区、京津冀等地建设了多层次的创新平台,打通了产业链上下游,形成了极具活力的具身智能产业集群。
随着我国在“大脑—小脑—身体”协同技术上实现关键突破,人形机器人的量产能力也已跻身世界前列。IDC发布的《全球人形机器人市场分析》显示,2025年全球人形机器人出货量排名前六位的厂商均为中国企业,其中宇树科技、智元机器人形成“双龙头”格局。
王亮指出,我国具身智能产业早已进入加速布局阶段,全域构建起完善的政策、人才、产业生态,各项新技术正迎来突破。在这场关乎未来的产业变革中,我国有望成为领跑者。
撰文:《中国报道》记者 陈珂
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.