![]()
撰文丨王聪
编辑丨王多鱼
排版丨水成文
近几年,基于大语言模型(LLM)的人工智能,以及机器人技术取得了一系列突破性进展,将二者结合的具身智能(Embodied AI)机器人,拥有无限想象空间。然而,将自然语言指令转化为机器人的可靠物理动作,仍是该领域面临的核心挑战,也就是说,我们仍需努力让机器人能够“听懂人话”。
2026 年 3 月 16 日,华为诺亚方舟实验室(Huawei Noah’s Ark Lab)的研究人员在 Nature 子刊Nature Machine Intelligence上发表了题为:A robot operating system framework for using large language models in embodied AI 的研究论文。
该研究通过将大语言模型智能体(LLM Agent)与机器人操作系统(ROS)相结合,构建了一个通用具身智能框架——ROS-LLM,并完全开源,该框架具备以下特性——自动将语言模型输出转化为机器人可执行指令;支持内联代码和行为树两种可互换的执行模式;通过模仿学习实现原子技能的自扩展能力;结合自动化优化与人机交互反馈实现持续改进。经多场景验证(包括长周期任务、桌面重组、动态优化等),该框架展现出良好的稳健性、可扩展性和适应性。值得注意的是,所有实验结果均基于开源预训练模型实现,且均在真实机器人(涵盖固定基座机械臂和带机械臂可行走机器人)上进行,从而为具身智能研究提供了可复现的解决方案。
这项研究不仅展示了人工智能与机器人技术融合的巨大潜力,更为我们描绘了一个更加智能、便捷的未来生活图景——当机器人能够真正听懂人话,人类-机器人协作将进入一个全新时代。
![]()
机器人的“最后一公里”难题
传统工业机器人虽然精准高效,但需要专业工程师编写复杂的控制程序。这种专家依赖模式成本高昂,且难以适应家庭、实验室等非结构化环境。当任务稍有变化,就需要重新编程,这大大限制了机器人的普及应用。
更棘手的是,现实世界充满不确定性——物体位置变化、环境动态调整、任务需求多样,传统预设程序难以应对这些挑战。这正是机器人从工厂走向家庭的“最后一公里”障碍。
ROS-LLM:连接语言与动作的智能桥梁
ROS-LLM框架的核心创新在于,它巧妙地将大语言模型(LLM)的“思考能力”与机器人操作系统(ROS)的“执行能力”无缝对接。
工作原理:当你用自然语言(人话)发出指令时,大语言模型会理解你的意图,将其分解为一系列原子动作(例如“移动到咖啡机前”、“拿起咖啡杯”等),然后生成对应的 ROS 代码,指挥机器人按步骤执行。
三大核心技术突破——
模仿学习新技能:非专家可以通过三种方式教机器人新动作——视觉观察、摇杆遥操作或直接手把手教学。研究团队在厨房模拟环境中,成功教会了机器人搅拌、倾倒、抛锅、擦桌子、调味和磨碎等烹饪动作。
人类反馈实时修正:就像教小孩子做事一样,当机器人犯错时,只需简单纠正(例如提醒它“别忘了拿刀叉”),它就能立即调整策略。实验显示,在复杂任务中,加入人类反馈后成功率显著提升。
环境自适应能力:如果目标物体被移动,机器人会重新定位并完成任务。更智能的是,它还能记住这次经验,下次遇到类似情况时自主应对,减少对人的依赖。
![]()
性能与交互结果
真实世界的全面验证
研究团队在三大场景中验证了框架的实用性:
家庭厨房任务:UR5 机械臂成功完成了“煮咖啡”这一包含 12 个步骤的复杂任务,从寻找杯子到操作咖啡机,全程自主完成。
远程操控任务:远在欧洲的操作员通过聊天界面,成功控制了位于亚洲的机器人完成避障抓取任务,仅有 2-3 秒的延迟。
化学实验室自动化:机器人完全按照自然语言描述的实验步骤,自主完成了“测试碳酸氢钠 pH 值”的化学实验,包括配制溶液、使用 pH 试纸、观察颜色变化等精细操作。
![]()
咖啡制作任务分解为 12 个原子动作
开源开放的生态优势
与许多依赖商业大模型的研究不同,ROS-LLM 全部使用开源模型(例如 DeepSeek-7B Coder),确保了技术的可复现性和可访问性。研究团队已将完整代码开源,任何研究者都可以在此基础上继续创新。
论文中的对比显示,ROS-LLM 在多个维度上超越了现有方案:同时支持开源模型、人类反馈、环境反馈、真实机器人实验、模仿学习、原子动作优化、远程控制和完整的 ROS 能力。
人人可用的机器人时代
这项研究的深远意义在于,它大幅降低了机器人使用的技术门槛。未来,家庭服务机器人、实验室助手、远程作业设备等,都可能通过自然语言直接控制,无需编程专业知识。
研究团队表示,最终目标是让机器人像智能手机一样普及,让每个人都能轻松地与机器人协作,完成从家务到专业工作的各种任务。
随着大语言模型(LLM)的不断进步和机器人硬件的成本下降,ROS-LLM这样的框架将加速机器人进入千家万户的进程。或许不久后,对机器人说“帮我做晚饭”或“整理一下房间”,就会像今天使用语音助手设置闹钟一样平常。
论文链接:
https://www.nature.com/articles/s42256-026-01186-z
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.