网易首页 > 网易号 > 正文 申请入驻

让机器人「不只是走路」,Nav-R1引领带推理的导航新时代

0
分享至



在机器人与智能体领域,一个长期的挑战是:当你给机器人一个「去客厅把沙发上的书拿来」或者「沿着楼道走到门口,再右转」这一类指令时,机器人能不能不仅「看见环境」,还能「理解指令」、「规划路径」、然后「准确执行动作」?



之前的许多方法表面上看起来也能完成导航任务,但它们往往有这样的问题:推理(reasoning)的过程不够连贯、不够稳定;真实环境中路径规划与即时控制之间难以兼顾;在新的环境里泛化能力弱等。

Nav-R1 出场:什么是 Nav-R1?



  • 论文标题:Nav-R1: Reasoning and Navigation in Embodied Scenes
  • 论文地址:https://arxiv.org/pdf/2509.10884

这篇题为《Nav-R1: Reasoning and Navigation in Embodied Scenes》的新论文,提出了一个新的「身体体现式(embodied)基础模型」(foundation model),旨在让机器人或智能体在 3D 环境中能够更好地结合「感知 + 推理 + 行动」。简单说,它不仅「看到 + 听到+开动马达」,还加入清晰的中间「思考」环节。

核心创新

1.Nav-CoT-110K:推理轨迹的冷启动(cold-start)基础



作者构造了一个大规模的数据集Nav-CoT-110K,包含约 11 万(110K)条 Chain-of-Thought(推理链 / 思考链、CoT)轨迹。每条轨迹里不仅有任务描述(导航指令),还有机器人从环境中看到的 egocentric 视觉输入 (「我从这里看到了墙、看到了桌子、右边是沙发…」 等),以及每一步可能的行动选项,再加上明确格式化的思考与动作输出。

这些轨迹用于冷启动训练(即监督训练阶段),使模型「先学会怎么思考 + 怎么根据环境和指令决定动作」,在进入强化学习 (RL) 优化之前就已有了一个较为稳定的推理与行动基础。

2.三种奖励(rewards):格式、理解、路径



在强化学习阶段,Nav-R1 不只是简单地奖励「到达目的地」,它引入了三种互补的奖励机制,使得行为更精准、更有逻辑、更符合人类期待:



  • 等标签的分明区分,这样既便于机器解析,也让内在推理清晰。
  • Understanding Reward(理解奖励):鼓励模型不仅「走到目标」,还要能语义上理解环境,例如回答场景问题、视觉与语言间对齐、语义正确。包括对正确答案的精确匹配,也包括与视觉输入(如 RGB-D 图像)的语义对齐。
  • Navigation Reward(导航奖励):关注路径的 fidelity,也就是路径与参考路径的匹配度 (trajectory fidelity)、终点精度 (endpoint accuracy) 等。通过这一奖惩机制,保证机器人走出来的不仅只是到达目的地,而是走出一条合理、不绕弯、不浪费时间的路径。

3.Fast-in-Slow 推理范式:脑子快 + 身体稳

一个非常有意思的设计灵感是借鉴人类认知中的 “双系统理论”(Thinking Fast and Slow 等),即一个系统擅长深思熟虑、长远规划;另一个系统擅长快速反应、实时控制。



  • Slow 系统(System-2):以较低频率工作,处理更宏观、更长时段的语义信息和历史观察(视觉历史、语言指令等),负责制定长期目标和语义一致性。
  • Fast 系统(System-1):以高频率执行,负责即时响应,控制短期动作,比如避障、调整姿态、走直线或转弯等。它借助 Slow 系统的 latent 指导,但自己要轻量、低延迟。
  • 两者异步协调:Slow 提供大致方向和语义指导,Fast 则负责执行,保证在复杂环境中既不丢失目标语义一致性,也能快速响应环境变化。

实验与效果:真的有用吗?

Nav-R1 给出的实验证据很有说服力,既有模拟环境中的各种基准(benchmarks)也有真实机器人部署。

  • 在多个导航任务(如视觉 - 语言导航 Vision-Language Navigation 的 R2R-CE、RxR-CE,以及物体目标导航 ObjectGoal Navigation 等)中,Nav-R1 的成功率(success rate)、路径效率 (SPL, 路径长度加权指标) 等指标相比于其他先进方法提升了约 8% 或更多。



VLN 任务结果



ObjectNav 任务结果

  • 在真实硬件上的部署也通过了测试:机器人平台(WHEELTEC R550,Jetson Orin Nano + LiDAR + RGB-D 摄像头等硬件)在会议室、休息室、走廊这些不同的室内场景中执行导航任务,表现稳健。



Robot Setup



在三个不同的室内环境中进行真实世界实验结果

  • 延迟 / 实时性方面也做了设计优化:Nav-R1 虽然推理能力强,但通过云端推理 + 本地执行命令 + Fast-in-Slow 架构,使得在资源受限的边缘设备上仍可近实时运行(服务器端推理延迟在约 95 ms 左右)对比只在本地推理的大延迟优势明显。



平均推理延迟比较

Demo 展示:从仿真到现实的双重验证

为了让大家更直观地理解 Nav-R1 的能力,研究团队还准备了视频 Demo,涵盖仿真环境和真实机器人环境两类典型场景。

仿真环境:VLN 与 ObjectNav

在Habitat 仿真平台中,Nav-R1 接收自然语言导航指令,例如「从走廊穿过客厅,到达右边的沙发」。

  • 在VLN (Vision-Language Navigation)任务中,Nav-R1 能够理解复杂的语言描述。

指令:Walk past brown leather recliner. Walk through open french doors. Make hard left opposite zebra painting. Wait at mirror.





  • 在ObjectNav (Object Goal Navigation)任务中,给定目标类别(如「找到电视显示器」),Nav-R1 会主动探索、识别物体,并规划合理路径,避开障碍物,快速到达目标。

指令:Search for a tv monitor.





真实世界:VLN ObjectNav 机器人部署

研究团队还把 Nav-R1 部署在WHEELTEC R550 移动机器人平台(配备 Jetson Orin Nano、RGB-D 摄像头和 LiDAR)。在会议室、走廊、休息区等真实场景中,Nav-R1 执行类似的 VLN 指令和 ObjectNav 任务。

  • 在VLN (Vision-Language Navigation)任务中,Nav-R1 能够理解复杂的语言描述,并在真实环境中执行指令。

指令:Go to the black chair on your left and pause, then move forward to the front-right and stop at the blue umbrella.



  • 在ObjectNav (Object Goal Navigation) 任务中,给定目标类别(如「找到电视显示器」),Nav-R1 会主动探索真实环境、识别物体,并规划合理路径,避开障碍物,快速到达目标。

指令:Move straight ahead and look for the keyboard along the wall in front.



意义与应用场景

Nav-R1 它带来了一些比较实际且有影响力的可能性。

1. 服务机器人 / 家庭机器人

在家里,机器人要在杂乱的环境中穿行、按指令找东西、与人交互时,不仅要走得快、走得稳,还要走得「懂」。Nav-R1 的结构化推理 + 路径精准性 + 实时控制恰好能提升用户信心与使用体验。

2. 助老 / 医疗 / 辅助设备

在医院、养老院、辅助设施中,环境复杂,人多物杂,需要机器人能安全、可靠地导航,且对错误能够有语义上的理解与纠正能力。

3. 增强现实 / 虚拟现实

AR 或 VR 中,如果虚拟智能体或助手要在用户的物理环境中导航(或通过视觉输入理解环境为用户指路),这样的推理 + 控制结合非常关键。

4. 工业 / 危险环境

在工厂、矿井甚至灾害现场,机器人需要在未知或危险环境中执行任务。Nav-R1 的泛化能力与稳健性使得它可以作为基础模块进一步应用。

作者介绍


刘庆祥是上海工程技术大学电子电气工程学院在读硕士,研究方向聚焦于视觉语言导航、具身智能。曾参与多项科研项目,致力于构建具备具身世界模型。

黄庭是上海工程技术大学电子电气工程学院在读硕士,Zhenyu Zhang 和 Hao Tang老师的准博士生,研究方向聚焦于三维视觉语言模型、空间场景理解与多模态推理。曾参与多项科研项目,致力于构建具备认知与推理能力的通用 3D-AI 系统。

张泽宇是 Richard Hartley 教授和 Ian Reid 教授指导的本科研究员。他的研究兴趣扎根于计算机视觉领域,专注于探索几何生成建模与前沿基础模型之间的潜在联系。张泽宇在多个研究领域拥有丰富的经验,积极探索人工智能基础和应用领域的前沿进展。

唐浩现任北京大学计算机学院助理教授 / 研究员、博士生导师、博雅和未名青年学者,入选国家级海外高水平人才计划。曾获国家优秀自费留学生奖学金,连续两年入选斯坦福大学全球前 2% 顶尖科学家榜单。他曾在美国卡耐基梅隆大学、苏黎世联邦理工学院、英国牛津大学和意大利特伦托大学工作和学习。长期致力于人工智能领域的研究,在国际顶级期刊与会议发表论文 100 余篇,相关成果被引用超过 10000 次。曾获 ACM Multimedia 最佳论文提名奖,现任 ACL 2025、EMNLP 2025、ACM MM 2025 领域主席及多个人工智能会议和期刊审稿人。更多信息参见个人主页:https://ha0tang.github.io/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
面对沈月和白鹿,王鹤棣的偏爱和双标,都藏在了他的身体语言中

面对沈月和白鹿,王鹤棣的偏爱和双标,都藏在了他的身体语言中

体育小柚
2026-01-08 22:29:16
退休人员注意!2026年2月养老金发放时间或有变,会提前发放吗?

退休人员注意!2026年2月养老金发放时间或有变,会提前发放吗?

丁丁鲤史纪
2026-01-10 13:50:58
没救了?!澳大利亚,已被彻底抛弃!

没救了?!澳大利亚,已被彻底抛弃!

澳洲财经见闻
2026-01-10 14:42:17
丧夫的翁帆面相都变了,字字不提杨振宁,却句句戳进自己的心窝里

丧夫的翁帆面相都变了,字字不提杨振宁,却句句戳进自己的心窝里

趣味萌宠的日常
2025-12-29 10:21:55
6.3分暴涨至8.0分,这部美剧真神了

6.3分暴涨至8.0分,这部美剧真神了

天天美剧吧
2026-01-09 17:40:03
高中各科考试规律:数学满分150分,大部分人都是不及格状态!

高中各科考试规律:数学满分150分,大部分人都是不及格状态!

好爸育儿
2026-01-08 15:58:19
疑点太多!南博陈超当年被立刻枪决,更像是为了掩盖什么

疑点太多!南博陈超当年被立刻枪决,更像是为了掩盖什么

天气观察站
2025-12-30 19:10:01
中国经济转向!今明两年,最好不要把钱存定期,这几个原因很现实

中国经济转向!今明两年,最好不要把钱存定期,这几个原因很现实

现代小青青慕慕
2026-01-05 11:19:30
成都一大熊猫触摸电网后被电出惨叫!工作人员回应:使用瞬时脉冲电压防外逃,不造成伤害

成都一大熊猫触摸电网后被电出惨叫!工作人员回应:使用瞬时脉冲电压防外逃,不造成伤害

南国今报
2026-01-10 19:59:04
瑞幸咖啡实控人黎辉:父亲是原兰州军区副司令,妻子是知名主持人

瑞幸咖啡实控人黎辉:父亲是原兰州军区副司令,妻子是知名主持人

小莜读史
2025-12-16 14:58:18
秋后算账来了。美国严查“赴美生子”,当年钻漏洞的代价异常惨痛

秋后算账来了。美国严查“赴美生子”,当年钻漏洞的代价异常惨痛

鹰视狼顾之天下
2025-12-11 13:42:38
亚洲杯1-0,叙利亚首胜+升至第三,卡塔尔输球又输人+2连败垫底

亚洲杯1-0,叙利亚首胜+升至第三,卡塔尔输球又输人+2连败垫底

侧身凌空斩
2026-01-11 02:27:57
未来三年,四川省内户籍身份证有效期满换证数量将达2500万余张

未来三年,四川省内户籍身份证有效期满换证数量将达2500万余张

封面新闻
2026-01-09 12:57:23
中超第11座专业足球场年底落成:草皮和视野都是国内顶级!

中超第11座专业足球场年底落成:草皮和视野都是国内顶级!

邱泽云
2026-01-10 19:30:22
上市公司卖房又卖车!二手奔驰SUV挂“9.5万元”引董秘配偶出手,还卖了劳斯莱斯和宾利

上市公司卖房又卖车!二手奔驰SUV挂“9.5万元”引董秘配偶出手,还卖了劳斯莱斯和宾利

凤凰网财经
2026-01-09 19:15:17
4-2大逆转!3-0横扫!U23亚洲杯最新晋级形势有变,中国队难度大

4-2大逆转!3-0横扫!U23亚洲杯最新晋级形势有变,中国队难度大

大秦壁虎白话体育
2026-01-11 00:02:48
“这么多年,对这名同事只闻其名、不见其人!”纪委监委深挖细查,相关人员被处理

“这么多年,对这名同事只闻其名、不见其人!”纪委监委深挖细查,相关人员被处理

新京报政事儿
2026-01-10 10:36:53
拉玛西亚的大龄留级生,正在经历最寒冷的冬天

拉玛西亚的大龄留级生,正在经历最寒冷的冬天

稗官青史
2026-01-09 18:26:55
玉渊谭天丨中方加严管制两用物项,坚决遏制日本军国主义图谋

玉渊谭天丨中方加严管制两用物项,坚决遏制日本军国主义图谋

上观新闻
2026-01-10 07:14:09
上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

霹雳炮
2025-10-17 21:31:29
2026-01-11 02:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12088文章数 142534关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

教育
本地
亲子
游戏
公开课

教育要闻

表现不好,还不接受批评的学生,怎么教育比较合适?

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

亲子要闻

方媛晒三个女儿:大宝趴地上画画,二宝读英文书!三胎睡婴儿车里

《地平线6》首发为何没PS5版?原来只是没做完!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版