网易首页 > 网易号 > 正文 申请入驻

IROS 2022 | 机器人通过预测距离主动寻找目标物品

0
分享至

物体目标导航(Object Navigation) 是智能机器人的基本任务之一。在此任务中,智能机器人需要在新的环境中探索并移动到某类目标物体附近。物体目标导航任务面向未来家庭服务机器人的应用需求,当人们需要机器人完成某些任务时,例如拿一杯水,机器人需要先寻找并移动到水杯的位置,才能使用机械臂拿到水杯。

本文针对物体目标导航任务,字节跳动人工智能实验室的研究者提出了一种基于目标距离预测的方法,通过环境中的语义信息及物体关联,预测地图上每个位置到目标物体的最短路径长度,引导机器人高效寻找物体,该工作发表于最近的IROS 2022 (IEEE/RSJ International Conference on Intelligent Robots and Systems) 机器人顶级会议上。

论文地址: https://arxiv.org/abs/2202.03735

一、研究背景

在传统机器人导航任务中,环境的地图一般是提前构建好的,同时机器人也知道目标的位置。然而在物体目标导航任务中,机器人在一个未知的环境中没有事先构建的环境地图,并且目标是以物体类别的方式给出。因此,机器人必须一边探索环境构建地图,一边寻找目标物体。

那么如何高效地寻找物体?在一个新的环境中,由于没有先验地图,机器人只能利用在其他相似环境中学到的知识,比如物体之间的空间关系。人类在新环境中寻找物体时,可能会优先在相关物体附近寻找目标物体。例如,如果目标是找一把椅子,当人们看到了一张桌子时,应该优先去桌子周围找椅子。这是因为人们知道椅子通常会放在桌子附近。如果可以将这种先验知识结合到机器人在传统导航任务使用的地图中,就可以将物体目标导航任务转化为传统导航问题。

基于上述想法,作者提出让机器人基于当前已探索区域的语义地图,利用学到的先验知识,预测一张距离地图,地图中的每个栅格保存从该点出发到目标物体的最短路径长度。通过预测的距离值选择合适的目标点,即可实现高效的物体目标导航。

二、方法介绍

算法由三个模块组成:语义建图模块、目标距离预测模块和局部策略 (Local Policy)。

图1 算法流程示意图

算法的输入是第一视角的RGB-D图像和机器人位姿,以及需要寻找的目标物体类别,输出是下一步动作 (action)。首先对 RGB 图像进行语义分割,然后根据深度图和机器人位姿更新语义地图。之后基于语义地图,使用距离预测模型预测一个距离地图,该地图的每一个栅格存储了从该位置到目标物体的最短路径长度。根据距离图,局部策略选择一个中期目标,并使用传统路径规划方法获得下一步动作。

语义建图模块

作者采用了论文[1]中的方法,首先使用 Mask RCNN 获得 RGB 图像的语义分割结果,然后根据深度图和机器人位姿得到 3D 语义点云,再投影到水平面上即可得到 2D 语义地图。

目标距离预测模块

作者使用一个 CNN 预测目标的距离,网络的输入是当前已探索的局部语义地图,根据需要寻找的目标物体类别,输出对应的局部距离地图。作者没有直接训练网络预测准确的距离值,而是将距离分为几个范围,将回归问题转化为分类问题,从而降低学习难度。

采集训练数据时,只需要提前生成整个训练场景的距离地图的真值,机器人可以在训练环境中以任意策略探索,同时根据位姿从完整距离地图中获取局部距离地图,和构建的局部语义地图一起组成一组训练样本。

图2 左:距离地图的真值(Ground Truth)示意图 右:网络输入输出示意图局部策略

局部策略首先通过一种目标选择策略获取一个中期目标 (mid-term goal),然后使用传统路径规划算法规划路径并得到下一步动作。

其中目标选择策略如图3所示,灰色格代表已探索区域,白色格表示未知区域,蓝色格为探索边界。由于机器人并不知道目标位置(红五角星),因此使用目标距离预测模块预测距离图(红色数字),结合已探索区域的距离值(黑色数字),即可在探索边界附近选择中期目标,使机器人到目标的路径长度(红色数字+黑色数字)最短。

作者还设计了另外两种策略,具体细节可参考原论文。

图3 中期目标选择策略示意图

三、实验结果

算法在 Matterport3D (MP3D) 数据集上进行了测试,达到了业界先进水平。同时作者也将算法迁移到实体机器人上在真实家居环境中进行测试,平均成功率为84.7%。

四、总结

作者提出了一种基于距离预测的物体目标导航方法,该方法根据学到的先验知识预测目标距离地图,并在该地图上选择合适目标点,帮助机器人更快地找到目标物体。本工作达到了业界先进水平,并在实体机器人上进行了验证。此外,作者还提到了算法未来的改进方向,例如增加房间类别预测,利用房间和目标物体之间的关系更好地预测目标物体的距离。

参考文献

[1] D. S. Chaplot, D. Gandhi, A. Gupta, and R. Salakhutdinov. Object goal navigation using goal-oriented semantic exploration. In Neural Information Processing Systems (NeurIPS), 2020.

[2] Yiqing Liang, Boyuan Chen, Shuran Song. SSCNav: ConfidenceAware Semantic Scene Completion for Visual Semantic Navigation. In International Conference on Robotics and Automation(ICRA), 2021.

[3] Ye J, Batra D, Das A, et al. Auxiliary tasks and exploration enable objectnav[J]. arXiv preprint arXiv:2104.04112, 2021.

作者:Minzhao Zhu

Illustration by IconScout Store from IconScout

-The End-‍

门侃 | AIGC 直播活动来啦!

学术界关心哪些应用场景的问题?产业界又在思考怎样的技术创新?技术和艺术如何协同?AI创造力有哪些想象空间?11月24日晚20点,快来参加门侃直播活动一“侃”究竟吧!

扫码观看!

本周上新!

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台湾方面不接受“一国两制”,王毅回应:往后台湾只有一个称呼

台湾方面不接受“一国两制”,王毅回应:往后台湾只有一个称呼

人生录
2026-06-22 15:37:48
日方逮捕一与电诈集团有关男子,外交部:望周边国家与中方一道加大执法合作力度

日方逮捕一与电诈集团有关男子,外交部:望周边国家与中方一道加大执法合作力度

澎湃新闻
2026-06-22 15:32:26
孟加拉国为何为阿根廷队疯狂:梅西与他们

孟加拉国为何为阿根廷队疯狂:梅西与他们

坠入温柔晚风
2026-06-23 00:17:51
尴尬纪录终结,贝尔萨的球队首次在世界杯单场打进2球

尴尬纪录终结,贝尔萨的球队首次在世界杯单场打进2球

林子说事
2026-06-22 15:49:13
以色列开战以来最惨重创!王牌36师师部被精准斩首,高级军官团灭

以色列开战以来最惨重创!王牌36师师部被精准斩首,高级军官团灭

扬子的故事屋
2026-06-22 13:52:48
巴拉圭美女球迷谈爆火出圈:土耳其给我带来了好运

巴拉圭美女球迷谈爆火出圈:土耳其给我带来了好运

懂球帝
2026-06-22 21:20:13
斯卡洛尼力挺梅西备战阿奥战

斯卡洛尼力挺梅西备战阿奥战

体坛周报
2026-06-22 16:26:14
42岁李宇春嫁法国老头真相曝光,近况不意外

42岁李宇春嫁法国老头真相曝光,近况不意外

微风轻拂面
2026-06-21 17:45:18
定了!独行侠聘达斯迪・梅出任主帅:他率密歇根拿下今年NCAA冠军

定了!独行侠聘达斯迪・梅出任主帅:他率密歇根拿下今年NCAA冠军

罗说NBA
2026-06-22 22:26:58
实事求是,姆巴佩点评梅西!

实事求是,姆巴佩点评梅西!

体育哲人
2026-06-22 16:52:28
队友说没义务传给C罗被冲爆:你哪位啊?学学阿根廷怎么尊重梅西

队友说没义务传给C罗被冲爆:你哪位啊?学学阿根廷怎么尊重梅西

圣西罗的太阳
2026-06-22 13:15:29
彻查!信号强烈!中央升级反腐“天网”!

彻查!信号强烈!中央升级反腐“天网”!

职场资深秘书
2026-06-21 14:07:53
高市早苗对天皇发重誓,不到48小时,王毅就接到美国急电,有要事

高市早苗对天皇发重誓,不到48小时,王毅就接到美国急电,有要事

莹莹的历史说
2026-06-22 12:40:05
葡萄牙爆发内讧!内维斯女友炮轰C罗:自私鬼赶紧退役

葡萄牙爆发内讧!内维斯女友炮轰C罗:自私鬼赶紧退役

球事百科吖
2026-06-20 03:06:48
红利曼丢了,连锁反应就来了

红利曼丢了,连锁反应就来了

星火聊天下
2026-06-22 07:09:14
TA:对梅西来说要凭实力入选国家队,没把参加美加墨视为理所当然

TA:对梅西来说要凭实力入选国家队,没把参加美加墨视为理所当然

兰亭墨未干
2026-06-22 17:11:55
中国要做好最充足的打算:一旦俄罗斯打赢了,我们可能要做3件事

中国要做好最充足的打算:一旦俄罗斯打赢了,我们可能要做3件事

离离言几许
2026-06-22 00:55:51
中国灵活就业者突破3.2亿大关,占就业人口比例高达44%。

中国灵活就业者突破3.2亿大关,占就业人口比例高达44%。

流苏晚晴
2026-06-13 18:21:18
再爆冷门,佛得角连续逼平两个世界杯冠军!门将母亲安娜:感谢中国球迷

再爆冷门,佛得角连续逼平两个世界杯冠军!门将母亲安娜:感谢中国球迷

上观新闻
2026-06-22 12:22:05
男子车底检修,妻子启动铲车,险被碾死,丈夫曝妻子买2000万保险

男子车底检修,妻子启动铲车,险被碾死,丈夫曝妻子买2000万保险

川渝视觉
2026-06-22 20:56:28
2026-06-23 03:40:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2410文章数 596关注度
往期回顾 全部

科技要闻

马云与阿里巴巴众高管下田插秧

头条要闻

阿根廷2-0奥地利 卫冕冠军2连胜提前晋级32强

头条要闻

阿根廷2-0奥地利 卫冕冠军2连胜提前晋级32强

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

财经要闻

前美联储主席格林斯潘去世 享年100岁

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

房产
家居
艺术
数码
时尚

房产要闻

一年时间,36个盘“消失”!海口楼市,罕见“大收缩”!

家居要闻

绿意盎然 自然之境

艺术要闻

光设计就刷屏!南京“绿洲大厦”,层层像梯田!

数码要闻

消息称三星显示已获苹果量产认证,将为折叠屏iPhone独供OLED面板

羞辱妈妈的烂梗,越来越歹毒了

无障碍浏览 进入关怀版