网易首页 > 网易号 > 正文 申请入驻

谷歌提出Transporter Networks: 基于视觉操作实现重新整理目标物体

0
分享至

来自谷歌的研究人员提出了名为Transporter Nets的简单模型架构,用于学习基于视觉的物体整理工作。

Transporter网络使用了新颖的机制来实现3D空间理解,避免依赖以目标为中心的表示,使其对基于视觉的操作具有更强的泛化性。同时,相比于基准方法,它具有更高的采样效率,在真实的机器人应用中更迅速、实用。

更多详情,请访问论文原文和项目主页:

论文链接:

https://arxiv.org/abs/2010.14406

代码链接:

https://transporternets.github.io/

后台回复【210312】可直接下载论文PDF~

整理是家务的主要内容,也是机器人在非结构化的环境中与人交互所要具备的基本功能(还包括往书架上摆放图书、在餐桌上移动餐具或将咖啡豆堆成堆等功能)。有些工作对于人类来说十分容易,却会给机器学习系统带来不小的挑战。比如,在整理书籍的时候,既需要考虑书的叠放位置和顺序,也需要确保书籍的边角相互对齐。

在机器学习的众多领域中,模型架构的些许不同也许会带来巨大的泛化性差异。例如,卷积结构在计算机视觉中很普遍,它可以有效编码平移不变性,使得不同位置状态的图像可以获取相同的响应。

而Transformer架构则通常用于语言处理过程中,利用自注意力机制来捕捉长程依赖关系。在机器人应用中,常常在学习到的模型中使用位置、关键点或目标描述子等以目标为中心的架构,但这些表示需要额外的手工标注的训练数据,同时,在描述无定形态(黏土团)、液体或零散的材料(切碎的菜)等目标时存在较大困难。

在这篇文章中,研究人员提出了名为Transporter Nets的简单模型架构,用于学习基于视觉的物体整理工作。Transporter网络使用了新颖的机制来实现3D空间理解,避免依赖以目标为中心的表示,使其对基于视觉的操作具有更强的泛化性。同时,相比于基准方法,它具有更高的采样效率,在真实的机器人应用中更迅速、实用。

研究人员已经开放了源码和测评基准仿真套件。

Transporter Networks:

用于目标整理的视觉机器人操作

Transporter Networks架构的关键在于将整理问题定义为了在3D空间中学习如何移动特定的一部分物质。与先前使用显式的目标定义不同,3D空间是一个更广泛的概念,可以定义空间单元并可包含目标、目标的一部分或者多个目标等。

对3D视觉世界表示的捕捉,使得Transporter Networks可利用这些特征计算出各种可能的重排布结构,并从中选择与训练数据最为接近的一种排布,利用这些排布参数化机器人行为。

这种方式使得模型有效泛化到未知目标,并更好地探索数据中的几何对称性以便于更好地应用于新的场景中。Transporter Nets可应用于更广泛的多种整理场景的机器人操作任务。

Transporter网络可以捕捉真实世界的深度表达,可以得出各种可能的排布可能,并寻找出最优的一种用于机器人训练。

Ravens基准

为了在连续的环境中公平地比较Transporter和基线模型、进行消融性分析,研究人员开发出了一个包含十种典型的基于视觉的整理任务评估套件。Ravens是一个内置随机特性,Gym API的模拟环境用于测评模仿学习的样本效率。Ravens避免了无法转移到真实情况的条件假设:观测数据仅仅包含RGB-D数据和相机参数;行为是末端执行器的位姿(可通过逆运动学转换为关键位姿)。

在十个典型任务上的实验表明,Transporter Nets的样本效率与其他端到端的算法相比可以实现数量级的提升,并且可以在仅仅100次示教后在多种任务上达到了90%的成功率,而基准模型则无法实现具有泛化性的结果。在实际过程中,这种方式使得收集足够的数据来训练真实的机器人更为有效(如下图所示)。

包括推入、放置等的十个基准测试任务。实验表明,Transporter的样本效率相比其他端到端的方法可以实现数量级的提升。

实验结果

在给定10个样本后,Transporter可以学会拾取和堆放任务,以及多模态任务,如下图所示:

通过学习闭环视觉反馈,Transporter通过少量演示来学习各种多步骤的负载任务,比如,移动汉诺塔的卡盘、箱子码垛、组装未知的工具包。这些任务需要相当长远的“视野”,模型必须按照正确的顺序作出一系列决策。这一策略同时还倾向于学习紧急恢复行为。

令人惊讶的是,模型除了学习感知之外还学会了高级的计划行为。例如,在解决汉诺塔问题时,模型需要学习下一步需要移动的卡盘;在码垛任务时,则需要找到空闲的货盘空间,并决定如何使货物适应这些空间。这些行为表明,模型具有baked不变性,可以集中力量学习更为高级的操作模式。

同时,Transporter Nets还可以学习使用两个致动器来定义任意基础运动,例如,将一堆小物体推入目标区域,或重新配置可变形的绳索以连接正方形三边剩余的两个端点。这意味着刚体的空间尾翼可作为非刚体的有用先验。

结 论

Transporter Nets为视觉操纵带来了一种新的方法,在取得成功的同时也存在一系列局限性。例如,它们可能容易受到3D数据中噪声的影响,实验中仅仅描述了稀疏路点进行运动控制的情况,而对于空间外基于力或基于力矩的控制行为还有待研究。

From: CoRL;编译: T.R

Illustration byNatasha Remarchuk from Icons8

- The End -

上周日的女生节推送中

恭喜这两位朋友中奖啦!

非常走心的留言

工作人员会尽快与你们联系哒~

扫码观看!

本周上新!

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

微信:thejiangmen

bp@thejiangmen.com

点个“在看”,分享好内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印媒曾曝料:2020年若不是中国99A坦克急上高原,印度或真会动手

印媒曾曝料:2020年若不是中国99A坦克急上高原,印度或真会动手

混沌录
2026-04-22 21:15:09
北京本周最高温直冲29℃!五一天气反转,或迎雷雨→

北京本周最高温直冲29℃!五一天气反转,或迎雷雨→

BRTV新闻
2026-04-27 11:35:26
机关事业单位人员大清理,这 5 类人员将被清退

机关事业单位人员大清理,这 5 类人员将被清退

细说职场
2026-04-25 13:38:47
1939年国民党坑了一小学老师,导致潜伏延安的55名特务被一网打尽

1939年国民党坑了一小学老师,导致潜伏延安的55名特务被一网打尽

掠影后有感
2026-04-24 12:00:57
乌度卡:我很惊讶艾顿被驱逐了;杜兰特有可能本轮回归

乌度卡:我很惊讶艾顿被驱逐了;杜兰特有可能本轮回归

懂球帝
2026-04-27 14:44:26
劳务派遣在央国企杀疯了!

劳务派遣在央国企杀疯了!

灯锦年
2026-04-21 17:56:52
惊魂一刻!女游客上厕所遇塌陷,直坠2米掉进粪坑,下身全被排泄物淹没三个小时

惊魂一刻!女游客上厕所遇塌陷,直坠2米掉进粪坑,下身全被排泄物淹没三个小时

澳洲红领巾
2026-04-27 12:17:35
惨!请13个外国演员撑场面,上映2天亏了1亿,这电影就是个笑话

惨!请13个外国演员撑场面,上映2天亏了1亿,这电影就是个笑话

靠谱电影君
2026-04-26 22:14:35
收评:深证成指涨0.37% 半导体、复合铜箔板块走强

收评:深证成指涨0.37% 半导体、复合铜箔板块走强

证券时报
2026-04-27 15:24:03
英国战斗机参战?第城遭今年最大空袭!小小的棺材看哭所有人

英国战斗机参战?第城遭今年最大空袭!小小的棺材看哭所有人

鹰眼Defence
2026-04-26 18:07:34
一场4:0让国足迎来大喜讯,邵佳一最欣慰,失而复得一位超级猛将

一场4:0让国足迎来大喜讯,邵佳一最欣慰,失而复得一位超级猛将

零度眼看球
2026-04-27 06:47:10
数百名医生强调:只要做过肠镜检查,患者一定多加关注这4点

数百名医生强调:只要做过肠镜检查,患者一定多加关注这4点

健康科普365
2026-04-27 13:15:12
白酒立大功?研究发现:经常喝白酒的糖尿病人,会有6个坏处!

白酒立大功?研究发现:经常喝白酒的糖尿病人,会有6个坏处!

岐黄传人孙大夫
2026-04-27 13:18:20
28岁赵心童身家上亿,开豪车住别墅,禁赛期间仍与女友形影不离

28岁赵心童身家上亿,开豪车住别墅,禁赛期间仍与女友形影不离

白面书誏
2026-02-26 16:21:41
中国鹰击-18击毁大型军舰曝光,现代反舰导弹突防能力哪家强?

中国鹰击-18击毁大型军舰曝光,现代反舰导弹突防能力哪家强?

军武次位面
2026-04-27 14:39:59
7换1!超值太交易,黑八奇迹,来吧!

7换1!超值太交易,黑八奇迹,来吧!

体育新角度
2026-04-26 16:17:48
岛内最新民调,事关两岸统一,蒋万安郑丽文支持率有惊人变化?

岛内最新民调,事关两岸统一,蒋万安郑丽文支持率有惊人变化?

DS北风
2026-04-23 15:56:17
曾毓群一声咳嗽,李斌欲言又止

曾毓群一声咳嗽,李斌欲言又止

版面之外
2026-04-26 07:53:41
靠“汉芯一号”骗取11亿研究经费,后逃到美国的陈进,结局如何?

靠“汉芯一号”骗取11亿研究经费,后逃到美国的陈进,结局如何?

文史达观
2026-04-27 06:45:17
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
2026-04-27 16:04:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2358文章数 596关注度
往期回顾 全部

科技要闻

DeepSeek V4上线三天,第一批实测出来了

头条要闻

美国白宫记协晚宴突发枪击事件 外交部回应

头条要闻

美国白宫记协晚宴突发枪击事件 外交部回应

体育要闻

最抽象的天才,正在改变瓜迪奥拉

娱乐要闻

黄杨钿甜为“耳环风波”出镜道歉:谣言已澄清

财经要闻

DeepSeek融资、字节加码 AI开始真烧钱了

汽车要闻

在不确定中寻找确定性:大众汽车的中国解法

态度原创

房产
艺术
本地
教育
公开课

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

艺术要闻

你绝对想不到,摄影能让她成为女神!

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

教育要闻

连爆猛料!这所区域领军校,新增两个“唯一”!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版