网易首页 > 网易号 > 正文 申请入驻

Robot Transformers 是什么 Transformer?

0
分享至

专题解读 事件: 2023 年 12 月中旬,斯坦福大学和普林斯顿大学等多所大学以及英伟达和 Google DeepMind 等多家企业的一个联合研究团队发布了一篇综述报告,总结了基础模型在机器人研究领域的发展情况和未来挑战。

为何要关注Robot Transformer?

在综述《Foundation Models in Robotics: Applications, Challenges, and the Future》中,研究者探讨了基础模型如何为机器人系统带来突破性的改进,以及这些模型在感知、预测、规划和控制等方面的潜在应用。

对于不同种类的基础模型,Robot Transformers 与另四类任务共同被归类于「直接用于机器人的基础模型」。

在背景介绍部分,研究者将用于机器人领域的基础模型分为两类。

一类是间接机器人研究相关联的基础模型,涉及感知(perception)和具身智能(Embodied AI)方向的研究。感知方面基础模型涉及处理「开放词汇对象检测和 3D 分类」、「开放词汇语义分割」、「开放词汇 3D 场景表示」和「可供性(affordances)」;具身智能方面的基础模型则有 Statler、EmbodiedGPT、Voyage、ELLM 等代表性工作。

另一类是直接用于机器人领域的基础模型,Robot Transformer 也归属于此。

图:利用了基础模型的机器人任务概述

所以什么是 Robot Transformers?

研究者在介绍Robot Transformers的小节中指出,通过一个整合感知、决策制定和动作生成的框架,这种基于 Transformer 架构的基础模型能够用于机器人的端到端控制。

综述在该小节列举了近期一系列 Robot Transformers 的工作,如RT系列、PACT、SMART等,探讨了这种基础模型在解锁机器人端到端控制的潜力,相关工作的探索方向包含:

1、自监督视觉预训练:通过使用真实世界的图像进行自监督视觉预训练,学习直接从像素输入进行机器人操纵任务的控制技能,无需任务特定的微调。

2、多模态输入处理:能够处理图像和自然语言指令作为输入,支持机器人根据视觉和语言信息生成动作。

3、泛化能力:通过在多样化的真实世界数据上训练,获得的表征能够适用于广泛的机器人应用。

4、跨领域数据吸收能力:能够有效地吸收和利用来自不同领域(包括仿真和不同机器人)的数据,增强模型的适应性和稳健性。

Robot Transformers 类型的工作是如何探索端到端机器人控制的?

1、机器人操纵任务方面,Xiao 等人和 Radosavovic 等人的工作证明了自监督预训练的优势,解锁了基础模型从多样化和非结构化的视觉数据中学习的可能,进而生成更家稳健和可转移的表征,用于机器人系统中的马达控制任务。

① Xiao 等人的工作《Masked visual pre-training for motor control》针对机器人操纵任务提出的方法无需对预训练的编码器进行任何任务特定的微调,即可直接从像素输入学习马达控制任务。

② Radosavovic 等人的工作《Real-world robot learning with masked visual pre-training》发现在野外多样化视频上使用自监督视觉预训练获得的表征在不同任务和机器人平台上泛化性良好,展示了自监督预训练对真实世界机器人应用的广泛适用性。

2、泛化性方面,RT-1 的工作使用大型的数据集训练了具备可扩展性的模型。它可以在变化的环境中保持稳健,并执行长期的指令,实现在新任务上的适应性。

① RT-1 还展示了该模型具有学习不同领域数据的能力,如仿真和不同类型机器人的数据...

RT-2、RT-X 是如何进一步探索机器人控制能力的?RT 系列之外还有哪些Robot Transformer 的工作?这些工作实现了哪些层面的突破?...查看完整解读请前往「机器之心PRO」业内通讯 · 2024年度#Week 05

本期完整版通讯含3个专题解读 +29项 AI & Robotics 赛道要事收录

1. 「Foundation Agent」是下一个 AI 前沿还是「吹水」?

Foundation Agent 是什么新兴概念?相比于以往的各类 Agent 有哪些关键特点?Foundation Agent 和 Foundation Model 到底是不是一个东西?...

2. Robot Transformers 是什么 Transformer?

为何要关注 Robot Transformer?什么是 Robot Transformer?Robot Transformers 都有哪些工作?这些工作分别解锁了什么价值?...

3. 多模态大型语言模型综述:理清多模态关键技术

MM-LLM 近期的研究方向如何?MM-LLM 模型的核心架构是什么?26 个最佳 MM-LLM 都有哪些特点?...

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
0-3!全运会新争议:国乒名将输球摔拍泄愤,对手大度帮他捡起来

0-3!全运会新争议:国乒名将输球摔拍泄愤,对手大度帮他捡起来

篮球看比赛
2025-11-17 11:41:44
失去信任!快船最后时刻战术:范甘迪险助哈登超神,泰伦卢旁观

失去信任!快船最后时刻战术:范甘迪险助哈登超神,泰伦卢旁观

体坛小李
2025-11-17 08:54:41
清朝“大辫子”到底多脏?满头油光,虱子满头,十步之内不能站人

清朝“大辫子”到底多脏?满头油光,虱子满头,十步之内不能站人

小豫讲故事
2025-11-05 06:00:03
王学兵满头白发去看张一山演话剧,身体发福,54岁的他老的认不出

王学兵满头白发去看张一山演话剧,身体发福,54岁的他老的认不出

小徐讲八卦
2025-11-17 16:28:59
安德玛为何宁愿多花9500万,也要终止与库里12年的合作?

安德玛为何宁愿多花9500万,也要终止与库里12年的合作?

体育产业独立评论
2025-11-14 22:24:08
混音队主教练:杨瀚森是一个无私的球员,他让队友变得更好

混音队主教练:杨瀚森是一个无私的球员,他让队友变得更好

懂球帝
2025-11-17 13:52:06
佘智江引渡回国后,做灰色产业的表哥黄有龙,能否全身而退?

佘智江引渡回国后,做灰色产业的表哥黄有龙,能否全身而退?

公子麦少
2025-11-16 17:57:55
11秒10,破亚洲青年纪录!16岁浙江选手陈妤颉,成全运会女子百米飞人“新后”

11秒10,破亚洲青年纪录!16岁浙江选手陈妤颉,成全运会女子百米飞人“新后”

极目新闻
2025-11-17 22:30:52
赵雅芝名利心太强了!举办完50周年派对后,回宾馆睡到第2天下午

赵雅芝名利心太强了!举办完50周年派对后,回宾馆睡到第2天下午

乐悠悠娱乐
2025-11-17 10:21:08
央媒:“迎头痛击”有多痛?日本该睁眼看清楚了!

央媒:“迎头痛击”有多痛?日本该睁眼看清楚了!

澎湃新闻
2025-11-16 17:01:02
最后大狂欢!超级宠粉的「新有菜」引退作情报即将揭晓!

最后大狂欢!超级宠粉的「新有菜」引退作情报即将揭晓!

素然追光
2025-11-17 00:43:54
80岁老太感染上艾滋,女儿查看监控后瞠目结舌,连捅男保姆43刀

80岁老太感染上艾滋,女儿查看监控后瞠目结舌,连捅男保姆43刀

民间精选故事汇
2025-05-12 08:01:12
时隔近两年半,巴萨本周末重回诺坎普

时隔近两年半,巴萨本周末重回诺坎普

体坛周报
2025-11-17 22:54:16
美上将曾问100岁的基辛格:如何战胜中国,基辛格的回答十分中肯

美上将曾问100岁的基辛格:如何战胜中国,基辛格的回答十分中肯

通文知史
2025-11-17 22:35:03
“快来逮捕我”,沈伯洋窜德发挑衅,不到24小时,大陆对其出重拳

“快来逮捕我”,沈伯洋窜德发挑衅,不到24小时,大陆对其出重拳

凡知
2025-11-17 14:53:14
今日,央行大动作!降准降息,将至?

今日,央行大动作!降准降息,将至?

中国商界杂志社
2025-11-17 14:00:49
乌方将从法国采购100架“阵风”战斗机

乌方将从法国采购100架“阵风”战斗机

新京报
2025-11-17 22:33:34
中产信仰崩塌,山姆的这颗雷,早在半年前已埋下

中产信仰崩塌,山姆的这颗雷,早在半年前已埋下

大鱼简科
2025-11-14 19:58:14
美军前最高将领,说了和东大开战后果的大实话,全场寂然无声

美军前最高将领,说了和东大开战后果的大实话,全场寂然无声

大国观察眼
2025-11-08 06:35:06
他履新深圳一区退役军人事务局副局长!曾在街道任职

他履新深圳一区退役军人事务局副局长!曾在街道任职

南方都市报
2025-11-17 21:12:10
2025-11-17 23:27:00
AI好好用 incentive-icons
AI好好用
探索人工智能应用场景及商业化
2096文章数 4431关注度
往期回顾 全部

科技要闻

有了通义和夸克,阿里为何再推千问App?

头条要闻

媒体:美国核武器进驻日本意味着什么 高市可要想好了

头条要闻

媒体:美国核武器进驻日本意味着什么 高市可要想好了

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

手机
亲子
艺术
数码
公开课

手机要闻

三星Galaxy S26系列三款手机参数曝光

亲子要闻

表姐难产大出血病危,我守在产房外哭到发抖,她清醒后低声说句话

艺术要闻

这雪景,太美了!

数码要闻

小米Poco Pad M1平板参数曝光,有望近期开售

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版