网易首页 > 网易号 > 正文 申请入驻

Robot Transformers 是什么 Transformer?

0
分享至

专题解读 事件: 2023 年 12 月中旬,斯坦福大学和普林斯顿大学等多所大学以及英伟达和 Google DeepMind 等多家企业的一个联合研究团队发布了一篇综述报告,总结了基础模型在机器人研究领域的发展情况和未来挑战。

为何要关注Robot Transformer?

在综述《Foundation Models in Robotics: Applications, Challenges, and the Future》中,研究者探讨了基础模型如何为机器人系统带来突破性的改进,以及这些模型在感知、预测、规划和控制等方面的潜在应用。

对于不同种类的基础模型,Robot Transformers 与另四类任务共同被归类于「直接用于机器人的基础模型」。

在背景介绍部分,研究者将用于机器人领域的基础模型分为两类。

一类是间接机器人研究相关联的基础模型,涉及感知(perception)和具身智能(Embodied AI)方向的研究。感知方面基础模型涉及处理「开放词汇对象检测和 3D 分类」、「开放词汇语义分割」、「开放词汇 3D 场景表示」和「可供性(affordances)」;具身智能方面的基础模型则有 Statler、EmbodiedGPT、Voyage、ELLM 等代表性工作。

另一类是直接用于机器人领域的基础模型,Robot Transformer 也归属于此。

图:利用了基础模型的机器人任务概述

所以什么是 Robot Transformers?

研究者在介绍Robot Transformers的小节中指出,通过一个整合感知、决策制定和动作生成的框架,这种基于 Transformer 架构的基础模型能够用于机器人的端到端控制。

综述在该小节列举了近期一系列 Robot Transformers 的工作,如RT系列、PACT、SMART等,探讨了这种基础模型在解锁机器人端到端控制的潜力,相关工作的探索方向包含:

1、自监督视觉预训练:通过使用真实世界的图像进行自监督视觉预训练,学习直接从像素输入进行机器人操纵任务的控制技能,无需任务特定的微调。

2、多模态输入处理:能够处理图像和自然语言指令作为输入,支持机器人根据视觉和语言信息生成动作。

3、泛化能力:通过在多样化的真实世界数据上训练,获得的表征能够适用于广泛的机器人应用。

4、跨领域数据吸收能力:能够有效地吸收和利用来自不同领域(包括仿真和不同机器人)的数据,增强模型的适应性和稳健性。

Robot Transformers 类型的工作是如何探索端到端机器人控制的?

1、机器人操纵任务方面,Xiao 等人和 Radosavovic 等人的工作证明了自监督预训练的优势,解锁了基础模型从多样化和非结构化的视觉数据中学习的可能,进而生成更家稳健和可转移的表征,用于机器人系统中的马达控制任务。

① Xiao 等人的工作《Masked visual pre-training for motor control》针对机器人操纵任务提出的方法无需对预训练的编码器进行任何任务特定的微调,即可直接从像素输入学习马达控制任务。

② Radosavovic 等人的工作《Real-world robot learning with masked visual pre-training》发现在野外多样化视频上使用自监督视觉预训练获得的表征在不同任务和机器人平台上泛化性良好,展示了自监督预训练对真实世界机器人应用的广泛适用性。

2、泛化性方面,RT-1 的工作使用大型的数据集训练了具备可扩展性的模型。它可以在变化的环境中保持稳健,并执行长期的指令,实现在新任务上的适应性。

① RT-1 还展示了该模型具有学习不同领域数据的能力,如仿真和不同类型机器人的数据...

RT-2、RT-X 是如何进一步探索机器人控制能力的?RT 系列之外还有哪些Robot Transformer 的工作?这些工作实现了哪些层面的突破?...查看完整解读请前往「机器之心PRO」业内通讯 · 2024年度#Week 05

本期完整版通讯含3个专题解读 +29项 AI & Robotics 赛道要事收录

1. 「Foundation Agent」是下一个 AI 前沿还是「吹水」?

Foundation Agent 是什么新兴概念?相比于以往的各类 Agent 有哪些关键特点?Foundation Agent 和 Foundation Model 到底是不是一个东西?...

2. Robot Transformers 是什么 Transformer?

为何要关注 Robot Transformer?什么是 Robot Transformer?Robot Transformers 都有哪些工作?这些工作分别解锁了什么价值?...

3. 多模态大型语言模型综述:理清多模态关键技术

MM-LLM 近期的研究方向如何?MM-LLM 模型的核心架构是什么?26 个最佳 MM-LLM 都有哪些特点?...

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
汪涵妻子被爆近况冲上热搜:什么样的“爱”会让人窒息?

汪涵妻子被爆近况冲上热搜:什么样的“爱”会让人窒息?

桌子的生活观
2026-04-28 12:19:53
特斯拉正式宣布五月新活动优惠!

特斯拉正式宣布五月新活动优惠!

XCiOS俱乐部
2026-04-28 19:41:06
网红白冰偷税被追缴1891万,全网账号已禁言,妻子江梦瑶曝其现状

网红白冰偷税被追缴1891万,全网账号已禁言,妻子江梦瑶曝其现状

阿纂看事
2026-04-28 18:04:57
老人从81岁到91岁还清2077万的债,96岁“诚信奶奶”陈金英回应:不过是守住了做人的底线

老人从81岁到91岁还清2077万的债,96岁“诚信奶奶”陈金英回应:不过是守住了做人的底线

九州新闻
2026-04-28 12:44:14
特鲁姆普:我现在配不上世界第一,世锦赛墨菲比赵心童更有望夺冠

特鲁姆普:我现在配不上世界第一,世锦赛墨菲比赵心童更有望夺冠

杨华评论
2026-04-28 21:48:25
某境外组织大力资助“躺平网红”,系统性开展“躺平洗脑”,国安部提醒

某境外组织大力资助“躺平网红”,系统性开展“躺平洗脑”,国安部提醒

界面新闻
2026-04-28 08:10:01
甘肃榆中山洪灾害调查评估报告公布

甘肃榆中山洪灾害调查评估报告公布

界面新闻
2026-04-28 16:01:49
听中国劝!伊朗这路走对了,短短48小时,打出漂亮合纵连横组合拳

听中国劝!伊朗这路走对了,短短48小时,打出漂亮合纵连横组合拳

军机Talk
2026-04-28 14:40:27
米饭被点名!医生直言:米饭冷冻24小时,抗性淀粉翻倍控糖护肠

米饭被点名!医生直言:米饭冷冻24小时,抗性淀粉翻倍控糖护肠

路医生健康科普
2026-04-26 19:55:03
警惕!境外组织做局躺平,资助网红洗脑青年,国安部紧急提醒

警惕!境外组织做局躺平,资助网红洗脑青年,国安部紧急提醒

青梅侃史啊
2026-04-28 16:52:45
我在沙特开餐馆娶了3位妻子,回国奔丧一星期,再回去时当场愣了

我在沙特开餐馆娶了3位妻子,回国奔丧一星期,再回去时当场愣了

千秋文化
2026-04-28 20:17:01
12人落马5轮彻查!张军失联第18天,64岁蔡振华成体育界正面教材

12人落马5轮彻查!张军失联第18天,64岁蔡振华成体育界正面教材

不写散文诗
2026-04-28 14:19:14
特朗普:伊朗希望美国尽快“开放霍尔木兹海峡”

特朗普:伊朗希望美国尽快“开放霍尔木兹海峡”

财联社
2026-04-28 21:37:28
43岁蔡卓妍官宣再婚!嫁给小10岁健身教练,明星好友纷纷祝福

43岁蔡卓妍官宣再婚!嫁给小10岁健身教练,明星好友纷纷祝福

萌神木木
2026-04-28 12:45:29
17岁男生不当操作导致阴茎骨折,错失早期最佳治疗窗口,延误救治或影响后续功能恢复

17岁男生不当操作导致阴茎骨折,错失早期最佳治疗窗口,延误救治或影响后续功能恢复

观威海
2026-04-28 18:12:05
智能眼镜终于不是概念尝鲜了?千问这次来真的了

智能眼镜终于不是概念尝鲜了?千问这次来真的了

差评XPIN
2026-04-17 00:08:30
中国正式禁止美国收购Manus,美媒集体破防指责

中国正式禁止美国收购Manus,美媒集体破防指责

空间展示知识
2026-04-28 11:51:13
罗马诺:皇马15天前就得知穆里尼奥可以回归

罗马诺:皇马15天前就得知穆里尼奥可以回归

懂球帝
2026-04-28 23:17:24
平台回应“孕妇自称花200元买水果遭丈夫咒骂后引产”:系剧情演绎,已处置禁言

平台回应“孕妇自称花200元买水果遭丈夫咒骂后引产”:系剧情演绎,已处置禁言

齐鲁壹点
2026-04-28 17:19:17
这家公司砍掉绩效面谈,离职率降了35%

这家公司砍掉绩效面谈,离职率降了35%

全栈遛狗员
2026-04-28 00:12:15
2026-04-29 02:31:00
AI好好用 incentive-icons
AI好好用
探索人工智能应用场景及商业化
2095文章数 4429关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

健康
教育
家居
旅游
时尚

干细胞治疗烧烫伤三大优势!

教育要闻

教育部通知,今年9月份开始,上学的规则全变了

家居要闻

江景风格 流动的秩序

旅游要闻

莫让内卷式竞争削弱旅游消费信心

普通女性春天穿什么好看?这些穿搭值得借鉴,自然舒适

无障碍浏览 进入关怀版