网易首页 > 网易号 > 正文 申请入驻

Robot Transformers 是什么 Transformer?

0
分享至

专题解读 事件: 2023 年 12 月中旬,斯坦福大学和普林斯顿大学等多所大学以及英伟达和 Google DeepMind 等多家企业的一个联合研究团队发布了一篇综述报告,总结了基础模型在机器人研究领域的发展情况和未来挑战。

为何要关注Robot Transformer?

在综述《Foundation Models in Robotics: Applications, Challenges, and the Future》中,研究者探讨了基础模型如何为机器人系统带来突破性的改进,以及这些模型在感知、预测、规划和控制等方面的潜在应用。

对于不同种类的基础模型,Robot Transformers 与另四类任务共同被归类于「直接用于机器人的基础模型」。

在背景介绍部分,研究者将用于机器人领域的基础模型分为两类。

一类是间接机器人研究相关联的基础模型,涉及感知(perception)和具身智能(Embodied AI)方向的研究。感知方面基础模型涉及处理「开放词汇对象检测和 3D 分类」、「开放词汇语义分割」、「开放词汇 3D 场景表示」和「可供性(affordances)」;具身智能方面的基础模型则有 Statler、EmbodiedGPT、Voyage、ELLM 等代表性工作。

另一类是直接用于机器人领域的基础模型,Robot Transformer 也归属于此。

图:利用了基础模型的机器人任务概述

所以什么是 Robot Transformers?

研究者在介绍Robot Transformers的小节中指出,通过一个整合感知、决策制定和动作生成的框架,这种基于 Transformer 架构的基础模型能够用于机器人的端到端控制。

综述在该小节列举了近期一系列 Robot Transformers 的工作,如RT系列、PACT、SMART等,探讨了这种基础模型在解锁机器人端到端控制的潜力,相关工作的探索方向包含:

1、自监督视觉预训练:通过使用真实世界的图像进行自监督视觉预训练,学习直接从像素输入进行机器人操纵任务的控制技能,无需任务特定的微调。

2、多模态输入处理:能够处理图像和自然语言指令作为输入,支持机器人根据视觉和语言信息生成动作。

3、泛化能力:通过在多样化的真实世界数据上训练,获得的表征能够适用于广泛的机器人应用。

4、跨领域数据吸收能力:能够有效地吸收和利用来自不同领域(包括仿真和不同机器人)的数据,增强模型的适应性和稳健性。

Robot Transformers 类型的工作是如何探索端到端机器人控制的?

1、机器人操纵任务方面,Xiao 等人和 Radosavovic 等人的工作证明了自监督预训练的优势,解锁了基础模型从多样化和非结构化的视觉数据中学习的可能,进而生成更家稳健和可转移的表征,用于机器人系统中的马达控制任务。

① Xiao 等人的工作《Masked visual pre-training for motor control》针对机器人操纵任务提出的方法无需对预训练的编码器进行任何任务特定的微调,即可直接从像素输入学习马达控制任务。

② Radosavovic 等人的工作《Real-world robot learning with masked visual pre-training》发现在野外多样化视频上使用自监督视觉预训练获得的表征在不同任务和机器人平台上泛化性良好,展示了自监督预训练对真实世界机器人应用的广泛适用性。

2、泛化性方面,RT-1 的工作使用大型的数据集训练了具备可扩展性的模型。它可以在变化的环境中保持稳健,并执行长期的指令,实现在新任务上的适应性。

① RT-1 还展示了该模型具有学习不同领域数据的能力,如仿真和不同类型机器人的数据...

RT-2、RT-X 是如何进一步探索机器人控制能力的?RT 系列之外还有哪些Robot Transformer 的工作?这些工作实现了哪些层面的突破?...查看完整解读请前往「机器之心PRO」业内通讯 · 2024年度#Week 05

本期完整版通讯含3个专题解读 +29项 AI & Robotics 赛道要事收录

1. 「Foundation Agent」是下一个 AI 前沿还是「吹水」?

Foundation Agent 是什么新兴概念?相比于以往的各类 Agent 有哪些关键特点?Foundation Agent 和 Foundation Model 到底是不是一个东西?...

2. Robot Transformers 是什么 Transformer?

为何要关注 Robot Transformer?什么是 Robot Transformer?Robot Transformers 都有哪些工作?这些工作分别解锁了什么价值?...

3. 多模态大型语言模型综述:理清多模态关键技术

MM-LLM 近期的研究方向如何?MM-LLM 模型的核心架构是什么?26 个最佳 MM-LLM 都有哪些特点?...

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
停火期限即将到来,美伊都做两手准备,霍尔木兹海峡“开了又关”

停火期限即将到来,美伊都做两手准备,霍尔木兹海峡“开了又关”

环球网资讯
2026-04-20 06:40:55
天齐锂业Q1业绩“炸裂”!净利预增15至18倍,锂价回暖与投资收益双重共振|财报见闻

天齐锂业Q1业绩“炸裂”!净利预增15至18倍,锂价回暖与投资收益双重共振|财报见闻

华尔街见闻官方
2026-04-20 18:49:14
终其一生,满是遗憾

终其一生,满是遗憾

青苹果sht
2026-04-08 05:13:36
左小青这状态,鲨疯了!明媚动人,若隐若现

左小青这状态,鲨疯了!明媚动人,若隐若现

只要高兴就好
2025-12-10 19:09:26
看哭了!张雪车队64号频频摔车排名垫底原来他的作用根本不是拿奖

看哭了!张雪车队64号频频摔车排名垫底原来他的作用根本不是拿奖

刘哥谈体育
2026-04-21 00:06:55
河南平顶山动物园的狼见人就“作揖”讨吃的,游客质疑狼被饿着;园方:“作揖”属正常习性,每天喂一次,一只狼4斤肉

河南平顶山动物园的狼见人就“作揖”讨吃的,游客质疑狼被饿着;园方:“作揖”属正常习性,每天喂一次,一只狼4斤肉

大风新闻
2026-04-20 12:44:10
倒计时1天,赖清德将离台!郑丽文已见不到他,国防部下最后通牒

倒计时1天,赖清德将离台!郑丽文已见不到他,国防部下最后通牒

易昂杨
2026-04-20 21:11:29
化疗康复期女店主遭多名城管围阻,店招改造引发执法争议;多方回应

化疗康复期女店主遭多名城管围阻,店招改造引发执法争议;多方回应

大风新闻
2026-04-20 20:25:06
以牙还牙!解放军过航日本横当水道,前锋朝着日本本土九州!

以牙还牙!解放军过航日本横当水道,前锋朝着日本本土九州!

荆楚寰宇文枢
2026-04-20 23:09:20
世锦赛战报:中国1领先2落后,00后小将4-5大满贯!8位种子进16强

世锦赛战报:中国1领先2落后,00后小将4-5大满贯!8位种子进16强

小火箭爱体育
2026-04-21 06:13:24
万斯及美国代表团将在数小时内抵达巴基斯坦

万斯及美国代表团将在数小时内抵达巴基斯坦

财联社
2026-04-20 21:33:03
77枚金牌不是万能,国家队不再原谅王濛,狂妄自大只会被抛弃

77枚金牌不是万能,国家队不再原谅王濛,狂妄自大只会被抛弃

牛牛叨史
2024-07-09 16:59:07
马蹄露自荐做团长后续!张敬轩粉丝不忍了,开始发文攻击了

马蹄露自荐做团长后续!张敬轩粉丝不忍了,开始发文攻击了

小徐讲八卦
2026-04-19 11:27:40
花27万元拍下周口太昊陵庙会摊位的“标王”摊主已盈利,当事人:每天工作十多个小时卖猪蹄数千只,明年会继续竞拍

花27万元拍下周口太昊陵庙会摊位的“标王”摊主已盈利,当事人:每天工作十多个小时卖猪蹄数千只,明年会继续竞拍

极目新闻
2026-04-19 22:39:27
被记者问能否留任本菲卡,穆帅:你能保证明年还在这家电视台吗

被记者问能否留任本菲卡,穆帅:你能保证明年还在这家电视台吗

懂球帝
2026-04-20 10:40:11
浙江震元副总经理被立案调查,年薪43万元,兼任母公司董事

浙江震元副总经理被立案调查,年薪43万元,兼任母公司董事

红星资本局
2026-04-19 15:06:04
牡丹花下死!送走马蓉又迎冯清,43岁王宝强,终究栽进“女人坑”

牡丹花下死!送走马蓉又迎冯清,43岁王宝强,终究栽进“女人坑”

小兰聊历史
2026-04-13 02:09:34
查到问题根源上 改到群众心坎里(树立和践行正确政绩观)

查到问题根源上 改到群众心坎里(树立和践行正确政绩观)

人民网
2026-04-20 08:45:09
黄圣依17年终错付,杨子带23岁新女友见91岁母亲,铜钱盆抢镜

黄圣依17年终错付,杨子带23岁新女友见91岁母亲,铜钱盆抢镜

卷史
2026-04-18 13:54:59
宇树机器人打破人类1500米世界纪录:1.9公里4分13秒自主跑完

宇树机器人打破人类1500米世界纪录:1.9公里4分13秒自主跑完

快科技
2026-04-19 07:47:05
2026-04-21 06:52:49
AI好好用 incentive-icons
AI好好用
探索人工智能应用场景及商业化
2095文章数 4429关注度
往期回顾 全部

科技要闻

重磅官宣:库克卸任,特努斯接任苹果CEO

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

房产
艺术
数码
手机
本地

房产要闻

大规模商改住!海口西海岸,这波项目要赢麻了!

艺术要闻

春天最适合小住三五天的地方

数码要闻

华为Pura90系列及Pura X Max折叠屏手机发布:5499元起

手机要闻

华为Pura X Max发布:搭载麒麟9030 Pro芯片,起售价10999元

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版