网易首页 > 网易号 > 正文 申请入驻

Robot Transformers 是什么 Transformer?

0
分享至

专题解读 事件: 2023 年 12 月中旬,斯坦福大学和普林斯顿大学等多所大学以及英伟达和 Google DeepMind 等多家企业的一个联合研究团队发布了一篇综述报告,总结了基础模型在机器人研究领域的发展情况和未来挑战。

为何要关注Robot Transformer?

在综述《Foundation Models in Robotics: Applications, Challenges, and the Future》中,研究者探讨了基础模型如何为机器人系统带来突破性的改进,以及这些模型在感知、预测、规划和控制等方面的潜在应用。

对于不同种类的基础模型,Robot Transformers 与另四类任务共同被归类于「直接用于机器人的基础模型」。

在背景介绍部分,研究者将用于机器人领域的基础模型分为两类。

一类是间接机器人研究相关联的基础模型,涉及感知(perception)和具身智能(Embodied AI)方向的研究。感知方面基础模型涉及处理「开放词汇对象检测和 3D 分类」、「开放词汇语义分割」、「开放词汇 3D 场景表示」和「可供性(affordances)」;具身智能方面的基础模型则有 Statler、EmbodiedGPT、Voyage、ELLM 等代表性工作。

另一类是直接用于机器人领域的基础模型,Robot Transformer 也归属于此。

图:利用了基础模型的机器人任务概述

所以什么是 Robot Transformers?

研究者在介绍Robot Transformers的小节中指出,通过一个整合感知、决策制定和动作生成的框架,这种基于 Transformer 架构的基础模型能够用于机器人的端到端控制。

综述在该小节列举了近期一系列 Robot Transformers 的工作,如RT系列、PACT、SMART等,探讨了这种基础模型在解锁机器人端到端控制的潜力,相关工作的探索方向包含:

1、自监督视觉预训练:通过使用真实世界的图像进行自监督视觉预训练,学习直接从像素输入进行机器人操纵任务的控制技能,无需任务特定的微调。

2、多模态输入处理:能够处理图像和自然语言指令作为输入,支持机器人根据视觉和语言信息生成动作。

3、泛化能力:通过在多样化的真实世界数据上训练,获得的表征能够适用于广泛的机器人应用。

4、跨领域数据吸收能力:能够有效地吸收和利用来自不同领域(包括仿真和不同机器人)的数据,增强模型的适应性和稳健性。

Robot Transformers 类型的工作是如何探索端到端机器人控制的?

1、机器人操纵任务方面,Xiao 等人和 Radosavovic 等人的工作证明了自监督预训练的优势,解锁了基础模型从多样化和非结构化的视觉数据中学习的可能,进而生成更家稳健和可转移的表征,用于机器人系统中的马达控制任务。

① Xiao 等人的工作《Masked visual pre-training for motor control》针对机器人操纵任务提出的方法无需对预训练的编码器进行任何任务特定的微调,即可直接从像素输入学习马达控制任务。

② Radosavovic 等人的工作《Real-world robot learning with masked visual pre-training》发现在野外多样化视频上使用自监督视觉预训练获得的表征在不同任务和机器人平台上泛化性良好,展示了自监督预训练对真实世界机器人应用的广泛适用性。

2、泛化性方面,RT-1 的工作使用大型的数据集训练了具备可扩展性的模型。它可以在变化的环境中保持稳健,并执行长期的指令,实现在新任务上的适应性。

① RT-1 还展示了该模型具有学习不同领域数据的能力,如仿真和不同类型机器人的数据...

RT-2、RT-X 是如何进一步探索机器人控制能力的?RT 系列之外还有哪些Robot Transformer 的工作?这些工作实现了哪些层面的突破?...查看完整解读请前往「机器之心PRO」业内通讯 · 2024年度#Week 05

本期完整版通讯含3个专题解读 +29项 AI & Robotics 赛道要事收录

1. 「Foundation Agent」是下一个 AI 前沿还是「吹水」?

Foundation Agent 是什么新兴概念?相比于以往的各类 Agent 有哪些关键特点?Foundation Agent 和 Foundation Model 到底是不是一个东西?...

2. Robot Transformers 是什么 Transformer?

为何要关注 Robot Transformer?什么是 Robot Transformer?Robot Transformers 都有哪些工作?这些工作分别解锁了什么价值?...

3. 多模态大型语言模型综述:理清多模态关键技术

MM-LLM 近期的研究方向如何?MM-LLM 模型的核心架构是什么?26 个最佳 MM-LLM 都有哪些特点?...

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
劝退!“去客厅化”火了5年,为什么70%家庭最后都偷偷把沙发搬了回来?

劝退!“去客厅化”火了5年,为什么70%家庭最后都偷偷把沙发搬了回来?

绘本家居
2026-04-10 11:13:39
愤怒的李想和遭到围攻的理想汽车

愤怒的李想和遭到围攻的理想汽车

界面新闻
2026-04-13 10:01:09
1920年,林徽因和父亲林长民,在伦敦寓所里吃西餐,颜值太高了!

1920年,林徽因和父亲林长民,在伦敦寓所里吃西餐,颜值太高了!

云霄纪史观
2026-04-14 02:18:38
6分优势在手,阿森纳在怕什么?

6分优势在手,阿森纳在怕什么?

足球报
2026-04-14 12:41:49
老板娘说她屁股太大了,我该怎么回答?

老板娘说她屁股太大了,我该怎么回答?

太急张三疯
2026-03-19 09:16:16
医生告诫:每天睡前玩手机的人,不用半年时间,睡眠或有这6变化

医生告诫:每天睡前玩手机的人,不用半年时间,睡眠或有这6变化

白话电影院
2026-04-05 15:34:47
兽爷丨王石平安,郁亮落幕

兽爷丨王石平安,郁亮落幕

兽楼处
2026-04-14 11:51:15
男子十年献血近4万毫升持“博爱卡”要求免诊查费遭拒,四川荣县医院回应

男子十年献血近4万毫升持“博爱卡”要求免诊查费遭拒,四川荣县医院回应

大风新闻
2026-04-13 17:47:10
全红婵确定缺席总决赛!被辱骂后未回归国家队 陈芋汐陈艺文出战

全红婵确定缺席总决赛!被辱骂后未回归国家队 陈芋汐陈艺文出战

念洲
2026-04-14 11:46:46
霍尔木兹海峡这张牌,伊朗恐怕用不了多久了

霍尔木兹海峡这张牌,伊朗恐怕用不了多久了

罗sir财话
2026-04-13 15:17:27
新势力面对特斯拉的绝望?车评人帮空姐选车,领座大哥一句话噎回

新势力面对特斯拉的绝望?车评人帮空姐选车,领座大哥一句话噎回

小李车评李建红
2026-04-14 08:00:03
交警提醒:即日起路边停车“开双闪”或被罚款200元,车主需留意

交警提醒:即日起路边停车“开双闪”或被罚款200元,车主需留意

复转这些年
2026-04-13 12:15:39
老板娘总发这种照片给我,还问我想不想看到更多,我该怎么回答?

老板娘总发这种照片给我,还问我想不想看到更多,我该怎么回答?

太急张三疯
2026-04-14 10:39:12
终于知道采购吃回扣是怎么被发现的了,网友分享真实,太开眼了

终于知道采购吃回扣是怎么被发现的了,网友分享真实,太开眼了

夜深爱杂谈
2026-03-13 22:02:43
美军一空中加油机伤痕累累 可能参与对伊朗军事行动

美军一空中加油机伤痕累累 可能参与对伊朗军事行动

环球网资讯
2026-04-14 08:59:45
梦龙广告引争议,芭蕾鞋元素被指恋足暗示,创意还是低俗?

梦龙广告引争议,芭蕾鞋元素被指恋足暗示,创意还是低俗?

凤凰网财经
2026-04-13 15:04:13
辛纳缺阵!阿尔卡拉斯稳了:巴塞罗那夺冠就抢回世界第一宝座

辛纳缺阵!阿尔卡拉斯稳了:巴塞罗那夺冠就抢回世界第一宝座

体育妞世界
2026-04-14 09:52:43
太没底线!三球16记三分“抢戏”,克尼佩尔险胜加冕历史首人!

太没底线!三球16记三分“抢戏”,克尼佩尔险胜加冕历史首人!

田先生篮球
2026-04-13 11:23:36
2026年4月人气女优TOP20 河北彩伽急跌!她重夺冠军

2026年4月人气女优TOP20 河北彩伽急跌!她重夺冠军

孤独的独角兽影视
2026-04-14 10:00:10
NBA附加赛票价:勇士vs快船起步57美元最贵,东部对决更亲民

NBA附加赛票价:勇士vs快船起步57美元最贵,东部对决更亲民

懂球帝
2026-04-14 12:11:08
2026-04-14 13:40:49
AI好好用 incentive-icons
AI好好用
探索人工智能应用场景及商业化
2095文章数 4429关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

亲子
时尚
旅游
本地
公开课

亲子要闻

注意!这5类母婴用品别再乱买了,当心有害(附避坑攻略)

今年科切拉的风吹向了谁?

旅游要闻

山水本身就是一间流动的自然课堂 春日文旅从“看风景”走向“读自然”

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版