网易首页 > 网易号 > 正文 申请入驻

丰田研究院发布机器人大行为模型研究,单一模型掌握数百项任务

0
分享至

丰田研究院(TRI,Toyota Research Institute)近日发布了一项关于大行为模型(LBMs,Large Behavior Models)研究成果,这项技术或有望给机器人的学习方式重大变革。研究显示,通过预训练的 LBMs,机器人可以在学习新任务时减少高达80% 的数据需求,单一模型能够掌握数百项不同的操作技能。相关论文以《大行为模型多任务灵巧操作的细致检验》(A Careful Examination of Large Behavior Models for Multitask Dexterous Manipulation)发表在arXiv上。

研究的作者之一,丰田研究院副总裁、美国麻省理工学院教授 Russ Tedrake 在社交媒体上表示:“LBMs 确实有效!随着预训练数据量的增加,我们看到了一致且具有统计学意义的改进。”

传统的机器人训练方法存在诸多限制:每个任务都需要单独编程,学习过程缓慢且不一致,往往局限于狭窄定义的任务和高度受限的环境。相比之下,LBMs 采用了类似于大语言模型(LLMs,Large Language Models)的架构思路,但专门针对机器人的物理操作行为进行优化。

TRI 此次研究采用的 LBM 架构,是一种基于扩散模型和 Transformer 的复杂神经网络。它能够整合来自多路摄像头(包括机器人手腕和场景摄像头)的视觉信息、机器人自身的姿态和位置等本体感知数据,以及人类通过自然语言下达的任务指令。这个多模态系统通过学习,直接输出机器人需要执行的一系列连贯、精确的动作指令。具体来说,这些模型能够一次性预测未来 16 个时间步(约 1.6 秒)的动作序列,从而实现平滑而具有预见性的操作。

为了验证 LBMs 的有效性,研究团队在近 1,700 小时的机器人演示数据上训练了多个 LBMs,这些数据包括 468 小时的内部收集双臂机器人遥操作数据、45 小时的仿真收集遥操作数据、32 小时的通用操作接口(UMI,Universal Manipulation Interface)数据,以及约 1,150 小时从 Open X-Embodiment 数据集中精选的互联网数据。

在评估环节,研究团队进行了 1,800 次真实世界评估试验和超过 47,000 次仿真试验,覆盖 29个不同任务。为确保结果的可靠性,他们采用了盲测 A/B 测试方法,并建立了新的统计评估框架来确保跨不同任务和设置的结果置信度。

研究中使用的硬件平台基于 Franka Panda FR3 机械臂的双臂操作系统,配备多达六个摄像头——每个手腕最多两个,以及两个静态场景摄像头。在感知层面,模型使用预训练的 CLIP 视觉变换器提取图像特征,并通过 CLIP 文本编码器处理任务描述的语言特征。这些视觉和语言特征与本体感受信息以及扩散时间步编码相结合,形成观察特征。

在动作生成方面,LBMs 采用去噪扩散隐式模型(DDIM,Denoising Diffusion Implicit Models)来生成连续的机器人动作。通过 K 步迭代去噪过程,从高斯噪声样本开始,逐步生成精确的动作序列。

研究得出了三个关键发现。首先,微调后的 LBMs 在已见任务上的表现始终优于单任务基线模型。在名义条件和分布偏移条件下,无论是在仿真还是真实世界环境中,微调的 LBM 都表现出统计学上的显著优势。

其次,LBMs 展现出更强的鲁棒性。当引入分布偏移时,虽然整体任务性能有所下降,但微调的 LBMs 比从零开始训练的策略表现出更强的适应能力。在仿真环境中,LBMs 在分布偏移条件下统计上优于单任务策略的比例从名义条件下的 3/16 提升到 10/16。

第三,也是最重要的发现是,LBMs 能够显著减少学习新任务所需的数据量。研究表明,要在仿真中达到相似的性能水平,需对 LBM 进行微调。所需的数据量不到从零开始训练所需数据的 30%。在真实世界任务中,这一优势更加明显——LBM 仅用 15% 的数据就能超越使用全部数据训练的单任务基线模型。

研究还验证了 LBM 的 Scaling Law。通过使用不同比例的预训练数据,研究人员发现随着预训练数据量的增加,模型性能稳步提升。即使在当前的数据规模下,研究人员也没有发现性能的不连续性或急剧拐点,这表明人工智能扩展在机器人学习领域同样有效。

为了测试 LBMs 的能力极限,研究团队还设计了多种复杂的长期任务。例如,“切苹果”任务要求机器人使用苹果取芯器给苹果去核,从器具架中取出刀具,拔出刀鞘将苹果切成两半,再将两半切成片,最后用布擦拭刀具并重新装鞘放回器具架。在这类复杂任务中,LBMs 同样展现出了优于传统方法的性能。

这项研究的一个重要贡献是强调了统计严格性在机器人学习评估中的重要性。研究团队指出,许多机器人学习论文可能由于统计功效不足而测量的是统计噪声而非真实效果。他们展示了在不同试验次数和真实成功率下的置信区间宽度:以 50 次试验为例,得到的置信区间宽度通常为 20%-30% 的绝对成功率,这使得除了最大规模的效应之外,其他效应都无法可靠测量。

为了解决这一问题,研究团队采用了贝叶斯分析方法,使用均匀 Beta 先验计算成功率的后验分布,并通过紧凑字母显示(CLD,Compact Letter Display)方法指示统计显著性。这种方法为机器人学习领域设立了新的评估标准。

研究结果表明,即使在数据规模相对较小的情况下,预训练也能带来一致的性能提升。这使得建立数据获取和性能提升的良性循环得以可能。随着更多任务被纳入预训练混合数据中,LBM 的整体性能将持续平稳改善。然而,研究也发现了一些局限性。非微调的预训练 LBMs 表现参差不齐,这部分归因于模型语言引导能力的局限性。

研究团队表示,在内部测试中,更大的视觉-语言行为原型在克服这一困难方面显示出良好前景,但需要更多工作来严格验证这一效果。此外,数据标准化等看似次要的设计选择对下游性能有重大影响,往往超过架构或算法改进的影响,提醒研究者在比较方法时需要仔细隔离这些设计选择,避免混淆性能变化的来源。

参考资料:

1.https://arxiv.org/pdf/2507.05331

2.https://toyotaresearchinstitute.github.io/lbm1/

3.https://x.com/RussTedrake/status/1942931808422875640

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
惊艳世界波!亚马尔25米石破天惊,巴萨大胜:又一18岁天才归来

惊艳世界波!亚马尔25米石破天惊,巴萨大胜:又一18岁天才归来

话体坛
2026-02-08 02:14:23
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

墨印斋
2026-01-31 16:37:48
蔡磊最新病情:用尽全力才能保持眼球转动,起身需4个人帮助;身体疼痛麻木,一晚翻身醒来约十次

蔡磊最新病情:用尽全力才能保持眼球转动,起身需4个人帮助;身体疼痛麻木,一晚翻身醒来约十次

都市快报橙柿互动
2026-02-07 14:12:30
乌军战俘获释后也会去世!俄军战俘:回俄罗斯还不如留在乌克兰

乌军战俘获释后也会去世!俄军战俘:回俄罗斯还不如留在乌克兰

鹰眼Defence
2026-02-07 17:44:57
好消息,勇士队将双向合同球员帕特·斯宾塞转为正式合同

好消息,勇士队将双向合同球员帕特·斯宾塞转为正式合同

好火子
2026-02-08 06:16:06
上海新增1家三甲医院!已有百余年历史,创造多个第一,市中心地铁直达

上海新增1家三甲医院!已有百余年历史,创造多个第一,市中心地铁直达

上观新闻
2026-02-07 17:18:06
百万粉博主炮轰S家!全在演戏,买稿立人设,和具俊晔物以类聚

百万粉博主炮轰S家!全在演戏,买稿立人设,和具俊晔物以类聚

小徐讲八卦
2026-02-05 14:29:40
法官问为何不交物业费,业主反问:不交税违法,不交费违法吗

法官问为何不交物业费,业主反问:不交税违法,不交费违法吗

boss外传
2026-02-08 06:00:07
在学校发生的八卦能有多炸裂?网友:怀孕率比升学率高,不夸张

在学校发生的八卦能有多炸裂?网友:怀孕率比升学率高,不夸张

带你感受人间冷暖
2026-02-05 00:30:08
冬奥第1天金牌榜:日本1金并列第一 中国队1铜排第7 美国韩国挂零

冬奥第1天金牌榜:日本1金并列第一 中国队1铜排第7 美国韩国挂零

侃球熊弟
2026-02-08 04:36:18
突然,辽宁又一大集团破产倒闭!

突然,辽宁又一大集团破产倒闭!

本账号停运
2026-02-07 19:18:29
44岁凯特王妃新亮相,腹部小包引热议,曾接受腹部手术后确诊癌症

44岁凯特王妃新亮相,腹部小包引热议,曾接受腹部手术后确诊癌症

夜深爱杂谈
2026-02-07 18:21:59
上海105岁老人流血昏迷,救护车被支使得团团转

上海105岁老人流血昏迷,救护车被支使得团团转

看看新闻Knews
2026-02-07 20:03:11
小仙女圣母,是如何被洗脑成“三通一达”的工具人?

小仙女圣母,是如何被洗脑成“三通一达”的工具人?

北山浮生
2026-02-07 16:02:08
炸锅!皇马接近签下利物浦世界级巨星 互换交易悬念拉满

炸锅!皇马接近签下利物浦世界级巨星 互换交易悬念拉满

澜归序
2026-02-08 01:05:51
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
38分钟帽子戏法!金球级巨星复苏,英超争四全乱了,曼联嗅到不安

38分钟帽子戏法!金球级巨星复苏,英超争四全乱了,曼联嗅到不安

阿泰希特
2026-02-08 00:25:58
林诗栋亚洲杯3-1领先遭逆转,官方点评指出四大问题

林诗栋亚洲杯3-1领先遭逆转,官方点评指出四大问题

郭揦包工头
2026-02-07 23:19:03
A股:下周稳了!工信部突发特利好,这几个板块将直接起飞!

A股:下周稳了!工信部突发特利好,这几个板块将直接起飞!

云鹏叙事
2026-02-08 00:00:07
固始新娘结局:老师身份被曝光,面相看着就不简单,黑历史太多

固始新娘结局:老师身份被曝光,面相看着就不简单,黑历史太多

秋姐居
2026-02-05 11:36:37
2026-02-08 06:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16235文章数 514593关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

网购椅子却收到15公斤银砖 男子紧急报警

头条要闻

网购椅子却收到15公斤银砖 男子紧急报警

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

房产
艺术
数码
手机
军事航空

房产要闻

新春三亚置业,看过这个热盘再说!

艺术要闻

100张极为罕见的过年老照片,看完泪目了!

数码要闻

冠捷推出26.5英寸AOC G4白色显示器:LGD四代WOLED,2919元

手机要闻

华为苹果领衔 TOP5厂商入场,阔折叠方向对了吗?

军事要闻

重大转变 特朗普签令调整军售排序

无障碍浏览 进入关怀版