网易首页 > 网易号 > 正文 申请入驻

机器人学会“举一反三”!从未见过空气炸锅,却能烤出红薯!

0
分享至

在 Generalist AI 发布 Gen-1 两周之后,具身赛道的另一位重量级玩家 ——Physical Intelligence 也亮剑了,发布了新模型 π 0.7,VLA 又往前走了一步。



这个模型的重大突破在于 —— 它不只是重复训练中遇到的任务,而是展现出了组合泛化的初步迹象。什么叫组合泛化?举个例子,你会切菜、会打开燃气、会翻炒,当你想吃番茄炒蛋时,虽然你从来没有做过,但只要看一眼菜谱,你也能把这些技能组合起来,把菜做出来。现在的大语言模型之所以那么强大,本质上也是因为具备这种能力。

但在机器人领域,这种能力还没有大规模涌现。比如现在广泛使用的 VLA(视觉 - 语言 - 动作)模型,虽然能听懂各种指令和概念,但它们还不会把学过的技能灵活组合起来用。你给它一个新工具或者没见过的厨房用具,它就不知道怎么用了。而且,就算是它学过的技能,通常也得专门再「调教」一下,效果才会好。这跟早期那些语言模型很像,处理不同的问题也得单独做微调。

π (0.7) 看起来不一样。Physical Intelligence 提到了一个空气炸锅的例子。他们从未让 π0.7 学习过「用空气炸锅烤红薯」这个具体任务。但是,当通过分的语言指令(就像指导一个第一次使用空气炸锅的人那样)来「辅导」它时,这个模型能够理解并执行。它需要将「关闭炸篮」、「放置食物」等从不同数据片段中学到的概念组合起来,应用到一个全新的、完整的任务流程中。



研究人员自己也很好奇,π0.7 到底是从哪里学会「空气炸锅」这个概念的。毕竟,训练数据里并没有直接演示「用空气炸锅烤红薯」的完整过程。由于训练集的规模很大且非常多样,很难精确追踪到是哪几段数据赋予了模型这个知识。研究人员的推测是,它很可能来自机器人操作数据和大规模视觉语言预训练的共同作用。

除了组合泛化,π0.7 在跨本体迁移方面的表现也非常亮眼。

在一个叠衣服的例子中,π0.7 被要求控制一个它从未训练过的、形态差异很大的双臂机器人(UR5e 系统)来叠衣服。UR5e 系统由两台 UR5e 工业机械臂搭配 Robotiq 平行夹爪组成。这台机器人很难遥操作:机械臂很重,惯性很大,夹爪也相对不够精确。研究人员之前完全没有收集过这台机器人做叠衣服任务的任何数据。

他们让 π0.7 去控制这台机器人折叠衣物。出乎意料的是,能够稳定地完成这一操作。值得注意的是,该机器人在折叠 T 恤时的物理动作,与他们最初采集训练数据所用的那台更小型机器人的动作存在显著差异。最终,π0.7 在该任务上的成功率,与经验丰富的遥操作员在同样使用双臂 UR5e 系统进行「零样本」操作时的成功率持平。这些操作员平均拥有 375 小时的遥操作经验,他们正是最初在原始机器人上采集训练数据的同一批专家。



除了广泛的任务泛化能力,研究团队还希望机器人干活又准又快。之前他们开发了一个叫 Recap 的算法,用强化学习专门优化特定任务的策略,让机器人动作更稳、速度更快。

以前的做法是为每个任务单独训练一个 Recap 专家模型。但现在他们换了个思路:把 Recap 训练过程中产生的经验连同策略元数据一起喂给 π0.7。

通过这种知识蒸馏,π0.7 这一个通用模型就学会了 Recap 优化的所有技巧。结果是,无论是叠衣服、做咖啡还是折盒子,π0.7 的成功率和速度都达到了之前专门训练的 Recap 专家模型水平,有时甚至更好。





也就是说,现在他们不再需要为每个任务单独维护一个专家模型,一个通用模型就能搞定所有活儿,这也是语言模型领域发生过的重要转折。





π0.7 是一个通用模型,因为它能够控制各种不同的机器人执行各种不同的任务。前面提到的那些都是针对特定能力(比如泛化性、跨本体迁移)做的专门测试,除此之外他们还试了更多日常场景 —— 像削蔬菜、用清洁剂擦玻璃门这些活儿它都能干。



π0.7 为何如此强大?

π0.7 为什么能泛化得这么开?核心在于数据要杂,但提示要细。

基础模型想泛化好,本来就得多喂各种来源的数据—— 他们汇集了几十种不同机器人的操作记录、人类演示视频,还有各种自主策略跑出来的实验数据。

不过,光是把这些数据混在一起可不行。关键是要在「提示词」上下功夫:不仅要告诉模型做什么,还要告诉它怎么做(steer)。



这套提示框架让 π0.7 可以把以前难以合并的数据源统一利用起来,包括:

有了这些丰富的标注信息,π0.7 就能放心地使用更多类型的数据。举个例子,那些质量不高的自主数据,本来可能会「教坏」模型,让模型学出低质量的动作。但只要给这类数据打上合适的标签,比如「质量偏低」或「速度偏慢」,模型就能正确理解,不会照单全收。



下图展示了模型架构的整体概况:





π0.7 是一个统一的通用模型,它具备一种「组合式泛化」的能力 —— 不仅能听懂各种指令、看懂视觉子目标,而且开箱即用,表现相当出色。即便是以前需要专门训练、精细调优的「专家模型」才能完成的任务,它也能直接上手。

研究人员认为,像 π0.7 这样能力强、可操控的模型,未来有可能解决更复杂、从未见过的任务。怎么做到呢?让模型自己「想一想」,先思考可能用什么方法去完成任务,利用它遵循多种提示的能力,把这些想法落地成具体的动作,然后再根据执行结果反思、调整方案。

所以,高效的提示遵循和泛化能力,不仅让人更方便地告诉机器人「我想让你做什么」,还能让现代基础模型把它们的语义推理和问题解决能力「翻译」成物理世界中的行动。换句话说,让机器人真正理解并动手干活。

除了这些展望,Physical Intelligence 团队还分享了他们关于世界模型以及未来 scale 方向的看法。团队成员 Lucy Shi 提到,他们原本赌世界模型会是机器人泛化能力的关键,结果数据规模一拉大,VLA 基线就把 world model 吃掉了,而且架构简单得多。











不过,他们也没有完全否定 world model。在 π0.7 中,他们仍然使用了轻量级 world model 来生成视觉子目标。



同时,Lucy Shi 也发现,现在模型能力是提上来了,但评估又成了新的瓶颈。数据那么多,你很难确定模型到底见没见过某个任务相关的数据,因此泛化也很难定义。这也是未来值得发力的一个方向



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
门店给顾客发有偿陪睡信息?沪上阿姨:已报警,账号疑被盗用

门店给顾客发有偿陪睡信息?沪上阿姨:已报警,账号疑被盗用

南方都市报
2026-05-12 17:39:36
人没到先点名!特朗普还没落地,内塔尼亚胡竟提前对中国发出警告

人没到先点名!特朗普还没落地,内塔尼亚胡竟提前对中国发出警告

小叨娱乐
2026-05-12 13:39:10
打破常规 国内航线燃油附加费5月16日起再上调

打破常规 国内航线燃油附加费5月16日起再上调

财联社
2026-05-12 16:55:15
这和不穿有啥区别?赵露思演唱会被吐槽内衣外穿,扭腰摆臀太辣眼

这和不穿有啥区别?赵露思演唱会被吐槽内衣外穿,扭腰摆臀太辣眼

青梅侃史啊
2026-05-13 07:26:36
一个普遍规律:低层次的社交,靠的是饭局;中层次的社交,靠的是利益;而高层次的社交,靠的是这两个关键核心

一个普遍规律:低层次的社交,靠的是饭局;中层次的社交,靠的是利益;而高层次的社交,靠的是这两个关键核心

心理观察局
2026-05-12 09:17:28
三名美人并排站着,你最偏爱哪一个

三名美人并排站着,你最偏爱哪一个

可乐谈情感
2026-05-13 01:20:36
4.5亿欧元!拉莫斯将收购塞维利亚:变身老板 只差最后一步

4.5亿欧元!拉莫斯将收购塞维利亚:变身老板 只差最后一步

叶青足球世界
2026-05-12 20:26:01
伟大的2-0!中国男足21年后重返世界大赛 U17国足小组第2进世少赛

伟大的2-0!中国男足21年后重返世界大赛 U17国足小组第2进世少赛

风过乡
2026-05-13 05:44:42
23岁男子自带挖掘机为社区修路坠崖身亡 家属与社区就“工亡”认定未达一致 律师解读分歧

23岁男子自带挖掘机为社区修路坠崖身亡 家属与社区就“工亡”认定未达一致 律师解读分歧

封面新闻
2026-05-12 20:32:02
29岁克拉克突然去世!疑似因药物过量死亡 李凯尔等好友悲痛万分

29岁克拉克突然去世!疑似因药物过量死亡 李凯尔等好友悲痛万分

罗说NBA
2026-05-13 05:43:30
记者:39岁苏亚雷斯落选乌拉圭世界杯初选名单

记者:39岁苏亚雷斯落选乌拉圭世界杯初选名单

懂球帝
2026-05-12 20:57:09
姚来英已任中国烟草总公司总经理

姚来英已任中国烟草总公司总经理

界面新闻
2026-05-12 11:12:28
12岁男孩确诊癌症晚期!研究证实:这5种添加剂正在升高癌症风险……

12岁男孩确诊癌症晚期!研究证实:这5种添加剂正在升高癌症风险……

环球网资讯
2026-05-11 14:21:45
CBA首组半决赛:历史第7次京沪大战 时隔25年再争总决赛名额

CBA首组半决赛:历史第7次京沪大战 时隔25年再争总决赛名额

醉卧浮生
2026-05-12 22:06:15
白宫公布名单,16位美国商界领袖将随特朗普访华

白宫公布名单,16位美国商界领袖将随特朗普访华

界面新闻
2026-05-12 21:23:09
蒋友青:我不认识蒋万安,平时完全没来往!他们之间发生了什么?

蒋友青:我不认识蒋万安,平时完全没来往!他们之间发生了什么?

凡人侃史
2026-05-12 14:37:12
两次嫁给梁靖崑,退圈安心照顾两个儿子,如今丈夫成为大学教授

两次嫁给梁靖崑,退圈安心照顾两个儿子,如今丈夫成为大学教授

往史过眼云烟
2026-05-12 22:04:20
奶奶骑台铃电动车接6岁孙子,NFC解锁后方向突然锁死两人摔伤;家属:不到一年发生七八次事故;台铃回应

奶奶骑台铃电动车接6岁孙子,NFC解锁后方向突然锁死两人摔伤;家属:不到一年发生七八次事故;台铃回应

大象新闻
2026-05-12 19:46:06
社评:世界期待中美携手多办大事实事好事

社评:世界期待中美携手多办大事实事好事

环球网资讯
2026-05-13 00:41:17
女子结婚不到一周,却因摩洛哥新娘视频导致离婚

女子结婚不到一周,却因摩洛哥新娘视频导致离婚

映射生活的身影
2026-05-12 12:13:28
2026-05-13 07:44:49
舍子花
舍子花
舍子花
633文章数 72关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
时尚
手机
教育
艺术

本地新闻

用苏绣的方式,打开江西婺源

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

手机要闻

谷歌安卓17新增系统验证功能:Pixel手机首发,识别恶意仿冒系统

教育要闻

600分以下想要本科就业,如何报志愿

艺术要闻

这位女摄影师的航拍风景照片,简直太美了!

无障碍浏览 进入关怀版