网易首页 > 网易号 > 正文 申请入驻

机器人公司Physical Intelligence:模型能完成从未训练过的任务

0
分享至


Physical Intelligence是一家成立两年、总部位于旧金山的机器人初创公司,已悄然成为湾区最受瞩目的AI企业之一。该公司于近日发布了最新研究成果,表明其新模型能够引导机器人完成从未经过专项训练的任务——这一能力甚至让公司自己的研究人员感到意外。

这款名为π0.7的新模型,代表着该公司朝着通用机器人"大脑"这一长期目标迈出的早期但重要一步:机器人面对陌生任务时,只需通过自然语言指引便能真正完成操作。如果研究结论经得起推敲,则意味着机器人AI或正在逼近一个类似大语言模型当年的关键拐点——能力开始以超出训练数据预期的速度复合增长。

组合泛化能力:打破"死记硬背"的训练范式

这项研究的核心主张是"组合泛化"——即将在不同情境中习得的技能进行组合,从而解决模型从未遇到过的新问题。长期以来,机器人训练的标准做法本质上是死记硬背:针对某项特定任务收集数据,训练专用模型,然后对每项新任务重复此流程。Physical Intelligence表示,π0.7打破了这一模式。

公司联合创始人、加州大学伯克利分校机器人AI教授谢尔盖·莱文(Sergey Levine)表示:"一旦模型跨越那个临界点——从只会执行已收集数据对应的任务,到真正以新方式重新组合运用这些技能——其能力提升将超越与数据量成线性增长的速度。这种更为优越的扩展特性,我们在语言和视觉等其他领域也曾观察到过。"

空气炸锅实验:令研究人员惊叹的意外能力

论文中最引人注目的演示,涉及一台模型在训练中几乎从未接触过的空气炸锅。研究团队调查后发现,整个训练数据集中仅有两段相关记录:一段是另一台机器人将空气炸锅盖推上,另一段来自开源数据集,记录了某台机器人按照指令将塑料瓶放入空气炸锅。而该模型竟能将这些零散片段与更广泛的网络预训练数据融合,形成对这台电器工作原理的实用性理解。

Physical Intelligence研究科学家、斯坦福大学计算机科学博士阿什温·巴拉克里希纳(Ashwin Balakrishna)坦言:"很难追溯知识究竟从何而来,也难以预判模型在哪些地方会成功或失败。"尽管如此,在零引导的情况下,该模型尝试用空气炸锅烹饪红薯,结果尚算过得去;而在逐步口头指导下——就像向新员工解释操作步骤那样——机器人则顺利完成了任务。

这种语言指导能力之所以重要,在于它意味着机器人可以在全新环境中部署,并通过实时指令改善表现,无需重新收集数据或重新训练模型。

局限性与失败案例:研究团队坦诚自我批评

研究人员并不回避模型的局限性,也未过度渲染研究成果。在至少一个案例中,他们将矛头直接指向了自身团队。

巴拉克里希纳说:"有时候失败不在于机器人或模型本身,而在于我们——我们不擅长提示词工程。"他描述了一次早期空气炸锅实验,成功率仅为5%。在花了大约半小时优化任务描述方式之后,成功率一跃升至95%。

该模型目前也尚不具备从单一高层指令出发、自主执行复杂多步骤任务的能力。莱文表示:"你不能直接告诉它'帮我做片吐司'。但如果逐步引导它——'对于烤面包机,先打开这个部分,按下那个按钮,再做这一步'——它通常就能顺利完成。"

研究团队同时承认,机器人领域目前缺乏标准化的评测基准,这使得外部验证其研究结论颇为困难。对此,公司转而将π0.7与自身此前的专用模型进行比较——这些专用模型是针对单一任务训练的专项系统——结果显示,通用模型在制作咖啡、折叠衣物、组装纸箱等一系列复杂任务中均能与之媲美。

超出预期的能力:研究者眼中最珍贵的惊喜

如果说这项研究有什么最值得关注之处,那或许不是某个具体的演示,而是结果令研究人员——那些对训练数据了如指掌的专业人士——感到真正意外的程度。

"我以前的经验一向是:只要深入了解数据内容,就能大致判断模型能做什么,"巴拉克里希纳说,"我几乎从不会感到惊讶。但过去几个月是我第一次真正感到震惊。我随手买了一套齿轮,问机器人'你能转动这个齿轮吗?'它就直接做到了。"

莱文回忆起研究人员第一次看到GPT-2生成一篇关于安第斯山脉独角兽故事时的情景:"它到底是从哪里学来秘鲁独角兽的?这种组合太奇特了。我认为,在机器人领域看到类似现象,真的意义非凡。"

当然,批评者会指出一个显而易见的不对等之处:大语言模型可以从整个互联网中汲取知识,而机器人没有这种条件,再聪明的提示词也无法完全弥补这一差距。但面对质疑,莱文的回应却指向另一个方向。

"对任何机器人泛化演示,人们总能提出一个批评:任务太无聊了,机器人又没在做后空翻。"他反驳了这种逻辑框架,认为令人眼前一亮的机器人演示与真正具备泛化能力的机器人系统之间的区别,恰恰就是问题的核心所在。他认为,泛化能力看起来永远不如精心编排的技巧性表演那样震撼,但其实用价值要高得多。

论文本身在措辞上保持审慎,将π0.7描述为展现出泛化能力的"初步迹象"与新能力的"初步演示"。这些是研究成果,而非已上市产品。Physical Intelligence从一开始便对商业化时间表保持克制态度。当被直接问及基于这些研究成果的系统何时能够准备好实际部署时,莱文拒绝猜测:"我认为有充分理由保持乐观,进展速度也确实比我几年前预期的要快。但这个问题真的很难回答。"

融资规模持续扩大:估值或将突破百亿美元

Physical Intelligence迄今已累计融资超过10亿美元,最新估值达56亿美元。投资者热情的重要来源之一,是联合创始人拉奇·格鲁姆(Lachy Groom)。他曾是硅谷最受认可的天使投资人之一,投资过Figma、Notion、Ramp等知名企业,之后认定Physical Intelligence正是他一直在寻找的公司。这一背景帮助该初创公司吸引了大量机构资本,尽管它拒绝向投资者提供商业化时间表。目前,该公司据悉正在洽谈新一轮融资,若成功完成,估值将接近翻倍,达到110亿美元。公司团队对此拒绝置评。

Q&A

Q1:π0.7模型的"组合泛化"能力是什么意思?

A:组合泛化是指模型能够将在不同场景中分别学到的技能进行重新组合,从而解决从未在训练数据中出现过的新任务。过去机器人训练是"一事一练"的专项模式,而π0.7可以融合零散知识片段,配合语言指令完成陌生任务,这标志着机器人AI从专用走向通用的重要转变。

Q2:π0.7目前有哪些明显的局限性?

A:目前π0.7还不能从单一高层指令出发自主完成复杂多步骤任务,比如无法直接听懂"帮我做吐司"这类命令。此外,模型的成功率高度依赖提示词的质量,研究人员曾通过优化任务描述将成功率从5%提升到95%。机器人领域也缺乏统一的评测基准,外部验证较为困难。

Q3:Physical Intelligence目前的融资和估值情况如何?

A:Physical Intelligence迄今已累计融资超过10亿美元,最新估值为56亿美元。目前公司正在洽谈新一轮融资,若完成,估值将接近翻倍至约110亿美元。尽管公司拒绝提供明确的商业化时间表,联合创始人格鲁姆的天使投资背景仍为其吸引了大量机构资本。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真子公主低调庆祝孩子1周岁生日,离开王室5年未回日本,比哈里狠

真子公主低调庆祝孩子1周岁生日,离开王室5年未回日本,比哈里狠

毒舌小红帽
2026-04-19 21:42:56
张雪机车因性能太强遭限制:增重7公斤限5%动力 张雪回应

张雪机车因性能太强遭限制:增重7公斤限5%动力 张雪回应

快科技
2026-04-19 15:31:07
被coco曝三胎生父后,张柏芝带儿子露面,谢霆锋坦白不娶王菲内幕

被coco曝三胎生父后,张柏芝带儿子露面,谢霆锋坦白不娶王菲内幕

一盅情怀
2026-04-19 18:20:07
WCBA总决赛:四川女篮轰20-0大胜山西2-1夺赛点 坎贝奇29+10

WCBA总决赛:四川女篮轰20-0大胜山西2-1夺赛点 坎贝奇29+10

醉卧浮生
2026-04-19 21:21:28
16万年一遇的彗星来了,为什么我们还在用肉眼追它

16万年一遇的彗星来了,为什么我们还在用肉眼追它

赛博兰博
2026-04-18 17:24:40
苏联背后的操控!蓄意扩大朝鲜战争,让中美两国苦不堪言

苏联背后的操控!蓄意扩大朝鲜战争,让中美两国苦不堪言

南极狼人
2026-04-17 20:18:46
明天谷雨,牢记:1不晒、2要躲、3不坐、4要吃,寓意五谷丰登!

明天谷雨,牢记:1不晒、2要躲、3不坐、4要吃,寓意五谷丰登!

阿龙美食记
2026-04-19 11:50:47
太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

橙星文娱
2026-04-17 13:19:56
教育部刚通知!9月起上学新规全覆盖,普通家庭孩子上学迎公平

教育部刚通知!9月起上学新规全覆盖,普通家庭孩子上学迎公平

复转这些年
2026-04-18 11:43:46
5月1日正式实施!烟酒礼品全面严控,公职人员好日子到头了

5月1日正式实施!烟酒礼品全面严控,公职人员好日子到头了

李博世财经
2026-04-18 17:03:09
欧尔班威胁:下周恢复油运我们就解冻90亿欧元援助

欧尔班威胁:下周恢复油运我们就解冻90亿欧元援助

桂系007
2026-04-19 23:49:10
我陪寡妇王姐爬山,她小声说:你做我老公,我什么都给你

我陪寡妇王姐爬山,她小声说:你做我老公,我什么都给你

i书与房
2026-04-18 21:46:27
40岁演员周瑞自曝:近五个月未进组拍戏,蜗居10平小屋,无车无房

40岁演员周瑞自曝:近五个月未进组拍戏,蜗居10平小屋,无车无房

韩小娱
2026-04-19 18:29:27
年纪越大,越要吃肉?提醒:这3种肉要舍得吃,吃对了比吃补品强

年纪越大,越要吃肉?提醒:这3种肉要舍得吃,吃对了比吃补品强

秀厨娘
2026-04-18 21:10:42
极端情况下,切尔西可能要靠输给利物浦来获得欧冠资格

极端情况下,切尔西可能要靠输给利物浦来获得欧冠资格

懂球帝
2026-04-20 00:22:46
英国喜剧演员婚礼请柬成BBC裁员梗

英国喜剧演员婚礼请柬成BBC裁员梗

追星雷达站
2026-04-19 03:03:55
探索爱与自爱的艺术:解锁“阴蒂周边圈圈法”的奥秘

探索爱与自爱的艺术:解锁“阴蒂周边圈圈法”的奥秘

精彩分享快乐
2026-04-17 07:10:09
赢球挨骂!曼城王牌全场隐身,成球队最大拖油瓶

赢球挨骂!曼城王牌全场隐身,成球队最大拖油瓶

奶盖熊本熊
2026-04-20 01:52:31
三星三折手机卖完就绝版,是饥饿营销还是真做不下去?

三星三折手机卖完就绝版,是饥饿营销还是真做不下去?

报错免疫体
2026-04-19 03:11:26
你可以活多久?美国教授推出“寿命公式"

你可以活多久?美国教授推出“寿命公式"

霹雳炮
2026-04-18 23:28:44
2026-04-20 04:43:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17789文章数 49700关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

数码
教育
房产
本地
旅游

数码要闻

华为新机发布前瞻:阔折叠X Max+影像旗舰Pura 90,都没悬念了

教育要闻

655家单位、1.29万个岗位,湖南用心帮大学生找工作

房产要闻

官宣签约最强城更!海口楼市,突然杀入神秘房企!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

旅游要闻

北京投入2.2亿元建成和田“三馆一院”

无障碍浏览 进入关怀版