网易首页 > 网易号 > 正文 申请入驻

OpenAI押注的「1X」训出专用世界模型,首证机器人Scaling Law

0
分享至

机器之心报道

机器之心编辑部

机器人能认出镜子中的自己吗?目前来看,依然做不到。

去年 3 月,OpenAI 领投了一家具身智能公司「1X」。这是一家成立于 2014 年的挪威人形机器人公司,致力于研发双足机器人 NEO 和商用轮式人形机器人 EVE。

本月初,1X 正式推出了专为家庭使用而设计的双足人形机器人 NEO Beta,让人们看到了大模型加持下活灵活现、超拟人机器人的不断进步。

如今,1X 迎来了自己的世界模型。具体地,基于视频生成(Sora)和自动驾驶世界模型(端到端自动驾驶,E2EAD)领域的进展,1X 训练出了一个世界模型,作为自家机器人的虚拟模拟器。

1X 人工智能副总裁 Eric Jang 表示,过去几个月,1X 一直在开发通用机器人的学习模拟器,如今终于问世了。

1X 工程师 Daniel Ho 表示这是机器人世界模型的初步进展,模型可以理解接触到的物理世界并生成高保真视频,使机器人可以在自己的神经空间中执行规划、评估和模拟操作。并且,很多生成的视频片段很难与真实视频区分开来。

1X 创始人兼 CEO Bernt Bornich 表示,这是人形机器人数据显著增强扩展定律的首个证据,「没有勺子」。

各路网友也对这个机器人世界模型给予了很高评价。

世界模型加持下的 1X 人形机器人还让一些人直呼《西部世界》重现。

从 1X 官方给出的 Demo 可以看到,从相同的起始图像序列开始,1X 的世界模型可以从不同的机器人(EVE)动作建议中想象出多种未来。

这个世界模型还能预测非平凡物体(如刚体)的相互作用、掉落物体的影响、部分可观测性、可变形物体(窗帘、衣物)和铰接物体(门、抽屉、窗帘、椅子)。

机器人的「ChatGPT 时刻」,同样需要扩展定律

世界模型解决了构建通用机器人时一个非常实际、但经常被忽视的挑战,即评估。如果你训练的机器人可以执行 1000 项任务,与先前模型相比,我们也很难确定新模型用在机器人上,在这 1000 项任务上表现优越。由于周围环境如光照细微的变化,即使模型权重相同,机器人也可能在几天内经历性能的快速下降。

此前 1X 训练了一个模型,在 50 天的时间里,机器人性能下降了

如果环境随着时间的推移不断变化,那么此前在该环境中达到的实验性能很难复现,因为旧环境不存在了。如果你在不断变化的环境(如家庭或办公室)中评估多任务系统,那么这个问题将会变得更加糟糕。这一状况使得在现实世界中进行机器人科学研究变得异常困难。

经过深入研究我们不禁会问,当数据、计算和模型规模增加时,机器人的能力将如何扩展?在大模型领域,扩展定律普遍得到大家的认同,如果机器人技术要迎来「ChatGPT 时刻」,必须首先建立它的扩展定律。

其他评估方法

基于物理的模拟(Bullet、Mujoco、Isaac Sim、Drake)是快速测试机器人策略的合理方法。这些方法可重置且可重现,这样一来,研究人员能够仔细比较不同控制算法带来的的差异。

然而,这些模拟器大多是为刚体动力学设计的,需要大量手工资产创作。

如何让机器人打开咖啡滤纸的纸盒、用刀切水果、拧开冷冻果酱罐或与人类等其他智能体互动还是一个值得思考的问题。众所周知,家庭环境中遇到的日常物体或者饲养的宠物很难模拟,因此机器人使用的模拟环境往往在视觉上很单调,缺乏现实世界用例的多样性。对现实或模拟环境中有限数量任务的小规模评估无法泛化到对现实世界中的大规模评估。

世界模型

1X 正在采用一种全新的方法来评估通用机器人,即直接从原始传感器数据中学习模拟器,并使用模拟器来评估新策略。通过直接从真实数据中学习模拟器,你可以在不手动创建资产的情况下了解真实世界的复杂性。

在过去的一年里,1X 收集的 1X 旗舰产品 EVE 机器人的数据高达数千小时,这些数据包括在家中和办公室中执行各种移动操作任务以及与人互动的任务。研究人员将这些视频和动作数据结合起来,训练了一个世界模型,该模型可以根据观察和动作预测未来的视频。

动作控制

该研究训练的世界模型能够根据不同的动作指令产生不同的结果,下面展示了在四种不同轨迹条件下的世界模型生成的效果,每种轨迹都从相同的初始帧开始。

左门轨迹

右门轨迹

弹奏空气吉他

世界模型的主要价值来自于模拟对象交互。在抓取盒子实验中,研究团队为模型提供相同的初始框架和三组不同的动作来抓取盒子。在每种情况下,所抓取的盒子都会根据夹具的运动而被提升和移动,而其他盒子则保持不受干扰。

即使没有提供动作,世界模型也会生成看似合理的视频,例如学会驾驶时应避开人和障碍物:

长视野任务

模型还可以生成长视野视频。下面的示例模拟了完整的 T 恤折叠演示。T 恤和可变形物体往往很难在刚体模拟器中实现。

故障

对象连贯性

模型可能无法在交互过程中保持对象的形状和颜色,有时对象甚至可能会完全消失。此外,当对象被遮挡或以不利的角度显示时,它们的外观可能会在整个生成过程中变得扭曲。

物理定律

左边的生成结果表明模型对物理特性有了新的理解,当抓手松开勺子时,勺子掉到桌子上就证明了这一点。然而,在很多情况下,模型生成结果都未能遵守物理定律,例如右侧的盘子悬浮在空中。

自我认知

研究团队让 EVE 走到镜子前,以观察它能否生成与镜子中动作相一致的行为。

结果显示,模型虽然开始自我反思,但没有出现「自我识别」或「自我理解」的觉醒。

博客地址:https://www.1x.tech/discover/1x-world-model

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官宣!德国绝对主力世界杯报销 身价6000万欧 系皇马重点引援目标

官宣!德国绝对主力世界杯报销 身价6000万欧 系皇马重点引援目标

狍子歪解体坛
2026-06-22 20:35:29
安妮·海瑟薇绝美礼服搭配“极其稀有”项链,惊艳全场

安妮·海瑟薇绝美礼服搭配“极其稀有”项链,惊艳全场

奇思妙想生活家
2026-06-23 02:42:29
伊朗发布首轮谈判达成的协议五大要点

伊朗发布首轮谈判达成的协议五大要点

界面新闻
2026-06-22 14:58:00
斯卡洛尼:安帅说我们比赛强度不高?这是赞美但被误解为批评

斯卡洛尼:安帅说我们比赛强度不高?这是赞美但被误解为批评

懂球帝
2026-06-22 11:59:15
2-2爆冷!佛得角创造历史 ,逼平两个世界冠军

2-2爆冷!佛得角创造历史 ,逼平两个世界冠军

温读史
2026-06-23 02:41:17
磷化工、磷酸铁锂,A股盈利能力最强10家公司,洛阳钼业排第一

磷化工、磷酸铁锂,A股盈利能力最强10家公司,洛阳钼业排第一

长风价值掘金
2026-06-22 16:24:19
雷军:攻击我的人只是为了流量

雷军:攻击我的人只是为了流量

观察者网
2026-06-22 10:58:21
他是杨采钰老公,福建某集团富三代,比她小帅气多金,郎才女貌

他是杨采钰老公,福建某集团富三代,比她小帅气多金,郎才女貌

以茶带书
2026-06-22 15:38:16
全线飙涨!氧化锆疯了

全线飙涨!氧化锆疯了

格隆汇
2026-06-22 19:26:15
丈夫谎称外出打工,躲在纸箱3天,亲眼目睹妻子和邻居丑事大怒

丈夫谎称外出打工,躲在纸箱3天,亲眼目睹妻子和邻居丑事大怒

墨策史
2026-06-23 00:48:04
涉留神峪煤矿事故,国家矿山安全监察局山西局监察执法八处三级调研员耿青禄被查

涉留神峪煤矿事故,国家矿山安全监察局山西局监察执法八处三级调研员耿青禄被查

界面新闻
2026-06-22 11:35:03
“万癌之王”,终于要迎来特效药了!

“万癌之王”,终于要迎来特效药了!

健识局
2026-06-21 01:46:26
全世界都没想到,三个弱小国家竟然打垮了三个超级大国

全世界都没想到,三个弱小国家竟然打垮了三个超级大国

揭秘历史的真相
2026-05-22 20:50:40
央视曝光!多款水果接连暴雷,滥用甜味剂8000倍甜度、违规防腐剂

央视曝光!多款水果接连暴雷,滥用甜味剂8000倍甜度、违规防腐剂

阿纂看事
2026-06-22 13:44:48
41岁龙妈崩溃发声:看过我屁股的文章后,我再也不敢看自己了

41岁龙妈崩溃发声:看过我屁股的文章后,我再也不敢看自己了

南万说娱26
2026-05-20 09:25:27
经纪人已抵米兰,国米5000万挖角意甲新星

经纪人已抵米兰,国米5000万挖角意甲新星

元气满分吖
2026-06-23 00:53:14
突尼斯是烂队,这是谁给的勇气?

突尼斯是烂队,这是谁给的勇气?

海子侃生活
2026-06-22 19:36:39
伊朗外交部:伊美达成协议文件

伊朗外交部:伊美达成协议文件

新华社
2026-06-22 09:37:11
和陈梦秘密领证真相大白后,樊振东近况曝出,难怪会淡出国家队

和陈梦秘密领证真相大白后,樊振东近况曝出,难怪会淡出国家队

乐天闲聊
2026-06-19 18:04:07
这话太伤人?里弗斯:哈登打球很闪耀,但他没有赢球体系!

这话太伤人?里弗斯:哈登打球很闪耀,但他没有赢球体系!

爱体育
2026-06-22 21:42:02
2026-06-23 03:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13329文章数 142677关注度
往期回顾 全部

科技要闻

马云与阿里巴巴众高管下田插秧

头条要闻

阿根廷2-0奥地利 卫冕冠军2连胜提前晋级32强

头条要闻

阿根廷2-0奥地利 卫冕冠军2连胜提前晋级32强

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

财经要闻

前美联储主席格林斯潘去世 享年100岁

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

数码
游戏
教育
本地
健康

数码要闻

消息称三星显示已获苹果量产认证,将为折叠屏iPhone独供OLED面板

老司机落泪!爆料称《GTA6》没有"特殊工作者"

教育要闻

首届直博清华学长重返母校,见证科高毕业生最美的青春模样

本地新闻

吃一次广东龙舟饭,才懂什么是豪华盛宴

粽子还没吃完?专家教你“清库存”

无障碍浏览 进入关怀版