1X 为其类人机器人 NEO 推出了被称为 1X 世界模型的系统。
该公司表示,该系统允许 NEO 将简单的语音或文本提示转化为新的物理技能,即使在它从未遇到的情况下也能做到。
此次更新的核心是一个基于视频的 AI 模型,扎根于现实物理。
该公司在一份声明中表示,NEO 现在可以从互联网规模的视频中学习,而不是仅依赖于预编程的行为或大量人类操作的数据,并将这些知识直接应用到物理世界中。
这种方法是为了弥补类人机器人技术中的一个长期短板:把数字智能转化为可靠的物理动作。
通过学习捕捉人类与物体互动的视频,NEO能够在不熟悉的环境和任务中概括自己的行为。
根据1X的说法,这是朝着能够不断自我学习的机器人迈出的第一步,而不是等工程师或操作员来定义每一个新功能。
从指令到行动
使用1X世界模型,用户可以通过语音或文字给NEO发出简短的指令。
机器人用它的摄像头来理解场景,生成未来动作的视觉预测,然后使用逆动力学模型把这些预测转化为精准的动作。
“经过多年的世界模型开发,并使NEO的设计尽可能接近人类,NEO现在可以从互联网规模的视频中学习,并将这些知识直接应用于物理世界,”1X的首席执行官兼创始人Bernt Børnich说。
“凭借将任何提示转化为新动作的能力——即使没有先前的示例——这标志着NEO自我学习掌握几乎所有你能想到的任务的能力的起点。”
在最近发布的演示视频中,NEO展示了完成日常任务的能力,比如打包午餐盒。即使物体与它之前见过的有所不同,机器人也能够顺利地规划和执行任务。
更值得一提的是,NEO还可以处理完全新的动作,甚至不需要任何先前的训练示例。
这些包括打开滑动门、操作马桶盖、熨烫衣物和梳理人类的头发。
公司表示,这反映了将视频中捕捉到的丰富人类知识转化为机器人的行为。
“通过1X世界模型,您可以把任何提示变成完全自主的机器人动作——即使是NEO从未见过的任务和物品,”1X的人工智能研究员丹尼尔·霍说。
会自学的机器人
除了单个任务之外,此次更新还改变了NEO随时间的改进方式。传统的人形机器人很大程度上依赖人类操作员收集的数据,这样既慢又贵。
1X世界模型允许NEO在与世界互动时收集自己的数据,从而创建一个自我强化的学习循环。
这也意味着,随着视频模型的不断进步,NEO也能从中受益。因为世界模型是基于视频理解构建的,因此视频人工智能的进步直接转化为更好的机器人能力。
另一个重点是稳定性。家庭环境常常不可预测,光线变化、杂物和持续的移动都可能影响环境。
1X表示,世界模型帮助NEO在这些条件下保持稳定和适应性,即使环境快速变化,NEO也能做出可靠的反应。
虽然现在还处于早期阶段,但这个更新预示着一个未来,在这个未来,人形机器人的学习方式将更像人类,而不是像机器那样。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.