武汉大学的研究人员开发了一种新框架,可以帮助机器人更轻松地操控物体。在一篇新论文中在 arXiv上介绍,这种方法应该使类人机器人能够抓取和处理比目前更多样化的物体。
目前,类人机器人在使用工具、抓取物体和行走等任务中表现出色,但它们存在固有的局限性。在大多数情况下,当物体形状发生变化或光线变化时,它们可能会失败。
它们在完成机器人没有特别训练过的任务时也会遇到困难,这种缺乏泛化能力被普遍认为是该技术的主要局限之一。
为了帮助克服这一点,武汉团队着手开发一种名为递归几何先验多模态策略的框架,简称RGMP。这个框架旨在帮助类人机器人对形状和空间等事物有一种内置的常识。
它还为机器人提供了一种更好地选择任务所需技能的方法,以及一种更高效的学习运动模式的方法。
使类人机器人更通用
其最终目标是帮助机器人选择合适的动作,并在新的环境中以远低于以往的训练数据进行适应能力的提升。根据团队的说法,RGMP 由两个主要部分组成。
第一个部分称为 几何先验技能选择器 (GSS),它帮助机器人判断哪些‘工具’和技能最适合完成某项任务。通过相机等传感器,机器人可以通过 GSS 来识别物体的形状、大小和方向。
掌握这些信息后(可以这么说),机器人就可以确定完成特定任务所需的操作(比如:拾起、推、抓、用双手握住等)。
第二种方法叫做自适应递归高斯网络(ARGN)。一旦机器人选择技能,ARGN 会帮助机器人执行任务。它通过建模机器人与物体之间的空间关系来实现这一点。
它还可以帮助逐步预测机器人的动作,并且数据效率非常高(所需的训练样本比典型的深度学习方法少得多)。
这种 ARGN 和 GSS 的结合帮助机器人更好地完成任务,而不需要进行数千次演示和训练。在测试中,使用该框架的机器人在没有任何完成经验的新任务中,成功率达到了令人印象深刻的 87%。
相比于竞争对手,这一改进非常显著
团队还发现,该框架的数据效率比目前基于扩散策略的模型高出大约 5 倍(这些模型目前是最先进的)。这真是令人印象深刻,而且在未来可能会非常重要。
如果机器人能可靠地操控物体,不用为每种新情况重新训练,它们实际上可以用来做一些家庭任务,比如清洁、整理,甚至做饭。
这将使类人机器人在仓库、餐厅和制造业等场所的任务提升到一个新水平。展望未来,团队希望扩展RGMP,让机器人几乎不需要人类教学就能学习新任务。
他们还计划帮助RGMP自行推断全新物体的正确动作方式,并自动生成针对特定任务的运动模式。“我们未来的研究将专注于提升RGMP框架在更多任务中的适应能力,”研究首席作者Xuetao Li解释道。
“我们还计划探索任务特定动作轨迹的自动推断,让机器人能够根据最少的人类输入或已有知识推断新物体的操作,从而进一步减少在动态环境中进行详细教学的需求,”他补充道。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.