品玩2月20日讯,据 MarketChpost 报道,微软研究院、马里兰大学、威斯康星大学麦迪逊分校 KAIST 和华盛顿大学的研究人员宣布推出基础大模型 Magma。
Magma 的设计旨在克服现有 VLA 模型的不足,它采用了一种强大的训练方法,将多模态理解、行动基础和规划融为一体。Magma 是通过一个包含 3,900 万个样本的多样化数据集进行训练的,其中包括图像、视频和机器人动作轨迹。它采用了两种新颖的
Magma 采用了深度学习架构和大规模预训练相结合的方法,以优化其在多个领域的性能。该模型使用 ConvNeXt-XXL 视觉骨干处理图像和视频,同时使用 LLaMA-3-8B 语言模型处理文本输入。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.