网易首页 > 网易号 > 正文 申请入驻

苹果发布 MM1:300亿参数的多模态,高效预训练与少样本应用

0
分享至

本文为 1290 ,建议阅读 2分钟

苹果公司发布论文提出 MM1 :多模态大语言模型预训练的方法、分析和启示, 在这项工作中,苹果讨论了构建高性能多模态大语言模型(MLLM)的问题。特别研究了各种架构组件和数据选择的重要性

研究团队对MM1模型架构的各个组成部分进行了细致的消融实验,包括图像编码器、视觉-语言连接器以及预训练数据的选择。实验结果显示,图像分辨率、图像编码器的预训练目标以及视觉-语言连接器的设计对模型性能有着显著的影响。特别是,通过混合使用图像标题、交错的图像-文本数据和纯文本数据进行大规模预训练,MM1模型在多项基准测试中实现了最先进的少量样本学习结果‍

在预训练阶段,MM1模型采用了不同比例的图像标题、交错图像-文本和纯文本数据的混合。这种混合方法在提高模型的零样本(zero-shot)和少样本(few-shot)性能方面起到了关键作用。实验数据表明,增加图像标题数据的比例可以显著提升零样本性能,而对于少样本性能来说,交错图像-文本数据的比例至关重要。此外,纯文本数据的使用也对模型的少样本和文本性能有所提升‍

MM1模型的另一个显著特点是对高分辨率图像的支持。通过在微调阶段采用位置嵌入插值和子图像分解技术,MM1能够处理高达1344×1344像素的图像,这在多模态模型中尚属首次。这一能力使得MM1在处理复杂视觉任务时更加精准,为图像理解任务提供了新的可能‍

监督式微调(Supervised Fine-Tuning, SFT)阶段,MM1模型在多个已建立的多模态基准测试中表现出色。这些测试包括了视觉问答(VQA)、图像标题生成等任务,MM1模型在这些任务中不仅超越了同等规模的现有模型,甚至在某些任务上与更大的模型相比也毫不逊色‍

MM1模型的构建过程中,研究团队还探索了混合专家(Mixture-of-Experts, MoE)模型的潜力。通过在模型中引入MoE结构,MM1能够在保持推理速度的同时,提升模型的容量。实验结果表明,MoE模型在几乎所有基准测试中都优于对应的密集模型,显示出MoE在进一步扩展模型规模方面的巨大潜力‍

研究团队通过公开详细的预训练策略、数据选择和模型架构,为社区提供了构建强大模型的参考。随着模型架构和数据策略的不断演进,MM1所体现的设计原则和方法论,将为构建更强大的AI模型提供指导,推动人工智能领域向更深层次的理解和发展迈进‍

结语‍‍

通过扩展所提出的方案,苹果构建了 MM1,这是一个最多 30B 个参数的多模态模型系列,由密集模型和专家混合 (MoE) 变体组成,它们在预训练指标中是 SOTA,并且在训练后实现有竞争力的性能对一系列已建立的多式联运基准进行监督微调。得益于大规模的预训练,MM1 具有增强的上下文学习和多图像推理等吸引人的特性,可以实现少量的思维链提示

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

苹果发力大模型

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
多家车企大降价,我听到一片欢呼

多家车企大降价,我听到一片欢呼

新行情
2026-03-05 15:00:34
Unity官宣:全球商店移除中国开发者资源!

Unity官宣:全球商店移除中国开发者资源!

3DM游戏
2026-03-04 09:18:05
全国政协委员袁小彬:建议取消私家车年审制度,实施远程监测

全国政协委员袁小彬:建议取消私家车年审制度,实施远程监测

南方都市报
2026-03-05 17:28:05
特朗普要求立即赦免以色列总理

特朗普要求立即赦免以色列总理

财联社
2026-03-06 01:49:08
美国人也很纳闷:伊朗导弹怎么还没炸光?美媒给答案:朝鲜出手了

美国人也很纳闷:伊朗导弹怎么还没炸光?美媒给答案:朝鲜出手了

阿钊是个小小评论员
2026-03-06 01:39:04
女子因出差将车停农村老家半个月,底盘发现大量红薯和玉米,当事人:一共20斤,用了20分钟才清理完

女子因出差将车停农村老家半个月,底盘发现大量红薯和玉米,当事人:一共20斤,用了20分钟才清理完

潇湘晨报
2026-03-05 16:49:10
伊朗官员:美国媒体在撒谎!伊朗没有向美国发送任何信息

伊朗官员:美国媒体在撒谎!伊朗没有向美国发送任何信息

西游日记
2026-03-05 14:03:18
比亚迪发布第二代刀片电池,王传福:从10%充到97%只用9分钟

比亚迪发布第二代刀片电池,王传福:从10%充到97%只用9分钟

蓝鲸新闻
2026-03-05 19:39:30
美以伊军事冲突最大副作用,是斩断了俄罗斯的“救命稻草”

美以伊军事冲突最大副作用,是斩断了俄罗斯的“救命稻草”

廖保平
2026-03-05 12:08:52
贝尔再谈C罗:他只想进球超越梅西!我不传球他就会挥动双臂不满

贝尔再谈C罗:他只想进球超越梅西!我不传球他就会挥动双臂不满

奥拜尔
2026-03-05 18:22:07
伊朗国防部警告:我们还没动用最先进的武器,不会在最初几天全部部署

伊朗国防部警告:我们还没动用最先进的武器,不会在最初几天全部部署

西游日记
2026-03-05 13:55:48
樊振东落选!世界杯名单公布,王励勤说到做到,温瑞博成最大黑马

樊振东落选!世界杯名单公布,王励勤说到做到,温瑞博成最大黑马

越岭寻踪
2026-03-05 02:39:06
湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

极目新闻
2026-03-04 09:59:45
原来刘烨当初没撒谎,多方曝谢娜夫妇猛料,网友担忧的事还是发生

原来刘烨当初没撒谎,多方曝谢娜夫妇猛料,网友担忧的事还是发生

白面书誏
2026-03-04 13:59:52
全国人大代表汪勇:电动自行车难以充分满足快递外卖配送需要,建议增设电动摩托车专用绿色号牌

全国人大代表汪勇:电动自行车难以充分满足快递外卖配送需要,建议增设电动摩托车专用绿色号牌

极目新闻
2026-03-05 20:12:33
哈梅内伊被害细节最新曝光,太可怕了!

哈梅内伊被害细节最新曝光,太可怕了!

仕道
2026-03-05 14:34:10
4亿成本,片方分账3200万,亏损超3.5亿,2026年最惨电影诞生了

4亿成本,片方分账3200万,亏损超3.5亿,2026年最惨电影诞生了

电影票房预告片
2026-03-05 23:47:12
郭艾伦重伤广州爆冷力克山东 徐昕17+10+4帽克里斯22+16

郭艾伦重伤广州爆冷力克山东 徐昕17+10+4帽克里斯22+16

醉卧浮生
2026-03-05 21:40:55
央视火速曝光:全是假货!别再往家里搬了,很多人天天在用!

央视火速曝光:全是假货!别再往家里搬了,很多人天天在用!

云舟史策
2026-03-05 17:54:39
新的战场出现!美司令首次承认:中国卫星已经强到让美国必须反击

新的战场出现!美司令首次承认:中国卫星已经强到让美国必须反击

丁丁鲤史纪
2026-03-05 12:04:56
2026-03-06 05:08:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

独家|林俊旸辞职 我们和认识他的人聊了聊

头条要闻

伊朗:已作好准备应对美国地面行动

头条要闻

伊朗:已作好准备应对美国地面行动

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

15.98万元起 第三代领克03大尾翼版上市

态度原创

教育
房产
亲子
艺术
时尚

教育要闻

华南理工大学公开招聘专职辅导员!

房产要闻

超猛!又有2800套房源砸出,2026海口安居房,彻底爆发!

亲子要闻

去挖煤了?娃穿一天的衣服能脏到哪种程度?网友:扫地机都多余买

艺术要闻

他偏要画最难的部分——这位韩国画师,只画手脚与人体,惊艳了无数人!

显白的奶茶色,穿出春日味道

无障碍浏览 进入关怀版