网易首页 > 网易号 > 正文 申请入驻

苹果发布2025基础模型报告,揭开Apple Intelligence技术全貌

0
分享至

苹果公司近日正式发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告,这是继去年首次公开其 AI 基础模型技术细节后的重要更新。而且,就在不久前 Meta 刚刚以数千万美元薪酬挖走了苹果基础模型团队负责人庞若鸣(Ruoming Pang),这份技术报告很可能是庞若鸣在苹果生涯的最后一份重要成果。

庞若鸣本人也在社交媒体上对这份报告进行了介绍,并正式将团队的重任交接给了 Zhifeng Chen。

报告详细介绍了一套双轨并行的模型策略。第一款是一个约 30 亿参数的端上模型,专为在 iPhone、iPad 和 Mac 等苹果设备上高效运行而设计。该模型经过深度优化,以充分利用苹果自研芯片的性能。另一款则是在苹果私有云计算上运行的可扩展服务器模型,用于处理更复杂的用户请求。这种“端云协同”的架构旨在平衡性能、效率和隐私,简单的任务在本地设备上完成,复杂任务则交由具备同等级别隐私保护的云端服务器处理。

为了提升端上模型的运行效率,苹果的工程师们引入了一项名为“键值缓存共享”(KV Cache Sharing)的创新架构。具体而言,他们将模型划分为两个区块,其中一个区块(占模型层数的 37.5%)直接共享另一区块(占 62.5%)生成的键值缓存,从而将缓存所需的内存减少了 37.5%,并显著缩短了生成第一个词元 token 的响应时间。

对于服务器端模型,苹果则开发了一种名为“并行轨道混合专家”(Parallel-Track Mixture-of-Experts, PT-MoE)的全新 Transformer 架构。该架构将一个大型模型分解为多个更小的、被称为“轨道”(Track)的并行处理单元。每个轨道独立处理信息,仅在特定节点进行同步,从而大幅减少了传统大型模型中常见的通信瓶颈,提高了训练和推理的效率。此外,通过在每个轨道内部署混合专家(MoE)层,该模型能够更高效地扩展,以低延迟处理复杂任务,同时不牺牲模型质量。

在赋予模型理解图像的多模态能力方面,报告也披露了其视觉编码器的技术细节。服务器和端上模型分别采用了 ViT-g 和更高效的 ViTDet-L 作为视觉主干网络。值得一提的是,端上模型还采用了一种新颖的“寄存器-窗口”(Register-Window)机制,使其能够同时有效捕捉图像的全局上下文信息和局部精细细节。

在训练数据方面,苹果保持了其一贯强调隐私保护的风格,在报告中明确了其数据来源和隐私原则。训练数据主要来自三方面:从出版商处授权的数据、由苹果网页爬虫 Applebot 抓取的公开网络信息,以及高质量的合成数据。苹果特别强调,在训练过程中绝不使用用户的私人个人数据或用户交互信息。

同时,公司遵循 robots.txt 协议,允许网站发布者选择不让其内容被用于模型训练,从源头上保障了内容所有者的权利和用户隐私。报告显示,苹果处理了超过 100 亿对高质量的图文对和 50 亿对合成图像标题数据,并通过先进的流水线进行过滤和提纯,以确保训练数据的质量。

为了让这些模型能在实际设备上高效运行,苹果采用了积极的优化策略。端上模型通过“量化感知训练”(Quantization-Aware Training, QAT)技术,将模型权重压缩至每权重 2 比特。服务器模型则利用了一种名为“自适应可扩展纹理压缩”(Adaptive Scalable Texture Compression, ASTC)的技术,该技术利用了苹果 GPU 中已有的硬件解压模块,能够以几乎零计算成本的方式对模型权重进行解压,最终将模型压缩至每权重约 3.56 比特。对于压缩过程中可能出现的性能损失,苹果则通过训练低秩适配器(Low-Rank Adaptation, LoRA)来进行补偿和恢复。

性能评估的结果显示,在 MMLU 等标准测试中,苹果的端上模型表现优于或持平于 Qwen-2.5-3B、Gemma-3-4B 等同规模的开源模型。

服务器模型则在与 LLaMA 4 Scout 的对比中表现出色,但与 Qwen-3-235B 和 GPT-4o 等更大规模的模型相比仍有差距。在与人类评分员进行的并排比较中,苹果的模型在多个语言区域和任务中的表现都较为突出。

最后,苹果还为开发者推出了全新的“基础模型框架”(Foundation Models framework),允许开发者直接调用设备上的 30 亿参数模型。该框架与 Swift 语言深度集成,通过名为“引导式生成”的功能,开发者可以仅用几行代码就让模型直接生成结构化的 Swift 数据类型,极大地简化了在应用中集成 AI 功能的过程。苹果强调,整个框架的设计都贯彻了其负责任 AI 的原则,内置了多重安全护栏,旨在帮助开发者构建既智能又注重隐私保护的下一代应用。

参考资料:

1. https://machinelearning.apple.com/research/apple-foundation-models-tech-report-2025

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台积电宣布:投资170亿美元,量产3nm芯片!魏哲家为何押注日本?

台积电宣布:投资170亿美元,量产3nm芯片!魏哲家为何押注日本?

王爷说图表
2026-02-05 16:40:31
53岁李冰冰在巴黎杀疯了!白到发光隐现腹肌,这状态真不是人类?

53岁李冰冰在巴黎杀疯了!白到发光隐现腹肌,这状态真不是人类?

草莓解说体育
2026-02-06 05:59:56
公积金缴纳等级,你在几级?

公积金缴纳等级,你在几级?

新浪财经
2026-02-04 05:17:52
警报!三种“毒早餐”竟成家长的心头好,快来看看你在喂什么!

警报!三种“毒早餐”竟成家长的心头好,快来看看你在喂什么!

特约前排观众
2026-01-25 00:20:06
巴拿马港口冷清,中方未宣行动见效,小国陷两难抉择

巴拿马港口冷清,中方未宣行动见效,小国陷两难抉择

王楔晓
2026-02-06 10:19:00
东风奕派发布情况声明:eπ007事故监控视频在网络平台传播,视频记录的事故发生于2025年,事故是车辆与货车高速碰撞后引发

东风奕派发布情况声明:eπ007事故监控视频在网络平台传播,视频记录的事故发生于2025年,事故是车辆与货车高速碰撞后引发

大风新闻
2026-02-05 17:48:02
中方已做好最坏打算!黄岩岛发生激烈对峙,美媒:轰6和055都到了

中方已做好最坏打算!黄岩岛发生激烈对峙,美媒:轰6和055都到了

古事寻踪记
2026-02-04 07:10:35
荣耀否认抄袭iPhone,客服:独立设计

荣耀否认抄袭iPhone,客服:独立设计

观察者网
2026-02-04 15:58:45
乌度卡不想干了?先不满杜兰特,又批评申京,KD赛后公然要战术

乌度卡不想干了?先不满杜兰特,又批评申京,KD赛后公然要战术

你的篮球频道
2026-02-06 14:26:35
跟大嫂合伙开店年利润140万,她拿走135万分我5万,我撤资她慌了

跟大嫂合伙开店年利润140万,她拿走135万分我5万,我撤资她慌了

小秋情感说
2026-02-04 09:48:58
卢靖姗:我对韩庚的评分太高,生完孩子后,他永远回家先亲我

卢靖姗:我对韩庚的评分太高,生完孩子后,他永远回家先亲我

秀语千寻
2026-02-05 23:52:24
中方火力全开,巴拿马踢到铁板,特朗普来电交底,不想跟中国翻脸

中方火力全开,巴拿马踢到铁板,特朗普来电交底,不想跟中国翻脸

东极妙严
2026-02-05 15:28:10
我国每年近千万人做肠镜!医生直言:做一次肠镜,或管十年无碍

我国每年近千万人做肠镜!医生直言:做一次肠镜,或管十年无碍

白宸侃片
2026-02-01 19:13:01
俄方警告日本“再军事化”,日本会成第二个乌克兰吗?

俄方警告日本“再军事化”,日本会成第二个乌克兰吗?

毛开云
2026-02-03 10:43:17
央视动真格了!2026春晚大换血,赵本山当年的狠话终于应验

央视动真格了!2026春晚大换血,赵本山当年的狠话终于应验

老吴教育课堂
2026-02-06 17:23:25
穿始祖鸟的中产快把北京近郊爬成珠穆朗玛峰了,“零下20度趴在人造冰瀑上当壁虎”

穿始祖鸟的中产快把北京近郊爬成珠穆朗玛峰了,“零下20度趴在人造冰瀑上当壁虎”

Vista氢商业
2026-02-04 13:44:56
中国石油江苏销售公司原总经理佟福财接受审查调查

中国石油江苏销售公司原总经理佟福财接受审查调查

界面新闻
2026-02-06 18:02:36
年利润14亿的绩优股,市盈率仅有14倍,股价从22元跌到9元

年利润14亿的绩优股,市盈率仅有14倍,股价从22元跌到9元

投资观
2026-02-06 07:50:03
封神!段永平加仓茅台,6天狂赚1700万

封神!段永平加仓茅台,6天狂赚1700万

大佬灼见
2026-02-06 09:58:10
追梦:临近交易截止时我非常紧张;我喜欢波尔津吉斯的交易

追梦:临近交易截止时我非常紧张;我喜欢波尔津吉斯的交易

懂球帝
2026-02-06 15:30:07
2026-02-06 18:39:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16229文章数 514588关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

爱泼斯坦案文件牵出更多欧美政商名流

头条要闻

爱泼斯坦案文件牵出更多欧美政商名流

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

教育
旅游
亲子
家居
数码

教育要闻

昆山杜克2025就业报告,诸多隐忧向谁问?

旅游要闻

各景区“随地大小躺”合照火了 游客们自发纷纷在景区里自然躺倒 与风景融为一体

亲子要闻

宝蓝和爸爸做了漂亮的蛋糕为叔叔过生日。看看叔叔喜欢那一个~

家居要闻

现代轻奢 温馨治愈系

数码要闻

索尼旗舰耳机WF-1000XM6定在2月13日登场!降噪性能更强

无障碍浏览 进入关怀版