网易首页 > 网易号 > 正文 申请入驻

深挖苹果 AI 报告:端侧内存占用少 37.5%、云端创新 PT-MoE 架构

0
分享至

IT之家 7 月 22 日消息,科技媒体 9to5Mac 昨日(7 月 21 日)发布博文,挖掘苹果新技术报告论文,探究其 AI 模型的训练、优化及评估过程,并揭示了诸多幕后技术细节。

这份报告全称为《Apple Intelligence Foundation Language Models – Tech Report 2025》,详尽描述了苹果在多个 AI 方面的处理,涵盖模型架构、数据来源、预训练、后训练、工具开发、优化措施以及性能基准等。


该媒体解读该技术报告,挖掘了 4 个值得关注的要点:

端侧模型双区块设计

此前消息显示,苹果的 AI 模型将采用端侧 + 云端组合方式,端侧模型规模大约为 30 亿(3B)个参数。

根据最新公布的技术报告,苹果端侧 AI 模型分为 2 个区块(Blocks),其中第 1 个区块包含大约 62.5% 的 transformer 层,而第 2 个区块包含大约 37.5% 的 transformer 层,但移除了键(Key)和值(Value)的映射。

苹果表示这种分割方式,在不影响模型的总体性能和输出质量的情况下,让模型在缓存时,减少了约 37.5% 的内存需求,同时输出第一个 tokens 的时间也缩短了 37.5%。


云端模型采用创新架构

对于服务器端模型,苹果开发了一种专门为其私有云计算平台量身定制的架构,名为 Parallel-Track Mixture-of-Experts(PT-MoE)。

简单来说,混合专家(Mixture of Experts)模式意味着,不是依赖单一的大型 AI 模型,而是将其拆分为多个较小的子网络(或称为专家),只有在任务与它们的专长相关时才会激活这些子网络。

因此,如果输入提示与烹饪相关,只会激活烹饪领域的专家,而其他专家则保持休眠状态。这样,虽然整体模型依然庞大,但其模块化的设计使得模型能够更快、更精确地响应。


苹果构建了一种名为 Parallel Track Transformer 的新型 Transformer,并利用混合专家(MoE)层对其进行扩展。听起来可能很复杂,但关键在于:

传统的 Transformer 模型会通过一个层的堆栈依次处理 tokens,而苹果的设计则是将模型分为多个并行的轨道。每个轨道独立处理 tokens,并在某些点进行同步。

在每个轨道内,苹果将每个其他常规 Transformer 层替换为 MoE 层,每个标记只激活几个专家,而其他专家保持空闲。由于每个轨道都有自己的本地专家,模型避免了在整个系统中协调时的处理瓶颈。

再加上一个平衡本地上下文与整体理解(称为交织全局和本地关注层)的巧妙设计,最终形成了一个模块化、高效、可扩展的模型,速度更快、更精简,同时保持了高度的智能。

苹果大幅提升多语言支持

Apple 智能最初推出时最受诟病的问题之一(现在依然存在),是英语之外的语言支持有限。随着新模型的发布,苹果扩展了语言支持范围,并在报告中详细介绍了实现这一目标的步骤。


报告中提到,苹果将训练过程中使用的外语数据量从 8% 增加到了 30%。苹果还将其标记器的容量增加了 50%,意味着模型现在能够识别 150K 个不同的标记,而之前只能识别 100K 个。

数据收集

另外是关于数据收集方面,可以参考IT之家此前发布的博文。

苹果在新发布的研究论文中表示,如果出版商不同意其数据被抓取用于训练,苹果公司将不会抓取这些数据。

我们相信,使用多样且高质量的数据来训练我们的模型是必要的。这些数据包括我们从出版商那里获得授权的数据、公开可用或开源数据集中的数据,以及通过我们的网络爬虫 Applebot 抓取的公开信息。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人类幼崽的理解能力有多绝?网友:完全不走寻常路,只有出乎意料

人类幼崽的理解能力有多绝?网友:完全不走寻常路,只有出乎意料

夜深爱杂谈
2025-11-08 22:18:59
雷军这回栽了,小米法务被这个女人拿捏,太打脸

雷军这回栽了,小米法务被这个女人拿捏,太打脸

公子麦少
2025-11-07 14:39:17
落马官员出狱当天,又被逮捕

落马官员出狱当天,又被逮捕

中国新闻周刊
2025-11-08 18:55:04
英超最新积分战报:阿森纳爆冷,曼联丢分,切尔西狂轰3球

英超最新积分战报:阿森纳爆冷,曼联丢分,切尔西狂轰3球

足球狗说
2025-11-09 06:05:18
限制枪手界外球战术,桑德兰缩短了广告牌和场地之间的距离

限制枪手界外球战术,桑德兰缩短了广告牌和场地之间的距离

懂球帝
2025-11-09 10:02:18
调整,11月9日中央五套直播乒乓球时间表:CCTV5白天播,附上赛程

调整,11月9日中央五套直播乒乓球时间表:CCTV5白天播,附上赛程

皮皮观天下
2025-11-09 09:03:01
湖南19岁男生和母亲新疆自驾游,父亲发现纸篓异物,崩溃了

湖南19岁男生和母亲新疆自驾游,父亲发现纸篓异物,崩溃了

纸鸢奇谭
2024-10-13 19:26:30
大乐透第25127期开奖情况:一等奖36注分落在15个地区,广西本月份首次上榜

大乐透第25127期开奖情况:一等奖36注分落在15个地区,广西本月份首次上榜

蓝色海边
2025-11-09 05:59:29
全运会乒乓球!8强名单出炉,蒯曼首秀大胜,孙颖莎对手+赛程出炉

全运会乒乓球!8强名单出炉,蒯曼首秀大胜,孙颖莎对手+赛程出炉

知轩体育
2025-11-09 00:24:44
iPhone 17大卖: 第一批京东自营用户已经在维权了

iPhone 17大卖: 第一批京东自营用户已经在维权了

好看商业
2025-11-07 15:52:03
球衣颜色相近?当值主裁把维罗纳与乌迪内斯搞混了

球衣颜色相近?当值主裁把维罗纳与乌迪内斯搞混了

懂球帝
2025-11-09 01:09:18
河北青年杨茂之,30岁时娶了毛岸英遗孀刘思齐,他究竟是什么人?

河北青年杨茂之,30岁时娶了毛岸英遗孀刘思齐,他究竟是什么人?

青途历史
2025-11-07 04:49:46
此女只应天上有,人间只有此一人,真的漂亮,而且很媚,媚而不俗

此女只应天上有,人间只有此一人,真的漂亮,而且很媚,媚而不俗

乡野小珥
2025-10-19 14:41:29
一个嘴歪脸僵,一个张牙舞爪,《四喜》这俩戏混子看得人真难受!

一个嘴歪脸僵,一个张牙舞爪,《四喜》这俩戏混子看得人真难受!

夜深爱杂谈
2025-11-08 22:46:05
莱巴金娜拒绝合影!携11连胜问鼎总决赛冠军,萨巴伦卡泪洒现场

莱巴金娜拒绝合影!携11连胜问鼎总决赛冠军,萨巴伦卡泪洒现场

排球黄金眼
2025-11-09 05:30:53
打奉陪到底,联合国爆发激战,中方开始算总账,第一个收拾美国

打奉陪到底,联合国爆发激战,中方开始算总账,第一个收拾美国

青途历史
2025-11-08 18:07:52
编剧秦雯卷入王家卫录音风波,丈夫王光利身份曝光,大16岁老公是谁?

编剧秦雯卷入王家卫录音风波,丈夫王光利身份曝光,大16岁老公是谁?

喜欢历史的阿繁
2025-11-09 03:10:46
德约官宣退出年终总决赛:连续两年因伤缺席 刚夺生涯第101冠

德约官宣退出年终总决赛:连续两年因伤缺席 刚夺生涯第101冠

醉卧浮生
2025-11-09 09:27:21
雷军直言“第一次造车没学会偷工减料”,遭网友狂怼

雷军直言“第一次造车没学会偷工减料”,遭网友狂怼

热点菌本君
2025-11-07 14:05:29
一个血亏,一个赚翻:北京环球影城比上海迪士尼输在哪?

一个血亏,一个赚翻:北京环球影城比上海迪士尼输在哪?

城市研究室
2025-11-06 16:27:43
2025-11-09 10:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314195文章数 606722关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

牛弹琴:欧洲议会故意挑衅中国触犯红线 中国很愤怒

头条要闻

牛弹琴:欧洲议会故意挑衅中国触犯红线 中国很愤怒

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

艺术
房产
数码
时尚
健康

艺术要闻

Elisabeth Marsch:美国当代画家

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

数码要闻

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

五十多岁的女性秋季别瞎打扮,这3个技巧实用还时髦,快收藏

超声探头会加重受伤情况吗?

无障碍浏览 进入关怀版