网易首页 > 网易号 > 正文 申请入驻

文本总结等方面超过 GPT-4,苹果披露 AFM AI 模型细节

0
分享至

IT之家 7 月 31 日消息,苹果公司最新发布论文 [PDF],分享了关于 Apple Intelligence 模型的相关细节,部分性能已经超过 OpenAI 的 GPT-4。

模型简介

苹果在论文中介绍了 Apple Foundation Model(下文简称 AFM)模型,共有以下两款:

  • AFM-on-device:本地运行,30 亿参数,可以在 iPhone、iPad 等设备上高效运行;

  • AFM-server:苹果尚未公布参数等细节。

训练数据来源

苹果表示训练数据集包括从出版商处获得授权的数据、经过策划的公开或开源数据集以及我们的网络爬虫 Applebot 抓取的公开信息组成。

苹果强调注重保护用户隐私,数据混合物中不包括苹果用户的私人数据。

据《纽约时报》报道,苹果公司在 2023 年底与 NBC、Condé Nast 和 IAC 等多家出版商达成了价值至少 5000 万美元的多年期协议,在出版商的新闻档案中训练模型。

苹果的 AFM 模型还在 GitHub 上托管的开源代码上进行了训练,特别是 Swift、Python、C、Objective-C、C++、JavaScript、Java 和 Go 代码。

论文称,为了提高 AFM 模型的数学技能,苹果公司特别在训练集中加入了来自网页、数学论坛、博客、教程和研讨会的数学问题和答案。

苹果利用了高质量、可公开获得的数据集(论文中未提及名称),这些数据集“拥有允许用于训练...... 模型的许可证”,并经过过滤以去除敏感信息。

AFM 模型的训练数据集约有 6.3 万亿个 token(token 是小块数据,通常更容易被生成式人工智能模型吸收)。相比之下,这还不到 Meta 用来训练其旗舰文本生成模型 Llama 3.1 405B 的 token 数量(15 万亿)的一半。

训练硬件

根据论文描述,苹果公司使用 8192 片 TPUv4 芯片训练 AFM-server 模型;2048 片 TPUv5p 芯片训练 AFM-on-device 模型。

每个 v5p pod 由 8960 个芯片组成,每秒的浮点运算(FLOPS)和内存分别是 TPU v4 的两倍和三倍,训练模型的速度快了近三倍。

模型性能

根据论文描述,苹果自研大模型在指令遵循、文本总结方面测试超 GPT-4。

苹果公司的数据显示,AFM-server 有害输出违规率为 6.3%,明显低于 GPT-4 的 28.8%。同样,在设备上,AFM 7.5% 的违规率低于 Llama-3-8B(由 Facebook 母公司 Meta 训练)21.8% 的得分。

在电子邮件、信息和通知汇总方面,设备上的 AFM 的满意度分别为 71.3%、63% 和 74.9%。研究论文还指出,这三个模型分别领先于 Llama、Gemma 和 Phi-3 模型。IT之家附上相关性能结果如下:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
昆明海埂大坝“游客比海鸥还多”,管理方:建议乘坐公共交通前往

昆明海埂大坝“游客比海鸥还多”,管理方:建议乘坐公共交通前往

上游新闻
2026-02-21 13:43:15
你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

夜深爱杂谈
2026-02-01 18:57:04
历史上真实的马尔泰若曦:死在冷宫七年才被发现,乾隆得知后大怒

历史上真实的马尔泰若曦:死在冷宫七年才被发现,乾隆得知后大怒

千秋文化
2026-01-21 20:59:51
“女员工入职即怀孕,老板连夜注销公司”,大伙儿说,还有王法吗

“女员工入职即怀孕,老板连夜注销公司”,大伙儿说,还有王法吗

蓝里
2022-11-22 21:40:15
军令如山!3月1日起全军实行终身负责制,从严治军强根基

军令如山!3月1日起全军实行终身负责制,从严治军强根基

我心纵横天地间
2026-02-19 23:15:18
装都不装了?消费完丈夫的傅首尔再曝猛料,“狼子野心”藏不住了

装都不装了?消费完丈夫的傅首尔再曝猛料,“狼子野心”藏不住了

一娱三分地
2026-02-20 23:31:22
成龙父子飞米兰过年,房祖名气质沉稳变成熟,太像年轻时候的龙叔

成龙父子飞米兰过年,房祖名气质沉稳变成熟,太像年轻时候的龙叔

疯说时尚
2026-02-22 11:32:55
披国旗庆祝!22岁谷爱凌震撼发言:每天都很苦 要让世界尊重中国

披国旗庆祝!22岁谷爱凌震撼发言:每天都很苦 要让世界尊重中国

风过乡
2026-02-23 08:10:54
美国十大领域全球领跑,差距还在拉大,正视实力才是真清醒!

美国十大领域全球领跑,差距还在拉大,正视实力才是真清醒!

保德全
2026-02-03 19:30:03
白纱:一种向未来的自我托付

白纱:一种向未来的自我托付

疾跑的小蜗牛
2026-02-22 21:29:48
6年了,郭麒麟的反击几乎断送了朱亚文的演艺生涯

6年了,郭麒麟的反击几乎断送了朱亚文的演艺生涯

小熊侃史
2025-12-25 11:24:12
穆帅说的没错!皇马输球,维尼修斯再惹事,皇马球星要锤得锤

穆帅说的没错!皇马输球,维尼修斯再惹事,皇马球星要锤得锤

福酱的小时光
2026-02-22 19:02:25
老美终于怕了,比稀土更厉害的王牌,拿捏了美高科技的咽喉!

老美终于怕了,比稀土更厉害的王牌,拿捏了美高科技的咽喉!

疯狂小菠萝
2026-02-22 21:24:11
真就无解,约基奇生涯第9次30+20+10,近50年其他球员总计6次

真就无解,约基奇生涯第9次30+20+10,近50年其他球员总计6次

懂球帝
2026-02-23 08:09:17
张萌,年龄越大越勇敢

张萌,年龄越大越勇敢

喜欢历史的阿繁
2026-02-23 12:46:22
“都怪你,男生没法学习了”,女生发型一周不重样,长相已经赢了

“都怪你,男生没法学习了”,女生发型一周不重样,长相已经赢了

泽泽先生
2026-02-10 21:35:49
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
黄子韬回徐艺洋老家穿大花棉睡衣!网友:四川女婿都要穿“省服”

黄子韬回徐艺洋老家穿大花棉睡衣!网友:四川女婿都要穿“省服”

可乐谈情感
2026-02-23 06:30:05
CCTV5直播中日男篮世预赛,徐杰被曝缺席,谁能顶替王俊杰的位置

CCTV5直播中日男篮世预赛,徐杰被曝缺席,谁能顶替王俊杰的位置

体育大学僧
2026-02-22 10:09:56
红军最高指挥官在苏联失踪,毛主席苦寻20年无果,1991年真相揭秘

红军最高指挥官在苏联失踪,毛主席苦寻20年无果,1991年真相揭秘

近史谈
2026-02-16 13:26:12
2026-02-23 13:19:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
330549文章数 607012关注度
往期回顾 全部

科技要闻

腾讯字节,“火拼”漫剧

头条要闻

中美战机在黄海上空对峙 韩国不满向美国提出抗议

头条要闻

中美战机在黄海上空对峙 韩国不满向美国提出抗议

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

谷爱凌奶奶去世,谷爱凌泪奔

财经要闻

结婚五金迈入10万大关 年轻人结婚更难了

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

本地
教育
艺术
公开课
军事航空

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

教育要闻

大动作:英国留学剧本大变!

艺术要闻

十大名家画春,送给春天的你!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军重兵集结蓄力作战之际 新一轮美伊谈判时间“敲定”

无障碍浏览 进入关怀版