网易首页 > 网易号 > 正文 申请入驻

苹果披露其AI模型训练策略:从大规模网络抓取到秘密授权交易和合成内容

0
分享至

WWDC 大会主要围绕其操作系统即将推出的全新视觉设计语言 Liquid 设计展开,同时苹果也宣布了下一代 AI 基础模型,这些模型将同时支持设备端和云端。大会结束后,这家科技巨头似乎准备通过一份详尽的技术报告,让用户和科技界深入了解其模型的训练和优化过程,从而更好地理解苹果的 AI 战略。苹果在报告中强调,其在训练模型时,真正注重隐私和效率。

尽管在当下的人工智能领域并不算举足轻重,苹果公司还是发布了一份关于其基础模型的详细报告,名为《Apple Intelligence基础语言模型——2025年技术报告》,该报告深入介绍了最新人工智能模型的关键要素。这份报告几乎涵盖了所有内容,从模型架构到训练阶段、训练后阶段,以及如何对模型进行微调。报告还探讨了用于确保模型技术改进的方法,以提高模型效率,同时避免隐私泄露。

虽然苹果此前曾分享过可供开发者使用的设备端 AI 模型,以及其拥有的 30 亿个参数,但其局限性在于其结构迄今为止较为稀疏。据报道,该模型被分成多个部分以提高效率。第一部分称为 Block 1,包含超过 60% 的核心构建块(称为转换层)。之后,AI 会理解语言的主要表达方式,并生成响应。

第二部分称为 Block 2,由于移除了两个占用大量内存的技术部件:键和值投影,因此更轻量。得益于这一策略,苹果能够将模型的内存占用减少约 38%,甚至加快模型的响应时间。该公司一直在研究如何在本地提升其 AI 模型的性能,几年前,他们曾探索过运行一个比设备内存容量更大的模型的想法。虽然最终没有采用既定方案,但他们一直在寻找应对硬件限制和其他挑战的方法。

关于AI模型的服务器端,苹果确保其私有云计算系统采用定制架构。这种方法被称为并行轨道混合专家(PT-MoE),这是一种巧妙的策略,简而言之,它将大型AI模型分解成更小的部分,称为专家。现在,通过将模型划分为专家混合模型,模型无需每次都完全运行;相反,它可以只关注与当前任务相关的专家。只有模型中具有该领域专业知识的部分才会被激活,从而节省性能并提高效率。

此外,苹果还设计了一种名为“并行轨道 Transformer”的全新 Transformer 架构,该架构拥有多个独立运行的轨道,仅在关键点协同工作。正因如此,该模型不会出现系统范围的延迟。这家科技巨头还解决了 Apple Intelligence 的一个最大痛点:对语言的支持有限。

凭借新模型,苹果显著提升了多语言能力。为了扩展语言支持,苹果将训练过程中非英语数据的比例从 8% 提升至 30%,涵盖真实内容和 AI 生成的内容,从而提升模型的理解能力,并支持更广泛的语言。这将使写作工具等功能更好地发挥作用。在训练新的 AI 系统时,苹果大量依赖其自主研发的网络爬虫 Applebot 收集的网络数据,这些数据也已在之前的模型中使用。有趣的是,由于苹果尊重隐私,如果网站不想被爬取,就不会使用其内容。

该公司使用多种技术来训练其模型;主要使用公共网络数据作为训练材料。苹果倾向于过滤不相关的内容,并专注于有用且切题的数据集。同样,这家科技巨头也依赖出版商的授权内容,尽管它确实透露了其所依赖的媒体公司的名称。该公司还使用较小的模型来收集合成数据,尤其是在涉及图像语言任务、代码或指令执行时,以便更好地进行微调。

这种多方法也涉及视觉数据,因为这家巨头拥有超过 100 亿个图像-字幕对,包括屏幕截图和手写笔记。它还使用自己的模型来生成更丰富的字幕。所有这些训练方法都有助于 Apple 构建更智能、更强大的模型。Apple 训练其 AI 模型的方法非常清晰。这是一种平衡的策略,既能确保系统保持强大和多功能性,又不会损害其核心价值:隐私。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马云的老底被曝光,网络炸锅,引起热议,时代变了吗…

马云的老底被曝光,网络炸锅,引起热议,时代变了吗…

慧翔百科
2026-04-22 08:56:22
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
张雪机车被围堵了,同行不修它的车,直播修车成唯一出路,这事儿真不是演的

张雪机车被围堵了,同行不修它的车,直播修车成唯一出路,这事儿真不是演的

陈意小可爱
2026-04-24 00:03:15
2027款宝马X5外观引争议?双肾变“猪鼻子”,车主:不适应

2027款宝马X5外观引争议?双肾变“猪鼻子”,车主:不适应

汽车网评
2026-04-23 22:56:32
张雪遗憾落败仅4天,人民日报发文,没有夸赞,却让张雪口碑暴涨

张雪遗憾落败仅4天,人民日报发文,没有夸赞,却让张雪口碑暴涨

老吴教育课堂
2026-04-23 18:58:07
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
特朗普的中东骗局被戳穿,炸伊朗、逼谈判是演戏,真正目标藏不住

特朗普的中东骗局被戳穿,炸伊朗、逼谈判是演戏,真正目标藏不住

西楼知趣杂谈
2026-04-22 11:42:50
演员文章开饭店,爆火不到3天便遇“滑铁卢”,糟心事一件接一件

演员文章开饭店,爆火不到3天便遇“滑铁卢”,糟心事一件接一件

复转这些年
2026-04-23 22:17:29
中央定调!4月起公务员退休彻底取消弹性延迟,体制内真绷不住了

中央定调!4月起公务员退休彻底取消弹性延迟,体制内真绷不住了

爱下厨的阿椅
2026-04-22 17:30:09
39万亿美债还不起,特朗普决定“干掉”大债主,为此不惜自曝家丑

39万亿美债还不起,特朗普决定“干掉”大债主,为此不惜自曝家丑

古史青云啊
2026-04-23 10:04:31
放弃世乒赛后 樊振东首次发文:人性尺度不同 勇于发问的人太稀缺

放弃世乒赛后 樊振东首次发文:人性尺度不同 勇于发问的人太稀缺

念洲
2026-04-23 06:04:23
华谊兄弟被申请破产

华谊兄弟被申请破产

雷达财经
2026-04-23 15:51:26
北京“最火驻京办”关门半个月重开业,菜有调整吗?饭点排队超1小时…

北京“最火驻京办”关门半个月重开业,菜有调整吗?饭点排队超1小时…

北京商报
2026-04-22 22:48:43
台湾专家赖岳谦:印度确实有一点比中国强很多,那就是——嘴。

台湾专家赖岳谦:印度确实有一点比中国强很多,那就是——嘴。

荆楚寰宇文枢
2026-04-22 23:16:37
格力回应铝线电机争议:相关工程机已停产,海信称靠多三两铜多500元时代已终结

格力回应铝线电机争议:相关工程机已停产,海信称靠多三两铜多500元时代已终结

红星资本局
2026-04-21 20:40:16
太意外了!2032奥运举办地敲定:结果惊呆众人,奥运格局大变!

太意外了!2032奥运举办地敲定:结果惊呆众人,奥运格局大变!

小涛叨叨
2026-04-22 17:06:20
我美吗:这个问题,我终于不再问了

我美吗:这个问题,我终于不再问了

疾跑的小蜗牛
2026-04-23 20:18:49
新款大众ID. Buzz官图发布!网友:价格25万起,肯定排队

新款大众ID. Buzz官图发布!网友:价格25万起,肯定排队

汽车网评
2026-04-23 23:00:31
火箭还能逆转?一人或成逆转钥匙 乌度卡能否及时调整?

火箭还能逆转?一人或成逆转钥匙 乌度卡能否及时调整?

惊奇侃球
2026-04-24 03:15:09
2026-04-24 04:04:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
67558文章数 70170关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

旅游
数码
时尚
房产
公开课

旅游要闻

来广州,分享10亿元“中国旅游日”专属优惠福利

数码要闻

荣耀重新定义轻薄本,四月连发六款新品续航首超Mac

李昀锐:林深见木

房产要闻

三亚安居房,突然官宣!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版