网易首页 > 网易号 > 正文 申请入驻

iPhone AI提速5倍,苹果黑科技来了

0
分享至

IT之家 8 月 9 日消息,科技媒体 9to5Mac 昨日(8 月 8 日)发布博文,报道称苹果在最新研究中,提出了“多 token 预测”(MTP)技术,不牺牲输出质量的情况下,可将大语言模型响应速度提升 2~3 倍,特定场景下最高可达 5 倍。

IT之家援引博文介绍,传统大语言模型(LLM)采用自回归方式生成文本,逐个输出 token,为保证连贯性,每一步都依赖前序内容。

例如生成“The cat is black”时,模型需在输出“is”后,基于上下文和训练经验,从词汇表中计算“black”等候选词的概率,再选择最合适的词。这种串行机制虽准确,但速度受限,尤其在移动设备上影响用户体验。

苹果在新论文《Your LLM Knows the Future: Uncovering Its Multi-Token Prediction Potential》中发现,尽管模型仅被训练为预测下一个词,其内部其实蕴含对后续多个词的潜在判断能力。

研究团队据此提出“多 token 预测”(MTP)框架,支持模型一次生成多个词。例如输入“The cat is ”,模型可直接输出“very fluffy”,大幅提升生成效率。

该技术核心在于引入“掩码”(Mask)token 作为占位符,并让模型并行推测后续多个词。每个推测结果会立即与标准自回归解码结果比对,若不符则自动回退到逐词生成模式,确保输出质量不受影响。这一“推测-验证”机制在提速的同时,保留了传统方法的准确性,实现速度与质量的平衡。

实验基于开源模型 Tulu3-8B 进行,苹果训练其最多推测 8 个后续 token。结果显示,在问答和对话等通用任务中,响应速度平均提升 2–3 倍;在代码生成、数学推理等结构化场景中,提速可达 5 倍。

研究人员强调,性能提升未以牺牲生成质量为代价,关键在于采用了“门控 LoRA 适配”技术,动态调节参数,仅在需要时激活推测模块。

这项研究为设备端大模型部署提供了新路径。相比依赖云端计算,MTP 可在 iPhone、Mac 等本地设备实现更快响应,降低延迟与能耗。

虽然目前仍处于研究阶段,但其兼容现有模型架构的特点,使其具备较强落地潜力,未来或可集成至 Siri、Apple Intelligence 等产品中,提升用户交互体验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
绿色是生命的颜色:它不是背景,是主角

绿色是生命的颜色:它不是背景,是主角

疾跑的小蜗牛
2026-04-23 21:36:36
徐帆回应离婚5个月,冯小刚近况曝光,他的“小心思”再藏不住了

徐帆回应离婚5个月,冯小刚近况曝光,他的“小心思”再藏不住了

天天热点见闻
2026-04-19 08:13:15
手握20多个冠军,嫁外国名将带夫定居广州,如今是中山大学副教授

手握20多个冠军,嫁外国名将带夫定居广州,如今是中山大学副教授

以茶带书
2026-04-16 14:50:51
迪丽热巴上学时无人追求,看到她早期照片,网友:这谁敢追啊

迪丽热巴上学时无人追求,看到她早期照片,网友:这谁敢追啊

乔话
2026-04-22 20:36:30
坏消息,掘金队阿隆·戈登因小腿受伤缺席打森林狼的第三场比赛

坏消息,掘金队阿隆·戈登因小腿受伤缺席打森林狼的第三场比赛

好火子
2026-04-24 07:07:03
四十年来最大的谜:包产到户后农民马上就吃上了饱饭,是真的吗?

四十年来最大的谜:包产到户后农民马上就吃上了饱饭,是真的吗?

兴趣知识
2026-04-22 03:35:27
关系修复:从"地毯式掩盖"到主动对话

关系修复:从"地毯式掩盖"到主动对话

晚风也遗憾
2026-04-23 07:36:03
令人遗憾!怀特塞德正式退出,原因曝光,卢伟表明态度,上海谨慎

令人遗憾!怀特塞德正式退出,原因曝光,卢伟表明态度,上海谨慎

萌兰聊个球
2026-04-23 08:52:23
死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

黑翼天使
2026-04-23 19:51:23
如今定居广东的朱芳雨,大儿走篮球路,二儿优秀低调,三儿最潇洒

如今定居广东的朱芳雨,大儿走篮球路,二儿优秀低调,三儿最潇洒

翰飞观事
2026-04-22 14:42:17
特朗普的嘴,开了挂了

特朗普的嘴,开了挂了

牛弹琴
2026-04-24 07:38:45
央国企的几大乱象:关系户横行、巨大的虚假繁荣......

央国企的几大乱象:关系户横行、巨大的虚假繁荣......

灯锦年
2026-04-22 17:16:25
吴法宪出狱后,安置在济南,同时告诉他有四个安排

吴法宪出狱后,安置在济南,同时告诉他有四个安排

历史甄有趣
2026-04-24 07:25:10
印尼的豪赌大溃败,给全世界提了个醒:中国行我也行,纯粹是幻觉

印尼的豪赌大溃败,给全世界提了个醒:中国行我也行,纯粹是幻觉

壹知眠羊
2026-04-24 07:21:00
我有罪,大导演昆汀花1万美金,在包房舔脚半小时,直到皮肤起皱

我有罪,大导演昆汀花1万美金,在包房舔脚半小时,直到皮肤起皱

西楼知趣杂谈
2026-04-20 08:40:47
“秀才”相当于如今什么学历?说出来可别不信,别被电视剧误导了

“秀才”相当于如今什么学历?说出来可别不信,别被电视剧误导了

莹莹的历史说
2026-04-23 00:44:55
不到1日,中国邻国犯下两大恶行,王毅直奔东盟内部,将待足五天

不到1日,中国邻国犯下两大恶行,王毅直奔东盟内部,将待足五天

影孖看世界
2026-04-22 23:53:06
场外收入颇丰,太阳报:帕尔默的个人公司总资产突破730万镑

场外收入颇丰,太阳报:帕尔默的个人公司总资产突破730万镑

懂球帝
2026-04-24 00:13:04
日本“最上”级护卫舰出口澳大利亚:一笔改变亚太格局的百亿大单

日本“最上”级护卫舰出口澳大利亚:一笔改变亚太格局的百亿大单

武器鉴赏
2026-04-22 09:02:13
脑震荡保护协议期!文班已参加轻度投篮训练 G3状态升级出战存疑

脑震荡保护协议期!文班已参加轻度投篮训练 G3状态升级出战存疑

醉卧浮生
2026-04-24 00:52:42
2026-04-24 09:39:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
340848文章数 607161关注度
往期回顾 全部

科技要闻

凌晨突发!GPT-5.5正式上线:跑分更猛

头条要闻

用了16年的学位证"失效"男子举报自己 高校最新通报

头条要闻

用了16年的学位证"失效"男子举报自己 高校最新通报

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

手机
亲子
房产
数码
教育

手机要闻

2026年最后一款不加价的旗舰!OPPO Find X9s Pro首销:5299元起

亲子要闻

语出惊人的萌娃

房产要闻

三亚安居房,突然官宣!

数码要闻

重磅回归!当贝超级盒子正式开启预约 4月27日全网开售

教育要闻

相似无刻度直尺作图,一个视频学会!

无障碍浏览 进入关怀版