网易首页 > 网易号 > 正文 申请入驻

大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算

0
分享至

新智元报道

编辑:LRST

【新智元导读】LLM用得越久,速度越快!Emory大学提出SpeedupLLM框架,利用动态计算资源分配和记忆机制,使LLM在处理相似任务时推理成本降低56%,准确率提升,为AI模型发展提供新思路。

在人类的认知世界里,熟练意味着更快、更高效。

比如看似复杂的魔方,只需训练几十次后便能「盲拧」;而面对一道做过几遍的数学题,我们往往能在脑海中迅速复现思路,几秒内作答。

那,大语言模型也能这样吗?

Emory大学的研究者Bo Pan和Liang Zhao最近发布了一篇令人振奋的成果:大语言模型的性能,也和熟练度有关,确实能「越用越快」!

论文地址:https://arxiv.org/abs/2505.20643

论文首次系统性地验证了LLM在「有经验」的条件下,不仅性能不降,反而能大幅减少推理时间和计算资源,揭示了「AI也能熟能生巧」的全新范式。

如何让LLM变熟练?

为系统验证「熟练加速效应」,作者提出一个统一框架,构造并量化三类记忆机制下的「使用经验」。

该框架由两部分组成,一是推理时动态计算资源分配,二是记忆机制。

对于动态计算资源分配,该文章系统性将多种已有test-time scaling方法扩展成动态计算资源分配,从而允许LLM在熟练的问题上分配更少的计算资源。

对于记忆机制,该框架引入记忆机制,从而实现通过过往经验加速当前推理。

在多轮使用中,大模型是否能像人类一样「从经验中变快」?是否存在一种方法,能系统性地提升效率,而非单纯堆算力?

研究亮点1:用经验节省算力

在任务重复或相似的推理过程中,研究者发现LLM通过利用以往经验(包括 memory cache、in-context memory 等),可以实现减少高达56%的推理预算,保持甚至提升准确率。

这意味着模型在处理「熟悉」的任务时能少走很多弯路,不仅答得准,还答得快。

研究亮点2:系统性大规模实验

为了验证普适性,研究者考察了:

  1. 多种test-time scaling方法,包括Self-Refine、Best-of-N、Tree-of-Thoughts和当前最新的Long Chain-of-Thought(o1式思考)

  2. 多种记忆,包括监督学习(Supervised Fine-tuning)、检索过去经历、三种自我反思(Reflection)

  3. 多种问题相似度,包括LLM在1)完全相同、2)意思一样仅表述不同、3)题目一样,仅换数字、4)不同题目但需要相同知识回答。

不同机制均表现出显著的推理加速,展示了这一现象的广泛性。

实验结果

在「重复问答」、「分步推理」等任务中,越是「重复」,模型推理越快,效果越好。而且,这种趋势随着经验积累更加明显。

实验结果带来了以下八大关键发现

发现一:LLM真的可以「越用越快」!

实验结果表明,在配备适当记忆机制和计算预算调控策略的前提下,LLM在处理重复或相似任务时,平均可节省高达56%的推理开销,且这一行为在80组实验设置中有64组都出现了显著的加速现象,覆盖率高达80%,验证了「经验式加速」具有普适性。

发现二:越快≠越差,反而更准!

令人惊喜的是,推理成本的下降不仅没有牺牲准确率,反而普遍带来了准确率的提升。实验测得推理成本与准确率提升之间的Pearson相关系数为 -0.41(p=0.0002),这表明「更快」也意味着「更稳」「更准」。

发现三:相似度越高,提速越明显

研究设计了4个相似度等级,从完全重复(S1)到结构变化大(S4)。结果发现,S1和S2类问题下的加速最显著(分别节省16.0%和15.4%计算),而S4问题由于结构不同、记忆不具备直接迁移性,加速效果最弱。

发现四:问题相似度低时,记忆机制可能反噬

当问题间差异过大时,记忆机制可能误导模型走错方向,导致推理成本反升、准确率反降。这种现象在部分S4设置中显著,提示我们记忆并非越多越好,而应「选得准、用得巧」。

发现五:情节记忆 > 反思记忆,更能加速推理

在不同记忆机制对比中,情节式记忆(如SFT和In-Context)在推理加速上表现更佳。例如In-Context平均节省27.4%计算,而反思类记忆仅为3.6%~8.8%。这与心理学研究一致:人类在形成熟练技能时,最初依赖的是具体实例的情节记忆。

发现六:In-Context比SFT更高效

在低样本(1~3轮)场景下,In-Context学习相比SFT更具泛化能力、更少过拟合,尤其在本研究的推理速度上,In-Context 更快、更稳、更准,展现了非参数记忆的强大即时适应力。

发现七:文本记忆易「触顶」,参数记忆可持续提速

反思类与In-Context等文本记忆方法存在上下文窗口的「瓶颈」,在加入3个案例后效果逐渐饱和;相比之下,SFT通过权重更新记忆内容,不受窗口限制,推理速度随经验持续提升。

发现八:越「泛化」的反思,提速越明显

三种反思机制中,Reflect-Update表现最佳。原因在于它能持续总结抽象规则,而不是堆积具体数字或案例。这种「泛化性强」的反思更容易跨任务迁移、辅助加速,未来设计更好反思机制时值得关注。

让LLM拥有「记忆力」和「熟练度」

这项研究提出了一种值得重视的新范式:

推理效率不只是堆硬件,也能靠「学习历史」提升。

在客服、搜索、问诊等反复场景中,部署「记忆型LLM」将带来:更低的响应延迟、更少的算力消耗、更强的适应性和个性化。

这项研究不仅补足了现有推理加速研究的空白,更为构建「具备人类熟练性」的AI模型提供了新思路。

参考资料:

https://arxiv.org/abs/2505.20643

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东一男子加满640元汽油后,拒不付款强行逃离现场,同行人对监控嚣张“比耶”,警方:已将嫌疑人抓获

广东一男子加满640元汽油后,拒不付款强行逃离现场,同行人对监控嚣张“比耶”,警方:已将嫌疑人抓获

大象新闻
2026-05-10 13:46:09
NBT:刷新认知!科学家首次发现,肝脏是mRNA疫苗的“灭火器”,肌肉是mRNA疫苗的“放大器”,mRNA疫苗免疫机制迎来重要修正丨科学大发现

NBT:刷新认知!科学家首次发现,肝脏是mRNA疫苗的“灭火器”,肌肉是mRNA疫苗的“放大器”,mRNA疫苗免疫机制迎来重要修正丨科学大发现

奇点网
2026-05-10 18:03:19
太尴尬了!陈行甲与俞敏洪南宁同台名场面,网友直言不抢上司风头

太尴尬了!陈行甲与俞敏洪南宁同台名场面,网友直言不抢上司风头

花小猫的美食日常
2026-05-11 01:52:30
美国对台策略不变!特朗普访华很可能被鲁比奥这一句话搅黄

美国对台策略不变!特朗普访华很可能被鲁比奥这一句话搅黄

潋滟晴方DAY
2026-05-10 13:34:25
古人常说的春药到底是什么?真有这么厉害吗?根本不是你想的那样

古人常说的春药到底是什么?真有这么厉害吗?根本不是你想的那样

长风文史
2026-05-10 19:41:09
留也不是,扔也不是,中国引进的24架俄制苏-35战斗机现状

留也不是,扔也不是,中国引进的24架俄制苏-35战斗机现状

蜉蝣说
2026-05-09 11:36:32
美国又在巴拿马耍花招!中方双管齐下反击,特朗普的算盘要落空?

美国又在巴拿马耍花招!中方双管齐下反击,特朗普的算盘要落空?

被误解的时候能微微一笑
2026-05-11 04:53:56
18岁10个月,亚马尔成西甲历史最年轻三夺联赛冠军球员

18岁10个月,亚马尔成西甲历史最年轻三夺联赛冠军球员

懂球帝
2026-05-11 05:17:16
国家力挺!张雪机车获200亩用地+2.4亿授信,研发占比9.33%!

国家力挺!张雪机车获200亩用地+2.4亿授信,研发占比9.33%!

世界圈
2026-05-10 08:51:12
存储芯片核心概念名单

存储芯片核心概念名单

风风顺
2026-05-10 01:00:05
体育总局一纸公示揭晓陈若琳最新身份!这场闹剧该收场了

体育总局一纸公示揭晓陈若琳最新身份!这场闹剧该收场了

动物奇奇怪怪
2026-05-11 01:56:48
新规落地,反腐力度之大超过历史任何时期

新规落地,反腐力度之大超过历史任何时期

深蓝夜读
2026-05-10 19:41:23
张志坤:关于解放台湾实现国家统一的若干意见(近2万字长文)

张志坤:关于解放台湾实现国家统一的若干意见(近2万字长文)

秦安战略
2026-05-09 11:58:24
欠他们一句道歉!5位被毁掉的外援:瞎眼、欠薪、断腿,巅峰全废

欠他们一句道歉!5位被毁掉的外援:瞎眼、欠薪、断腿,巅峰全废

圣西罗的太阳
2026-04-19 10:08:28
敢拦就开战?美国给“台独”递刀,中方:公海销毁没商量

敢拦就开战?美国给“台独”递刀,中方:公海销毁没商量

华山穹剑
2026-01-19 21:32:59
山楂配一物?喝掉全身淤堵!这搭配太绝了,全身都顺了

山楂配一物?喝掉全身淤堵!这搭配太绝了,全身都顺了

刘哥谈体育
2026-05-09 15:21:53
楼市预期急转,房东开始着急了

楼市预期急转,房东开始着急了

重远投资观
2026-05-10 17:32:30
伊朗导弹猛砸美军基地,冲突已失控,美国对中国提了一个大胆要求

伊朗导弹猛砸美军基地,冲突已失控,美国对中国提了一个大胆要求

标体
2026-05-10 08:13:42
天价皮皮虾事件盖棺定论!43岁店主猝然病逝,为三亚文旅局点赞!

天价皮皮虾事件盖棺定论!43岁店主猝然病逝,为三亚文旅局点赞!

壹月情感
2026-05-10 20:56:11
温情时刻,夺冠后巴萨官推缅怀已故10年的诺坎普球场播报员

温情时刻,夺冠后巴萨官推缅怀已故10年的诺坎普球场播报员

懂球帝
2026-05-11 05:48:08
2026-05-11 06:11:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15178文章数 66858关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

王楚钦助男乒12连冠+生日捧杯:球迷陪伴是最好礼物

头条要闻

王楚钦助男乒12连冠+生日捧杯:球迷陪伴是最好礼物

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

教育
数码
时尚
旅游
艺术

教育要闻

男孩为了拼中考体育满分,每天坚持猛跑1小时,却把骨头跑断了

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

旅游要闻

北京“二绿地区”郊野公园焕新升级

艺术要闻

全国最值得去的八大最美古镇

无障碍浏览 进入关怀版