网易首页 > 网易号 > 正文 申请入驻

浙大让AI大脑学会"删繁就简":推理能力不减,内存消耗暴降70%

0
分享至


这项由浙江大学联合蚂蚁集团发表于2024年的研究论文(arXiv:2604.03679v1),为解决大型语言模型在复杂推理时的效率瓶颈提供了突破性方案。有兴趣深入了解的读者可以通过论文编号arXiv:2604.03679v1查询完整论文。

回到十年前,当我们使用手机时,经常会遇到这样的情况:打开几个应用程序后,手机就开始卡顿,因为内存不够用了。类似地,当今最先进的AI语言模型在进行复杂推考时也面临着同样的困扰。当AI需要解决一个复杂的数学问题或进行多步推理时,它会产生大量的"思考痕迹",就像我们在纸上演算时会写下很多中间步骤一样。然而,这些思考痕迹会迅速占满AI的"内存空间",导致推理速度变慢,成本急剧上升。

浙江大学的研究团队发现了一个有趣的现象:人类在解决复杂问题时,并不会把每一个中间步骤都牢牢记在脑子里。相反,我们会把重要的结论提炼出来,暂时"忘掉"具体的计算过程,只在需要时再回忆起相关细节。基于这个观察,研究团队开发了一套名为LightThinker的智能压缩系统,教会AI如何像人类一样进行"有选择性的记忆"。

这项研究的核心创新在于,它不是简单地删除AI的思考内容,而是教会AI如何"提炼要点"。就像一个熟练的记者能把长篇采访压缩成新闻摘要,同时保留所有关键信息一样,LightThinker能够将AI冗长的推理过程压缩成精炼的"思考精华",在大幅减少内存占用的同时,确保推理质量不受影响。

实验结果令人印象深刻。在保持推理准确性的前提下,LightThinker将AI的内存峰值使用量减少了70%,推理时间缩短了26%。更令人惊喜的是,在一些复杂推理任务中,这种"精简记忆"的方式实际上还提升了AI的表现,准确率平均提高了2.42%。这就像整理房间一样,去除杂乱物品后,不仅空间更大了,找东西也更容易了。

研究团队还开发了LightThinker++,这是一个更加智能的升级版本。如果说LightThinker是教AI学会"做笔记",那么LightThinker++就是教AI学会"管理笔记本"。它不仅能压缩信息,还能在需要时重新展开详细内容,就像我们能够根据关键词回忆起完整的记忆一样。这种"可逆的压缩"特别适合处理那些需要反复查阅前面步骤的复杂推理任务。

在长期复杂任务的测试中,LightThinker++展现了更加显著的优势。当普通AI模型的内存使用量在60轮对话后急剧膨胀到10万个词汇单元时,LightThinker++始终保持在3-4万个词汇单元的稳定水平,即使经过80轮对话仍然游刃有余。同时,它在复杂任务中的成功率平均提升了14.8%,在最困难的任务上甚至实现了2.51倍的性能飞跃。

一、教AI学会"取其精华"的艺术

当我们阅读一本厚厚的教科书时,不会试图记住每一个字,而是会提炼出重要概念和逻辑关系。LightThinker的核心思想正是模仿这种人类的学习方式。研究团队观察到,AI在推理时产生的文本有两个作用:一是确保语言流畅性,二是承载实际的推理逻辑。就像一篇文章中,有些词语是为了让句子读起来顺畅,有些词语则承载着核心信息。

LightThinker的工作原理可以用编辑报纸的过程来类比。当编辑收到一篇冗长的稿件时,他们会保留关键信息,删除冗余描述,最终形成精炼的新闻报道。不同的是,LightThinker不是简单的删除,而是将完整的推理步骤"提炼"成一系列特殊的"概念标记",这些标记虽然看起来简短,但包含了原始推理的所有精髓。

这种压缩过程需要AI学会判断什么是重要的,什么是可以省略的。研究团队设计了一套特殊的训练方法,教AI识别推理过程中的关键节点。当AI完成一个推理步骤时,系统会自动将这个步骤的核心信息提取出来,存储在"压缩标记"中,然后丢弃原始的详细过程。接下来的推理就基于这些压缩标记进行,就像我们在解题时会写"由前面的结论可知..."一样。

为了确保压缩过程不会丢失关键信息,研究团队设计了精巧的注意力机制。这就像给AI配备了一个智能的"信息过滤器",它能够准确识别哪些信息对后续推理是必需的,哪些只是语言表达的装饰。通过大量训练,AI学会了在保持推理逻辑完整性的同时,最大化地减少存储需求。

实验证明,这种方法在多个基准测试中都表现出色。在数学推理任务中,LightThinker将原本需要2000多个词汇单元的推理过程压缩到600多个,压缩率高达70%,而准确率仅下降1%。在逻辑推理任务中,压缩后的AI甚至表现得更好,这说明去除冗余信息实际上帮助AI更好地专注于核心逻辑。

二、从压缩升级到智能记忆管理

如果说LightThinker是教AI学会"做笔记",那么LightThinker++就是教AI学会"管理整个笔记系统"。研究团队发现,单纯的信息压缩在面对特别复杂的推理任务时可能会遇到瓶颈。有些时候,AI需要回到之前的详细步骤中查找特定信息,但压缩后的简化版本可能不够详细。

这就像我们在学习时做的思维导图。刚开始,我们可能只写下关键词和简单连接线,这对一般复习已经足够。但是当需要深入研究某个概念时,我们希望能够"展开"这个节点,看到更多详细信息。LightThinker++正是实现了这种"可展开的记忆系统"。

LightThinker++引入了三种智能操作:提交(commit)、展开(expand)和折叠(fold)。当AI完成一个推理步骤时,它可以选择将这个步骤"提交"到记忆系统中,此时详细过程被压缩成摘要形式。当后续推理需要回顾某个特定步骤时,AI可以"展开"那个步骤,重新获取完整的详细信息。使用完毕后,AI会"折叠"这个步骤,重新回到节省空间的摘要状态。

这种设计的妙处在于,AI能够根据推理的复杂程度动态调整其记忆策略。在处理简单问题时,AI主要依靠压缩后的摘要信息,保持高效运行。在遇到复杂瓶颈时,AI会主动展开相关的历史步骤,获取解决问题所需的详细信息。这就像我们在考试时,大部分时候依靠记忆中的要点答题,但在遇到难题时会仔细回忆相关的详细知识。

为了训练AI掌握这些操作,研究团队开发了一套"协作合成"的训练方法。他们使用强大的教师模型生成高质量的推理轨迹,这些轨迹包含了何时应该使用哪种记忆操作的示例。通过学习这些示例,AI逐渐掌握了在什么情况下应该压缩信息,什么时候需要展开查看详细内容。

实验结果显示,LightThinker++在复杂推理任务中表现尤为出色。在标准推理测试中,它不仅将内存使用峰值降低了69.9%,还实现了2.42%的准确率提升。这个看似矛盾的结果实际上反映了一个重要发现:经过合理压缩和管理的上下文信息,往往比杂乱无章的完整信息更有助于AI的推理表现。

三、在长期对话中展现真正实力

LightThinker++的真正价值在长期、复杂的对话任务中得到了最充分的体现。研究团队设计了一系列需要多轮交互的复杂任务,比如深度网络搜索和信息整合。这些任务需要AI在数十轮对话中保持上下文连贯性,同时不断积累和整合新信息。

在传统方法中,随着对话轮次的增加,AI需要处理的上下文信息呈指数级增长。就像我们的电脑在运行多个程序时会越来越慢一样,普通的AI模型在经过几十轮对话后会因为上下文过载而性能急剧下降。研究发现,普通AI模型在60轮对话后,上下文长度会膨胀到10万个词汇单元,此时系统几乎无法正常工作。

相比之下,LightThinker++展现了出色的"记忆管理"能力。即使经过80轮复杂对话,它的活跃上下文始终保持在3-4万个词汇单元的健康水平,相当于传统方法的60-70%节省。更重要的是,这种记忆管理并没有以牺牲性能为代价,反而带来了显著的性能提升。

在三个不同的复杂任务测试中,LightThinker++的平均成功率提升了14.8%。特别值得注意的是,在最具挑战性的"困难"任务类别中,LightThinker++实现了惊人的2.51倍性能提升。这种提升主要来自于它能够有效过滤噪音信息,让AI专注于真正重要的推理线索。

研究团队通过详细分析发现,LightThinker++的成功秘诀在于它的适应性记忆策略。在处理简单任务时,它主要依靠压缩摘要来保持效率。在遇到复杂任务时,它会更频繁地使用展开和折叠操作,动态调整可见信息的详细程度。这种适应性使得AI能够在保持高效运行的同时,应对各种复杂度的挑战。

从效率角度来看,LightThinker++还显著降低了推理成本。在相同的计算资源下,它能够处理更多轮的对话,或者在相同的对话轮次下提供更准确的结果。这对于实际应用来说意义重大,因为它意味着更低的运营成本和更好的用户体验。

四、技术创新的深层逻辑

LightThinker系列方法的成功并非偶然,而是基于对人类认知过程的深刻理解。研究团队观察到,人类大脑在处理复杂信息时有一个重要特征:工作记忆容量有限,但能够通过分层组织和选择性注意来高效处理复杂任务。

这种认知经济学的原理在LightThinker的设计中得到了体现。传统的AI模型试图在推理过程中保留所有信息,就像一个试图同时记住整本教科书每个细节的学生。而LightThinker则模仿了优秀学者的学习方式:及时总结要点,按需查阅详细内容,始终保持清晰的思维框架。

从技术实现的角度来看,LightThinker使用了一种创新的"分离式"设计。在传统方法中,信息压缩和内容生成是耦合在一起的,这就像一个人一边做笔记一边思考,容易产生混乱。LightThinker将这两个过程分离开来:专门的"压缩标记"负责存储精华信息,专门的"生成标记"负责基于压缩信息进行推理。这种分离使得整个系统更加稳定和可控。

LightThinker++进一步引入了"显式记忆管理"的概念。这不仅仅是技术上的改进,更代表了AI系统设计哲学的转变:从被动的信息处理转向主动的知识管理。AI不再是简单地响应输入,而是能够主动规划自己的记忆使用策略,这使得它在处理复杂任务时更像一个有经验的专家。

研究团队还发现了一个有趣的现象:经过适当压缩的上下文信息往往比原始的冗长信息更有助于推理。这类似于编辑过的文章往往比初稿更清晰易懂。通过去除冗余和噪音,AI能够更好地识别关键模式和逻辑关系,从而提高推理质量。

这种"少即是多"的效果在数学推理中尤其明显。研究发现,当AI处理复杂数学问题时,保留过多的中间计算细节反而可能干扰最终的逻辑判断。而经过合理压缩的关键步骤摘要能够帮助AI保持清晰的解题思路,避免在细枝末节中迷失。

五、实验验证的全方位视角

为了全面验证LightThinker系列方法的有效性,研究团队设计了一套涵盖多个维度的综合实验方案。他们不仅测试了准确性和效率,还深入分析了方法的适用范围、稳定性和可扩展性。

在准确性测试中,研究团队使用了四个经典的推理基准数据集:GSM8K(数学推理)、MMLU(多领域知识)、GPQA(科学推理)和BBH(复杂逻辑)。这些数据集代表了AI推理能力的不同方面,从基础计算到高级抽象思维。实验结果显示,LightThinker在所有测试中都保持了与传统方法相当或更好的准确性。

特别值得注意的是,在一些复杂推理任务中,LightThinker的表现实际上超越了传统方法。研究人员分析认为,这是因为信息压缩帮助AI过滤了干扰信息,使其能够更专注于核心推理逻辑。这就像清理杂乱的书桌能够提高工作效率一样。

在效率测试中,研究团队从多个角度评估了方法的性能提升。除了传统的内存使用和推理时间指标,他们还引入了一个创新的"依赖度"指标,用于衡量AI在生成过程中对历史信息的整体依赖程度。这个指标能够更准确地反映不同方法的压缩效果。

实验发现,LightThinker将平均依赖度降低了78%,这意味着AI在推理过程中需要"回顾"的信息量大幅减少。同时,推理时间缩短了26%,内存峰值使用量降低了70%。这些数字的背后是显著的成本节省和用户体验改善。

研究团队还进行了详细的消融实验,分析了不同组件对整体性能的贡献。他们发现,压缩粒度的选择对效果有重要影响。以"思考步骤"为单位的压缩比以"词汇"为单位的压缩效果更好,这说明保持逻辑完整性比单纯减少词汇数量更重要。

在可扩展性测试中,研究人员模拟了不同长度的推理任务,从简单的几步推理到复杂的数十步推理。结果显示,随着任务复杂度的增加,LightThinker的优势变得更加明显。这印证了该方法特别适合处理长期、复杂的推理任务。

六、从理论突破到实用价值

LightThinker系列方法的意义不仅在于技术上的创新,更在于它为AI应用的实用化开辟了新的可能性。当前许多AI应用因为计算成本过高而难以大规模部署,LightThinker提供的效率提升使得更复杂的AI服务变得经济可行。

在教育领域,这种技术可以让AI导师在长时间的个性化教学过程中保持高效响应。AI导师可以在与学生的多轮对话中不断积累对学生学习状况的理解,同时通过智能压缩避免信息过载。学生可以随时询问之前讨论过的概念,AI能够准确回忆相关内容而不会因为上下文过长而出现混乱。

在客户服务领域,LightThinker++的记忆管理能力可以显著改善用户体验。客服AI可以在长期对话中记住用户的问题历史和偏好,提供更加个性化和连贯的服务。当用户提到"之前讨论的那个问题"时,AI能够准确定位并展开相关信息。

在科研辅助方面,这种技术可以帮助研究人员处理大量的文献和数据。AI可以在分析过程中动态压缩和管理信息,始终保持对研究主线的清晰把握,同时能够在需要时深入特定的细节。这就像给研究人员配备了一个永不疲倦、记忆超群的研究助手。

从更广阔的角度来看,LightThinker代表了AI系统设计思路的重要转变:从追求更大的模型和更多的计算资源,转向更智能的信息管理和更高效的资源利用。这种转变对于AI技术的可持续发展具有重要意义,因为它提供了一条在不显著增加计算成本的前提下提升AI能力的道路。

研究团队指出,随着AI模型规模的不断增长,传统的"堆叠式"扩展方式将面临越来越严重的效率瓶颈。LightThinker提供的"智能压缩"思路为解决这一挑战开辟了新的方向。未来的AI系统可能会更多地采用类似的认知经济学原理,在保持强大功能的同时实现更高的效率。

说到底,这项研究最令人兴奋的地方在于,它让我们看到了一种更加"智能"的智能系统。这些系统不仅能够处理复杂任务,还能够智能地管理自己的认知资源,就像一个经验丰富的专家知道如何在繁重的工作中保持清晰思维一样。这种能力的获得,标志着AI系统向着真正的智能化又迈进了重要一步。

随着技术的进一步发展和完善,我们有理由期待看到更多基于这种"认知经济学"原理的AI创新。这不仅会让AI系统变得更加高效和实用,也会让我们对人类智能本身有更深入的理解。毕竟,最好的AI往往是那些能够从人类智慧中汲取灵感,然后以自己独特的方式实现这些智慧的系统。

Q&A

Q1:LightThinker是如何做到既压缩信息又保持推理准确性的?

A:LightThinker采用了类似"做笔记提要"的方法,它不是简单删除信息,而是将AI的冗长推理过程提炼成包含核心逻辑的"压缩标记"。这些标记虽然短小,但保留了推理的精华内容。就像我们看笔记要点就能回忆起完整知识一样,AI可以基于这些压缩标记继续准确推理。

Q2:LightThinker++的记忆管理功能具体是怎么工作的?

A:LightThinker++引入了三种智能操作:提交、展开和折叠。AI可以将推理步骤"提交"压缩存储,在需要详细信息时"展开"查看完整内容,使用完毕后再"折叠"回节省空间的状态。这就像智能管理笔记本,平时看要点,需要时查详情,用完再收起来。

Q3:这种压缩技术能带来多大的效率提升?

A:实验显示LightThinker将内存峰值使用量减少了70%,推理时间缩短了26%,而且在某些复杂任务中准确率还提升了2.42%。在长期对话中,当普通AI的内存使用量膨胀到10万词汇单元时,LightThinker++始终保持在3-4万的稳定水平。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曼联隐形后腰遭基恩怒骂!曝拉爵愿亏1500万清洗,转会谈判已开启

曼联隐形后腰遭基恩怒骂!曝拉爵愿亏1500万清洗,转会谈判已开启

罗米的曼联博客
2026-04-14 11:43:32
中超对手慌不慌?“球王”武磊开发出了1项新球技

中超对手慌不慌?“球王”武磊开发出了1项新球技

足球大腕
2026-04-14 08:24:51
离岸人民币兑美元涨至6.8157元,创2023年3月23日以来新高

离岸人民币兑美元涨至6.8157元,创2023年3月23日以来新高

每日经济新闻
2026-04-14 08:36:17
30国将齐聚东京,高市找中国要债,先降级中日关系,中方反将一军

30国将齐聚东京,高市找中国要债,先降级中日关系,中方反将一军

小樾说历史
2026-04-14 12:06:49
丢人丢大了!半马选手硬闯赛道蹭跑丰配友,跑圈集体声讨!

丢人丢大了!半马选手硬闯赛道蹭跑丰配友,跑圈集体声讨!

老王谈跑步
2026-04-14 10:46:41
俄专家:中国武器大部分性能超美国!但有一个缺点,暂时无法解决

俄专家:中国武器大部分性能超美国!但有一个缺点,暂时无法解决

栗子熟了呀
2026-04-14 09:33:24
新一代理想L9无伪实车曝光:整体变圆润 首次用上双色车漆

新一代理想L9无伪实车曝光:整体变圆润 首次用上双色车漆

快科技
2026-04-13 18:14:06
大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

墨印斋
2026-03-24 21:34:56
学风最好的10所大学!武汉双雄进前五,排名第一的没有想到

学风最好的10所大学!武汉双雄进前五,排名第一的没有想到

史海流年号
2026-04-07 20:40:02
朴信惠被曝怀二胎!预产期在秋天,网友:这也太快了吧?

朴信惠被曝怀二胎!预产期在秋天,网友:这也太快了吧?

今古深日报
2026-04-14 10:21:31
何超蕸去世,最伤心的不是何超琼,也不是继母梁安琪,而是何猷君

何超蕸去世,最伤心的不是何超琼,也不是继母梁安琪,而是何猷君

牛锅巴小钒
2026-04-14 12:27:07
突发!微软宣布全面退出中国!

突发!微软宣布全面退出中国!

大白聊IT
2025-04-07 13:26:38
下令全面封锁伊朗后,特朗普送中国一句话

下令全面封锁伊朗后,特朗普送中国一句话

小熊看国际
2026-04-14 11:24:20
辽宁一小伙认50岁女教师做干妈,每周去其家中补课,最后酿成悲剧

辽宁一小伙认50岁女教师做干妈,每周去其家中补课,最后酿成悲剧

红豆讲堂
2024-09-24 10:14:37
中美舰机再度交锋巴士海峡!

中美舰机再度交锋巴士海峡!

阿龙聊军事
2026-04-13 20:24:30
伊朗:巴林、沙特、卡塔尔、阿联酋、约旦,赔偿

伊朗:巴林、沙特、卡塔尔、阿联酋、约旦,赔偿

观察者网
2026-04-14 08:17:06
马英九一句话炸翻两岸!统一的底线,两岸人吵翻了

马英九一句话炸翻两岸!统一的底线,两岸人吵翻了

南宗历史
2026-04-13 13:02:48
当代著名作家、云南省作协原主席黄尧逝世

当代著名作家、云南省作协原主席黄尧逝世

澎湃新闻
2026-04-14 12:32:28
央视4月14日CCTV5直播国乒比赛,集训已紧急启动

央视4月14日CCTV5直播国乒比赛,集训已紧急启动

王稱吃吃喝喝
2026-04-14 12:03:15
“立即转向,否则开火” 伊朗披露64秒“驱退”美军舰视频

“立即转向,否则开火” 伊朗披露64秒“驱退”美军舰视频

环球网资讯
2026-04-13 15:06:31
2026-04-14 13:51:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7969文章数 560关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

艺术
亲子
教育
家居
公开课

艺术要闻

这位美女画家的夏天竟如此梦幻

亲子要闻

注意!这5类母婴用品别再乱买了,当心有害(附避坑攻略)

教育要闻

审美与教育碰撞!五年级女孩着装引争议:心态崩了,母亲成了罪人

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版