网易首页 > 网易号 > 正文 申请入驻

总编辑圈点 | 更小内存带来更强AI,压缩内存可提升大模型处理任务准确性

0
分享至

来源:科技日报

英国爱丁堡大学与英伟达的联合团队开发出一种新方法,能够压缩人工智能(AI)模型运行时所依赖的内存,从而在保持响应速度不变的情况下,提升模型处理复杂任务的准确性,或显著降低其能耗。这也意味着,更小的内存将带来“更强的AI”,有望打破大语言模型(LLM)性能瓶颈。


团队发现,将LLM所使用的内存压缩至原有大小的1/8后,模型在数学、科学和编程等专业测试中的表现反而更好,且推理时间并未延长。这一方法亦有助于模型同时响应更多用户请求,从而降低单个任务的平均功耗。除了节能优势,这项改进还有望使AI更适用于处理复杂问题的系统,或存储速度较慢、内存容量有限的终端设备,例如智能家居产品和可穿戴技术。

AI模型通常通过“思考”更复杂的假设,或同时探索更多可能性来寻找答案。在此过程中,模型需要将已生成的推理线程内容暂存于一种称为“KV缓存”的内存中。随着线程数量增多或线程长度增加,KV缓存的体积会迅速扩大,成为性能瓶颈,拖慢模型输出响应的速度。

为突破这一限制,团队提出了一种名为“动态记忆稀疏化”(DMS)的内存压缩技术。该方法并非保留所有生成的标记(即AI模型处理的基本数据单元),而是动态判断哪些标记对后续推理至关重要、哪些可以剔除。由于从决定删除某个标记到实际删除之间存在的微小延迟,使模型有机会将待删除标记中的有用信息转移至保留的标记中。通过这种方式,DMS使AI模型能够在相同计算资源下进行更深入的“思考”,或探索更多可能的解决方案路径。

测试中,在一项基于美国数学奥林匹克资格赛(AIME 24)设计的数学测试中,压缩模型在相同内存读取次数下,平均得分比未压缩模型高出12分;在由博士级专家编制的专业科学题库中,其表现优于原模型;在评估代码编写能力的平台上,压缩模型的平均得分也提高了10分。

总编辑圈点

这项研究打破了人们“计算资源越多,AI越强”的惯性认知。DMS内存压缩技术就像给AI装上了过滤器,让它学会抓住思考的重点,而非盲目堆砌数据。这种“更少内存,更强智能”的路径,可能从根本上改变AI的研发方向,让高性能AI真正轻量化。未来,复杂的科学计算或许在智能手表上就能运行,家用机器人也可以同时处理多项复杂指令而不卡顿。其实,这也暗合了人类的高效思考逻辑——我们不会记住每个细节,而是提炼关键信息进行推理。这种向人脑学习的选择性记忆机制,也许会比单纯扩大模型规模更早触及通用AI的门槛。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
现货黄金跌幅扩大至2.5%

现货黄金跌幅扩大至2.5%

财联社
2026-03-27 00:24:12
伊朗称已组织超百万人为地面战斗做准备

伊朗称已组织超百万人为地面战斗做准备

闪电新闻
2026-03-27 00:18:15
罗技中国致歉

罗技中国致歉

第一财经资讯
2026-03-27 00:17:22
乌克兰打出400:1恐怖战绩,俄罗斯列宁格勒港口基本被打瘫痪

乌克兰打出400:1恐怖战绩,俄罗斯列宁格勒港口基本被打瘫痪

史政先锋
2026-03-26 16:17:12
为何越来越多有钱人,宁愿买两套房和父母住对门,也要搬离别墅?

为何越来越多有钱人,宁愿买两套房和父母住对门,也要搬离别墅?

装修秀
2026-03-26 14:05:47
上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

环球网资讯
2026-03-26 08:13:14
含剧毒,无解药!高温120℃煮不烂、杀不死每家都有,一定别乱吃

含剧毒,无解药!高温120℃煮不烂、杀不死每家都有,一定别乱吃

江江食研社
2026-03-25 21:55:01
美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

爱吃醋的猫咪
2026-03-22 22:29:08
颖儿素颜做热玛吉,疼到表情失控,这为了上镜也是真拼?

颖儿素颜做热玛吉,疼到表情失控,这为了上镜也是真拼?

娱乐领航家
2026-03-27 00:00:03
为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

另子维爱读史
2026-03-22 22:34:48
虽然毛主席享年83岁,保健医生却说:其实毛主席不具备长寿条件

虽然毛主席享年83岁,保健医生却说:其实毛主席不具备长寿条件

芳芳历史烩
2026-03-26 23:31:52
伊朗再获重大胜利!美国,又被打惨了!

伊朗再获重大胜利!美国,又被打惨了!

大嘴说天下
2026-03-26 19:32:16
放弃阿隆索!利物浦新帅目标敲定,他是下一个克洛普

放弃阿隆索!利物浦新帅目标敲定,他是下一个克洛普

奶盖熊本熊
2026-03-26 04:28:59
伊朗愿意与“主和派”万斯谈!特朗普一边宣称胜利一边增兵中东:我和鲁比奥也要参与

伊朗愿意与“主和派”万斯谈!特朗普一边宣称胜利一边增兵中东:我和鲁比奥也要参与

红星新闻
2026-03-25 17:17:14
1979年越南战败后,黎笋要求中国边线北移100公里,杨得志:打!

1979年越南战败后,黎笋要求中国边线北移100公里,杨得志:打!

兵卒史
2026-03-26 10:26:03
真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

吃瓜局
2025-11-11 16:23:49
语文课不会教的:念奴娇、如梦令,千奇百怪的词牌名是怎么来的?

语文课不会教的:念奴娇、如梦令,千奇百怪的词牌名是怎么来的?

长风文史
2026-03-24 17:09:58
雷军晒成绩:小米SU7、YU7双双第一!

雷军晒成绩:小米SU7、YU7双双第一!

快科技
2026-03-26 13:09:04
字母哥的哥哥:我也想不通为什么尼克斯选我,我都不抱希望

字母哥的哥哥:我也想不通为什么尼克斯选我,我都不抱希望

林子说事
2026-03-26 14:42:15
诺利托:尽管我曾效力于巴萨,但为了生活我也愿意效力于皇马

诺利托:尽管我曾效力于巴萨,但为了生活我也愿意效力于皇马

懂球帝
2026-03-26 22:42:03
2026-03-27 00:56:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1348000文章数 2710911关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
本地
旅游
数码
公开课

转头就晕的耳石症,能开车上班吗?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版