网易首页 > 网易号 > 正文 申请入驻

谷歌推出压缩算法TurboQuant:AI运行内存占用锐降至1/6

0
分享至

IT之家 3 月 26 日消息,谷歌研究院昨日(3 月 25 日)发布博文,推出全新极端压缩算法 TurboQuant,有望重塑 AI 运行效率并解决大模型键值缓存(KV Cache)的内存瓶颈。

向量是 AI 模型理解和处理信息的基础,但高维向量会消耗海量内存,从而在键值缓存(KV Cache)中引发严重的性能瓶颈。

IT之家注:键值缓存是大语言模型生成文本时使用的一种高速缓存机制,通过存储历史计算结果来避免重复计算,但极易造成内存瓶颈。

传统的高维向量量化技术虽然能压缩数据,却常常因为需要为微小数据块计算和存储量化常数,引入了额外的“内存开销”。这种额外负担部分抵消了压缩原本带来的优势,导致 AI 大模型在处理长文本或大规模搜索时依然受限。

谷歌研究院为彻底解决这一难题,推出了全新压缩算法 TurboQuant。同时,研究团队还公布了支撑该算法的两项核心底层技术:量化 Johnson-Lindenstrauss(QJL)和 PolarQuant(将亮相 AISTATS 2026)。

这三项技术协同工作,为高度依赖数据压缩的 AI 与搜索业务带来了全新解法,能够在完全不牺牲 AI 模型预测性能的前提下,大幅削减键值缓存的内存占用。

在运行机制方面,TurboQuant 分为两个关键步骤。首先,它利用 PolarQuant 方法进行高质量的主体压缩。该方法打破常规,放弃了传统的笛卡尔坐标系,转而将数据向量转换为极坐标。

这种转换将数据映射到边界已知的固定“圆形”网格上,免去了昂贵的数据归一化步骤,彻底消除了传统方法的内存开销。


随后,TurboQuant 利用 QJL 算法处理第一步遗留的微小误差。QJL 仅需 1 比特的残差压缩算力,就能像数学纠错机一样消除偏差,确保模型计算出精准的注意力分数。

研究团队在 Gemma 和 Mistral 等开源大模型上进行了严格的基准测试。实验数据表明,TurboQuant 无需任何预训练或微调,就能极其高效地将键值缓存压缩至 3 比特,并在“大海捞针”等长上下文测试中实现零精度损失,同时将内存占用降低至 1/6。

此外,在 H100 GPU 加速器上,4 比特 TurboQuant 的运行速度比未量化的 32 比特基准提升了高达 8 倍。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么说坏人绞尽脑汁不如蠢人灵机一动?网友:差点让家里团灭

为什么说坏人绞尽脑汁不如蠢人灵机一动?网友:差点让家里团灭

夜深爱杂谈
2026-03-03 22:08:42
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
美国前国务卿预言美以伊战争后果,孙玉良:蓬佩奥的话不幸会落空

美国前国务卿预言美以伊战争后果,孙玉良:蓬佩奥的话不幸会落空

孙玉良
2026-03-27 09:33:16
《逐玉》床戏删减引争议,张凌赫田曦薇自曝最爱吻戏

《逐玉》床戏删减引争议,张凌赫田曦薇自曝最爱吻戏

孤城落日
2026-03-27 07:19:03
全面绞杀!中方拒邀日企参会,万亿市场关上大门,高市赴美也难救

全面绞杀!中方拒邀日企参会,万亿市场关上大门,高市赴美也难救

胖福的小木屋
2026-03-26 17:33:34
安帅:主要问题在后场出球上;维尼修斯没进球?不能说表现差

安帅:主要问题在后场出球上;维尼修斯没进球?不能说表现差

懂球帝
2026-03-27 07:45:05
5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

叮当当科技
2026-03-20 03:29:51
太突然!中国音乐家被撞身亡,年仅35岁

太突然!中国音乐家被撞身亡,年仅35岁

吃青菜长高
2026-03-06 14:52:43
固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

小李子体育
2026-03-27 08:24:49
张雪峰私下真面目曝光!员工闺蜜爆料:和镜头里完全两样

张雪峰私下真面目曝光!员工闺蜜爆料:和镜头里完全两样

寒律
2026-03-27 07:40:18
抗炎才能抗癌!哈佛大学《自然》重磅:炎症会在身体留下长期记忆,显著增加未来患癌风险

抗炎才能抗癌!哈佛大学《自然》重磅:炎症会在身体留下长期记忆,显著增加未来患癌风险

医诺维
2026-03-26 17:00:54
地坛公园周深、王俊凯等“明星树”不能续养了?园方:不允许以明星姓名认养树木,往年挂牌的也需配合修改

地坛公园周深、王俊凯等“明星树”不能续养了?园方:不允许以明星姓名认养树木,往年挂牌的也需配合修改

极目新闻
2026-03-26 16:43:13
开火之日就是全军覆灭之时!万万没想到,菲律宾导弹已经瞄准台海

开火之日就是全军覆灭之时!万万没想到,菲律宾导弹已经瞄准台海

黑翼天使
2026-03-24 07:50:52
心态凉了,勇士队格林就斯蒂芬·库里伤愈复出问题发表看法

心态凉了,勇士队格林就斯蒂芬·库里伤愈复出问题发表看法

好火子
2026-03-26 23:56:40
圈内大佬刚内涵潜规则,关晓彤鹿晗分手原因就上热搜,真瞒不住了

圈内大佬刚内涵潜规则,关晓彤鹿晗分手原因就上热搜,真瞒不住了

情感大头说说
2026-03-26 10:12:47
利雅得胜利社媒晒球员回归照,C罗面对镜头比出“胜利”手势

利雅得胜利社媒晒球员回归照,C罗面对镜头比出“胜利”手势

懂球帝
2026-03-27 00:17:13
汪宝儿满月伴手礼曝光,马筱梅很用心,满月宴办的低调亲友没出镜

汪宝儿满月伴手礼曝光,马筱梅很用心,满月宴办的低调亲友没出镜

乡野小珥
2026-03-27 00:01:02
一年流出视频294部的小宝到底探过多少朵花?

一年流出视频294部的小宝到底探过多少朵花?

挪威森林
2026-01-25 17:18:42
以色列40分钟挨了4轮导弹,美国在背后跟伊朗谈停火,内塔尼亚胡还能撑多久

以色列40分钟挨了4轮导弹,美国在背后跟伊朗谈停火,内塔尼亚胡还能撑多久

起喜电影
2026-03-27 09:02:35
延寿9年,心脏病风险降60%!悉尼大学最新:饮食、睡眠、运动最佳组合出炉,小改变也大有益

延寿9年,心脏病风险降60%!悉尼大学最新:饮食、睡眠、运动最佳组合出炉,小改变也大有益

医诺维
2026-03-24 17:02:18
2026-03-27 10:19:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336161文章数 607092关注度
往期回顾 全部

科技要闻

OpenAI果断砍掉"成人模式",死磕生产力

头条要闻

65岁上海老伯相信"33岁女老师"给自己生儿子 被骗16万

头条要闻

65岁上海老伯相信"33岁女老师"给自己生儿子 被骗16万

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

很反常!油价向上,黄金向下

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
手机
艺术
游戏
军事航空

家居要闻

傍海而居 静观蝴蝶海

手机要闻

消息称苹果iOS 27拓展“液态玻璃”,要求所有App跟进

艺术要闻

江青的书法秘诀!只练草书真的能提升书法水平吗?

《苍穹浩瀚:奥西里斯重生》宣布将于 4 月 22 日开启面向其支持者的封闭测试,并公布全新实机预告

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版