网易首页 > 网易号 > 正文 申请入驻

AI内存压缩超83%,谷歌黑科技给存储巨头“当头一棒”

0
分享至



出品|搜狐科技

作者|张雅婷

编辑| 杨 锦

存储市场的高歌猛进,被谷歌投下的一枚“深水炸弹”骤然打断。

当地时间3月24日,谷歌研究院发表文章推出以TurboQuant为代表的新一代压缩算法,宣称可以在不损失质量的前提下实现AI内存的极致压缩,突破了AI发展的核心瓶颈。

随着大模型参数规模迈向万亿级别,推理过程中键值缓存带来的内存压力暴涨。每一次问答、每一次推理,都需要海量内存资源支撑。

OpenAI首席运营官Brad Lightcap此前表示,存储芯片短缺与美国能源供应紧张,是当前AI基础设施扩张面临的两大潜在瓶颈。“现在的瓶颈是存储,过去是电力。”

而谷歌最新推出的 TurboQuant 技术,在几乎不影响模型性能的情况下,可将键值缓存压缩至原来的1/6(约减少 83%),从而显著缓解内存压力;同时,在英伟达 H100 GPU 上,其性能最高可提升至8倍。

Cloudflare首席执行官Matthew Prince认为,谷歌TurboQuant有望像去年的DeepSeek模型一样,通过效率革新打破算力依赖的行业逻辑。

这枚“深水炸弹”掀起的冲击波,迅速传导至资本市场。存储巨头股价集体重挫,恐慌情绪蔓延。美东时间3月26日,闪迪(SanDisk)股价大跌11.02%,美光科技下跌6.97%。


谷歌发布突破性新算法

当地时间3月24日,谷歌发布了名为TurboQuant的技术,引发市场震动。

根据谷歌官方介绍,TurboQuant是一种专为大型语言模型和向量搜索引擎设计的内存压缩技术,核心目标是解决AI系统中键值缓存(Key-Value Cache)的存储瓶颈。

所谓键值缓存,可以简单理解为模型在“做阅读理解时做的笔记”。当大模型逐字生成内容时,会把已经处理过的信息存下来,下次就不用从头再算一遍,从而加快生成速度。不过,这些“笔记”会随着对话变长不断累积,占用越来越多的内存,最终可能成为推理过程中的主要资源消耗。

向量量化(Vector Quantization)是一种强大的经典数据压缩技术。然而,这种传统的向量量化方法让每个数字产生1至2比特的额外内存开销,部分抵消了压缩收益。

而谷歌提出的TurboQuant,可以在实现模型尺寸大幅缩减的同时保持零精度损失。

具体来看,TurboQuant可在无需模型训练或微调的前提下,将键值缓存压缩至3比特,在Gemma、Mistral等开源模型实测中,键值内存降至1/6(约减少 83%)。在英伟达H100 GPU加速器上,该算法较未量化键值方案性能提升最高达8倍。

TurboQuant通过两个关键步骤实现压缩:首先是采用PolarQuant(高质量压缩)方法,对数据向量进行随机旋转。这一巧妙的步骤简化了数据的几何结构,实现高质量压缩。

然后,TurboQuant使用极少量的残余压缩能力,利用量化Johnson-Lindenstrauss算法充当数学误差校验器,处理第一阶段留下的微量误差,从而获得更准确的注意力分数。

谷歌表示,TurboQuant、QJL和PolarQuant虽然主要应用是解决Gemini等模型中的KV缓存瓶颈,但其影响远不止于此。

当下,搜索正从单纯的关键词匹配演变为理解意图和含义,TurboQuant等技术对于这一使命至关重要。因为它们允许以极小的内存、接近零的预处理时间和业界领先的准确性,来构建和查询大型向量索引,这使得语义搜索变得更快、更高效。

据了解,TurboQuant将于ICLR 2026发表,PolarQuant则计划在AISTATS 2026上亮相。谷歌已在LongBench、Needle In A Haystack、ZeroSCROLLS、RULER及L-Eval等多项基准测试中完成验证,并指出该技术同样适用于大规模搜索引擎的向量检索场景。


内存股集体大跌

存储的“DeepSeek时刻”来了?

谷歌TurboQuant技术发布后,全球存储芯片板块震荡。

美东时间3月26日,闪迪股价大跌11.02%,美光科技下跌6.97%,西部数据下跌7.7%,希捷科技下跌8.33%。

韩国存储巨头同样受到重创。当地时间3月26日,韩国SK海力士股价下跌6.23%,市值损失44.18万亿韩元(约合293.8亿美元);三星电子也下跌了4.71%,市值损失57.83万亿韩元(约合384.5亿美元)。3月27日,三星电子和海力士股价仍持续下跌,跌幅收窄至1%左右。

今日开盘,A股存储芯片集体大跌,佰维存储、西测测试跌超7%,江波龙、德明利、香农芯创跌超5%。

近两年,由于AI产业的爆发,存储需求随之暴涨。

以HBM(高带宽内存)为例,这一基于DRAM技术的高端品类,主要面向AI时代高性能计算场景。数据显示,2025年,AI服务器对HBM的需求量从2024年的30万颗激增至120万颗,增长率高达300%。

三星电子表示,目前所有可量产的HBM产能均已预订满,预计2026年HBM销量将同比增长超过三倍。

然而,谷歌TurboQuant技术的出现,悄然改写了行业预期Cloudflare首席执行官Matthew Prince将此次技术突破称为谷歌的“DeepSeek时刻”,认为其有望像去年的DeepSeek模型一样,通过效率革新打破算力依赖的行业逻辑。

此前,DeepSeek横空出世,因高性能、低成本的高性价比优势,市场认为英伟达算力需求预期将变弱,导致英伟达一度暴跌。当时,英伟达的股价一天跌幅17%,市值蒸发了5890亿美元。

不过,也有业内人士认为,根据“杰文斯悖论”,当技术进步提高了效率,资源消耗不仅没有减少,反而激增。回过头来看,DeepSeek并没有让英伟达芯片的需求减少。

摩根士丹利认为,通过大幅降低单次查询的服务成本,TurboQuant能够让原本只能在云端昂贵集群上运行的模型迁移至本地,有效降低AI规模化部署的门槛,这可能反而能进一步提振整体需求。

Quilter Cheviot科技研究主管Ben Barringer认为,近期存储芯片企业股价下跌可能是由于股东在周期性市场持续增长后套现所致。“TurboQuant的事件加剧了股价下跌的压力,但这只是渐进式的,而非革命性的,它不会改变行业的长期需求格局。”

此外,TechCrunch相关分析指出,该算法存在局限性,这项技术并不能缓解人工智能模型训练阶段所需的大量内存问题,因为它只是在推理阶段对数据进行严格的压缩。



运营编辑 |曹倩审核|孟莎莎




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰追悼会现场!天不亮排长队,妈妈哭得很伤心,汪涵前去送别

张雪峰追悼会现场!天不亮排长队,妈妈哭得很伤心,汪涵前去送别

180视角
2026-03-28 10:03:05
中国连出两条公告,特朗普不敢回应!美盟友们急了:赶紧派人赴华

中国连出两条公告,特朗普不敢回应!美盟友们急了:赶紧派人赴华

军机Talk
2026-03-28 13:31:41
麻将、关系、性生活是县城的底色!

麻将、关系、性生活是县城的底色!

黯泉
2026-03-28 15:09:09
全红婵登《嘉人》封面,彻底告别青涩模样,网友直呼画面太惊艳

全红婵登《嘉人》封面,彻底告别青涩模样,网友直呼画面太惊艳

丫头舫
2026-03-28 20:03:34
伊朗:报复“将不再局限于以牙还牙”

伊朗:报复“将不再局限于以牙还牙”

中国网
2026-03-28 16:18:36
“鲁比奥显然很恼火”!美媒爆料:G7外长会上,美国务卿和欧盟“外长”激烈交锋

“鲁比奥显然很恼火”!美媒爆料:G7外长会上,美国务卿和欧盟“外长”激烈交锋

环球网资讯
2026-03-28 14:05:11
暴跌95%,裁员5万人,全球第二大车企爆大雷

暴跌95%,裁员5万人,全球第二大车企爆大雷

蒋东文
2026-03-27 21:09:47
信仰已经崩塌,多数人可能真熬不住了

信仰已经崩塌,多数人可能真熬不住了

经济学教授V
2026-03-27 18:36:19
打!赔光1770亿也要打!以色列最新民调:75%民众要求打到底

打!赔光1770亿也要打!以色列最新民调:75%民众要求打到底

砚底沉香
2026-03-28 15:45:02
现实版钢铁侠:乌克兰战斗机器人独守阵地45天,毙敌43人

现实版钢铁侠:乌克兰战斗机器人独守阵地45天,毙敌43人

史政先锋
2026-03-28 15:09:53
张雪峰穷人思维很严重?身家5亿骑电驴,吃外卖,400元自助餐嫌贵

张雪峰穷人思维很严重?身家5亿骑电驴,吃外卖,400元自助餐嫌贵

魔都姐姐杂谈
2026-03-28 13:06:09
国务院食安办、市场监管总局约谈相关地方市级人民政府负责人 督办“3・15”晚会曝光问题整改

国务院食安办、市场监管总局约谈相关地方市级人民政府负责人 督办“3・15”晚会曝光问题整改

新京报
2026-03-28 19:17:17
4月1日起,高血压糖尿病患者必办三件事,药费直接省一半

4月1日起,高血压糖尿病患者必办三件事,药费直接省一半

今日养生之道
2026-03-28 07:00:22
最贵一只上千元!浙江男子钻进深山4年,养了3万多只

最贵一只上千元!浙江男子钻进深山4年,养了3万多只

万象硬核本尊
2026-03-28 21:12:26
大学生怒砸食堂后续!人已被抓,知情人爆猛料,赔几十万只是一角

大学生怒砸食堂后续!人已被抓,知情人爆猛料,赔几十万只是一角

奇思妙想草叶君
2026-03-28 18:03:09
门将扑球脱手酿丢球+主力伤退,中国U23半场0-1落后于东亚劲旅

门将扑球脱手酿丢球+主力伤退,中国U23半场0-1落后于东亚劲旅

侧身凌空斩
2026-03-28 20:24:37
刚刚,被全世界遗忘的马杜罗,等来了美国法庭的判决

刚刚,被全世界遗忘的马杜罗,等来了美国法庭的判决

沧海旅行家
2026-03-28 12:25:40
广东:坚决拥护党中央决定

广东:坚决拥护党中央决定

新京报政事儿
2026-03-27 22:17:04
邀请赛:“徐州姆巴佩”苗润东发挥抢眼,U19国足1比0击败澳大利亚

邀请赛:“徐州姆巴佩”苗润东发挥抢眼,U19国足1比0击败澳大利亚

足球报
2026-03-28 16:56:47
U23国足连场丢球!3场已丢7球,姚浩洋不满队友,右路又被打穿

U23国足连场丢球!3场已丢7球,姚浩洋不满队友,右路又被打穿

奥拜尔
2026-03-28 20:07:38
2026-03-28 21:47:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4750文章数 9184关注度
往期回顾 全部

科技要闻

华为盘古大模型负责人王云鹤确认离职

头条要闻

女子被指拥有"3个身份证号" 当地多部门回应

头条要闻

女子被指拥有"3个身份证号" 当地多部门回应

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

陈牧驰陈冰官宣得子 晒一家三口握拳照

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

房产
亲子
本地
家居
公开课

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

亲子要闻

我确实不敢啊孩子

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

家居要闻

曲线华尔兹 现代简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版