网易首页 > 网易号 > 正文 申请入驻

谷歌突破性算法震惊硅谷 华尔街激辩:内存需求要降温了?

0
分享至

财联社3月26日讯(编辑 刘蕊)美东时间周二,谷歌发布了一个炸裂硅谷科技圈的最新算法:超高效AI内存压缩算法TurboQuant。


谷歌声称,这项算法可以在在不损失准确性的前提下,将大型语言模型运行时的缓存内存占用至少减少6倍、性能提升8倍,本质上,可以让人工智能在占用更少内存空间的同时记住更多信息。

这一算法一经发布,美股芯片股应声下挫。谷歌和华尔街也掀起了一场热烈讨论:当前困扰众多科技巨头的内存芯片短缺灾难是否可以就此终结了?

TurboQuant是什么?

先来说说这项TurboQuant算法具体是什么。

根据谷歌在官方网站的介绍,TurboQuant是一种压缩方法,它能够在不损失任何精度的前提下大幅减小模型大小,因此非常适合支持键值缓存(KV Cache)压缩和向量搜索。它通过两个关键步骤实现这一点:

1、高质量压缩(PolarQuant method):TurboQuant 首先随机旋转数据向量。这一巧妙的步骤简化了数据的几何结构,使得可以轻松地将标准的高质量量化器分别应用于向量的每个部分。第一阶段利用了大部分压缩能力(大部分比特)来保留原始向量的主要概念和特征。
2、消除隐藏误差:TurboQuant 使用少量剩余的压缩能力(仅1比特)将QJL算法应用于第一阶段遗留的微小误差。QJL 阶段充当数学误差检查器,消除偏差,从而获得更准确的注意力评分。

简单来说,TurboQuant本质上就是在保持AI模型核心结构不变的情况下压缩AI模型,而且无需预处理或特定的校准数据。

谷歌声称,他们使用开源的长上下文模型(Gemma和Mistral ),在包括LongBench、Needle In A Haystack、ZeroSCROLLS、RULER和L-Eval在内的多项基准测试中,对 TurboQuant、PolarQuant 和KIVI这三种算法进行了严格评估。

实验数据表明,TurboQuant在点积失真和召回率方面均达到了最优评分性能,同时最大限度地减少了键值(KV)内存占用。


上图展示了TurboQuant、PolarQuant 和KIVI基线算法在问答、代码生成和摘要等不同任务中的综合性能得分。

谷歌称,TurboQuant在所有基准测试中均取得了完美的下游结果,同时将键值内存大小至少减少了6倍。

他们计划在下个月的ICLR 2026会议上展示他们的研究成果,以及展示实现这种压缩的两种方法:量化方法PolarQuant和名为QJL的训练和优化方法。

谷歌迎来DeepSeek时刻?

谷歌的这一算法,令不少人联想到了HBO电视剧《硅谷》(2014年至2019年播出)中虚构的创业公司Pied Piper。在电视剧中,Pied Piper同样开发出一种突破性的压缩算法,能在近乎无损压缩的情况下大幅减小文件大小。


而现实中的谷歌研究院发布的TurboQuant技术,同样致力于在不损失质量的前提下实现极致压缩,但它应用于人工智能系统的核心瓶颈。

Cloudflare首席执行官Matthew Prince等人甚至称之为谷歌的DeepSeek时刻,认为其有望像DeepSeek一样,通过极高的效率收益大幅拉低AI的运行成本,同时在结果上保持竞争力。


他在X上的一篇文章中写道:“在速度、内存使用、功耗和利用率方面,AI推理还有很大的优化空间。”

内存芯片需求将会降温?

谷歌的这一算法发布之际,正值全球存储芯片短缺问题日趋严峻的时刻。

由于全球各大巨头全力兴建AI基础设施,内存需求不断攀升,供不应求的现象短期内难以缓解。各大科技公司开发人员已经想出各种创新方法来克服或至少应对内存短缺,而谷歌的TurboQuant,目前被科技界人士认为,很可能成为一种给内存需求降温的可持续方案。

这一预期对于致力于建设AI基础设施的科技巨头们来说,自然是一件好事。但对于内存芯片厂商们来说,可能结果就不同了。

受到内存需求可能降温预期的影响,美东时间周三,美股存储芯片板块在开盘后不久就集体跳水:闪迪一度跌6.5%,美光科技跌4%,西部数据跌超4%,希捷科技跌超5%。


闪迪周三早盘一度大跌

周四亚洲时段,截至发稿时SK海力士下跌4.42%,三星跌3.02%。

Futurum股票研究部门的Shay Boloor声称:

“市场认为这对内存类股票来说是一个潜在的不利因素,因为长上下文AI推理每个工作负载可能需要的内存现在可能大幅减少。”

大摩提出相反观点

不过,也有华尔街巨头提出了相反的看法。

比如,Lynx Equity Strategies分析师KC Rajkumar就提出,TurboQuant的技术“颠覆性”可能并没有媒体描述的那么夸张。

他表示,谷歌所谓的“8倍性能提升”是建立在与老旧的32-bit模型对比之上的,然而当前的推理模型早已广泛采用4-bit量化数据,因此性能提升幅度并没有那么夸张。

此外,摩根士丹利还指出,谷歌TurboQuant技术仅作用于推理阶段的键值缓存,不影响模型权重所占用的HBM,也与训练任务无关。

因此,这并非存储总需求或硬件总量减少6倍,而是通过效率提升增加单GPU吞吐量——相同硬件可支持4至8倍更长的上下文,或在不触发内存溢出的前提下显著提升批处理规模。

更重要的是,摩根士丹利进一步援引了“杰文斯悖论”(Jevons Paradox),来解释内存需求不会降温的判断。

杰文斯悖论是经济学中的一个重要概念,指的是技术进步与资源消耗之间的一种反直觉关系。其定义是:当技术进步提高了效率,资源消耗不仅没有减少,反而激增。例如,瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升。

摩根士丹利认为,通过大幅降低单次查询的服务成本,TurboQuant能够让原本只能在云端昂贵集群上运行的模型迁移至本地,有效降低AI规模化部署的门槛,这可能反而能进一步提振整体需求。

实际上,Cloudflare首席执行官Matthew Prince等人提到的DeepSeek,就是杰文斯悖论的最鲜明例子:在DeepSeek去年年初刚刚发布时,市场也一度担忧AI硬件需求将会降温,但事实是,效率的提升带来了AI应用的进一步普及,AI硬件需求也再次升温。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个月允许吃几次他达拉非?这样服用,高效摆脱ED困扰

一个月允许吃几次他达拉非?这样服用,高效摆脱ED困扰

哆啦程医生
2026-03-27 18:20:23
62岁广西名医黄贵华突发心梗去世,去世前2天还在科普脾胃保养,工作人员:近期将举行追悼会

62岁广西名医黄贵华突发心梗去世,去世前2天还在科普脾胃保养,工作人员:近期将举行追悼会

大象新闻
2026-03-27 14:45:21
世界不再迷信美元,美国把伊朗打得太狠,反而倒逼出了石油人民币

世界不再迷信美元,美国把伊朗打得太狠,反而倒逼出了石油人民币

丁丁鲤史纪
2026-03-27 17:21:44
香港金像奖发布最佳男女主候选人造型照,梁家辉跳舞、古天乐“头痛”,马丽大变样、章子怡很美;本届金像奖4月19日颁奖,章子怡有望第3次“封后”

香港金像奖发布最佳男女主候选人造型照,梁家辉跳舞、古天乐“头痛”,马丽大变样、章子怡很美;本届金像奖4月19日颁奖,章子怡有望第3次“封后”

极目新闻
2026-03-27 09:09:45
大理州县管干部任前公示公告,涉及45人

大理州县管干部任前公示公告,涉及45人

加油大理
2026-03-28 09:03:00
随着喀麦隆0-1,FIFA系列赛澳洲站最新积分榜出炉:中国男足第一

随着喀麦隆0-1,FIFA系列赛澳洲站最新积分榜出炉:中国男足第一

侧身凌空斩
2026-03-27 19:03:34
17岁费曼长到188cm!陪妈妈看展太帅了,王丽萍罕见出镜气质绝了

17岁费曼长到188cm!陪妈妈看展太帅了,王丽萍罕见出镜气质绝了

观鱼听雨
2026-03-27 16:48:38
三年级文班和三年级霍华德,谁更强?全面对比,结果和想象不同

三年级文班和三年级霍华德,谁更强?全面对比,结果和想象不同

大西体育
2026-03-27 21:11:04
破防!中国油轮硬闯霍尔木兹海峡,伊朗全程护航,看完太提气

破防!中国油轮硬闯霍尔木兹海峡,伊朗全程护航,看完太提气

戗词夺理
2026-03-25 10:53:15
樊振东一单独得2分 52岁华裔名将求合影 现场播放《真心英雄》

樊振东一单独得2分 52岁华裔名将求合影 现场播放《真心英雄》

念洲
2026-03-28 06:47:42
李梓萌,私生活传闻太荒唐

李梓萌,私生活传闻太荒唐

做一个合格的吃瓜群众
2026-03-21 19:20:55
陈士榘退休后,总参谋长杨得志登门一见面就喊:陈士榘万岁!

陈士榘退休后,总参谋长杨得志登门一见面就喊:陈士榘万岁!

老杉说历史
2026-03-27 18:16:07
浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

独角showing
2025-12-31 21:08:57
哈梅内伊最后画面曝光,几分钟后被美以空袭炸死

哈梅内伊最后画面曝光,几分钟后被美以空袭炸死

三叔的装备空间
2026-03-27 12:40:03
49年他婉拒了新中国外长职务:若不拒绝,恐怕开国元帅名单要改写

49年他婉拒了新中国外长职务:若不拒绝,恐怕开国元帅名单要改写

浩渺青史
2026-03-25 13:59:19
关于调整市级总河长,部分河(湖)长,协助单位,市河长办主任、副主任的通知

关于调整市级总河长,部分河(湖)长,协助单位,市河长办主任、副主任的通知

文都桐网
2026-03-28 10:17:16
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
怪不得张雪峰说普通家庭的女孩不要学金融!

怪不得张雪峰说普通家庭的女孩不要学金融!

仰望星空的一粒沙子
2026-03-27 07:26:52
“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

妍妍教育日记
2026-02-26 20:37:12
抱紧美日大腿,停飞中国航班、拒绝中国游客的小国,如今怎样了?

抱紧美日大腿,停飞中国航班、拒绝中国游客的小国,如今怎样了?

霁寒飘雪
2026-03-28 07:19:21
2026-03-28 10:47:00
科创板日报 incentive-icons
科创板日报
上海报业集团主管主办
65893文章数 44558关注度
往期回顾 全部

科技要闻

遭中国学界"拉黑"后,这家AI顶会低头道歉

头条要闻

前大厂员工开"网络赌场" 三个月吸金1900万

头条要闻

前大厂员工开"网络赌场" 三个月吸金1900万

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

范玮琪加盟,官宣《浪姐7》遭全网抵制

财经要闻

我在小吃培训机构学习“科技与狠活”

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

本地
游戏
数码
家居
公开课

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

PS5疯狂涨价!或将拖累《GTA6》硬件销量

数码要闻

全球存储芯片短缺,索尼宣布暂停CFexpress及SD卡订单

家居要闻

曲线华尔兹 现代简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版