网易首页 > 网易号 > 正文 申请入驻

谷歌突破性算法震惊硅谷 华尔街激辩:内存需求要降温了?

0
分享至

来源:滚动播报

来源:财联社

财联社3月26日讯(编辑 刘蕊)美东时间周二,谷歌发布了一个炸裂硅谷科技圈的最新算法:超高效AI内存压缩算法TurboQuant。


谷歌声称,这项算法可以在在不损失准确性的前提下,将大型语言模型运行时的缓存内存占用至少减少6倍、性能提升8倍,本质上,可以让人工智能在占用更少内存空间的同时记住更多信息。

这一算法一经发布,美股芯片股应声下挫。谷歌和华尔街也掀起了一场热烈讨论:当前困扰众多科技巨头的内存芯片短缺灾难是否可以就此终结了?

TurboQuant是什么?

先来说说这项TurboQuant算法具体是什么。

根据谷歌在官方网站的介绍,TurboQuant是一种压缩方法,它能够在不损失任何精度的前提下大幅减小模型大小,因此非常适合支持键值缓存(KV Cache)压缩和向量搜索。它通过两个关键步骤实现这一点:

1、高质量压缩(PolarQuant method):TurboQuant 首先随机旋转数据向量。这一巧妙的步骤简化了数据的几何结构,使得可以轻松地将标准的高质量量化器分别应用于向量的每个部分。第一阶段利用了大部分压缩能力(大部分比特)来保留原始向量的主要概念和特征。
2、消除隐藏误差:TurboQuant 使用少量剩余的压缩能力(仅1比特)将QJL算法应用于第一阶段遗留的微小误差。QJL 阶段充当数学误差检查器,消除偏差,从而获得更准确的注意力评分。

简单来说,TurboQuant本质上就是在保持AI模型核心结构不变的情况下压缩AI模型,而且无需预处理或特定的校准数据。

谷歌声称,他们使用开源的长上下文模型(Gemma和Mistral ),在包括LongBench、Needle In A Haystack、ZeroSCROLLS、RULER和L-Eval在内的多项基准测试中,对 TurboQuant、PolarQuant 和KIVI这三种算法进行了严格评估。

实验数据表明,TurboQuant在点积失真和召回率方面均达到了最优评分性能,同时最大限度地减少了键值(KV)内存占用。


上图展示了TurboQuant、PolarQuant 和KIVI基线算法在问答、代码生成和摘要等不同任务中的综合性能得分。

谷歌称,TurboQuant在所有基准测试中均取得了完美的下游结果,同时将键值内存大小至少减少了6倍。

他们计划在下个月的ICLR 2026会议上展示他们的研究成果,以及展示实现这种压缩的两种方法:量化方法PolarQuant和名为QJL的训练和优化方法。

谷歌迎来DeepSeek时刻?

谷歌的这一算法,令不少人联想到了HBO电视剧《硅谷》(2014年至2019年播出)中虚构的创业公司Pied Piper。在电视剧中,Pied Piper同样开发出一种突破性的压缩算法,能在近乎无损压缩的情况下大幅减小文件大小。


而现实中的谷歌研究院发布的TurboQuant技术,同样致力于在不损失质量的前提下实现极致压缩,但它应用于人工智能系统的核心瓶颈。

Cloudflare首席执行官Matthew Prince等人甚至称之为谷歌的DeepSeek时刻,认为其有望像DeepSeek一样,通过极高的效率收益大幅拉低AI的运行成本,同时在结果上保持竞争力。


他在X上的一篇文章中写道:“在速度、内存使用、功耗和利用率方面,AI推理还有很大的优化空间。”

内存芯片需求将会降温?

谷歌的这一算法发布之际,正值全球存储芯片短缺问题日趋严峻的时刻。

由于全球各大巨头全力兴建AI基础设施,内存需求不断攀升,供不应求的现象短期内难以缓解。各大科技公司开发人员已经想出各种创新方法来克服或至少应对内存短缺,而谷歌的TurboQuant,目前被科技界人士认为,很可能成为一种给内存需求降温的可持续方案。

这一预期对于致力于建设AI基础设施的科技巨头们来说,自然是一件好事。但对于内存芯片厂商们来说,可能结果就不同了。

受到内存需求可能降温预期的影响,美东时间周三,美股存储芯片板块在开盘后不久就集体跳水:闪迪一度跌6.5%,美光科技跌4%,西部数据跌超4%,希捷科技跌超5%。


闪迪周三早盘一度大跌

周四亚洲时段,截至发稿时SK海力士下跌4.42%,三星跌3.02%。

Futurum股票研究部门的Shay Boloor声称:

“市场认为这对内存类股票来说是一个潜在的不利因素,因为长上下文AI推理每个工作负载可能需要的内存现在可能大幅减少。”

大摩提出相反观点

不过,也有华尔街巨头提出了相反的看法。

比如,Lynx Equity Strategies分析师KC Rajkumar就提出,TurboQuant的技术“颠覆性”可能并没有媒体描述的那么夸张。

他表示,谷歌所谓的“8倍性能提升”是建立在与老旧的32-bit模型对比之上的,然而当前的推理模型早已广泛采用4-bit量化数据,因此性能提升幅度并没有那么夸张。

此外,摩根士丹利还指出,谷歌TurboQuant技术仅作用于推理阶段的键值缓存,不影响模型权重所占用的HBM,也与训练任务无关。

因此,这并非存储总需求或硬件总量减少6倍,而是通过效率提升增加单GPU吞吐量——相同硬件可支持4至8倍更长的上下文,或在不触发内存溢出的前提下显著提升批处理规模。

更重要的是,摩根士丹利进一步援引了“杰文斯悖论”(Jevons Paradox),来解释内存需求不会降温的判断。

杰文斯悖论是经济学中的一个重要概念,指的是技术进步与资源消耗之间的一种反直觉关系。其定义是:当技术进步提高了效率,资源消耗不仅没有减少,反而激增。例如,瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升。

摩根士丹利认为,通过大幅降低单次查询的服务成本,TurboQuant能够让原本只能在云端昂贵集群上运行的模型迁移至本地,有效降低AI规模化部署的门槛,这可能反而能进一步提振整体需求。

实际上,Cloudflare首席执行官Matthew Prince等人提到的DeepSeek,就是杰文斯悖论的最鲜明例子:在DeepSeek去年年初刚刚发布时,市场也一度担忧AI硬件需求将会降温,但事实是,效率的提升带来了AI应用的进一步普及,AI硬件需求也再次升温。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
正告台独:中国收复的是土地,不是所有人!

正告台独:中国收复的是土地,不是所有人!

阿七说史
2026-03-28 15:23:20
毛主席提议落选的国旗,网友感叹:寓意很伟大,但确实不合适

毛主席提议落选的国旗,网友感叹:寓意很伟大,但确实不合适

微史纪
2026-03-28 12:49:01
张雪峰女儿亲自辟谣!父母恩爱没离婚,回应三个问题,口才很意外

张雪峰女儿亲自辟谣!父母恩爱没离婚,回应三个问题,口才很意外

离离言几许
2026-03-27 14:42:23
办公室不雅行为!摄像头忘关视频曝光,这些人把“体面”丢了一地

办公室不雅行为!摄像头忘关视频曝光,这些人把“体面”丢了一地

就一点
2026-03-29 00:19:23
重庆某设计院员工带头罢工被辞退,辞退员工把领导眼镜打飞了!

重庆某设计院员工带头罢工被辞退,辞退员工把领导眼镜打飞了!

黯泉
2026-03-29 20:11:11
伊朗伊斯兰革命卫队称美以大学将成“合法袭击目标”

伊朗伊斯兰革命卫队称美以大学将成“合法袭击目标”

新京报
2026-03-29 07:26:06
体检都出毛病了,连马拉松参赛资格都被取消,当事人硬是不信邪。

体检都出毛病了,连马拉松参赛资格都被取消,当事人硬是不信邪。

岁月有情1314
2026-03-29 08:19:26
公司不敢明说:45岁以上的员工,其实是最难辞退的

公司不敢明说:45岁以上的员工,其实是最难辞退的

中国民航人
2026-03-28 19:46:35
定了!公安部正式官宣,6月1日起全国推行10项便民新措施

定了!公安部正式官宣,6月1日起全国推行10项便民新措施

混沌录
2026-03-28 20:14:21
4万股民懵了!002538突遭ST,明起停牌

4万股民懵了!002538突遭ST,明起停牌

大众证券报
2026-03-29 11:34:12
打不过就道德绑架!以色列一市长痛哭怒斥战争,丝毫没有悔过之意

打不过就道德绑架!以色列一市长痛哭怒斥战争,丝毫没有悔过之意

沧海旅行家
2026-03-27 15:07:47
大陆放话:不管台湾当局点不点头,厦金大桥照建不误,直达金门

大陆放话:不管台湾当局点不点头,厦金大桥照建不误,直达金门

汪镛的创业之路
2026-03-28 10:24:01
印尼0-7惨败,中国队确定出线,携手日本队晋级

印尼0-7惨败,中国队确定出线,携手日本队晋级

体育一点就通
2026-03-29 14:20:31
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
国际观察|胡塞武装“扣动扳机”,伊朗摊牌了吗

国际观察|胡塞武装“扣动扳机”,伊朗摊牌了吗

新华社
2026-03-28 21:49:36
广东大龄光棍老李相亲遇奇葩,女方带3娃上门赖着不走,要他接盘

广东大龄光棍老李相亲遇奇葩,女方带3娃上门赖着不走,要他接盘

捣蛋窝
2026-03-29 17:27:49
黄仁勋最新惊人观点:英语专业将血洗计算机,文科成AI时代新贵族

黄仁勋最新惊人观点:英语专业将血洗计算机,文科成AI时代新贵族

南宗历史
2026-03-28 19:31:50
沙特油轮绕开霍尔木兹抵达日本:世界油阀,被一脚踹开了!

沙特油轮绕开霍尔木兹抵达日本:世界油阀,被一脚踹开了!

老马拉车莫少装
2026-03-29 11:19:25
中年男人无妻是啥体验?网友:没钱苦一辈子,跟结婚不结婚没关系

中年男人无妻是啥体验?网友:没钱苦一辈子,跟结婚不结婚没关系

带你感受人间冷暖
2026-03-28 17:20:05
为什么要加入CPTPP?啃不下这6块硬骨头,未来中国可能会很难!

为什么要加入CPTPP?啃不下这6块硬骨头,未来中国可能会很难!

世界圈
2026-03-28 12:25:46
2026-03-29 22:16:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2670312文章数 6229关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

动车被困隧道内停车断电4个小时 乘客:有人紧张晕倒

头条要闻

动车被困隧道内停车断电4个小时 乘客:有人紧张晕倒

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

张凌赫事件持续升级!官方点名怒批

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

本地
房产
手机
健康
军事航空

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

手机要闻

旧手机回收价暴涨五六倍引关注,央视揭秘涨价背后主要原因

干细胞抗衰4大误区,90%的人都中招

军事要闻

美两栖攻击舰载3500名增援到达

无障碍浏览 进入关怀版