网易首页 > 网易号 > 正文 申请入驻

一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?

0
分享至

看过 HBO 神剧《硅谷》(Silicon Valley)的朋友,想必都对那个名为 Pied Piper(魔笛手)的虚构公司念念不忘。

在剧中,男主角 Richard Hendricks 发明了一种「中间压缩算法」,能以极高的压缩率无损处理文件,甚至因此改写了整个互联网的规则。

当时我们都以为这只是编剧的脑洞。直到 Google Research 正式发布了名为 TurboQuant 的 AI 压缩算法。


这原本是一条枯燥的技术新闻,却在社交网络上引发了病毒式传播,不到 24 小时,就收获了 1280 万次浏览。原因无他,这项技术的设定简直就是 Pied Piper 的翻版:

在不损失模型性能的前提下,将 AI 的「工作记忆」压缩至少 6 倍。

市场的反应也极为真实,美股存储芯片板块盘中遭遇抛售,美光科技、闪迪等头部企业股价齐齐收跌。


这不禁让人好奇,一项纯软件层面的算法创新,为什么会让卖硬件的先慌了神,而Google 到底向当前的 AI 牌桌上扔了一张怎样的底牌?

困在「记忆黑洞」里的大模型

抛开网络热梗,TurboQuant 的出现其实不仅是为了好玩,更是为了解决一个让整个 AI 行业头疼已久的真实瓶颈。

众所周知,现在的 AI 模型越来越大,对显存的胃口也像无底洞一样。尤其是在推理阶段(也就是你和 AI 聊天的时候),AI 需要记住上下文信息,这部分数据被称为 KV Cache(键值缓存)。


每处理一个词,模型都要把它转成一个高维向量存进 GPU 显存。对话越长,这份「数字备忘录」膨胀越快,很快就把 GPU 显存塞满。这就是为什么你的 AI 助手聊久了会「变笨」或者直接报错,脑容量不够了。

更棘手的是,传统的压缩方法一直面临一个两难困境:压缩数据时,需要额外存储「量化常数」来告诉模型怎么解压。这些元数据听起来很小,加起来却能把压缩带来的收益全部抵消掉。

Google 的 TurboQuant 的诞生正是基于此。

研究人员设计了一套两阶段的数学解法。第一阶段叫 PolarQuant,把数据向量从传统的直角坐标系转换成极坐标系,拆分成「半径」(表示大小)和「角度」(表示方向)。

这个几何变换的妙处在于:转换后角度的分布变得高度可预测,模型不再需要为每个数据块单独存储昂贵的归一化常数,直接映射到固定的圆形网格上就行了,开销为零。


第二阶段叫 QJL(Quantized Johnson-Lindenstrauss 变换),充当数学层面的纠错器。它把压缩后残留的误差投影到低维空间,再把每个误差值压缩成一个符号位(+1 或 -1)。

这个设计保证了 AI 在计算「注意力分数」时,压缩版本的结果与高精度原版在统计意义上完全一致。所谓注意力分数,就是模型判断上下文里哪些词最重要的关键步骤。

如果说以前 AI 记笔记是「逐字逐句抄写」,那么 TurboQuant 就像发明了一套「极简速记符号」:该记的一个不漏,占的空间却少了六倍。

这套方法还有一个对企业来说格外友好的特性:无需重新训练模型。你现有的开源模型,或者自己微调过的模型,直接套上 TurboQuant 就能跑,不用额外的数据集,也不用重新跑一遍训练流程。

光说不练假把式,在「大海捞针」基准测试里,让 AI 从 10 万个词里找出一句藏好的话,TurboQuant 在 Llama-3.1-8B 和 Mistral-7B 上跑出了满分召回率,同时把 KV Cache 的显存占用压缩了至少 6 倍。


在 LongBench 综合评测套件(涵盖问答、代码生成、长文摘要)上,TurboQuant 全面追平甚至超过了此前的最强基线方法 KIVI。

最硬核的数字来自英伟达 H100 GPU 的实测:4 位精度的 TurboQuant 在计算注意力逻辑上的速度,比未压缩的 32 位方案快了整整 8 倍。


Google 的「DeepSeek 时刻」?

论文发布后的 24 小时内,社区已经开始动手验证。

Apple Silicon MLX 框架的知名开发者 @Prince_Canuma 把算法移植到了 Apple Silicon 的 MLX 框架,测试 Qwen3.5-35B 模型,上下文长度从 8500 到 64000 token 全覆盖,每个量化等级都跑出了 100% 的精确匹配。

他还发现,2.5 位的 TurboQuant 能把 KV Cache 压缩近 5 倍,准确率零损失。


对于 TurboQuant 的发布,Cloudflare CEO Matthew Prince 甚至将其称为 Google 的「DeepSeek 时刻」。


把时间拨回一年前,DeepSeek 以极低的成本训练出了性能惊人的模型,彻底打破了硅谷大厂对高成本才能训练出高性能 AI 的迷信。那次冲击也让整个行业意识到:光有大模型不够,还得跑得起、跑得快。

TurboQuant 也是这种背景下的产物。如果这项技术能从实验室走向大规模应用,它将带来肉眼可见的商业价值。

同样一张 H100,推理成本理论上可以直接打折超过 50%;端侧部署的门槛也会大幅降低,以前需要 32 位精度才能跑的大模型,放在 Mac Mini 或者本地服务器上也能运行,还不会有质量损耗。


市场的反应,已经很说明问题了。TurboQuant 发布当天,美股存储芯片板块盘中遭遇明显抛售。闪迪、美光科技等头部企业股价显著收跌,存储芯片与硬件供应链相关指数单日跌幅超过 2%。

究其原因,如果 AI 巨头能用一套纯软件算法把显存需求砍掉六分之五,那些押注 AI 会持续疯狂消耗高带宽显存的多头,就得重新盘算自己的仓位了。

而这种防御性反应背后,也表明,过去两年支撑存储股估值的核心逻辑之一,是 AI 对显存的需求只会越来越大。TurboQuant 第一次在技术层面正式动摇了这个假设。

当然,虽然听起来很美好,还是要泼一盆冷水。


一方面,历史上每次效率提升,往往反而带动了总需求增长,经济学里叫「杰文斯悖论」。AI 跑得更便宜,可能意味着更多人更频繁地用它,最终消耗的算力反而更多。所以这场「显存危机」到底会不会因此化解,还真不好说。

另一方面,TurboQuant 目前仍处于实验室阶段,根据最新消息,Google 计划在下个月的 ICLR 2026 大会上正式展示这项技术,届时还将同步亮相另一场顶会 AISTATS 2026。

但从论文到大规模生产部署,中间隔着工程适配、不同架构的兼容性测试、真实场景的性能验证,每一关都不轻松。


论文地址:https://arxiv.org/abs/2504.19874

有网友直接开炮,这篇论文的底层研究其实早在去年四月就已公开,根本谈不上横空出世,眼下的舆论热潮,多少有点追着旧闻起哄的意思。

在他看来,如果存储股因为一篇算法论文而大跌,恰恰暴露了市场里有多少人根本没搞清楚这件事的边界,并把这波反应比作「丰田出了新混动引擎,石油就该崩盘」。


更重要的是,TurboQuant 解决的只是推理(Inference)阶段的显存瓶颈,训练阶段的显存消耗依然是另一座大山。想从头训练一个主流量级的大模型,需要的算力资源依然是天文数字。

在《硅谷》里,Pied Piper 的压缩算法最终改变了整个互联网。而在现实中,TurboQuant 的野心没那么大,目标只是让 AI 在有限的物理空间里记得更多、算得更快、跑得更便宜。

现实终究不是好莱坞剧本,不必彻底改变互联网,能和 AI 聊得更长、不再半途报错,已经是很多人想要的了。

附上 TurboQuant 官方技术博客:

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我总领馆紧急提醒:实弹射击高风险!谨慎参与

我总领馆紧急提醒:实弹射击高风险!谨慎参与

看看新闻Knews
2026-04-04 21:27:06
他把冠军车定价4万,进口品牌集体失眠了

他把冠军车定价4万,进口品牌集体失眠了

固件更新中
2026-04-02 14:48:45
三毛自杀前最后公开照:在成都流浪,满脸都是愁容,眼神充满绝望

三毛自杀前最后公开照:在成都流浪,满脸都是愁容,眼神充满绝望

咸説历史
2026-03-12 21:46:50
唐鹤德近照曝光,67岁老了胖了有白头发了,皮肤粗糙,好朋友不多

唐鹤德近照曝光,67岁老了胖了有白头发了,皮肤粗糙,好朋友不多

小娱乐悠悠
2026-04-04 17:06:49
河北孟村"家暴致妻死亡"案被告人金昊已被执行死刑

河北孟村"家暴致妻死亡"案被告人金昊已被执行死刑

老猫观点
2026-04-04 09:21:31
陈光标到底是怎么发家的?他为什么有那么多钱可以捐?

陈光标到底是怎么发家的?他为什么有那么多钱可以捐?

担扑
2026-04-03 13:56:56
2-2!波尔图主场爆冷,本菲卡差8分,穆帅计划有变:葡超要争冠

2-2!波尔图主场爆冷,本菲卡差8分,穆帅计划有变:葡超要争冠

体育知多少
2026-04-05 08:42:38
中国资产成美以伊冲突“避风港, 人民币单日交易额破1.2万亿元

中国资产成美以伊冲突“避风港, 人民币单日交易额破1.2万亿元

每日经济新闻
2026-04-04 16:05:40
沧州杀妻案凶手金昊被执行死刑:多张内部照曝光,第三者被扒!

沧州杀妻案凶手金昊被执行死刑:多张内部照曝光,第三者被扒!

眼光很亮
2026-04-05 09:16:48
美军宣称摸清中国导弹库存!俄专家:中国解放军可以半小时定胜负

美军宣称摸清中国导弹库存!俄专家:中国解放军可以半小时定胜负

叹知
2026-04-05 05:22:04
美国前官员“痛心疾首”:从未想过美国会变成一个“流氓国家”!他曾为三位美国总统提供有关伊朗问题的建议

美国前官员“痛心疾首”:从未想过美国会变成一个“流氓国家”!他曾为三位美国总统提供有关伊朗问题的建议

扬子晚报
2026-04-05 09:48:10
18中12!恭喜中国男篮!又收获一名超跑型后卫

18中12!恭喜中国男篮!又收获一名超跑型后卫

篮球实战宝典
2026-04-04 22:48:36
黄晓明带9岁小海绵春日骑行,帅气发型超吸睛,父子同框满是温柔

黄晓明带9岁小海绵春日骑行,帅气发型超吸睛,父子同框满是温柔

精彩背后
2026-04-05 08:59:58
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
加征100%关税!特朗普疯狂了

加征100%关税!特朗普疯狂了

新浪财经
2026-04-04 17:39:51
国乒又出局1人!孙颖莎独守,王曼昱战日本独苗,王楚钦怼记者

国乒又出局1人!孙颖莎独守,王曼昱战日本独苗,王楚钦怼记者

曹说体育
2026-04-04 13:41:04
为什么领导在大领导面是前背手,在小领导面前是后背手?

为什么领导在大领导面是前背手,在小领导面前是后背手?

深度报
2026-04-03 21:40:01
老板娘问我她屁股大不大?我该怎么回答?

老板娘问我她屁股大不大?我该怎么回答?

太急张三疯
2026-04-05 08:29:01
“不是我的菜”!百亿私募董事长深夜改口,小米争议背后

“不是我的菜”!百亿私募董事长深夜改口,小米争议背后

穿透
2026-04-04 22:50:11
重磅!25岁中国冰壶女队队长拒绝参加世锦赛:我可能被封杀+退役

重磅!25岁中国冰壶女队队长拒绝参加世锦赛:我可能被封杀+退役

念洲
2026-04-04 11:25:29
2026-04-05 12:51:00
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6272文章数 26813关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

专家:美国对伊朗发动战争是本世纪最大战略失误之一

头条要闻

专家:美国对伊朗发动战争是本世纪最大战略失误之一

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

教育
本地
手机
亲子
公开课

教育要闻

博士扩招潮,来了

本地新闻

跟着歌声游安徽,听古村回响

手机要闻

大疆Osmo Pocket 4包装曝光:1英寸传感器、107GB内置存储

亲子要闻

这女孩不简单

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版