算力荒，会把中国 AI 烧成一场泡沫吗？|gpu|新模型

分享至

被称为“AI 教父”之一的杨立昆，最近说了一个很可怕的预测，他认为：AI泡沫的破裂没有想象中那么远，它随时可能爆。这个推论，也适用于中国AI产业。

他的观点也很通透——泡沫并不是AI没有价值，而是太有价值了。但如果AI的需求无法用足够低的算力成本支撑，那很多公司的营收也就无法达到预期，就会出市值崩塌，进而引发泡沫。

所以，这篇文章真正想追问的，不是智谱和 Kimi 谁更聪明，也不是 DeepSeek 的路子是不是更高明，而是一个更现实的问题：当所有人都在排队等 Token 的时候，中国能不能为自己的AI供应链，建起一套自由、充沛、能持续降价的产能兜底。

如果我们在算力大爆炸到来时拥有足够多、足够便宜的Token产能，那么，今天的限购，只是黎明前的拥挤。如果建不起这条链，被算力逼出来的，就不再是某一种产品性格——而是一场泡沫，以及它炸开的那一声。

——导语

AI泡沫，并非遥不可及

6 月 18 日的 CNBC 访谈里，他算的是极其简明的一笔经济账：高端AI产品的价格虽然一直在涨，可运行它们的Token成本降得太慢了，慢到几乎所有公司都在用投资人的钱在替用户买单。

他的推论很简单，如果Token的成本账本始终无法改善，那超级估值-超级市值-收入快速增加的闭环就走不通，如果整个行业都陷入这种死循环，都在证明最前沿的AI换不来足够的收入，泡沫就会“撑不了多久”。

这并非危言耸听。

马斯克的 xAI，和 SpaceX 合并后估值冲到 2 万亿美元，一个季度却亏掉 25 亿，收入才 8 亿出头；做 Claude 的 Anthropic 每月掏 12.5 亿美元，租马斯克的卡来跑自己的模型；连一向嘴硬的 OpenAI，奥尔特曼也松了口，承认成本如今是“一个巨大的问题”。

这本是互联网时代的老套路——拿投资人的钱补贴用户，先把规模冲上天，再寻找商业化变现机会，找不到，泡沫就会破。而AI 这局赌得更大：所有人都押注推理的成本会一路降下去，降到某天能跑赢烧掉的速度。如果赌赢了，AI的新时代就来了；如果赌输了，和互联网泡沫后是同一种一地鸡毛。

关键就在有足够又便宜的Token产能，但眼下，中国AI似乎已经撞上了这道算力产能墙。

这个 6 月，中国最强的几款编程大模型扎堆问世：13 日智谱开源 GLM-5.2，代码能力一度全球第二、只输给 Claude；Kimi 端出专攻编程的 K2.7 Code，MiniMax 甩出主打智能体的 M3。可几乎同时，这几家公司在干一件正相反的事——拦着你别买。

现在，智谱的套餐天天得抢、一年涨三次价；Kimi、MiniMax 的接口接连过载，开发者排着队“等 Token”；巨头们的情况略好，但高端线同样算力吃紧，多次对用户发出预警信息。

最该以无限供给的形式去支撑未来市值的东西，变成了经济匮乏时代的“凭票供应”，这本身很讽刺。

但警报信号是真实且明确的——如果一个卖数字产品的公司开始限制购买，等于承认它卖的早已不是能无限复制的软件，而是一种有产能上限的工业品，这是中国 AI 产能池底发出的第一声警报。

更严重的是，如果运行成本要是始终降不下来，等在这声警报后面的，就不再是限购——是杨立昆说的那场泡沫，和它炸开的那一声。

股东金主为什么也靠不住了？

眼下这场算力荒，不是豆包那种 C 端日活烧出来的。真正把需求顶上天的，是今年中国大模型乃至全球大模型集体押注的 AI 编程和智能体调度框架。

聊天再贫，一次也就几万个 Token；一个编程智能体却要啃下整个代码库，反复跑命令、改文件、自检——MiniMax 演示 M3 时让它独立复现一篇论文，自主跑了将近 12 个小时。这类任务吃 Token 的胃口，是聊天的几十上百倍。

于是， MiniMax 发布 M3 的同一天，干脆把用了多年的包月计费改成按 Token 计费，重度用户实测成本涨了一两倍。

美国的业者算出的比例更极致——一个开发者计算自己使用Claude、ChatGPT的200美金套餐烧掉的Token，最后得出了2048美元这个精确的十倍数字。

“几十块钱包月随便跑”的好日子，目前看来已经一去不复返。而且，这不会是它一家要这么做——可无限复制的软件的定价逻辑已经被认为不适合AI，它正被基于产能的定价逻辑取代，往后这将是行业通例。

按理说，这些公司不该缺算力。智谱背后站着腾讯、阿里、蚂蚁、美团、小米；Kimi 的最大股东是阿里，占股四成，腾讯也跟投了。按理说，抱着这样有庞大云计算资源的金主，限购怎么也不该轮到它们。

问题是，金主自己也没余粮。

2026 年的算力荒不是某个零件断货，而是芯片、存储、封装、网络、数据中心整条链一起见底，这种紧张，业内判断至少还要紧两年。

一位 ICT 厂商的人士说得很直白：从前两百万能买八台 GPU 服务器，现在只够买四五台，厂商宁可毁约也不交货。

于是，3 月，腾讯云率先给自家混元的部分产品涨价、个别飙到四倍，阿里云、百度云几小时内跟进。连有厚实的AI云业务底座的大模型公司都缺货——这才是当前中国 AI 产能的基本面。

当然，价格这件事，倒不是一边倒地涨。DeepSeek 把 V4-Pro 的接口永久降到原价的四分之一，小米 MiMo 跟着砍掉九成，腾讯云干脆把自家平台上托管的 DeepSeek 一刀劈掉九成七——缓存命中的调用价压到每百万 token 两分五，比打一通电话还便宜。

这听起来和“产能缺乏”似乎很矛盾，但实则和限购困局并不矛盾，而是同一场短缺的两头：降价的是 DeepSeek、小米这些效率派，靠把缓存和稀疏架构榨到极致，把廉价档的成本真摁了下来；涨价限购的是智谱那种紧俏的编程高端档，越能干活越供不应求。连腾讯都在两头下注——涨自己的混元，贴别人的 DeepSeek。价格不是齐涨齐跌，是在按档位分化。

更有张力的是，初创模型公司和资本金主的默契，发生了微妙的变化。

互联网巨头属性的金主当初投这些模型公司，尤其是那些自己也做 AI 的巨头，本就揣着两个心思：技术上押个外部团队，给自研加道保险绳；商业上用资本绑一个长期客户——你拿了我的钱，转头来买我的算力，我出钱又收回算力收入，看着两全其美。

可算力一旦变稀缺，这个本该是 VIP 的被投客户，就尝到了绑定的另一面：已经有云巨头公开放话，要把紧缺算力优先留给自家的高价值业务，被投的创业公司，往后排。说穿了，你的房东、你的债主、和你的对手，常常是同一个人。

于是接口照样过载，套餐照样限购，钱却一分不少烧。据招股书口径，智谱七成研发投入花在买算力上，三年半亏掉六十二亿；MiniMax 同样七成研发买算力，三年半亏约九十二亿，它跟阿里云的年度采购上限还在逐年往上抬。

这说明，绑定换不来优先级已是共识。剩下的只是一道无解难题：产能就这么多，谁掏得起、扛得住，谁活下去。

被逼到这份上，一个新思路出现了：金主既然靠不住，能不能靠自己？

觉醒者

模型公司和投资人之间，本是一桩你情我愿的默契：你投钱进来，我拿钱买你的算力，我得算力，你得利润，各取所需，看着很美。可金主的池子一旦不够深，这默契就兜不住。模型公司只能从这场看似双赢的美梦里惊醒，自己找活路。

能走的路就两条：把效率抠到极致，和拥抱国产产能。

前者，下一节再说，先说适配国产芯片——这条路上，大方向其实一致。智谱把 GLM-5 的训练集群交给华为昇腾，由神州数码用昇腾加鲲泰的服务器独家交付，又把年初的 GLM-Image 做成第一个全程在国产芯片上训出来的顶级多模态模型。

DeepSeek 走得更远。4 月发布的 V4，不惜拖期也要在华为昇腾首发，底层代码从英伟达的 CUDA 整个重写为华为的 CANN，目的就是在释放产能可控的信号。

智谱适配昇腾，和 DeepSeek 适配昇腾，本质是一回事。可再往前一步，两家就分了岔。

智谱仍把算力的源头托给云厂和股东；DeepSeek 却开始直奔上游：一边放风短期不追盈利，一边疯了似的招聘数据中心建设和管理人才，这种做法直指自建吉瓦级的算力基地。

最见性格的是 6 月那轮首轮融资——创始人梁文锋自掏约两百亿当最大出资方，把投资人挡在董事会门外。我认为，他这么决绝，要的就是希望这个激进计划别被股东拉扯。因为这条路一旦走通了，它会是中国第一家自建庞大算力基建的纯模型公司，在初创和巨头之外趟出第三条路。

可惜，醒了是一回事，走得通是另一回事，这一切都压在国产硬件这个底座上——它到底有多硬？

只看市场份额，确实提气：2025 年国产 AI 芯片在国内的出货份额已经爬到四成，华为出货第一、占了近一半，寒武纪营收一年翻了二十多倍。

但把镜头推近，没那么好看。论单颗高端芯片，英伟达旗舰在多项指标上仍是华为昇腾的四到六倍；华为得把上百颗芯片用光模块全互联堆成超节点，才在集群层面追平甚至反超，代价是接近四倍的功耗。

国产硬件如今交出的是“能跑”的平替，离性能更优、让人主动掏钱的优替，还差一大截。何况整个盘子还供不应求——觉醒者认清了方向，可这条拥抱国产产能的路，本身就卡在产能上。

被算力荒改变的产品性格

自建基础设施，持续往上游走，是远水。而眼前的近渴，只能靠把效率用软硬件协同的工程化能力提上去。某种意义上，算力一不自由，最先变的，是一家公司的产品性格。

Kimi 的答案，是把效率抠进架构。

它的推理跑在一套叫 Mooncake 的架构上——以缓存为中心，把“预填充”和“解码”两个阶段拆开分别调度，再把算过的 KV 缓存在整个集群里池化、复用，让同一批 GPU 多服务出几成的请求。核心环节，它依然深度绑定阿里云，用弹性的算力组合把任务稳定性和利用率顶上去，又自研安全网关，省掉自建机房的重负担。

为此，月之暗面创始人杨植麟常把一个词挂在嘴边——Token 效率，还把团队那套让学习效率翻倍的 MUON 优化器摆出来作证。他的确很清醒——竞争的胜负手，早从堆资源挪到了推理系统的效率本身。

智谱的答案，是把效率直接做成能卖的产品，工程上近乎暴力。它的高速推理引擎 TileRT，在编译期就把整张计算图静态编排成一个常驻 GPU 的内核，把旗舰模型的吐字顶到每秒约 400 个 Token；它和清华合做的 ZCube 网络架构，不加一块 GPU、不改一行代码，就把同一批硬件的推理吞吐提了一成半、把网络设备的钱省下三分之一、首字响应的尾延迟压低四成；它的 GLM-5 集成了一套稀疏注意力，在保住百万级上下文的同时把推理成本摁下去。这些省出来的本事，它打包成能直接搬进客户机房的私有化设备，卖给政企。

两家抠的地方不同，指的是同一件事：中国头部公司，早已不只在比模型谁更聪明，而是在比单位 Token 的生产效率。

稀缺逼出了新技术，是好事。我认为，这可能是中国公司会持续走的一条路，但这并非全局最优解，死抠效率是有一定性能代价的，而绝非毫无代价——一种被约束逼出来的优点，终究带着约束的胎记。

美国也有两条路，但美国有底

把目光挪到太平洋对岸，美国的前沿公司，也基本不自己盖机房。所以，DeePSeek这次，抄的绝不是美国的作业。

OpenAI 干的是攒局的活。它的 Stargate 计划，四年五千亿美元、十吉瓦，机房由甲骨文、软银这些伙伴出钱建，建好了专供 OpenAI；微软继续供云，甲骨文、CoreWeave 并行，它自己还拉上博通设计专属芯片。它要的不是有一个金主，是让一群供应商、融资方、电力商，全都围着它的产能需求转。这是一种强控制型的基础设施联盟。

Anthropic 走的是多云、多伙伴、多份长约。它绑定亚马逊云为主要训练伙伴，那座专给它训 Claude、塞了一百多万颗芯片的超级集群，产权在亚马逊手里、算力却为它独留；它一边跟亚马逊签十年超千亿美元、最高五吉瓦，一边跟谷歌签数百亿美元、想买下足足一百万颗 TPU，它甚至不惜每月掏 12.5 亿去租马斯克闲着的卡。最后的结果是，它可以横跨多种芯片、不跟任何一家云公司签排他协议，这样才可以把模型权重和定价牢牢攥在手里。这是一种多伙伴的合同型算力池。

两条路看着不同，前提只有一个： AI 产业链最值钱的那截——先进芯片、成熟云平台、自研加速器、能撬动千亿融资的数据中心、能采购的电力、覆盖全球的客户——大多落在本土或盟友体系里。所以美国公司操心的从来不是有没有算力，而是算力天花板能抬多高：联盟越搭越大，天花板就一路往上顶。目前，这道天花板比中国公司的高太多。

虽然，中国公司也能抱金主，也能合纵连横。但关键差别在于，它们抱住的那条腿，自己也站在同一条受限的供应链里排队。

真正的窄门：会不会烧成泡沫？

需求那头的故事，已经讲得够了——智能体一爆发，Token 消耗每两周翻一倍；按 IDC 的预测，到 2030 年，全球年度 Token 消耗会比 2025 年涨超过三亿倍。几乎每篇乐观文章都在算同一笔账：中国未来每天烧多少 Token，仿佛烧得越多就越繁荣。

可很少有人回头问一句：这些 Token 谁来生产？用什么芯片？在哪个机房？谁付电费？当编程智能体占了一半的生产力场景，谁来保证服务不会突然限流、排队、涨价？

Token 消耗是需求侧的繁荣，产能池底是供给侧的现实——只盯前者，是一种虚假的繁荣。真正的关键词从来不是“算力”，而是“产能”：芯片、显存、互联、电力、机房、调度、价格机制，是这一整套东西，才能把智能持续地、而且越来越便宜地生产出来。

绕了一圈，又回到杨立昆那句判断——限购也好，省卡也好，拥抱国产产能也好，说到底都是在一个赛道里赛跑：成本能不能跑在钱烧光之前降下来。

降成本太重要了，对于今年的中国大模型市场来说，无论是抬高前沿模型的价格，还是通过降价让便宜够用的模型去抢市场，本质上仍然考验一件事——无论是价格台上天，还是把价格砸到地板，只要公司还在失血，就显示出泡沫破裂并不是乐观者认为的呓语。

这道南墙，中国撞得最早、也最痛。别人是在算力充裕里抠成本，中国是在算力稀缺里抠成本。时间和短缺这两件事，对中国AI行业都更不友好。但如果这题要是解不开，崩掉的就不只是一两家公司的市值，而是支撑整轮 AI 的那个循环——用户用着投资人的钱补贴的服务，投资人等着成本下降来兑现回报——那个下降一旦迟迟不来，循环就会整个塌下去。到那天，所谓的繁荣，不过是又一片更贵的单车坟场。

所以这篇文章真正想追问的，不是智谱和 Kimi 谁更聪明，也不是 DeepSeek 的路子是不是更高明，而是一个更现实的问题：当所有人都在排队等 Token 的时候，中国能不能为自己的智能，建起一套自由、充沛、能持续降价的产能兜底。

建得起，今天的限购，只是黎明前的拥挤。建不起，被算力逼出来的，就不再是某一种产品性格——而是一场泡沫，以及它炸开的那一声。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.