被称为“AI 教父”之一的杨立昆,最近说了一个很可怕的预测,他认为:AI泡沫的破裂没有想象中那么远,它随时可能爆。这个推论,也适用于中国AI产业。
他的观点也很通透——泡沫并不是AI没有价值,而是太有价值了。但如果AI的需求无法用足够低的算力成本支撑,那很多公司的营收也就无法达到预期,就会出市值崩塌,进而引发泡沫。
所以,这篇文章真正想追问的,不是智谱和 Kimi 谁更聪明,也不是 DeepSeek 的路子是不是更高明,而是一个更现实的问题:当所有人都在排队等 Token 的时候,中国能不能为自己的AI供应链,建起一套自由、充沛、能持续降价的产能兜底。
如果我们在算力大爆炸到来时拥有足够多、足够便宜的Token产能,那么,今天的限购,只是黎明前的拥挤。如果建不起这条链,被算力逼出来的,就不再是某一种产品性格——而是一场泡沫,以及它炸开的那一声。
——导语
01
AI泡沫,并非遥不可及
被称为“AI 教父”之一的杨立昆,最近说了一个很可怕的预测,他认为:AI泡沫的破裂没有想象中那么远,它随时可能爆。这个推论,也适用于中国AI产业。
6 月 18 日的 CNBC 访谈里,他算的是极其简明的一笔经济账:高端AI产品的价格虽然一直在涨,可运行它们的Token成本降得太慢了,慢到几乎所有公司都在用投资人的钱在替用户买单。
他的推论很简单,如果Token的成本账本始终无法改善,那超级估值-超级市值-收入快速增加的闭环就走不通,如果整个行业都陷入这种死循环,都在证明最前沿的AI换不来足够的收入,泡沫就会“撑不了多久”。
这并非危言耸听。
马斯克的 xAI,和 SpaceX 合并后估值冲到 2 万亿美元,一个季度却亏掉 25 亿,收入才 8 亿出头;做 Claude 的 Anthropic 每月掏 12.5 亿美元,租马斯克的卡来跑自己的模型;连一向嘴硬的 OpenAI,奥尔特曼也松了口,承认成本如今是“一个巨大的问题”。
这本是互联网时代的老套路——拿投资人的钱补贴用户,先把规模冲上天,再寻找商业化变现机会,找不到,泡沫就会破。而AI 这局赌得更大:所有人都押注推理的成本会一路降下去,降到某天能跑赢烧掉的速度。如果赌赢了,AI的新时代就来了;如果赌输了,和互联网泡沫后是同一种一地鸡毛。
关键就在有足够又便宜的Token产能,但眼下,中国AI似乎已经撞上了这道算力产能墙。
这个 6 月,中国最强的几款编程大模型扎堆问世:13 日智谱开源 GLM-5.2,代码能力一度全球第二、只输给 Claude;Kimi 端出专攻编程的 K2.7 Code,MiniMax 甩出主打智能体的 M3。可几乎同时,这几家公司在干一件正相反的事——拦着你别买。
现在,智谱的套餐天天得抢、一年涨三次价;Kimi、MiniMax 的接口接连过载,开发者排着队“等 Token”;巨头们的情况略好,但高端线同样算力吃紧,多次对用户发出预警信息。
最该以无限供给的形式去支撑未来市值的东西,变成了经济匮乏时代的“凭票供应”,这本身很讽刺。
但警报信号是真实且明确的——如果一个卖数字产品的公司开始限制购买,等于承认它卖的早已不是能无限复制的软件,而是一种有产能上限的工业品,这是中国 AI 产能池底发出的第一声警报。
更严重的是,如果运行成本要是始终降不下来,等在这声警报后面的,就不再是限购——是杨立昆说的那场泡沫,和它炸开的那一声。
02
股东金主为什么也靠不住了?
眼下这场算力荒,不是豆包那种 C 端日活烧出来的。真正把需求顶上天的,是今年中国大模型乃至全球大模型集体押注的 AI 编程和智能体调度框架。
聊天再贫,一次也就几万个 Token;一个编程智能体却要啃下整个代码库,反复跑命令、改文件、自检——MiniMax 演示 M3 时让它独立复现一篇论文,自主跑了将近 12 个小时。这类任务吃 Token 的胃口,是聊天的几十上百倍。
![]()
于是, MiniMax 发布 M3 的同一天,干脆把用了多年的包月计费改成按 Token 计费,重度用户实测成本涨了一两倍。
美国的业者算出的比例更极致——一个开发者计算自己使用Claude、ChatGPT的200美金套餐烧掉的Token,最后得出了2048美元这个精确的十倍数字。
“几十块钱包月随便跑”的好日子,目前看来已经一去不复返。而且,这不会是它一家要这么做——可无限复制的软件的定价逻辑已经被认为不适合AI,它正被基于产能的定价逻辑取代,往后这将是行业通例。
按理说,这些公司不该缺算力。智谱背后站着腾讯、阿里、蚂蚁、美团、小米;Kimi 的最大股东是阿里,占股四成,腾讯也跟投了。按理说,抱着这样有庞大云计算资源的金主,限购怎么也不该轮到它们。
问题是,金主自己也没余粮。
2026 年的算力荒不是某个零件断货,而是芯片、存储、封装、网络、数据中心整条链一起见底,这种紧张,业内判断至少还要紧两年。
一位 ICT 厂商的人士说得很直白:从前两百万能买八台 GPU 服务器,现在只够买四五台,厂商宁可毁约也不交货。
于是,3 月,腾讯云率先给自家混元的部分产品涨价、个别飙到四倍,阿里云、百度云几小时内跟进。连有厚实的AI云业务底座的大模型公司都缺货——这才是当前中国 AI 产能的基本面。
当然,价格这件事,倒不是一边倒地涨。DeepSeek 把 V4-Pro 的接口永久降到原价的四分之一,小米 MiMo 跟着砍掉九成,腾讯云干脆把自家平台上托管的 DeepSeek 一刀劈掉九成七——缓存命中的调用价压到每百万 token 两分五,比打一通电话还便宜。
这听起来和“产能缺乏”似乎很矛盾,但实则和限购困局并不矛盾,而是同一场短缺的两头:降价的是 DeepSeek、小米这些效率派,靠把缓存和稀疏架构榨到极致,把廉价档的成本真摁了下来;涨价限购的是智谱那种紧俏的编程高端档,越能干活越供不应求。连腾讯都在两头下注——涨自己的混元,贴别人的 DeepSeek。价格不是齐涨齐跌,是在按档位分化。
更有张力的是,初创模型公司和资本金主的默契,发生了微妙的变化。
互联网巨头属性的金主当初投这些模型公司,尤其是那些自己也做 AI 的巨头,本就揣着两个心思:技术上押个外部团队,给自研加道保险绳;商业上用资本绑一个长期客户——你拿了我的钱,转头来买我的算力,我出钱又收回算力收入,看着两全其美。
可算力一旦变稀缺,这个本该是 VIP 的被投客户,就尝到了绑定的另一面:已经有云巨头公开放话,要把紧缺算力优先留给自家的高价值业务,被投的创业公司,往后排。说穿了,你的房东、你的债主、和你的对手,常常是同一个人。
于是接口照样过载,套餐照样限购,钱却一分不少烧。据招股书口径,智谱七成研发投入花在买算力上,三年半亏掉六十二亿;MiniMax 同样七成研发买算力,三年半亏约九十二亿,它跟阿里云的年度采购上限还在逐年往上抬。
这说明,绑定换不来优先级已是共识。剩下的只是一道无解难题:产能就这么多,谁掏得起、扛得住,谁活下去。
被逼到这份上,一个新思路出现了:金主既然靠不住,能不能靠自己?
03
觉醒者
模型公司和投资人之间,本是一桩你情我愿的默契:你投钱进来,我拿钱买你的算力,我得算力,你得利润,各取所需,看着很美。可金主的池子一旦不够深,这默契就兜不住。模型公司只能从这场看似双赢的美梦里惊醒,自己找活路。
能走的路就两条:把效率抠到极致,和拥抱国产产能。
前者,下一节再说,先说适配国产芯片——这条路上,大方向其实一致。智谱把 GLM-5 的训练集群交给华为昇腾,由神州数码用昇腾加鲲泰的服务器独家交付,又把年初的 GLM-Image 做成第一个全程在国产芯片上训出来的顶级多模态模型。
DeepSeek 走得更远。4 月发布的 V4,不惜拖期也要在华为昇腾首发,底层代码从英伟达的 CUDA 整个重写为华为的 CANN,目的就是在释放产能可控的信号。
![]()
智谱适配昇腾,和 DeepSeek 适配昇腾,本质是一回事。可再往前一步,两家就分了岔。
智谱仍把算力的源头托给云厂和股东;DeepSeek 却开始直奔上游:一边放风短期不追盈利,一边疯了似的招聘数据中心建设和管理人才,这种做法直指自建吉瓦级的算力基地。
最见性格的是 6 月那轮首轮融资——创始人梁文锋自掏约两百亿当最大出资方,把投资人挡在董事会门外。我认为,他这么决绝,要的就是希望这个激进计划别被股东拉扯。因为这条路一旦走通了,它会是中国第一家自建庞大算力基建的纯模型公司,在初创和巨头之外趟出第三条路。
可惜,醒了是一回事,走得通是另一回事,这一切都压在国产硬件这个底座上——它到底有多硬?
只看市场份额,确实提气:2025 年国产 AI 芯片在国内的出货份额已经爬到四成,华为出货第一、占了近一半,寒武纪营收一年翻了二十多倍。
但把镜头推近,没那么好看。论单颗高端芯片,英伟达旗舰在多项指标上仍是华为昇腾的四到六倍;华为得把上百颗芯片用光模块全互联堆成超节点,才在集群层面追平甚至反超,代价是接近四倍的功耗。
国产硬件如今交出的是“能跑”的平替,离性能更优、让人主动掏钱的优替,还差一大截。何况整个盘子还供不应求——觉醒者认清了方向,可这条拥抱国产产能的路,本身就卡在产能上。
04
被算力荒改变的产品性格
自建基础设施,持续往上游走,是远水。而眼前的近渴,只能靠把效率用软硬件协同的工程化能力提上去。某种意义上,算力一不自由,最先变的,是一家公司的产品性格。
Kimi 的答案,是把效率抠进架构。
它的推理跑在一套叫 Mooncake 的架构上——以缓存为中心,把“预填充”和“解码”两个阶段拆开分别调度,再把算过的 KV 缓存在整个集群里池化、复用,让同一批 GPU 多服务出几成的请求。核心环节,它依然深度绑定阿里云,用弹性的算力组合把任务稳定性和利用率顶上去,又自研安全网关,省掉自建机房的重负担。
为此,月之暗面创始人杨植麟常把一个词挂在嘴边——Token 效率,还把团队那套让学习效率翻倍的 MUON 优化器摆出来作证。他的确很清醒——竞争的胜负手,早从堆资源挪到了推理系统的效率本身。
智谱的答案,是把效率直接做成能卖的产品,工程上近乎暴力。它的高速推理引擎 TileRT,在编译期就把整张计算图静态编排成一个常驻 GPU 的内核,把旗舰模型的吐字顶到每秒约 400 个 Token;它和清华合做的 ZCube 网络架构,不加一块 GPU、不改一行代码,就把同一批硬件的推理吞吐提了一成半、把网络设备的钱省下三分之一、首字响应的尾延迟压低四成;它的 GLM-5 集成了一套稀疏注意力,在保住百万级上下文的同时把推理成本摁下去。这些省出来的本事,它打包成能直接搬进客户机房的私有化设备,卖给政企。
两家抠的地方不同,指的是同一件事:中国头部公司,早已不只在比模型谁更聪明,而是在比单位 Token 的生产效率。
稀缺逼出了新技术,是好事。我认为,这可能是中国公司会持续走的一条路,但这并非全局最优解,死抠效率是有一定性能代价的,而绝非毫无代价——一种被约束逼出来的优点,终究带着约束的胎记。
05
美国也有两条路,但美国有底
把目光挪到太平洋对岸,美国的前沿公司,也基本不自己盖机房。所以,DeePSeek这次,抄的绝不是美国的作业。
OpenAI 干的是攒局的活。它的 Stargate 计划,四年五千亿美元、十吉瓦,机房由甲骨文、软银这些伙伴出钱建,建好了专供 OpenAI;微软继续供云,甲骨文、CoreWeave 并行,它自己还拉上博通设计专属芯片。它要的不是有一个金主,是让一群供应商、融资方、电力商,全都围着它的产能需求转。这是一种强控制型的基础设施联盟。
Anthropic 走的是多云、多伙伴、多份长约。它绑定亚马逊云为主要训练伙伴,那座专给它训 Claude、塞了一百多万颗芯片的超级集群,产权在亚马逊手里、算力却为它独留;它一边跟亚马逊签十年超千亿美元、最高五吉瓦,一边跟谷歌签数百亿美元、想买下足足一百万颗 TPU,它甚至不惜每月掏 12.5 亿去租马斯克闲着的卡。最后的结果是,它可以横跨多种芯片、不跟任何一家云公司签排他协议,这样才可以把模型权重和定价牢牢攥在手里。这是一种多伙伴的合同型算力池。
![]()
两条路看着不同,前提只有一个: AI 产业链最值钱的那截——先进芯片、成熟云平台、自研加速器、能撬动千亿融资的数据中心、能采购的电力、覆盖全球的客户——大多落在本土或盟友体系里。所以美国公司操心的从来不是有没有算力,而是算力天花板能抬多高:联盟越搭越大,天花板就一路往上顶。目前,这道天花板比中国公司的高太多。
虽然,中国公司也能抱金主,也能合纵连横。但关键差别在于,它们抱住的那条腿,自己也站在同一条受限的供应链里排队。
06
真正的窄门:会不会烧成泡沫?
需求那头的故事,已经讲得够了——智能体一爆发,Token 消耗每两周翻一倍;按 IDC 的预测,到 2030 年,全球年度 Token 消耗会比 2025 年涨超过三亿倍。几乎每篇乐观文章都在算同一笔账:中国未来每天烧多少 Token,仿佛烧得越多就越繁荣。
可很少有人回头问一句:这些 Token 谁来生产?用什么芯片?在哪个机房?谁付电费?当编程智能体占了一半的生产力场景,谁来保证服务不会突然限流、排队、涨价?
Token 消耗是需求侧的繁荣,产能池底是供给侧的现实——只盯前者,是一种虚假的繁荣。真正的关键词从来不是“算力”,而是“产能”:芯片、显存、互联、电力、机房、调度、价格机制,是这一整套东西,才能把智能持续地、而且越来越便宜地生产出来。
绕了一圈,又回到杨立昆那句判断——限购也好,省卡也好,拥抱国产产能也好,说到底都是在一个赛道里赛跑:成本能不能跑在钱烧光之前降下来。
降成本太重要了,对于今年的中国大模型市场来说,无论是抬高前沿模型的价格,还是通过降价让便宜够用的模型去抢市场,本质上仍然考验一件事——无论是价格台上天,还是把价格砸到地板,只要公司还在失血,就显示出泡沫破裂并不是乐观者认为的呓语。
这道南墙,中国撞得最早、也最痛。别人是在算力充裕里抠成本,中国是在算力稀缺里抠成本。时间和短缺这两件事,对中国AI行业都更不友好。但如果这题要是解不开,崩掉的就不只是一两家公司的市值,而是支撑整轮 AI 的那个循环——用户用着投资人的钱补贴的服务,投资人等着成本下降来兑现回报——那个下降一旦迟迟不来,循环就会整个塌下去。到那天,所谓的繁荣,不过是又一片更贵的单车坟场。
所以这篇文章真正想追问的,不是智谱和 Kimi 谁更聪明,也不是 DeepSeek 的路子是不是更高明,而是一个更现实的问题:当所有人都在排队等 Token 的时候,中国能不能为自己的智能,建起一套自由、充沛、能持续降价的产能兜底。
建得起,今天的限购,只是黎明前的拥挤。建不起,被算力逼出来的,就不再是某一种产品性格——而是一场泡沫,以及它炸开的那一声。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.