微软本周砍掉了内部Claude Code授权,Uber四个月烧光2026全年AI预算,GitHub全线取消固定费率方案。三件事指向同一个信号:那个"AI功能随便用"的定价时代,正在快速终结。
业内喜欢用"AI补贴期结束"来形容这波转向。这个词听着体面,实则掩盖了一个集体误判——过去两年,几乎所有厂商都在赌一件事:推理成本会持续暴跌,低到足以支撑"AI功能塞进每一档订阅"的商业模式。
![]()
赌错了。
成本曲线没有向下,反而在抬头。实验室别无选择,只能把压力转嫁给下游。
第一层误判:只算单价,不算总量
每一代新模型,token成本理论上确实在降,有时候甚至10倍。但这里有个陷阱:这个"10倍"是针对同等质量的输出而言。
太多人拿这个数做线性外推,搭起了整套商业模型。这是典型的二阶思维缺失。
搞交通规划的人都知道"诱发需求"——高速公路每加宽一条车道,就会催生新的通勤需求。这些通勤原本不存在,是路修好了才出现的。AI一模一样。推理变便宜了,用户不会因此少花钱,而是会让模型干更多、更复杂的事。
作者举了自己的例子:现在的推理查询要4分钟以上,以前的只需要2分钟;Agentic工作流会发起50次调用,而旧流程只调1次。单位成本跌了,调用量爆炸,总账单反而更高。
所有卖"固定费率AI助手"的厂商,都假设用户行为不会变。变了。而且总是会变。
![]()
第二层误判:供应端不再配合
内存和GPU的经济学,正在全面逆转。
内存贵了4倍,GPU贵了95%以上。前沿训练和推理依赖英伟达加速器配高带宽内存(HBM),瓶颈不再是晶体管密度,而是HBM本身,以及把它和计算芯片封装在一起的先进工艺。
这个瓶颈深到只有一家工厂。台积电的CoWoS封装线是加速器供应的卡脖子环节。HBM市场由SK海力士主导,三星落后,美光更靠后。没有谁能一夜之间扩产——这些产能规划周期是18到36个月,而它们的规划基准,比实际需求低了一个数量级。
所以GPU定价就是稀缺定价。顶级加速器在同等集群规模下,比上一代贵约2倍;HBM价格在18个月内翻了4倍。电力和散热也成了真约束——以前没人算电费的地区,现在每个超大规模云厂商都在讲"千兆瓦园区"和"核电采购协议"的故事。
实验室的财务现实
Anthropic的CFO今年3月在证词中披露:公司花了100亿美元算力成本,收入50亿美元。实验室在推理业务上是亏本的。涨价是为了活下去。
那些把AI功能打包进固定订阅的厂商,现在正卡在中间:上游成本刚性上涨,下游用户用量失控,中间层的"无限量"承诺成了财务黑洞。微软、Uber、GitHub的动作只是开始——更多公司正在重新算账,调整定价结构。
这场调整的核心教训很简单:技术成本曲线的下降,从来不代表你的账单会下降。行为会适应,系统会反弹,而供应端的物理约束,不会因为你画了一张指数下降的PPT就消失。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.