AI"无限订阅"正在崩塌：一场成本与行为的错配|内存|推理|hbm|新模型

AI"无限订阅"正在崩塌：一场成本与行为的错配

2026-05-23 00:15:13　来源: Ping值焦虑

北京举报

分享至

微软本周砍掉了内部Claude Code授权，Uber四个月烧光2026全年AI预算，GitHub全线取消固定费率方案。三件事指向同一个信号：那个"AI功能随便用"的定价时代，正在快速终结。

业内喜欢用"AI补贴期结束"来形容这波转向。这个词听着体面，实则掩盖了一个集体误判——过去两年，几乎所有厂商都在赌一件事：推理成本会持续暴跌，低到足以支撑"AI功能塞进每一档订阅"的商业模式。

赌错了。

成本曲线没有向下，反而在抬头。实验室别无选择，只能把压力转嫁给下游。

第一层误判：只算单价，不算总量

每一代新模型，token成本理论上确实在降，有时候甚至10倍。但这里有个陷阱：这个"10倍"是针对同等质量的输出而言。

太多人拿这个数做线性外推，搭起了整套商业模型。这是典型的二阶思维缺失。

搞交通规划的人都知道"诱发需求"——高速公路每加宽一条车道，就会催生新的通勤需求。这些通勤原本不存在，是路修好了才出现的。AI一模一样。推理变便宜了，用户不会因此少花钱，而是会让模型干更多、更复杂的事。

作者举了自己的例子：现在的推理查询要4分钟以上，以前的只需要2分钟；Agentic工作流会发起50次调用，而旧流程只调1次。单位成本跌了，调用量爆炸，总账单反而更高。

所有卖"固定费率AI助手"的厂商，都假设用户行为不会变。变了。而且总是会变。

第二层误判：供应端不再配合

内存和GPU的经济学，正在全面逆转。

内存贵了4倍，GPU贵了95%以上。前沿训练和推理依赖英伟达加速器配高带宽内存（HBM），瓶颈不再是晶体管密度，而是HBM本身，以及把它和计算芯片封装在一起的先进工艺。

这个瓶颈深到只有一家工厂。台积电的CoWoS封装线是加速器供应的卡脖子环节。HBM市场由SK海力士主导，三星落后，美光更靠后。没有谁能一夜之间扩产——这些产能规划周期是18到36个月，而它们的规划基准，比实际需求低了一个数量级。

所以GPU定价就是稀缺定价。顶级加速器在同等集群规模下，比上一代贵约2倍；HBM价格在18个月内翻了4倍。电力和散热也成了真约束——以前没人算电费的地区，现在每个超大规模云厂商都在讲"千兆瓦园区"和"核电采购协议"的故事。

实验室的财务现实

Anthropic的CFO今年3月在证词中披露：公司花了100亿美元算力成本，收入50亿美元。实验室在推理业务上是亏本的。涨价是为了活下去。

那些把AI功能打包进固定订阅的厂商，现在正卡在中间：上游成本刚性上涨，下游用户用量失控，中间层的"无限量"承诺成了财务黑洞。微软、Uber、GitHub的动作只是开始——更多公司正在重新算账，调整定价结构。

这场调整的核心教训很简单：技术成本曲线的下降，从来不代表你的账单会下降。行为会适应，系统会反弹，而供应端的物理约束，不会因为你画了一张指数下降的PPT就消失。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

汽车要闻

手机 / 数码

房产 / 家居

AI"无限订阅"正在崩塌：一场成本与行为的错配

爆炸声中又迈一步！拆解马斯克“十二飞”

媒体：针对两岸关系 郑丽文最新表态说了句很直白的话

媒体：针对两岸关系 郑丽文最新表态说了句很直白的话

少年意气，正在改变中国足球

《浪姐7》三公，王濛赢麻了，张月实惨

股价暴跌！富途老虎是什么来头？

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

消息称铠侠计划2027年量产BiCS10（332层）3D NAND闪存

夏天衣服不用买太多，每个人都可以准备一条白裙子，大方百搭

低调传承 温润沉静

特朗普再酝酿对伊打击 美伊谈判连放信号

媒体：针对两岸关系郑丽文最新表态说了句很直白的话

媒体：针对两岸关系郑丽文最新表态说了句很直白的话

2027款星途瑶光上市把"全球车"标准卷进13万级市场

低调传承温润沉静

特朗普再酝酿对伊打击美伊谈判连放信号