网易首页 > 网易号 > 正文 申请入驻

算力“黑洞”逼近 你的每一次AI对话,都暗中标好了价格

0
分享至

当AI不再只是“回答问题”,而是开始“动手干活”,整个数字世界的账单正在被悄悄改写。

以OpenClaw为代表的智能体应用爆发,正推动大模型从对话引擎进化为任务引擎。而这一进化带来的直接连锁反应,是算力需求结构的根本性重塑——从过去的“集中式训练”,全面转向“高并发、长时段的推理”,并催生出一套全新的算力计价逻辑。

在这个新逻辑里,Token不再是一个藏在技术文档里的晦涩单位,而成了上下游每一方都不得不精打细算的战略资源。

一位开发者向21世纪经济报道记者晒出了她的算力账单:每一次通过API调用DeepSeek模型,后台都会精确记录下本次消耗的Token数量。

如果说开发者晒出的API账单是这场Token战争的“上游战报”,那么近期豆包上线付费订阅,则意味着这场战火终于烧到了普通用户头上。

当单月数亿活跃用户的Token消耗呈指数级增长,免费午餐难以为继,大模型行业开始从“跑马圈地”转向分层收费。这背后,正是智能体驱动的算力“黑洞”倒逼整条产业链重构的开端。

“黑洞”首当其冲:大厂成本雪崩

智能体应用爆发带来的Token调用量,不是线性增长,而是指数级跃升。

国家数据局发布的数据显示,中国日均Token调用量从2024年初的约1000亿飙升至2025年底的100万亿;2026年3月,进一步提升至140万亿,两年增长超千倍。

机构监测数据同样印证了这一趋势:过去一年,周度消耗Token数量从2.1T上升至24.5T,2026年以来周度Token消耗增加280%。

这种爆发式增长的根源,在于智能体完全不同于传统对话的运行方式。

传统AI对话中,一次用户请求对应一次模型推理,消耗的Token通常在几百到几千之间,用户问完即走,算力消耗是离散、短周期的。而智能体完成一个任务,需要模型自主规划、搜索信息、调用工具、执行步骤、验证结果,这个循环可能会重复几十轮甚至上百轮,从而让输入和输出Token都呈现指数级膨胀。

这也是当下市场的共识:推理对算力的消耗正在翻倍。其本质是智能体对低延迟、高并发推理的需求激增。据第三方统计,当前训推算力比例已从早期的“倒挂”演变为4:6,部分场景甚至达到3:7,且推理占比有望继续提升。

Token需求的指数级增长,正在深刻重塑云厂商的B端定价逻辑与计费模式。传统上,云厂商按vCPU/GPU时长、带宽或存储容量计费,本质是“资源租赁”;而Token成为新一代计价单位后,计费逻辑转向“按智能消耗量”收费——客户只需为模型实际生成的Token数买单。

“定价会采用更细的颗粒度,加入cache、batch等计费条目,打破了计量计费的传统体系。”云计算厂商优刻得的一位产品负责人告诉21世纪经济报道记者。这对客户的成本结构造成根本改变:“过去企业购买整张GPU卡或算力集群,成本固定且存在闲置浪费;现在按Token付费后,成本与业务用量完全挂钩,小型AI应用门槛大幅降低。但大客户也面临新的挑战:Token消耗量激增可能导致‘成本雪崩’。月度Token费用可达数十万元甚至数百万元。”

这并非危言耸听。OpenAI联合创始人兼总裁布罗克曼在近期表示,公司2026年将在算力方面投入500亿美元。随着OpenAI开发更先进的AI模型并向更广泛用户提供服务,其计算成本已从2017年的约3000万美元激增至今年的数百亿美元。

500亿美元这个数字,既见证了顶尖大模型研发的惊人能耗,也暴露了AI行业财务门槛以几何级数飙升的现实。

无独有偶,海外巨头包括微软、亚马逊、Meta、谷歌,国内包括阿里、腾讯、字节跳动等平台企业,总资本支出与AI资本支出占比也在逐渐提高,且各家上调2026年资本开支指引,无一不指向算力核心。


涨价不止的Token:硬件全线承压

一边,Token激增吞噬大厂成本;另一边,中外大厂齐掀算力与大模型涨价潮。

据不完全统计,自今年以来,腾讯云、阿里云、百度云等云服务厂商纷纷涨价,智谱AI、字节跳动、MiniMax、月之暗面也上调了模型API价格。Claude母公司Anthropic调整了旗下企业级产品Claude Enterprise订阅模式,从每月每用户最高200美元的固定费用,转变为按照实际算力消耗收费,且加收每月基础费20美元,对于重度用户而言,新定价或导致成本提升两到三倍。

对普通人而言,涨价或许还比较远,但对于AI工具的使用者而言,这是一场生存之战。

有AI漫剧从业者公开表示,“现在一部合格的120分钟AI剧,API等多渠道混用,算力成本已经普遍往2万元以上走。有些没做好API成本控制的,一部剧消耗10多万元的算力。”而市场上一部普通的AI漫剧报价才6万块,因此许多团队的生存空间被大幅压缩。

21世纪经济报道记者注意到,AI工具的使用成本在显著上升。以视频生成工具即梦为例,目前其基础会员、高级会员分别每月有725分、6160分,而之前是1080分、15000分。这意味着,用户花同样的钱,到账积分却大幅缩水,相当于变相涨价。且有创作者反映,原先会员价首年5折优惠,现在则将首年优惠折扣调整为6折。

然而,Token计价的上调,只是冰山浮出水面的部分。水面之下,真正的成本地基——硬件,正在经历一场更为剧烈的涨价潮。

GPU方面,英伟达H100的一年期租赁价格已从2025年10月的低点约1.70美元/小时,涨至2026年3月的2.35美元/小时,涨幅近40%;Blackwell系列芯片的单小时租金更高达4.08美元,较两个月前上涨48%。按需租赁容量在所有GPU类型中均已售罄。即便是消费级显卡,如英伟达RTX 5090,也一卡难求,溢价数倍。

“GPU的成本确实决定了算力的成本,也就间接掌握了算力定价权。”GPU厂商砺算科技的一位资深产品经理对记者表示,“以DeepSeek-V4 Pro为例,每百万输出Token收费三块多美元,这个价格就是主要由数据中心的建设成本决定的,这里面包含三块成本:数据中心租赁及托管费用,服务器费用和能耗费用,其中GPU属于服务器费用里比较大的一部分,如果是每张10万元的数据中心级GPU,那么其成本大约占到了总成本的近一半。”

存储方面,HBM(高带宽内存)是AI训练与推理的核心瓶颈之一。据TrendForce数据,2026年第一季度HBM价格同比翻倍,供应持续紧张。三星、SK海力士、美光虽在扩产,但产能爬坡速度远跟不上智能体驱动的需求爆发。

服务器与网络组件同样面临成本上行。先进封装产能吃紧,光模块、交换机等互联部件也在供需失衡中涨价。

这意味着,算力成本上涨,并非仅由“模型调用更频繁”驱动,而是从芯片、存储到数据中心整条供应链的价格重估。Token单价的调高,成了这条成本传导链路的最后一站。而这些,最终都会写进消费者的订阅费里。


AI产业链重构:效率决胜

算力计价从粗放到精算的转折,不只影响云厂商和企业的账单,更在深层改写整个AI产业链的成本结构与竞争逻辑。新的游戏规则已经清晰:效率和性价比,才是智能体时代的生存法则。

“我们虽然没有设立‘Token Hub’这样的事业群,但已从技术架构与产品矩阵全面拥抱这一变化。”优刻得产品负责人表示。他透露,客户在选择推理服务时,除了价格,还会紧盯三个硬指标:首Token延迟(TTFT)、端到端吞吐量(TPM)以及推理稳定性——延迟抖动与错误率直接决定了AI应用的用户留存和运维成本。

在他看来,在Token洪流中,胜出的云厂商必须具备三大特质:一是全栈自研优化能力,从底层算力调度到上层模型服务实现系统性提效;二是中立开放的生态,不被单一模型或框架绑定,让客户自由选择最佳方案;三是产品灵活性,提供公有云按Token计费、混合云一体机、私有化部署等多元模式。优刻得正通过智能资源调度、vLLM框架深度优化及模型级加速机制,实现KV缓存卸载等能力,以系统性降低总体拥有成本(TCO)。

然而,任何过于火爆的行情都暗藏风险。砺算科技资深产品经理直言:“Token需求暴涨是一把双刃剑。短期Token不愁销路,但长期看,智能体热潮能持续多久?GPU需求是否会突变?会不会出现新的XPU?这些都是未知数。”他算了一笔账:GPU采购后需保证四至五年的使用期才能有利润空间,其间任何变化都可能冲击营收模型。

更深刻的挑战来自下游的成本压力——用户正疯狂寻找更廉价的推理方案,这可能催生一批“XPU”企业,用性价比更高的推理芯片撕开市场。英伟达收购Groq已被视为一个标志性信号。如果LPU、TPU等产品在性价比上远超传统GPU/GPGPU,这个市场将被快速拆分。“芯片公司每代产品周期至少两年,投入以十亿人民币计,传统GPU厂商能做的应对其实有限。”前述产品经理说。

另一个关键战场在存储。“AI推理工作负载的需求持续攀升,这对存储芯片与加速硬件提出了更高需求,以边缘侧AI大语言模型或小语言模型为例,其需要高带宽、低延迟、低功耗存储产品,才能支撑每秒超过一万个Token的高性能生成目标。”内存大厂华邦电子相关负责人对记者解释。他举例道,AI眼镜、机器人等端侧设备空间受限,存储芯片必须在功耗控制和尺寸体积上精益求精,以延长待机时间并支持轻量化设计。

当算力成为制约智能体普及的最硬约束,这场由Token引爆的“算力黑洞”正在重塑产业链的权力版图。它不是一次短暂的供需错配,而是一轮强制性的效率筛选。无论云厂商、芯片设计公司还是存储巨头,最终的考卷只有一道题:谁能用更低的单位Token成本,完成更复杂、更可靠的任务?答案的获得者,将掌握下一个时代的核心权力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖清德返台后称台湾是国家,下令拆除蒋介石像,大陆六字预言结局

赖清德返台后称台湾是国家,下令拆除蒋介石像,大陆六字预言结局

凉了时光人
2026-05-08 09:46:12
罪有应得!以色列,正被全世界集体孤立!

罪有应得!以色列,正被全世界集体孤立!

毛豆论道
2026-05-05 17:35:52
浏阳烟花厂爆炸已致37人死亡

浏阳烟花厂爆炸已致37人死亡

新华社
2026-05-08 12:44:24
稀土战争其实早就打完了——一份从 1985 到 2026 的完整账本,告诉你 AI 时代真正的胜负手是什么

稀土战争其实早就打完了——一份从 1985 到 2026 的完整账本,告诉你 AI 时代真正的胜负手是什么

六子吃凉粉
2026-05-06 18:14:18
月薪几万却招不到人?远洋海员背后的残酷,配偶:男女关系太乱了

月薪几万却招不到人?远洋海员背后的残酷,配偶:男女关系太乱了

李将平老师
2026-05-08 09:42:27
萨摩亚女足球员被控性侵14岁美国男孩,“多达每周三次”

萨摩亚女足球员被控性侵14岁美国男孩,“多达每周三次”

观察者网
2026-05-08 08:39:09
中方宣布无视美国制裁,美媒称史无前例,鲁比奥:或追加二次制裁

中方宣布无视美国制裁,美媒称史无前例,鲁比奥:或追加二次制裁

书纪文谭
2026-05-07 15:11:53
江苏省体育局发布退役运动员安置情况:钱天一、何冰娇均自主择业

江苏省体育局发布退役运动员安置情况:钱天一、何冰娇均自主择业

懂球帝
2026-05-08 09:54:18
福州一智力残疾女孩在医院全托管期间“高坠身亡”,家属质疑死因,当地多方回应

福州一智力残疾女孩在医院全托管期间“高坠身亡”,家属质疑死因,当地多方回应

潇湘晨报
2026-05-08 15:14:19
魏凤和案、李尚福案一审宣判

魏凤和案、李尚福案一审宣判

界面新闻
2026-05-07 18:01:52
0-2!湖人全队围住裁判不让走!炸了炸了,这场面真没见过!

0-2!湖人全队围住裁判不让走!炸了炸了,这场面真没见过!

贵圈真乱
2026-05-08 13:25:45
委内瑞拉,从热搜消失了

委内瑞拉,从热搜消失了

民间胡扯老哥
2026-05-08 06:45:03
外交部:奉劝巴拉圭当局早日同台湾当局断绝所谓“外交关系”

外交部:奉劝巴拉圭当局早日同台湾当局断绝所谓“外交关系”

新京报
2026-05-07 14:47:07
突发!美军发动“定点打击”,伊朗多地被炸,伊方:攻击3艘美国军舰,造成“重大损失”!特朗普:这只是轻轻敲打,停火还在持续

突发!美军发动“定点打击”,伊朗多地被炸,伊方:攻击3艘美国军舰,造成“重大损失”!特朗普:这只是轻轻敲打,停火还在持续

每日经济新闻
2026-05-08 07:34:08
5月1日起红灯右转全国统一新规:不是不让转,是不要再乱转了

5月1日起红灯右转全国统一新规:不是不让转,是不要再乱转了

笑熬浆糊111
2026-05-08 05:47:49
37死1失联!涉浏阳"5·4"烟花爆炸事故8名责任者到案!在医救治51人

37死1失联!涉浏阳"5·4"烟花爆炸事故8名责任者到案!在医救治51人

声情专递
2026-05-08 12:22:29
王凤英入职小鹏3年终获股权,此前奉献长城30年未持一股

王凤英入职小鹏3年终获股权,此前奉献长城30年未持一股

三言科技
2026-05-08 09:32:13
特朗普态度大转变:连说中国三句好话,日本想截胡被晾一边

特朗普态度大转变:连说中国三句好话,日本想截胡被晾一边

壹切的壹切
2026-05-08 09:54:16
“4只皮皮虾1035元”店主事发次日病逝,年仅43岁;家人称其有基础病,事发前已脑出血,店铺收到多起威胁电话,不打算继续开业

“4只皮皮虾1035元”店主事发次日病逝,年仅43岁;家人称其有基础病,事发前已脑出血,店铺收到多起威胁电话,不打算继续开业

扬子晚报
2026-05-08 12:46:41
广州一公园现70cm剧毒外来入侵物种

广州一公园现70cm剧毒外来入侵物种

新快报新闻
2026-05-08 11:44:15
2026-05-08 16:27:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
246714文章数 744224关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

向导掐人中救醒高反昏迷女子反遭掌掴 女子否认"装晕"

头条要闻

向导掐人中救醒高反昏迷女子反遭掌掴 女子否认"装晕"

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

一觉醒来,美伊又打起来了

汽车要闻

智能双舱大五座SUV 乐道L80将于5月15日正式上市

态度原创

艺术
游戏
时尚
房产
军事航空

艺术要闻

探索施密德的油画,感受无法抵挡的艺术魅力!

神秘海域合集史低!经典大作捆绑仅需113.85元

海魂衫搭配白色,更解暑!

房产要闻

豪掷6.8亿拿地!何猷君大手笔投资三亚!

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版