网易首页 > 网易号 > 正文 申请入驻

算力“黑洞”逼近:你的每一次AI对话,都暗中标好了价格

0
分享至

21世纪经济报道记者 张赛男

当AI不再只是“回答问题”,而是开始“动手干活”,整个数字世界的账单正在被悄悄改写。

以OpenClaw为代表的智能体应用爆发,正推动大模型从对话引擎进化为任务引擎。而这一进化带来的直接连锁反应,是算力需求结构的根本性重塑——从过去的“集中式训练”,全面转向“高并发、长时段的推理”,并催生出一套全新的算力计价逻辑。

在这个新逻辑里,Token不再是一个藏在技术文档里的晦涩单位,而成了上下游每一方都不得不精打细算的战略资源。

一位开发者向21世纪经济报道记者晒出了她的算力账单:每一次通过API调用DeepSeek模型,后台都会精确记录下本次消耗的Token数量。

如果说开发者晒出的API账单是这场Token战争的“上游战报”,那么近期豆包上线付费订阅,则意味着这场战火终于烧到了普通用户头上。

当单月数亿活跃用户的Token消耗呈指数级增长,免费午餐难以为继,大模型行业开始从“跑马圈地”转向分层收费。这背后,正是智能体驱动的算力“黑洞”倒逼整条产业链重构的开端。

智能体应用爆发带来的Token调用量,不是线性增长,而是指数级跃升。

国家数据局发布的数据显示,中国日均Token调用量从2024年初的约1000亿飙升至2025年底的100万亿;2026年3月,进一步提升至140万亿,两年增长超千倍。

机构监测数据同样印证了这一趋势:过去一年,周度消耗Token数量从2.1T上升至24.5T,2026年以来周度Token消耗增加280%。

这种爆发式增长的根源,在于智能体完全不同于传统对话的运行方式。

传统AI对话中,一次用户请求对应一次模型推理,消耗的Token通常在几百到几千之间,用户问完即走,算力消耗是离散、短周期的。而智能体完成一个任务,需要模型自主规划、搜索信息、调用工具、执行步骤、验证结果,这个循环可能会重复几十轮甚至上百轮,从而让输入和输出Token都呈现指数级膨胀。

这也是当下市场的共识:推理对算力的消耗正在翻倍。其本质是智能体对低延迟、高并发推理的需求激增。据第三方统计,当前训推算力比例已从早期的“倒挂”演变为4:6,部分场景甚至达到3:7,且推理占比有望继续提升。

Token需求的指数级增长,正在深刻重塑云厂商的B端定价逻辑与计费模式。传统上,云厂商按vCPU/GPU时长、带宽或存储容量计费,本质是“资源租赁”;而Token成为新一代计价单位后,计费逻辑转向“按智能消耗量”收费——客户只需为模型实际生成的Token数买单。

“定价会采用更细的颗粒度,加入cache、batch等计费条目,打破了计量计费的传统体系。”云计算厂商优刻得的一位产品负责人告诉21世纪经济报道记者。这对客户的成本结构造成根本改变:“过去企业购买整张GPU卡或算力集群,成本固定且存在闲置浪费;现在按Token付费后,成本与业务用量完全挂钩,小型AI应用门槛大幅降低。但大客户也面临新的挑战:Token消耗量激增可能导致‘成本雪崩’。月度Token费用可达数十万元甚至数百万元。”

这并非危言耸听。OpenAI联合创始人兼总裁布罗克曼在近期证词中表示,公司2026年将在算力方面投入500亿美元。随着OpenAI开发更先进的AI模型并向更广泛用户提供服务,其计算成本已从2017年的约3000万美元激增至今年的数百亿美元。

500亿美元这个数字,既见证了顶尖大模型研发的惊人能耗,也暴露了AI行业财务门槛以几何级数飙升的现实。

无独有偶,海外巨头包括微软、亚马逊、Meta、谷歌,国内包括阿里、腾讯、字节跳动等平台企业,总资本支出与AI资本支出占比也在逐渐提高,且各家上调2026年资本开支指引,无一不指向算力核心。

一边,Token激增吞噬大厂成本;另一边,中外大厂齐掀算力与大模型涨价潮。

据不完全统计,自今年以来,腾讯云、阿里云、百度云等云服务厂商纷纷涨价,智谱AI、字节跳动、MiniMax、月之暗面也上调了模型API价格。Claude母公司Anthropic调整了旗下企业级产品Claude Enterprise订阅模式,从每月每用户最高200美元的固定费用,转变为按照实际算力消耗收费,且加收每月基础费20美元,对于重度用户而言,新定价或导致成本提升两到三倍。

对普通人而言,涨价或许还比较远,但对于AI工具的使用者而言,这是一场生存之战。

有AI漫剧从业者公开表示,“现在一部合格的120分钟AI剧,API等多渠道混用,算力成本已经普遍往2万元以上走。有些没做好API成本控制的,一部剧消耗10多万元的算力。”而市场上一部普通的AI漫剧报价才6万块,因此许多团队的生存空间被大幅压缩。

21世纪经济报道记者注意到,AI工具的使用成本在显著上升。以视频生成工具即梦为例,目前其基础会员、高级会员分别每月有725分、6160分,而之前是1080分、15000分。这意味着,用户花同样的钱,到账积分却大幅缩水,相当于变相涨价。且有创作者反映,原先会员价首年5折优惠,现在则将首年优惠折扣调整为6折。

然而,Token计价的上调,只是冰山浮出水面的部分。水面之下,真正的成本地基——硬件,正在经历一场更为剧烈的涨价潮。

GPU方面,英伟达H100的一年期租赁价格已从2025年10月的低点约1.70美元/小时,涨至2026年3月的2.35美元/小时,涨幅近40%;Blackwell系列芯片的单小时租金更高达4.08美元,较两个月前上涨48%。按需租赁容量在所有GPU类型中均已售罄。即便是消费级显卡,如英伟达RTX 5090,也一卡难求,溢价数倍。

“GPU的成本确实决定了算力的成本,也就间接掌握了算力定价权。”GPU厂商砺算科技的一位资深产品经理对记者表示,“以DeepSeek-V4 Pro为例,每百万输出Token收费三块多美元,这个价格就是主要由数据中心的建设成本决定的,这里面包含三块成本:数据中心租赁及托管费用,服务器费用和能耗费用,其中GPU属于服务器费用里比较大的一部分,如果是每张10万元的数据中心级GPU,那么其成本大约占到了总成本的近一半。”

存储方面,HBM(高带宽内存)是AI训练与推理的核心瓶颈之一。据TrendForce数据,2026年第一季度HBM价格同比翻倍,供应持续紧张。三星、SK海力士、美光虽在扩产,但产能爬坡速度远跟不上智能体驱动的需求爆发。

服务器与网络组件同样面临成本上行。先进封装产能吃紧,光模块、交换机等互联部件也在供需失衡中涨价。

这意味着,算力成本上涨,并非仅由“模型调用更频繁”驱动,而是从芯片、存储到数据中心整条供应链的价格重估。Token单价的调高,成了这条成本传导链路的最后一站。而这些,最终都会写进消费者的订阅费里。

算力计价从粗放到精算的转折,不只影响云厂商和企业的账单,更在深层改写整个AI产业链的成本结构与竞争逻辑。新的游戏规则已经清晰:效率和性价比,才是智能体时代的生存法则。

“我们虽然没有设立‘Token Hub’这样的事业群,但已从技术架构与产品矩阵全面拥抱这一变化。”优刻得产品负责人表示。他透露,客户在选择推理服务时,除了价格,还会紧盯三个硬指标:首Token延迟(TTFT)、端到端吞吐量(TPM)以及推理稳定性——延迟抖动与错误率直接决定了AI应用的用户留存和运维成本。

在他看来,在Token洪流中,胜出的云厂商必须具备三大特质:一是全栈自研优化能力,从底层算力调度到上层模型服务实现系统性提效;二是中立开放的生态,不被单一模型或框架绑定,让客户自由选择最佳方案;三是产品灵活性,提供公有云按Token计费、混合云一体机、私有化部署等多元模式。优刻得正通过智能资源调度、vLLM框架深度优化及模型级加速机制,实现KV缓存卸载等能力,以系统性降低总体拥有成本(TCO)。

然而,任何过于火爆的行情都暗藏风险。砺算科技资深产品经理直言:“Token需求暴涨是一把双刃剑。短期Token不愁销路,但长期看,智能体热潮能持续多久?GPU需求是否会突变?会不会出现新的XPU?这些都是未知数。”他算了一笔账:GPU采购后需保证四至五年的使用期才能有利润空间,其间任何变化都可能冲击营收模型。

更深刻的挑战来自下游的成本压力——用户正疯狂寻找更廉价的推理方案,这可能催生一批“XPU”企业,用性价比更高的推理芯片撕开市场。英伟达收购Groq已被视为一个标志性信号。如果LPU、TPU等产品在性价比上远超传统GPU/GPGPU,这个市场将被快速拆分。“芯片公司每代产品周期至少两年,投入以十亿人民币计,传统GPU厂商能做的应对其实有限。”前述产品经理说。

另一个关键战场在存储。“AI推理工作负载的需求持续攀升,这对存储芯片与加速硬件提出了更高需求,以边缘侧AI大语言模型或小语言模型为例,其需要高带宽、低延迟、低功耗存储产品,才能支撑每秒超过一万个Token的高性能生成目标。”内存大厂华邦电子相关负责人对记者解释。他举例道,AI眼镜、机器人等端侧设备空间受限,存储芯片必须在功耗控制和尺寸体积上精益求精,以延长待机时间并支持轻量化设计。

当算力成为制约智能体普及的最硬约束,这场由Token引爆的“算力黑洞”正在重塑产业链的权力版图。它不是一次短暂的供需错配,而是一轮强制性的效率筛选。无论云厂商、芯片设计公司还是存储巨头,最终的考卷只有一道题:谁能用更低的单位Token成本,完成更复杂、更可靠的任务?答案的获得者,将掌握下一个时代的核心权力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
再见,掘金!王朝解体,掘金大超市要开张了

再见,掘金!王朝解体,掘金大超市要开张了

体育新角度
2026-05-07 20:35:54
6队仅1冠!欧洲三大杯迎来最弱决赛,却拥有最强主帅

6队仅1冠!欧洲三大杯迎来最弱决赛,却拥有最强主帅

嗨皮看球
2026-05-08 17:26:16
炸裂!奥运冠军发文痛斥76岁恩师:没底线,逼我吃药!

炸裂!奥运冠军发文痛斥76岁恩师:没底线,逼我吃药!

拳击时空
2026-05-08 06:12:50
2013年,金正哲联手张成泽发动朝鲜兵变,因一细节败露,双遭反杀

2013年,金正哲联手张成泽发动朝鲜兵变,因一细节败露,双遭反杀

阿胡
2025-03-11 13:28:03
“汉坦病毒”来势汹汹,建议:每家备好5样东西,关键时刻能救命

“汉坦病毒”来势汹汹,建议:每家备好5样东西,关键时刻能救命

健康科普365
2026-05-08 15:00:16
中国油轮首次在霍尔木兹海峡遇袭,这件事没那么简单

中国油轮首次在霍尔木兹海峡遇袭,这件事没那么简单

戗词夺理
2026-05-07 23:33:26
湿气最怕这菜!三天两头吃一次,体内湿气哗哗排,大肚腩变小了!

湿气最怕这菜!三天两头吃一次,体内湿气哗哗排,大肚腩变小了!

江江食研社
2026-05-07 17:30:11
成都南城都汇5000套房屋查封数年,业主翘首期待办证

成都南城都汇5000套房屋查封数年,业主翘首期待办证

中国房地产报官方号
2026-05-08 15:41:01
浙江宣传评世界杯转播权之争:与其花费巨资追捧海外赛事,不如投入本土足球

浙江宣传评世界杯转播权之争:与其花费巨资追捧海外赛事,不如投入本土足球

澎湃新闻
2026-05-08 12:24:10
秋千坠亡女子身后排队游客发声:该女子同行朋友开玩笑称“没绑紧”吓唬她,事发后其朋友一直哭泣,深感愧疚

秋千坠亡女子身后排队游客发声:该女子同行朋友开玩笑称“没绑紧”吓唬她,事发后其朋友一直哭泣,深感愧疚

洪观新闻
2026-05-07 14:44:22
凌晨突发!东莞银屏山出事了!

凌晨突发!东莞银屏山出事了!

东莞好生活
2026-05-08 16:19:21
“开除军籍、持外国绿卡、骗财骗色”,蒋大为身上标签哪个是真的

“开除军籍、持外国绿卡、骗财骗色”,蒋大为身上标签哪个是真的

寻墨阁
2026-03-25 12:40:35
被央媒点名批评!张本智和进四强仰天长啸 再次挑衅:中国没有特别强

被央媒点名批评!张本智和进四强仰天长啸 再次挑衅:中国没有特别强

漫川舟船
2026-05-08 09:37:22
中国“退步”最快的城市:曾与南京、上海齐名,如今却沦为三线

中国“退步”最快的城市:曾与南京、上海齐名,如今却沦为三线

长风文史
2026-05-08 13:02:57
16岁女孩景区内坠亡,目击者发声,赔偿金额曝光,景区运营仅49天

16岁女孩景区内坠亡,目击者发声,赔偿金额曝光,景区运营仅49天

温柔看世界
2026-05-06 11:48:44
生下三胎仅6个月,方媛官宣喜讯,全网恭喜,让郭富城也始料未及

生下三胎仅6个月,方媛官宣喜讯,全网恭喜,让郭富城也始料未及

一盅情怀
2026-05-08 10:58:52
新款 AirPods Pro 带摄像头版本即将发布!

新款 AirPods Pro 带摄像头版本即将发布!

XCiOS俱乐部
2026-05-08 09:16:39
打起来了!特朗普不宣而战,美军发起斩首行动,伊朗或再次上当

打起来了!特朗普不宣而战,美军发起斩首行动,伊朗或再次上当

张鴘喜欢软软糯糯
2026-05-08 15:12:19
蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

伦伦妈爱历史
2026-05-02 10:01:48
国际足联要疯了,没有软肋的中国足球已经天下无敌

国际足联要疯了,没有软肋的中国足球已经天下无敌

枫冷慕诗
2026-05-07 11:32:38
2026-05-08 18:28:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
246765文章数 744224关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

中国船东所有的油轮中东遇袭 中方:船上有中国籍船员

头条要闻

中国船东所有的油轮中东遇袭 中方:船上有中国籍船员

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

轮到豆包收割了?

汽车要闻

智能双舱大五座SUV 乐道L80将于5月15日正式上市

态度原创

教育
家居
亲子
房产
军事航空

教育要闻

全年招聘!数量不限!这所学校发布招聘公告

家居要闻

流动的尺度 打破家的形式主义

亲子要闻

全职妈妈和职场妈妈带出的孩子,三点区别藏也藏不住

房产要闻

豪掷6.8亿拿地!何猷君大手笔投资三亚!

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版