三月份,AI行业最热的词是Token。
国家数据局局长刘烈宏放出一组数字:中国日均Token调用量突破140万亿,两年前这个数字还是1000亿。黄仁勋在GTC大会上的说法更直白——Token将是未来数字世界最核心、最值钱的大宗商品,它的吞吐量会成为全球CEO追踪的核心经营数据。
几乎同时,阿里云喊出五年内云与AI商业化年收入破1000亿美元的目标;火山引擎的豆包大模型日均调用量超过100万亿Tokens,挤进全球前三。
云计算这门生意,终于要变好了。
科技行业判断"好生意"有三条硬标准:规模效应带来的边际成本递减、客户生态锁定的高转换成本、标准化产品之上的高毛利与经常性收入。亚马逊AWS、微软Azure、谷歌Cloud同时满足这三条,2025年利润分别为456亿、540亿和139亿美元。
但中国云厂商过去十几年走的是另一条路。重资产、低毛利、高度内卷,利润始终做不上去。原因在于特殊的IT消费习惯、贫弱的SaaS生态,以及政企客户对定制化的执念。各家云厂商的计算、存储、网络资源高度同质化,竞争最终沦为价格战。为了抢政企大客户,厂商们做了大量低毛利、高人力的本地部署和定制开发,把本该轻量化的云服务,做成了人力和硬件堆砌的传统IT项目。
AI浪潮给了国内云厂商一次重构商业模式的机会:把大模型封装成可调用、可计费的标准化云服务,卖给企业和开发者。
增长来得很快。2025年Q1,中国云基础设施服务支出116亿美元,同比增长16%,AI需求成为上云的主要动力。Omdia预测,2025年中国AI云市场规模518亿元,同比增长148%,2030年将突破1930亿元。
但增长背后是惨烈的价格战。2024年5月,豆包大模型率先降价,阿里云、百度智能云跟进,Token定价一年内狂降超90%,部分厂商推理算力毛利率跌为负数。策略很明确:以亏损换规模,谁先让开发者和企业养成API调用习惯,谁就能占据主动。
转折点出现在2026年初。海外AWS与谷歌Cloud宣布涨价,国内阿里云、百度智能云、腾讯云随即跟进。3月18日,阿里云和百度智能云同步官宣:
阿里云最高涨34%:自研芯片平头哥真武810E等算力卡上涨5%-34%,高性能文件存储CPFS上涨30%,4月18日执行。
百度智能云最高涨30%:AI算力产品上调5%-30%,并行文件存储上调约30%,同样4月18日生效。
涨价的直接导火索是Token需求的激增。单纯的大模型对话消耗有限,但2026年Agent爆发和多模态成熟彻底扩容了市场。Claude Code、OpenClaw等智能体走红后,科技公司发现:一次智能体任务包含多轮内部推理、工具调用和任务执行,Token消耗量远高于普通对话。算力需求从"云端训练"变成"训练+推理"双轮驱动,资源极度紧缺。
这种供需变化催生了计费模式的根本改变。
传统IaaS阶段,云厂商是"二房东",出租计算、存储、带宽,同质化严重。Token打破了这一局面——它是AI处理语言、图像、音视频的最小语义单元,用户每次与大模型交互,最终都被拆解成Token完成运算。以Token计费,云厂商从"卖硬件使用权"变成了"卖智能服务"。
这套模式的优势很明显:一是抹平硬件同质化,用户不关心底层GPU,只关心同等Token能否完成任务;二是放大规模效应,算力池越大,并发调度效率越高,单个Token的边际成本越低;三是标准化API形成生态锁定,调用习惯一旦建立,迁移成本极高。云服务真正变成了水电——打开即用,接上即跑。
云厂商正在把紧缺的AI算力向高附加值的Token业务倾斜。腾讯云推出"龙虾"产品矩阵,把MaaS平台升级为TokenHub,推出统一的Token Plan服务。智能体普及让按次调用的能力变成高频自动化服务,极大推高了Token流水。据《财经杂志》报道,阿里云刘伟光称MaaS收入占比可能达到30%甚至更高;AWS管理层也表示,要把Bedrock打造成全球最大推理平台,收入贡献与核心产品EC2相当。
这正是顶级云生意需要的"经常性、高毛利、可复制"结构。
海外AWS、Azure、谷歌Cloud、甲骨文OCI都在转型AI云;国内阿里云、百度智能云、腾讯云、火山引擎、华为云也在强化AI属性。资本开支持续创新高。
AI云的竞争不是单纯算力竞争,而是全栈成本竞争。胜负手不在于GPU数量,而在于谁能实现最低的"单位Token成本"。
美国四大云厂商已验证这个逻辑。谷歌是全栈整合最高的玩家,Gemini由自研TPU训练、部署在TPU上,芯片、模型、云服务三位一体,掌握成本与定价权。亚马逊累计交付超140万枚自研Trainium 2芯片,性价比比英伟达GPU高30%-40%。反面教材是甲骨文:无自研芯片,算力建设完全依赖英伟达,资本支出超过经营性现金流,同时高度依赖OpenAI单一客户,处境最脆弱。
中国云厂商面临同样逻辑,叠加地缘压力,维度更复杂。
阿里云有规模与全栈双重优势。百炼MaaS平台聚合通义千问、DeepSeek等数十款主流模型;累计出货超47万颗AI芯片,60%以上服务外部客户。未来三年投入超3800亿元。
百度智能云不急于抢Token流量规模,而是向能源、金融、汽车等垂直行业核心流程渗透,凭昆仑芯、文心大模型与千帆平台的"芯-云-模-体"全栈自研体系,连续两年拿下国内大模型招投标项目数和中标金额双第一。
火山引擎走激进的MaaS优先路线。字节内部抖音、视频创作、Seedance等庞大应用生态平摊了基础设施固定成本,让火山引擎得以持续激进定价。据《晚点》报道,火山引擎此前定下2026年MaaS业务收入超百亿目标,随着Seed 2.0、Seedance 2.0发布、OpenClaw持续爆火,团队已上调目标。
腾讯云过去几年艰难转型。2022年主动砍掉低毛利总包业务,聚焦高毛利自研PaaS/SaaS,将"被集成"而非"总集成"树立为核心战略。短期市场份额承压,但收入结构改善:2025年IaaS占四成、PaaS占四成、SaaS占两成,PaaS与SaaS毛利率50%-70%,远高于IaaS的10%-15%。成立12年后首次规模化盈利,马化腾在财报中将其列为当年核心成就。
AI把云计算的计费单元从同质化算力转向差异化智能服务;Token的爆炸式增长让MaaS收入长期看不到天花板;标准化API带来的规模效应与生态锁定,正在赋予头部厂商一定程度的定价权。
这门生意变好了,但机会只属于少数玩家:有充裕现金流承受千亿级算力投入;能自研芯片或深度整合国产算力,在英伟达生态外构建成本控制能力;以及有自研模型和MaaS工程化能力——模型强弱直接决定单卡Token吞吐量,决定单Token成本,最终决定毛利率。
黄仁勋那句话可以当作注脚:生成Token的成本与效率,决定科技企业的营收与生死。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.