前段时间,一个消息引发了广泛关注:豆包大模型正式开启商业化,推出付费订阅服务。
这看似是应用层的一小步,实则是整个 AI 算力产业链的一大步。它直接验证了算力需求的真实性与紧迫性,也为上游的算力服务商,尤其是备受关注的算力租赁板块,注入了一剂强心针。
豆包推出付费版,核心原因很简单:复杂的 AI 任务消耗巨量的算力和推理时间,成本太高了。
数据显示,豆包日均 Token 使用量已突破 120 万亿,过去三个月翻了一倍,比刚发布时增长了一千倍。
![]()
这背后,是实实在在的算力成本在燃烧。付费,是覆盖高昂算力成本的必然选择,也是 AI 应用从 “叫好” 走向 “叫座” 的关键测试。
这个现象,直接印证了当前算力供不应求的局面。短期内能解燃眉之急的,正是算力租赁。
五一假期里,美股 H100 和 B200 的算力租赁服务价格大幅上涨,带动相关板块走高,全球算力紧缺涨价的逻辑被进一步实锤。
算力租赁的火爆,大家有目共睹。但市场关注的焦点,正在悄然变化。一个更高级的商业模式 ——“Token 工厂”,开始浮出水面。
这不仅仅是概念,而是算力服务下一站的明确方向。
传统算力租赁,是重资产、卖资源的生意。客户租用服务器,厂商按月收租金,核心是拿卡能力和上架率。这像是一次性买卖,收益有刚性上限。
![]()
而 Token 工厂,是价值附加的生意。它不再简单出租硬件,而是通过平台级的调度、软硬件深度优化,将算力加工成标准化的智能内容(Token)输出给客户。
其商业模式也升级为“Token 分成”:按照大模型实际产生的 Token 调用量,与模型厂商进行收益分成。
这种模式下,超额分成收益几乎全部转化为纯利润,为算力服务打开了极高的利润弹性。机构调研显示,在深度联合运营中,算力服务商可能分得 Token 销售收入的 60%-80%。优秀的软件优化,甚至能让 Token 服务带来的收入达到传统裸算力租赁的 5 到 10 倍。
头部算力运营商的净利率,有望借此从传统的 10%-15%,强势逼近 30% 甚至更高。
Token 工厂凭什么能大幅提升毛利?核心在于“精耕细作”和效率的极致优化。
传统租赁是粗放管理,签个五年合同,后续基本不管。
![]()
Token 工厂则像精细化运营的 “智能电厂”:用户用多少收多少,价格更灵活,竞争力更强。白天和夜晚的用户需求不同,通过调度提升整体使用率。复杂任务和简单任务,分配不同的大模型或算力资源,降低成本。
目前测算基础是每日有效使用 8 小时,若能提到 12 小时,效率又能提升 50%。这一切优化,都是在不显著增加硬件成本的前提下完成的,从而大幅提升了毛利率。
虽然 Token 工厂模式想象空间巨大,但我们也需要冷静看待。硬件的高溢价,本质源于稀缺。但技术演进有一个残酷规律:凡是足够贵、足够重复、足够刚需的东西,最终都会被整个产业链优化掉。
AI 算力目前消耗巨大,部分原因是模型早期训练粗糙、推理昂贵、调度效率不高。
![]()
一旦成本高到一定程度,整个行业就会自动进入 “降本模式”—— 模型压缩、量化、新架构、专用芯片、软件优化等技术都会涌现,目标就是让同样的任务消耗更少的算力。
谷歌 CEO 在季报电话会上坦言算力受限,但也表示需求能见度至少延伸到 2028 年。这意味着,算力缺口是长期结构性的,但硬件的高毛利很难像当时那样线性外推、无限上涨。
市场部分涨幅已经包含了未来的乐观预期。因此,真正具备长期复利的公司,不能只靠卖稀缺的硬件。它们必须进化成平台、生态和标准的制定者。
就像曾有报道称,大基金开始领投 AI 模型公司,其意图正是打通从中国设备、中国芯片到中国模型的完整产业生态闭环。
硬件赚钱靠稀缺,而软件和生态的优化,终将稀释这种稀缺,并创造出更持久的价值。
Token 工厂模式,正是算力服务商向平台生态迈进的关键一步。它炒的不是短期业绩,而是下一代商业模式的演进方向,以及由此打开的长期市值空间。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.