网易首页 > 网易号 > 正文 申请入驻

MaaS竞争更激烈,火山引擎的份额为什么还在涨?

0
分享至

来源:市场资讯

(来源:智能涌现)


AI云飞轮,开始转起来了。

文|苏天明

中国MaaS(模型即服务)市场正在迅速扩大,从一个非常小且狭隘的市场,变成充满潜力的业务增长点。

市场调研机构IDC最新数据显示,2025年中国企业级MaaS市场大模型调用量同比增长16倍,达1941万亿Token,并预计2026年增速更快。

2025年,尤其是下半年,中国的云计算厂商、大模型公司几乎悉数入场,投入更多算力、销售和产品资源,提高MaaS业务优先级,竞争愈发激烈。

按照常理,一个快速扩容的新兴市场,后来者集中入场后,领跑者的份额就越容易被稀释。尤其在MaaS这样的市场里,外界一度认为大模型API难以形成黏性:开发者似乎只需要改几行代码,就能换掉底层模型或更换云平台。

但IDC最新数据给出了一个反直觉的结果:2025年,火山引擎在中国MaaS市场的份额非常稳固,从上半年的49.2%进一步提升至全年的49.5%。


也就是说,在竞争最激烈的下半年,火山引擎不仅没有被后来者摊薄,反而随着市场扩容继续扩大了领先优势。中国公有云上每产生两个大模型Token,就有接近一个跑在火山引擎上。

外界习惯于将其归因于激进的定价策略。2024年5月,火山引擎发布豆包大模型MaaS服务时,曾把价格降至较行业通用水平低99.3%。但单纯的补贴无法解释火山引擎份额的持续扩张。行业内其他厂商很快也把MaaS服务价格压低到类似水平。真正决定低价能否持续的,是调用规模和推理工程能力。

模型能力同样关键。MaaS市场快速扩容,主要来自模型能力提升后,新场景不断打开:模型编程能力提升推动Vibe Coding和Agent走热,视频生成模型进入短剧、漫剧和广告制作生产流程,持续放大Token消耗。

这意味着,MaaS更偏向增量市场中的速度竞争。谁能更快把模型能力产品化,提供具有性价比的稳定服务,谁就能更快承接新增场景,并在市场扩容中继续扩大份额。

从豆包大语言模型到Seedance视频生成模型等,豆包系列模型能力不断迭代。火山引擎则在此基础上,加速把过去积累的Token规模,转化为更完整的竞争力:更低的推理成本、更高的工程效率,以及围绕Agent运行所需的基础设施。一个大模型时代的云计算飞轮,正在成型。

低价背后,是规模和工程能力

云计算是典型的高固定成本、低边际成本行业。服务器、网络、研发和运维体系都需要前期大量投入,但每新增一次调用的边际成本会下降。规模越大,研发和基础设施投入越容易被摊薄。

规模也会放大工程优化的价值。火山引擎总裁谭待曾举过一个例子:“1万台服务器利用率优化一个点,和100万台服务器优化一个点,收益差100倍。可以组建强大的团队做得更好。”

规模是火山引擎重点发力MaaS时最看重的变量:不是简单卖模型接口,而是尽快把Token调用量做大。

为此,火山引擎把Token消耗量作为业务发展的核心指标,并调整销售团队的业绩考核方式:同样销售额的MaaS产品,在内部考核中的激励权重,是传统云服务的数倍。

与业务优先级一起提升的,还有火山引擎在模型推理方向的技术投入。MaaS的成本主要看Token的生成效率。服务器利用率、缓存命中率、算力调度效率提升,成本就有机会下降。

“更低的成本能催生更多应用,可以把盘子做大。”谭待后来谈起当时的定价策略时说,看到“能靠技术把成本降下来,就决定一次降彻底”。

当时支撑火山引擎降价的关键技术,主要是其较早大规模应用的PD分离和KV Cache。PD分离,是把大模型推理中的“理解问题”(Prefill)和“生成答案”(Decode)拆开,分别匹配更合适的算力单元;KV Cache则是缓存模型生成过程中的历史状态,避免每输出新内容都重复计算此前上下文,从而节省显存带宽和推理成本。

但这些技术都依赖规模。小规模调用时,维护复杂缓存和调度系统本身也有成本,甚至可能抵消节省下来的算力。

随着PD分离、KV Cache等技术在行业中扩散,行业内的Token价格逐渐趋同。缺乏规模效应的跟随者,对标低价往往意味着更大的成本压力,甚至会产生亏损。

调用规模更大的火山引擎,成本压力更小,会有更多空间继续优化推理技术,形成可持续的低价能力。

火山引擎也在技术和工程之外寻找降低成本的空间:一方面,根据Context长度区间做差异化定价,把选择权交给客户;另一方面,推出“节省计划”,把客户在语言模型、视频生成等不同模型上的用量合并计算。客户在语言模型上积累的规模折扣,可以用来对冲视频生成等新业务的试错成本。

IDC最新中国MaaS报告提到,火山引擎拥有最高的市场份额,也就是调用量份额;其收入份额同样排名第一,但比调用量份额低几个百分点。火山引擎每个Token的单价低于行业均值。

需要注意的是,IDC对中国MaaS市场的统计,主要覆盖公有云上企业调用模型的情况,不包括字节跳动开发的豆包、即梦等AI应用,也不包括抖音、飞书等内部业务部署大模型时产生的Token。

这些调用量不进入IDC的市场份额统计,但是同样会影响火山引擎的成本结构和工程效率。

Agent让MaaS变成了基础设施生意

OpenAI CEO山姆·阿尔特曼近期在访谈中说,AI的下一阶段,将从“用户提供一段文本、大模型返回一段文本或代码”,转向“Agent真正运行在公司内部,完成各种不同类型的工作”。他说,OpenAI还在与AWS合作开发一款类似“虚拟同事”的产品。

MaaS正在从标准化的供应模型接口,变成企业的基础设施,黏性更强。一个企业Agent真正运行起来,需要身份认证、权限控制、记忆系统、工具调用、沙箱环境、日志记录、安全治理等组件,以及与企业内部系统的连接。

这也是最近大模型行业开始重视Agent Harness的核心原因。所谓Harness,原意是“马具”或“套具”。放在Agent语境里,指的是与基础模型配合的工程系统。MaaS供应稳定的模型能力,Harness负责把推理变成可约束、可追踪、可持续运行的工作流。

云平台提供大模型服务的方式跟着发生变化。不论是Anthropic和多家云厂商的合作,还是今年4月OpenAI与AWS的合作,不只是简单地把模型接口放到云平台上,还会把它封装进云平台的原生Agent环境中,让企业能够在云平台环境里开发、运营生产级Agent。

火山引擎过去几年的产品演进,也可以放在这个趋势里理解:提升MaaS竞争力的同时,把大模型服务扩展成覆盖开发和运营Agent的基础设施。

“我们是国内第一个推出全套Agent产品,把Agent开发简化的。”谭待去年底接受访谈说,客户写几行代码,就能做出来一个复杂的Agent,“就跟你以前开发一个复杂的网站一样”,只是现在需要新的AI中间件。

在他的判断中,以前写代码本质上是在写if-else定义工作流;现在基于模型开发Agent,开发者更多是在写提示词,流程规划、任务拆解、创建子Agent等环节,则越来越多交给模型自己完成。这也是OpenClaw这类产品的底层工作逻辑。

所以火山引擎今年初能在支援央视春晚活动的同时,迅速推出OpenClaw产品ArkClaw,提升安全能力的同时,开源为Agent长期记忆设计的上下文数据库OpenViking等,让ArkClaw更好用。

他们把“ArkClaw个人版”定义为“敏态Agent”:先让员工快速实验提高业务效率的想法,再把验证有效的能力沉淀、固化成“稳态Agent”。后者对应的是火山引擎在2024年上线的Agent开发和运营平台HiAgent。

到今年4月,火山引擎上累计消耗万亿Tokens的企业,已经从去年底的100家,增长到了140家。越来越多的MaaS大客户,与火山引擎的合作变得更深入。

AI云飞轮,开始转起来了

在商业分析里,飞轮效应是解释全球最大云计算平台AWS成功的核心逻辑:规模摊薄成本,降价吸引更多客户,客户增长又带来更多反馈、现金流和更强的生态,推动技术和服务继续迭代。

火山引擎正在AI时代建立类似的飞轮。但它的飞轮并不完全遵循传统云计算行业的逻辑。传统云计算的飞轮,主要围绕算力、存储、网络和软件生态;MaaS的飞轮,则多了模型能力、Token使用方式、Agent场景和真实业务反馈。

火山引擎飞轮的第一层,是模型能力、调用规模和推理成本之间的循环。

字节跳动内部的模型研发团队Seed,稳定为火山引擎供应第一梯队模型。模型越强,越容易扩大调用规模;调用规模越大,越能用工程技术压低成本;成本下降后,又能吸引更多客户。这是一个接近传统云计算的规模飞轮,只是计量单位从服务器、存储和带宽,变成了Token。

第二层飞轮,来自真实场景的反馈。字节体系中,每天上亿人使用的豆包、迅速增长的即梦,以及抖音、飞书等数十个内部业务线,以及外部客户,都在通过火山引擎开发和使用大模型能力,会给火山引擎提供的高频、复杂、真实的产品反馈。

这些反馈一端流向Seed模型团队,帮助基础模型继续迭代;另一端流向火山引擎的Agent团队,帮助提升产品能力。

Agent产品尤其依赖这些反馈。Anthropic也在多篇技术文章中提到,Agent能力提升不是只靠模型能力提升。内部员工、外部用户、生产监控、A/B测试、用户研究和客户部署需求,共同推动了Claude Code等产品的迭代。

2025年,火山引擎在中国MaaS市场份额接近一半,只是其飞轮转起来后的阶段性结果。

现在Agent热潮继续推高市场需求,行业一度出现算力供不应求。一些公司选择涨价,优化短期财务表现。火山引擎表示不会跟进。

这种定价克制,来自火山引擎对行业阶段的判断:比起获得更高的短期利润,当前更重要的是扩大调用规模、降低使用门槛、增加真实场景,让飞轮继续加速。

正如谭待所言,AI云的竞争是一场马拉松,才刚刚跑完一公里,现在的份额并不代表终局,“比速度更重要的是加速度”。

封面来源|视觉中国

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
定了!6月通车!西安超级枢纽正式上线,城东起飞沸腾了!

定了!6月通车!西安超级枢纽正式上线,城东起飞沸腾了!

木兮聊房
2026-05-08 18:09:03
新婚儿媳拒交陪嫁,婆婆怒扇她7耳光,次日婆婆痛哭:我错了

新婚儿媳拒交陪嫁,婆婆怒扇她7耳光,次日婆婆痛哭:我错了

青青会讲故事
2024-10-31 13:15:45
G2湖人107-125再输雷霆 球员评价:2人优秀,5人及格,2人低迷

G2湖人107-125再输雷霆 球员评价:2人优秀,5人及格,2人低迷

篮球资讯达人
2026-05-08 12:25:48
取消提前1年落户限制!南京鼓楼区2026年小学、初中招生入学工作实施办法

取消提前1年落户限制!南京鼓楼区2026年小学、初中招生入学工作实施办法

南京择校
2026-05-08 18:00:09
丘吉尔在回忆录中称,原子弹挽救日本,否则日本或将不复存在

丘吉尔在回忆录中称,原子弹挽救日本,否则日本或将不复存在

磊子讲史
2026-03-23 16:34:24
演都不演了!吴宜泽夺冠不到48小时,恶心的事情发生,还不止一件

演都不演了!吴宜泽夺冠不到48小时,恶心的事情发生,还不止一件

丁丁鲤史纪
2026-05-08 18:04:41
罗马诺:弗洛伦蒂诺已直接沟通球员,问题点是消息如何外泄的

罗马诺:弗洛伦蒂诺已直接沟通球员,问题点是消息如何外泄的

懂球帝
2026-05-08 01:11:13
中国版劳斯莱斯杀疯了!尊界S800销量碾压奔驰S级、迈巴赫、宝马7系、奥迪A8总和

中国版劳斯莱斯杀疯了!尊界S800销量碾压奔驰S级、迈巴赫、宝马7系、奥迪A8总和

快科技
2026-05-08 14:32:28
河南一景区海报文案欠妥引人不适,景区致歉:系追忆不同年代场景长廊,已下架整改更换

河南一景区海报文案欠妥引人不适,景区致歉:系追忆不同年代场景长廊,已下架整改更换

潇湘晨报
2026-05-07 18:55:16
卡西利亚斯:在我看来,阿隆索本是皇马最理想的主帅人选

卡西利亚斯:在我看来,阿隆索本是皇马最理想的主帅人选

懂球帝
2026-05-08 18:58:17
得内线者得天下!CBA全线陷入内线荒,多支强队暴露致命短板

得内线者得天下!CBA全线陷入内线荒,多支强队暴露致命短板

寒律
2026-05-09 00:13:13
意大利中国商会发布关于欧盟《网络安全法》修订草案的声明:对不合理措施坚决反对

意大利中国商会发布关于欧盟《网络安全法》修订草案的声明:对不合理措施坚决反对

证券时报
2026-05-08 21:32:05
一条传了近30年的谣言,澄清为何那么难?

一条传了近30年的谣言,澄清为何那么难?

网络辟谣
2026-04-27 08:11:30
老紫薇不需要老干部!杨超越翻身失败!

老紫薇不需要老干部!杨超越翻身失败!

八卦疯叔
2026-05-08 11:27:51
台官员曝赖清德成功返台内幕,大陆出手阻止未果,背后有难言之隐

台官员曝赖清德成功返台内幕,大陆出手阻止未果,背后有难言之隐

混沌录
2026-05-07 20:57:08
世界杯门票太贵,特朗普惊了:即使是我也不会花1000美元看比赛!央视拒绝花天价买转播权,底气何在?“国际足联可能已经慌了”上热搜

世界杯门票太贵,特朗普惊了:即使是我也不会花1000美元看比赛!央视拒绝花天价买转播权,底气何在?“国际足联可能已经慌了”上热搜

每日经济新闻
2026-05-08 14:58:09
日本:射程之内!

日本:射程之内!

新民周刊
2026-05-01 09:17:00
瘦肚子最有效的运动:不是卷腹,每天20分钟,干掉肚腩、秀出马甲线

瘦肚子最有效的运动:不是卷腹,每天20分钟,干掉肚腩、秀出马甲线

增肌减脂
2026-03-17 16:25:06
从52跌到1.7!30万散户被套,一股民持仓10年亏损148万

从52跌到1.7!30万散户被套,一股民持仓10年亏损148万

财经智多星
2026-05-03 09:27:25
北京开展“僵尸车”清理行动 公示7天无人认领将清拖

北京开展“僵尸车”清理行动 公示7天无人认领将清拖

极目新闻
2026-05-08 19:29:37
2026-05-09 01:03:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3154344文章数 7247关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

外籍银行高层在香港豪宅性虐及杀害两女子 内幕解密

头条要闻

外籍银行高层在香港豪宅性虐及杀害两女子 内幕解密

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

艺术
健康
游戏
旅游
本地

艺术要闻

惊艳私房摄影:感受真情与绝美画面!

干细胞能让人“返老还童”吗

PS未发售重磅独占要完!同类项目崩盘 新作悬了

旅游要闻

母亲节+护士节,临沂景区优惠合集暖心上线

本地新闻

用苏绣的方式,打开江西婺源

无障碍浏览 进入关怀版