网易首页 > 网易号 > 正文 申请入驻

盘点2025:模型服务,成为基础设施

0
分享至

AI持续狂奔的2025年,大模型API基础设施化,成为最鲜明的注脚。

本月,国际市场调研机构英富曼(Omdia)发布了《2025全球企业级MaaS市场分析》报告:截至2025年10月,OpenAI、谷歌云、火山引擎分别占比31%、19%、15%,三家模型厂商合计占据全球MaaS市场65%的份额。ChatGPT带来的大模型技术变革仅3年,全球MaaS(模型即服务)市场格局初步形成。


Omdia报告中,火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿。

作为全球前三中唯一的中国厂商,火山引擎正在凭借 MaaS 服务在 AI 云市场快速突围。12月29日,火山引擎官宣成为总台春晚独家 AI 云合作伙伴,一并公布了豆包大模型的最新日均调用量,63万亿 Tokens,持续高速增长。

在大模型API成为基础设施的2025年,依旧有“MaaS薄、MaaS市场窄”的声音。2023年之前,没有MaaS这一商业模式,谈品牌忠诚度也还是太早了,用户总是会选择下一个更有性价比的模型服务。

但改变就这么发生了,推出不到600天,豆包大模型的调用量呈指数增长。


据《晚点》,今年火山引擎已实现100%的同比增长,营收超200亿。由于MaaS商业化和模型迭代超预期,火山引擎原来计划于2030年实现的 1000 亿营收目标,又上调了百分之几十。

“MaaS优先,加速度的600

更早地意识到MaaS的重要性,火山引擎投入早、投入的精力和资源多。

过去两年,MaaS作为这家公司的第一战略优先级目标,体现在火山引擎全员会上、在员工的OKR里,更体现在具体的销售激励和产品研发上。

2024年5月15日,火山引擎首次推出豆包大模型家族的API服务,通过模型架构、推理框架等技术创新,将主力模型定价从行业的“分计价”拉入“厘计价”时代,降幅高达99.3% 。伴随着更多模型厂商跟进的降价潮,MaaS市场就此迎来“从无到有”般的增长。

2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发。在部署同一个开源模型的大考中,火山方舟的各项模型部署性能领先,火山引擎也顺势成为市场上吃到最多DeepSeek推理服务红利的云厂商。

IDC报告显示的中国公有云大模型调用量月度环比增长中,显示了这两个关键的增长拐点。可以说,豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场。


中国公有云大模型调用量月度环比增长中,2024年7月和2025年2月中增长率最高。|来源:IDC

DeepSeek-R1之后,不断迭代的豆包大模型接棒Tokens调用量继续增长。

2025年6月以来,豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、豆包图像编辑模型SeedEdit、豆包语音模型2.0、豆包图像创作模型Seedream4.0、豆包大模型1.8、视频生成模型Seedance 1.5 pro等模型相继发布。每一次模型能力的提升,解锁了更多的应用场景。

伴随模型发布节奏,几乎每3个月,模型调用就会迎来一次更陡峭的增长。

2025年,Token跳动,成为基础设施,越来越多的头部云厂商,把 MaaS 当做业务长期成功的首要指标。在AI应用逐渐渗透的过程里,MaaS成为最大的幕后功臣。

与MaaS市场一同壮大的火山引擎,也顺势进化为“Token跳动”公司,率先迈向AI云。


火山引擎总裁谭待

IDC显示,2025年H1,火山引擎大模型公有云服务扩大到49.2%,中国公有云上每产生的两个tokens就有一个由火山引擎生产。此外,Gartner®发布的2025年度全球《AI应用开发平台魔力象限》中:凭借豆包大模型和火山方舟大模型服务平台 ,火山引擎领跑全球“挑战者”象限。在“执行能力”上,火山引擎位于全球第五、中国第一。

大的模型调用量,才能打磨出更好的模型和Infra

谈及把MaaS当作第一优先级时,谭待曾表示,看长期就会更早意识到MaaS的重要性,比如想想十年后的云跟现在有什么变化,而不是明年。这让火山引擎在中国MaaS市场加起来只有几亿人民币时,坚定执行MaaS战略优先。

2024年5月第一次推出豆包大模型对外服务的发布会上,他表示,“大的使用量,才能打磨出好模型,并且大幅降低模型推理的单位成本。”


豆包大模型家族

换句话说,大模型调用量越大,模型在B端场景的反馈和需求,比如:是否被用起来、哪些场景用得多用得好、哪些场景用不起来等,都可以反映在下一代模型等路线图里,让Seed团队训练出B端场景更加智能的模型。相反,如果是私有化部署,就没有这样的反馈来做真实世界的评测集。

同时,大的模型调用量,也会迭代出更极致的Infra。举例来说,以当前豆包APP日活1亿且免费的前提,决定了其对火山引擎在KV Cache优化上的要求会极其严苛。同时,在大模型平台的性能和工具易用性上,如果不是有非常大的调用量,Infra层面的各种corner case和新需求,甚至也都没有见过,也就不能在2024年5月通过PD分离、xLLM推理框架等方式,降低模型推理价格。

当然,大的模型调用量也会进一步优化MaaS服务的毛利率。对于火山引擎这样体量的调用量来说,MaaS服务已成为增长最快、毛利最高的AI云计算产品。一个可以参照的对象是,今年2月底,DeepSeek官方公布自己推理服务的最高成本利润率可达545%。

用火山引擎,薅字节的技术羊毛

如果上述视角是火山引擎选择MaaS份额第一为优先级目标的理由,那么63万亿日均Tokens调用量——用户的用脚投票,则来源于字节跳动的溢出效应。

谭待在媒体报道里讲过最多的一个观察,似乎是火山引擎在B端(企业客户)和C端(个人用户)的极致协同。他常说,字节的 C 端产品有大量用户,会大规模调用模型,能帮火山把服务做好,同时,豆包 App 也帮了不少忙,很多客户都会拿着跟豆包的聊天 Case 找过来,问火山引擎能不能在企业场景中实现类似的效果。企业用好AI,可以先下个豆包感受一下。


以前在ToB行业,做购买决策和开发产品的人不用最终的产品,所以很多ToB产品在流程管理上,比用户体验重要得多。但AI其实会让 ToB 和 ToC 更近一些。有了 AI 之后,动动嘴就能用起来大模型和Agent,产品体验好不好立竿见影,这时候,C端产品体验好就很关键,会给火山引擎带来很大的增益,因为字节跳动对做好产品体验比较擅长,也有洞察。

服务这些“内部客户”的时候,火山引擎知道模型和Infra上的痛点在哪,就能够去不断地提供各种方案。在 AI 的实践上,字节跳动走得更靠前,做了很多Agent,比如豆包就是一个最大的 Agent,即梦也是,字节内部 50 多个业务线在不断尝试。

在谭待看来,最重要的是认知,ToC 和 ToB 的协同有巨大优势,不仅是品牌上的协同优势(豆包APP和豆包大模型),而在于在这个过程中获得的know-how。企业想把 Agent 做好,要找最懂的人来做,火山引擎不仅自己做了,而且把量级做起来了,是做出来的认知。

事实上,作为字节跳动旗下云与AI服务平台,火山引擎自2020年以来通过把字节跳动的数据增长方法论、推荐算法、内容生态等以工具的形式外溢,同时利用抖音对服务器的规模优势外溢低成本、弹性的云服务。2022年,火山引擎发现了自动驾驶、科学计算、大模型等场景,2023年推出了模型训练服务,直到2024年,终于在模型推理服务上迎来新空间。

把能力服务化、商业化是一个过程,大模型时代,火山引擎赶上了好时机,放大了字节跳动的技术溢出。

云计算本质上是规模体系的比拼,目前市场上头部云厂商的崛起,都有庞大的业务体系托举。尤其当大模型技术投入非常大时,如果没有一个能够外溢的业务,很难保持足够的领先,AWS、谷歌、阿里无一例外。

今年6月,字节跳动CEO梁汝波在火山引擎发布会致辞时也曾表示,字节跳动决心做好技术,必须在更大的市场、更多的场景去服务客户,经受市场的检验,才算是真的好。同时,字节跳动致力成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。

MaaS第一后,火山引擎的下一步

在12月举办的Force大会媒体群访时,谭待曾表示,MaaS份额第一后,火山引擎的目标依旧是MaaS优先。当前模型服务主要集中在 ToC 行业,比如互联网公司、智能制造、消费电子以及汽车行业,随着模型应用进入更深的领域,以Agent为技术主体的AI云原生成为新需求,对模型和工具也会提出新要求。

他表示,火山引擎致力于降低 AI 应用的门槛,通过更高层次的封装,通过成本优化,加速AI普惠。

在基础的 MaaS(模型即服务)层,追求模型效果越来越好、成本越来越低,同时易用性提升。随着客户需求的推动,用模型 API 需要选模型、调 Prompt,火山引擎推出了Prompt Pilot、Model Router和Responses API,把一些工具内嵌进去,这样应用做起来更简单。

在更底层,火山引擎这个月还推出了模型的推理代工服务。客户可以直接把自己的模型托管在方舟上,像使用豆包模型服务一样方便,不需要自建底层设施。

MaaS 往上是 Agent 开发和Agent运营,随着应用迈向以 Agent 为技术主体,以模型为中心的AI云原生架构正在形成。新架构中,模型是软件的核心,MaaS 是使用模型的最佳方式,同时围绕 Agent 开发和 Agent 运营,云平台和中间件进一步把 Tokens 组装成 Agents,并实现 Agent 和现有工作流、Agent 和 Agent 之间的智能互通。


作为国内率先推出Agent开发、运营全套产品的云厂商,在谭待看来,过去如果模型服务用得很浅,比如只是拿模型做数据打标,模型API 的确随时可换。但如果要做的事情很复杂,比如视频创作时,要把客户画像跟模型结合,针对不同人群创造不同视频,并在里面融入私有数据、特定画风;做完这些模型微调,还要端到端地跑通、把一个 Agent 做好,那还需要身份认证、各种组件。

更进一步,当客户需求更多追求直接能解决问题,把模型串联到一起做一个Agent,把Agent封装为API的新方式出现了。近日,豆包助手API,即梦API都已经通过火山引擎对外提供服务。

就像红杉美国一直在讲10万亿美金的agent市场,从Agent的结果来看,商业逻辑就从tokens调用的IT预算,变成了BPO(人力外包)的角度,市场天花板也就变成全球客服市场有多大、全球开发程序员市场有多大,Agent会把原来的市场扩大很多倍。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
尴尬 22岁夏思凝社媒晒性感视频 网友留言:吴艳妮我好爱你,真的

尴尬 22岁夏思凝社媒晒性感视频 网友留言:吴艳妮我好爱你,真的

风过乡
2026-03-25 10:56:58
干翻埃尔法?尊界MPV实车曝光,前脸照搬S800

干翻埃尔法?尊界MPV实车曝光,前脸照搬S800

泡泡网
2026-03-26 11:21:11
“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

新京报
2026-03-26 20:41:35
山姆曲奇礼盒紧急下架!监管部门:已立案

山姆曲奇礼盒紧急下架!监管部门:已立案

中国品牌
2026-03-26 19:00:21
“我的部长同学进去了”

“我的部长同学进去了”

霹雳炮
2026-03-21 16:58:17
一口气刷完全集,Netflix新剧又杀疯了

一口气刷完全集,Netflix新剧又杀疯了

来看美剧
2026-03-26 19:45:54
章泽天看展带火春日穿搭叫“针织衫+弯刀裤”,配色清新很少女!

章泽天看展带火春日穿搭叫“针织衫+弯刀裤”,配色清新很少女!

明星私服穿搭daily
2026-03-26 09:44:53
马筱梅晒儿子满月宴!六菜一汤连家宴都不算,婆婆没表示也不重视

马筱梅晒儿子满月宴!六菜一汤连家宴都不算,婆婆没表示也不重视

乐悠悠娱乐
2026-03-26 15:02:11
重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

澜归序
2026-03-26 06:02:38
马筱梅晒儿子满月宴伴手礼!板栗饼干好简单,没婆婆撑腰不敢高调

马筱梅晒儿子满月宴伴手礼!板栗饼干好简单,没婆婆撑腰不敢高调

东方不败然多多
2026-03-27 00:04:06
路虎“大揽胜亮相 长5.1米,大6座,售30万起?

路虎“大揽胜亮相 长5.1米,大6座,售30万起?

网上车市
2026-03-26 21:41:53
C罗儿子要加盟皇马?15岁迷你罗试训皇马,C罗的7号后继有人

C罗儿子要加盟皇马?15岁迷你罗试训皇马,C罗的7号后继有人

仰卧撑FTUer
2026-03-25 23:05:29
皇马“6300万金童”到底怎么了?全阿根廷都在等他打脸质疑者

皇马“6300万金童”到底怎么了?全阿根廷都在等他打脸质疑者

仰卧撑FTUer
2026-03-26 23:09:03
18岁少女发明净水黑科技:无滤芯循环过滤,微塑料去除率超95%

18岁少女发明净水黑科技:无滤芯循环过滤,微塑料去除率超95%

DeepTech深科技
2026-03-25 13:48:24
张雪峰灵堂布置疑曝光,一侧挽联有深意,遗照选了大家熟悉的那张

张雪峰灵堂布置疑曝光,一侧挽联有深意,遗照选了大家熟悉的那张

揽星河的笔记
2026-03-26 19:04:02
高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

古怪奇谈录
2025-10-16 10:53:42
家里出贵人,必有征兆:孩子有这3点,必定大富大贵

家里出贵人,必有征兆:孩子有这3点,必定大富大贵

金沛的国学笔记
2026-03-23 10:29:42
台积电已经无法向美国交代了!张忠谋没有说谎:台积电也无可奈何

台积电已经无法向美国交代了!张忠谋没有说谎:台积电也无可奈何

顾史
2026-03-20 22:13:27
这几个指标正常,证明你的心脏基本没啥大问题,不要再乱检查了

这几个指标正常,证明你的心脏基本没啥大问题,不要再乱检查了

健康之光
2025-12-17 07:35:04
郑裕彤家族为什么不自救?不是说香港豪门隐形资产很多么?

郑裕彤家族为什么不自救?不是说香港豪门隐形资产很多么?

担扑
2026-03-26 17:02:51
2026-03-27 03:11:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248338文章数 621905关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
艺术
旅游
家居
军事航空

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

家居要闻

傍海而居 静观蝴蝶海

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版