网易首页 > 网易号 > 正文 申请入驻

从 Others 到挑战者第一,火山引擎没有错过大模型

0
分享至



大模型开始让中国云计算行业格局发生变化。

文丨贺乾明

火山引擎团队最近为一个 “坐标” 感到振奋。

11 月 17 日,国际市场调研机构 Gartner 发布 《AI 应用开发平台魔力象限》。这份报告中,火山引擎凭借豆包大模型和火山方舟大模型服务平台,在 “挑战者” 象限排名第一。在落地能力指标上,火山引擎仅次于 Google、AWS、微软、IBM 四家海外云计算公司。



据了解,Gartner 评估的 AI 应用开发平台,主要是云计算行业常说的 MaaS(模型即服务)平台。因为毛利高、潜力大,MaaS 是当前各大云计算公司看重的业务方向。

在权威市场调研报告中排名前列,在火山引擎 5 年的发展历程中并不多见。

2020 年 6 月正式上线以来,比中国云计算同行晚 10 年的火山引擎尝试各种方向,从数据驱动增长服务到云原生,增长始终缓慢。无论是在行业报告还是市场认知中,火山引擎经常被归于 “Others”。对于一个被字节寄予厚望的业务来说,无疑是一种煎熬。

直到大模型爆发改变了云计算行业的竞争规则,火山引擎迎来弯道超车的机会。“这几年 AI 快速普及,我觉得挺幸运的。” 火山引擎总裁谭待今年接受我们访谈时说。

大趋势对所有参与者都是公平的。过去三年,火山引擎在 AI 领域激进投入,展现出极强的战斗力。Gartner 之前,也有市场调研机构 IDC 发布数据,2025 年上半年中国公有云大模型服务市场,火山引擎以 49.2 % 的份额占比位居中国第一。

这背后,不仅有火山引擎 “必须赢” 的意愿和战略决心,也离不开字节体系饱和式的资源投入和能力支撑。

渴望增长的火山引擎,更激进地押注 AI

火山引擎从上线开始,就是字节高层寄予厚望。他们认为,做好火山引擎对字节成为一家优秀的科技公司、保持技术竞争力很重要,把其视为公司战略级业务。

2021 年,谭待给火山引擎写了一份商业计划书,定下千亿年收入的目标。在同一年,中国云计算市场的第一名阿里云,年收入也才刚到 600 亿。

如何实现这一目标,成为火山引擎团队的难题。在以 CPU 为算力底座的传统云计算市场,火山引擎的发展缓慢。他们无论提供字节的增长经验 “数据驱动增长”,还是押注云计算领域的新方向 “云原生” 服务,都没能带来太多收入增长。

云计算是一个先发者占优势的市场。有需求的客户早已与头部的云厂商绑定,数据迁移成本高,业务流程盘根错节,后来者很难撼动。即便是企业出于分散风险考虑采用 “多云策略”,火山引擎也要面对一长串竞争对手。

而且它还要面临中国云计算行业的共同难题:平台依赖的电力、带宽等基础设施成本并不受企业自身控制;大量传统企业出于数据安全、合规或历史惯性等原因,仍倾向于自建数据中心。

“那是一个存量的市场,增长就是慢。” 火山引擎的管理层判断,只有技术迭代时,他们才能有迅速增长的空间。他们评估了区块链、元宇宙、AI 等多个技术方向后,决定押注 AI。

AI 的基础设施依赖 GPU,而不是原有云计算平台曾大力投入、建立规模优势的 CPU 芯片。在这个增量市场上,所有的云公司基本在同一条起跑线上。

而且 AI 的爆发也会催生一批新的公司,“它们往往不是云计算领域的传统客户”。 在他们看来,这会是一个比肩互联网、移动互联网起步的机会,市场上原本的大型云平台,都是跟着新技术变革发展壮大。

那时云计算行业对 AI 技术发展潜力还没有形成共识。当时整个行业能够消耗大量资源的客户只有少数自研自动驾驶系统的公司,它们也想着自己组建数据中心,给云计算厂商提供的增长空间不大。在 2021 年前后,多数云计算公司都没有采购太多 GPU,甚至会退单。一直寻求增长空间的火山引擎坚持了下来。

直到 2022 年下半年,火山引擎发现一些大模型创业公司,如 MiniMax、智谱等,开始在火山引擎上训练大模型,随后 OpenAI 推出 ChatGPT,他们意识到增长机会可能就要来了。

火山引擎有相对独特的卡位。一位云计算从业者说,传统的云计算公司面对大模型技术多少都有包袱,他们的多数收入来自出售虚拟机、存储等资源,想要朝着新方向迅速发力比较困难。而火山引擎没有那么多负担,可以更激进地调整架构,让它更适应 AI 时代。

而且字节有中国最大的推荐引擎算法模型,在 2022 年就需要把数千张 GPU 做成单一集群训练模型。火山作为字节的云服务供应商,积累了训练大规模模型的经验。

2023 年 4 月,火山引擎举办发布会,宣布中国做大模型的公司七成在火山引擎上。两个月后,火山引擎团队把过去训练大模型的套件整合成服务平台 “火山方舟”,为企业客户提供大模型精调、推理、评测、部署等服务。

“很多公司选择火山,不是因为我们有卡,而是因为我们能够稳定地把模型训练出来。” 谭待说。

不过到年底,大模型行业的格局就发生了变化。海外开源模型成熟,中国企业从头自研大模型的热情开始退却,直接购买 GPU 算力的客户大幅减少。有限的客户也面临着更激烈的竞争,阿里投资了多家大模型创业公司,一部分投资额度被折算为阿里云算力资源。

与此同时,大模型调用成本下降,企业客户开发大模型应用的热情高涨。火山引擎内部达成共识:大模型的算力使用,将从训练大模型为主转移到使用大模型(推理)为主。

他们决定重点发力 MaaS 产品,Token 消耗量成为业务发展的核心指标。

我们了解到,火山引擎也调整了销售团队的业绩考核指标,把销售 MaaS 产品排在第一位。销售卖同等价格的 MaaS 产品得到的回报,要比卖传统云服务更高。明年,火山引擎也会延续这一策略。

字节饱和式投入 AI,火山引擎增长的助力

云计算本质上是体系的比拼,市场上排名靠前的云公司都有庞大的业务体系托举。

火山引擎成立并不是像 AWS 或者阿里云诞生时那样,集团要单独开一个新业务,而是字节的成熟技术外溢。字节高层也希望火山引擎对外提供技术服务获取收入的同时,也能反过来强化公司的技术能力。

这一定位决定,火山与字节其他业务的组织联系要比其他云平台更紧密。“字节做火山一个重要的原则就是技术内外同源。” 谭待说,火山的基础设施方面就和字节复用一个大团队,保证体系能够协调在一起。

因此字节决定 “饱和式投入”AI 时,整个体系的力量都能高效地传导至火山引擎。火山引擎有专门的团队参与到 Seed 部门的模型研发中,同时 Seed 部门训练出来的模型,也是火山引擎对外提供 MaaS 服务的基础。

在产品侧,字节的 Flow 部门开发了从软件到硬件、覆盖多个方向 AI 应用,它们都通过火山引擎的 MaaS 平台调用大模型。字节在抖音、飞书等产品中加入大模型功能时同样如此。

这让火山引擎在大模型发展的早期阶段就具备了规模效应。火山引擎近期公布,到今年 9 月,豆包大模型的日均使用量超 30 万亿 tokens,已经逼近国外科技巨头。

不论是训练大模型还是对外提供服务,都是规模生意。训练领先的大模型需要投入海量资金。字节跳动的体量和决心,使其能够招揽一批研究者,并积极采购可用算力,高强度地研发、迭代大模型。

大模型的应用也只有上了规模,才能够找到更多优化空间,成本才有可能被压低。2024 年 5 月,火山引擎宣布大幅降低豆包大模型的调用价格,核心语言模型的定价一度比同行低 99.3%,主要的目的就是扩大火山引擎上的大模型使用规模。

“规模大了,服务器多、负载高,天然就对技术有很高的要求,会强迫我们做好各种事情。” 谭待曾说,规模大了后,做优化收益也很大,“ 1 万台服务器利用率优化一个点,和 100 万台服务器优化一个点,收益差 100 倍。可以组建强大的团队做得更好。”

字节的饱和式投入 AI ,也让火山引擎在大模型领域有了垂直优化的空间。美国管理学家克莱顿·克里斯坦森(Clayton Christensen)在提出 “创新者窘境” 理论后,曾在《创新者的解答》中补充:当新技术还不能满足用户的主流需求时,那些 “垂直整合”“封闭架构”,能够掌控关键部件的公司,往往能在各个环节榨取性能,从而获得更大的竞争优势。

Gartner 的《AI 应用开发平台魔力象限》也在一定程度上印证了这个理论。在 ChatGPT 爆发之初,Google 是被 OpenAI 和微软组合冲击最大的一方。现在从 “落地能力” 和大模型能力来看,Google 排名全球第一。他们能够迅速反超,除了拥有丰富的技术储备和顶级研究人员,还在于 Google 能从芯片(TPU)、软件开发平台、大模型到全球产品的垂直整合能力。

火山引擎很难像 Google 那样,在国内做到从芯片到软件的垂直整合。不过它也凭借字节的 AI 体系尽可能建立了从模型、到平台再到产品的整合。

谭待说,火山引擎不仅在这个体系中优化技术,也获得了客户线索,“很多客户都会拿着跟豆包(应用)的聊天 Case 找过来,问火山引擎能不能在企业场景中实现类似的效果。”

据火山引擎披露,现在他们的大模型服务已经覆盖八成头部咖啡茶饮品牌、九成主流汽车品牌、八成头部券商、八成系统重要性银行、七成 985 高校、9 家全球出货排名前十的手机厂商等。

大模型服务市场规模还小,但让云计算行业发生变化

Gartner 的 AI 应用开发平台魔力象限报告只是一个阶段总结。如果只是看这个细分市场,规模与整个云计算领域相比仍有巨大差距。

根据市场调研机构 IDC 的报告,2025 年上半年中国 MaaS(模型即服务)市场规模只有 12.9 亿元人民币,但增速达到 421.2%。

“这个事太早期了。” 谭待此前说,他会告诉团队 “马拉松才跑 500 米,别取得一点点小成绩就满意了。”

火山引擎也在积极布局新的增长点:Agent(智能体)。今年举办的多场发布会上,火山引擎介绍的技术方案几乎全部围绕着 Agent。

在谭待看来,过去的云平台为网页和 app 设计,其上限是 “全世界所有人的时间总和”。而 Agent 能自动思考、规划并执行任务,它工作的总时长将远超 app 时代的天花板,“能创造更大的经济价值”。

火山引擎积极押注大模型,已经开始推动中国云计算行业的格局发生变化。我们了解到,火山引擎在大模型领域的增长也在带动其传统云计算服务。目前火山引擎一定比例的 CPU 算力、数据库等需求来自大模型客户。

在谭待的规划中,当年定下的千亿目标,大模型市场会占到一半多,剩下的都会来自存量市场。这意味着,火山引擎也在把 AI 当作撬动存量市场的杠杆。

据了解,火山引擎今年的收入目标是突破 200 亿元人民币,同比增长超过 100%。这个体量与行业头部云厂商年收入千亿元的规模还有差距,但它也是一个信号:火山引擎不只是 Gartner 细分领域报告中的挑战者,也正在成为中国云计算领域的挑战者。

不过头部的云计算公司同样在 MaaS 方向上发力,它们正在利用过去积累的存量客户、企业端的销售经验等,把 AI 能力集成到客户已有的云服务中。火山引擎的发展,也会是一场艰难的攻坚战。

题图来源:Top Gun: Maverick

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不可错过!3月26日晚间19:00比赛!中央5套CCTV5、CCTV5+直播表

不可错过!3月26日晚间19:00比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-03-26 15:33:07
为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

侃神评故事
2026-03-10 18:50:04
4.0 英寸 4050mAh 还有实体键盘!这绝对是今年最酷的新机了

4.0 英寸 4050mAh 还有实体键盘!这绝对是今年最酷的新机了

科技狐
2026-03-25 22:34:58
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
张凌赫和田曦薇,谢谢你俩让我看到了真人秀有多假

张凌赫和田曦薇,谢谢你俩让我看到了真人秀有多假

草莓解说体育
2026-03-26 14:17:01
加时被逆转!申京:一切发生太快!杜兰特:在胡打,我该果断出手

加时被逆转!申京:一切发生太快!杜兰特:在胡打,我该果断出手

篮球资讯达人
2026-03-26 15:28:40
新华社消息|覆盖全民!我国加快建立长期护理保险制度

新华社消息|覆盖全民!我国加快建立长期护理保险制度

新华社
2026-03-25 23:15:12
好辣眼睛!黄多多穿三点式泳装,20岁身材矮小,在国外思想开放

好辣眼睛!黄多多穿三点式泳装,20岁身材矮小,在国外思想开放

章眽八卦
2026-03-26 13:22:27
炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

澜归序
2026-03-26 06:08:07
面相这东西真藏不住,停播一个半月的李亚鹏,

面相这东西真藏不住,停播一个半月的李亚鹏,

小光侃娱乐
2026-03-26 16:05:08
押注中国!迪拜资本大转移,数千亿真金白银连夜搬家到东方

押注中国!迪拜资本大转移,数千亿真金白银连夜搬家到东方

小舟谈历史
2026-03-25 06:28:02
发生了什么?午后,沪指再度失守3900点

发生了什么?午后,沪指再度失守3900点

每经牛眼
2026-03-26 15:25:31
李鑫认亲第3天!姐弟闹掰再次失联,姐姐深夜哭诉,养家姐姐发声

李鑫认亲第3天!姐弟闹掰再次失联,姐姐深夜哭诉,养家姐姐发声

离离言几许
2026-03-26 12:11:37
俄警告绝非空言:暗杀伊朗领导人,正在打开中东战乱的潘多拉魔盒

俄警告绝非空言:暗杀伊朗领导人,正在打开中东战乱的潘多拉魔盒

华人星光
2026-03-24 11:45:23
鹅蛋营养价值惊人,发现:常吃鹅蛋的人,不用多久,或有4个改善

鹅蛋营养价值惊人,发现:常吃鹅蛋的人,不用多久,或有4个改善

垚垚分享健康
2026-03-23 17:30:11
000968,午后垂直涨停!油气概念股,集体异动!

000968,午后垂直涨停!油气概念股,集体异动!

证券时报e公司
2026-03-26 16:05:07
日媒:政府出手后,日本汽油价已降至7.71元/升

日媒:政府出手后,日本汽油价已降至7.71元/升

随波荡漾的漂流瓶
2026-03-25 15:39:49
剖腹自尽?日本陆自军官持刀冲入中国大使馆,想杀中国外交员!

剖腹自尽?日本陆自军官持刀冲入中国大使馆,想杀中国外交员!

军武次位面
2026-03-26 14:26:42
如果美国解体,犹太财阀的巨资何处安放下一个宿主,答案超乎想象

如果美国解体,犹太财阀的巨资何处安放下一个宿主,答案超乎想象

芳芳历史烩
2026-03-25 22:24:25
张雪峰传奇人生揭秘:父母下岗,大学考上郑大,第一份工作开饭店

张雪峰传奇人生揭秘:父母下岗,大学考上郑大,第一份工作开饭店

谈史论天地
2026-03-25 07:26:54
2026-03-26 17:56:49
晚点LatePost
晚点LatePost
晚一点,好一点。商业的真相总是在晚点。《晚点LatePost》官方账号
3127文章数 21909关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
房产
手机
旅游
家居

皮衣+裙,高级到炸

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

手机要闻

顶配Ultra旗舰!vivo X300 Ultra配置公布:骁龙8E5+2K/144Hz直屏、8.19mm机身

旅游要闻

视点|陶然亭公园海棠春花文化节,解锁春日新体验

家居要闻

傍海而居 静观蝴蝶海

无障碍浏览 进入关怀版