电网在 AI 时代,正在变成一种“旧世界的基础设施”。
SemiAnalysis 深度文章《AI 实验室如何解决电力危机:现场天然气发电深度解析》称,电网又老又累,排队、审批、扩容等,都跟不上算力军备竞赛的节奏。
该机构曾在 2024 年 3 月的《AI 数据中心能源困境——AI 数据中心空间争夺战》报告里预测,美国 AI 数据中心用电需求会从 2023 年约 3GW 增长到 2026 年超过 28GW,并且会把供应链压到极限。
![]()
光是德州,每个月就有“数十吉瓦”的数据中心负荷接入申请涌入;但过去 12 个月里,获批的容量“几乎只略多于 1GW”,一句话结论是:电网已经“卖光了”。
这不是简单的“电不够”,而是“接不进来”:多年的输电升级周期、并网研究、许可流程,把算力项目卡在门外。
然而,AI 基础设施不可能等电网那种需要多年才能完成的输电升级。
一个 AI 云业务每新增 1GW 的算力数据中心,每年可创造 100—120 亿美元的收入。一个 400MW 数据中心哪怕提前 6 个月上线,都值几十亿美元。经济需求远远碾压“电网过载”这类问题。行业已经在寻找新方案。
18 个月前,埃隆·马斯克用 4 个月时间建成了一个 10 万张 GPU 的集群,震动数据中心行业。多项创新促成了这一不可思议的成果。
但最令人印象深刻的是其能源策略:xAI 完全绕过电网,在现场发电,使用卡车搭载的燃气轮机和发动机。
在一个 AI 实验室争夺“首个吉瓦级数据中心”的世界里,速度就是护城河。
这就是BYOG(Bring Your Own Generation,自带发电)。
很快,巨头们开始集体“暂时抛弃电网”。
2025 年 10 月,OpenAI 和 Oracle 下了史上最大一笔现场天然气发电订单:在德州建设 2.3GW 的 onsite gas 电站。
由此,现场燃气发电市场正在进入“年增速三位数”的增长阶段。
更关键的是,这波红利并不只属于 GE Vernova、Siemens Energy 这类传统燃机巨头。
还有三类“新玩家”浮出水面。
比如,韩国工业巨头斗山能源Doosan Enerbility 把 H 级燃机的发布时点卡得极准,并已拿到服务 xAI 的 1.9GW 订单。
比如,瓦锡兰 Wärtsilä 作为传统船用发动机厂商,意识到给邮轮供能的发动机同样能给大型 AI 集群供能,已签下美国 800MW 数据中心合同。
甚至 ,Boom Supersonic 这种做超音速飞机的公司,都宣布与 Crusoe 签下 1.2GW 的涡轮合同,把数据中心发电的利润当作其 Mach 2 客机研发的“另一轮融资”。
仅在美国,就已经有 12 家不同供应商,各自拿下超过 400MW 的数据中心现场燃气发电订单。
![]()
不过,现场发电也带来了自己的挑战。
比如,电力成本往往(明显)比走电网更贵。许可审批可能漫长且复杂,而且已经造成一些数据中心延误——最典型的是 Oracle/Stargate 某个吉瓦级设施。
但像 xAI 这样的聪明公司找到了应对办法。马斯克的 AI 实验室甚至“发明”了新的选址流程——把项目建在两个州的边界上,以最大化尽早拿到许可的概率!田纳西州无法按时交付时,密西西比州却乐于促成马斯克建设吉瓦级电站。
为什么电网会被逼到这种境地?
答案是:电网慢不是管理懒,而是“被设计成慢”。
尽管除马斯克外,今天几乎所有大 GPU/XPU 集群仍运行在电网之上,电网迄今是 AI 基础设施的主要支撑。
但转折点在于,2024–2025 上线的大型数据中心,其电力资源是在 2022–2023、“淘金热”之前就锁定的。淘金热之后,抢电变成了失控的争夺。
预计,美国公用事业公司与电网运营商收到的负荷接入申请规模,大约已经到了 1 太瓦(terawatt)的量级。
电网又为何会“堵死”?
大概有两个结构性原因。其一是实时平衡:电力供需必须在每一秒几乎完全匹配,失配会带来大范围停电风险,比如 2025 年 4 月伊比利亚半岛大停电。
其二是系统研究:任何大负荷(数据中心)或大电源(电站)的接入都会触发复杂的工程研究,以确保不破坏电网稳定。
而在一些地区,拓扑变化太快,负荷研究甚至会在完成前就过时。 当成百上千的开发者同时提交并网申请,系统就会陷入一种囚徒困境:如果大家能协调,电网可以更快处理更多请求;现实中,开发者会把投机性申请撒向多家公用事业公司占队列,导致队列更拥堵,反过来诱发更多投机性申请。
截至 2024 年中,AEP Ohio 收到 35GW 的负荷申请,其中 68% 甚至没有土地控制权。
同时,供给侧同样被锁死。从提出并网请求到商业运行,如今对多数发电类型而言,时间线已经拉长到约 5 年。
而 AI 基础设施开发商等不了 5 年。很多情况下,连 6 个月都等不了,因为等 6 个月就意味着数十亿美元机会成本。
于是 BYOG 登场——自带发电。
BYOG 的价值主张极其简单粗暴:不等电网,先跑起来。
数据中心可以靠本地发电长期运行,等电网服务最终到位,再把这些设备转为备电。这也正是 xAI 的策略:用移动燃气涡轮建 Colossus,把上线周期从“按年”缩短到“按月”,现在大家都在照着这套打法做。
这套打法具体怎么做的?
本质上,BYOG 需要彻底重写“建电站”的剧本。传统模式是依靠大型、集中式、吉瓦级的基荷电源,再配合较小的调峰电站应对电网尖峰负荷。
现代最常见的部署是重型燃气轮机的联合循环模式(CCGT)。其无与伦比的燃料效率(>60%)构成现代文明的骨架。
但问题在于部署速度:大型燃机通常需要数年交付周期,而当前交付周期已处于历史最高水平。交付后,一座大型联合循环电站的建设与调试大约需要 2 年——在 AI 时代几乎等同于“永远”。
AI 数据中心的 BYOG 电站重塑了打法,xAI 率先带路。为了更快部署,马斯克的 AI 实验室依靠 Solar Turbines(卡特彼勒 CAT 子公司)的 16MW 小型模块化燃机。这些燃机小到可以用普通长途卡车运输,部署只需数周。马斯克甚至没买——而是从 Solaris Energy Infrastructure 租用,以绕开设备交期。他还利用 VoltaGrid 的卡车载移动燃气发动机车队来进一步提速。
![]()
其他超大规模云厂商也迅速跟进。Meta 在俄亥俄与 Williams 的部署很有代表性:电站由五种不同类型的燃机与发动机构成,设计模式显然是“什么能按时拿到就先上什么”。
具体操作上,可以把“自带发电”拆成工程选型问题:到底有什么设备可用、各自的成本/交期/爬坡速度/可靠性/占地/效率是怎样的。
比如,现场发电设备可以按三大类归纳:燃气轮机(包括工业燃机 IGT、航改型 aeroderivative,以及更大的重型燃机)、往复式内燃机 RICE(3–7MW 的高速机与 10–20MW 的中速机,业内常简称 recips)、以及固体氧化物燃料电池 SOFC(目前主要来自 Bloom Energy)。
比如,衡量指标体系上,成本通常以 $/kW 计(而且各类设备成本都在上涨),交期按月或年计(需求增速超过供给导致交期普遍拉长),可靠性与冗余(以“几个 9”的 uptime 衡量),冷启动到满载的爬坡速度(决定能否做备电/调峰),土地占用(MW/acre),热耗率与燃料效率(BTU/kWh,热耗越高效率越低),以及是否能做 CHP 用余热做吸收式制冷、降低数据中心制冷用电等。
很多时候真正决定中标的,不是参数,而是谁产能更有空档、时间表更可信。
还有,如何选择燃气轮机?这方面,aeroderivative 与 IGT 对数据中心更匹配。
aeroderivative 本质上可以理解为“把喷气发动机拧到地上”,空间与重量效率极高;简单循环的 aeros 往往以 30–60MW 为一个包,冷态到满载可在 5–10 分钟完成爬坡,但在非满载稳定运行时效率会受影响;它也可以配置成小型联合循环(1x1 或 2x1),换取更高效率和更大输出,但启动时间会拉长到 30–60 分钟。
aeros 的全包 capex 大约在 1700–2000 美元/kW,交期 18–36 个月且还在变长;安装倒很快,通常 2–4 周,但工厂排产已经很满。xAI 的应对是租用可卡车运输的机组来绕开交期。
IGT 与 aeros 同属布雷顿循环,拥有紧凑、模块化、相对较快交期的优点,但它是为固定式应用从零设计的,通常在更低进气温度下运行,维护成本更低但效率与爬坡速度也更弱。
简单循环 IGT 的规模跨度约 5–50MW,冷态到满载约 20 分钟,单靠自身偏慢,难以独立承担应急备电或调峰,需要电池或柴油等辅助;IGT 也能升级联合循环,提高效率但进一步变慢。
当下 IGT 的全包 capex 约 1500–1800 美元/kW,交期大致 12–36 个月;但采购二手或翻新 IGT 可把交期压到 12 个月以内。比如,Fermi America 就用这种方式拿到电。
总体上,aeroderivative 与 IGT 很适合 onsite,因为尺寸“刚好”、爬坡够快且易于转作备电、运输安装不需要重型吊装体系;它们最大的麻烦是交期越来越长。
另一条路线是往复式内燃机(RICE)。
可以简单把它理解成一种“更像乐高”的电站:单机更小、台数更多、冗余更容易做。高速机与中速机的典型台功率区间是:中速机 7–20MW(通过涡轮增压可上更高),高速机 3–5MW;RICE 在 50%–80% 部分负载区间的效率往往优于涡轮。
成本上,目前 RICE 的全包 capex 约 1700–2000 美元/kW,交期 15–24 个月;制造周期更接近 12–18 个月,但中速机更重,安装与调试可长达约 10 个月。高速机部署可以更快,比如 xAI 在 Colossus 1 初期部署中用了 34 套 VoltaGrid 的卡车载系统。
但 RICE 不是没有代价。如果用 5MW 级发动机搭一个 2GW 的现场燃气系统,需要 500 台发动机。台数爆炸会带来运维后果:如果每台发动机每 2000 小时需要一次小维护,维护团队一年要做 2000 多次服务,接近每周 40 次。成本更可预测,但会累加成巨大的持续性负担,备件库存、场地占用也会跟着膨胀。
“模块化”背后的隐性账单很简单:快,是用复杂度换来的。
除了燃烧式设备,还有燃料电池。燃料电池过去相对小众,但正在拿走越来越大的一块蛋糕;Bloom 的 SOFC 不仅能用氢,也能用天然气,并被定位为基荷发电。
结构上,Bloom 的 Energy Server 由多个约 1kW 的堆栈组成,堆栈组成约 65kW 模块,再封装为 325kW 的发电单元;截至目前,最大的 SOFC 电站规模在几十 MW,主要在美国和韩国。
这一路线的优点是:它没有燃烧过程,意味着除了 CO₂ 外不会产生“实质性的空气污染物”,所以许可层面更顺滑、更容易在有人口的区域落地;而它的“杀手级特性”是部署速度,模块化使得从基础到并电可以做到“几周级”。与之相对的是成本压力:文中给出燃料电池系统 capex 可到 3000–4000 美元/kW,显著高于涡轮和 RICE。
但现场燃气发电的复杂性,还不在于选 LM2500 还是 Jenbacher,而在于如何配置、部署、运营,才能满足数据中心对 uptime 的要求。
电网是一套系统工程奇迹,能把成千上万台机组、无数条输电线与市场机制拼成一个长期平均 99.93% 可用性的供电体系;当你离开电网,你就要自己承担那套复杂性。因此在多数情况下,现场发电的电力成本会结构性地更贵,原因恰恰来自“为了可靠性必须做冗余”。
这一方面,目前有三条主流部署路径,几乎可以看成今天数据中心电力策略的“新三角”。
第一条是桥接电(bridge power):电网并网在排队,但数据中心先用 onsite 发电提前运营,几个月的提前上线就可能带来巨额收入差。
第二条是“永久离网”,把供电外包给 Energy-as-a-Service 厂商。以 VoltaGrid 为例,其会打包提供容量(MW)、电量(MWh)、电能质量(电压与频率容差)、可靠性指标(几个 9)、以及从签约到供电的周期;客户签长期 PPA,EaaS 厂商像公用事业公司一样采购设备、设计部署、维护运营。
第三条是为了追平电网的“三个 9”,不得不做“过建(overbuild)+备份策略”的组合:更高冗余、更复杂架构,甚至考虑把电网当作备份,或用电池做备份与稳频。
这种冗余处理很尴尬,听起来像“车上既有备胎又有补胎工具”。
以一个 200MW 数据中心为例,如果用 11MW 的 RICE 做 N+1,可能配 26 台、总装机 286MW,正常运行时 23 台以约 80% 负载出力,坏一台就让其余略抬负载,另外保留几台做维护或冷备。
比如,Nexus Datacenter 申请了三十台 20.4MW 燃气发动机(总 613MW)并配 152MW 柴油备份,来满足冗余要求。 如果用 30MW 级 aeros,可能配 9 台总 270MW,正常 7 台接近 95% 负载、坏一台就启第 8 台、第 9 台留维护。
而在更热的气候里,还可能需要 10–11 台才能维持 N+1+1。
Crusoe 在得州 Abilene 为 Oracle 与 OpenAI 的站点,采用了类似思路:十台涡轮混编,其中五台是 GE Vernova 的 LM2500XPRESS 航改型燃机、五台是 Titan 350,总名义装机 360MW。
更“现实主义”的,是 Meta 与 Williams 在俄亥俄 Socrates South 的做法。它看起来像是 time-to-power 驱动下的拼装车:同一个围栏里混了 Solar Titan 250、Solar Titan 130、Siemens SGT-400 这几类 IGT,又配了 15 台 Caterpillar 的快速启动发动机。围栏内名义装机 306MW,其中约 260MW 来自涡轮、46MW 来自发动机,正常由部分 IGT 稳态跑 200MW,IGT 若跳机则由 RICE 快速顶上,其他 IGT 留作维护切换,从而做出 N+1+1 的 behind-the-meter 设计。
这相对前两个案例更“拼布”,涡轮型号不统一、发动机也更小,说明 Williams 把“按时通电”放在了维护标准化之前。
冗余为什么会变成 onsite 电“结构性更贵”的根?这里有个过建比例的实战样本。
在德州 Shackelford County,VoltaGrid 用 2.3GW 的 Jenbacher 系统去供一个 IT 容量 1.4GW 的数据中心,相当于 64% 的 overbuild。这 64% 里,一部分是典型德州站点的 PUE 过配(1.4x–1.5x,主要与制冷有关),另一部分是为冗余额外付出的 10%–17% overbuild。
对 H/F 级重型燃机系统而言,单纯“堆冗余”未必是最经济的路径,有些运营商开始考虑把电网仅作为备份,但这又会引入并网周期与选址对高压线的依赖;也有人考虑建巨型电池站,但在典型 2–4 小时储能时长下既昂贵也不够实用;还存在 H 级联合循环当基荷、IGT/aeros/RICE 当备份的混合方案,但通常比“电网备份或 2–4 小时 BESS”更贵。
还有个因素是AI 训练负载的“电性格”。训练负载高度波动,存在 MW 级的突增突降,且可能在亚秒级发生。一个电力系统的惯量越大,就越能在短期波动中维持频率稳定;频率偏离 50Hz/60Hz 过多会导致断路器跳闸或设备故障。热机组天然有惯量,因为发电依赖高速旋转的重物,但离网系统往往还需要额外手段增强稳频能力,这也是“电网级可靠性”背后的隐形工程。
可见,BYOG 的胜负不只取决于设备参数,更取决于谁能在许可、交期、冗余设计、稳频与运维组织上,把“几个月”抢出来,同时把 uptime 做到接近电网。
![]()
最后的压力可能转移到了供给侧,如果大家都选择自建电,燃机与相关设备产业链能不能供得上?
现实情况是, aeros 也好、IGT 也好、RICE 也好,交期都在普遍变长——很多时候决定项目成败的,是“谁能按时交货”。
于是,AI 的电力战争不再只是数据中心之间的战争,它把燃机制造商、发动机厂商、燃料电池厂商、EaaS 供电服务商、许可与选址体系、甚至州与州之间的政策友好度,全部卷进同一张竞速网络里。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.