深度拆解AI数据中心：一场速度与效率的竞赛|信号|电力|负载|可靠性|燃气轮机|智能设备

分享至

算力的竞争，正在变成一场电力的竞赛。

步入2026年，真正决定AI基建成败的战场，不再是芯片实验室，而在变电站、燃气轮机和海底光缆的交汇处。

4月底，硅谷101与Power HF在硅谷联合举办了一场围绕数据中心展开的活动（Scaling AI：The Infrastructure, Energy & Capital Triangle）。来自AI基础设施、能源工程与资本市场的五位嘉宾，为现场的100多位观众拆解了这场跨越全球的算力之争：电力，从哪里来？数据中心，谁在建？钱，谁来出？

我们的嘉宾包括：

Alex Yeh，GMI Cloud创始人兼CEO。GMI Cloud是全球六家英伟达参考平台云合作伙伴之一，目前管理横跨亚洲、美国东西海岸及欧洲的九个数据中心，并于近期宣布5亿美元AI工厂计划。
David Xu，Power HF董事长兼CEO。上市公司Power HF（华丰股份，股票代码：605100）创立于1920年，总部位于上海，国际运营中心设于新加坡，在中国与印度均设有制造基地。
Harish Jere，Power HF集团CTO兼印度CEO。有横跨石化、电信与基础设施领域近四十年从业经验，曾主导超过25000个电信站点的运营管理。
Dr. Zhibin Xiao，ZFLOW AI创始人兼CTO，CASPA前任主席及现任顾问。曾在Oracle/Sun Microsystems主导数据中心服务器CPU研发，后专注于AI推理芯片设计，现致力于AI数据中心的异构系统自动优化。
Christina Xu，Franchise Capital高级总监，主要关注AI基础设施相关投资，曾担任德克萨斯州某AI数据中心项目（毗邻Stargate）的投资方及代理CFO。

硅谷101的创始人泓君和特约研究员Yiwen也主持了本次活动。

以下是这场论坛的精彩观点：

Fireside Chat：

重建AI时代的数据中心

Yiwen（硅谷101）×Alex Yeh（GMI Cloud）

我们常常认为，AI基建里最核心的一环是GPU。但在GMI Cloud的Alex Yeh看来，GPU早已不是瓶颈。真正卡脖子的，是等待周期长达八个月的InfiniBand以及电力。而电力短缺的程度，比大多数人想象的要严峻得多。

Alex Yeh GMI Founder&CEO GPU其实只是整个供应链里很小的一部分。光纤，就是官方的InfiniBand，等待周期大概要八个月。如果你的终端客户对英伟达来说足够重要，他们会帮你提前拉货，但最多也就提前两个月，还是在你运气好的情况下。所以GPU现在真的不是瓶颈，货源充足，OEM/ODM很多，价格到位就能拿到。真正的瓶颈是InfiniBand，是电力，这两个才是核心。

需求端的压力还在持续攀升。Alex提到，两年前，训练集群的起步规模是1000张GPU。现在，无论是亚洲还是美国的前沿实验室，最低门槛已经升至4000张。

1.1 芯片涨价，是需求信号，不是供给信号

市场上流传着一种误读：旧芯片价格飙升，是因为新芯片替代不了它们。Alex对此有不同解读。

Alex Yeh GMI Founder&CEO 这其实不是替代，而是互补。H200两年前刚出来的时候，我收到各种邮件说我们有几架H100的服务器。但现在，H200的市场报价已经到了34万美元，两年前才22万。每个价位都涨上去了，挺疯狂的。而且你去AWS上查按需实例或容量块，根本找不到多少，价格一直在飙。这就说明了需求有多旺盛。

或者说，整个生态系统的需求在爆炸性增长，新旧芯片各司其职。新一代用于大规模训练，老一代承接推理和沙盒任务，没有人愿意让任何一张卡闲置。

图为Alex Yeh，GMI Founder&CEO

1.2 融资结构：从私募资金到多层次SPV

数据中心的融资，正在走向一套越来越成熟的体系。Alex将此分为两个量级。

约1亿美元级别的小型项目，可以通过股权、客户预付款加上供应商融资和风险债务的组合来解决。但一旦进入大型项目阶段，股权融资根本无法覆盖，必须依赖多层次结构。

Alex Yeh GMI Founder&CEO 对于更大规模的项目，比如我们在日本和GTC上宣布的吉瓦级计划，光是第一期大约300兆瓦的建设成本就高达130亿美元。这根本没办法靠股权融资来覆盖，没有人有那么多钱。所以你必须做很多创意性的结构设计：某种形式的股权加供应商融资，加上私募股权资金，甚至还有主权资本叠在上面。同时客户的还款承诺也非常重要，这是支撑大型项目融资的关键。

GPU债券市场的成熟也印证了这一趋势，从企业债券的利率变化就可以看出来。

Alex Yeh GMI Founder&CEO 比如Coreweave最近发行了一个利率在5%左右的GPU债券。这说明整个市场正在走向成熟，华尔街开始把GPU视为可靠的抵押资产。我认为市场会自我修正，溢价最终会下来。事实上已经在下降了：两年前，CoreWeave以微软合同作为还款来源的债券利率高达15.5%，现在投资级债券的利率大概在9%到10%，最新的企业债券已经降到5.7%。随着大家开始把GPU当作可靠抵押品来评估，收益率一直在走低。

1.3 日本：数据主权与海底光缆的双重逻辑

最后，GMI Cloud有一个独特的优势，也就是全球化布局。Alex提到，他们不是在寻找最好的地方，而是跟着真实需求走。

美国依然是建设速度最快的市场，因为Alex认为这里的监管最少，尤其是德州、俄克拉荷马这类地区。但日本是GMI Cloud近期一个特殊的战略节点。日本的数据主权法律要求所有数据必须存储在境内，这本身就创造了一个规模庞大且相对封闭的本地需求。与此同时，日本可以说承载了整个亚洲的需求。

Alex Yeh GMI Founder&CEO 你去搜一下海底光缆的分布图，就会发现几乎所有的枢纽都汇聚在东京：从日本出发，连接韩国、台湾、东南亚、新加坡，然后再横跨太平洋。所以日本是海底光缆光纤的重要枢纽，这也是为什么日本对美国的超大规模云服务商来说同样是一个重要节点。

东南亚的格局则更为分散。马来西亚曾因电力充裕备受青睐，但政府随即开始加税，资本随之转向印尼、泰国。

图为现场观众提问

Keynote AI数据中心：重新思考供电基础设施

（从依赖电网到分布式的供电解决方案）

Harish Jere主题演讲，Power HF CTO

在Alex为观众讲述了基建一线的困境和机会后，我们邀请了Power HF的CTO Harish Jere上台。Harish的演讲从他作为一个有40多年从业经验的实践者的角度切入。他的核心观点是：电不是没有，是送不到。

电网互联的等待时间在美国许多州已经长达五到六年。这意味着，对于想要快速建设AI数据中心的运营商来说，等电网已经不再是一个选项。

从供电架构的角度，Harish提出，表后供电（Behind the Meter）不再是一个选项，而是一种必要。他提出了一个概念：Bring Your Own Power（BYOP），也就是自带电力。

战略重心，正在从接入电网转向自己保障电力。

Harish在现场展示了一张完整的对比表格，覆盖了目前AI数据中心可用的所有表后供电方案：

Harish Jere Power HF集团CTO兼印度CEO 没有任何单一方案能同时满足AI基础设施对速度、可靠性和确定性的要求。你可以用模块化解决方案来快速部署，但最终你还是要找到稳定、可靠、在融资层面也站得住脚的电力来源。重型燃气轮机是最好的稳定电力来源之一，气源也够，但交货周期要四年。我们需要的是稳定电力，或者能持续输出固定兆瓦数的电源。其次，还有负载波动的问题。电网的韧性不足以应对这些波动，有人在讨论超级电容，有人在讨论储能设备，但真正能提供灵活调度能力的是储能系统（BESS）。所以电力架构不是单一解决方案，而是需要混合架构。至于新兴方案：核电还需要几年时间。燃料电池和SOFC已经开始以模块化结构在多个地方落地部署。

最后，Harish提出，AI数据中心的高密度、动态负载和液冷系统，让各个子系统之间的耦合度远超传统数据中心。所以，任何一个环节的故障都可能引发连锁反应，压缩了故障发生到影响扩散的时间窗口。

他从25000个电信站点的运营经验里得出的结论是：

即使拥有最可靠的设备，如果缺乏妥善的维护或操作不当，依然可能导致故障。可靠性并非仅仅关乎设备的选用，而是取决于整个基础设施及其运作的统筹与协调。

在Harish眼中，这也是Power HF团队要做的：不只是供货，而是提供从控制系统到运营层的完整架构。

Panel AI时代的数据中心：挑战和解决方案

（从电力、能源和资本角度看新的机遇）

在活动的第三场对话上，我们邀请了三位从不同角度来关注数据中心的嘉宾，更全面回答了这几个问题：数据中心的瓶颈在哪里，解法是什么，钱从哪里来，以及这个行业里什么被高估了，什么被低估了。

主持：Jane Liu（硅谷101）嘉宾：David Xu（Power HF）、Dr. Zhibin Xiao（ZFLOW AI）、Christina Xu（Franchise Capital）

3.1 瓶颈与挑战

今年，建一个1吉瓦的数据中心，要花多少钱？

600亿美元。Christina透露这个数字来自Crusoe本周公布的最新数据。其中400亿用于芯片、GPU、CPU和网络层；剩余200亿中，将近50%流向了人工和能源。

Christina Xu Franchise Capital高级总监在这400亿芯片层面的瓶颈依然是内存（memory），这是一个极难解决的问题。关于内存供应，厂商往往需要先从资本市场捕捉到需求信号；然而，即便他们接收到了信号，留给他们构建完整供应链的时间也很短，因为这一过程至少需要两年时间。SK海力士、三星、Micron三大厂全部售罄。大型科技公司在2026 Capex中30%流向内存，这是历史上从未有过的比例。第二个瓶颈在于先进制程晶圆厂（leading-edge foundry）。随后则是目前备受热议的光器件领域，也就是CPO（co-packaged optics）和高功率EML激光器。目前供给只能满足需求的一半。

在下游，我们来看聚焦于数据中心本身的基建部分。这部分投入约为200亿美元，而在这200亿中，近50%的资金都消耗在了劳动力和能源成本上。也就是发电机设备和人工成本。我曾作为投资人兼代理CFO参与过位于德克萨斯州的某项目——就在Stargate旁边——因此我们对这一现状有切身体会。就像Alex说的，想要采购到燃气轮机设备非常难，更别提那些动辄数十兆瓦的超大规模需求了。即便是1到3兆瓦级的小型可集装箱机组——市场也几乎被Elon清空了（早期的小型发电机产能基本被Elon包揽，现在他们已经转向更大型的设备）。

另外，一个高级电工现在的年薪可以高达30万美元。即便开出了如此高昂的薪酬，依然无法招募到足够数量的电工。这些才是真正制约行业发展的瓶颈所在。

从投资人视角看，目前定价权最强的依次是：HBM内存、先进制程晶圆厂、光器件，这是5到10年的结构性瓶颈。

图为Christina Xu，Franchise Capital资深总监

Dr. Zhibin Xiao则从芯片架构的角度补充了另一个经常被忽视的瓶颈：软件优化层的缺失。

Dr. Zhibin Xiao ZFLOW AI创始人兼CTO 就像Alex说的，GPU现在不是问题，电力和冷却成了问题，这些是真正的物理瓶颈。但从我的角度来看，因为我做的是架构，背景更偏硬件和软件设计，我能看到还有一个短缺：软件优化层，也就是能够跨异构组件进行优化的编排层，在AI数据中心里这一层是缺失的。这也是为什么即便是英伟达，也在快速创新，但仍然有点跟不上AI推理数据中心更快的发展节奏。

这也是为什么英伟达收购Groq。Jensen看中的正是LPU架构在推理解码上的效率。异构系统的自动优化，是下一个真正的战场。

3.2 解决方案与权衡

重型燃气轮机和SOFC固体氧化物燃料电池是美国市场上的两条主流表后供电路线。他们到底有什么本质区别？

Power HF的David Xu回答了以下四点：

第一，能量转换路径完全不同。燃气轮机是燃烧驱动的热力发动机，有旋转机械部件；SOFC是无燃烧、无运动部件的纯电化学转换系统。

第二，发电效率。重型燃气轮机单循环效率为35%到45%，加上联合循环可达55%到62%；SOFC效率更高，达到60%到65%，如果结合热电联产（CHP）甚至可以达到85%到90%。

第三，排放。燃气轮机会产生含有氮氧化物、颗粒物、一氧化碳和碳氢化合物的废气；SOFC如果以氢气为燃料则零排放，即便使用天然气也不产生氮氧化物和颗粒物，排放更为清洁，对需要满足ESG合规要求的hyperscaler来说更具吸引力。

第四，成本结构。David认为，这是对hyperscaler来说最重要的维度：重型燃气轮机造价最低，约2.2美元/瓦，LCOE（Levelized Cost of Electricity,"平准化度电成本"）约70美元/兆瓦时；航改燃气轮机约3美元/瓦，LCOE约91美元/兆瓦时；SOFC约3.5美元/瓦，LCOE约90美元/兆瓦时。前期投入更大，但更绿色。

那么，如果让David来决策一个500兆瓦的数据中心，选哪条路？

David Xu Power HF董事长兼CEO 如果没有交货问题，重型燃气轮机会是最好的选择。但现实是，重型燃气轮机全球只有三家主要供应商：GE、西门子和三菱。你要等四到五年。所以现在没有选择，只能回过头来用SOFC或者航改燃气轮机。我的意见是两者各半：SOFC作为新技术，可靠性和耐久性还需要时间验证；航改燃气轮机与SOFC的CapEx和LCOE大致相当，但供应链更成熟。这也是为什么马斯克在Colossus项目里用的是航改燃气轮机，因为交货周期在一年以内。

图为David Xu，Power HF董事长与CEO

Jane Liu 硅谷101创始人对于Mag7这样的公司来说，价格不是最重要的。时间很关键。你会怎么建议数据中心做时间和价格上的取舍呢？

David Xu Power HF董事长兼CEO 如果一家hyperscaler的AI业务需求非常明确、现金流也很充裕，那么支付20%到30%的溢价来加快交货是值得的。但如果需求不确定、现金流比较紧张，我不建议支付溢价，因为机会成本太高了。

在全球化运营方面，David分享了Power HF的本地化经验。印度业务从2006年起步，即便疫情期间中印两国人员无法互访，业务也未受影响。他认为进入美国AI市场最关键的是：在数据中心架构设计阶段就介入，而不是等到采购环节才出现。

3.3 计算优化：密度、可靠性与模块化

随着液冷技术的普及，机架密度已经从20千瓦跳升至130千瓦。Zhibin Xiao指出，GB200和GB300单卡功耗已超过1.2到1.3千瓦，整个行业正在向48V直流架构、乃至800V高压直流架构迁移，芯片级别的垂直供电（VPD）也成为热门话题。

模块化是应对GPU快速迭代的唯一解法。Jensen一年内发布了九款芯片。那么，数据中心如果不在设计阶段就考虑模块化和可扩展性，建好即面临过时的风险。Zhibin Xiao的建议是：数据中心必须能容纳未来两到三代GPU的功耗和互联需求，同时在软件层面建立自动优化的AI工厂运营体系。

高密度带来的另一个挑战是可靠性。

Zhibin Xiao ZFLOW AI创始人兼CTO 一个芯片内存bit或互联链路的单点故障，如果导致训练任务中途停止，就可能让你的集群损失数十万美元。传统数据中心靠增加硬件冗余来保障可靠性，但这在今天已经行不通了。我们需要的是系统级智能。

图为Zhibin Xiao，ZFlow AI创始人&CEO

3.4 市场、融资和风险

投资人是否还在买数据中心的故事？Christina认为：钱还在流入，但标准变了。

今年CoreWeave的融资成本已经下降了300个基点，资本仍在持续进场。3月底他们完成了Neocloud史上第一笔IG评级融资，85亿美元。值得注意的是，这笔融资真正拿到A3评级的原因，不是因为市场认为CoreWeave是投资级，而是因为照付不议（take-or-pay）合同把Meta的Aa2信用传递给了Coreweave，这是非常聪明的结构。

在所有hyperscalers中，甲骨文（Oracle）面临的压力相对最大，因为OpenAI占其RPO约54%客户集中度风险显著。

关于GPU折旧的担忧，Christina给出了一个有意思的类比：GPU现在就像在伊朗的二手车，因为根本买不到新的，所以旧的不会贬值，反而在升值。H100的租赁价格在过去6个月就上涨了40%。她认为真正的信用风险窗口不在今天，而在2028到2030年。那是供应链追上需求、GPU不再稀缺的时间节点。

如果类比历史危机，她认为这更像2015年的新能源危机或98年长期资本管理公司崩盘，而非2008年。

Christina Xu Franchise Capital高级总监这些借款机构更多是其现金流回笼速度极快的hyperscalers。尽管这类业务具有极高的资本支出强度且高度集中，但借款人自身完全有能力对冲并匹配相应的风险。

3.5 电网 vs 表后供电

五年后，数据中心的电力将更依赖电网，还是转向表后自供？

三位嘉宾的答案出现了有趣的分歧。

David Xu Power HF董事长兼CEO 表后供电意味着自供电，这是一个明显的趋势。根据Bloom Energy的数据中心调研，到2030年将有33%的AI数据中心使用自供电，到2035年这一比例将升至44%。趋势非常清晰。但无论如何，混合模式能为所有AI数据中心提供更高的可靠性。我认为hyperscaler不会愿意承担纯表后供电的风险。另外，混合模式可以探索灵活的运营方式，实现更好的经济效益。如果只依赖自供电，第一是可靠性会成为大问题，第二是投资人必须提前支付更多成本来锁定电力。所以我认为混合模式会越来越普及，一是为了可靠性，二是为了经济效益。至于哪种方式会占主导，我认为还是电网。我相信美国政府会加大对电网的投资。

Christina Xu Franchise Capital高级总监长期来看，我同意电网始终是更好的选择。但问题是，接入电网的排队时间是四到七年。七年后可能已经AGI了。所以我们要尽可能快地行动。我们追踪了所有数据中心的做法，比如Crusoe用航空发动机改造的燃气轮机——也就是把退役的喷气发动机直接用来发电。Meta也在用类似的混合方案。Bloom Energy的fuel cell也越来越受欢迎，因为它的permit速度更快。

表后供电确实比电网贵：如果用电网，大概是每兆瓦100到150万美元；如果做表后供电加燃气发电，大概是每兆瓦300万美元，差不多是两倍的成本。但为什么大家还是选表后供电？因为快。比如两年后你可以把电网接入作为备用，但在那之前你需要尽快拿到电力。而且如果你把所有能源成本都摊进GPU的整体成本里来算，根据SemiAnalysis的数据，即便能源成本翻倍，GPU的成本也只增加了10美分。所以他们连眼睛都不会眨，在中短期内会毫不犹豫地选择表后供电。

Zhibin Xiao ZFLOW AI创始人兼CTO 从AI原生数据中心的设计角度来看，如果真的要从零开始建，我认为需要建立自己的表后供电体系。这样你就有了更大的硬件软件协同设计空间。如果能控制自己的电力供应，就可以做很多硬件和软件层面的优化。我认为这将是未来AI原生数据中心的常态。

观众提问

3.6 最高估 vs 最低估

最后，对我们三位嘉宾来说，在数据中心行业目前最被高估和最被低估的，分别是什么？

Christina Xu Franchise Capital高级总监最高估的是那些靠讲AI故事融大钱的公司，就像Allbirds（指All Birds这家运动鞋品牌最近转型做AI数据中心）。最低估的是能源侧的投资机会。大家的注意力都跑去追内存和芯片了，但GE Vernova财报发布后股价一天涨13%，机会还在。

Zhibin Xiao ZFLOW AI创始人兼CTO 最高估的是用GPU数量衡量算力实力；最低估的是token效率和系统效率。他还提出到一个有意思的中美分化：美国在push模型的极限，中国因算力受限被迫在效率上先行一步，而这个问题现在也开始反噬美国前沿实验室。

David Xu Power HF董事长兼CEO 最高估的是重型燃气轮机单循环发电模式，长期LCOE更高，但市场热捧，交货期漫长且价格出现泡沫。最低估的是高效热电联产（CHP co generation）系统的运用，虽然这项技术并不新颖，但值得更高的关注。

图为观众签到

以上就是这场线下活动的精彩观点，我们做了适当删减与编辑。总的来说，我们感受到，在2026年讨论数据中心，从行业、供应链到资本，都采取了更加务实的态度。对于数据中心面临的能源和电力瓶颈，在全球范围内都有了更有创造性的解决思路。但是，挑战与机会并存，之后对算力的需求只会越来越大，需要各大供应商做好准备。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.