中美算力,。2026年GW(吉瓦)级数据中心上线,2027年MW(兆瓦)级机架服役,正在成为行业共识。算电协同并不仅发生在数据中心外部,更深刻的变化还在其内部展开。
数据中心由此演化成“新物种”。它最突出的特征,是端到端的高压直流配电体系,以及不同层级的储能与冷却系统;它们都围绕MW级机架的极高功率密度需求而展开。面对发生在数据中心内部的创新,中国与美国几乎站在同一起跑线。
AI基础设施的竞争,已经从芯片延伸到机架级系统架构。目前,为英伟达贡献更多营收增长的已经不再是独立的GPU,而是以NVL72为代表的机架级系统;后者还包括网络等业务,上一季度收入增速超过计算业务。黄仁勋很早就认识到“AI工厂”的重要性,那是将能源转化为token的地方。于是,英伟达对下一代机架的参考设计,一开始就将数据中心的供电分配网络(PDN)也纳入了进来。
它就是Kyber架构。黄仁勋已经在今年的GTC与OCP峰会上,数次。英伟达改变的不仅仅是它的GPU数量的堆叠,而是将电力提升至与芯片同等重要的地位,让电力更高效地转化为token。
![]()
本质上,这一变化也是算力需求趋势驱动的。在英伟达看来,AI的演化是一场持续的扩展,从GPU升级到AI基础设施,它需要纵向、横向以及跨域的扩展。尤其是纵向扩展,已成为当前平衡AI工作负载的关键路径。随着稀疏架构中专家(Expert)数量与通信需求不断攀升,芯片和节点规模同步扩大,机架级计算与超节点应运而生。
在芯片算力性能与机架算力密度提升的双重推动下,单个机架的功率密度也因此迅速攀升,几乎每年都在翻倍。2020年,基于Amper架构芯片的单机柜功率约为10kW。在上个月的OCP峰会上,无论是提供AI算力的英伟达、AMD,还是提供电力的松下与台达电子(Delta)等,都确信会在2027年前后,迎来1MW级别的单一机架。这相当于短短七年间,单机架的功率密度增长了约100倍。机架功率密度的“摩尔定律”很快将进一步升级至2MW甚至4MW。
这是对传统数据中心供配电体系的一次颠覆。在OCP峰会上,台达电子称,如果单个机架的功率达到1MW,那么,如果继续使用传统的54V(伏特)供电,电流将达到20,000A(安培),这是极其巨大的电流,会带来线路损耗、散热和短路等安全问题。
即使技术上可行,经济上也不可行。届时,为单个机架供电的铜母线将达到200公斤。如果GW级数据中心遍地崛起,作为多个国家指定的关键矿产,铜的供应将面临风险。能量密度越来越高数据中心,不仅在改变着电力系统,。
欧美科技巨头的共识,是引入端到端的高压直流方案。英伟达的Kyber机架,描绘的是端到端的800V高压直流(HVDC)方案;甚至,在英伟达看来,800V还不是终点,未来很可能达到1500V。而目前微软、谷歌与Meta共同打造的Mt. Diablo配电架构,采用±400VDC配电方案,也可支撑机1MW级机架功率。
此外,MW级机架的横向扩展就是GW级数据中心。它们都将放大AI计算负载的波动性。在英伟达的设想中,储能仍然是核心关注点,既有机架本地储能,也有长时储能(如BESS系统),分别应对动态功率波动、电压调节,以及电网响应和无功功率支撑;不同的储能技术在不同时间尺度下各有优势。
英伟达选择800V的理由是,电压过低就无法在数据中心级高效配电,电压过高则会导致转换器和保护器件体积过大。而且,800V直流的理念并非全新,电动汽车充电、光伏系统已经广泛应用,海运业也有现成设备。这意味着这套方案供应链相对成熟,存在规模经济效益。台达电子则称,800V直流配电的美妙之处,在于可以轻松接入光伏或燃料电池等可再生能源。这加深了数据中心与新型电力体系的协同演进关系。
不过,这一套供应链仍然是全球化的。在今年的COMPUTEX上,英伟达成立800V高压直流供应商联盟,其中功率模块领域的核心参与者,包括中国大陆企业麦格米特(Megmeet),也包括在大陆拥有产能的台达电子、伟创力(Flex Power)、领益(Lead Wealth)、光宝科技(LiteOn)。而目前成熟的储能量产,主要仍然由中国与韩国企业主导。难怪OpenAI向白宫建议,通过税收优惠、财政支持,用AI基础设施牵引实现国家层面的再工业化。
尽管中国单卡性能仍然与英伟达存在“纳米级”的差距,但华为、阿里与中科曙光等,都在寻求单柜算力密度的突破,MW级机架只是时间问题。其中,磐久AL128超节点服务器支持高达350kW供电能力和500kW散热能力;曙光scaleX640超节点自研的浸没式相变液冷先进方案,已经可以满足“一拖二”千卡级计算单元共1.72MW的散热能力。脱胎于华为的服务器企业超聚变,推出单柜集成128个AI加速卡的超节点,供电能力达240kW。
不过,面对这些数据中心“新物种”,突出的问题之一,是如何解决数据中心折旧与关键IT设备折旧的时间错配问题。数据中心往往建成后可以稳定运营20年,而GPU等关键IT设备满负荷运行5年就需要更换。一方面,大量存量数据中心需要升级,以适配越来越功率密集的机柜,另一方面,在投建增量数据中心的时候,同样需要考虑到提前留足设计冗余,至少它要是可扩展的。
除当前的传统方案外,英伟达对未来的“AI工厂”的供配电体系,设想了三个演进阶段。传统方案(下图红色部分)中的配置,可以逐步过渡(橙色或黄色部分),或者最小化改动,仅从交流配电体系切换到直流配电体系,或者进一步用储能系统替代UPS备电功能。
![]()
而最彻底的变革(绿色部分),则是端到端集成的800V直流架构,通过引入固态变压器(SST),基于其电力电子开关(IGBT、SiC MOSFET 等)控制电流、电压和频率,以灵活适配不同负载;它大幅压缩了电流转换的层级与复杂度,减少传统配电设备占用的空间,从而进一步提升计算设备在数据中心的空间占比。
2026年,数据中心的“新物种”,将在AI基础设施与新型电力体系的协同演进中,发挥越来越关键的作用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.