AM易道分享
一座1GW的AI数据中心,每年要烧掉的电够一座中型城市用。
其中至少一半,不是用来跑算力,是用来吹风、循环水、维持散热冷却的基础设施。
今天分享的这篇文章值得收藏。
2026年5月7日,《Cell Reports Physical Science》刊出论文,第一作者来自伊利诺伊大学香槟分校,合作方是圣地亚哥的一家叫Fabric8Labs的公司。
![]()
如果只看论文摘要,它讲的事很朴素。
一块20mm×20mm的水冷铜冷板,比传统方块针翅的同类产品热阻最多低32%,压降最多低68%。
但这篇论文真正值得花时间读的原因,藏在两个细节里。
第一这块铜片不是铣出来的、不是刻出来的,也不是3D打印激光烧结出来的。
它是用电镀的原理长出来的。
一种叫电化学增材制造(ECAM,Electrochemical Additive Manufacturing)的工艺,过去十年一直在小众圈子里发展,这次第一次被严肃地推到了AI数据中心散热这个赛道的台面上。
第二,论文里有一段数据中心能效推算:
如果把这套方案用在一个1GW的AI数据中心,TUE(总能效系数)能从行业平均的1.55降到1.011。
通俗讲,传统空冷数据中心每用1度电跑算力,就要再花0.55度电用于冷却和辅助系统;
这套方案把那0.55度压到了0.01度。
算到整座1GW的数据中心,原本被冷却基础设施吃掉的电,多出344MW可以真正用来跑算力。
论文作者自己谨慎地把这个数字标为illustrative(示例性的),但量级摆在那里,已经足以让数据中心运营者认真看一眼。
我们顺便想借助这篇论文把ECAM和其他金属3D打印路线差别讲清楚。
![]()
算法画不常见的针翅
故事从计算机里开始。
研究团队用COMSOL Multiphysics搭了一套拓扑优化(Topology Optimization)框架。
简单说,就是让算法在一块给定空间里自己决定每个角落该是铜还是水。
给定一个长方体的材料和流体共存的区域,告诉算法:
底面是热源,顶面有冷却水流过;
目标是让底面温度最低,约束是压降不能超过设定上限(ΔPlim)。
剩下的事,交给算法。
研究做了9种工况组合,收敛结果一眼看去,让人意外。
算法吐出来的针翅,长得像一个倒扣的松果。
下图是拓扑优化在三种压降约束下收敛出的针翅形态,从左到右分别对应40Pa、80Pa、120Pa。
压降越大,分叉越复杂。
![]()
根部宽厚,向上逐级收窄,顶端长出细密的分叉枝杈。
这种形态没有一个人类工程师会主动去画。
但在仿真里,它的速度场显示水流被这些分叉结构反复扰动,温度场则比方块针翅显著更均匀。
研究最终选定的是Hf=2mm、ΔPlim=80Pa这个工况。
不是最激进的,也不是最保守的。
论文里给的理由很朴素是,这个点能拿到大部分温度收益,又不至于让压降失控。
用研究者的视角看,工程总要在性能和代价之间挑一个手感最舒服的中间档位,这就是那个档位。
接下来,这个单个针翅被镜像、阵列,铺满20mm×20mm的冷板表面。
最终成型的,是一个50×50的针翅阵列,单元间距0.4mm。
这是一个工程上的有意妥协。
直接对整块20mm的冷板做3D拓扑优化,计算量会爆炸。
论文里给了一个直观对比:5×5mm扩到75×75mm,体素数会涨两个数量级。
先优化一个单元胞(unit cell,可以理解为最小重复单元),再阵列复制,是把算得动和做得好之间的平衡拿捏住的现实策略。
![]()
如何把这个全新针翅真的做出来:电化学ECAM登场
算法画出来的针翅,最细的特征只有几十微米。
这正是过去拓扑优化研究的死结。算得出,做不出
这就轮到ECAM登场。
ECAM是Fabric8Labs这家2015年成立的公司过去十年的核心技术。
它的本质,用一句话说,就是把电镀做成了一台3D打印机。
传统电镀大家都不陌生,把工件泡在含金属离子的溶液里,通电,金属离子就在工件表面均匀地还原成金属薄膜。
但传统电镀只能均匀沉积,没法局部控制。
ECAM做了一件关键的事。
它把阳极换成了一个由数百万个独立可控微电极组成的阵列。这些微电极借鉴了主动矩阵显示屏(active-matrix display)的技术路线,每一个像素都能独立通断、独立控制电场强度。
![]()
打印过程是这样的。
底板(阴极)和打印头(阳极阵列)之间,留一道很窄的间隙,里面循环流过含铜离子的水基电解液。
当某个像素被激活,它和底板之间形成局部电场,溶液里的Cu²⁺就在这个像素正对着的底板位置被还原成铜原子,沉积下来。
下一层,根据切片数据点亮另一组像素,再长一层铜。如此逐层、逐像素地长出三维结构。
整个过程发生在室温下,全程没有高温熔池、没有粉末。
论文里给出了几个关键参数。
当前ECAM系统的体素分辨率约33微米,沉积铜的纯度可以达到99.95%(这个数字直接关系到铜的导热率有没有打折),整个过程由闭环控制系统实时监控每个像素的沉积状态。
这次实测的冷板,是在一片高纯铜基板上长出了一个20×20mm的针翅阵列。
论文Table 1给出了冷板规格。
![]()
整个20×20mm范围内排了50×50共2500根针翅。
![]()
论文里的SEM图和光学显微图都呈现得很清楚,那种带分叉的复杂针翅形态,被ECAM相当忠实地复刻了出来。
换句话说,传统电镀车间里那些泡满工件的大镀槽,被Fabric8Labs缩成了一台桌面级设备,每秒钟独立控制数百万个微型电极,决定这一层的铜该长在哪里、不长在哪里。
![]()
叹为观止。
中间插一段,ECAM和金属3D打印主流路线,到底差在哪
读到这里,对3D打印有了解的读者大概会问。
金属增材又不是只有ECAM一家,激光选区熔融(SLM)、电子束熔融(EBM)、粘结剂喷射(Binder Jetting)这些都已经做了很多年了,凭什么这次非要用ECAM?
第一个差别是材料。
纯铜在金属增材里是出名的钉子户。
它对激光波长(特别是常见的1064nm红外激光)反射率极高,激光打上去大半被反射走,剩下一点能量又因为铜导热太快被迅速带走,根本形不成稳定熔池。
强行打出来的铜件,要么密度不够,要么微观孔隙严重,热导率会比理论值打个折。
而冷板要的恰恰是高热导率。
这是为什么纯铜冷板在金属增材里一直还在攻坚的核心原因之一。
ECAM不存在这个问题。
它根本不靠熔化,靠的是离子在电场下的电化学还原。
铜的反射率、导热率,对ECAM都不构成障碍,它处理纯铜反而是天然的优势。
第二个差别是温度。
SLM、EBM都是高温过程,局部温度可以到铜的熔点以上。
这意味着两件事,一是工件本身会因为热应力产生显著变形,二是工件不能直接打印在温度敏感的基底上,比如硅、PCB、陶瓷。
所以传统3D打印做的冷板,一般是先做一块独立的金属冷板、再用焊接或导热界面材料贴到芯片上,中间多一层界面,热阻多一份折损。
ECAM是室温过程。
原则上,它可以直接在芯片、PCB、陶瓷基底上长出冷却结构,没错,他们公开融资材料是这么写的。
这可能就是为什么Intel Capital、SK海力士、Lam Research这些半导体产业链的玩家都在投Fabric8Labs。
论文里专门提了一句,ECAM的电化学过程和现有半导体封装的电镀工艺有相似性,存在向高量产平移的现实路径。
第三个差别是分辨率。
SLM、EBM的分辨率受限于金属粉末粒径(一般15-53μm)和激光/电子束焦斑大小,复杂细节很难做到100μm以下。
BJ分辨率好一些,但还有烧结后变形和密度问题。
ECAM当前33μm的体素分辨率,加上随技术迭代继续往下走的潜力,是支撑拓扑优化这种喜欢算细节设计方法的关键。
第四个差别是后处理。
金属增材件几乎都需要支撑去除、热处理、表面精加工等多道后处理,每一道都增加成本和周期。
ECAM水基工艺,沉积出来的件几乎可以直接用,论文里也强调了这一点。
这对量产意义重大。
但显然,AM易道必须强调的是,ECAM不是万能的。
当前的体素分辨率和半导体光刻还有数量级的差距;
可打印的金属种类目前以铜为主,合金体系还在拓展中;
而单台设备的产能、大尺寸结构件的能力,都还未见工业化方案。
ECAM不是要替代SLM、EBM,不过它在【亚毫米级+纯铜+复杂内部结构+可直接打印在敏感基底上+可批量】这个组合空间里,目前几乎没有成熟竞争对手。
这是它目前的技术位置。
把铜片塞进真实的GaN功率电路里测
冷板做出来放进真实的电子系统里跑。
研究团队搭了一套测试平台,核心是一块定制的PCB,上面用标准回流焊焊了4颗GaN氮化镓功率晶体管,按2×2矩阵排布在20×20mm的有效区域内,每颗晶体管尺寸5.55×4.48×0.54mm³。
第1、2号管子靠近水的入口(上游),第3、4号靠近出口(下游)。
这种布局是有意为之。
既要看冷板对单颗器件的局部冷却能力,也要看水流过整个阵列后下游器件的温度衰减问题。
整套装置放在恒温22°C的环境里水平放置,冷板用导热界面材料贴在GaN阵列上。
闭环水路里同时测了流量、压差、进出口水温(仪器型号和不确定度分析在论文补充材料里),所有数据都可追溯。
![]()
性能差距明显
整篇论文最关键的是Figure 4。
![]()
研究团队拿ECAM打的拓扑优化(TO)冷板,和两块对照组:
2mm高的方块针翅冷板、1.5mm高的方块针翅冷板。
他们做了正面对比。
这两个对照组不是随便选的,是行业里被广泛拿来当基准的常规设计。
结论很多,但我们筛选了我们认为最关键的。
同流量下拓扑冷板更省。
在一定范围内,TO冷板的平均热阻在每一个流量点都最低。
差距在下游放得更大,水流到下游,温度升、动量弱,方针翅力不从心,而TO针翅带分叉、能持续扰动流场,热量抓得住。
第二,公平比较下,TO拓扑冷板仍然赢,而且赢得明显。
把散热付出的电费对齐(也就是按泵功率比,而不是按流量比),TO冷板在常用区间里始终领先。
最戏剧性的一组数字是,要把下游器件的热阻压到3.1 K/W这个工况点,TO冷板需要的泵功率比2mm方针翅低约60%,比1.5mm低约98%。
换个更猛的视角,限制结温-环境温差不超过10°C,自然空冷只能让一颗GaN器件耗散0.32W,TO水冷能扛25.25W。
79倍的功率密度差,这是论文给整个为什么必须用拓扑优化液冷冷板的定量答案。
第三,代价依然存在。
TO冷板在同流量下,压降确实是三者中最高的。
本质是,愿意付更高的压降,换更低的热阻;按泵功率折算反而省。
这意味着系统设计时泵的扬程必须留出空间,对一些泵选型受限的场景,本文这类TO冷板未必是最优解。
把组件级数据外推到数据中心层面
论文最后做了一个数据中心能效推算。
这也是很多业内人士关注的核心数据。
设定的场景,一个42U机架,总功耗167kW,目标芯片温度85°C,环境温度25°C。
这个机架功率级别是有现实参照的,论文明确说对标NVIDIA Blackwell Ultra GB300 NVL72这种下一代级别功率的机柜。
![]()
推算结果是,用这套TO+ECAM液冷方案的系统TUE是1.011,意味着只有1.1%的数据中心总能耗用在了冷却上。
对比传统空冷的TUE 1.55,超过一半的能耗都被冷却基础设施吃掉了。
如果把这个差距放到一座1GW数据中心里,就是344MW的IT负载差。
原本要喂给冷却的电,现在可以喂给算力。
不严谨的说,如果再放大到美国2028年预测的数据中心总装机74–132GW(按50%平均利用率),对应增量是25–45GW的可用算力容量。
但这里要原文照搬一句论文作者自己的态度,他们专门加了一段说明:
这部分数据中心层面的分析是"illustrative application example"(示例性的应用场景),实际的设施级效益是架构和场地相关的,不应该被当作已验证的预测。
论文的硬贡献是组件级的实验数据;数据中心的图景是合理的、有依据的推演,但还需要大规模验证。
这件事的产业坐标
读到这里有必要把镜头拉远一点。
Fabric8Labs这家公司,2015年成立于圣地亚哥。
![]()
2023年2月完成5000万美元B轮,由NEA领投,Intel Capital、Lam Capital(Lam Research的投资臂)、TDK Ventures、SE Ventures、imec.XPAND跟投。
2025年11月又拿到一轮5000万美元,依然由NEA和Intel Capital领投,新进投资人包括SK海力士、爱立信Ventures、丸之内创新合伙人、凸版印刷等。
最新一轮的核心用途,是把美国本土产能从500万件/年扩到2200万件/年,目标客户群明确指向AI/HPC散热、射频通信、汽车电力电子。
这份投资人名单本身有点意思。
半导体大厂Intel进来可能看到了芯片级散热集成的可能性,而SK海力士进来,HBM散热是绕不开的话题。
Lam Research(半导体设备龙头)加注,可能看到了ECAM和现有半导体工艺的工程兼容性。
而爱立信进来,是5G/6G射频天线方向。
这些信号叠加上这篇与伊利诺伊大学合作的Cell Reports论文,AM易道认为可以做出这样的判断:
ECAM正在从一个长期被归类为小众的技术路线,转向AI数据中心散热和先进电子封装这个赛道里的一个严肃供应链选项。
它不会替代SLM或EBM3D打印,各自有各自的边界。
但在其能打的空间,目前没有成熟工艺能正面竞争。
AM易道读者中如有类似技术团队,请私信联系。
冷板从来不是数据中心叙事的主角。
芯片是主角,机柜是骨架,电力是血液,散热长期被当成配角。
但配角偶尔会决定主角能不能上场。
机架功率从30kW向1MW爬的路上,决定上限除了芯片,还有热能不能及时被带走。
这篇论文,在拓扑优化这条算法路线和电化学增材这条工艺路线之间,搭了一座可以承重的桥。
这座桥能不能走过工程化、规模化、可靠性的关键一段,要看接下来这几年。
但桥已经架起来了,这件事本身已经值得行业里每一个关心散热、关心AI基础设施、关心铜的人,认真停下来看一眼。
注:本文是AM易道对论文的解读和转述,带有大量主观判断、内容取舍和添加行业视角,原文信息密度大、专业细节多,如果您是相关领域的专业读者,强烈建议直接阅读原文,本文的内容可能与原作者的严谨表述存在部分差异。
主信源(论文): Bazmi, B., Lad, A.A., Shatskiy, E., et al. (2026). Ultra-high-performance cold plate development through topology optimization and electrochemical additive manufacturing.Cell Reports Physical Science 7, 103272.
doi.org/10.1016/j.xcrp.2026.103272
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.