![]()
论文信息:
Xinge Chen, Chudong Hu, Jun Liang, Jiangpeng Li, Lin Lu, Yan Wu a, Jianbin Zang. Efficient two-phase liquid cooling and optimization technology on the chip side based on high-power data centers: Summary and prospects. Renewable and Sustainable Energy Reviews, 2025.
论文链接:
https://doi.org/10.1016/j.rser.2025.115994
Part.1
研究背景
![]()
![]()
随着大数据时代的到来以及人工智能技术的快速发展,数据中心的用电需求预计将在2026年超过1000 TWh,其中冷却系统的耗电量将超过35%。与此同时,芯片的负载与热流密度也在逐年提升。采用更加高效、节能的冷却方式已成为必然趋势。本文综述了数据中心芯片冷却中四种两相液体冷却方法的最新研究进展与优化技术,包括直接液冷技术(两相浸没冷却与喷淋冷却)和间接液冷技术(两相冷板冷却与热管冷却)。文章重点关注在数据中心中具有较高应用潜力的系统配置,以及针对实际数据中心需求的冷却优化方法。间接冷却技术较为成熟,但冷却能力有限;喷淋冷却具有更高的冷却潜力,但安全性和稳定性不足;两相浸没冷却在各方面表现均较为优异,目前展现出显著的应用潜力。总体而言,本文总结了数据中心冷却系统的当前应用现状,并指出了在算力爆发时代下,系统应用类型与优化路径的发展方向。
成果以“Efficient two-phase liquid cooling and optimization technology on the chip side based on high-power data centers: Summary and prospects”为题发表在期刊《Renewable and Sustainable Energy Reviews》(IF= 16.3,JCR一区,中科院一区TOP)上。文章第一作者为同济大学机械与能源工程学院博士研究生陈辛格,通讯作者为同济大学教授臧建彬。
Part.2
研究内容
![]()
![]()
图1对比了2000年至2024年全球数据中心液冷系统的研究情况。数据中心液冷研究主要集中在北美和亚洲,知识产权申请数量分别为846件和452件。其中,热管和冷板技术的研究更为普遍,并呈现快速增长趋势,而浸没式冷却则保持稳定增长。然而,由于数据中心机柜侧和芯片侧的可用空间相较于室外冷却设备(如冷却塔和压缩机冷却单元)更为有限,因此需要在这些受限空间内最大化瞬时传热能力,尤其是针对高功率机柜和芯片。由此可见,涉及工质相变的两相液冷技术具有更大的应用潜力。
![]()
图1. 2004年至2024年a. 全球数据中心液冷相关文献的分布;b. 各类文献数量;c. 各大洲文献数量;d. 五种常见冷却方式相关文献的增长趋势
本文系统梳理了所有现有的两相液冷方法,并结合其在数据中心芯片热管理中的应用背景,总结了基于基本机理(主要来源于实验室尺度研究)的优化策略,如图2所示,包括浸没式冷却、喷淋冷却、冷板冷却和热管冷却。可以看出,热源表面结构的改性是四种冷却技术优化方法的核心。对于两相浸没冷却,重点在于倾角与工质的优化;在喷淋冷却和热管冷却中,结构与工质的优化更为关键;而两相冷板冷却的增强方法相对简单,主要通过调控表面粗糙度与孔隙率来实现。
![]()
图2. 两相液冷及其增强技术结构框架
首先,对于两相浸没式冷却,随着全球学者对沸腾传热的深入研究以及微纳米级加工技术的快速发展(尽管表面结构改性并不局限于微纳米级),以下是数据中心背景下池沸腾增强技术的文献综述。 与微观和纳米尺度的表面改性不同,宏观尺度的凹槽或纹理结构更易于在金属表面实现,并且对数据中心具有更实际的应用价值。这些结构背后的原理是它们增加了沸腾表面的传热面积,提供了更多的成核位点,并更容易捕获气泡。微通道中气泡的上升也加强了周围液体的微对流传热。由于其尺寸有限,气泡离开频率增加,并避免了引发薄膜沸腾的过早合并。因此,如图3所示的易于制造的毫米级微通道结构最初被学者们研究。
![]()
图3. a. 具有不同几何尺寸的标准微槽铜表面;b. T型微通道;c. 矩形、抛物线形和阶梯形微通道;d. 倾斜微通道;e. 圆柱阵列
与易于制造的宏观表面相比,微纳米尺度的池沸腾表面制造更加复杂,涉及更复杂的增强池沸腾原理。这种增强主要通过改变沸腾壁的微观形态以改变其粗糙度、润湿性、孔隙率、毛细抽芯力,以及通过设计用于相分离的特殊微观结构来实现,如图4,所有这些都旨在改善沸腾过程的CHF和HTC。
图4. a. 双亲性表面的圆柱阵列;b. 选择性双亲性表面;c. 多孔铜泡沫表面及其强化机理;d. V形连接的铜纳米线;e. 毛细抽吸驱动的多孔复合表面芯部抽取机制
纳米流体是通过在基础流体中添加各种微米和纳米级颗粒而产生的,这提供了一种更灵活地调整冷却剂热物理特性的方法。同时,纳米流体中的纳米颗粒可以沉积在热源表面,以多种方式改善池沸腾的CHF。纳米流体强化作为一种新颖有效的方法,在池沸腾领域得到了广泛的研究。此外,由于其浓度通常较低,纳米流体在经济上是可行的,并显示出一定的实际应用潜力。如图5所示,本文主要总结了纳米流体对池沸腾的影响机理。
![]()
图5. a.纳米颗粒在沸腾条件下的沉积;b.干点附近纳米颗粒沉积的环形区域;亲水性对纳米颗粒沉积的影响;d. 不同表面粗糙度对纳米颗粒沉积的影响。
在大多数池沸腾研究中,主要重点是研究各种条件的变化如何增强 CHF 和 HTC。这些研究通常采用水平热源进行实验。然而,在实际的数据中心芯片级冷却系统中,主板在机柜中的水平放置往往会阻碍蒸汽气泡的上升路径,从而降低冷却效率。因此,有必要研究不同角度放置热源时的气泡动力学以及CHF和HTC的变化。这可能会导致针对倾斜热源的池沸腾增强技术的开发,这将显着提高数据中心浸没式冷却系统的冷却性能。现有角度对池沸腾的影响研究如图6所示。
![]()
图6. a.毛细管芯吸驱动的岩心萃取梯度均热板结构;b.垂直窄间隙池沸腾增强;c. 3个亲水面对垂直热源池沸腾的影响;d. 用于池沸腾实验的相邻水平-垂直热源;e.U型管的数值分析,研究不同角度的水池沸腾;f.不同角度沸腾池中的气泡形态
池沸腾的主动增强技术,即利用外力主动调节沸腾参数,也得到了广泛的研究。这些技术主要包括应用超声波场、振动场、电场、磁场、重力场和压力场来调节池沸腾性能。最常研究的方法涉及施加压力场,该压力场会降低池内的压力,从而降低冷却液的饱和温度,从而降低 ONB。同时,它增加了气泡离去频率,同时减小了离去直径,最终增强了HTC。其余强化方法如图7所示。
![]()
图7. a.超声增强池沸腾;b.电场碎裂效应增强池沸腾;c. 磁场对纳米颗粒的影响;d. 纳米颗粒在外加磁场下的传热增强;e.在地球或太空的微重力条件下,整个时期的气泡生长和演化
对于喷淋冷却,目前的研究发现,强化热源表面对于喷淋冷却有利于提高传热性能。如图8所示,主要增强方法包括蚀刻微通道结构、提高表面粗糙度和制备多孔表面。增加微通道结构增加了传热面积,而表面开槽可以有效防止液滴从冷却表面滚落,从而延长液滴停留时间,有效控制液膜厚度。喷淋冷却中的表面粗糙度改性效果与两相冷板和浸没式冷却相似,因为它增加了气泡的成核位点,减小了气泡的离去直径,从而刺激了相变过程,增强了HTC。最后,多孔微结构表面可以通过增加传热面积来增强固相和液相之间的传热。这些表面孔隙率的改善增加了多孔层中的空隙空间,从而降低了内部流动阻力,并使加热表面产生的气泡更容易逸出。这有利于稳定和连续的细胞核沸腾。此外,多孔结构增强的毛细管泵送效果提高了表面补充液体的能力,有助于保持液膜厚度。
图8. a.系统级不同角度喷淋冷却系统;b.微通道喷淋冷却试验台;c. 喷淋冷却系统中的表面粗糙度结构;d. 不同表面粗糙度结构的比较;e.四面体鳍复合结构;f.粗糙度诱导的气泡成核增强机制;g. 喷淋冷却系统中的多孔铜表面
基于流动沸腾机理的两相冷板技术具有三个关键评估参数:CHF、HTC 和压降 (ΔP)。由于流动沸腾涉及冷却剂在管道内的循环,因此压降是评价冷板性能的关键指标。压降越大,表明冷却液在冷板部分的能量损失越大,从而降低系统效率。对于目的为优化这三个参数的手段,结构和角度等因素似乎很难产生重大影响。因此,两相冷板技术的优化手段主要是表面结构的改性。如前所述,增强两相冷板技术的主要方法是提高冷板中的气泡产生率和分离频率,加速沸腾,增强传热,并优化微通道的结构,以符合气泡动力学和流体力学。如图9所示,这涉及改变热源表面的传热面积和粗糙度。
![]()
图9. a.常规矩形微通道冷板;b.疏水薄膜包覆微通道冷板;矩形微通道微柱结构冷板;d. 均匀且逐渐膨胀的矩形微柱结构冷板;e.射流和微鳍阵列组合冷板;f.一种前端导流结构的矩形微通道组合冷板;g 4种不同的微鳍形冷板;h.开环针鳍微针阵列冷板;i. 多孔结构两相冷板
热管技术也是数据中心冷却中比较成熟的技术。其主要机制可以看作是两相浸没式冷却和冷板冷却的结合。它由三个主要部分组成:蒸发部分、绝热部分和冷凝部分。管道中充满了低沸点冷却剂,该冷却剂密封在管道内。热源将蒸发段的冷却剂加热到饱和点,使液相冷却剂蒸发到气相中。通过潜热传递,热量从热源中带走。然后,热蒸汽在压力和密度驱动力的作用下输送到冷凝器部分,冷源从外部施加,导致蒸汽凝结回液相。然后,液体通过内部微通道中的毛细管力或重力返回蒸发部分,完成一个不断带走热量的自循环回路。它们分别被称为毛细管热管和虹吸热管。热管具备易于操作、高效传热以及不需要额外泵驱的优点,被广泛用于数据中心的芯片级冷却。目前已经对它们与系统的集成及其优化方式进行了大量研究如图10所示。
![]()
图10. a.环路热管分离式冷凝器;b.平板虹吸环热管;c.超长反重力回路热管毛细管芯;d.柔性传热管环路热管;e.带辅助取芯通道、附加翅片和风扇的环形热管;f.水平不对称直径脉动热管;g.仿生脉络结构脉动热管;h.多弯管脉动热管
图11a全面比较了四种液冷技术与空气冷却的性能。蓝色、绿色、黄色和红色依次表示性能由优到劣。从两个重要指标来看,四种液冷方式在提升能效方面均远强于空气冷却,其中直接液冷的高密度冷却能力略优于间接液冷。由于冷却效率较高,直接液冷在经济性方面也优于间接液冷。喷淋冷却因系统不稳定,在集成复杂度、运维简化和可扩展性方面表现最差。而同样属于直接液冷的两相浸没冷却技术在多个评价指标上表现十分出色。空气冷却虽然能力有限,但因其结构和原理简单,在集成复杂度和可扩展性方面具有一定优势,因此在低功率数据中心仍具备应用价值。对于人工智能和超级计算驱动的数据中心,两相浸没冷却是最具潜力的解决方案,研究和应用前景广阔。
图11b进一步比较了四种技术在数据中心应用时的传热系数(HTC)和能效比(PUE)指标。喷淋冷却实现了最高的HTC(288 kW/m²·K),但其PUE最高(1.25);冷板冷却和热管冷却的PUE较低,但冷板冷却的HTC最低,仅为23.8 kW/m²·K;相比之下,浸没式冷却在四种两相液冷方式中表现较为均衡,HTC为89.4 kW/m²·K,PUE为1.12,兼具较高的冷却能力和一定的经济性。这表明其能够在保证冷却能力的同时,兼顾系统的能效与经济性能。
![]()
图 11.两相液冷技术比较 a. 优缺点比较;b. 性能比较
Part.3
总结与展望
![]()
![]()
总之,尽管四种技术均展现出应对不断攀升的计算需求的能力,但其应用必须与数据中心的具体需求相匹配。未来的研究应重点推动这些技术与芯片级设计的深度结合,并发展针对性优化策略,以实现大数据时代的可持续解决方案。在四种两相液冷技术中,工质问题贯穿始终。探索替代性工质(如含氟流体或其他具有优异热物理特性、低GWP、易降解的传统工质),对于两相液冷系统的环境特性与可持续发展具有重要意义。
此外,两相液冷技术应对高热流密度的能力主要得益于人工智能技术的快速发展,而人工智能本身也能为液冷系统带来益处。例如,通过将智能控制系统与热管理系统相结合,实现基于数据中心动态负载变化的实时调节与控制;再如,将可再生能源系统与传统冷却系统耦合,能够有效提升数据中心液冷系统的经济性与环境性能。未来的优化发展路径应致力于在深入探索本文所总结的两相液冷优化方法的同时,兼顾耦合系统以及其他潜在优化手段的可能性,以全面应对大数据时代的到来。
欢迎关注公众号 “芯片散热”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.