(本文编译自Electronic Design)
在数字化时代的浪潮下,数据中心作为信息存储、处理和传输的核心枢纽,正经历着迅猛的发展。随着信息技术的飞速进步,数据中心所承载的业务量与日俱增,从传统的互联网服务到新兴的人工智能、大数据分析、云计算等领域,其应用范围不断拓展。这不仅促使数据中心的规模持续扩大,更使得机架功率密度急剧攀升。如今,数据中心机架功率密度已突破每架 100 千瓦以上,不断挑战着数据中心热设计的极限。
功率密度的大幅提升,意味着数据中心在单位空间内产生的热量呈几何倍数增长。传统的散热方式,如风冷技术,在面对如此高强度的热量产生时,逐渐显得力不从心。因此,寻求一种高效、可靠的散热技术,成为了数据中心行业发展的当务之急。液冷技术正是在这样的背景下应运而生,它以其卓越的散热性能,为高密度数据中心的散热难题提供了可行的解决方案。
高性能计算和人工智能带来的散热压力
近年来,高性能计算(HPC)和人工智能(AI)技术的迅猛发展,为数据中心带来了新的机遇,但也使其散热压力倍增。液冷技术正迅速成为解决数据中心散热问题的关键方案。目前已有浸没式、芯片直冷等多种液冷技术,但关于液冷的诸多误解仍普遍存在。
如今,大多数现有供电设施长期来看将无法满足这一需求。仅单块图形处理器(GPU)平均每日耗电量就达54千瓦时,相当于普通家庭两天的用电量。而若扩展到5000个数据中心机架(配备30万块GPU),其耗电量约能为40万户家庭供电,规模堪比美国得克萨斯州奥斯汀市。如此庞大的耗电量,意味着会产生海量的热量。
若冷却系统无法充分散热以实现最大计算性能(通常只能达到额定容量的75%以下),将给传统数据中心的暖通空调(HVAC)设备带来沉重负担。软件仿真技术可助力优化数据中心冷却系统的设计。
数据中心的液冷解决方案
成功推行液冷解决方案,需要整合来自不同机构的多种技术。这些系统最好有序协同安装,以打造可持续运营的数据中心。但要找到一家可靠的交钥匙供应商并非易事,这类供应商需能全面负责方案制定、项目规划、协调管理,以及现场所有各类技术的安装,确保系统无缝启动。
系统安装完成后,终端用户的维护工作可能相对复杂。尽管液冷解决方案的采用率正在攀升,但大多数数据中心技术人员并未接受过充分培训,无法熟练操作液冷硬件及掌握必要的组件维护技能。
设计师在评估液冷解决方案前,必须明确自身的目标与诉求。下一步应制定计划,对数据中心项目及其现有设备或目标新设备展开详细审计,这将有助于明确设备要求与场地条件。
之后,需准备好清晰阐述自身目标,并筛选出最优的单一来源供应商。该供应商应不偏袒原始设备制造商(OEM),且精通多种液冷技术。
单一来源合作伙伴需具备以下能力:主导初期方案规格制定与范围界定、采购用户指定技术;提供现场项目管理与安装服务、完成服务器的安装调试;为新系统提供全生命周期维护。若设计师同时评估多家解决方案供应商,需记得向每家索取总拥有成本(TCO)汇总报告,以进行真实、可靠的对比。
常见液冷技术介绍
液冷技术适用场景广泛、应用范围全面,但安装过程较为复杂。
后门热交换器(RDHX)
后门热交换器(RDHX)是一种在数据中心中应用较为广泛的液冷技术。其工作原理是将热交换器直接安装在服务器机架的后门位置,通过冷却液在热交换器内部的循环流动,吸收服务器排出的热空气的热量,从而实现对服务器的冷却。后门热交换器(RDHX)是最常用的技术之一,它是侵入性最低的液冷解决方案,可对现有机架系统进行改造升级。
芯片直冷技术(DTC)
芯片直冷技术(DTC)又称冷板液冷或直接液冷(DLC)。其原理是通过将冷却液直接传导至服务器组件,如CPU、GPU等芯片表面,利用冷却液的高比热容和良好的热传导性能,迅速将芯片产生的热量带走,并通过循环系统将热量传递出去,实现对芯片的有效冷却。该技术对安装人员要求更高、操作更复杂,但冷却效率更高,且能支持更高的机架密度。
单相浸没式冷却技术
第三种方案是全液浸冷却,即单相浸没式冷却技术。它将服务器或电子组件完全浸没在具有导热性且不导电的液态介电质中,以介电质作为冷却剂来实现散热的一种先进液冷技术。全液浸冷却的安装复杂度远高于前两者,但相比后门热交换器和芯片直冷技术具有显著优势,比如能实现最高冷却效率和最优计算性能。同时,它还能大幅降低数据中心对暖通空调系统的需求,减少机房环境噪音,改善工作人员操作体验。
这种技术也被称为开式槽浸没冷却,将服务器或电子组件浸入具有导热性且不导电的液态介电质中,以该介电质作为冷却剂,防止电路放电。这种不导电的液态介电液能吸收组件产生的热量,且因属于单相技术,在整个冷却过程中始终保持液态。
介电冷却剂是一种可传递电场力但不导电的介质,常见例子包括矿物油或去离子水系统。
冷却剂与浸没在槽中的发热硬件直接接触,硬件通过热传导升高冷却剂温度。受热后的冷却剂被泵送至热交换器,经冷却后再回流至开式槽中。冷却塔就是热交换器的一种类型。
单相冷却系统维护成本更低、冷却剂费用更少,且在蒸汽产生和冷却剂蒸发方面的问题更少。
单相浸没式冷却的优缺点
单相浸没式冷却的优点包括:
散热效率高:液体比热容大,能高效带走组件热量,可应对高热负荷场景。
冷却均匀:介电液直接接触并包裹浸没的组件,实现组件整体均匀冷却。
降低噪音:无需风扇或其他气流驱动装置,大幅降低环境噪音水平。
简化冷却设施:不依赖空气循环,无需配备风扇、空调机组或大型冷却基础设施。
环境适应性强:系统相对隔离湿度、灰尘等环境因素,在恶劣环境中更具优势。
该冷却方式的缺点则如下:
初始部署成本高:浸没式冷却基础设施造价不菲,对现有数据中心进行改造时成本尤其高昂。
冷却液管理复杂:介电液的选型与管理至关重要,可能产生较高费用,且需确保材料的长期兼容性与稳定性。
维护与可达性差:组件维修或更换时需从冷却液中取出,给维护操作带来不便。
结语
展望未来,液冷技术在数据中心领域将迎来更为广阔的发展空间。随着人工智能、大数据、云计算等技术的持续发展,数据中心的规模和功率密度将进一步提升,对液冷技术的需求也将更加迫切。在技术发展方面,液冷技术将朝着更高效率、更低成本、更智能化的方向发展。在应用方面,液冷技术的应用范围将不断扩大。不仅在新建的数据中心中,液冷技术将成为主流的散热方式,而且在对现有数据中心的改造升级中,液冷技术也将得到更广泛的应用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.