数据中心液冷大致分为两类
在高密度AI服务器冷却中,空冷逐渐接近极限,利用液体搬运热量的“液冷”正在扩大。液冷并不是单一方式,而是大致分为direct liquid cooling(DLC) 和 immersion cooling 两类。两者都比空气更能搬运热量,但机制、导入难度和维护方式不同。
什么是direct liquid cooling(DLC / direct-to-chip)
direct liquid cooling是让cold plate紧贴CPU/GPU等高发热部件,并通过其中流动的液体回收热量的方式。它不是把整个服务器浸入液体,而是只对高温部件进行局部冷却;很多配置也会同时用空冷处理内存和低发热部件。由于比较容易保留既有机柜和服务器结构,导入门槛相对较低。
产品化也在推进。CoolIT的机柜型CDU(冷却液分配单元)「CHx200」在4U机箱内可处理200kW热负荷,并可冷却最多200台服务器;同时支持温水冷却,并具备N+1冗余泵/电源(CoolIT Systems)。NVIDIA的GB200 NVL72等机柜级液冷设计,也以这种direct liquid cooling为前提(NVIDIA)。
什么是immersion cooling:single-phase与two-phase
immersion cooling是将电子设备直接浸入介电(不导电)液体的方式。由于部件与液体直接接触,热移动效率较高。immersion cooling又可分为两类。
- single-phase:液体不沸腾、不汽化,通过循环和换热器搬运热量。
- two-phase:液体因部件热量而沸腾汽化,再由冷凝器恢复为液体。由于利用相变,通常被认为比single-phase具有更高传热能力。
学术研究也报告称,与空冷相比,immersion cooling可将能耗降低约50%、占用空间降低约三分之二;同时也指出维护性和IT设备处理难度等课题(arXiv)。在高冷却能力的同时,运行和维护方式会与空冷大幅不同,这是实施上的主要论点。
direct liquid cooling(DLC)
用cold plate对高发热部件局部冷却。较容易应用于既有机柜,导入门槛较低。低发热部件也可并用空冷。
immersion(single-phase)
把整体浸入介电液体。冷却能力高,但布线和维护方式会不同于空冷。
immersion(two-phase)
通过相变获得更高传热。冷媒、冷凝器设计和故障模式管理是要点。
选择视角
按热处理能力、既有设备利用、维护性,以及OCP等标准化带来的生态系统成熟度综合判断。
总结
DLC可以概括为“对高温部件局部冷却、容易保留既有结构”,immersion cooling可以概括为“整体浸入以获得高冷却能力,但运营和维护方式会改变”。选择哪一种,取决于机柜功率密度、既有设备、维护体制和标准化成熟度。冷却方式选择也会影响电源和功率器件的设计前提,详细内容见相关文章。
