IDC液冷产业链各环节的液冷技术储备及进展情况
发布时间:2023-08-07 18:28:29 来源:中研网

后摩尔定律时代芯片算力与功耗同步大幅提升,一方面,学界创新性提出“于芯片内部集成微流体液冷系统”,并逐步在业内尝试,主流CPU、GPU厂商则选择加装冷却器、对接液冷系统,实现芯片的液冷散热。

主流CPU、GPU厂商则选择加装冷却器、对接液冷系统,实现芯片的液冷散热:

CPU方面,以Intel为首的CPU芯片厂商选择为CPU芯片加装一体式(AIO)冷却器,与风冷模式类似,整个冷却过程从CPUIHS基板出发,IHS上附有导热管,方便两个表面之间进行传热,基板的金属表面则为水冷头的一部分,水冷头中装填冷却液。当冷却液通过水冷头时,会从基板中吸收热量,而后向上通过管道到达散热器,散热器再将液体暴露于空气中,实现冷却的一次循环。GPU方面,NVIDIA在其A10080GBPCIe中提供双插槽风冷式或单插槽液冷式双版本,A10080GBPCIe单插槽液冷版本类似于桌面液冷显卡,其中整合水冷头,接口置于GPU芯片尾部,方便对接液冷系统,HGXA100则采用SXM样式计算卡,在机架内部直接整合液冷系统。


(相关资料图)

主流芯片厂商布局情况

(1)CPU方面,Intel2023Q1发布的第四代至强处理器多款子产品热设计功耗达350W,传统风冷解决方案散热压力极大,2023年1月Intel至强发布会上表明,第四代至强处理器将会配置液冷散热方案。

Intel与合作伙伴共同设计冷板式液冷解决方案。一方面,Intel携手生态伙伴,全面系统地总结冷板液冷系统的设计与实践经验,发布《英特尔高效能数据中心白皮书》、《绿色数据中心创新实践——冷板液冷系统设计参考》。另一方面,Intel和合作伙伴不断推进冷板方案的具体落地应用,2021Q2,Intel与京东云合作,基于第三代Intel至强可扩展处理器,共同调整其核心数、Turbo频率、TDP、RAS特性等主要参数,以适配冷板式液冷解决方案的部署。

Intel已通过自研、合作研发等模式对于服务器浸没式液冷开展研究。1)2021年,Intel宣布与Sumber合作,双方会将至强架构的CPU系统与精密冷却技术相结合,开发基于浸没式液冷的余热回收技术;2)2022年,GRC(GreenRevolutionCooling)公司宣布将会为Intel至强处理器提供浸没式液冷技术优化;3)2023年,Intel发言人透露,Intel将会在其希尔斯伯勒工厂内继续进行浸没式液冷创新技术研究。

(2)GPU方面,2022年5月,英伟达宣布将在A100、H100系列产品中引入直接芯片(DirecttoChip)液冷散热技术,A10080GBPCIe将在尾部安置接口,以对接液冷系统。根据Equinix与NVIDIA的测试结果,液冷NVIDIAA100PCleGPU一方面可以在空间相同的条件下,实现双倍计算量;另一方面,采用液冷技术的数据中心工作负载可以与风冷设施持平,但能源消耗量将减少28%。同时,根据NVIDIA估计,采用液冷GPU的数据中心PUE可以达到1.15,远低于风冷的1.6。

预计2025年国内IDC液冷市场规模将达到132.8亿元,其中AI服务器液冷市场规模达100亿元、通用服务器液冷市场规模达32.8亿元;

预计2028年国内IDC液冷市场规模将达到250亿元,其中AI服务器液冷市场规模达212亿元、通用服务器液冷市场规模达37.7亿元;

冷板式液冷对于服务器整体改动较小,浸没式液冷对于服务器有较高要求

(1)冷板式加装液冷模块

冷板式液冷对于服务器本身改动较小,主要途径为加装液冷模块。冷板式液冷是最为典型的间接接触型液冷技术,在冷板式液冷系统中,服务器芯片等发热器件不直接接触冷却液,而是通过装配在电子元器件上的冷板(通常是铜、铝等高导热金属构成的封闭腔体)将热量间接传递给封闭在循环管路中的冷却液体,从而将主要发热器件的热量传递出去。

冷板式液冷技术对现有服务器芯片组件及附属部件改动量较小,液冷化改造可操作性相对较强。主要在服务器中加装液冷模块,采用集中式或分布式CDU供液、Manifold分液,以此对于CPU、DIMM等部件进行精准制冷。在实际操作过程中,中国移动(呼和浩特)数据中心将冷板式液冷细分出“两级热管”、“水冷+热管”、“芯片冷板”三条具体技术路径:

“两级热管”液冷服务器:此模式将服务器CPU、GPU、内存等产生的热量从一级导热管传递至二级导热管,二级热管冷媒流动至换热器将热量传递给冷冻水,交换后的热水通过室外回水管路流出,完成整个换热过程。

“水冷+热管”液冷服务器:此模式将通过热管导热原理将服务器CPU、GPU、内存等产生的热量传递至热管冷凝端,冷却水在冷凝端与热管进行热交换,交换后的热水经由回水管路流出,完成整个换热过程。

“芯片冷板”液冷服务器:此模式采用泵驱动冷却液流过芯片背部通道,冷却液在通道内通过板壁与芯片进行充分热交换,带走芯片端的热量后,含有热量的冷却液将通过集分水器将热量输送至机房内的CDU完成热量交换。

(2)浸没式要对服务器箱体定制化改造

浸没式液冷改造对于服务器本身及浸没腔体具有较高要求。浸没式液冷改造过程中,服务器箱体需要进行定制,满足三点要求:1)采用高功率密度设计;2)采用结构定制化设计以强化液体与发热器件之间的热交换;3)采用结构定制化以提高浸没式液冷环境下电子信息设备的运维效率。同时,浸没式液冷服务器浸没腔体应该被设计顶部开盖、由四个壁面和一个底面围成的具有一定内部容积的结构,分气相区与液相区,服务器主板浸没于液相区内,气相区保障气密性良好,确保冷却液蒸汽无泄漏;单项系统中液相区的液体温度场需均匀,无局部热点,同一水平界面下温差需要<5℃。

实践层面上,中科曙光以液冷刀片形式为行业提供服务器改造思路。浸没式液冷技术基于液体直接制冷,当前仍然处于发展早期,由于研发难度较大、投入成本较高,当前入局的服务器厂商较少。中科曙光旗下子公司曙光数创,专注于数据中心制冷基础实施开发,由其所开发的以液冷刀片服务器为核心的浸没相变产品为行业提供技术商业化落地思路。液冷刀片服务器由刀片模块,后插单板、电源等组成,通过设备后总接口置于冷媒之中。根据曙光数创方案,将液冷服务器全部浸没于冷媒之中,CPU、GPU等发热元器件通过冷媒相变换热的方式实现散热,气化的冷媒进入换热器与常温冷却水换热,冷凝为液体后,完成热力循环。

标签:

X 关闭

X 关闭