数据中心的能耗焦虑,液冷技术能解吗?

电子放大镜 2022-11-04
3303 字丨阅读本文需 8 分钟

在《碟中谍5》中有这样一个场景:一座位于摩洛哥的数据中心被直接“泡”在了水里,为了让自己的技术支持班吉·邓恩通过一个需要步态识别的走廊,阿汤哥纵身一跃,跳入了漩涡之中,顺着水流就被推入了计算机中枢,从而黑掉了安保系统……

这部电影的上映时间是2015年,场景看似科幻,但其实就在同一年,阿里云已经开始进行浸没式液冷技术的概念验证。

所谓浸没式液冷,就是将布满密密麻麻红黄色线头的服务器浸泡在水一样的液体里,只是这些液体并不是普通的水,而是特殊的绝缘冷却液,服务器运算中产生的热量被冷却液吸收后,再进入外循环冷却。

数据中心的能耗大致由通信及网络设备、供电配电系统、照明及辅助设备和冷却系统组成,其中冷却部分的能耗约占数据中心总能耗的40%左右。

以往由于风冷成本低、部署简单,一直被广泛使用。但近年来,随着高密度计算兴起,芯片、服务器性能和单机柜功率密度持续提升,浸没式液冷开始受到青睐。

以阿里云在杭州的云数据中心为例,作为国内规模最大的全浸没液冷集群,整体节能超70%,年均PUE低至1.09。相比传统数据中心,每年可以省电7000万度,相当于西湖周边所有路灯连续点亮8年的耗电量。

尤其是今年2月,我国“东数西算”工程正式全面启动。其中,提出了三个发展方向:绿色节能、算力调度、安全可靠。绿色节能被放在了优先位置。

“无论从政策角度、市场需求还是技术成熟度来讲,均标志着数据中心进入‘液冷时代’。”中国电子节能技术协会秘书长吕天文此前在2022数据中心液冷技术研讨会上说道。

数据中心“火热”,但能耗隐患不容忽视

谈到算力的增长,有一个非常直观的数据可以形容。

1992年,全球每天产生的数据只有100GB,而现在,这个数字达到了当时的105亿倍。以我国为例,在过去的6年间,我国数据量每年以超过30%的增速上涨。即便现在每天产生的数据量已经足够庞大,但数字经济仍会不断飞速发展是一个确定的趋势,这也意味着,数据量的增速依旧不会停止。

当下,“东数西算”已经成为与西气东输、西电东送、南水北调等并列的又一超级工程,并且在数字经济不断发展,算力消耗速度不断提升的前提下,数据中心的产业规模仍会不断提升。

“从全球的数据中心来看,服务器数量在2020年的增长率大约为6%,2021年4%左右,但在中国,这个增长率达到了11%。”周赞鑫表示,“即便2021年只有8%,还是达到了全球水平的双倍,从我们中兴通讯自身来看,2021年我们服务器的发货量达到了16万台,从2018年至2021年整个服务器的发货规模增长了6倍以上,2021年比上一年增长率更是达到了88%,这样的发展势头是非常凶猛的。”

好的一面是,未来我们对于算力的需求会越来越容易满足,并且能够创造出更多现在无法想象的黑科技,甚至是一个完全类比真实世界的“元宇宙”世界,但我们需要焦虑的一面是,按照如此势头发展下去,未来数据中心产业对于数据的消耗可能会脱离我们所有人的控制。

根据公开数据显示,中国数据中心2022年总能耗将突破2000亿千瓦时,而据国网能源研究院则预测,到2030年,我国数据中心用电量将突破4000亿千瓦时,占全社会用电量的比重达3.7%。

这可能是许多人都无法想象的数字,以2020年三峡全年总发电量1118亿千瓦时来计算,需要两个三峡发电站才能满足数据中心整年的消耗。

被捧上神坛的“液冷”技术

在算力正在重塑产业格局的机遇面前,数据中心已然是无法拒绝的刚需,为数不多的选择在于提高算力效率并降低能耗,而能否找到新的散热方案,逐渐成为计算产业上下游必须应对的课题。

传统的散热方案以风冷为主,即将空气作为冷媒,把服务器主板、CPU等散发出的热量传递给散热器模块,再利用风扇或空调制冷等方式将热量吹走,也是散热系统消耗数据中心近半电力的主要诱因。

当PUE值被严格限定,绿色计算渐渐深入人心的时候,上世纪80年代就开始尝试的“液冷”技术,迅速成了产业上下游的新焦点。其实“液冷”技术的原理并不复杂,简单来说就是利用矿物油、氟化液等绝缘低沸点的冷却液作为冷媒,通过热交换将服务器的热量排出,并演变出了冷板式、喷淋式、浸没式等多种散热方案。

看似只是“冷媒”的改变,却为数据中心的节能降耗带来了诸多可能:

比如风冷热传导存在过程复杂、热阻总和大、换热效率较低等痛点,在很大程度上制约了数据中心的算力密度,并且常常会产生很大的噪声。液冷技术所呈现出的节能降耗、减少噪声、节约空间的特性,不可谓不诱人。

一个直接的例子就是普渡大学的Bell集群,10个机架的戴尔PowerEdge C6525 服务器直接浸没在冷却液中,运行时产生的热量直接被冷却液吸收,PUE最低可以降到1.05左右,散热所需的功耗比传统方案降低了90%以上。

再比如风冷想要提高散热能力,最“简单粗暴”的做法就是提高风扇转速,可把热量带出去的同时,风扇和硬盘间也会形成大的漩涡,不规则的湍流可能会影响硬盘的读写能力,甚至会因为磁头震动导致硬盘报废。

液冷技术近乎完美地规避了这些不利因素,由于液冷方案是一个相对静止的环境,可以有效降低由空气、灰尘和震动引起的硬件产品故障率,且数据中心始终在低温环境中运行,极大地提升了内部电子元器件的使用寿命。

可以看到的是,液冷技术的出现和应用,在很大程度上让计算和散热跳出了“囚徒困境”,对风冷降维打击的综合优势,也让液冷技术被不少人捧上神坛。然而和很多新技术一样,液冷方案同样存在天然短板:冷却液的价格堪比茅台,无形中增加了散热的硬性成本;液冷技术对数据中心的机房环境要求苛刻,重新改造的成本较高;液冷技术降低了PUE,运营成本却难言优势……

液冷是各种散热方案中毋庸置疑的翘楚,却也要考虑到现实的考量。

研发“无人区”,标准、成本如何解?

根据MordorIntelligence的报告,2020年全球数据中心浸没式液冷市场的整体规模为2.97亿美元,预计到2026年将达到7.03亿美元,期间复合年增长率为15.27%。

数据中心浸没式液冷技术发展迅速,优势也显而易见,能突破散热瓶颈,实现更优能效比,但真正应用的企业并不多,即使是在数据中心领域有着非常大技术投资的互联网巨头,也没有真正规模化应用这项技术。这就意味着浸没式液冷技术的研发就像行走在“无人区”,前面没有领路人,很多技术方向都是需要摸索,也就不得不面临技术难度、成本偏高、缺乏标准化,还有腐蚀、漏液等问题。

浸没式液冷技术的原理是用液体去代替空气进行换热,它同传统的风冷技术相比,革命性的地方不只是散热方式的变化,还会涉及到整个数据中心的生态,服务器、网络设备、监控乃至数据中心整体设计都将被改变和重新定义。“比如不导电的液体有很多种,哪种液体能够满足长期演进和长期使用?RD设备放在液体中是否能够长期稳定工作?甚至如何运维等等。”钟杨帆说道。

为此,阿里云联合了全球数十家合作伙伴,从芯片到服务器整机到机柜再到数据中心等多个供应商。比如芯片的重要合作伙伴是英特尔,其第三代英特尓®至强®可扩展处理器、以及高性能可编程芯片FPGA等产品都需要在浸没液冷系统中高效并可靠地运行。通过联合供应商联合研究开发验证,一点点地迭代部署来发现问题,解决问题,从而实现规模化部署。

处于行业初期,供应链、生产链并不健全导致标准也缺失,比如业界对液冷材料兼容性、液冷产品材料选型、浸没液冷机柜和服务器结构、光模块等均没有规范标准。“如果没有标准,特别是行业标准,就没有规模经济,就很难降低成本,也就很难做到复用去支持可循环经济的产业链的发展。”王飞说道。

为了推动行业标准发展,阿里云先是在去年与中国信通院云计算与大数据研究所、OPPO共同发起“浸没液冷智算产业发展论坛”,并在今年5月举办的第一届浸没液冷智算产业发展论坛上,发布了新的浸没式液冷技术的三大技术标准和两项白皮书。

英特尔则是发起成立了绿色数据中心技术创新论坛,集合20家ICT产业上下游厂商,横跨多个领域,覆盖整个数据中心产业链。该论坛的成立,旨在通过技术创新和产业合作,加速数据中心运营模式的绿色转型,推动数据中心节能减排、可持续发展,支撑数字基础设施建设、碳中和计算,实现碳达峰、碳中和的“双碳”目标。

另外,对新技术的引入、研发等存在成本。浸没式液冷系统的部署成本不仅包含液冷设备罐体和冷却液的价格以及后续的维护成本,还包括泵、换热器、过滤器、传感器等一系列用来满足液冷系统设计实践的其它设施的改造和维护成本。尤其是对于那些已按照风冷系统建设完成的数据中心来说,改造成本往往是巨大的。据了解,当前由于浸没式比起传统方式初期投入构建成本高,大约都有几倍的价差。

为了解决成本高昂的问题,据TomsHardware报道,英特尔持续研发浸没式液冷散热解决方案,让数据中心更多地采用浸没式液冷散热,同时不需要耗费大量资金设计定制解决方案,这将大幅度降低成本及碳排放。

任何技术在发展初期,具体发展道路都是曲折的、迂回的,伴随着数据中心节能减碳的需要与高密度数据中心的发展,政策驱动、巨头出手,数据中心浸没式液冷正进入大规模商用加速道。

文章来源: 36氪品牌,Alter聊科技,钛媒体

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:电子放大镜
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...