都知道液冷技术好,但全栈式液冷存储应该如何越过“三重关”?

智能未来 2023-11-23
2248 字丨阅读本文需 6 分钟

11月15日,知名行研机构IDC发布了《液冷数据中心白皮书》,曙光存储为华南理工大学打造的液冷存储系统,作为业内首个也是唯一一个成功部署的案例入选。

白皮书指出,随着IT基础设施中芯片不断升级迭代、高性能芯片需求不断增加、服务器密集化程度越来越高、存储器容量越来越大,数据中心这个能耗“大户”,在“双碳”背景下实现低碳绿色转型迫在眉睫。

在此背景下,采用比风冷技术更节能、更灵活的液冷技术并全栈布局成为必然的趋势。

然而,液冷技术的落地并不容易,面临着缺乏统一标准、改造成本高、系统难维护等难题。尤其是液冷存储方面,在整个市场的占比几乎只有2%。

曙光存储在此次案例中成功部署近25PB液冷存储,基本完成全栈液冷数据中心建设,实现同等规模下性能提升100%、数据中心PUE(电源使用效率)<1.2、电费节省60%等显著成效,填补了行业空白。

液冷存储是全栈式的重点与难点

全栈式液冷数据中心的发展趋势已是必然,目前计算和网络的液冷均已落地,存储的液冷仍面临极大挑战。

《白皮书》指出,东数西算、AI、云原生等需求刺激下,数据中心的数据存储体量快速提升。统计显示,截至2023年6月底,我国存储总量达到1080EB,存储的能耗也持续提高。

然而,存储的液冷落地门槛极高,面临技术、生态、业务上的三重问题。

一,技术方面,液冷技术应用于存储设备,需基于目前存储架构与技术的革新,提供液冷存储方案,以优化存储性能,保证存储的稳定性,实现存力的高速增长。

这其中,需要考量安全性、效率、成本、环保等,不仅涉及到硬件设备的革新,还有软件系统的适配与优化。高性能的密封材料、可靠的连接技术、优良的管道设计、高效的冷却循环系统、良好的系统集成能力、精良的智能化支撑、足够的安全性及环境适应性等缺一不可。想要实现液冷存储,技术服务商需要有足够的积累与实践经验。

二,生态方面,主要包括两个体系的建设与完善,即,液冷配套基础设施及生态体系,存储硬件设施与软件研究体系。

实际来看,液冷技术的研发和应用仍处于初级阶段,产业发展不充分,存储的液冷化对产品研发与产出能力要求极高,技术服务商很难得到相关要求;同时,为提升存储性能、资源利用率、降低能耗,存储软硬件正不断优化,需要技术服务商具备与之匹配的液冷能力。

三,业务方面,液冷服务器的大规模应用是部署液冷存储的前提与条件,是液冷存储商业化落地的基础;此外还需具备液冷技术快速迭代的土壤。

目前,虽然大模型等人工智能的爆发推动了液冷服务器的部署,但大规模液冷服务器案例依旧较少,并且具备液冷技术研发、生产能力等完整液冷生态链条的技术服务厂商极少,导致存储的液冷化较难实现。

以此来看,由于技术、生态、业务上的高门槛,液冷存储发展仍需市场助推力。

三大优势实现能耗、成本、性能平衡

杨昀煦告诉智东西,在旧数据中心的液冷化改造上,由于要考虑机柜硬装、建筑物承重等改造成本,一般会比新建数据中心成本要高。

华南理工大学的数据中心于2019年建成,其PUE测算在1.4-2之间,耗电量巨大。数据中心改造规模较大,存储节点超过20个,存储容量扩展接近25PB,对成本的控制也是一个难题。此外,改造后的数据中心性能也要得到保障,需要寻求能耗、成本及性能之间的平衡。

面对这些挑战,曙光存储具备三大优势,能够从三个方面满足用户的需求。

能耗方面:冷板散热,软件调优。

据悉,该解决方案采用曙光ParaStor液冷存储系统,实现冷板散热与存储技术全面结合,散热效率相比原本的散热片提高3000倍。

在软件方面,积极采用数据重删压缩等技术进一步减少设备数量、降低系统功耗。测试显示,存储节点PUE值可降至1.2以下。

成本方面:存算一栈式,覆盖全生命周期。

由于曙光ParaStor液冷存储系统与曙光液冷服务器同源,二者可形成“存算一栈式”液冷方案,便于数据中心基础设施的统一规划、设计和共用,降低成本。

在提供全栈式液冷数据中心解决方案时,曙光可以覆盖数据中心建设的全生命周期,实现液冷数据中心端到端交付。从冷却塔、管路等基建开始就将液冷系统的安全部署考虑在内,并为未来的扩容做好准备。

性能方面:无风扇设计,超静音无震动。

传统风冷方案由于风扇的存在,面临元器件震动风险,而液冷技术的天然优势就是无风扇设计,可为硬盘提供超静音且无震动的工作环境,从而提高读写性能及稳定性。

此外,针对冷板漏液风险,曙光存储系统在内部设置多个监控点实时监测,通过漏液导流结构、漏液检测装置、温度监控装置,在发生漏液、冷板堵塞、断液、超温等故障问题时自动报警,可有效保障系统不遭受漏液风险。

液冷助力数据中心节能降耗

在浪潮信息与合作伙伴的努力下,一座座绿色数据中心正在快速崛起,它们在符合城市规划发展的同时也为企业带来了更高的效率与更低的运维成本。

据李金波介绍,浪潮信息与京东云联合发布的液冷整机柜服务器支持冷板式液冷,散热能效提升50%,与传统风冷整机柜相比,数据中心部署整体能耗降低40%以上,支持计算、存储、网络模块的一体化交付,高效运维部署,交付速度提高5-10倍,已经在京东云数据中心实现规模化部署,为京东618、双十一、虎年央视春晚红包互动等提供了基础算力保障,性能提升34%-56%,帮助数据中心降低PUE,实现低碳节能。

高密度计算带来的能耗挑战,促使数据中心液冷技术兴起发展。浪潮信息联合燧原科技发布了计算能力超群的“钱塘江”智算中心方案。

作为液冷与AI的结合体,钱塘江智算中心方案独具特色,它是全球首台开放加速模组液冷计算平台。实现了单节点8颗400W高性能AI芯片液冷散热,支持50摄氏度中高温水运行,智算中心整体PUE低于1.1,这在风冷时代是难以想象的。

在计算力方面,钱塘江智算中心方案基于浪潮AI服务器系统,配备了燧原科技高能效AI算力芯片邃思2.0。实现了单集群超过200P峰值AI算力(TF32),并支持按需横向扩容。

2022年我们看到了全球生态环境触目惊心的一幕,北极冰川持续融化、全球气候变暖、旱灾、内涝等事件频发,部分城市还出现了持续40摄氏度以上高温,可以说减少碳排放已经成为当务之急。多年来,我国也一直致力于节能减排,在很多领域升级产业结构,十四五规划中数据中心的相关政策也是重要的一环。

文章来源: 计算杂谈,智东西,中国IDC圈

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智能未来
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...