芯片散热,发自内“芯”:芯片功率奔向1000瓦,散热成为一大难题

数码面对面 2022-06-30

英特尔数据中心英特尔架构

2053 字丨阅读本文需 6 分钟

据anandtech报道,高性能计算 (HPC) 领域越来越明显的一个趋势是,每个芯片和每个机架单元的功耗不会因空气冷却的限制而停止。

由于超级计算机和其他高性能系统已经达到,并且在某些情况下超过了这些限制:功率要求和功率密度不断扩大。

根据台积电最近一年一度的技术研讨会的消息,随着台积电为更密集的芯片配置奠定基础,我们应该期待看到这种趋势继续下去。

晶体管功耗的缩小速度几乎没有晶体管尺寸那么快。由于芯片制造商不会放弃性能(并且无法为客户提供半年增长),因此在 HPC 空间中,每个晶体管的功率正在迅速增长。

随着工艺节点不断提升,芯片制程不断逼近物理极限,功能越来越强大,在带来了更高的集成度的同时,也带来了更高的功耗。因此,散热成为越来越多厂商关注的焦点。另外,对于数据中心而言,风冷在可靠性、能效、噪音等方面都存在问题,因此液冷技术已经以直接芯片(Direct-to-Chip)冷却的形式广泛应用于全球高速超级计算机中。

1、芯片设计和半导体制程确实走入了瓶颈

尽管半导体厂商总是说,摩尔定律从未失效。但无论是从产品设计思路、功耗数据,还是从真实的能效比测试结果来看,如今的整个消费电子芯片产业,实际上都已经走入了一个“性能大幅提高、但功耗也快速上涨”的怪圈。

就拿大家熟悉的PC端CPU来说,前几年无论Intel还是AMD的旗舰产品,大多都还维持在95W的功耗水平上。然后从9代酷睿开始,Intel率先将CPU的典型功耗放宽到了125W,然后就有了后续10代、11代酷睿睿频时超过200W的功耗表现。更不要说在高端工作站领域,2014年的Xeon 2699V3功耗还仅145W,到了2017年就出现了默认功耗300W的E5-2699P V4,而如今最高端的Xeon 9282 56核处理器,设计功耗甚至已经来到了400W之巨。

当然,AMD方面其实也并没有好太多。初代的锐龙7 1700X同样只有95W,到了Zen2的3800X上,典型功耗就上涨至105W,解锁PBO后我们甚至测得过300W+的瞬时功耗。而在定位更高的锐龙线程撕裂者平台上,初代的1950X“只有”180W,到了2990WX就上涨到250W,而目前最新的Ryzen Threadripper PRO 3995WX,则更是已经成为了常规散热器难以降服的280W“怪物”。

想要完全的发挥出芯片的性能,优秀的散热是必不可少的,那么主流的散热技术有哪些呢?

2、英伟达发布PCIe液冷GPU

日前,英伟达发布了率先采用直接芯片(Direct-to-Chip)冷却技术的数据中心 PCIe GPU,为可持续发展贡献了自己的力量。

Equinix 正在验证 A100 80GB PCIe 液冷 GPU 在其数据中心的应用,这也是该公司为实现可持续性冷却和热量捕获的综合性方案中的一部分。GPU 现已进入试用阶段,预计将于今年夏季正式发布。

数据中心运营商正试图将 PUE 降至接近 1.0 的理想水平。Equinix 设施目前的平均PUE为 1.48,而其旗下新数据中心的 PUE 最低可低于 1.2。

在单独的测试中,Equinix 和 NVIDIA 均发现:采用液冷技术的数据中心工作负载可与风冷设施持平,同时消耗的能源减少了约 30%。NVIDIA 估计,液冷数据中心的 PUE 可能达到 1.15,远低于风冷的 PUE 1.6。

在空间相同的条件下,液冷数据中心可以实现双倍的计算量。这是由于 A100 GPU 仅使用一个 PCIe 插槽,而风冷 A100 GPU 需使用两个 PCIe 插槽。

数据中心运营商旨在淘汰用于冷却数据中心内部气体的冷水机组,因其每年会蒸发数百万加仑的水量。而借助液冷技术,系统仅需对封闭系统中的少量液体进行循环利用,并能够着重于主要的发热点。

至少有十几家系统制造商计划于今年晚些时候在其产品中使用液冷 GPU,包括华硕(ASUS)、永擎电子(ASRock Rack)、富士康工业互联网(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新华三(H3C)、浪潮(Inspur)、英业达(Inventec)、宁畅(Nettrix)、云达科技(QCT)、 超微(Supermicro)、 纬颖科技(Wiwynn)和超聚变(xFusion)。

液冷技术的使用范围并不局限于数据中心,汽车和其他系统也需要利用该项技术来冷却封闭空间内的高性能系统。

3、英特尔投资液冷技术

英特尔公布两项全新投资计划,以持续推动打造可持续发展的数据中心技术解决方案。首先,英特尔宣布将投资逾7亿美元,建设一个占地面积约20万平方英尺的领先大型研发实验室,旨在聚焦创新的数据中心技术,并解决加热、冷却和用水等领域的问题。此外,英特尔还推出了业界首个开放知识产权的浸没式液冷解决方案和参考设计。截至目前,英特尔已在中国台湾启动了初始设计概念验证,计划助力简化并加速浸没式液冷解决方案在全球生态系统中的落地实施。

新的大型实验室将关注浸没式冷却、用水效率以及热量回收和再利用等应用领域。该实验室将于今年在俄勒冈州希尔斯伯勒的Jones Farm园区开始建设,并预计于2023年底投入使用。值得注意的是,该实验室不仅将验证、测试和支持运行英特尔数据中心产品组合,如英特尔®至强®、英特尔®傲腾™、网络接口和交换机设备、英特尔® Agilex™ FPGA、Xe架构GPU、Habana加速器及正在开发中的全新产品;其亦将展示先进技术,让客户和合作伙伴能够在实验室内的多样化数据中心环境中观察和测试英特尔产品,推动和加速领先技术在整个生态系统中的应用。

与此同时,英特尔发布业内首个开放知识产权的数据中心浸没式液冷解决方案和参考设计,这是一种开放、易于部署且易于扩展的整体冷却解决方案。它将有助于帮助合作伙伴加速部署和使用英特尔解决方案,以应对数据中心功率和密度不断提升的趋势,从而提高运营效率。台湾英特尔公司与本地生态系统携手合作,分阶段完成初始的解决方案和设计概念验证,并计划扩展至全球各地。未来,英特尔将持续携手合作伙伴共同开发和验证相关解决方案。

数据中心用电量约占全球电力需求总量的1%,全球碳排放总量的0.3%。英特尔旨在通过投资标准化冷却技术和研发加速创新,这也进一步展示了英特尔对可持续的技术解决方案的坚定承诺。研究表明,与传统数据中心相比,支持能源回收和再利用的浸没式冷却可将碳排放量减少45%。

来源:半导体行业观察 ,Mo丶Ge,电子工程世界,三易生活

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:数码面对面
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...