边缘计算与AI存储谁更好?边缘AI将“吃透”百亿美元众多市场

3441 字丨阅读本文需 8 分钟

根据估计,全球人工智能市场规模在2018~2025间的年复合成长率高达55.6%,庞大语言模型及影像处理带来海量资料的挑战,让存储在产业的重要性与日俱增,具有运算功能的新一代存储开发成为产业风潮。

为了加速AI终端应用落地,很多存储厂商都分别提出AI技术及发展布局。运算及存储整合的下一代存储开发,近年来成为存储产业的重点布局,各家大厂均相继新一波产业竞赛。

因为将AI技术导入终端装置呈现高度蓬勃发展,为了提升AI模型在语言及影像资料处理效率,存储带宽也必须跟进升级。

巨头都看好存储计算一体化

针对AI应用的不同需求,华邦电重点布局两大方案,将运算与存储整合于系统芯片的异质整合将锁定于强调运算的高带宽应用。至于针对轻智能、设计简单的低功耗产品则开发一系列HyperRAM产品,目前已陆续导入各类IoT应用。由于低脚数、低功耗、易于应用设计作为HyperRAM系列的最主要三个特性,HYPERRAM是采用串列讯号,但透过提升存储内部频率与I/O数量,更加适合穿戴式产品等要求低功耗的终端应用,且接脚数比传统设计大幅简化,相较于传统约需要40~50个接脚,HyperRAM可降低至仅约20个,华邦电表示,小容量32Mb~256Mb产品将可望于2022年导入穿戴装置的终端应用,预计最快品牌客户将于下半年推出新品上市。

除此之外,全球最大的DRAM制造商三星公司开始推出存储计算一体化(PIM)技术。其第一款PIM产品于2021年2月推出,该产品将人工智能计算核心集成到了它的Aquabolt-XL高带宽内存(HBM)中。HBM是一种围绕在一些顶级人工智能加速器芯片周围的专用DRAM。时任三星内存业务部门高级副总裁的IEEE会士金南成(Nam Sung Kim)表示,这种新内存旨在作为普通HBM芯片的“简单替代品”。

三星的两大竞争对手SK海力士和美光科技都在向其他类型的存储计算一体化迈进。

总部位于韩国利川的第二大DRAM供应商SK海力士正在从多个角度探索PIM,其存储解决方案产品开发副总裁兼主管朴一(Il Park)说。朴一还表示,目前该公司正在DRAM标准芯片中试验PIM,而不是可能更易于客户采用的HBM。对SK海力士来说,HBM PIM更可能是中长期目标。目前,客户在尝试将HBM DRAM放置在物理上更靠近处理器的位置时,已经要处理很多问题了。

将存储进行异质整合的近存储运算(Near Memory Computing;NMC)与PIM形成两大派别,虽然在业界各有拥护者,但多家存储大厂多半采取同步进行的双重布局,其中,近存储运算的异质整合设计虽然具有较多I/O数量,但存储与逻辑芯片进行叠加的设计较为成熟,并可达到节省连接线及降低功耗的效益。

PIM技术仍处于初期研究阶段,至于异质整合则与多家潜在客户进行合作及讨论相关规格,包含云端AI运算、服务器运算、AI独角兽等相关客户,并希望在DRAM芯片进行灌孔设计,类似于让讯号可以透过灌孔进行对外传输,未来希望将导入于边缘服务器等相关应用。

不同于过去AIoT主要集中于工控客户,边缘AI将全面开发全球软件及新应用客户,边缘AI将是未来5~10年的重要成长动能。

边缘AI落地需要整合要多方串连,因此必须透过集团力量去符合客户需求,举例在AI智能城市的智能电杆,其监控环境功能需搭配参考判断,也需要高度整合模组进行针对空气感测、远端监控和标案部分,并加入频外远端管理等功能,透过结合软硬整合、远端管理及数据安全等三大关键要素,将可望助力全球客户加速达成AI最佳化目标。

AI应用拉动需求,迈入产品化前夜

随着人工智能应用的爆发,业界迫切需要一项技术来解决传统冯·诺依曼架构存在的算力瓶颈与高功耗问题。这也是一众半导体大厂关注存内计算的主要原因。

对此有业内专家告诉记者,当前主流的计算架构均采用冯·诺依曼架构,其存在两个固有问题:即所谓的内存墙问题和功耗墙问题。冯·诺依曼架构的计算单元与存储单元分置,之间用数据总线连接,运算过程中就需要使数据在处理器与存储器之间进行频繁迁移,这一过程产生的功耗极为巨大,甚至比真正用于数据处理所产生的功耗还要高上百倍。内存墙则是指目前的CPU运算速度比存储器的数据存取速度快得多,存储器成为制约数据处理速度提高的主要瓶颈。现在的人们应对这个问题的主要方法是提高内存的处理速度或加大数据传输带宽,但这些都不能从根本上解决问题,开发一种将存储单元与处理单元完全整合的处理器方案,就成为解决这一问题的终极方案。

SK海力士定制设计项目负责人Dae-han Kwon 也指出:“对于 RNN(循环神经网络)等内存受限的应用程序,当应用程序在DRAM中使用计算电路执行时,性能和功率效率有望显著提高。考虑到要处理的数据量将大幅增加,存内计算有望成为改善当前计算机系统性能极限的有力候选者。”

正是在人工智能特别是边缘AI应用需求的推动下,存内计算的产品化开发进程也在加快。根据北京大学信息科学技术学院微纳电子学系副教授叶乐的介绍,存内计算技术大概率会实现产品化。目前基于SRAM的存内计算,已经进入到产品化的前夜,有望率先在可穿戴设备、智能手机等智能物联网AIoT领域应用,估计1到2年就有望看到产品级的SRAM存内计算芯片实现商业化落地。在此之后,存内计算芯片会逐渐往更大算力的应用领域渗透。基于MRAM的存内计算则会稍微滞后一些,这主要跟工艺可获得性有关。基于DRAM的存内计算芯片,有可能需要更长的时间才会落地,原因在于DRAM存内计算适用于大算力AI芯片,因此还需要解决其他一系列的技术难题,例如阵列间的互连和架构问题等。此外,大算力芯片,往往对通用性和可编程性要求更高,因此对于大算力芯片,架构需要更多的考虑通用性和可编程性,并且软硬件协同设计、编译器等工具链的重要性和难度也更为突出。

叶乐强调,不同应用场合对存内计算的需求也不同,消费电子、物联网终端、边端计算、云端计算对功耗、能效、算力密度、Bit精度、绝对算力、成本、是否需要非易失性等方面的侧重点和侧重程度各不相同,因此各类存内计算技术,均会有发展的必要性。

生态搭建存挑战,存内逻辑是方向

尽管存内计算的商业化进程不断临近,但在开发与应用中存在的挑战也不容忽视。业内专家指出,相较于传统处理器,存内计算本身就是一门非常复杂的、技术壁垒极高的设计方法,属于需要多年经验积累、大量资源以及时间投入才能实现的尖端领域。而更大的挑战还涉及到相关产业生态的整合,其中面临的挑战更加复杂。

在冯·诺依曼架构下,处理器与存储器是分别独立发展的,经过这么多年均已各自形成独立的产业生态,从设计到制造再到软件都已相当完备。而存内计算要想发展起来,实际是要将两个独立的生态整合到一起,其中所需投入的精力和资源是非常巨大的。

尽管存内计算面临技术开发与产业生态的双重挑战,但是其整体发展趋势依然被看好。叶乐指出,存内计算将是大势所趋,只有这种革命性的彻底的架构革新,才能真正解决内存墙和功耗墙的问题。从技术趋势上看,存算一体芯片将循着近存储计算、内存储计算、内存执行计算的技术路线发展。

此外,基于哪类存储进行存内计算设计也是开发重点之一。此次Sk海力士便基于DDR进行开发的,台积电则是基于SRAM。对此专家指出,目前开发者的研究之所以多是基于SRAM展开,一方面是因为SRAM比较容易获得,SRAM在标准CMOS工艺下即可得到,流片门槛较低。另一方面则因SRAM的存取速度是所有主流存储器中最接近CPU的,基于它进行存内计算开发,最容易解决内存墙问题。但是SRAM也存在芯片成本高、面积大的问题。更重要的是,SRAM属易失性存储器,断电后数据无法保存,还要把数据传输到其他NAND Flash等存储器当中,并不能从根本上解决功耗问题。NAND闪存等非易失性存储器可以保存处理后的数据,还具有成本低、容量大等优势,但是NAND闪存的存取速度慢,依然限制着未来存内计算芯片的速度。

因此,专家认为,对于那些投入存内计算开发的半导体大厂来说,将来更大的可能是基于新型存储器如MRAM、ReRAM等,做存内计算的开发。此类新型存储器一些性能上的优势是传统存储器所不具备的。当然,专家也指出,当前业界开发的新型存储技术工艺还不成熟,以之为基础进行存内计算或会需要的研发更长时间。

AI边缘计算加速爆发

云计算、AI和5G正在快速发展,全球的数据量也以惊人的速度增长。IDC数据显示,2015年以来,全球数据量每年增长25%,且50%的数据来源于边缘端。IDC预测,2025年全球数据量将达到175ZB,超过75%的数据需要在边缘侧分析、处理与储存。

这是因为,边缘节点更接近数据源,边缘计算能提高数据处理的效率、降低延迟,同时保护隐私安全。据美国市场调研公司CB Insights估算,到2023年,全球边缘计算行业整体市场容量有望达到340亿美元。

自2017年成为显学的边缘计算,其重要性更是彰显于AI人工智能与5G。过去AI必须仰赖强大的云端运算能力来进行数据分析与算法的运作,但随着芯片能力提升、边缘计算平台成熟,开始可赋予现场端装置、网关拥有较为初阶的AI能力,协助数据初步筛选分析、装置设备实时反应,该优势在工业领域、智慧城市、消费性市场都能让既有服务有进一步的提升,如实时警示、安全监控、语音助理、预防维护等应用的实现。

随着AI技术的快速发展,以及应用场景越来越丰富,资本对AI芯片行业的投入也越来越大,根据IT桔子数据显示,2012-2020年中国AI芯片行业投资金额逐年增长,2020年投资金额达到58.96亿元。从今年到目前的融资情况来看,今年AI芯片领域的融资金额规模预计超过100亿元。

而边缘计算市场规模正在以20%甚至更高的年复合增长率增长,将快速在家居、安防、智慧城市、医疗、自动驾驶等众多领域应用和普及。但这也带来了巨大挑战,丰富的场景和多样的应用对边缘计算产品的性能、功耗、稳定性、安全性要求各不相同。未来,边缘计算的可能性还有更多。

文章来源:半导体产业纵横,中国电子报,每日安全资讯

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...