AI时代主流的计算架构,存算一体芯片会是AI时代的最佳答案吗?

芯圈那些事 2022-08-15

存储芯片架构芯片

2538 字丨阅读本文需 6 分钟

近日,存算一体(存内计算)芯片设计公司苹芯科技宣布于数月前完成千万级美元A轮融资。中国工程院院士邬贺铨在2022中国算力大会上表示,对自动驾驶等场景产生的热数据(实时性数据),存算分离会使数据在存储和计算之间来回输入,此时存内计算更适合热数据的处理。

在冯诺依曼架构中,计算和存储功能分别由中央处理器和存储器完成。而处理器在跟随摩尔定律逐年提升性能的过程中,将对制程工艺不敏感的存储器甩在了后面,两者的性能差距形成了“存储墙”。相比之下,存算一体能够避免数据来回搬运所造成的功耗损失和时间延迟。在AI技术不断释放数据洪流和算力场景需求的大趋势下,存算一体芯片越来越受到产业界和资本市场的关注。

绕过存储墙是AI时代刚需

早在1969年,斯坦福研究所的William Kautz就提出了存算一体的概念。Kautz提出在芯片的存储单元中加入逻辑电路,并将多个单元连接起来组成阵列,这样能够打造更加灵活、速度更快、耗能更低的数字电路,以更好地适应当时大规模集成电路的需求。然而,早期的存算一体研究并没有取得明显的突破,以冯诺依曼架构为蓝本、按照摩尔定律的步伐提升芯片性能,逐渐成为产业界的共识。

但近几年来,存算一体又回到了业界的视野,并被视为重要的技术方向。

知存科技创始人兼CEO王绍迪向《中国电子报》指出,过去几十年是摩尔定律快速发展的时期,加上开发新的架构需要高昂的投入,因此在摩尔定律还能往下走的时候,产业界对存算一体这类架构创新的需求还不高。但近十年以来,算力需求的增长使存储墙的问题越来越凸显。

“到2010年以后进入后摩尔时代,行业内日益增长的算力需求和几乎走到极限的摩尔定律之间越来越突出的矛盾已经成为人工智能发展的巨大瓶颈。因此,能解决存储墙问题的存算一体技术受到了越来越多的关注,近几年在产业界得到了非常快速的发展。”王绍迪说。

尤其在2016年人工智能Alpha Go在围棋对弈中战胜世界冠军李世石之后,以深度学习为代表的统计学习理论与方法促动了整个人工智能行业的发展。OpenAI的分析显示,自 2012 年以来,人工智能训练任务中使用的算力每 3.5 个月翻一倍。计算需求的突飞猛进,对算力芯片的效能提出了更高的要求和新的挑战。

九天睿芯董事长兼CEO刘洪杰向我们表示,在冯诺依曼架构中,处理器从处理单元外的存储器提取数据,搬运时间往往是运算时间的成百上千倍。

“深度学习加速的最大挑战就是数据在计算单元和存储单元之间频繁的移动,市场急需可实现超高能效并且可以快速迭代的智能计算芯片来满足日新月异的市场变化。我们推出的新型类脑计算的存内计算体系架构就是面向AI发展的算力瓶颈,核心技术是解决AI算力能效比偏低的核心刚性需求。算力堆叠带来能耗问题,存算一体就是很好的解决方案。”刘洪杰说。

国内外存内计算赛道火热

目前,全球存内计算有不少玩家。除了学术界,产业界也越来越多的玩家布局该技术。

IBM基于其独特的相变存内计算已经有了数年的技术积累,台积电正大力推进基于ReRAM的存内计算方案;英特尔、博世、美光、Lam Research、应用材料、微软、亚马逊、软银则投资了基于NOR Flash的存内计算芯片。

5月Myhtic C轮融资了7000万美元,迄今为止已共计筹集了1.65亿美元;6月10日,知存科技宣布完成亿元A3轮融资,产品线扩充及新的产品量产,加上此前的两轮融资,截至目前,知存科技已完成累计近3亿元的A轮系列融资。

6月25日九天睿芯获亿元级A轮融资,用于新产品研发和人员扩充的工作;7月2日,杭州智芯科完成近亿元的天使轮融资,用于继续搭建团队,启动ACIM下一阶段技术研发与市场拓展。

8月24日,后摩智能宣布完成3亿元人民币Pre-A轮融资,将用于加速芯片产品技术研发、团队拓展,早期市场布局及商业落地;8月24日,苹芯科技完成近千万美元Pre-A轮融资,据悉,本轮融资将主要用于芯片研发相关工作。

这些存算一体芯片公司有的处于团队搭建阶段,有的是正在芯片研发阶段,还有的已经到了产品线扩充和量产阶段。

前几年这个市场国内也就仅有3-4家崭露头角的企业,但现在存算一体这个赛道显然已经开始变得热闹起来了。

AI芯片公司还是存储芯片公司,存算一体技术应该由谁来做?

可以说,现在对于业内而言,树在大家面前的首要问题就是达成技术方向上的共识,而想要达成技术共识之前,可能大家首先要解决的是,存算一体到底由AI芯片公司来做还是由存储公司来做?

由AI芯片公司来做,技术方向更多偏向于计算型存储或类脑计算,而由存储公司来做,存内计算方向则会更容易被发展和推动。

上文介绍的存内计算是从存储的角度去做计算上的融合,尤其伴随SSD产品(由NAND flash构成)的兴起,因嵌入了ARM核和DRAM,NAND flash、ARM和DRAM、控制器和内部总线实际上构成了一个计算机系统,这让存储产品本身就可以做计算任务,因此也为存算一体提供了发展平台。国内就有诸多初创公司在探索这个方向,尤其是由于AI的引入,各种数据的Key-Value只要直接存储在硬盘里,AI需要的数据就可以自动完成分类,可以显著提升非关系数据库的性能。

而计算型存储则是将存储做到计算芯片上,如现在很多处理器公司都在做片上存储这件事,IBM设计的Blue Gene Active Storage(BGAS)结点就是一种‘存储上的计算’系统,每一个BGAS结点包含32个处理器,每个处理器通过PCIe接口连接2TB的SLC NAND非易失闪存介质,大致就是这样一个思路 。

当然不仅仅如此,超越冯•诺依曼架构之上,人的大脑就是一个典型的存储计算系统,而仿照人脑的仿生系统也被认为是最有可能颠覆现有技术的终极发展方向。

作为电子复兴计划的一部分,DAPRA看中的就是这个更高级的系统——通过将电子元件编程为离散阻值状态并将不同权重的电子元件相互卷积以建立一个类似突触和神经元的系统,即神经拟态计算,又被称为类脑计算。此前,国内清华大学类脑计算团队打造的“天机芯”就是被称为异构融合类脑计算芯片,复旦大学也在单晶体管逻辑架构上有突破性的进展,为存算一体发展奠定了技术基础。然而需要指出的是,DAPRA团队在这项研究上已经涉及了超过1800种混合材料,其难度之高可想而知,而后面架构搭建等都是商用道路上必须要迈过去的坎,因此可以说,类脑的存算一体系统遥不可及。

尽管类脑遥不可及,退回到现有的芯片设计上,存算一体的挑战也是十分之多,如器件方面,现有的浮栅器件存储就不适合存内计算;在芯片的工艺上,存算一体的设计和流片周期都将会很长,甚至连现有的EDA工具,目前尚没有支持存算一体设计的。

总体来看,存算一体有IBM、知存科技等数十家大大小小企业在投入和探索,它们广泛分布在存储、计算等领域里,几大技术方向也都在发展中。但是因可探索的方向很多,且没有人知道哪一种是最适合商用的方向,可以说整个市场还处在早期的百家争鸣状态。

结尾:

人工智能的硬件化加速方法朝着多元化的方向发展,各种类型的加速方法的研究同步推进,各具特色且难以相互替代。

目前国内外在存算一体方面都处于起步阶段,存算一体正处于学术界向工业界迁移的关键时期,所以这可能是我们发展国产芯片的另一大重要方向。

来源:镁客网,AI芯天下, 中国电子报

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:芯圈那些事
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...