Arm新架构推出“私人订制”,定制化芯片风口正式开启,按需构建再度成为“潮流”

微观人 2022-10-31
3306 字丨阅读本文需 9 分钟

众所周知,2000年手机移动时代的发展带动了Arm架构的繁荣。随着行业进入由5G、工业互联网、物联网、人工智能等驱动的数字化时代,Arm似乎又再次迎来了“风口”。短短4年内亚马逊云科技(AWS)的定制芯片Graviton系列CPU已经发展到第三代;Ampere宣布每年推出基于Arm架构高核心数服务器CPU;英伟达发布了面向AI及高性能计算 (HPC) 的Grace CPU;VMware运用DPU开展Monterey项目;包括AWS、微软、谷歌、阿里巴巴、甲骨文等主流的公有云厂商都在使用DPU来支撑云工作负载。所有这些都可谓是按需构建的定制化芯片。

一个定制化芯片的时代正在开启。

Arm Neoverse:一个或将颠覆现代计算的架构

当前,全社会数据总量爆发式增长,数据存储、计算、传输、应用的需求大幅提升,对算力的需求也越来越高。CPU不仅需要处理通用计算类任务,还需要承担网络、存储、安全等任务,有效算力在总体算力中的占比逐渐下降,行业亟需在特定领域更高算力的芯片的支撑。而随着Arm Neoverse架构的发布,整个行业迎来了巨变。

2018年Arm首次发布了Arm Neoverse平台。目前,Neoverse平台主要包括三个IP系列:分别是V系列、N系列和E系列。据Arm官网介绍,Neoverse V系列主打极致性能,适合执行高计算需求和存储器密集型应用的系统,主要应用场景包括高性能计算 (HPC)、云计算和AI/ML加速型工作负载;Neoverse N系列主打可高扩展的性能表现,提供均衡的最佳化CPU设计、出色的性能功耗比和性能成本比,应用场景包括可高扩展的云计算、企业连网、智能网卡/DPU以及客制化ASIC加速器、5G基础设施以及电力和空间受限的边缘场景;Neoverse E系列主打高效率吞吐量,在支持高资料吞吐量的同时,大幅降低功耗,主要应用场景包括网络资料层处理器、低功耗网关的5G部署。

可以看出,这三种内核分别针对三种不同的性能和功耗权衡,这就为各行业实现定制化芯片带来了充分且灵活的施展空间。但光有硬件还远远不够,要打造成功的基础架构解决方案,还需要一个强大的软件生态系统。

在软件生态系统方面,Arm不仅在开源社区有着长期且持续的投入,并在Arm Neoverse平台的设计原则中纳入了构建独一无二的开发者生态系统,目的是赋能开发者顺畅地进行创建、测试以及优化在基于Arm架构上的项目开发,如今,Arm架构得到了所有领先编程语言和运行库的支持,例如Linux操作系统、云原生软件、CI/CD流水线等都已经运行在Arm架构上。从架构、IP到技术库、运行环境和编译器,Arm已启用了主流的基础设施软件。

软硬件充分加持下,Arm Neoverse架构正在吸引一众云服务厂商、CPU厂商、GPU厂商、DPU玩家的青睐。

定制芯片重返潮流

曾几何时,芯片公司都专注于设计一种芯片:英特尔制造 CPU、高通制造调制解调器、英伟达制造 GPU、博通(Avago 之前)制造网络芯片。那个时代已经过去了。半导体的未来将是为更具体的用途设计更具体的芯片。这种变化需要很多年才能体现出来,但过渡已经开始。这将颠覆半导体行业,其程度与过去 20 年的整合程度相同。

造成这种情况的原因有很多。最简单的就是说摩尔定律正在放缓,所以每个人都需要寻找新的商业模式。在 2010 年之前的迷雾中,摩尔定律意味着芯片每两年左右就会变得“更快”或“更好”。如果某些客户有他们需要的专用芯片,他们可以出去设计自己的芯片。但是当他们将自己设计的芯片投入生产时,会发现市场上的新CPU正在投入生产,而这些通用CPU通常比自研的专业芯片效果更好。

然后摩尔定律放缓了,我们没有足够的证据说它已经结束,但它肯定已经放缓了。因此,现在每个人都必须更加努力地从他们的硅设计中努力提升性能。最明显的是,这为所有来自硬件和超大规模公司的定制芯片打开了大门。

半导体的全部意义在于运行某种形式的软件。正如我们所说,在过去,我们可以从更密集的芯片中获得该软件的性能提升,但现在公司将不得不更仔细地看待问题的软件方面。谷歌推出 TPU是因为他们想要更好地运行他们的 AI 算法的东西。他们出于同样的原因推出了VCU,而该芯片实际上是由软件工程师设计的。Apple及其 M 系列和 A 系列处理器也是如此。在所有这些中,重点是优化软件的芯片。

不是每个人都想要或能够推出自己的芯片,因此我们开始看到大量的中间芯片,它们不是单一类型的通用计算,也不是完全定制的。AMD 最近收购的 Pensando DPU 就是这个中间步骤的一个很好的例子。

曾几何时,数据中心本质上是装满 CPU 的仓库。现在他们还必须容纳 GPU、AI 加速器、网络负载和一堆 FPGA。这通常被称为异构计算,它与过去的 CPU 统一性相反。

这些变化也不仅仅发生在数据中心。“边缘计算”的整个概念看起来越来越像是一种定制和半定制硅的结合,出现在各种地方——汽车、工厂和智慧城市等。

最终,主要的芯片公司将不得不决定如何应对这些变化。构建定制芯片不是一项伟大的业务,但设计半定制芯片充满风险,尤其是选择正确的设计、支持它们并希望它们达到目标。

老牌公司已经开始为此做好准备,十年来,初创企业的大门第一次开始打开裂缝。

元宇宙也离不开定制

在元宇宙大背景下,AR头显设备重新回到人们的视野中央。在2022年的CES上,三星展示了AR如何被纳入汽车的挡风玻璃,以显示天气、轮胎压力水平、地图等信息。微软则继续打磨HoloLens,目前HoloLens 2工业版已被推出。谷歌正在开发下一代AR头显设备,项目代号“Project Iris”,产品预计最快会于2024年上市。至于苹果AR眼镜的爆料信息,更是频频见诸网络之中。

然而元宇宙浪潮下的重新回暖,并未让AR设备中存在的一些问题得到彻底解决。有专家指出,设备太过笨重,周边应用环境不够成熟,传输数据不够完善,产品使用限制过大等,依然制约着用户特别是消费电子用户使用AR设备的热情。数据显示,AR 设备因为没有达到消费级水平,目前出货量比较少,2021 年全球市场AR头显出货量28万台。如何让AR能够尽快贴近用户使用需求,是AR设备厂商的当务之急。

针对目前市场上大多数AR设备依然采用通用芯片的情况,芯原股份业务运营高级副总裁汪洋指出:“AR是近年来才开始发展出的一种新型产品,市面上现有的很多通用计算芯片,一般主要针对如手机、平板电脑、PC等应用而深度优化和绑定。在被应用到AR设备中时,常常会出现部分功能冗余、部分特定功能无法满足,以及显示性能或是功耗不理想等问题,这极大限制了AR设备端的发挥。这些设备的使用体验欠佳,不利于市场的打开,也阻碍了AR技术和设备的进一步迭代。”

而面向AR设备开发定制化芯片或将为AR的发展提供有利契机。安谋科技智能物联网事业群联合负责人商德明表示,AR产品具有全新的应用场景,既要满足日常佩戴对重量的要求,又要打造极致的交互体验。这就使得定制化芯片在实现应用中显示更加重要。

Rokid创始人暨CEO祝铭明则指出,AR眼镜的进化,依赖于核心部件和生态系统的支撑,其中核心部件包括光学与芯片等。区别于电脑、手机芯片,AR芯片对算力和低功耗有着更高要求,涉及到高昂的开发成本和技术门槛。“自研芯片+自主OS”的紧耦合是AR芯片未来的演进方向。芯片不能孤立进化,软硬一体的高度协同才能够使计算性能最大化。

国产CPU和DPU初创企业嗅到商机

近年来正值中国基础设施的计算升级新浪潮,因此,国内服务器芯片赛道也迎来了蓬勃兴起。国内一众初创企业如鸿钧微、遇贤微等将Arm Neoverse作为其服务器芯片的创新基础,甚至新兴的DPU企业也开始率先踏上探索之路。

鸿钧微电子是服务器芯片领域新兴的一员。在鸿钧微电子首席执行官沈荣看来:“数据中心的规模越来越大,其占地与体积随之将变得更大,这意味着要花费更多的资金投入,所以性能密度、功耗效率这些指标便显得尤为重要,而Arm Neoverse符合云计算所需的多核解决方案,具有优异的总拥有成本 (TCO) 优势,让我们找到能真正为客户提供具成本效益的整体解决方案。”据悉鸿钧微电子基于Neoverse N2的服务器CPU产品预计将在明年年底面世。

遇贤微电子是一家正在面向中国云计算市场打造弹性云原生服务器CPU的初创公司,采用的也是Neoverse N2平台。遇贤微电子首席执行官罗勇博士表示:“云计算的巨大增长是新一波科技浪潮的趋势,它将会是全球范围内最大的增量市场之一。而且,云计算生态系统已经是个相对成熟的环境,能让像Arm Neoverse这类的新架构来取代x86,最终用户能够从一致性的Arm Neoverse CPU上获益,也可以加速遇贤微电子产品的部署。”

不止是CPU和GPU这两类芯片,DPU芯片厂商也看中了Arm Neoverse的潜力。DPU (Data Processing Unit) 是最近几年新发展起来的一种专用处理器,被称之为数据中心继CPU和GPU之后的“第三颗主力芯片”。目前DPU主流方案亦开始以Arm Neoverse平台为设计基础。Arm基础设施事业部全球副总裁邹挺表示,“我们认为ASIC系统级芯片是普遍的最后DPU目标产品形态,而从能耗和性能的要求上来看,Arm Neoverse平台将是DPU中ASIC系统级芯片方案的最佳选择。”

国内DPU芯片头部企业云豹智能最新的DPU SoC产品上就采用了大量的Arm CPU,尤其是Neoverse CPU与其高性能互连技术。云豹智能首席芯片架构师及联合创始人莫志城指出:“现阶段数据中心正在快速地从以CPU为中心转变为以DPU为中心。云豹DPU不仅要能处理网络控制面和数据面的卸载,具备高度灵活和可编程能力;同时必须非常高效地处理运维和业务管理。因此我们的可编程DPU必须依赖非常高性能且低功耗的CPU,例如新一代的Neoverse。”据悉,云豹这款DPU产品预计于2023年初流片。

可以看出,由于高性能、低能耗、优异的性能比以及总拥有成本等特点,尤其是完善的自身生态,Arm架构正在吸引广大中国初创芯片企业的涌入,生态“朋友圈”逐渐扩大。另一方面,如Arm Neoverse这样的平台也为这些初创企业提供了很好的发展机会,并在加速芯片进入市场的时间窗口,如上文所述,国内几家初创企业基于Arm Neoverse的产品大多将于明年问世。

文章来源: 中国电子报,半导体产业纵横,半导体行业观察

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...