数字基础设施中的新物种DPU:巨头、资本密集布局,未来会如何?

3548 字丨阅读本文需 8 分钟

近年来,DPU异常火热,除了传统芯片巨头企业积极布局DPU产品研发之外,国内涌现出十多家DPU创业企业,包括芯启源、中科驭数、云豹智能、星云智联等,与此同时,资本也大手笔密集进入该赛道。

DPU是数据中心继CPU和GPU之后第三颗重要的算力芯片,作用在于卸载CPU部分算力并释放到上层应用中,支持存储、安全、服务质量管理等基础设施层服务,帮助使用者获得超高性价比的算力,有效克服通信延迟,提升数据安全水平。

给CPU“减负”,为数据中心“降‘税’”

“DPU最直接的作用是作为CPU的卸载(offload)引擎,其效果是给CPU‘减负’。”《DPU技术白皮书》主编、中科院计算所研究员鄢贵海告诉《中国科学报》,作一形象比喻,DPU提供了数据中心一把“杀鸡”的工具,节省的是CPU这把“牛刀”,以释放CPU算力,留给更需要它的业务负载。

接管CPU的网络协议处理任务,就是一个很好的例子。鄢贵海说,比如在数据中心仅线速处理10G的网络,大概就需要一个8核高端CPU一半的的算力,而如果是40G、100G甚至更高速的网络,性能开销更大。

云计算巨头亚马逊云服务(AWS)形象地称之为“数据中心税”——还未运行业务程序,接入网络数据就要占去许多计算资源。

“DPU诞生的使命就是承载网络虚拟化、硬件资源池化等基础设施层服务,以释放CPU的算力到上层应用。”《DPU技术白皮书》编委会成员、中科驭数高级副总裁张宇解释说,将“CPU处理效率低下、GPU处理不了”的负载卸载到专用的DPU,就能实现对“数据中心税”的抵消,从而有助于提升整个计算系统的效率、降低整体系统的总体拥有成本。

张宇介绍称,DPU主要处理网络数据和输入输出(IO)数据,并提供带宽压缩、安全加密、网络功能虚拟化等功能。“这些可以说是离我们普通用户每天感知到的各种应用最远的功能了。而这些基础功能是实现日常应用更高效、更安全、更实时的保障。”

DPU的三个中文名

业界对DPU中的“D”有三种说法,因此DPU就有三个中文名。

一种是“Data”,DPU被称为“数据处理器”;一种是“Datacenter”,DPU译作“数据中心处理器”;一种是“Data-centric”,相应的,DPU可叫作“以数据为中心的处理器”。

中科院计算所研究员、中国计算机学会集成电路设计专业组副主任李晓维向记者解释说,这三种说法,乍一看意义差不多,但各有侧重:“数据处理器”既区别于信号处理器、基带处理器等“信号”处理,也区别于专门处理图形图像类数据的GPU,而是把各类时序化、结构化的数据放在核心位置;“数据中心处理器”只是偏重于描述DPU的应用场景,但显然它无法指代所有“服务于数据中心的处理器”;第三种说法则体现了DPU的设计理念,体现了计算架构从“以控制为中心”向“以数据为中心”的演进。

“以上三种关于DPU的说法,从不同角度反映DPU的特征,都有一定的可取之处,我们认为可以作为不同的三个维度来理解DPU的内涵。”李晓维说。

“随着‘软件硬件化’成为常态,异构计算的潜能将因各种DPU的普及而彻底发挥出来。”《DPU技术白皮书》编委会成员、中科驭数联合创始人兼CTO卢文岩认为,新一代的DPU不仅可以作为运算的加速引擎,还具备“控制平面”(即追求数据处理功能的覆盖面)的功能,能更高效地完成网络虚拟化、IO虚拟化、存储虚拟化等任务,彻底将CPU的算力释放给应用程序。

“可以说,DPU的出现将让各行各业的业务层数字化应用更全面、更流畅、更绿色。”卢文岩说。

火热的DPU赛道

作为数据的“高速公路”,DPU正面向一个千亿量级的市场,据研究预测,至2025年,仅中国的市场容量就将达到40亿美元的规模。

之所以能够取得如此高的增长率,原因在于目前数据中心内部流量(也称横向流量)的年复合增长率都在25%以上,但与此同时,随着SDN的增加,云服务器会在CPU和软件中使用很多SDN功能,使得高达30%的数据中心计算资源被分配用于联网I/O处理云数据。

坦率地说,如果听之任之,这个问题随着时间的推移只会越来越严重。

当前,以几何级数幅度增长的联网端口速度,远超摩尔定律和Dennard缩放比例定律(Dennard’s scaling)的计算周期速度,这种差距的存在使得服务器中所有的CPU资源都将遭到挤占,而无暇顾及应用级处理,降低了CPU利用率。如果是公有云的话,他们需要把这样的资源出售给客户来进行变现。但如果不能出售这些核心内容,云服务商就会赔钱,这是一个非常严峻的问题。

亚马逊和微软这样的一级云服务提供商在很多年前就意识到了上述问题的严重性,纷纷选择卸载掉服务器的联网功能,并将这部分工作转移到SmartNIC上运行,以便释放出更多的CPU核,优化服务器利用率,降低联网成本。

例如亚马逊收购了一家名为Annapurna的初创企业,专门开发类似的器件和SmartNIC,并在2017年发布了AWS Nitro;微软此前也通过将FPGA集成到SmartNIC上去卸载服务器的联网功能,并实现了数以百万计规模的部署;VMware则宣布将SmartNIC集成到VMware Cloud Foundation中的Project Monterey项目;而阿里云的做法是在其神龙服务器核心组件MOC卡中使用了专用的X-Dragon芯片,统一支持网络、I/O、存储和外设的虚拟化。

电信服务提供商则是另一大具有强劲增长潜力的市场,他们正考虑将SmartNIC从核心网集成到边缘网,为NFV和AI推断等应用提供服务。

不过,并非每一家公司都拥有足够的研发能力和人才储备去部署SmartNIC,因此目前有80%以上的云服务供应商尚未采用SmartNIC。相比之下,二、三级的厂商们就更加需要现成且方便的SmartNIC解决方案——无需自行开发,只需即插即用就可满足数据中心的卸载、存储和计算加速等需求。

哪些企业抢先布局?

在这个千亿量级市场中,国际芯片巨头如英伟达、英特尔、Marvell、博通等厂商,都在积极布局DPU产品研发,而且英伟达、英特尔与博通三家企业占据了中国大部分市场份额。

过去几年国内DPU市场可谓是疯狂发展,创业企业快速推出产品,以期抢占市场,同时资本也在密集进入,包括芯启源、中科驭数、云豹智能、星云智联、大禹智芯、云脉芯联、边缘智芯、益思芯科技、青芯半导体等。

芯启源在DPU/智能网卡领域,可提供从芯片、板卡到驱动软件和全套云网的全栈解决方案,产品Agilio可支持200万个安全规则,并提供高达100Gb/s、28Mpps的吞吐量,同时仅消耗十分之一的计算资源就可提供可扩展的通用计算网络功能。公司已获得来自国内头部运营商的多批智能网卡订单,同时与各大服务器厂商、OTT、BAT等客户已进行深入技术对接。

芯启源在2021年就完成了Pre-A2/A3/A4多轮融资,每轮融资金额都是数亿元,上个月再获超亿元战略投资由国家集成电路产业基金旗下子基金上海超越摩尔领投,老股东允泰资本继续坚定跟投,资金将用于下一代DPU产品研发和目前产品商业化推广。

中科驭数自主研发了KPU芯片架构,打造了业界首颗拥有网络数据库一体化加速功能的DPU芯片和智能网卡系列产品和解决方案。目前在第一代产品基础上,该公司正在研发的第二代DPU芯片K2已经完成设计和验证工作,预计将于2022年第一季度投产流片。

中科驭数在2021年不足半年时间相继完成两轮融资,目前该公司已联合交易所、多家头部券商机构等合作伙伴进入金融计算行业,持续融资后,还将面向数据中心、电信运营商等客户类型,不断推进DPU方案的应用落地,并与信创生态伙伴合作,在产品适配后进一步拓宽客户渠道,逐渐帮助更多信创产业客户、政府客户等协助解决算力难题。

云豹智能成立于2020年,作为软件定义DPU行业半导体公司,该公司已成功开发全功能云霄DPU网卡解决方案,全面支持裸金属、虚拟机和容器云服务一体化,以及高性能2x25G网络,提供弹性存储、弹性网络、虚拟化管理和安全加速等一站式解决方案。

今年年初,云豹智能与燧原科技达成战略合作,依托双方各自在DPU和AI计算领域的软硬件优势,联合开发大规模高性能AI算力平台,为云端AI计算提供更高效的解决方案。

在融资方面,云豹智能于2021年4月完成天使轮融资,投资方包括腾讯投资、红杉资本、耀途资本、中芯聚源、华业天成、正心谷资本等知名投资机构的投资。

星云智联成立于2021年3月22日,专注于数据中心基础互联通信架构和DPU芯片研发,成立仅一年时间,该公司便已经完成多轮融资,2021年4月、7月、8月分别完成天使轮、Pre-A轮、A轮融资,投资方包括高瓴创投、华登国际等,其中A轮由美团独家投资,另外今年2月,该公司又完成新一轮战略融资,由百度投资。

从上述几家公司的情况可以看到,过去一两年中,国内的DPU公司在推出产品,推进产品应用落地,同时资本也是相当热衷于对DPU创业企业的投资,还可以看到在投资这些企业的机构中,还包括美团、百度、腾讯等互联网企业。

兵家必争之地前途未卜

在数据中心领域,DPU正推动着计算基础架构的变革,以提供更高效的数据处理和计算解决方案。DPU行业市场规模正呈现稳步增长的态势,据统计,2020年全球DPU行业市场规模为29.5亿美元,预计2025年将达到135.7亿美元。

从中国行业市场规模来看,在未来两年内将爆发式增长。有数据统计,2020年中国DPU行业市场规模为0.88亿美元,预计到2025年将达到37.41亿美元。

从目前的形势来看,DPU可谓是兵家必争之地,这也就是为什么除了国际传统芯片巨头正在积极布局之外,近年来涌现出数十家DPU创业企业的原因,同个大投资机构对于DPU赛道也是相当看好,此外作为使用方的互联网企业也在通过投资入股的方式参与进来。

然而也存在一个问题,阿里巴巴集团研究员、阿里云弹性计算产品线负责人张献涛此前对媒体表示,DPU芯片不适合走通用路线,因为对云厂商来说,DPU是软件定义的计算架构,是一个软硬件技术栈结合密切的工作,因此DPU适合以自研为主。他认为,做通用DPU的公司很难满足云厂商的需求,未来的最好的归宿可能是被收购。

不过如果云厂商真的需要自研DPU才更好,那么又会存在一个很大的问题,就是自研芯片本身就是一个耗时耗力的事情,在过去没有足够芯片人才和经验积累的情况下,要想自研芯片难度将会相当大,可能几年以后自研DPU芯片不理想,还影响对计算需求的满足。

对于这些需求厂商来说收购或许是一条出路,不过建立更深度的合作也会是一个方式,这或许就是百度、美团这些企业都投资DPU创业企业的原因之一,不过对于DPU企业要将产品方案落地,需要跟客户建立深层次,针对每家客户做定制化方案,难以做到通用,那么人力精力的投入会不会影响到企业的盈利,这样的方式如何能持续发展可能也是需要考虑的问题。

来源:电子发烧友观察,国际电子商情,中国科学报

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:数据包
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...