腾讯宣布推出三款本土系统级芯片之后,未来的芯片之路怎么走?

芯闻速递 2021-11-11

腾讯云计算芯片

1808 字丨阅读本文需 5 分钟

在宣布推出 三款用于数据中心应用的本土系统级芯片 (SoC) 之后,中国云巨头腾讯推出了星海智慧木系列 GA01,这是一款基于 AMD 图形处理单元的定制显卡。公告中有趣的细节之一是腾讯可以为主板设计自己的驱动程序,这表明他们与 AMD 的合作相当密切。

现代图形处理器可用于各种应用,包括游戏和专业应用的渲染、媒体编码/解码和高性能计算。据CSDN.net报道,腾讯在其云数据中心运行各种工作负载,因此它需要一个可用于多种用途的多功能 GPU,因此它转向 AMD 寻求半定制解决方案 。

腾讯的 GA01 GPU 基于 AMD 的 Radeon Pro V620 显卡,配备 32GB GDDR6 显存(据 TechnoPixel 称),但它采用了液冷系统(LCS)并配备了实时故障监控和预警功能,使其更加可靠. 更重要的是,GPU是在驱动程序级别高度定制的,以优化其渲染、编码/解码和图像处理。腾讯声称该主板比主流显卡快 120%,但该公司没有详细说明。

AMD 的 Radeon Pro V620 基于 Navi 21 GPU,该 GPU 依赖于该公司最新的架构 RDNA 2。GPU 支持 SR-IOV 虚拟化,可被多个远程用户同时使用(用于云游戏、DaaS、WaaS 和 ML)。此外,它还支持高级安全功能,以保护用户数据免受其他用户的侵害。

通常情况下,AMD 的 Radeon Pro 带有自己的驱动程序,但与腾讯合作,它让中国公司设计自己的软件,这是一个相当不寻常的举动,因为 AMD 和 Nvidia 都倾向于保护其最新 GPU 架构的特性免受竞争对手的侵害。同时,腾讯计划在专门设计的服务器中使用该卡,以提高可用性和可靠性,因此可能需要为该卡开发特殊驱动程序,以最大限度地提高与机器及其软件堆栈的兼容性。

值得注意的是,腾讯是去年为数不多的几家采用英特尔基于Xe-LP的SG1服务器GPU卡进行远程渲染的公司之一。这些系统主要用于远程渲染腾讯的一些安卓游戏,以确保入门级智能手机的流畅帧率。与此同时,腾讯似乎更喜欢将 AMD GPU 用于其他云数据中心工作负载,这可能是出于性能和可用性方面的考虑:AMD 的 GPU 已经出现,而英特尔的 Xe HPG GPU 则需要几个月的时间。

AMD 销售相当多的定制硬件。该公司为微软和索尼游戏机提供定制的片上系统 (SoC)。此外,AMD 拥有许多仅适用于 Apple 的半定制 GPU。因此,为腾讯打造半定制产品对公司来说不是什么大事,但在腾讯的云数据中心击败英特尔对 AMD 来说是一件大事。

AMD 在其用于数据中心的 EPYC CPU 方面取得了相当大的成功,但对于针对同一市场的 GPU,该公司并没有特别多的成果,因此 Nvidia 目前统治着这个市场。与腾讯合作,AMD 在设计方面取得了相对较大的胜利,尽管提供的是半定制产品。

腾讯首次正式披露三款自研芯片研发进展

11月3日,在位于武汉的腾讯数字生态大会上,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生宣布,腾讯已在三款自研芯片上取得进展,分别是AI推理芯片“紫霄”、视频转码芯片“沧海”和智能网卡芯片“玄灵”。此外,腾讯还正式宣布云原生操作系统“遨驰”。

据腾讯方面介绍,紫霄AI推理芯片最显著的特点是结合图片和视频处理、自然语言处理、搜索推荐等场景,通过采用2.5D封装技术合封HBM2e内存与AI核心,以及在芯片内部增加计算机视觉CV加速 器和视频编解码加速 器等创新措施,对芯片架构进行了优化,打破了制约芯片算力发挥的瓶颈。

沧海视频转码芯片在算法上完整实现了高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合了腾讯云软件编码器码率控制等方面的领先技术;同时,沧海通过灵活的多核扩展架构、高性能编码流水线、层级化Memory布局等技术,也能够有效满足业务高吞吐、低时延和实时的要求。

玄灵智能网卡芯片定位于云主机的性能加速,结合CVM/BM/容器等场景优化芯片架构,将原来运行在主 CPU上的虚拟化、网络/存储IO等功能下移到芯片,实现了主CPU 的零占用。

腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏在演讲中进一步介绍,腾讯AI推理芯片紫霄,性能相比业界提升100%,目前已经流片成功并顺利点亮;支持硬件编码器在世界编码大赛中获奖的沧海视频转码芯片,压缩率相比业界提升30%以上;同时,腾讯研发的智能网卡芯片玄灵相比起业界产品性能提升了4倍。

“芯片是硬件中最核心的部分,也是产业互联网最核心的基础设施。”汤道生表示,腾讯会一直进行积极探索,并做长期投入。除此之外,腾讯也会一直寻求通过生态共建的模式,与国内外芯片企业保持深度战略合作,把芯片的定制化能力和软件的定制化能力结合起来,获得最优的性能和最佳的性价比,确保给客户提供更多元化和更适配的选择。

此前,腾讯云已经与多家芯片企业合作推出了星星海服务器。星星海结合了云计算的丰富场景特性,支持全平台、多场景。不久前,腾讯云推出国内首个规模应用100G超大网络的云服务器产品系列,其底层硬件也由星星海服务器支撑。过去一年,星星海规模增长高达400倍。

在芯片领域,腾讯此前已经有不少布局。此前,腾讯曾投资云端AI芯片企业燧原科技。目前,燧原科技发布第二代AI芯片,并预计今年底量产。2020年,腾讯还成立了专注芯片研发的蓬莱实验室,旨在实现芯片端到端设计、验证全覆盖。

此外,对于整体战略,腾讯汤道生在会上表示,“数实融合”正在从“选答题”,变成每个行业都要面对的“必答题”,腾讯未来在用户、技术、安全和生态四个方面发力。

文章来源: 半导体行业观察, 金版权救火队

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:芯闻速递
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...