橙色云资讯 - 工业互联网行业信息门户

AMD叫板英伟达为何吃力不讨好？国产GPU不能只看算力

电子大世界 2023-07-04

3062 字丨阅读本文需 8 分钟

近日，芯片巨头AMD推出全新AI GPU MI300系列芯片，与英伟达在AI 算力市场展开竞争。

AMD首席执行官苏姿丰介绍称，MI300X提供的高带宽内存（HBM）密度是英伟达H100的2.4倍，HBM带宽是竞品的1.6倍。华尔街分析师也普遍认为，AMD的这款芯片将对目前掌握AI芯片市场逾八成份额的英伟达构成有力挑战，这款MI300X加速器，有望替代英伟达的同类产品。

然而，市场对本次新品的反响似乎并不热烈。截至隔夜收盘，AMD股价下跌超3.6%，被挑战的英伟达不跌反涨，股价单日大涨3.90%。

蹿红的英伟达

2022年ChatGPT横空出世，把AI 行业的发展推向了一个新的高潮，生成式 AI 需要基于海量的数据进行推理训练，高算力的 GPU 加速卡自然也成了市场的抢手货。乘着AI的东风，英伟达坐上了“算力霸主”的宝座。

据悉，微软用几亿美元，耗费上万张英伟达A100芯片打造超算平台，只为给ChatGPT和新版必应提供更好的算力。不仅如此，微软还在Azure的60多个数据中心部署了几十万张GPU，用于ChatGPT的推理。特斯拉CEO马斯克也购买了约1万个GPU，用于公司的两个数据中心之一。除此之外，像亚马逊、阿里、百度等众多科技公司都在竞相部署AI芯片。

供需的极度不平衡让英伟达的GPU一芯难求，开启涨价。据市场消息人士透露，英伟达的A100和H100 AI GPU订单还在不断增加，A800和H800的售价已上涨40%，新订单交期可能要延长到12月份。

在炙手可热的AI浪潮下，英伟达赚得盆满钵满。英伟达表示，其截至 7 月的本季度销售额预计将达 110 亿美元，较华尔街之前的估计高出 50%以上。不过，作为AI的基础设施，算力芯片环节的“一家独大”显然不是有利于行业长远发展的生态，市场迫切需要引入新的竞争者，AMD的出现或许有望“分担”AI市场的压力。

AMD叫板英伟达

MI300是AMD发布的第一款数据中心、高性能计算机群（HPC）级的APU，采用与英伟达Grace Hopper相同的CPU+GPU架构，但是硬件参数更高。

MI300在CPU部分集成了24个ZEN4内核，GPU部分集成了6块使用CDNA3架构的芯片，拥有1460亿个晶体管，比英特尔GPU Ponte Vecchio多460亿个晶体管，比英伟达H100多660亿个晶体管，而且MI300的统一内存可降低不同内存间来回复制、同步和转换数据所导致的编程复杂性。

封装工艺方面，MI300使用最近爆火的3D Chiplet封装技术，而GH200则使用CoWoS（2.5D）封装，3D对比2.5D的优势在于性能更高、延迟和功耗更低。

从硬件参数上来看，AMD MI300已经具备和英伟达叫板的能力，但显卡领域完善软件生态比堆硬件参数更难，AMD的软件生态能否贴合人工智能行业的市场需求，是MI300能否抢走英伟达既有市场的重要影响因素。

英伟达垄断人工智能训练芯片市场的主要原因是其自研的CUDA生态。所以AMD MI300想要替代英伟达，首先需要兼容英伟达的CUDA生态，AMD为此推出ROCm生态圈，并实现通过HIP完全兼容CUDA。

作为AMD的GPU软件开发框架，HIP对应的是CUDA API，其提供的HIPify-perl和HIPify-clang工具，可用于CUDA到HIP的代码转换，转码后可在AMD GPU上编译运行，基于HIP开发的应用也可用于AMD和英伟达的GPU上。

在此背景下，同一个数据中心内，理论上可以同时使用AMD和英伟达的GPU，但不同公司的GPU产品对数据精度的标准和计算方法及顺序配置不同，混合使用GPU难免会导致计算精度缺失等问题，直接影响模型训练效果。

而且从技术层面来看，兼容意味着被动、落后，因为CUDA每一次升级，ROCm都需要做出对应升级，技术团队无法将所有精力用于ROCm生态圈的迭代上，应用场景和使用体验都会落后于英伟达。

回顾二者发展历程，英伟达2007年发布CUDA，AMD2016年才发布ROCm，前者自问世起就支持Linux、Windows多平台，后者则长期只能支持Linux系统，且不支持部分Linux的更新，并于今年4月才登录Windows平台。

同样是今年4月，AMD刚解决消费级产品与ROCm的适配，此前仅支持AMD高端GPU，限制了市场份额的提升。最后就是由于切入时间更晚，AMD开发者数量远低于英伟达的400万。

对比CUDA和ROCm的开发活跃度，在全球最大的开发者社区之一StackOverflow中，“CUDA”的标签下有超过14000个问题讨论，而ROCm在“amd-rocm”的标签下只有不到100个问题讨论。在Github上，贡献CUDA软件包仓库的开发者超过32600位，而ROCm只有不到600个。

为改变这种被动局面，AMD也在积极丰富其软件生态。虽然目前仅有部分SKU支持Windows系统，但主流Radeon显卡用户可以开始试用过去仅专业显卡才能使用的AMD ROCm(5.6.0Alpha)。

今年1季度，AMD宣布ROCm系统融入PyTorch2.0框架，目前TensorFlow和Caffe深度学习框架也已加入第五代ROCm。

故此，从软件生态方面来看，现有的AMD MI300还不足以威胁英伟达的市场份额，想撼动英伟达在人工智能行业的地位，AMD还需时间。

国产GPU迎来发展黄金期

庞大的市场需求和欧美的芯片封锁，迫使得国产GPU被推到了聚光灯下，迎来了绝佳的发展期。有业内人士称：“国产GPU在信创方面已经实现逐步替代，AI&数据中心、智能汽车、游戏等应用领域的国产GPU需求量也有极大的提升，国产GPU迎来发展黄金期，我们看好国产GPU公司的发展与投资机遇。”

近日，国内多个GPU厂商，从老牌的景嘉微，到初创的沐曦，都顺应市场需求，相继推出了各自在GPU领域的最新拳头产品。

中天恒星：６月１５日在北京发布国产自主GPU架构“天狼星”，拥有完全自主知识产权，自研核心架构确保产品迭代自主可控，同时拥有完备的交付能力，并已实现量产。

景嘉微：成功研发JM54 系列、JM72 系列、JM92 系列三代 GPU 产品。应用于台式机、笔记本、一体机、服务器、工控机、自助终端等设备。

天数智芯：６月１０日发布天垓100加速卡的算力集群，已经具备支持百亿级参数大模型训练的能力。是国内第一款全自研、GPU 架构下的云端训练芯片，实现了我国通用GPU从0到1的重大突破。

芯动科技：芯动发布的“风华 2 号”是一款集超低功耗、强渲染、4K 高清三屏显示、4K 视频解码及智能 AI 计算于一体的桌面和笔记本 GPU，实现了多个自研技术的创新突破。

摩尔线程：基于MUSA架构打造了两颗全功能GPU芯片“苏堤”和“春晓”；面向信创市场推出了桌面级显卡MTT S10、MTT S30和MTT S50。

沐曦：6 月 1４日宣布曦云系列的最新产品MXC500成功点亮，产品直接对标英伟达 A100，采用通用 GPU 架构，兼容 CUDA。

尽管国产GPU的推出步伐不断加快，其中也不乏一些对标国际高端GPU的产品，但不得不承认，国产GPU要走向真正成熟可靠，实现完全国产替代还有很长的距离。

国产GPU整个商业生态尚未成熟

在芯片“断供”之前，国内购买海外高端GPU芯片之路畅通，很少有客户在重大项目采购时会考虑国产GPU，都普遍倾向海外最先进、最稳定的产品，以保证项目顺利完成。究其原因有二，一是毕竟国产GPU的发展才刚刚起步，在性能和稳定性方面尚未取得长时间，多项目的验证，不少国产GPU在实际应用中出现了工作负载低，芯片性能不稳定，兼容性差的情况。二是软件生态不够完善，如果一个芯片没有与之配套的软件生态，则很难真正形成大面积的应用。

在当下GPU应用最火的AI大模型训练中，腾讯云新一代HCC（High-Performance Computing Cluster）高性能计算集群使用的是英伟达最新代次H800 GPU；阿里曾在 2018-2019 年采购了上万块英伟达的V100和T4 GPU用于近年来的云计算和大模型训练，其他字节、百度、美团、B站等都清一色采购英伟达的A100、H100 GPU或是去年禁令后英伟达专门推出的减配版 A800、H800 GPU。

这使得国产GPU在国内鲜有大企业应用成功的案例，大部分还仅仅围绕在PC、图形渲染领域，或是应用在专门的军事、政府等部门。商业市场的大门，只是开了一条缝。

另外，国产GPU厂商的硬件架构，软件API接口不尽相同，客户基本只能多选一，兼容和替换都不够灵活，比较难实现技术生态的统一。

只靠算力，无法做英伟达的PlanB

英伟达的强不只是体现在硬件产品上，在软件平台中，英伟达也有自己的护城河。

CUDA就是英伟达推出的基于GPU的并行计算平台和编程模型，可以用来加速大规模数据并行计算，使得GPU可以用于更加广泛的科学计算和工程计算等领域。CUDA的良好生态系统吸引了众多学术机构和高性能计算中心的关注和使用，也为英伟达提供了强有力的市场竞争优势。现在AMD也在做同样的事情，只是英伟达已经占了先发优势，AMD搭建起来可能会更为艰难。

CUDA的重要性不言而喻，但是提供CUDA兼容层，需要厂商具备足够的研发实力，上文提到的与CUDA兼容的有沐曦、海光、壁仞、天数智芯等公司，因此是否兼容CUDA也成为衡量AI芯片公司的标的之一。

至于是否一定要兼容CUDA，业界有着不同见解。专家称，在小模型上CUDA仍然很重要，但在大模型上它的地位越来越轻了。如果未来中国市场以小模型为主，那CUDA还是有很大的影响力，而如果是以大模型为主，对于CUDA的依赖就越来越小了。

总而言之，重视软件配适开发至关重要。

对于建立国产IT系统的行动建议包括：设置合理国产系统及芯片性能要求和验证目的，从非关键应用开始尝试导入部分国产芯片；加强软件配适开发，确保软件对不同系统的兼容性、稳定性和运营性能；建立加强对国内基础IT软硬件厂商的投资，确保厂商对产品开发计划的影响力；优先考虑国内供应链和成熟平台，积极采用半导体创新技术。

文章来源：金融界，信创专研社，半导体产业纵横

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：电子大世界

0 0

参与评论

登录后参与讨论 0/1000

下一篇 NVIDIA RTX 3050确认采用GA106核心：RTX 3060同款

今天，有爆料称，NVIDIA即将上市的RTX 3050...

2022-01-10

AMD叫板英伟达为何吃力不讨好？国产GPU不能只看算力

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

AMD叫板英伟达为何吃力不讨好？国产GPU不能只看算力

参与评论

为你推荐

天玑8000加持！Redmi Note 12系列入网：首次搭载旗舰级芯片

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

半年融资827亿，1.2万字看懂新能源汽车产业图谱

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(3月第三周) | 工信部将开展汽车软件在线升级管理试点；湖南发布智能网联汽车产业“十四五”规划

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

中国智慧城市“药方”如何化解海外城市治理症结？

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

RISC-V只适用于嵌入式芯片？以IoT为立足点，RISC-V正在“征服”整个半导体世界

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

国产屏厂TCL华星要打入苹果供应链：为iPad、MacBook出货LCD

国产CIS开始向2亿像素时代迈进，巨头垄断格局或将被打破

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

Nreal国内首发AR眼镜，消费级AR眼镜潮即将爆发，VR/AR产业链开启“卡位战”

研究人员研发仿生二合一纳米电子传感器，可同时测量细胞电气和机械反应

国家电投与阿里巴巴宣布战略合作，数字化转型这条路上，央企各显神通

新材料七国的竞争版图：热门行业分布大集锦，未来10年的市场机会或许在这

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

SiC迎来“奇点时刻”，盘点近期产能、需求量、交易等行业大事件

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

从工业机器人产业链看智能制造机会

最新总结：冬奥会的100个创业机会

后疫情时代，OTA如何回血

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总