人工智能变人工智障?算力是基础,AI芯片产业之争异常激烈

芯闻速递 2023-04-07
2733 字丨阅读本文需 8 分钟

2022年11月30日,微软旗下的OpenAI发布ChatGPT,5天内涌入100W用户。他拥有持续的上下文对话能力,同时支持文章写作、诗词生成、代码生成等能力,这被认为是“通用型人工智能”的开端。

2023年3月15日,OpenAI研发多模态预训练大模型——GPT-4,作为ChatGPT的动力来源,使用微软Azure训练模型,更聪明强大、更准确安全、在许多专业测试中超过人脑水平。

2023年3月16日,百度发布了大语言模型、生成式AI产品——文心一言,被称为中国版ChatGPT。从现场展示来看,它回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

2023年3月20日,在GTC开发者大会上发布,英伟达推出了新的Hoppper CPU——配有双 GPU NVLink 的 H100 NVL隆重登场,H100 NVL是专门针对算力需求巨大的 ChatGPT 而设计的显卡,拥有夸张的 188GB HBM3 内存(每张卡 94GB),为是十倍级ChatGPT提供了“核弹级”的运算能力!

过去数月,全球科技巨头大秀肌肉,各种AI生成产品接连登场,当前正在掀起新一轮人工智能(AI)风暴。AI正在以天为周期进化,给人前所未有的压迫感,对此比尔盖茨和英伟达老板黄仁勋的表态是最具代表性的。

比尔盖茨表示:这就像我当年第一次见到图形界面操作系统(MacOS)。

黄仁勋在发布会上三次强调:我们正在经历又一个IPhone时刻。

人工智能三大核心要素:算力、算法、数据!少了AI算力芯片,人工智能就是人工智障。ChatGPT实现从人工智障到弱人工智能的进步,从应答式人工交互到原创内容输出,主要是得益于算法的突破!算力是人工智能的基石,随着参数量的膨胀,未来人工智能发展对算力需求会呈指数级的增长,在模型训练成本中,算力成本占比高达40%-70%。

从去年10月7日开始,美国根据新的芯片法案,开始限制单精度浮点算力19.5T FLOPS以上,或双精度浮点算力 9.7T FLOPS以上,或存取速度600GB/S以上的GPU对华出口以及相关人员设备对华服务,也就是限制英伟达A100或者以上级别的通用GPU对华出口,这一举措显然意在限制中国AI大模型的训练算力。

台积电垄断了AI芯片代工,英伟达垄断了高端通用GPU设计和AI开发框架(CUDA),根据通信院数据,2021年Q4英伟达占据了全球95.7%的GPU算力芯片市场份额。这导致整个产业只有后端的大模型和终端应用对中国企业部分开放,并且随时可能被掐断。

AI革命背后是芯片产业之争。

半导体器件物理专家、中国科学院院士、国科大的校长李树深院士在和他的学生共同发表的文章《加强半导体基础能力建设,点亮半导体自立自强发展的“灯塔”》里表示:

“虽然半导体基础研究在过去几年受到了很大重视,但包括学科设置、协同创新、基础设施、研发投入、评价机制、研究生名额等半导体基础能力并没有得到根本性改善,难以支撑半导体科技高水平自立自强。”

“半导体是当前中美科技战的“主战场”。全球年产值6000亿美元的半导体产品涵盖了上千款芯片和近10万种分立器件,支撑了下游年产值几万亿美元的各类电子产品,以及年产值几十万亿美元的数字经济。据统计,1美元半导体产品拉动了全球100美元的GDP。”

近两年,以AI为引领的新一轮科技革命正在迅猛发展,而AI的关键就是依托大数据训练。AI的算力需求主要是以大规模的数据中心为基础,要完成AI的发展,没有超强的通用计算GPU芯片,根本无法想象。

大的方面,从航天卫星、俄乌冲 突,到城市治理,智慧工业等等全离不开芯片算力的支持;小的方面,从你的快递和外卖的高效分发,再到你医疗健康治愈各种疾病,都需要AI算力的支持。

而随着未来人口越来越少,AI自动驾驶汽车,AI自动机器人,将会大规模的替代人类的劳动,这里面也全是需要芯片来支持。通信方面,甭管是5G还是6G,没有芯片根本无从谈起,而没有高速的移动通信技术,下一代的互联网应用就无从谈起。办公娱 乐方面,你别管是元宇宙远程会议,还是AR、VR沉浸式游戏,没有芯片也不行!甚至设计芯片本身也会加入AI的支持,科技的发展已经快走到了芯片自己制造芯片的无敌正循环了……

如此下去,就是强者愈强,弱者越弱。未来,绝大部分人能做到的事儿,都将被算力解决!而芯片是一切的基础。

如果我们拿不下高端芯片,那么我们的产业升级就全方位会受阻。然而芯片产业又是世界上最复杂,最卷的产业,正如李树深院士所写:

“半导体产业链长且广:上游包括EDA软件/IP模块、半导体设备和材料,中游是芯片设计、制造、封装和测试,下游是各类电子产品,涉及大量材料、设备和配件、软件和IP模块。王阳元院士指出,半导体产业链上游的任何一种材料、一种设备甚至一个配件都可能成为制约竞争者的手段。”

芯片产业链是极为繁琐和漫长的。主要包括 6 个部分:

(1)设计软件,芯片设计软件是芯片设计的关键工具,目前主要依靠 EDA软件来完成;

(2)指令集体系,是芯片的底层架构信息,没有高效的指令集,芯片没法运行操作系统和软件;

(3)芯片设计,这是用硬件实现指令集架构功能的关键部分;

(4)原材料和设备,原材料包括硅片,光刻胶,清洗液等等,设备即生产芯片的各种设备,包括光刻机,蚀刻设备等等。

(5)晶圆代工,晶圆代工厂是芯片从图纸到产品的生产车间,它们决定了芯片采用的纳米工艺等性能指标;

(6)封装测试,是芯片进入销售前的最后一个环节,主要目的是保证产品的品质。

经常被提到的光刻机是第5个环节晶圆代工当中要用到的上百种设备当中的一种,它是整个芯片产业当中技术含量最高的环节之一,但这不代表别的环节技术含量不高,就比如原材料里面的硅片。整个芯片制造过程中还有各种气体、各种液体、各种固体化合物、金属靶材、光刻胶、光掩模等等,在如此多的设备,耗材,软件,工艺当中,只要有一个环节不合格,芯片就造不出来。因此,芯片是世界上 门槛最高的产业,是最卷的产业。

AI算力芯片主要包括GPU、FPGA、以及以VPU、TPU为代表的的ASIC芯片,其中以GPU用量最大。相较于传统图形GPU,通用型算力GPU在芯片构架上缩减了图形图像显示、渲染功能,具有更有的计算机能效比,被广泛应用于人工智能模型训练和推理领域。根据IDC数据,预计到2025年GPU仍将占据AI芯片8成市场份额。

根据在网络中的位置、AI芯片可以分为云端AI芯片、边缘和终端AI芯片:云端主要部高算力的AI训练芯片和推理芯片,承担智能数据分析、模型训练任务和对传输带宽要求较高的推理任务;边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据采集、环境感知、人机交互及部分推理决策控制任务。

GPU的生态包括底层硬件、指令集架构、编译器、API、基础库、顶层算法框架和模型等,英伟达与2006年发布的CUDA平台是当前应用最为广泛的AI开发生态系统。通用GPU与CUDA组成的软硬件底座构成了英伟达引领AI计算的根基,当前全球主流深度学习框架均使用CUDA平台。

面对汹涌的AI浪潮,国产AI算力芯片正燃起星星之火。目前已经涌现出了如寒武纪、海光信息和景嘉微优质AI算力芯片上市公司,非上市AI算力芯片公司如沐曦、天数智芯、壁仞科技等在产品端有持续突破。尽管其中部分产品逼近或超越了美国头部厂商的性能。但是我们的底层和产品大量采用了美国技术、IP和人员经验,并且依赖台积电的先进制程代工,更存在IP授权不可控的风险。

高端GPU的突发断供,引发市场对于国产GPU自主可控的关注。中国AI芯片企业拥抱全球化的梦想被迫毁后,主流舆论观点认为,中国要想实现GPU的自主可控,必须走全盘去美化的道路——这不单单关乎芯片安全,还涉及到中国AI产业的整体安全。

2023年2月27日,中共中央、国务院印发了《数字中国建设整体布局规划》中提到,数字中国基础设施的建设有望拉动以数据中心、超算中心、智能计算中心为代表的算力基础设施建设,从而带动服务器与 AI 算力芯片的需求快速增长。

要想在大模型上反超,中国还有很大的差距。要想在AI算力芯片突围,中国GPU企业必须在底座、专利、核心技术、人才建设和产业联盟下大功夫,下深功夫。

文章来源: 酷玩实验室Coollabs,未来半导体,雪球,互联网.乱侃秀

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:芯闻速递
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...