重磅资料下载 | 张量分块技术实现超高算力

探索科技TechSugar 2021-06-21

张量

642 字丨阅读本文需 2 分钟

随着汽车向智能化的发展不断深入,车载应用对算力的要求在不断提高。传统的数字驾舱和人机交互功能对算力要求较低,但在高级驾驶辅助系统(ADAS)中,对算力的需求明显增加,比如:车道偏离检测可能需要10 GFLOPS(每秒10亿次浮点运算)算力,行人预测可能需要500GFLOPS。

自动驾驶功能的实现,更离不开高算力,L2级别自动驾驶需要10 TOPS(每秒万亿次整数运算)算力,L3至L4级别自动驾驶则需要50至100 TOPS算力,实现L5级别全自动驾驶需要500 TOPS以上的算力。

毫无疑问,ADAS 和自动驾驶计算需求呈上升趋势,有强烈迹象表明,这些需求将在未来 3-5 年内以一定数量级增长。

为满足车载智能对算力的极致要求,全球著名IP厂商Imagination Technologies(以下简称Imagination)在多核处理方面有多项创新性技术,首当其冲的便是Tensor Tiling张量分块技术,Imagination称之为ITT。

ITT的概念,是在空间维度上对每个张量进行拆分,利用片上存储加深算子融合,从而减少神经网络执行过程中通过外部存储交换的中间特征图,进而降低对内存带宽的需求。根据Imagination的统计,最大可减少内存带宽需求90%。这在计算大型网络时优势十分明显。

对于试图应对汽车行业日益增长的挑战的系统设计师来说,在硬件加速推理系统中减少外部 DDR 系统带宽是首要需求。DDR 带宽的减少不仅等同于功耗的降低,还能降低在系统上运行网络的处理延迟。

现在Imagination重磅推出了专为ADAS与自动驾驶设计的白皮书《张量分块技术实现超高算力》。本白皮书重点介绍了 IMG 4系列神经网络加速器(NNA)中的Imagination张量分块技术(IIT)如何被专门设计来帮助SoC设计者实现这些目标。

为了尽可能地提高效率,深度神经网络加速器必须尽可能减少对外部存储器的带宽从而提高图形执行性能。大多数情况下,提供给深度神经网络加速器的可用DDR带宽存在理论上的最大值——实际受限于一个更低可用值。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:探索科技TechSugar
0

参与评论

登录后参与讨论 0/1000