国内智驾掀起BEV+Transformer风潮,这些产业的机会来了!

智能未来 2023-11-30
3175 字丨阅读本文需 8 分钟

近日,在2023年广州车展期间,不少车企及智能驾驶厂商都发布了BEV+Transformer方案。其中,极越01已经实现了“BEV+Transformer”的“纯视觉”方案的量产,成为国内唯一量产“纯视觉”智驾方案的厂商。

预计明年1月,极越01将在BEV+Transformer的基础上通过OTA升级更新OCC占用网络技术,极大提升异形障碍物识别能力和场景泛化能力,并实现BEV+Transformer+OCC的“纯视觉”高阶智驾完整技术体系。

除此之外,蔚来、小鹏、理想、百度、华为等主流主机厂、自动驾驶方案商在此前也推出了基于BEV+Transformer的智驾方案。

什么是BEV?

BEV全称是Bird's Eye View(鸟瞰视角),实现方法是把原本摄像头2D的视角通过算法校正和改变,形成基于上帝视角的俯视图。

从本质上来说,BEV算法就是 将传感器输入转换到统一的俯视角度下进行处理。

这里的传感器不只有摄像头,还有4D毫米波雷达、激光雷达等,算法把它们的信号融合,最终形成一个上帝视角。在计算机里面处理这部分信息时,也会基于上帝视角去进行规划决策和控制。

BEV为什么兴起?

首先是城市NOA的落地。

高速场景下L2++场景相对单一,感知任务不重,但控制方面很难,因为高速公路一般速度在80-120公里/小时,所以在高速场景下,如何把规划决策和控制做好,保证它不会在边界状态下失稳就显得尤为重要。

但是在城市道路上,它的 难点就在于感知,因为有非常多的交通参与者或者非常复杂的路况。

目前主要的城市NOA玩家:

原来做L4的科技公司:从Robotaxi上迁移感知,调整传感器;

传统Tier1或者OEM:把感知做好,处理好复杂场景。

在实现L2++功能时,大多希望360度范围内能够做到精确感知,需要做到传感器融合,难度加大,复杂度增强,因此BEV愈发重要。

安信证券报告显示,蔚小理等车厂通过OTA升级释放城市NGP或者NOA功能的时间节点都在2022年到2023年之间。

所以这就是为什么国内高速NOA对BEV的使用并不多,但随着2021年特斯拉提出BEV算法,以及与transformer结合后,国内也开始在城市道路上去使用BEV算法解决复杂和不确定的城市道路场景。

BEV+Transformer方案能够很好地融合多传感器的特征,将多传感器收集到的图像信息转换成3D视角,从而提高感知和预测的准确率,进而成为了高阶智能驾驶的主流方案。

毫无疑问,伴随着BEV+Transformer的大规模应用,从芯片到传感器、软件算法、数据、模型部署等都将发生改变,整个智能驾驶供应链体系正在发生新一轮的重构。

高阶自动驾驶进入2.0时代

基于BEV+Transformer方案,高阶智能驾驶正在进入2.0时代。

一方面,伴随着智能驾驶感知系统进入新一轮的变革周期,“重感知、轻地图”成为了行业主流趋势。根据《高工智能汽车研究院》监测数据显示,目前市面上的智能驾驶系统,多摄像头依然是感知组合的必选项,而4D毫米波雷达、激光雷达则以辅助感知和冗余决策为主。

在这样的背景之下,车载摄像头作为智能驾驶感知系统的主力传感器,正在进入了全新的爆发式增长周期。根据《高工智能汽车研究院》数据显示,2023年1-6月中国市场(不含进出口)乘用车前装标配前向ADAS摄像头589.23万颗,同比增长29.29%;侧视ADAS摄像头225.64万颗,同比增长107.13%;舱内摄像头标配搭载量达到225.50万颗,同比增长82.40%。

与此同时,车用传感器也进入了快速迭代演进与技术升级的发展阶段,高性能、低成本、小体积成为了新一代传感器产品的主流发展趋势。以车载摄像头为例,其性能要求正在不断被提升,比如环视/侧视摄像头,传统的360环视更多只是解决人机交互的问题,图像的现实和拼接仅仅是辅助驾驶员的感知和决策,但BEV却对摄像头的分辨率与暗光成像等性能提出了更高的要求。

“BEV+Transformer对于传感器的测量精度、鲁棒性、性价比和数量等都提出了更高的要求。”元橡科技相关负责人表示,双目立体视觉系统内专用深度引擎,直接输出图像+深度信息,在同等目距、像素条件下,具备测距更远、精度更高等独特的竞争优势。

据介绍,元橡科技的双目立体视觉系统通过双目系统识别道路类型,扫描前方路面信息得到高精度路面3D点云,不依赖激光和高精地图,是有效应对城市、高速等复杂NOA需求的高性价比解决方案。同时,双目立体视觉系统还可以与主动悬架系统结合,从而实现 “魔毯”垂向控制技术。

目前,元橡科技的“主动悬架路面预瞄系统”已经获得国内多家一线乘用车企前装定点,成为国内首家基于双目立体视觉的主动悬架路面预瞄系统的前装量产供应商。此外,元橡科技针对多种场景定制立体视觉解决方案来解决行业痛点,满足各类需求,也降低传感器使用门槛,从硬件、软件、平台、应用多层级与合作伙伴共建立体视觉新生态。

“仅提供硬件产品已经无法满足主机厂的需求,新一代传感器需要配套软件算法、测试验证等服务,为主机厂提供全方位的服务。”有企业人士表示,具备自主学习能力且能够支持AI技术处理大模型数据的新一代智能传感器,未来市场空间巨大。

另一方面,由于BEV+Transformer方案面临着大数据量的处理,对于大算力芯片的需求也在日益增强。在地平线看来,以数据为驱动、大规模并行运算的智能计算正取代逻辑计算,成为车载计算的核心。因此,如何在有限的面积、有限的功耗及成本下,实现更大的算力,已经成为巨大的挑战。

为此,地平线专门自主研发设计了具备“智能进化”能力的BPU创新性智能计算架构,有望在未来几年做到一至两个数量级的有效算力提升。

目前,经三代架构迭代、超400万片前装量产验证,地平线已经推出了最新一代智能驾驶加速引擎——BPU纳什,专为大参数量Transformer、大规模交互式博弈而设计,具有超异构计算架构,可显著增强算力多样性,是智能汽车时代的最优选择。

除此之外,地平线还推出了基于征程5的纯视觉BEV感知原型方案,并提出“感知决策一体化”的自动驾驶通用算法框架(UniAD),将智驾流程融合到基于Transformer的端到端网络框架中。

而近期,地平线还发布了新一代系列车载智能计算方案——征程6,基于统一的BPU纳什计算架构而来,是业界首款能够覆盖从低到高全阶智能驾驶需求的系列车载智能计算方案。

据了解,征程6旗舰专为新一代城区高阶智驾而生,拥有高集成度、高算力、高效率、高处理能力、高接入能力以及高安全等特点,算力高达560 TOPS,对BEV、Transformer等先进模型的支持效率在业界处于领先地位。

地平线相关负责人介绍,征程6旗舰搭载的BPU纳什架构实现了软硬结合的极致优化,专为大参数Transformer而生,面向高阶智驾前沿算法赢得最佳计算效率。同时,在强大计算性能的加持下,单颗征程6旗舰即可支持感知、规划决策、控制、座舱感知等全栈计算任务。

总体来看,伴随着高阶智能驾驶进入2.0时代,从芯片、传感器乃至智能驾驶系统的每一个模块都在发生“震动”。

背后的受益者有哪些?

首先受益者是视觉系统厂家,车辆至少要增加4-6个摄像头,不过目前新兴造车企业都已经准备好了这些硬件基础,此外需要6-8个加串行芯片,2-3个解串行芯片,加串行与解串行的市场基本被德州仪器和ADI旗下的美信垄断,美信独占了中高端市场,这些芯片价格随着像素的上升也大幅度增加,数量也增加了,最终成本几乎与主SoC一样价格,让ADI业绩大涨。

其次是英伟达这样的强大数据训练系统厂家,Transformer就是暴力美学,参数量动辄十亿百亿千亿,万亿也不罕见,层数动辄上千层,根本不是老旧数据训练中心能支撑的,需要大量购买英伟达或AMD的上万美元级的训练芯片。以前做训练的RTX3090,现在只能做推理用了。毫无疑问这让研发成本暴增。

再次是存储系统,Transformer模型体积惊人,动辄GB起,这需要芯片上的L2缓存大增,实际就是消耗大量的SRAM,对数据训练中心和嵌入式系统来说就是芯片价格暴涨,如果用不起昂贵的SRAM,数据中心这一级也要用HBM。对推理的嵌入式系统来说,HBM的价格太高,消费级的汽车市场是无法接受的,只能退一步选择LPDDR5或GDDR5/6,容量要大幅度增加,至少32GB起,成本自然也大幅增加。

最后是数据搜集和标注,Transformer需要海量训练数据,越多越好,意味着智能驾驶厂家需要更多的数据采集车,数据采集设备,更多的数据处理人员,研发成本暴增。2D直视图+CNN时代厂家累积起来的研发成果化为乌有,很多事情都要从头做起,意味着以前的研发成果贬值严重。最终这一切都转换为消费者头上的成本,成本至少增加300%。

激光雷达和传统AI芯片也将受到影响。首先是激光雷达,BEV+Transformer让纯视觉更加强大,接近以前激光雷达制造BEV的效果,厂家都一窝蜂地拥抱BEV+Transformer,冷落激光雷达。其次是推理用的AI芯片,之前的AI芯片大多是针对CNN的,对Transformer的适应性会比较差,毕竟Transformer是源自自然语言处理(NLP)的,数据的串行性很显著,并行性不佳,这需要AI芯片做出对应的改变,并且是硬件上的改变,这可能意味着推倒重来,或者用更强的Host来对数据整形,也就是标量运算即CPU要加强,Cortex-A55恐怕是无法胜任的。再有原本智能驾驶AI专用芯片都特别针对INT8精度,但Transformer简单量化为8位后性能显著下降,这主要是由于普通的激活函数量化策略无法覆盖全部的取值区间。参数越多,量化后的效果就越差。引入BF16非常有必要,而以前设计的AI芯片大多没考虑BF16。

可以预见,伴随着BEV+Transformer的大规模上车应用,一个全新的智驾市场格局正在到来。

文章来源: 佐思汽车研究,一米光学,钛媒体APP

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智能未来
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...