无人驾驶要上路离不开存算一体?自动驾驶落地或许还要10年之久

3087 字丨阅读本文需 8 分钟

以前提起自动驾驶,大家的印象可能是安全系数存疑、烧钱的买卖、资本追逐热度虚高、真正落地遥遥无期……但是,四个座位都没人的自动驾驶车队真的已经在路上了!

日前,在广州正常开放行驶的道路上,萝卜快跑的自动驾驶车队里空无一人,它们成功进行变道、超车等一系列动作。此举一出,证明广州在自动驾驶的探索上已经领先。

自动驾驶,蕴藏万亿市场机遇。广州率先启动整车无人上路,已经占了先机。但想成为“无人驾驶第一城”,它的竞争对手还有北京、上海、深圳、重庆、长沙等40多个省市。既能抓住商业机遇又能推动无人驾驶生态,各大城市的角逐还在进行中。

整车无人上路的实现,源于自动驾驶芯片算力的迭代和突破,也有赖于早前“圈地”测试的成功和逐步打破。

芯片,是自动驾驶汽车的大脑,特斯拉、蔚来、小鹏、地平线、寒武纪、后摩智能等各大厂商争相布局这一赛道。

无人驾驶要上路,“存算一体”应运而生

衡量自动驾驶汽车芯片的标准,曾是算力的高低,算力越大就越能应用在更高级别的自动驾驶中。2014年,第一代EyeQ芯片的算力是0.256TOPS;2025年,英伟达预计芯片算力将达到1000TOPS。这中间的巨大差距不言而喻。

芯片算力的巨大飞跃,还不足以支撑智能驾驶的全部,还需低功耗、低延迟和低成本。“存算一体”方案应运而生。这一方案既增加数据处理速度,又大大降低了数据传输的功耗,从而使芯片能效比达成跃升。可以说,存算一体是芯片技术的颠覆性突破。

技术层面实现突破,基础设施也该完美配套。自动驾驶的实现,还需“车路协同”。道路的智能化改造以及通信基础设施的铺排,才能更好地实现真正的自动驾驶。此举对于技术、时间、成本都有不小的考验,虽然艰难,但一切都在积极推进中。

起初,因为无人自动驾驶伴有一定的危险性,所以测试都在小范围内施行。以长沙为例,2018年,长沙国家智能网联汽车测试区投入使用;2019年,100平方公里城市范围开放道路和100公里智慧高速开放测试;随后,逐步开放到135公里道路……

数央网看到,从圈地测试到一步步将区域范围打开,再到广州无人驾驶车队变道超车,自动驾驶从测试范围上有了显著进展。再加之各大厂商逐步加码的芯片算力,早前看似遥不可及的自动驾驶技术正一步步朝普通人走来。但我们同时看到,实现“车路协同”尚需很多路要走。

存算一体,金字塔从头建起

为了解决“存储墙”问题,当前业内主要有三种方案:

用GDDR 或HBM来解决存储墙问题的冯·诺依曼架构策略;算法和芯片高度绑定在一起的DSA方案;以及存算一体的方案。

HBM是目前业内超大算力芯片常用的方案之一,其优势在于能够暂时缓解“存储墙”的困扰,但其性能天花板明显,并且成本较高。

DSA方案以牺牲灵活性换取效率提升,算法和硬件高度耦合,适用于已经成熟的AI算法,但并不适用于正处于快速迭代的自动驾驶AI算法中。

最后是存算一体方案,这是一项诞生于实验室的新兴技术,其创新性在于打破了传统·冯诺伊曼架构局限性,实现了计算与存储模块一体化的整合创新,解决了传统芯片架构中计算与存储模块间巨大的数据传输延迟、能量损耗痛点,既增加了数据处理速度,又大大降低了数据传输的功耗,从而使芯片能效比(即每瓦能提供的算力)得到2-3个数量级(>100倍)的提升。

达摩院计算技术实验室科学家郑宏忠曾讲过:“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代芯片的性能和能耗问题。”

因此,存算一体架构可以把算力做的更大,其芯片算力天花板比传统冯·诺依曼架构更高;同时,大幅降低了数据传输的能量损耗,提升了能效比;另外,还能得到更低的延时,存储和计算单元之间数据搬运的减少,大幅缩短了系统响应时间。

更重要的是,用存算一体架构做大算力AI芯片另一大优势在于成本控制。不依赖于GDDR 或HBM,存算一体芯片的成本能够相应的降低50%~70%。

换句话说,真正创新架构的AI芯片是将上文中提到的算力、功耗、成本三角形结构从原来的位置往上挪了三个档位。不仅可以提高算力,还可以达到降低功耗、控制成本的效果。

市场趋于饱和,先到者开始收获期

最近几年,在缺芯的时代背景下,随着政策支持的不断加码,我们看到国内半导体产业迎来了发展的良机。芯片的“国产替代”已经在很多细分领域取得了进展,深受资本市场青睐。

但是资本市场也有越来越多的人意识到,热门芯片赛道的“国产替代”创业项目已经日趋饱和。一部分嗅觉敏锐的投资人开始关注后摩尔时代的“创新架构”,认为要想在纯市场化竞争中挑战英伟达等国际芯片巨头,必须另辟蹊径。于是差异化的技术创新成为芯片投资中的重要策略。

HBM、DSA、存算一体都属于芯片行业当前的技术创新路径,三者对比来看,存算一体可以算作是一条难度最大、颠覆性最强、风险最高,但差异化和创新性也最显著的路径。

近年来,国内外涌现出不少专注于存算一体芯片的新兴创企,巨头们纷纷加快了产业布局,资本也对其青睐有加。国内最近一笔相关融资来自今年4月,国内存算一体明星创企「后摩智能」宣布获得数亿人民币Pre-A+轮融资。

不过,一直以来,传统的存算一体研究大多集中在低功耗、低算力的「小」芯片场景中,比如语音、AIoT、安防等边缘领域。

能够应用在车载AI的存算一体「大」算力芯片,即便在学术界也是一大难题,产业界敢于迎战者更是屈指可数。

想要将二者融合,既需要存储单元阵列、AI core、工具链等各个方面都需要有深厚积累的团队,又需要进行整体的协同优化设计,才能最终实现一款高效的基于存算一体的大算力AI芯片。

所幸,这一创新性技术已经让市场看到了落地可能性。

5月23日,后摩智能首款基于SRAM的存算一体大算力AI芯片已成功点亮,并跑通智能驾驶算法模型。首次在存内计算架构上跑通了智能驾驶场景下多场景、多任务算法模型,为高级别智能驾驶提供了一条全新的技术路径。

存算一体很难,存算一体大芯片更难。但在产业巨头林立,市场秩序森严的芯片产业,新兴创企若是只愿意选择容易走的路、采摘「低垂的果实」,是难以取得成功的。

在保证存算一体带来的高能效比、高性价比的前提下,又能将其成功扩展到满足自动驾驶「大」算力需求的级别,属于产业中「高挂的果实」。

从成立之初就聚焦于存算一体大算力芯片的后摩智能,正是瞄准了这一道路。

以团队组成来说,后摩智能的核心创始团队既有来自美国普林斯顿大学、UCSB, Penn State大学等海内外知名高校的学术人才,又有在AMD、Nvidia、华为海思、地平线等一线芯片企业中拥有丰富大芯片设计与实战经验的产业专家。

今年5月大算力存算一体芯片宣布点亮,对于后摩智能来说,离摘取「高挂的果实」已经越来越近了。

传统高算力芯片山头林立,后来者想要在现有赛道上实现超越,确实是充满挑战的。

高算力芯片上车元年,自动驾驶落地尚需时日

高通技术公司产品市场高级总监 艾和志认为,国内自动驾驶近几年发展非常快,从高通的角度来说,我们希望通过持续的研发投入,不断扩展Snapdragon Ride平台,为车企提供灵活、丰富、可定制化的解决方案选择。他认为,2025年是一个关键的时间点,届时L2及以上的自动驾驶汽车将占据市场大约一半的份额。

“今年4月,自主品牌月销量首次超越合资品牌,这也展现了国内新能源汽车蓬勃发展的态势。高通对于中国市场非常重视,愿同合作伙伴一起打造优质的平台。”艾和志表示。

罗来军表示,今年是高算力芯片上车的元年,中国芯片厂商的入场极大推动了至少中国品牌的发展。联创将紧紧抓住这几年发展的黄金期,更好地为中国自主品牌提供更好的服务。

葛俊钦表示,智能网联的发展速度会与电动化一样迅速,甚至超出相关指导文件的预期。目前自动驾驶技术有一套相应的业界公认的技术框架和方法论,最先进的感知技术与人工智能依然是基于不断透过庞大数据训练的模型,这就赋予了大数据平台的意义。他预期,到2024年大算力平台会有几十万台到上百万台的规模,也期待主机厂在大算力平台技术功能的落地、迭代,在人机共驾体验上能给到车主愿意买单的冲动,再推进整个自动驾驶行业的发展。

柯柱良表达了不同的观点,他指出要实现规模化的自动驾驶落地还需要很多工作,现阶段完成自动驾驶的智能化的复杂程度远远超出业界的想象力,实际运行过程中也有很多突发事件无法预测,例如横向穿越物体的识别。在量产上车的过程中会碰到各种各样的干扰,一个小概率事件在非常大的样本数、非常大的出货前提下,就会变成有一定概率出现的安全事故。

他指出,往后看L3+技术落地的周期并不如大家预测的这么乐观,可能需要十年甚至更长的时间。

文章来源:数央网,36氪,爱集微

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...