大模型“发育”成熟,自动驾驶“苟来”最强大脑

青蛙科技 2023-10-21
3640 字丨阅读本文需 9 分钟

2023年10月17日,百度世界大会2023在北京首钢园举行。创始人李彦宏以“欢迎来到生成式人工智能的时代”开场,发表了主题为《手把手教你做AI原生应用》的演讲。作为大模型浪潮正式到来后的首次世界大会,这届的主题被百度定为“生成未来”。发布会上首先亮相的产品,便是重磅的文心大模型4.0版本。相较于7个月前初次发布文心一言时坦诚的提到“不够完美”“承认差距”,台上的Robin这次显然更加从容自信:

“这是我们认为迄今为止最强大的文心大模型,它的基础模型实现了全面升级,在理解、生成、逻辑、记忆这四大能力上,相比于大家现在用的线上的文心一言版本是有明显提升的,综合水平跟GPT4相比也已经毫不逊色。”

从现场的演示看,文心大模型4.0版本的确涌现出了相当高的智能水平。李彦宏扮演了一个“刁蛮”的测试用户,向其询问到“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”而文心大模型4.0的回答表明,即便面对这类涉及乱序表述、模糊意图乃至潜台词的问题,它应对起来依旧游刃有余。

基于全新的文心大模型核心能力,百度在过去几个月里,对集团内部的几乎所有产品做了重构,即李彦宏说的“手把手教你做AI原生应用”。最核心的百度搜索在大模型加持下,已经具备极致满足、推荐激发、多轮交互三个特点。百度产品矩阵中的担当角色,如地图、网盘、文库等在重构后革新了用户体验。而像国内首个生成式商业智能产品“百度GBI”和“如流”这类新一代智能工作平台,则显示出“AI原生”这个新要素在生产力方面所能创造的巨大价值。

当然,百度自动驾驶基于大模型的新进展,也在这次会议上向外界做了展示。目前,百度萝卜快跑订单总量已超过400万单,是全球最大的自动驾驶出行服务商。百度集团资深副总裁、智能驾驶事业群组总裁李震宇以视频方式做了演示,他在机场打了一辆萝卜快跑的“真无人车”,车辆在繁华复杂的城市道路上穿梭自如,并最终顺利达到目的地,引发现场一阵惊叹。

相较于上面提到的这些互联网应用,自动驾驶跟大模型的结合有着特别的意义,因为它象征着大模型对世界的重构从信息空间拓展到了物理空间。如李彦宏所说,大模型将会让百度的自动驾驶能力超越经验系统,更聪明处理复杂场景,实现更广泛的时空覆盖。

自动驾驶长脑子

李想国庆假期前的最后一周,拉着王兴和陆奇等人开了场秋季战略会。这场战略会上,智能驾驶被提到了空前高度,这群人单独花了一整天来讨论智驾要如何投入。李想本人在会上做了某种意义上的自我批评,他认为智驾应该提前半年投入,也就是从去年中,而不是今年初才开始上强度。

这个判断有着充足的现实素材做支撑。L2级自动驾驶在去年底已经成为标配,而具备高速点对点和NOA的高阶智能驾驶能力将在2025年达到15%以上的搭载率。从乘联会发布的乘用车价格段市场结构看,这个比例几乎涵盖了价格在25万以上的所有车型。相对应的,2025年智能驾驶在所有购车因素中的决策占比也将从过去的不到2%快速增长到超过30%。所以对于车企而言,尤其是瞄准中高端市场的厂商,智能驾驶是个做了不一定能活到最后,但不做一定立马就死的必选项。

这个过程中,基于大模型的生成式AI技术将扮演关键的催化剂角色。具体来讲,可以大致分成两个层面。

一是由于大模型具有理解、生成、推理、记忆的能力,它将完全重塑智能座舱的体验,“使得智能座舱内人的体验彻底变为人和虚拟人之间的一个全新关系”。未来人跟汽车的交互将从现在基于图形界面的GUI模式,转向更符合人类通过语言交流的LUI模式。在两年前的世界大会上,百度首次提出了“汽车机器人”的前瞻概念,而随着大模型在智能座舱上面的普遍应用,这个概念正在一步步变得具象和现实。

因此,在文心大模型的基础上,结合百度对于智能汽车的理解以及过去多年在领域内累积的人机交互数据,IDG进一步迭代出了智舱大模型。在具备文心大模型智力的同时,跟出行场景和车内环境做了深度融合。OEM厂商通过官方提供的智舱开发工具链,可以非常方便地打造带有车企自身特色的下一代导航、交互、信息服务、用车场景等一系列的智舱原生应用。百度智能驾驶事业群组智能汽车业务部总经理苏坦在论坛上的描述,就是“通用大模型、行业大模型和品牌大模型,是让用户体验变得越来越好的三级火箭。”

在智能座舱之外,大模型还将对自动驾驶技术本身带来跃进,百度称之为智驾或者视觉大模型。最近一段时间,国内自动驾驶行业最重要的一波技术潮流,就是车企纷纷转型基于BEV+Transformer的纯视觉路线。

在此之前,智能驾驶系统实际是以传统的组件堆砌方式实现的。例如在感知领域,不同的小模型负责不同的功能,然后这些小模型组合在一起形成一个系统。例如,车道线的检测、红绿灯的检测和障碍物的检测都由各自的小模型实现。但这种方式显然会给数据搜集和系统智能化的组合带来问题。

规划控制方面也类似,过去是基于规则和经验的系统,就是说提供一些预定义的规则或者训练系统时喂给它不同的场景,让系统知道后续再次遇到类似场景应该如何做。这样做带来了两个问题,首先是有些场景下你很难把规则说清楚。比如10月4号,清华、港大和UCB的研究人员就在arXiv上刚刚发表了一篇论文。他们举了个例子,如果前面的路口没有交通信号灯,而正驾驶车辆打算左转的你,迎面来了一辆直行车辆。这种情况下,熟悉交通规则的人类驾驶员直觉上就知道要减速让行,但现有的高级自动驾驶系统却往往需要设计极其复杂的规则或者奖惩函数才能有效处理类似场景。

其次是很难处理corner case,因为高频刚需的场景会给系统留下最多的“经验”。笔者在上海人工智能实验室和华东师大研究者合作的一篇论文里,就看到了一个有趣的例子。下面这两张图片非常类似,但左图在货车上的交通锥应该理解为货物,而右图在地上的交通锥又应该理解为真正的道路标识,而这两种情况又对应着不同的动作。你可以整一堆包含类似corner case的数据集,比如装交通锥的是大皮卡小皮卡或者三轮车,让自动驾驶系统学会应对这种情况,知道遇到作为“货物”的交通锥不需要刹车。但棘手的是,算法又会在交通锥作为“道路标识”的时候弄不明白状态。

而在有了大模型过后,自动驾驶系统也就被赋予了常识,汽车就像人的脑子一样,可以基于常识通过推理解决上面提到的问题。就像苏坦在下午的论坛上所阐述的,基于BEV的感知大模型正在以吞食天地的速度快速消灭过去多个零散组合式的小模型,从而形成完整的一站式的大感知模型。同时,决策和规划相关部分也开始迅速引入大模型相关技术,开始从过去的经验系统、规则系统快速变成一套学习系统和一个向上可自我迭代的智能化系统。

目前,百度已经基于BEV大模型打造了高阶辅助驾驶,并且跑通了泊车、高速和城市的全域场景。据苏坦介绍,在城市场景中,百度的纯视觉方案已经实现了与有激光雷达同样好的产品体验。对智能汽车行业有关注的读者大概知道,过去几年这个赛道非常卷,厂家经常以堆料的方式显示自己的诚意。 但归根结底消费者关心的是使用体验,如果去掉不需要的激光雷达,那么产品的物料成本会更低很多,车企也会有更好的竞争力。

在下午“大模型重构智能汽车”论坛分享的末尾,官方还披露了一个振奋人心的消息。国内首个纯视觉城市领航高阶智驾产品Apollo City Driving Max将在今年四季度量产落地,届时大家将能看到整个自动驾驶底层技术在基于大模型深度重构后所带来的澎湃的产品力、良好的用户体验和科技给整个社会带来的推动力。

大模型“重构”智能汽车的三条关键路径

近年来,智能驾驶在用户整体购车因素的占比快速上升,在“选购前最重视因素”占比从1.2%突破到30%,成为用户购车核心决策因素。智能汽车市场正处在规模化量产前夕,智能汽车底层智能化技术也在发生重构,让AI原生出行时代更快到来。

李震宇认为,大模型对智能汽车行业的重构主要体现在三个方面。语言大模型上车,人车交互方式会从“命令式”升级到“对话式”;通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及;未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。

会上还发布了多款智驾和舱驾融合产品。百度Apollo量产的Apollo Highway Driving Pro进一步演进,发布了新一代Apollo City Driving,使得使用场景从封闭道路升级到城市开放道路,功能场景无限接近全域。

百度称,纯视觉城市领航高阶智驾产品Apollo City Driving Max将于2023年第四季度量产落地。与此同时,百度Apollo还行业首发了Apollo Robo-Cabin舱驾一体软芯融合智算平台,它是中国首个能够完成甚至是全球首个真正意义上在单SOC上实现了舱驾融合运行的平台。

各家车企加速布局

10月10日,毫末智行CEO顾维灏在HAOMO AI DAY上谈到,自动驾驶3.0时代与2.0时代相比,其开发模式和技术框架都将发生颠覆性的变革。在自动驾驶2.0时代,以小数据、小模型为特征,以Case任务驱动为开发模式。而自动驾驶3.0时代,以大数据、大模型为特征,以数据驱动为开发模式。毫末基于DriveGPT大模型开发模式推出了七大应用实践,包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解释、驾驶环境预测和车端模型开发。

在10月11日的2023科创大会上,商汤科技绝影智能汽车事业群总裁王晓刚指出,通用人工智能将让智能驾驶变成安全可靠的老司机,让智能座舱变成暖心懂你的好管家。在自动驾驶领域,商汤首次将检测、跟踪、建图、预测及规划整合到一个基于 Transformer 的端到端网络框架下,在多目标追踪、车道线预测、目标轨迹预测、规划误差等任务上均超越此前最佳模型,有望加速高级别自动驾驶的落地。

东吴证券最新研报中提到,汽车AI智能化已至变革拐点,板块核心环节均有望受益。本轮智驾变革下,产业受益整车>零部件;未来1~2年,整车环节华为+小鹏领先,理想等加速跟进;零部件环节以高阶智驾域控最为受益,其次关注线控底盘(制动+转向)以及4D雷达等子板块。

总的来说,围绕新能源汽车的竞争,上半场是电动化,下半场是智能化。作为智能汽车的核心驱动力,AI大模型之争才刚刚开始起步,企业需要投入大量资金维持平台迭代升级,但AI大模型必将推动汽车智能化的革新。

文章来源: 汽车与配件,雷递,新立场

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:青蛙科技
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...