有了大模型的加入,自动驾驶将迎来质的飞跃

老刘说科技 2023-12-05
2797 字丨阅读本文需 7 分钟

在今年的2023世界人工智能大会上,特斯拉CEO马斯克表示,随着人工智能技术快速发展,预计大约在今年年末,便有望实现全面自动驾驶。他坦承,“我之前也做过许多类似的预测,我承认之前的预测也不完全准确,但是这一次的预测,我觉得是比较接近的。”

与此同时,有了自动驾驶技术,汽车的使用率也会大大增长。

马斯克指出,一般情况下,一辆家用汽车每周大约有10-20小时的使用时间,而其他多数时间都是呆在停车场里。相较之下,全自动驾驶汽车可能每周使用时间可以达到50-60小时——按这样计算,全自动驾驶汽车的使用时间可以达到非全自动驾驶汽车的近5倍水平。

马斯克补充称,特斯拉乐意将自家的自动驾驶技术对其他车企分享或发出技术许可。

那么,目前特斯拉的自动驾驶技术达到了什么水平?

“我们已经非常接近没有人类干预的全自动驾驶的状态了,”马斯克透露,“我们已经在美国的道路上展开测试,现在很少会需要人工干预”。

“我觉得,要实现全自动驾驶,或者说L4-L5级的全自动驾驶,大概今年晚一点时候就有望实现。”

实际上,马斯克之前已有类似表态。据多家外媒4月19-20日报道,马斯克在电话会议上表示,将在今年推出全自动驾驶技术。“我有点犹豫(要不要这么说),但我认为我们今年可以做到。”马斯克之前曾多次设定实现全自动驾驶的目标时间,但都没有达成。

另据多家外媒本周报道,特斯拉正在招聘临时工,来试驾公司汽车,并收集其自动驾驶系统的相关数据。

特斯拉发出的招聘信息显示,公司正在为美国14个城市的车辆数据收集团队,招聘临时车辆操作员。岗位职责包括在指定区域内驾驶特斯拉车辆、分析并报告驾驶过程中收集到的数据、撰写每日驾驶报告、调试软件等。

此外,马斯克6月末在社交平台上指出,FSD V12发布时将不再是测试版(Version 12 won't be beta)——而特斯拉FSD之前只面向部分用户推送Beta版本,马斯克这一表态被外界解读为特斯拉FSD有望升级完整版。

民生证券认为,这意味着FSD已达到向用户推送的标准,FSD V12有望落地,自动驾驶将迎拐点。国泰君安更指出,特斯拉有可能在年内正式向北美用户推送FSD完整版。华西证券补充称,FSD V12版本有望开启端到端AI,其将采用端到端的AI算法模型,将“感知”和“决策”融合到一个模型中。

AI大模型落地汽车

目前,AI大模型正在各行各业快速渗透,而汽车也成为其“不可放过”的目标落地场景。

广汽集团近日宣布正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,吉利汽车也表示首个全栈自研的全场景AI大模型将搭载在吉利银河L6上。更早之前,奇瑞新能源汽车注册了“ICAR GPT”商标,长城汽车注册了“长城汽车SPACEGPT”等商标,蔚来汽车、小鹏汽车也申请注册了GPT相关商标。

除此之外,多家车企纷纷宣布与大模型企业展开合作:百度Apollo日前宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴;今年4月,吉利汽车、智己汽车、奇瑞新能源汽车等多家企业也表示,将与阿里云在大模型相关场景上展开技术合作。

“汽车是一个较为垂直的领域,大模型在汽车方面的应用并不是‘大’,而是‘多’。智能驾驶、智能座舱、智能营销,乃至智慧交通,短期内都是专业性较强的多模型,在功能上会更加丰富。这让汽车从交通工具属性升级为智能终端属性,但在性能上反而对算力、网络有了更高的要求。从长远来看,汽车成为AGI(通用人工智能),更多的还停留在愿景层面,在硬件、架构、安全、服务等方面要做的工作还有很多。”有着10年汽车行业经验、聚焦车载人工智能的从业人员张凯(化名)告诉中国商报记者。

探索智能交互与自动驾驶

AI大模型在汽车领域的探索,首先是在车载智能交互方面。

百度Apollo将与文心大模型智能座舱应用探索伙伴,围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证。

“目前车内主要使用的交互形式是‘命令式交互’,就像是语音遥控器,用户通过语音给车机发出一道指令,它按照你的指令完成任务,这种方式可以很好满足用户的基础需求,但百度认为仅仅这样还远远不够。”接近百度的人士许东(化名)告诉中国商报记者,“基于文心大模型能力,百度Apollo针对车载场景进行专项训练和模型精调,无需人工数据标注,AI便会具备更出色的语言理解和学习能力。未来,在大模型加持下的智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,让车内助手在未来有能力像真人一样跟用户交流,可以理解并满足用户在车内场景的深层次需求。”

吉利全场景AI大模型则囊括了绘画大模型、音乐大模型、语言大模型和自动驾驶大模型。基于此,吉利银河将提供AI智能交互、AI音乐MV、AI儿童绘本、WoW壁纸等基于AI智能技术的功能,可具有主动搭讪、自动唱歌以及哄娃等能力,实现购物、车内休闲、哄娃、社牛以及自我营销等场景。

除了智能交互外,自动驾驶也是AI大模型探索的重要方面。

去年8月,小鹏汽车和阿里联合打造自动驾驶AI智算中心“扶摇”,用于自动驾驶模型训练。小鹏汽车CEO何小鹏表示,“扶摇”是目前我国汽车行业最大的自动驾驶智算中心,为小鹏在全场景智能辅助驾驶系统的训练奠定了算力基础。

广汽AI大模型平台将率先落地智能语音交互场景并支持智能驾驶,进一步提高智能驾驶的感知能力,提升智能驾驶的安全性和可靠性。据悉,广汽AI大模型平台聚合了多种AI大模型,并与广汽智能网联底层能力深度融合,不仅拥有能够调动通用大模型的能力,还能基于智能汽车的应用场景构建专用模型。

自动驾驶服务商毫末智行于今年4月发布了业内首个自动驾驶生成式大模型DriveGPT,中文名为“雪湖·海若”。它通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,现阶段主要用于解决自动驾驶的认知决策问题,终极目标是实现端到端自动驾驶。

自动驾驶算法有望迎来奇点

感知:BEV+Transformer横空出世,大模型推动自动驾驶迈向“平民化”

2021年特斯拉第一次推出BEV+transformer算法架构,用神经网络将多个2D的图像和传感器信息综合成为三维的向量空间方便下游规控模块处理,开启了自动驾驶新时代。该算法优势显著:(1)解决2D图像转换成3D空间深度预测难点,感知性能提升。(2)完美实现多摄像头、多传感器信息融合。(3)更易融入时序信息,让模型拥有“记忆”。(4)拥有实时建图能力,摆脱对高精度地图的依赖。

规控:算法由基于规则迈向基于神经网,大模型开始崭露头角

规划控制算法中,目前行业仍以基于规则的方式为主,但泛化性不足仍面临诸多长尾问题,同时不断“打补丁”完善算法会导致最终代码量庞大且难以维护。领军公司已开始将大模型引入其中,进而拥有更强的泛化能力和更好的驾乘体验。

端到端(感知决策一体化):大模型为自动驾驶彻底实现带来希望

感知、预测、规划、控制组合模块化部署模式,一方面,容易累计误差,另一方面,不同模块之间全局优化存在困难,因此端到端感知决策一体化算法成为自动驾驶行业共识的目标。英伟达、Uber、Wayve等公司进行了诸多探索。

数据:大模型推动数据闭环和仿真落地

数据闭环通常包含数据采集、挖掘、数据标注等环节,如何实现自动化运行同时降本增效是关键。目前行业推动大模型助力数据挖掘和自动标注,将加速产业成熟。仿真方面,逼真的仿真环境可替代实车数据的采集,是减少Cornercase的有效手段,大模型亦帮助实现自动化的场景生成等,完美提升模型自我迭代能力。

算法变局推动L3级自动驾驶加速到来

大模型时代,得算力者得天下。大模型可通过仿真、自动标注等方式显著提升车厂算法能力,车企纷纷加码数据中心。芯片格局有望受大模型影响而重塑。Transformer大模型具有大参数、计算复杂等特点,芯片需要针对性开发加速器以实现在推理端良好运行,前瞻拥抱产业趋势的玩家有望在竞争中占得先机。最后,大模型推动下,L3级自动驾驶正加速到来,诸多车企推出自己的大模型解决方案,并有望迅速实现城市辅助驾驶落地,全产业链玩家均有望持续受益。

文章来源: 科创板日报,中国商 报,高质量发展GZF

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:老刘说科技
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...