数据安全无小事,自动驾驶领域的数据该如何管理?

IT猿人 2022-12-16
4377 字丨阅读本文需 10 分钟

随着人工智能、智能驾驶、物联网等技术的发展,数据安全的重要程度正在迅速提升。

近日,北京市自驾办发布《北京市高级别自动驾驶测试示范区数据分类分级白皮书》,填补了国内自动驾驶示范区数据分级分类领域的空白。对于备受关注的数据安全,示范区通过判断数据一旦遭到破坏、泄露、损毁等,对国家安全、公众利益、个人权益和企业合法权益的危害程度与影响,将数据等级分为5级。

根据ML大牛吴恩达提出的著名二八定律:80%数据+20%模型=更好的AI。他认为,一个机器学习团队80%的工作应该放在数据准备上,确保数据质量是最重要的工作,每个人都知道应该如此做,但没人在乎。如果更多地强调以数据为中心而不是以模型为中心,那么机器学习的发展会更快。

而随着中国自动驾驶产业商业化落地的高速推进,市场对于数据的需求也正在呈现急速上升的趋势。根据公开数据,预计至2030年,中国运营的自动驾驶车辆将达3000万辆,或将成为全球最大的自动驾驶市场。

总体来看,整个自动驾驶正处于L2级自动驾驶向L3级发展的阶段,场景越来越复杂的同时,也带来了对于3D等更高维度、更高质量数据的巨大需求。而另一方面,自动驾驶全产业链的企业数量正在飞速扩展,包括传统车企、车企相关互联网公司、跨界互联网公司、新型自动驾驶相关公司等在内的企业,也让我们看到了更大的数据需求。

自动驾驶数据的重要程度正在持续上升

如果说智能化1.0阶段,车企拼的是技术的快速落地和高阶能力的标杆效应,那么2.0阶段就是拼规模化搭载。

高工智能汽车研究院重磅发布《2023-2025年智能网联产业趋势报告》,报告显示,今年1-10月,前向ADAS(L2含NOA)同比上年增长67.11%。NOA(导航辅助驾驶)同比上年增长116.25%。

在具体车型方面,特斯拉Model Y/S、理想ONE、比亚迪汉、丰田亚洲龙排名L2全系标配搭载量前五。这意味着,一旦启用「影子模式」,大量实际驾驶数据采集的效果将会显现。

比如,在数据方面,特斯拉采集用户实际驾驶中产生的数据,用“影子模式”去学习用户的驾驶逻辑,辨识各种各样的驾驶场景,确保有充足的数据进行系统优化。

众所周知,数据贯穿了整个AI的生命周期,从数据获取,数据准备、模型训练和部署、再到人工模型评估。

当前,软件和数据已成为智能汽车的核心增量。在很多业内人士看来,打造一套可用的智能驾驶系统并不难,但开发和维护可扩展和可靠的完整数据驱动解决方案才是真正面临的挑战。这意味着,智能驾驶系统真正实现基于数据+软件定义的全新模式。

马斯克也曾公开表示,FSD可以让公司价值不菲。但同时强调,系统改进的唯一途径是收集数据。

可以看到,在中国市场,数据服务的价值也已然明朗。

高工智能汽车研究院监测数据显示,在前装市场,传感器的搭载量正处于上升周期。例如以整车搭载摄像头为统计口径,今年1-8月中国市场(不含进出口)乘用车新车标配交付摄像头合计为3329.86万颗,同比增长23.35%,单车搭载摄像头颗数为2.67颗(上年同期为2.05颗)。

高工智能汽车研究院预计,接下来两三年仍是摄像头上车的市场红利期,预计到2025年中国市场单车搭载摄像头将提升至7-8颗。同时前向双目、三目,周视等更多摄像头配置成为主流,基于数据认知的训练也成为刚需。

另一方面,4D毫米波雷达以及激光雷达的搭载也正处于最关键的导入期,这带来了一个全新的市场:多传感器感知的数据融合。此外,舱内人机交互的体验升级,也同样需要数据迭代支持。这也再次表明,无论是在自动驾驶还是辅助驾驶领域,数据标注的需求量都将迎来增长的高峰期。

以一辆搭载8个摄像头(前向3颗、周视4颗、后视1颗)的智能汽车为例,每个摄像头以30帧/秒的速度拍摄1小时,将会产生约86万帧的图片,按10万辆存量车计算,就是接近1000亿帧的数据。即便其中有大部分数据可以进行快速自动化过滤处理,剩下的需要精确标注的数量仍然非常惊人,这还不包括雷达的融合数据。

很明显,产业链迎来了新的商机。

自动驾驶数据标注当前面临的难点

作为产业链的重要一环,澳鹏同样深刻感受到自动驾驶市场需求的火热:尤其在今年,自动驾驶的数据标注需求更是呈现爆发式增长。

2020年澳鹏做到4.7m美金的营收,2021年是24.7m美金,实现了421%的增长;2021年上半年141%增长大部分是来自自动驾驶,目前自动驾驶占总业务量60%以上,澳鹏一半以上的客户来自自动驾驶。

然而,随着业界对于数据标注需求量的爆发,过去简单粗暴的“人力堆叠”已无法满足当前对于“高质高量”数据供不应求的行业痛点。

要知道,在自动驾驶领域,数据标注几乎没有出错的余地,也不容缺少关键用例。这就导致自动驾驶汽车的数据采集和标注是非常耗时的资源密集型过程。同时这也是为什么一直以来自动驾驶企业会面临上市时间延迟、产品性能堪忧以及推广困难等问题。

澳鹏相关负责人表示,伴随L3级自动驾驶的进阶升级,自动驾驶厂商对舱外数据服务的需求与日俱增,其中既包括数据需求量的增长,也有更复杂的数据类型的变化。行业对于激光雷达3D点云数据的大量需求,也让数据标注的工作变得更为复杂,数据成本急剧上升。

而对于下游企业而言,如何低成本获取高质量数据就成了他们在这个时代的刚需。

自动驾驶数据标注当前的技术主要面临以下难点:

1:随着自动驾驶市场的爆发式增长,总体数据量增大使得平台业务吞吐量增大,这对于工作流的数据流转效率、稳定性提出了更高要求;

2:采集到的数据精度提高、数据稠密度的提升,导致需要处理的单条数据变大,标注员设备可能比较低端,需要加大力度在研发上支持工具在各种高低端设备上的正常使用;

3:采集设备越来越多样化和复杂,使得数据类型增多,产生包括4D传感器数据等多传感器数据融合标注的需求;

4:数据成本和企业降本增效的需求,对标注效率和管理能力的要求越来越高,需要不断打磨和优化工具功能以及项目管理功能;

5:随着自动驾驶商业化落地进程的加快,客户需求也越来越细化和多变,需要加大投入模型辅助标注的研发并针对不同项目进行定制化的模型开发。

可以看到,为了解决以上难点,数据服务企业采用的数据标注技术已然从最早的单机标注工具演进为数据标注平台,继而升级为现阶段的智能数据标注平台/企业级AI数据标注平台。

另外,从管理角度来说,该采取怎样的措施?

分级管理是数据安全治理基础

李克强强调,要着力解决智能网联汽车面临的基础、共性、关键信息安全问题。示范区运营过程中出现的数据量不断增多,过度采集、使用不当、法规难以覆盖,标准、管理明显滞后等问题正是智能网联汽车数据安全治理面临的普遍问题。而分类分级是数据安全治理的基础,“北京经验”也可以为更多的数据治理提供“共性”经验。

张永伟指出,要对监管数据进行分类分级,明确哪些数据要被纳入强监管,哪些数据可以进行市场化自律范畴。《白皮书》也提出,行业亟需制定一套行之有效的数据分类分级方法,全面梳理数据资产,明确数据安全等级保障要求,为全面、高效保障示范区数据安全建立基础。

智能网联汽车数据分级分类管理日益被重视,这成为数据安全治理的基础。我国从2021年开始重视汽车智能化带来的数据管理问题,形成了“三法一条例”的基本数据管理制度。但“三法一条例”不是只针对汽车领域,汽车只是其中很重要的一方面。王羽强调,汽车一直是先进技术应用的前沿阵地,目前智能网联汽车的安全问题,在某种程度上也是我国网络数据安全面临的普遍问题,“我们在智能网联汽车数据安全方面做了大量工作,包括‘北京经验’,可以为其他行业网络数据安全治理提供借鉴。”他认为,做好数据分级分类管理,不仅可以为数据安全治理提供基础,而且还可以为数据的整合应用提供可能。“虽然我们都说要发挥大数据的作用,更好推动行业发展,但如果对数据的基本分析都没有,比如哪些数据适用在哪个领域、环节,可能会发挥怎样的价值,这些基本的问题都没弄清楚的话,数据价值自然也就无从谈起。”王羽说,通过分级管理提高数据安全的同时,数据才能更好发挥价值。

目前,从国家到行业、企业,也都越来越重视智能网联汽车数据的分级分类管理。2021年,工信部印发《关于加强车联网网络安全和数据安全工作的通知》,指出智能网联汽车生产企业、车联网服务平台运营企业要建立数据管理台账,实施数据分类分级管理,加强个人信息与重要数据保护,定期开展数据安全风险评估,强化隐患排查整改。2022年,中国智能网联汽车产业创新联盟等行业组织、企业联合发布团体标准《智能网联汽车测试示范区数据安全分类分级指南》,在执行层面为自动驾驶数据安全保障提供标准化方案和技术指导。

建立专用数据管理制度 产业链协同打造安全体系

除了数据的分级分类管理,更要形成数据管理的顶层设计,也需要多主体的共同努力,协同推进。

在张永伟看来,相比电动化,智能化的发展涉及的方面更多元,也因此,对管理政策和管理体制的创新要求也更高。当前最迫切的是,加快形成智能网联汽车发展所需要的数据管理制度。“智能网联汽车的数据积累非常快,目前已经进入数据爆发时代,如果我们的数据监管不健全,甚至没有明确的监管职能部门,或者各部门只监管部分数据,不能有效协同,就会面临很大风险。”张永伟表示,有关监管方要明确在数据链条上各自的角色。

张永伟进一步强调,当前数据本身的权责界定并不明晰,智能汽车形成的数据所有权、使用权和基于使用权形成的收益如何界定,是非常棘手的法律问题。“数据的安全等方面一旦出现问题,如何审查、问责需要明确;数据安全管理的预警制度建立等方面也都有待明确。”张永伟说,“我们需要建立专用的数据管理制度。”

国家信息技术安全研究中心副主任兼总工程师、中国信息协会信息安全专委会副主任李京春则从企业的角度,强调了数据安全治理的重要性,并提出了建议。

他认为,应进一步加强汽车数据安全治理工作,汽车企业急需提高网络安全和数据安全意识,加强网络安全和数据安全合规管理,使智能网联汽车产业能健康快速发展,让人民群众有更多的幸福感、获得感和安全感。他建议,在操作层面,跨境数据需要备案,治理过程要分级分类;开展汽车数据安全管理认证、产品和服务认证;作为关键信息基础设施的自动驾驶云计算服务商需要通过四部委组织的云计算服务安全评估;构建适合汽车数据安全管理的统筹机制;加强从硬件到软件安全防护技术上车、上路、上云。

“针对智能汽车领域存在的数据安全问题,车企需要提高网络安全和数据安全意识,加强网络安全和数据安全合规管理,确保合规采集、使用、存储车辆数据。严格保护用户隐私数据,平衡数据流通与泄露风险,使智能网联汽车产业能健康快速发展。守护智能汽车数据安全不只是车企的责任,更需要多方主体共同发力,让数据能流转起来,共享起来,应用起来。”李京春如是说。

国家智能网联汽车创新中心信息安全部部长罗承刚强调了多元主体参与的意义。“智能网联汽车数据安全体系的构建,需要以数据全生命周期防护为中心,多元主体共同来参与,同时从监管、标准、管理、技术4个方面去推进。”他认为,在国家层面,需要制定相应的标准法规,建立相应的监管平台;在行业层面,需要制定行业规范、研制行业相关的防护技术、突破技术瓶颈;在企业层面,需要多维度地落实标准法规;在个人层面,需要加强数据安全防护的意识,履行相关的责任和义务。“只有通过国家、行业、企业、个人多维度,整个产业链上多主体共同努力,协同建设,才能把智能网联汽车数据安全体系建设好。”罗承刚说。

“考虑数据安全治理的时候,一定要选择适合自身发展阶段的办法,兼顾安全和业务的平衡。”北京天空卫士网络安全技术有限公司北区技术总监陆明认为,数据安全治理可以分阶段进行:首先,要引入数据安全的整体框架;其次,通过数据分类分级,在部分位置引入针对核心数据安全的处理能力;最后,进行统一部署,实现数据安全的可视化监控,数据流转的可视化追溯及安全事件的快速响应,形成数据安全治理持续化运营能力。

文章来源: 资讯朝闻,中国汽车报,北京日报

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:IT猿人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...