橙色云资讯 - 工业互联网行业信息门户

如何利用人工智能和自动化大规模识别敏感数据

智通互联 2021-09-24

人工智能大数据

1168 字丨阅读本文需 2 分钟

Text IQ首席执行官Apoorv Agarwal在行业媒体采访时谈到了非结构化数据对组织的风险，以及利用人工智能和自动化大规模识别敏感数据的机会。

当组织试图解决漏洞和勒索软件攻击时，他们忽略了隐藏在数据中的敏感信息。这其中的主要原因是什么？

理想情况下，组织应该掌握敏感信息在其数据中的位置。一般来说，公司最终会将收集的信息保留很长时间，即使这些信息没有实际用途。我认为问题可以归结为更广泛的数据治理问题。

如果没有某种程度的自动化，就不可能有强大的数据治理；例如，企业生成的数据量正呈指数级增长，依赖于人类对隐藏在其数据库中的所有未被发现的敏感信息进行评估，而且通常情况下，非结构化格式根本无法大规模工作。

数据泄露和勒索软件攻击将继续发生，但组织有真正的机会利用AI，这使他们能够主动识别大规模的敏感和个人数据；一旦确定了数据，他们可以选择编辑、删除、加密或采取任何必要的步骤来保护数据，以确保数据不会落入坏人之手。

非结构化数据是如何构成风险的，可以采取哪些措施？

首先，高达80%的企业数据是非结构化的——其攻击面的巨大规模使其非常容易成为不良行为者的目标。其次，这种非结构化数据充满了所有类型的敏感信息：商业秘密、个人的信息、健康信息、知识产权等；例如，没有人构建一个包含组织商业秘密的结构化数据库——它更可能分散在电子邮件、聊天、Excel表格和其他形式的非结构化数据中。

非结构化数据带来的挑战是数据量巨大，找到其中的敏感信息就像大海捞针。寻找那些危险和敏感的针头需要可伸缩的机器学习技术。

自动化是唯一的出路还是人的因素仍然有价值？

数据的增长速度明显快于人口增长速度。没有足够的人力，一天中没有足够的时间完成任务的数量和复杂性。

我认为还需要注意的是，机器并不是一个你只需按下一个按钮就能自动完成这些任务的地方。他们确实需要人类的帮助。这项工作不能单靠机器或人来完成。

能解释一下人工智能是如何识别和保护敏感信息的吗？

它不保护敏感信息，而是识别敏感信息。一旦确定了它，组织就可以通过删除、编辑、加密或更改对它的访问控制来保护它。

挑战在于身份识别本身。在身份识别方面，现状是基于过时的方法和技术——RegEx，搜索词。这些劳动密集型方法除了速度慢、可扩展性不强外，产生的结果可能会被错误所困扰。

但并非每个9位数字都是SSN。另一方面，人工智能可以查看信息的更大上下文，以更准确地确定一条信息是否敏感。作为一个例子，考虑电子邮件。当分析敏感信息的电子邮件时，AI有能力考虑上下文，诸如谁写的、谁消费的、谁被复制到它以及电子邮件链中的人之间的关系网络，以确定电子邮件的一部分是否敏感。

现在，理论上，人类可以对所有这些环境进行三角测量，但世界上没有足够的人类来完成这项工作；此外，人类不擅长计算任务，他们更擅长抽象思维。

企业保护数据的方式会对其整体业务和声誉产生重大影响。您认为企业对此有多了解？您认为他们应该改进什么？

他们非常清楚这一点。没有任何组织认为它完全不受数据泄露的影响。这在董事会层面是最重要的。

他们可以改进的地方在于：长期以来，他们一直依赖于数据丢失预防、搜索术语和手动审查。他们真的需要转向并利用AI等新技术。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：智通互联

0 0

参与评论

登录后参与讨论 0/1000

下一篇颠覆产业的新技术!小型机器人变形器将为您刷牙和使用牙线清洁牙齿

牙科护理的未来可能会有新的机器人盟友。 ...

2022-09-19

如何利用人工智能和自动化大规模识别敏感数据

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

如何利用人工智能和自动化大规模识别敏感数据

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

国家电投与阿里巴巴宣布战略合作，数字化转型这条路上，央企各显神通

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

安防智能化升级的一大助力：端边云，有啥不一样？

Nvidia英伟达的AI智能汽车信仰

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

“赢在南京·创业金陵”科技创新创业大赛圆满举行|北京·活动

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

霍尼韦尔：工业数据分析如何驱动智能分析与决策优化

方大九钢携手图扑软件：数字孪生”高精尖“智慧钢厂

汽车企业数字化转型：关键认知与实现策略

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

面向未来：自动驾驶的数据治理

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

对话清华大学张亚勤：AI发展应遵循3R法则

一文讲透货拉拉混合云数据库体系化建设

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

全球“工业4.0”发展现状及产业链上下游分析

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

人工智能五年内将爆发国家与地方政策鼎力支持政策法规