利用AI在海量电网数据中进行“捞针”,可以快速检测到电网故障点

1468 字丨阅读本文需 4 分钟

识别国家电网故障就像大海捞针。遍布美国的数十万个相互关联的传感器实时捕获电流、电压和其他关键信息的数据,通常每秒记录多次。

麻省理工学院IBM沃森人工智能实验室的研究人员设计了一种计算效率高的方法,可以实时自动查明这些数据流中的异常情况。他们证明了他们的人工智能方法,即学习对电网互联性建模的方法,在检测这些故障方面比其他一些流行技术要好得多。

由于他们开发的机器学习模型不需要对电网异常情况进行注释数据培训,因此它更容易应用于现实世界中,因为在现实世界中,往往很难获得高质量的标记数据集。该模型也很灵活,可以应用于大量互连传感器收集和报告数据的其他情况,如交通监控系统。例如,它可以识别交通瓶颈或揭示交通堵塞是如何级联的。

“在电网的情况下,人们试图用统计数据捕捉数据,然后用领域知识定义检测规则,例如,如果电压激增一定百分比,那么电网运营商应该得到警告。这种基于规则的系统,即使通过统计数据分析来实现,也需要大量的人力和物力d.专业知识。我们证明,我们可以自动化这个过程,还可以使用先进的机器学习技术从数据中学习模式。”麻省理工学院-IBM沃森人工智能实验室的研究人员和经理、资深作者陈杰(Jie Chen)说。

本文的合著者是麻省理工学院-IBM沃森人工智能实验室实习生、宾夕法尼亚州立大学研究生戴恩扬。这项研究将在学习表征国际会议上发表。

探测概率

研究人员首先将异常定义为发生概率较低的事件,如电压突然升高。他们将电网数据视为概率分布,因此如果他们能够估计概率密度,就可以识别数据集中的低密度值。最不可能出现的数据点对应异常。

估计这些概率绝非易事,尤其是因为每个样本捕获多个时间序列,每个时间序列都是一组随时间记录的多维数据点。此外,捕获所有数据的传感器彼此之间是有条件的,这意味着它们以特定的配置连接,一个传感器有时会影响其他传感器。

为了了解数据的复杂条件概率分布,研究人员使用了一种特殊类型的深度学习模型,称为标准化流,该模型在估计样本的概率密度方面特别有效。

他们使用一种称为贝叶斯网络的图形来扩充规范化流模型,该网络可以了解不同传感器之间复杂的因果关系结构。陈解释说,这种图形结构使研究人员能够看到数据中的模式,并更准确地估计异常。

他说传感器相互作用,它们之间有因果关系,相互依赖。因此,我们必须能够将这种依赖性信息注入到我们计算概率的方式中。

该贝叶斯网络将多个时间序列数据的联合概率分解为更容易参数化、学习和评估的不太复杂的条件概率。这使得研究人员能够估计观察到某些传感器读数的可能性,并识别那些发生概率较低的读数,这意味着它们是异常。

他们的方法尤其强大,因为这种复杂的图结构不需要事先定义,模型可以在无监督的情况下自行学习图。

强大的技术

他们测试了这个框架,看它能识别电网数据、交通数据和水系统数据中的异常情况。他们用于测试的数据集包含人类识别的异常,因此研究人员能够将他们的模型识别的异常与每个系统中的实际故障进行比较。

通过在每个数据集中检测到更高百分比的真实异常,他们的模型优于所有基线。

对于基线来说,它们中的很多都不包含图形结构。这完全证实了我们的假设。弄清楚图形中不同节点之间的依赖关系肯定会对我们有所帮助。他们的方法也很灵活。有了一个大型的、未标记的数据集,他们可以调整模型,以便在其他情况下(如交通模式)做出有效的异常预测。一旦部署了该模型,它将继续从稳定的新传感器数据流中学习,适应数据分布的可能漂移,并随着时间的推移保持准确性。

虽然这个项目即将结束,但他期待着将所学到的经验应用到深度学习研究的其他领域,尤其是图表方面。

陈和他的同事们可以利用这种方法来开发映射其他复杂条件关系的模型。他们还想探索当图形变得巨大时,如何有效地学习这些模型,可能有数百万或数十亿个相互连接的节点。他们也可以使用这种方法来提高基于数据集的预测的准确性,或者简化其他分类技术,而不是发现异常。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...