掌桥专利:专业的专利平台
掌桥专利
首页

一种电力变压器声纹信号故障无监督检测方法

文献发布时间:2024-04-18 19:58:30


一种电力变压器声纹信号故障无监督检测方法

技术领域

本发明涉及电力变压器故障检测技术领域,更具体的说是涉及一种电力变压器声纹信号故障无监督检测方法。

背景技术

随电力变压器是电力系统中的重要设备之一,广泛应用于电力传输和配电系统中,起着变换电压、调节电压、隔离电力线路以及保护电力设备的作用。然而,由于长期运行和各种外界因素的影响,电力变压器存在着故障的风险,而这些故障可能会导致设备无法正常工作甚至造成事故,严重影响电力系统的稳定运行。

目前,传统的电力变压器故障检测方法主要依靠人工巡检和定期的仪器检测,这种方法需要耗费大量的人力和物力,并且不能实时监测设备的状态,无法进行真正意义上的故障预警。另外,由于电力变压器内部存在复杂的电磁场和热场等环境,故障信号往往被掩盖在背景噪声中,使得故障的检测变得更加困难。声纹信号是电力变压器故障检测的重要指标之一,可以通过分析声学特征来判断设备是否存在异常。声纹信号是指在电力变压器运行时产生的声音信号,由于故障导致的设备振动或内部电弧等原因,会产生特定频率和幅值的声音。因此,通过对变压器声纹信号进行分析,可以准确地识别故障类型和位置,实现对设备的故障诊断和状态监测。

关于电力变压器声纹信号故障检测的研究主要集中在两个方向:特征提取和故障识别。特征提取是指通过对声纹信号进行数学处理和分析,提取出能够表示声音特征的参数或特征。常用的特征包括频域特征(如能量、幅度谱等)、时域特征(如时长、过零率等)和小波变换特征等。而故障识别则是利用机器学习、深度学习等方法,将提取的特征与故障模式进行匹配,识别出异常信号,从而实现故障的自动检测。然而,目前的故障诊断方法往往需要大量的手动标记样本来进行监督学习,这限制了其在实际应用中的灵活性和可扩展性。

目前的变压器声纹信号故障诊断的主流技术有基于机器学习和深度学习的方法,基于聚类的K最近邻算法(K-means)、主成分分析(PCA)算法、随机森林(RF)、支持向量机(SVM)等机器学习方法被应用在故障诊断中,但这些方法往往依赖于特征提取效果的好坏,在使用这些方法进行分类诊断之前,需要进行特征提取,而手动提取峰峰值、方差、频谱等特征的方法并不能很好的适用所有的场景,并且人为提取的方式较复杂繁琐,有一些学者提出傅里叶变换或者小波变换的方式进行特征提取,然而这些方法需要针对不同的场景人为设定不同的适用的小波基函数等参数,泛化能力较弱。当信号存在噪声的时候,机器学习方法方法并不能很好的学习数据分布特点,对带噪信号的非线性拟合效果较差,以至于在测试集中效果不佳。深度学习越来越多的应用在解决复杂的非线性拟合的问题上,对于变压器故障分类,有人提出神经网络的方法,对已有数据集进行学习,检测未知样本并分类出故障信号,但由于实际情况中,声纹信号我们并不能提前获取,所以很多基于先验数据进行有监督学习的神经网络方法并不具有泛化性。长短期记忆神经网络(LSTM)作为循环神经网络的一种变种,具有可以更好处理长序列具有依赖的问题,同时可以对变压器中异常的长序列进行检测,但由于本身结构的复杂性和训练中循环的特点,硬件化较困难,本发明采用改进后的LSTM网络进行序列预测,可以更好的解决应用难的问题。

因此,提出一种电力变压器声纹信号故障无监督检测方法,来解决现有技术存在的困难,是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种电力变压器声纹信号故障无监督检测方法,用于解决现有技术中存在的技术问题。

为了实现上述目的,本发明提供如下技术方案:

一种电力变压器声纹信号故障无监督检测方法,包括以下步骤:

S1、利用传感器采集每一个电力变压器声纹信号,通过与传感器连接的读取电路将基于时序的声纹信号进行提取和收集,并组成样本集S;

S2、定义一个窗口,使用窗口对样本集S中的每一个序列样本进行滑动切片处理,得到切片后的样本集S’;

S3、对切片后的样本集S’采用密度峰值算法,得到一个序列作为密度中心;

S4、以S3得到的序列作为中心点,使用基于K近邻聚类方法,找到中心点最近的K个邻居,邻居和中心点共同组成训练样本集X;

S5、构建由自动编码器网络AEN和门控循环单元GRU以及全连接神经网络NN组成的AE-GRUNN模型,将训练样本集X作为自动编码器网络的输入和输出进行训练,得到训练后的自动编码器,将编码器部分提取出来,输出低维稀疏表示序列样本集X’,即提取出自动编码器网络的瓶颈层向量;

S6、将低维稀疏表示序列样本集X’作为门控循环单元GRU以及全连接神经网络NN组成的GRUNN模型的输入和目标输出,对构建的GRUNN模型进行训练,得到训练后的GRUNN模型;

S7、将低维稀疏表示序列样本集X’输入GRUNN模型中并输出预测序列;

S8、通过预测序列和GRUNN模型的目标输出计算异常分数scr值,得到待测样本中所有样本的异常分数集A;

S9、使用3-sigma法则排除异常分数集A中的异常点,2-4个周期提取出新的待测声纹信号,重复S5-S6,得到新的异常分数集。

可选的,S1具体为:

样本集S={s

可选的,S2具体为:

S21、定义窗口的长度范围为win=30~300;

S22、将滑窗的起始位置设为序列的开始位置;

S23、取样本集S的第1个样本时间序列,以滑窗大小为单位,从序列的起始位置开始,逐步移动滑窗,并将每个滑窗切分出来;

S24、重复S23,取第2~num个样本时间序列,最后切片后样本组成得到训练样本集S’={S_win

可选的,S3具体为:

S31、定义S’={S_win

S32、计算S’中任意两个序列之间的欧式距离d

d

其中,d

S33、计算每一个序列的局部密度:

其中,截断距离d

S34、统计局部密度,取局部密度最大的序列样本作为密度中心,密度中心序列为S_t

po=arg maxρ

其中,po为局部密度最大的序列的序号,argmaxρ

可选的,S5具体为:

自动编码器网络的输入层神经元数量为训练样本集X中序列的长度win,隐层的神经元数量范围为10~500,瓶颈层的神经元数量的范围为n=12~256。

可选的,S8中计算异常分数scr值,公式为:

其中,y

可选的,S9中的3-sigma法则具体步骤为:

S91、计算异常分数集A的平均值和标准差;

S92、计算异常分数集A的所有scr值,当scr值大于平均值加3倍标准差或小于平均值减3倍标准差时,判定该scr值对应的序列为异常序列,即异常声纹信号。

经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种电力变压器声纹信号故障无监督检测方法,其有益效果是:通过使用聚类算法的思想,让模型自动寻找训练集而无需人为定义,从而实现无监督训练,并通过密度聚类得到的数据集作为训练集可以更好的揭示序列的特征,从而更适合后面网络的训练;设计自动编码器网络AEN结合门控循环单元GRU和全连接神经网络的模型,用自动编码器网络AEN提取出的特征更能揭示序列的变化特性,该方法避免了针对不同特点的数据分别定义提取函数的缺点;最后设计结构简单的AE-GRUNN模型,预测效果更好,漏报率和误报率都得到较低的结果,全程实现了无监督的模型学习方式和简单的预测网络模型结构,可以在后续更好的硬件化并进行实际场景的应用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明提供的一种电力变压器声纹信号故障无监督检测方法的流程图;

图2为本发明提供的AE-GRUNN检测模型结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1所示,本发明公开了一种电力变压器声纹信号故障无监督检测方法,包括以下步骤:

S1、利用传感器采集每一个电力变压器声纹信号,通过与传感器连接的读取电路将基于时序的声纹信号进行提取和收集,并组成样本集S;

S2、定义一个窗口,使用窗口对样本集S中的每一个序列样本进行滑动切片处理,得到切片后的样本集S’;

S3、对切片后的样本集S’采用密度峰值算法,得到一个序列作为密度中心;

S4、以S3得到的序列作为中心点,使用基于K近邻聚类方法,找到中心点最近的K个邻居,邻居和中心点共同组成训练样本集X;

S5、构建由自动编码器网络AEN和门控循环单元GRU以及全连接神经网络NN组成的AE-GRUNN模型,将训练样本集X作为自动编码器网络的输入和输出进行训练,得到训练后的自动编码器,将编码器部分提取出来,输出低维稀疏表示序列样本集X’,即提取出自动编码器网络的瓶颈层向量;

S6、将低维稀疏表示序列样本集X’作为门控循环单元GRU以及全连接神经网络NN组成的GRUNN模型的输入和目标输出,对构建的GRUNN模型进行训练,得到训练后的GRUNN模型;

S7、将低维稀疏表示序列样本集X’输入GRUNN模型中并输出预测序列;

S8、通过预测序列和GRUNN模型的目标输出计算异常分数scr值,得到待测样本中所有样本的异常分数集A;

S9、使用3-sigma法则排除异常分数集A中的异常点,2-4个周期提取出新的待测声纹信号,重复S5-S6,得到新的异常分数集。

具体的,S5中的自动编码器网络由编码器和解码器组成。

具体的,使用3-sigma法则排除异常点,使得故障声纹信号尽可能全部检测出来,当变压器运行的过程中存在新的故障也可以及时的进行检测,得到较低的误报率和漏报率。

进一步的,S1具体为:

样本集S={s

进一步的,S2具体为:

S21、定义窗口的长度范围为win=30~300;

S22、将滑窗的起始位置设为序列的开始位置;

S23、取样本集S的第1个样本时间序列,以滑窗大小为单位,从序列的起始位置开始,逐步移动滑窗,并将每个滑窗切分出来;

S24、重复S23,取第2~num个样本时间序列,最后切片后样本组成得到训练样本集S’={S_win

具体的,S23中滑窗的移动步长为1,表示每次滑动1个数据点,得到第1个样本时间序列的切片后样本S_win

进一步的,S3具体为:

S31、定义S’={S_win

中N为对num个序列切片后得到的序列总数,S_t

S32、计算S’中任意两个序列之间的欧式距离d

d

其中,d

S33、计算每一个序列的局部密度:

其中,截断距离d

S34、统计局部密度,取局部密度最大的序列样本作为密度中心,密度中心序列为S_t

po=arg max ρ

其中,po为局部密度最大的序列的序号,argmaxρ

具体的,S32中距离的计算采用L2范数。

具体的,S4中使用K近邻方法进行聚类,以S_t

进一步的,S5具体为:

自动编码器网络的输入层神经元数量为训练样本集X中序列的长度win,隐层的神经元数量范围为10~500,瓶颈层的神经元数量的范围为n=12~256。

具体的,自动编码器(AEN)的结构为:1层输入层,6层隐层,1层输出层;

各层从输入到输出神经元数量分别为200,100,80,64,80,100,200,其中输入层和随后连接的三个隐层组成编码器,神经元数量200,100,80,64;

其中提取瓶颈层就是64长度的序列,AEN的超参数选择通过网格搜索和10折交叉验证来得到,最后得到隐层的激活函数均选择线性整流函数(ReLu),输入层、输出层无激活函数,反向传播优化器选择Adam优化器,训练批次选择256,训练次数5000。

具体的,S6中GRUNN的输入时间为低维稀疏表示序列样本集X’中的序列前一部分长度,区间为12~256,特征定义为1维,门控循环单元GRU内神经元数量区间为20~100,输出接全连接神经网络,其中神经元数量区间1~20,即序列后一部分的长度。

具体的,门控循环单元GRU的结构中,神经元数量30;

将长度为64的低维稀疏表示序列样本集X’中的序列分为序列前一部分和序列后一部分,长度分别为60和4。门控循环单元GRU输入长度为60的序列前一部分,输出接全连接神经网络,全连接神经网络的神经元数量4,也就是序列后一部分。通过AE-GRUNN模型,长度为64的序列中,前60个点来预测后4个点的值。

AE-GRUNN模型的超参数选择通过网格搜索和10折交叉验证来得到,最后得到激活函数均选择线性整流函数(ReLu),全连接神经网络作为输出,无激活函数,反向传播优化器选择Adam优化器,训练批次选择256,训练次数为5000。

进一步的,S8中计算异常分数scr值,公式为:

其中,y

进一步的,S9中的3-sigma法则具体步骤为:

S91、计算异常分数集A的平均值和标准差;

S92、计算异常分数集A的所有scr值,当scr值大于平均值加3倍标准差或小于平均值减3倍标准差时,判定该scr值对应的序列为异常序列,即异常声纹信号。

在一个具体的实施例中:

参见图2所示,展示了预测模型的结构,首先通过聚类算法得到训练集,之后用该训练集先训练好AEN模型,提取出瓶颈层后,将序列分为前一部分和后一部分,对GRUNN模型进行训练,最后形成一个完整的可以预测序列的AE-GRUNN模型,待测序列首先经过AEN中的编码器部分,然后分割序列后经过GRUNN模型,让分割出的后一部分真实值和预测值计算异常分数,最终3-sigma法则得到异常信息,从而达到无监督训练模型,检测异常信号的功能。

下表展示了待测样本中,模型检测的性能指标,TP为真正例。表示模型正确地将正样本标记为正样本的数量。FP为假正例,表示模型错误地将负样本标记为正样本的数量。TN为真负例,表示模型正确地将负样本标记为负样本的数量。FN为假负例,表示模型错误地将正样本标记为负样本的数量。准确率acc、精确率prec、误报率FRR、漏报率MRR公式如下:

acc=(TP+TN)/(TP+FP+TN+FN)

prec=TP/(TP+FP)

FRR=FP/TN+FP

MRR=FN/FN+TP

表1.性能指标

可以看到,该发明检测异常信号的准确率较高,达到98.2%,同时具有较低的误报率和漏报率,分别为1.88%、1.5%,表明模型对正常数据的误判较少,能够准确地将正常数据与异常数据区分开来,并且模型能够捕获大部分异常数据,很少遗漏真正的异常情况,因此具有较高的检测效率,而二者同时保持较低水平,可以在处理异常数据时具有更高的可靠性。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种变压器局部放电信号分类装置及故障检测装置
  • 基于无监督深度学习的变压器异常声纹预警方法
  • 一种基于多频段自监督的变压器声纹异常检测方法
技术分类

06120116500411