掌桥专利:专业的专利平台
掌桥专利
首页

一种基于双注意力机制的变压器故障诊断方法

文献发布时间:2024-04-18 19:58:53


一种基于双注意力机制的变压器故障诊断方法

技术领域

本发明涉及故障诊断的技术领域,尤其涉及一种基于双注意力机制的变压器故障诊断方法。

背景技术

变压器作为旋转机械的关键部件,因其长时间工作在重负载、高旋转的环境下,极易发生故障而影响设备正常运行,从而造成不必要的经济损失,为了保证旋转机械正常运行,对变压器进行早期故障诊断是有必要的。然而变压器中类似轴承等早期损伤通常特征微小且难以察觉,因此对变压器故障诊断步骤、故障特征提取方法的研究成为国内外热点。

随着人工智能技术的引入,变压器故障诊断的可靠性和自动化程度大大提高。传统机器学习方法对于预测准确率具有一定的效果,但是对于大样本分类计算量大,耗时久。为此故障诊断也从传统方法转向深度学习方法,深度学习的方法能够直接处理原始数据,越来越多的研究人员用深度学习的方法来进行分类。现有的深度学习方法虽然能直接处理原始数据,但是忽略了变压器故障信号的时序性,如果要兼顾时序性就无法满足故障诊断快速响应的需求,学习速度较慢并且准确率也不够满足要求。

申请号为202210639082.9的发明专利公开了一种基于注意力机制和卷积NN的变换器故障诊断方法,包括以下步骤:建立双有源桥变换器的仿真模型,并选取漏感电流、原边桥任一桥臂中点电压和副边桥任一桥臂中点电压为故障诊断信号,根据发生故障的功率开关器件位置对双有源桥变换器故障状态进行分类编码,并收集变换器在不同开路故障下的诊断信号作为原始数据样本集;利用卷积操作构建多分支特征提取模块,将原始数据样本集中的多个诊断信号分别输入多每个分支中,提取诊断信号的故障特征,得到故障特征图;利用注意力机制结合软阈值函数构建去噪模块,将多分支特征提取模块提取的诊断信号特征输入到去噪模块中消除诊断信号中的噪声特征,得到去噪特征图;利用注意力机制构建特征融合模块,根据注意力机制得到的每个特征图的通道重要性融合多分支去噪特征图,得到融合特征图;将得到的融合特征图输入到分类器中,构建多分支卷积神经网络故障诊断模型;将采集的原始数据样本集分为训练集和测试集,利用训练集对多分支卷积神经网络故障诊断模型进行训练,利用测试集对训练后的故障诊断模型进行测试;将待诊断数据输入训练后的多分支卷积神经网络故障诊断模型输出最终的分类结果,实现对双有源桥变换器的故障诊断。上述发明利用注意力机制构建故障诊断模型,去除了诊断信号中的噪声并融合了多诊断信号的故障特征,有效提高了诊断准确度,且利用卷积神经网络进行诊断,提高了诊断的智能化。但是,上述发明在变压器负载变动情况下效果不太明显,稳定性及泛化能力还可以提升。

发明内容

针对传统变压器故障诊断方法面对多分量、强噪声的情况下特征提取困难,诊断准确度较差的技术问题,本发明提出一种基于双注意力机制的变压器故障诊断方法,解决了传统机器学习方法故障预测准确率低和速度慢的缺陷,提高了故障诊断的准确率且提高了诊断速度。

为了达到上述目的,本发明的技术方案是这样实现的:一种基于双注意力机制的变压器故障诊断方法,其步骤如下:

步骤一:用经验模态分解将原始故障信号进行分解,通过对本证模态函数集分量的选取消除表示非线性和非平稳信号的杂散谐波,得到不同频段的IMF分量;

步骤二:根据力学的重心计算方法类似得出信号重心的计算方法筛选出与原始故障信号相关性较强的IMF分量进行信号重构,对重构之后的信号序列用注意力卷积神经网络进行空间特征提取;

步骤三:在长短期记忆递归神经网络的隐藏层增加时间特征注意力机制提取时序特征,按照对本时刻的影响将不同历史时刻的时序特征赋予不同的时间注意力权值,得到综合时序信息特征,应用全连接层对变压器状态进行分类。

优选地,所述步骤一中原始故障信号x(t)经过经验模态分解之后的结果为:

式中,第i个IMF

优选地,所述经验模态分解的方法为:

(1)确定原始故障信号x(t)的所有极大值点、极小值点,采用三次样条插值法拟合所得到的极大值点和极小值点分别形成上包络线y

(2)原始故障信号x(t)减去平均包络线avg

(3)判断差值信号h

(4)从原始故障信号x(t)中分离出包含高频信号成分的第1个IMF分量,得到信号序列:R

其中,R

(5)将信号序列R

优选地,所述信号重构的方法为:利用相关系数γ先筛选出与原始信号序列相关性较强的IMF分量进行信号重构;将IMF函数按顺序相加并添加残余函数,形成重构的原始故障信号。

优选地,计算给定信号序列重心作为相关系数:

其中,X=(x

优选地,所述注意力卷积神经网络由两个卷积模块和一个空间注意力机制构成,其中卷积模块的卷积层用来提取空间特征,空间注意力机制自适应赋予不同特征不同权值,实现对不同空间特征加权;采用空间注意力机制代替池化层,利用注意力机制对空间特征进行权值分配达到对特征进行重要度区分;利用空间注意力机制将对分类任务贡献较小的空间特征赋予较小的权重,对分类任务贡献度较大的特征赋予较大的权重,将得到的权值与卷积模块提取的空间特征进行加权得到最终的空间特征。

优选地,所述注意力卷积神经网络的计算方法为:重构后的原始故障信号即信号序列特征向量

将注意力权重向量x′

得到经过注意力机制加权之后的空间特征向量

式中,⊙表示哈达玛积。

优选地,经过空间注意力机制之后的空间特征向量y

优选地,在长短期记忆递归神经网络的隐藏层增加时间特征注意力机制,首先对所有输入向量X=[x

优选地,所述时间特征注意力机制的输入为LSTM网络迭代到t时刻学习到的时序特征

式中,

使用软计算最大值函数对时间特征注意力权重向量α

其中,

将时间特征注意力权值与各历史时刻的时间特征进行加权得到综合时序信息特征

将所有的加权之后的综合时序信息特征作为隐藏层状态h′

与现有技术相比,本发明的有益效果:通过经验模态分解方法将含有噪声的原始信号分解成一系列本征模态函数,接着使用信号重心的计算方法筛选本征模态函数分量进行重构;利用注意力卷积神经网络提取重构信号序列的空间特征,基于长短时记忆网络提取时序特征,利用时间注意力机制度量时间特征的重要性,最后使用软计算最大值层进行故障诊断。本发明能够对变压器故障类型进行精确诊段分类,且抗干扰能力、泛化能力强,本发明在0、1、2、3hp负载情况下变压器轴承诊断的准确率分别为99.64%、99.78%、99.46%、99.68%,均高于1D-CNN、LSTM、1D-CNN-LSTM这三种热门模型。

本发明的创新点如下:

(1)基于经验模态分解的故障信号分解方法:首先应用EMD对信号的分解能力将故障信号进行分解,将任何复杂的数据集分解为有限且通常为少量的本征模态函数集(IMF),通过对IMF分量的选取与重构消除了表示非线性和非平稳信号的杂散谐波。

(2)基于注意力卷积网络的空间特征提取方法:用力学的重心计算方法得出信号重心的计算方法相关系数筛选出与原始故障信号相关性较强的信号序列进行重构,对重构之后的信号序列用注意力卷积神经网络进行空间特征提取,这样可以减少信息损失,保留信号的完整性,降低对故障诊断精度的影响。

(3)双注意力机制变压器故障诊断的学习:用LSTM对时序特征进行提取,在LSTM的隐藏层增加时间特征注意力机制将不同历史时刻的时间信息进行区分,按照对本时刻的影响将不同历史时刻的信息赋予不同的时间注意力权值,最后应用软计算最大值层对变压器状态进行分类。相较于传统神经网络克服了池化层信息丢失的弊端,并且通过注意力机制自适应赋予不同特征不同权值,以突出重要特征的影响,减少或忽略无关特征的影响。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的流程图。

图2为本发明空间特征注意力机制的计算示意图。

图3为本发明时间特征注意力机制的处理示意图。

图4为本发明与现有模型的故障诊断结果对比图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种基于变压器故障的双注意力机制诊断方法,利用注意力卷积神经网络提取重构信号的空间特征,其步骤如下:

步骤一:用经验模态分解(EMD)将原始故障信号进行分解,通过对本证模态函数集分量的选取消除了表示非线性和非平稳信号的杂散谐波,得到不同频段的IMF分量。

对信号进行不同特征尺度的EMD分解的过程如下:

(1)确定原始故障信号x(t)的所有极大值点、极小值点,采用三次样条插值法拟合所得到的极大值点和极小值点分别形成上包络线y

其中,x(t)、y(t)表示随着时间t变化的信号序列,经过差值得到曲线上的点的极大值和极小值,极大值随着时间变化形成上包络线y

(2)原始故障信号x(t)减去平均包络线avg

h

其中,h

(3)判断差值信号h

(4)从原始故障信号x(t)中分离出包含高频信号成分的第1个IMF分量,得到信号序列:

R

其中,R

将信号序列R

此时,可以得到原始故障信号x(t)经过EMD分解之后的结果:

式中,IMF分量包含了原始故障信号x(t)不同频段的频率成分,能够准确反映原始故障信号序列不同尺度的局部特征信息;残余信号分量R

步骤二:根据力学的重心计算方法类似得出信号重心的计算方法筛选出与原始故障信号相关性较强的IMF分量进行信号重构,对重构之后的信号序列用注意力卷积神经网络进行空间特征提取。计算方法可以衡量IMF分量与原始信号的相关性,筛选出与原始信号相关性较强的IMF分量。

给定信号序列重心的计算作为相关系数计算如下:

其中,X=(x

筛选出与原始故障信号相关性较强的IMF分量进行信号重构以消除噪声的影响。将IMF函数按顺序相加并添加残余函数,以形成原始信号。由于EMD分解过程采用自适应方法,因此每个IMF函数内在包含了与其他IMF函数无关的信息,使得重构过程不会造成信息损失。对于重构的故障信号序列采用注意力卷积神经网络进行空间特征提取,注意力卷积神经网络由两个卷积模块和一个空间注意力机制构成,其中卷积模块的卷积层用来提取空间特征,空间注意力机制实现对不同空间特征加权。相比较于传统卷积神经网络,本发明的注意力卷积神经网络克服了池化层信息丢失的弊端并且通过空间注意力机制自适应赋予不同特征不同权值,以突出重要特征的影响,减少或忽略无关特征的影响,注意力卷积神经网络通过空间特征注意力机制实现空间特征提取的过程如图2所示。本发明采用空间注意力机制代替池化层,利用注意力机制对特征进行权值分配来达到对特征进行重要度区分,其工作机制为把卷积块提取的空间特征输送到空间特征注意力机制,利用注意力机制将对分类任务贡献较小的特征赋予较小的权重而不是直接舍去,对分类任务贡献度较大的特征赋予较大的权重,以加强模型对该特征的关注度,将得到的权值与卷积块提取的特征进行加权得到最终的空间特征。与传统的卷积神经网络相比,该注意力卷积网络在突出重要特征的同时保留了信息的完整性。

重构后的原始故障信号为信号序列特征向量

其中,

然后将注意力权重向量x′

其中,

所以可以得到经过注意力机制加权之后的空间特征向量

式中,⊙表示哈达玛积,x

空间特征向量这样计算能能更好的反应特征信息,增加鲁棒性。

步骤三:在长短期记忆递归神经网络(LSTM)的隐藏层增加时间特征注意力机制来提取时序特征,按照对本时刻的影响将不同历史时刻的信息赋予不同的时间注意力权值,最后应用软计算最大值层对变压器状态进行分类。

经过空间注意力机制之后的空间特征向量y

同样,通过时间特征注意力机制挖掘所提取的时间序列特征中各历史时刻信息对当前时刻信息之间的相关性,并根据其贡献度的不同赋予其不同的时间注意力权重,以增强重要时间特征在任务目标中的影响,时序注意力机制的结构图如图3所示。

如图3所示,时序特征注意力机制的输入为LSTM网络迭代到t时刻学习到的时序特征

式中,

同理,使用软计算最大值函数对时间特征注意力权重向量α

其中,

将时间特征注意力权值与各历史时刻的时间特征进行加权得到综合时序信息特征

最后将所有的加权之后的隐藏层状态h′

图4是采用T-分布领域嵌入法(T-SNE)将原始信号特征和经过各模型提取之后的特征进行降维可视化,删除模型不同模块来探究各个模块在特征提取中发挥的作用。消融实验的模型分别为注意力卷积网络、注意力加权的LSTM、1D-CNN-LSTM以及缺少emd降噪的双注意力模型,这些模型除结构不同外其余所有参数设置完全相同。注意力卷积网由于特征提取效果较差导致模型诊断率偏低,诊断准确率仅达到60%。因为对时序特征有较高的敏感度,对空间特征感知不灵敏,LSTM预测准确率仅能够达到87.42%。CNN和LSTM被改进通过注意力机制,加强了模型对重要特征的关注度,因此缺少EMD降噪的双注意力网络诊断率达到了99.24%。然而本文模型的准确率最高,准确率达到了99.57%,并且各模型在训练集每次迭代的时间也有对比1D-CNN耗时最久,预测精度最低,LSTM训练时间最短,然而其却需要更多次的迭代来使模型趋于稳定,且预测精度不足,1D-CNN-LSTM虽然准确率能够达到98.27%,但是其每次迭代需要12.199s,耗时远远超过本发明的模型的4.075s,说明本发明不仅有令人满意的预测精度,训练时间也能满足要求。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于残差学习与注意力机制融合的故障诊断方法
  • 一种基于一维注意力机制和卷积神经网络的旋转机械故障诊断方法
技术分类

06120116513109