掌桥专利:专业的专利平台
掌桥专利
首页

基于频带注意力度量学习的齿轮箱故障诊断方法及系统

文献发布时间:2023-06-19 16:12:48



技术领域

本发明涉及机械故障诊断、模式识别技术等领域,具体为一种基于频带注意力度量学习的齿轮箱故障诊断方法及系统。

背景技术

旋转机械在许多行业中发挥着重要作用,例如航空航天、交通运输和石油化工。在旋转机械的众多部件中,齿轮箱是重要的部件。由于旋转设备运行条件的复杂性,齿轮箱往往在相对恶劣的环境中运行。一旦发生事故,可能造成严重的财产损失,甚至威胁到人员的生命安全。因此,对齿轮箱运行的安全性和可靠性提出了更高的要求,因此对齿轮箱进行更有效的故障诊断具有重要意义。

近年来,受益于计算机技术的不断发展,特别是机器学习的迅速兴起,出现了许多智能故障诊断方法,并受到了故障诊断学者的广泛关注。而探究并建立有效的深度学习故障诊断模型,提取齿轮箱运行状态数据中的重要故障信息,并用于实际运行中齿轮箱的故障诊断具有重要意义。

一方面,注意力机制在深度学习中受到了广泛的关注,它让网络更加关注于部分重要的信息,按照作用维度的不同,可以将注意力分为空间注意力、通道注意力和自注意力,其中,由于简单高效,通道注意力直接对不同的通道加权,成为一种主流的注意力范式。但是通道注意力Squeeze-and-Excitation Networks(SENet)的输入是来自于GlobalAverage Pooling(GAP)所得到的标量。这个标量由GAP对一个通道里的所有元素取其均值得到。但是这个均值并不足以表达不同通道的所有信息,这就导致了经过GAP得到的特征缺乏多样性。

另一方面,为了进一步提取不同类别之间特征的差异性,可以通过度量学习来拉近相同类别样本之间的距离,学习同类样本之间的相似性;通过拉大不同类别样本之间的距离,增大不同类样本的差异性。但是目前主流的度量学习通常聚焦于损失函数,也就是选择合适的类内距离和类间距离进行度量,而忽略了难分样本的存在。

发明内容

针对上述问题,本发明提出了一种基于频带注意力的度量学习齿轮箱故障诊断方法及系统。由于不同频带下的特征表征的信息不同,其重要性存在差异,本发明将提出的频带注意力模块嵌入故障诊断模型的频带注意力学习神经网络,可以有效地避免通道注意力在提取通道特征时的信息丢失;对于相同类别下的各个样本,提出了重要性加权方法,结合度量学习,能够有效地将难分样本挑选出来并加以关注。为了进一步提取不同类别之间特征的差异性,本发明采用了度量学习的思想。度量学习通过拉近相同类别样本之间的距离,学习同类样本之间的相似性;通过拉大不同类别样本之间的距离,增大不同类样本的差异性。但是目前主流的度量学习通常聚焦于损失函数,也就是选择合适的类内距离和类间距离进行度量,忽略了难分样本的存在。

在本发明的第一方面,本发明提供了一种基于频带注意力度量学习的齿轮箱故障诊断方法,所述方法包含以下步骤:

获取齿轮箱的多种故障振动信号,进行小波包分析后生成二维时频数据;

将所述二维时频数据输入到频带注意力度量学习神经网络中,经过第一传输层和第二传输层,得到所有频带特征;

利用通道频带注意力机制模块对多通道的频带特征进行自适应加权处理,从而获得通道频带注意力加权特征;

将所述通道频带注意力加权特征输入到度量加权模块中,对不同类别中同类样本进行自适应加权处理;

将所述通道频带注意力加权特征输入到第三传输层中,经过全连接层预测得到齿轮箱的故障诊断分类结果;

其中,通过对不同类别中同类样本进行加权处理,计算得到类间距离和类内距离;根据类内距离和类间距离得到对当前故障诊断分类结果的加权损失函数,利用加权损失函数训练所述频带注意力学习神经网络。

在本发明的第二方面,本发明还提供了一种基于频带注意力度量学习的齿轮箱故障诊断系统,所述系统包括:

数据采集模块,用于获取齿轮箱的多种故障振动信号;

小波分析模块,用于对获取的故障振动信号进行小波包分析后生成二维时频数据;

频带注意力度量学习模块,用于构建出频带注意力度量学习神经网络,利用二维时频数据对所述频带注意力度量学习神经网络进行训练,通过对不同类别中同类样本进行加权处理,计算得到类间距离和类内距离;根据类内距离和类间距离得到对当前故障诊断分类结果的加权损失函数,利用加权损失函数训练所述频带注意力学习神经网络;以及用于输出齿轮箱的故障诊断分类结果;

所述神经网络包括第一传输层、第二传输层、第三传输层、通道频带注意力机制模块、度量加权模块以及全连接层;

频带特征提取模块,用于调用第一传输层和第二传输层,将所述二维时频数据经过第一传输层和第二传输层,得到所有频带特征;

通道特征提取模块,用于调用通道频带注意力机制模块对多通道的频带特征进行自适应加权处理,从而获得通道频带注意力加权特征;

样本类别处理模块,用于调用度量加权模块,将所述通道频带注意力加权特征中不同类别中同类样本进行自适应加权处理;

故障诊断分类模块,用于调用第三传输层和全连接层,将所述通道频带注意力加权特征输入到第三传输层中,经过全连接层预测得到齿轮箱的故障诊断分类结果。

本发明的有益效果:

1、本发明采用改进的通道频带注意力机制模块替代了原本的通道注意力。通道注意力中采用通道均值作为特征输出,这样会导致通道的特征信息不足,本发明引入频带信息,对通道的不同频带进行加权求和,可以效地效地避免通道注意力在提取通道特征时的信息丢失,提高模型的特征提取能力。

2、本发明采用改进的度量加权模块,在度量学习的基础上,对同类的样本进行自适应重要性加权,能够有效地将难分样本挑选出来并加以关注,在此基础上能够更加有效拉近类内距离,拉大类间距离。

附图说明

图1是本发明实施例中一种基于频带注意力度量学习的齿轮箱故障诊断方法流程图;

图2是本发明实施例中齿轮箱的8种振动信号示意图;

图3是本发明实施例中齿轮箱故障诊断模型即频带注意力度量学习神经网络结构图;

图4是传统的注意力机制结构图;

图5是本发明实施例的通道频带注意力机制模块结构图;

图6是本发明实施例的度量加权模块的结构图;

图7是本发明实施例的一种基于频带注意力度量学习的齿轮箱故障诊断系统架构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是本发明实施例中的一种基于频带注意力度量学习的齿轮箱故障诊断方法流程图,如图1所示,所述方法包括:

101、获取齿轮箱的多种故障振动信号,进行小波包分析后生成二维时频数据;

在本发明实施例中,要针对某一齿轮箱故障数据中的8种故障振动信号进行分析,包括:轴承外圈故障、轴承内圈故障、轴承滚动体故障、齿根缺齿故障、齿根断裂故障,齿轮偏心故障以及正常状态信号。

而对齿轮箱的故障振动信号进行小波包分析生成二维时频数据的过程可以包括如下:

首先接收齿轮箱的一维原始振动信号数据,每次测试的振动信号包含1024个采样点;齿轮箱的8种振动信号分别如图2所示;直观的一维原始振动信号数据无法看出故障问题,因此需要对齿轮箱的振动信号进行小波包分析,得到二维矩阵A;所谓小波包分析,是指将齿轮箱的振动信号分解为两组小波系数,即低频段的近似系数和相对高频段的详细系数。从数学上讲,小波包分析可以使用一系列具有一对低通和高通滤波器的卷积来实现。具体如下,高通滤波器h(·)和具有g(k)=(-1)

其中,

102、将所述二维时频数据输入到频带注意力度量学习神经网络中,经过第一传输层和第二传输层,得到所有频带特征;

在本发明实施例中,可以将得到的小波包二维特征矩阵数据输入深度学习模型VGG中训练故障诊断模型,而故障诊断模型是由频带注意力度量学习神经网络所构成的,如图3所示,所述频带注意力度量学习神经网络包括第一传输层、第二传输层、第三传输层、通道频带注意力机制模块、度量加权模块以及全连接层;其中,每个传输层均包括卷积层、池化层、批量归一化层(BN层)以及激活层。本发明通过前向传播和后向传播的方式完成故障诊断模型的优化,前向传播输入信号直至产生误差,反向传播误差更新权重矩阵。前向传播指数据从输入层即第一传输层开始,依次经过隐藏层最终达到输出层即全连接层的过程,其中数据每经过一层传播,其节点输出的值所代表的信息层次就越高阶和概括,节点中输出的值是通过与其相连的前一层中所有的节点输出值的加权求和处理后的结果。反向传播指复合函数的链式求导法则,前向传播得到结果,产生了误差,对于输出层直接接收到误差的反馈,可以通过梯度下降进行误差的更新。

与传统的故障诊断模型不同的是,本发明改进了通道频带注意力机制模块、度量加权模块,并将这两个改进模块嵌入故障诊断模型中。

在本发明实施例中,所述第一传输层和所述第二传输层均包括卷积层、池化层、批量归一化层以及激活层;这些网络层的设计能够成功提取出二维时频数据的频带特征。

103、利用通道频带注意力机制模块对多通道的频带特征进行自适应加权处理,从而获得通道频带注意力加权特征;

在传统的注意力机制中,如图4所示,通道注意力的标量,由GAP对一个通道C里的所有元素取其均值得到,与下面描述的DCT的第一个通道相等,后续通过全连接层和sigmoid函数将权值赋予通道C。但是这个均值并不足以表达不同通道的所有信息,这就导致了经过GAP得到的特征缺乏多样性。

基于上述分析,本发明实施例中在已知GAP是离散余弦转换(DCT)的一种特殊形式的基础上,在频域上推广了GAP通道注意力机制,使用多个频率分量代替只有最低频的GAP。DCT的基函数如下所示:

式中,i和j是当前特征点所在的第i行第j列的位置,H是指特征图的高,W是特征图的宽,h和w是所选频带的顺序。

考虑到每个频带对特征图通道都有一定的贡献度,因此不应该直接对频带进行选取;如果只选取指定的频带,这样就会导致不同的通道只利用了特定的频带信息,进而导致某些信息的缺失。同时,对所有频带都进行实验之后再挑选最佳频带,在时间复杂度上也是不合理的,会导致大量的运算资源浪费。

因此本发明对将所有频带加权到所有的通道上,但是根据不同频带对通道的贡献存在差异性,加入了自适应的通道频带注意力机制模块,如图5所示,由DCT选取不同的基函数对通道C里进行处理得到,将得到的不同通道的频带权值进行初始化,后续通过全连接层和sigmoid函数提取自适应权值赋予不同通道,让不同通道能够与频带进行一个自适应的权值相乘,进而获取各个频带的信息。

通过二维DCT,就可以得到需要的DCT系数,那么本发明所采用的频道注意力加权方法公式如下:

WDCT=fc(cat([Freq

att=sigmoid(fc(WDCT))

式中,Freq

具体的,对二维时频数据进行离散余弦变换,得到需要的离散余弦变换系数,并确定离散余弦变换的频带;将所有频带按照通道进行拼接,将拼接后的频带特征输入全连接层中处理,得到加权后的离散余弦变换系数,利用激活函数求得每个通道的自适应权值,并根据该自适应权值对频带信息进行处理,获得通道频带注意力加权特征。

本发明将所有频带的信息都用于通道加权,通过初始化随机参数给不同频带进行加权,反向传播进行权值更新。

104、将所述通道频带注意力加权特征输入到度量加权模块中,对不同类别中同类样本进行自适应加权处理;

在传统的度量学习中,通过拉近相同类别样本之间的距离,学习同类样本之间的相似性;通过拉大不同类别样本之间的距离,增大不同类样本的差异性。但是目前主流的度量学习通常聚焦于损失函数,也就是选择合适的类内距离和类间距离进行度量,忽略了难分样本的存在。

基于上述分析,本发明发现了传统度量学习中存在的不足,所以提出了自适应重要性加权度量模块,想要对同类的样本进行自适应重要性加权,能够有效地将重要的样本筛选出来并加以关注,同时能够有效拉近类内距离,拉大类间距离。

本发明实施例中,根据当前迭代过程中分类损失最小的样本和分类损失最大的样本,计算得到自适应的类内距离加权系数;通过K-means聚类方法得到每一分类的聚类中心,并将其作为锚样本点,计算出每个锚样本点之间的距离,得到样本集的类间距离;将每个分类中的所有样本和对应的锚样本点之间的距离求和取均值,并将所述类内距离加权系数与该均值之间的积作为类内距离。

其具体实现过程如下所述:

通过对不同类别中同类样本进行加权,可以有效地将难分样本筛选出来并加以关注,inW是类内距离加权系数,inW如下所示:

其中,本发明对当前迭代(epoch)计算所有样本的分类损失,并将其进行保存,l

得到类内距离加权系数之后,本发明对当前批次(batch)的数据,通过K-means方法找到每类的聚类中心,将其作为锚样本点,再计算出每个锚样本点之间的距离,就可以得到整个样本集的类间距离。而样本集的类内距离可以通过每个类中的所有样本和对应的锚样本点之间的距离求和取均值得到。为了拉远不同类别之间的距离,将类间距离作为分母加入损失函数中,当类间距离越大时,损失便越小。通过上述方法便可以达到一个度量的效果。

计算类间距离和类内距离的公式如下:

类间距离D

其中,N是类别总数,||·||是二范数;类间距离中,i是任意类别的锚样本点,j是当前类别的锚样本点;||D

类内距离D

其中,M是当前类别的样本总数,||·||是二范数;类内距离中,n是当前类别的任意样本,m是当前类别的锚样本点;||D

得到类内距离和类间距离后,可以得到对当前样本的加权损失函数,如下:

其中,C是类别数,P是每个类别中的样本数。通过对不同类别中同类样本进行加权处理,计算得到类间距离和类内距离;根据类内距离和类间距离得到对当前故障诊断分类结果的加权损失函数,利用加权损失函数训练所述频带注意力学习神经网络,当所述频带注意力学习神经网络训练完成后,即可直接对齿轮箱的故障振动信号的故障情况进行分类诊断。

图6所示为本发明的度量加权模块。首先计算不同类别的类间距离和相同类别的类内距离,通过保存的loss值对所有样本进行排序,认为loss较大的样本为难分样本,最后通过类内加权函数对难分样本进行加权。通过上述计算,本发明将当前batch中损失较大的,也就是难分样本筛选出来,并通过自适应重要性加权方法,增大难分样本的损失,达到了难分样本重点关注的作用。

105、将所述通道频带注意力加权特征输入到第三传输层中,经过全连接层预测得到齿轮箱的故障诊断分类结果;

在本发明实施例中,将所述通道频带注意力加权特征输入到第三传输层中,利用第三传输层能够进一步提取出分类特征,将该分类特征输入至全连接层中,即可得到该通道频带注意力加权特征所对应的故障诊断分类结果。

图7是本发明实施例中的一种基于频带注意力度量学习的齿轮箱故障诊断系统,所述系统包括:

201、数据采集模块,用于获取齿轮箱的多种故障振动信号;

202、小波分析模块,用于对获取的故障振动信号进行小波包分析后生成二维时频数据;

203、频带注意力度量学习模块,用于构建出频带注意力度量学习神经网络,利用二维时频数据对所述频带注意力度量学习神经网络进行训练,通过对不同类别中同类样本进行加权处理,计算得到类间距离和类内距离;根据类内距离和类间距离得到对当前故障诊断分类结果的加权损失函数,利用加权损失函数训练所述频带注意力学习神经网络;以及用于输出齿轮箱的故障诊断分类结果;

204、所述神经网络包括第一传输层、第二传输层、第三传输层、通道频带注意力机制模块、度量加权模块以及全连接层;

205、频带特征提取模块,用于调用第一传输层和第二传输层,将所述二维时频数据经过第一传输层和第二传输层,得到所有频带特征;

206、通道特征提取模块,用于调用通道频带注意力机制模块对多通道的频带特征进行自适应加权处理,从而获得通道频带注意力加权特征;

207、样本类别处理模块,用于调用度量加权模块,将所述通道频带注意力加权特征中不同类别中同类样本进行自适应加权处理;

208、故障诊断分类模块,用于调用第三传输层和全连接层,将所述通道频带注意力加权特征输入到第三传输层中,经过全连接层预测得到齿轮箱的故障诊断分类结果。

在本发明实施例中,所述第一传输层、所述第二传输层以及所述第三传输层均包括卷积层、池化层、批量归一化层以及激活层。

机械设备故障诊断的目的是对故障类型进行分类,其本质是模式识别问题。为了验证本发明在机械故障诊断中的应用效果,通过某一齿轮箱故障数据来说明本方法的有效性,可以采用任意一种齿轮箱试验台。本发明可以用于包括但不限于齿轮箱在内的机械故障诊断。

本发明实施例选用转速20hz-40hz、载荷为0HP、采样频率为12000Hz的中间轴的8种变转速齿轮箱故障振动信号进行分析,包括:外轴承外圈故障、轴承内圈故障、轴承滚动体、齿根缺齿故障、齿根断裂故障,齿轮偏心,正常状态。训练数据共取900个,测试数据共取5500个。将训练数据均分为3组,每组300个数据,每次训练随机取其中两组。测试数据全部取完。每组数据重复2次,共进行了18次实验。实验同VGG网络,只采用了频带注意力的VGG网络(VGG_F)和只采用了度量损失的VGG(VGG_M)网络进行对比,实验结果如表1所示。

表1本发明与VGG,VGG_M,VGG_F,SENet对应的平均准确率

表1展示了5种故障诊断模型最后的模式识别准确率。从表中可以看出,本模型的模式识别准确率最高,经典的卷积神经网络VGG效果最差,主要原因是模型特征提取模块为原始的神经网络,数据在高维空间中的真实分布无法得到充分反映;VGG_M在VGG的基础上,加入了样本重要性自适应加权模块,提高了难分样本的重要性,因此提高了VGG的精度;SENet作为原始通道注意力网络,对不同通道加入了加权的概念,也能提高模型的准确性;VGG_F在SENet的基础上,引入了频带信息,通过自适应加权将不同的频带嵌入了通道中,能够有效地获取多样地特征信息,较通道注意力的效果有一定提升;本发明将VGG_M和VGG_F进行了融合,能够有效地结合两者优势,实验结果证明了提出的方法的合理性。因而本发明在机械故障诊断中是具有很好的应用背景。

在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 基于频带注意力度量学习的齿轮箱故障诊断方法及系统
  • 元度量学习驱动的直升机行星齿轮箱故障诊断方法
技术分类

06120114741242