掌桥专利:专业的专利平台
掌桥专利
首页

基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法

文献发布时间:2023-06-19 19:30:30


基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法

技术领域

本发明涉及故障诊断技术领域,尤其是基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法。

背景技术

齿轮箱是旋转机械设备中的常用零件,由于其具有传动比大、承载力强以及结构紧密等优点,被广泛应用到航空航天、工业生产及风力发电等领域。而由于其所处工作环境较为恶劣,转速负载经常变化,极易发生各类故障,影响设备正常运行甚至引起安全事故。因此针对齿轮箱的故障诊断方法在提高设备可靠性和减少事故发生方面具有重大价值。

齿轮箱振动信号携带大量反映其故障类别的信息,基于振动信号的故障诊断关键在于对振动信号故障敏感信息的获取。但是故障产生的振动信号变化容易被复杂背景噪声和干扰信号淹没,再考虑到其具有时间多尺度特性,导致特征提取困难。且由于变化工况下原始振动信号中故障敏感信息分布与训练集工况下的信号有所差异,不同故障特征之间产生混叠,信号的非线性程度产生变化,导致变工况诊断较为困难。因此,如何挖掘多层次、非线性和非平稳振动信号的故障敏感特征是齿轮箱故障诊断的首要问题。

近年来,深度学习算法常被用于从大规模数据中自动获取更深层次的抽象特征,其中卷积神经网络由于其突出的特征提取能力,在预测分类领域得到了广泛关注。针对振动信号的多层次特性,利用不同尺度卷积核成为一种有效的特征提取方法。然而传统的拼接方法只是对多尺度特征进行机械组合,造成信息冗余,增加网络训练难度的同时降低了诊断精度。因此需要更有效的特征融合策略。

发明内容

本发明人针对上述问题及技术需求,提出了基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法,本发明的技术方案如下:

一种基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法,包括如下步骤:

步骤一:获取齿轮箱不同故障模式下的振动信号,振动信号为一维时序数据;

步骤二:将采集到的样本按照预设比例分为训练集、验证集与测试集,包括:利用相同大小的滑动窗口截取一维时序数据获得样本,并根据实际故障类型设置各样本标签;按照预设比例将所得样本划分成训练集、验证集与测试集;

步骤三:构建基于自注意力机制的多尺度特征融合故障诊断模型;

基于自注意力机制的多尺度特征融合故障诊断模型包括并行的低频特征提取通路及局部时域特征提取通路、特征融合网络及分类网络;

低频特征提取通路和局部时域特征提取通路均包括卷积层、池化层及批归一化层,输入为齿轮箱原始振动信号,通路各包括三层卷积结构,输出为大小相同的特征向量;低频特征提取通路采用大卷积核,局部时域特征提取通路采用小卷积核;特征融合网络包括多头自注意力(MHSA)模块、改进的卷积自注意力(CBAM)模块及批归一化层;分类网络包括池化层、全连接层和Softmax分类器,利用平均池化以降低特征维度,防止过拟合,采用一层全连接及Softmax分类器进行故障特征分类;CBAM模块的激励函数选用Sigmoid,模型其余激活函数均选用Relu;

步骤四:将训练集输入构建的故障诊断模型进行训练;

训练时先将训练集中的有标签样本输入至故障诊断模型得到预测输出,再与真实的标签计算交叉熵损失然后使用Adam优化器反向传播优化网络参数,直到训练损失稳定到设定值以下或达到迭代次数;

步骤五:将待检测振动信号样本按照一定长度进行截取,输入步骤四中训练完成的故障诊断模型,得到故障诊断结果。

其进一步的技术方案为,在步骤二中:

滑动窗口的大小为1024,截取方式为随机截取;训练集、验证集与测试集比例为6:3:1,样本标签设置为0,1,...,C,C为齿轮箱故障种类数,训练集批量输入至故障诊断模型进行训练。

其进一步的技术方案为,在步骤三中:

低频特征提取通路结构包括依次相连的第一卷积层—第二卷积层—第一池化层—第三卷积层—自适应池化层一,局部时域特征提取通路结构包括依次相连的第四卷积层—第二池化层—第五卷积层—第三池化层—第六卷积层—第四池化层;针对一维齿轮箱振动信号输入,各卷积层使用一维卷积神经网络;第一至第四池化层采用最大池化;自适应池化层一按照给定输出维度对输入进行平均池化,自适应池化层一用于维度修整;各卷积层与MHSA模块之后均引入批归一化层调整协变量偏移,改善训练性能;对于批量输入的样本x

其中,μ和σ

其进一步的技术方案为,在步骤三中:

MHSA模块利用不同参数下的投影进行基于相似度的振动信号融合特征学习;MHSA模块具有三个同维输入,分别为查询矩阵Q、键矩阵K和值矩阵V,将低频特征提取通路输出的低频特征向量分别作为Q、K输入,为主要特征;将局部时域特征提取通路输出的局部时域特征向量作为V输入,为辅助特征;主要特征和辅助特征分别经过多次线性投影进行注意力计算,计算公式为:

/>

其中,d

CBAM模块通过将注意力映射沿特征向量的通道与空间两个独立的维度注入;在通道注意力中,采用压缩输入特征映射的空间维度的方法;在空间注意力中,沿着通道维度进行平均池化和最大池化,并将它们连接起来以描述特征信息;通过分配各自注意力权重,对输入的特征向量进行自适应特征细化,进一步学习故障敏感信息;CBAM模块的输入为MHSA模块的输出,输入前经过批归一化处理,CBAM模块的数学模型如下:

M

M

其中,F为MHSA模块输出的特征向量,M

其进一步的技术方案为,该方法还包括:

由于本文使用一维卷积通路进行特征提取,则对空间注意力进行改进,改进后的1D-CBAM模块的空间注意力与原通道注意力相同,均使用并行全连接层替代卷积操作,相比于卷积核的局部连接,全连接结构具有全局感受野,能在整体上进行注意力权重分配;同时为了防止Sigmoid函数引起梯度衰减,在MHSA模块输出与主要特征输入之间引入残差连接,则改进后的1D-CBAM模块的空间注意力的数学模型更新为:

M

特征融合网络首先利用MHSA模块对输入的多尺度特征进行初步融合,捕捉故障信息联合对应关系,在MHSA模块输出与主要特征输入间引入残差连接,强调低频特征的作用;其次经批归一化调整协变量偏移,提高模型训练性能;最后通过CBAM模块突出融合特征故障敏感部分,且输出与输入同维,提高了信息表达能力。

其进一步的技术方案为,在步骤三中:

分类网络结构包括依次相连的Flatten层—自适应池化层二—全连接层

—Softmax分类器;自适应池化层二用于降低融合特征维度,防止过拟合;Softmax分类器是一种监督学习分类器,输出为一维特征向量,向量各位置的值对应该故障种类的概率;假设训练集的样本总量为N、分为C个类别,记第i个样本的预测输出为y

其中,w

其进一步的技术方案为,在步骤四中:

交叉熵损失函数与Softmax分类器组合使用以计算预测类别与故障类别的差异程度,以最小化损失函数为目标进行反向传播更新模型内部参数,交叉熵损失函数的数学表达式如下:

其中:n为该类故障的样本数;d

Adam优化器是是一种可以替代传统随机梯度下降过程的一阶优化算法,能够加快网络收敛,防止模型陷入局部最优。Adam优化器的迭代过程如下:

式中,m

由于Adam优化器在训练后期会出现极端学习率,影响模型收敛,因此需对学习率进行动态裁剪,给定学习率的上下界,稳定后期模型收敛。

本发明的有益技术效果是:

1)本申请提出的基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法,通过多尺度特征提取方法和有效的特征融合策略,能够很好的从齿轮箱原始振动信号中提取故障敏感信息进行故障诊断;

2)通过嵌入改进后的自注意力机制进行特征融合,解决传统多尺度模型直接进行Concat导致特征信息冗余,影响模型分类性能的问题,输入特征维度与融合特征维度相同,提高了特征信息表达能力;以频域特征为主,局部时域特征为辅的特征融合策略,能有效适应工况变化的齿轮箱运行环境,模型具有一定的跨域诊断性能;

3)本申请能够通过构建的故障诊断模型,无需借助传统的信号处理技术对输入进行预处理,即可自动获取底层故障特征,突出故障敏感信息,最后直接输出齿轮箱的故障类别,实现端到端的故障智能诊断。

附图说明

图1是本申请提供的齿轮箱故障诊断方法的流程图。

图2是本申请提供的多尺度特征提取原理图。

图3是本申请提供的基于自注意力机制的多尺度特征融合网络的示意图。

图4是本申请提供的基于自注意力机制的多尺度特征融合故障诊断模型的结构图。

具体实施方式

下面结合附图对本发明的具体实施方式做进一步说明。

本申请提供了一种基于自注意力机制的多尺度特征融合(以下简称MSC-MHSA-CBAM)的齿轮箱故障诊断方法,如图1所示,该方法的具体实施方式包括以下步骤:

步骤一:通过信号采集设备获取齿轮箱不同故障模式下的振动信号。

具体的,加速度计负责收集一段时间内齿轮箱侧面振动信号的变化,并通过数据线输入到计算机中进行保存,得到一维时序数据的信号样本,记录当时的齿轮箱故障模式。实验平台由驱动电机、控制器、行星齿轮箱、平行齿轮箱和制动器组成。其中,电机类型为3相、3HP电机,其电源为三相交流电(230V、60/50Hz)。在行星齿轮箱上预制了四种行星齿轮失效模式和四种轴承失效模式。齿轮故障包括齿面磨损、缺齿、根裂、齿断裂。轴承故障包括球形故障、内圈故障、外圈故障和上述三个轴承故障的混合故障。因此,在正常状态下,共采集了9种振动信号。

步骤二:根据采集的原始振动信号样本划分训练集、验证集与测试集。

具体的,使用随机滑窗的方式对一维振动数据进行截取,截取长度为1024,每个故障类型下训练集选取240个样本,验证集选取120个样本,测试集选用40个样本,在输入模型前对样本集合进行打乱操作。

步骤三:构建MSC-MHSA-CBAM故障诊断模型。

采用Pytorch深度学习框架搭建模型。MSC-MHSA-CBAM模型包括多尺度特征提取网络、特征融合网络及末端分类网络三个部分。多尺度特征提取网络包括低频特征提取通路及局部时域特征提取通路,针对齿轮箱振动信号,多尺度特征提取网络的原理如图2所示,构建不同尺度的卷积通路提取原始振动信号的周期性低频特征和局部时域细节特征,初步提取信号不同层次的故障特征;再利用自注意力机制构建特征融合网络,如图3所示,捕捉故障敏感信息;最后通过池化全连接分类网络输出预测标签。MSC-MHSA-CBAM模型整体结构如图4所示。

步骤四:将训练集样本批量输入至MSC-MHSA-CBAM故障诊断模型进行训练,根据在验证集上的诊断性能调整模型参数。

本实施例设置批量大小为64,Adam优化器初始学习率与动态裁剪的上限均为0.01,下限为0.001,训练上限为3000次。通过最小化交叉熵损失函数以更新内部参数,直到训练损失稳定到设定值以下或达到迭代次数。通过经验以及反复实验调整模型批量大小、学习率及网络参数,保存最终模型,参数设定如表1所示。

表1MSC-MHSA-CBAM模型参数

步骤五:将验证集输入到训练完成的齿轮箱故障诊断模型中进行在线故障诊断,得到诊断结果,验证模型故障诊断性能。

以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

技术分类

06120115938972