掌桥专利:专业的专利平台
掌桥专利
首页

一种LSTM-E轴承故障识别模型训练方法

文献发布时间:2023-06-19 09:52:39


一种LSTM-E轴承故障识别模型训练方法

技术领域

本发明涉及振动检测技术领域,具体涉及一种LSTM-E轴承故障识别模型训练方法。

背景技术

轴承是机械设备中承载旋转类部件的核心承重零件,以滚动轴承为典型代表。在机械设备工作过程中,多变的冲击载荷可能使得轴承出现故障问题,并且随着机械设备的使用,前述故障的严重性逐步增大并可能造成连锁性故障;正因为如此,及早发现轴承的故障十分重要。

目前,用于诊断轴承故障的方法有时域分析方法、频域分析方法和深度学习方法;时域分析方法通过测量的振动信号的时域波形进行统计分析而获得始于统计指标;时域统计指标包括信号的最大值、均方根值、峭度指标、峰值指标等;因为微小故障的振动信号特征很弱,采用时域统计指标并不能有效地挖掘故障信息和故障特性;频域分析方法通过对振动信号进行傅里叶变换、希尔伯特变换等方法处理获得频域信号后,再通过功率谱分析、包罗解调谱分析、倒谱分析或者谱峭度分析方法识别故障类型。

现有的深度学习方法有基于神经网络的LSTM轴承故障识别模型进行预测,但该种预测方法的准确率较低,为此我们提供了一种更加较为准确的轴承故障识别模型训练方法。

发明内容

本发明所要解决的技术问题在于:如何解决现有的基于神经网络的LSTM轴承故障识别模型进行预测,但该种预测方法的准确率较低的问题,提供了一种LSTM-E轴承故障识别模型训练方法。

本发明是通过以下技术方案解决上述技术问题的,本发明包括如下步骤:

S1、数据搜集:通过批量搜集凯斯西储大学公开轴承数据集中多种不同参数情况下的轴承频率数据;

S2、数据集的制作和处理:分别对收集到的轴承频率数据进行预处理和标准化,并标注对应数据标签;

S3、建立LSTM-E诊断模型:对处理过的多个轴承频率数据分别利用基于LSTM-E神经网络建立局部诊断模型;

S4、模型训练判别:数据基于LSTM原理和多层感知机模型层层拟合,构建损失函数和优化器,不断自更新权重,对局部诊断模型输出的诊断结果进行概率值估计并得到最终判别结果;

S5、验证数据集:在CWRU轴承数据集上验证模型性能。

进一步,所述步骤S1中,通过批量搜集凯斯西储大学公开轴承数据集中多种不同参数情况下的轴承频率数据,情况分别为在电机近似转速为1797r/min,电机载荷为0的固定前提下,分别在故障直径为0.1778mm、0.3556mm、0.5334mm的时候取内圈故障,滚动体故障和外圈相对位置符合区的轴承频率数据。

进一步,所述步骤S2中,分别对收集到的轴承频率数据进行预处理和标准化,并标注对应数据标签,具体包括以下几个步骤:

S2-1、分别对S1中搜集到的不同参数下的轴承频率数据设置2个信号周期,每个信号周期10类信号,每个类别1000个数据;

S2-2、标注对应信号的标签;

S2-3、基于原始数据的均值和标准差对数据集进行Z-score标准化,将所有数据都压缩在0附近,方差为1的区间内便于反向求导自更新计算;

S2-4、对训练集和验证集采样顺延实现数据增强;

S2-5、设置训练集、验证集、测试集比例分别为70%、20%、10%。

进一步,所述步骤S3和S4中,所述LSTM-E轴承故障识别模型由keras框架搭建,网络结构为6层结构:包括输入层、16个堆叠的LSTM-e层、一个由relu激活函数构成的activation层、一个由32个感知机组成的全连接层、一个抑制率为0.2的dropout层和一个softmax分类激活层,所述每个LSTM-e层包括32个LSTM记忆体细胞,并行接受相同的数据,每个神经元以不同的权重输出,将每一层的每个LSTM记忆神经元输出结果累加求reduce-mean并用tanH函数激活得到一个LSTM-e层输出结果,该层输出结果作为下一个LSTM-e的输入,如此循环,最后一个LSTM-e层的结果由activation层中的relu激活函数激活,经32个感知机的全连接层的提取特征,dropout层使20%的感知机随机失活,输出结果为softmax分类层的输入,最后由softmax分类层归一概率最大化输出模型判断结果。

进一步,将S2-5中已经划分好的10%的测试集数据输入至LSTM-E模型。

本发明相比现有技术具有以下优点:

1、本申请在凯斯西储大学公开轴承数据集下的验证准确率达到100%。

2、本申请网络模型中神经网络层数精炼,参数量较少。

3、本数据集将有限的样本数据经过数据预处理,添加了有益噪声(高斯白噪声),使得训练好的网络具有一定的泛化能力。

4、Z-score-lg使得样本数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。

附图说明

图1是本发明的整体结构图。

具体实施方式

下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

如图1所示,本实施例提供一种技术方案:一种LSTM-E轴承故障识别模型训练方法,包括如下步骤:

S1、数据搜集:通过批量搜集凯斯西储大学公开轴承数据集中多种不同参数情况下的轴承频率数据;

S2、数据集的制作和处理:分别对收集到的轴承频率数据进行预处理和标准化,并标注对应数据标签;

S3、建立LSTM-E诊断模型:对处理过的多个轴承频率数据分别利用基于LSTM-E神经网络建立局部诊断模型;

S4、模型训练判别:数据基于LSTM原理和多层感知机模型层层拟合,构建损失函数和优化器,不断自更新权重,对局部诊断模型输出的诊断结果进行概率值估计并得到最终判别结果;

S5、验证数据集:在CWRU轴承数据集上识别正确率可达100%。

所述步骤S1中,通过批量搜集凯斯西储大学公开轴承数据集中多种不同参数情况下的轴承频率数据,情况分别为在电机近似转速为1797r/min,电机载荷为(马力)0的固定前提下,分别在故障直径为0.1778mm、0.3556mm、0.5334mm的时候取内圈故障、滚动体故障和外圈相对位置符合区(中心位置在6点方向)的轴承频率数据。

所述步骤S2中,分别对收集到的轴承频率数据进行预处理和标准化,并标注对应数据标签,具体包括以下几个步骤:

S2-1、分别对S1中搜集到的不同参数下的轴承频率数据设置2个信号周期,每个信号周期10类信号,每个类别1000个数据;

S2-2、标注对应信号的标签(one-hot编码);

S2-3、基于原始数据的均值和标准差对数据集进行Z-score-lg标准化(Z-score-lg:对样本数据张量做两次lg(以10为底)运算,即:x=lg(x)运算,输出结果用(x-均值)/方差将数据标准归一化,(其中,Z-Score通过(x-μ)/σ样本数据转化为无单位的Z-Score分值,使得数据标准化统一,提高了数据可比性,削弱了数据解释性)经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:

其中,μ为所有样本数据的均值,σ为所有样本数据的标准差将所有数据都压缩在0附近,方差为1的区间内便于反向求导自更新计算;

S2-4、对训练集和验证集采样顺延实现数据增强;

S2-5、设置训练集、验证集、测试集比例分别为70%、20%、10%。

所述步骤S3和S4中,所述LSTM-E轴承故障识别模型由keras框架搭建,网络结构为6层结构:包括输入层、16个堆叠的LSTM-e层、一个由relu激活函数构成的activation层、一个由32个感知机组成的全连接层、一个抑制率为0.2的dropout层和一个softmax分类激活层,所述每个LSTM-e层包括32个LSTM记忆体细胞,并行接受相同的数据,每个神经元以不同的权重输出,将每一层的每个LSTM记忆神经元输出结果累加求reduce-mean并用tanH函数激活得到一个LSTM-e层输出结果,该层输出结果作为下一个LSTM-e的输入,如此循环,最后一个LSTM-e层的结果由activation层中的relu激活函数激活,经32个感知机的全连接层的提取特征,dropout层使20%的感知机随机失活,输出结果为softmax分类层的输入,最后由softmax分类层归一概率最大化输出模型判断结果。该部分的函数模型表达式为:

输入门:

遗忘门:

细胞体:

输出门:

一个细胞输出:

其中,

1.神经元的输入用a表示,输出用b表示;

2.w

3.下标ι,φ和ω分别表示输入门、遗忘门、输出门;

4.c下标表示细胞体,从细胞体到输入、遗忘、输出门的peephole(结构变体)权重分别记做w

5.s

6.控制门的激活函数用f表示,g,h分别表示lstm细胞的输入输出激活函数;

7.I表示输入层的神经元的个数,K是输出层的神经元个数,H是隐层细胞的个数。

32个神经元的并行输入输出(每一个神经元与对应随机权重相乘,得到一个LSTM-e层的输出):

k

第一层的LSTM-e的y(输出)作为下一层的LSTM-e的x(输入)层,经过16层LSTM-e层,经过relu(x)得到最后一层的y,再将y作为全连接层的x,经过全连接层;

y=w*x+b

得到全连接层的y,再经过dropout层:

Dropout数学模型(0.2失活率):

经过softmax层激活,预测最大值概率为输出结果;

y=arg max(p(y=c|x));

将S2-5中已经划分好的10%的测试集数据(将上述中的x样本输入改为划分好的10%的测试集数据)输入至上述LSTM-E模型,得到输出结果准确率达到100%。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 一种LSTM-E轴承故障识别模型训练方法
  • 一种电网线路故障识别模型训练方法
技术分类

06120112338085