掌桥专利:专业的专利平台
掌桥专利
首页

一种基于文本和语义嵌入的旋转机械复合故障识别方法

文献发布时间:2023-06-19 18:32:25


一种基于文本和语义嵌入的旋转机械复合故障识别方法

技术领域

本发明涉及故障诊断技术领域,具体涉及一种基于文本和语义嵌入的旋转机械复合故障识别方法。

背景技术

随现代制造业快速发展,加速大尺寸机械装备批量化生产。旋转机械是机械装备中最为关键的部件之一,在长期的运转下,很容易发生退化磨损甚至失效。如果对于失效部件缺乏及时的维护,失效部位将会进一步扩大,单一故障也会因此演化为复合故障,导致整个机械设备停机甚至出现伤亡事故。旋转机械复合故障诊断是非常具有前景的技术,可以有效确保机械装备的安全运行,降低维护成本和经济损失。

目前,故障诊断技术主要包括两类:

基于模型与基于数据驱动的方法,其中,基于模型的方法可以精确地预测设备故障,但前提是开发的模型可以精确地描述一台老旧设备的退化特征。然而,机械设备实际的退化过程受多种因素的影响,如其他机械部件或设备的工作环境等。退化损伤过程中的非线性、随机性以及动态变化等特征给基于模型的方法带来了大量的不确定参数。而基于数据驱动的方法,能够准确追踪机械装备真实的退化过程,并精确预测设备的退化状态。基于数据驱动的故障诊断方法主要包括三个连续的阶段,即数据处理、特征提取和故障识别。相应的发展过程也可以概括为两个关键的历史阶段,即传统的基于统计特征的故障诊断技术和基于机器学习的智能故障诊断技术。通过传统诊断技术需要结合专家知识和先进的工程师经验来完成这个选择,而选择的特征决定了整个技术的诊断效果,因此该技术在故障诊断应用中难以得到全面的应用。

基于机器学习的智能诊断技术可以通过模型的自学习与自训练过程来实现旋转机械设备的故障诊断,该过程不需要人为的参与,而且学习的特征与人的理解不同,通过抽象特征的方式表征设备故障退化信息。但是在该技术的应用过程中,主要聚焦于对已有的故障类型进行诊断分析,即需要诊断的故障形式虽然多样,但是形式是已知的。这与实际情况并不完全相符,因为在机械设备退化过程中,损伤退化存在很多不确定因素,会产生很多位置的故障类型,比如具有多种单一故障特征的复合故障。而在基于已有故障类型数据来预测诊断未知的复合故障类型的数据过程中,现有的解决技术并不多,依然面临巨大的挑战。

发明内容

本发明提出了一种基于文本和语义嵌入的旋转机械复合故障识别方法,通过已有故障类型数据来预测诊断未知的复合故障类型。

为实现上述目的,本发明提供了如下的技术方案:

一种基于文本和语义嵌入的旋转机械复合故障识别方法,包括以下步骤:

采集旋转机械设备单一故障状态下振动信号的时域信号和频域信号作为训练集;

构建深度卷积神经网络模型,通过深度卷积神经网络模型提取时域信号的文本信号特征;构建第一双全连接层,所述第一双全连接层为两个全连接层的网络模型,通过第一双全连接层提取频域信号的语义特征;将文本信号特征和语义特征进行差值融合,获得融合特征;构建第二双全连接层,根据融合特征通过第二双全连接层输出故障识别结果;

通过训练集进行多次迭代训练;

采集待识别的旋转机械设备振动信号的时域信号和频域信号;通过训练后的深度卷积神经网络模型、第一双全连接层和第二双全连接层获得旋转机械设备复合故障的识别结果。

优选地,所述采集旋转机械设备单一故障状态下振动信号的时域信号和频域信号,包括以下步骤:

对每个采样数据进行整理,使用尺寸为1024的滑窗对采样的时序数据进行分割,获得相同格式的样本集合并保存;

根据每个样本所来自的设备,分别生成对应的标签对:

式中,

优选地,还包括:

通过快速傅里叶变换获得频域信号,其包括以下步骤:

对振动信号的时域信号进行快速傅里叶变换,获得时域信号的频域特征,快速傅里叶变换表述为:

式中,

优选地,还包括:

对时域数据和频域数据进行z-score归一化处理,确保所有数据均位于[0,1]之间,从而消除因极端值或者量纲导致偏差;

数据归一化的表达式为:

式中,

优选地,所述深度卷积神经网络模型包括:依次连接的三组卷积模块和一个全连接层,三组所述卷积模块通过前向传播的方式连接;每组所述卷积模块包含一个卷积层、一个激活层和一个池化层。

优选地,所述通过深度卷积神经网络模型提取时域信号的文本信号特征,包括以下步骤:

对于每个卷积模块的输入,通过卷积层运算进行数据特征提取,公式如下:

式中,

将卷积层的输出特征输入到激活层进行非线性运算,具体的函数关系式为:

式中,

将激活层输出的高维特征通过池化运算获得低维特征表达,表达式如下:

式中,

在输入数据经过三个卷积模块的特征提取后,继续输入到全连接层,提取数据的全局特征,其表达式为:

式中,

优选地,还包括:

三个全连接层的参数要求为:

其中,

优选地,所述将文本信号特征和语义特征进行差值融合,包括以下步骤:

式中,

将进行差值融合后的特征输入到双全连接层,通过soft-max函数输出最终预测结果;所述双全连接层包括两个连接的全连接层。

优选地,还包括:

模型的训练过程使用交叉熵作为损失函数,其定义为:

其中,

将损失函数作为目标值,使用自适应矩估计更行网络模型参数。

本发明的有益效果:

本发明提出一种基于文本和语义嵌入的旋转机械复合故障识别方法,通过对已知故障类型数据进行处理,获得数据的文本特征和语义描述,然后对复合故障数据进行同样的处理,获得复合故障的语义描述。建立深度学习模型,提取复合故障语义与单一已知故障语义之间的相关联系,实现对复合故障类型的识别,本发明能够准确实现对旋转机械设备复合故障诊断的目的,从机械设备单一故障信息,获取多样故障形式的诊断结果。该方法通过对文本特征和语义描述的差值融合处理,获取了准确的故障特征,同时加强了单一故障和复合故障的相关联系,通过单一已知故障训练模型,即可获得复合故障的识别模型。

附图说明

图1是本发明实施例的一种基于文本和语义嵌入的旋转机械复合故障识别方法的流程图;

图2是本发明实施例的一种基于文本和语义嵌入的旋转机械复合故障识别方法的数据样本生成示意图;

图3是本发明实施例的一种基于文本和语义嵌入的旋转机械复合故障识别方法的基于文本和语义输入的神经网络结构;

图4是本发明实施例的一种基于文本和语义嵌入的旋转机械复合故障识别方法的测试数据预测结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例1

本发明的一种基于文本和语义嵌入的旋转机械复合故障识别方法,具体步骤如图1-4所示:

S1:搭建轴承实验台,分别使用正常轴承、单一故障轴承和复合故障轴承进行测试实验。通过在测试轴承外圈上安装振动加速度传感器,采集不同测试轴承的振动数据。加速度传感器设置的采样频率为5000Hz。

S2:对每个采样数据进行整理,使用尺寸为1024的滑窗对采样的时序数据进行分割,获得相同格式的样本集合并保存;

根据每个样本所来自的设备,分别生成对应的标签对:

式中,

S3:采集旋转机械设备复合故障状态下的振动信号的时域信号,并通过快速傅里叶变换获得频域信号:

对振动信号的时域信号进行快速傅里叶变换,获得时域信号的频域特征,快速傅里叶变换表述为:

式中,

对时域数据和频域数据进行z-score归一化处理,确保所有数据均位于[0,1]之间,从而消除因极端值或者量纲导致偏差;

数据归一化的表达式为:

式中,

S4:构建深度卷积神经网络模型,通过训练后的深度卷积神经网络模型提取时域信号的文本信号特征:

深度卷积神经网络模型包括三组卷积模块和一个全连接层,三组卷积模块通过前向传播的方式连接;每组卷积模块包含一个卷积层、一个激活层和一个池化层;

深度卷积神经网络模型的特征提取,包括:

对于每个卷积模块的输入,通过卷积层运算进行数据特征提取,公式如下:

式中,

将卷积层的输出特征输入到激活层进行非线性运算,可以提高数据的表达效果,提升模型特征提取性能,具体的函数关系式为:

式中,

将激活层输出的高维特征通过池化运算获得低维特征表达,该运算过程可以有效降低信息冗余,提升模型的尺度不变性和旋转不变性,防止过拟合。在本发明中应用的池化运算为最大池化,表达式如下:

式中,

在输入数据经过三个卷积模块的特征提取后,继续输入到全连接层,提取数据的全局特征,其表达式为:

式中,

S5:构建包含两个全连接层的网络模型,通过训练后的网络模型提取频域信号的语义特征:

三个所述全连接层的参数要求为:

其中,

式中,

S6:将文本信号特征和语义特征进行差值融合,获得融合特征:

式中,

将进行差值融合后的特征输入到新建立的全连接层,通过soft-max函数输出最终预测结果。

S7:根据融合特征,通过全连接层输出旋转机械设备复合故障的识别结果。

进一步,使用训练集数据训练模型参数,目的在于学习单一故障的文本和语义特征。模型的训练过程使用交叉熵作为损失函数,其定义为:

其中,

训练数据通过S4-S5所述的详细流程,深层抽象特征被逐步提取。将损失函数作为目标值,使用自适应矩估计(ADAM)更行网络模型参数。以降低损失函数值为目标,通过反复迭代训练提高模型的学习能力,最终获得训练好的模型。

本实施例中:

为了验证本发明提出的旋转机械故障诊断算法的有效性,采集六种不同类型的轴承在运行过程中的振动加速度数据,所有测试轴承均在载荷为4Nm,转速为300rpm的工况下进行实验采集的数据按照S1-S3中的方式进行处理,并获得格式为[1024,1,1]的时域样本数据集,格式中的第一、二位数为样本的维度,第三位数表示样本的通道数,即特征类别数。建立基于文本和语义嵌入的旋转机械复合故障识别方法。对时域数据进行快速傅里叶变换获得对应的频域数据特征,分别将时域数据定义为文本信息,频域数据定义为语义信息,并将归一化后的数据分别输入到对应的模型分支中,通过逐层前向传播方式提取输入数据的敏感故障特征。实验所构建的基于文本和语义嵌入的网络模型如图3所示,包含由三个卷积模块和一个全连接层组成的卷积网络,每个卷积模块包含一个卷积层、一个激活层、一个池化层。以及一个由两个全连接层组成的语义特征学习模型。

图4为使用实验数据测试模型所得到的结果的混淆矩阵图。图中的对角线为预测结果准确率,非对角线为预测结果错误率。实验使用三种单一故障轴承和三种复合故障轴承进行试验。可以看出单一故障类型轴承和复合故障类型轴承的识别准确率均为100%。试验结果表明,所提模型能够精确实现旋转机械复合故障诊断,能够满足该模型对于旋转机械复合故障诊断的要求。

以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于语义增强与多层次标签嵌入的短文本分类方法
  • 一种基于语义增强与多层次标签嵌入的短文本分类方法
技术分类

06120115600112