掌桥专利:专业的专利平台
掌桥专利
首页

一种基于改进WGAN网络的轴承故障诊断方法

文献发布时间:2024-04-18 19:53:33


一种基于改进WGAN网络的轴承故障诊断方法

技术领域

本发明涉及一种轴承故障诊断方法,尤其涉及一种基于改进WGAN网络的轴承故障诊断方法。

背景技术

随着旋转机械在自动化中的发展,其中轴承起到了关键作用。目前轴承广泛用于航天、航海等智能制造领域,但大多数轴承所处工作环境较为恶劣,振动和冲击等极易造成轴承损伤影响设备的正常运行。为了避免轴承发生故障造成严重影响,亟需对轴承在使用过程的损伤程度进行故障判断,利于操作人员对轴承故障进行排查。

为了解决原始GAN存在模式崩塌、梯度消失和无法识别是否收敛情况,本专利提出改进Wasserstein距离生成对抗网络(Wasserstein Generative Adversarial Networks),该网络主要由生成器(Generator)和鉴别器(Discriminator)组成,但鉴别器不在是传统模型,而是由R-FCN网络代替,通过不断迭代训练生成器和鉴别器,实现二者相互博弈,使训练得到的鉴别器无法判断生成器生成数据真假。此时,得到诊断模型为最优模型。

目前,WGAN主要用于增强数据、图像处理、语音识别和故障诊断等领域。CN114037001基于WGAN和度量学习的机械泵小样本故障诊断方法,通过按类扩充数据,并结合度量网络结合残差思想和空间自适应结构实现特征映射,实现故障分类;CN114781447提出一种基于生成对抗网络和三维卷积神经网络齿轮箱诊断方法,该方法将改进的生成对抗网络WGAN与三维卷积神经网络结合的WGAN-3DCNN提取扩充数据集特征,并识别故障类型;CN113536697 A提出一种基于改进残差网络和WGAN的轴承剩余寿命预测方法,该方法在变工况和强噪声干扰下,采集轴承在不同工况下的原始振动信号,实现目标域和源域中序列的共同的特征空间,再通过全连接神经网络实现轴承的寿命预测;CN 110428004 B提出一种数据失衡下基于深度学习的机械零部件故障诊断方法,该方法通过扩充样本数据至原始故障样本数据中,实现数据平衡,再利用卷积神经网络进行特征提取和故障分类,实现机械零部件的故障诊断。以上方法大都通过数据增强的方法扩充WGAN网络所需的数据量,并在不同程度上实现WGAN网络在故障诊断中的作用,但未从生成器和鉴别器自身模型及超参数选择、损失函数和无监督学习等角度进行优化,导致无法获取优越的生成器和鉴别器模型,导致WGAN无法提取深层次数据信息,进而无法精准判断轴承运行状态。

因此,亟待解决上述问题。

发明内容

发明目的:本发明的目的提供一种基于改进WGAN网络的轴承故障诊断方法,该方法优化了WGAN模型和超参数,强化了数据利用率,提高了模型准确性和诊断精度。

技术方案:为实现以上目的,本发明公开了一种基于改进WGAN网络的轴承故障诊断方法,包括如下步骤:

(1)加速度传感器的选取与安装,

(2)采集样本轴承运行过程中的振动信号并对样本信号进行处理,

(3)构建改进WGAN诊断模型,利用该模型实现轴承故障诊断和故障分类,具体步骤为:

(3.1)搭建生成器模型并生成虚假信号,

(3.2)采用R-FCN网络模型代替原来鉴别器模型,获取改进WGAN诊断模型,

(3.3)Hyperopt优化改进WGAN诊断模型超参数,

(3.4)采用半监督学习指导改进WGAN诊断模型中生成器和鉴别器训练,

(3.5)优化后改进的WGAN诊断模型实现轴承故障诊断,

(4)采集待测轴承运行的全生命周期振动信号并对振动信号进行处理,将处理后的振动信号以时频图形式输入改进WGAN诊断模型,以获取待测轴承的诊断精度和故障类型。

其中,步骤(1)中将加速度传感器安装在齿轮箱的驱动端,将加速度传感器安装在齿轮箱驱动端表面9时和12时方向,且加速度传感器安装位置相对垂直。

优选的,步骤(2)的具体步骤为:

(2.1)设置采样参数,采样参数包括采样频率f=f′、采样时长t=t′和采样间隔Δt=Δt′,对轴承所受加速度信号进行采样,采集轴承运行过程中的样本数据;

其中,样本数据由人为故障注入获取,主要包括正常轴承和故障轴承,故障轴承包括6种不同类型故障的轴承;7种轴承分配情况为:样本轴承1为损伤直径为R

(2.2)将步骤(2.1)中采样结果以数值形式输出并保存,轴承在高速运转时,驱动端的加速度传感器将采集到加速度振动信号,采集到加速度振动信号通过模数转换器进行转换,转换后的加速度振动信号按照桥式电路放大输出振动信号值;最后将每次采样输出的数值以CSV格式保存,分别对两种不同方向的采样点进行采样,9时方向加速度振动信号放置在CSV文件第一列,12时方向加速度振动信号放置在CSV文件第二列,保存为1.CSV,以此类推,完成数据保存;

(2.3)步骤(2.2)中数据进行分割处理,若一个CSV文件中有N个数据,取前N/1000个数据为一组,以此类推,逐个遍历CSV文件,共得到N

(2.4)对步骤(2.3)中获取的N

(2.5)采用独热编码对步骤(2.4)中数据集按照训练集和测试集分别为80%和20%进行标签处理,利用0和l表示运行数据的故障状态,即使用N位寄存状态器N种状态进行编码,设置1000为正常状态,0100为轻微故障状态,0010为中度故障状态,0001为重度故障状态;并利用反独热编码表示输出类型,其中输出值为0代表正常状态,输出值为1代表轻微故障状态,输出值为2代表中度故障状态,输出值为3代表重度故障状态。

再者,步骤(3.1)中搭建生成器网络模型的具体步骤如下:

(3.1.1)采用二维卷积层作为网络输入,输入端为随机噪声数据,经批量标准化处理实现数据归一化,再采用LeakyRule激活函数激活大量神经元,并依靠神经元间的计算提取深层次特征,最后利用tanh激活函数作为网络输出;

(3.1.2)将设置的具有独热编码标签的随机噪声输入至生成器中,经过生成器自身网络结构训练生成器生成虚假信号;

(3.1.3)利用改进的CWT对随机噪声生成的虚假信号进行处理,以生成所需的时频图。

进一步,步骤(3.2)中搭建R-FCN网络模型为改进WGAN网络的鉴别器模型,利用鉴别器模型对步骤(3.1)中生成器生成图片进行判断,并输出生成器和鉴别器损失函数及改进WGAN模型的诊断精度,具体步骤如下:

(3.2.1)利用O个二维卷积层Conv2D、P个Batch Normalizaztion层、Q个LeakyRule激活函数及ResNet101网络组成鉴别器输入端网络,在通过1个Conv2D得到初始特征图,再对其进行Conv2D操作,最终得到去除冗余图像特征的新特征图;

(3.2.2)通过区域提议网络RPN获取新特征图中对应的感兴趣区域边缘框,并利用每个RoI边缘框分别获取步骤(3.2.1)中新特征图中的特征;再通过每个RoI边缘框区域的r,s,t,u来确定位置敏感区域的坐标信息,r,s,t,u为边缘框坐标位置,依据该方法得到每个子区域,最终由每个RoI实现特征的分类和回归;

其中,RPN网络是Faster R-CNN中的RPN层,主要用于Faster-RCNN网络提取边缘框;由于提取R-FCN网络中边缘框耗时耗力,因此,在引入卷积神经网络后,采用的二维卷积层以特征提取的形式选择边缘框的位置从而降低了计算时间,在此发明中RPN网络可较快的提取R-FCN网络中的边缘框;

(3.2.3)在每个子区域上利用池化操作寻找合适的响应值,依据RoI边缘框大小设置最小响应值为S,最大响应值为T,若响应值在[S,T]之间,则表示该特征为所需特征;反之,去除该特征,继续寻找合适特征直至找到所有特征;直到获取整张图片中的特征;

(3.2.4)将步骤(3.2.3)中每个RoI得到的特征按照获取边缘框的大小映射至新特征图,得到位置敏感区域,即通过池化操作得到响应值在[S,T]之间的特征区域,其中,得分映射大小,即位置敏感区域获取的边缘框大小,为K*K*(C+1)和4*K*K维,再利用卷积池化操作对新特征图上的位置敏感区域进行特征提取,并将提取结果经全连接层输出;

(3.2.5)将步骤(2.5)中带有标签的真实训练集输入至搭建好的鉴别器模型进行训练,再将步骤(3.1)中生成器生成图片输入至R-FCN中进行训练,利用鉴别器损失函数和生成器损失函数进行判断,如果鉴别器鉴别结果为真,同时生成器损失函数和鉴别器损失函数下降,当两者最终趋于拟合并接近时,达到纳什平衡,表明诊断模型满足要求,则训练结束;再利用softmax函数分类得到带有独热编码标签的故障类型,并输出随迭代次数变化生成器和鉴别器模型的损失函数曲线和改进WGAN网络模型诊断精度曲线;如果鉴别器判断结果为假,则进行步骤(3.2.6);

(3.2.6)训练结果为假时,则表示生成器生成图片效果不好,鉴别器无法正确判断图片真假,生成器模型未达到预期效果,则采用控制变量法控制鉴别器模型及其超参数来优化生成器模型,将鉴别器的模型参数固定,不断迭代优化生成器的模型参数,当鉴别器判断结果为真时,则生成器模型达到最优,此时鉴别器和生成器模型优化效果最优,效果最优就是当生成器和鉴别器损失函数下降,且两者最终趋于拟合并接近时,停止迭代,以此获取改进WGAN诊断模型;其中在获取改进WGAN诊断模型时,其迭代次数为epochs,学习率为Lr,批量大小为Batch_size;

这里的控制变量法就是保持鉴别器模型和参数不变,去优化生成器;

(3.2.7)利用测试集对步骤(3.2.5)中获取的改进WGAN诊断模型进行测试;若鉴别器可以判断生成器生成图片真假,且鉴别器损失函数和生成器损失函数缓慢降低至拟合,不在出现陡坡式的跳跃性波动,即不存在梯度消失或崩塌现象,则停止迭代,输出生成器和鉴别器损失函数和模型训练精度,得到改进的WGAN诊断模型。

优选的,步骤(3.2)中为进一步提高改进WGAN诊断模型的诊断速度,对R-FCN网络中Resnet101网络进行层数优化,分别选取R

再者,步骤(3.3)由于改进WGAN网络模型仍存在较多网络结构和众多超参数,会影响生成器生成能力和鉴别器的鉴别能力,为实现深层次信号的特征提取,提高诊断精度,利用自动调参优化鉴别器模型达到优化改进WGAN模型目的,具体步骤如下:

(3.3.1)初始化网络超参数,获取待优化的卷积核大小、隐藏神经元个数、池化因子等参数组成初始参数集F

其中,初始化参数集F

(3.3.2)建立目标函数,目标函数作为评估先验模型的基础,用于计算更新优化函数的后验概率,得到最优超参数组合;采用交叉熵损失函数作为目标函数,公式如下:

式中,B为样本数,C为类别数,τ

(3.3.3)将步骤(3.3.1)中的初始参数F

(3.3.4)将步骤(3.3.3)数据集A中的第一组数据用于验证集上判断模型是否满足要求;具体可依据模型的超参数组合表达式判断,若鉴别器损失函数迭代趋于拟合,则该组超参数满足要求;反之,进行步骤(3.3.5),公式如下:

I

式中,H(i)为最小化的目标函数;I

设置最小目标函数H(i)≤£时,满足超参数选取要求;

(3.3.5)利用数据集A建立高斯回归模型,通过高斯回归模型不断迭代计算更新损失函数,修正概率模型;

为在高斯分布中获取最优超参数,可利用极大似然估计法,其表达式如下:

式中,K为协方差矩阵;f为前n个样本的后验概率;θ为所选超参数,θ=log

(3.3.6)使用采集函数G

其中,步骤(3.3.6)中采集函数是由当前数据集的后验分布构造,通过最大化采集函数来选取下一组超参数,采集函数公式如下:

G

式中,x为训练集,μ(x)、δ(x)分别为目标函数联合后验分布的均值函数和协方差函数;β为调节参数,可用来调整采样点的选取;

(3.3.7)判断是否满足模型精度要求,若满足,则确定超参数F

得到改进WGAN模型的最优网络超参数,进而实现Hyperopt优化改进WGAN诊断模型的目的,再利用步骤(3.2.6)实现生成器和鉴别器双重优化,获取优化后的改进WGAN诊断模型。

进一步,步骤(3.4)中为解决大多数WGAN网络无监督学习模型不仅需要大量样本数据,还存在样本标注困难问题;通过更改鉴别器和生成器损失函数,实现半监督学习,目的在于使WGAN网络学习器不依赖外界交互、自动利用未标记样本来提升学习性能,具体步骤如下:

(3.4.1)构建半监督学习中鉴别器的损失函数,

首先,构建WGAN网络的监督学习损失函数,公式如下:

式中,E为数学期望,u,v~P

其次,构建WGAN网络的无监督学习损失函数,公式如下:

式中,D(u)为判别器对真实数据u的评估,G(z)为生成数据,Z为随机噪声,u~P

最后,构建改进WGAN网络模型的鉴别器(L

进一步地,为提高鉴别器损失函数精确度,将监督学习和半监督学习损失函数权值c归一化处理并乘以权值尺度因子α,则更新后的损失函数表达式如下:

(3.4.2)改进WGAN网络半监督学习中生成器(L

/>

(3.4.3)利用步骤(3.3)中优化好的网络模型为基础,训练步骤(3.1)中生成的具有独热编码标签的生成图片和用样本标签率代替整体训练样本标签的真实图片,样本标签率为θ

(3.4.4)对步骤(3.4.3)中的训练结果进行判断,通过不同的样本标签率进行训练分别得到相应准确率£

优选的,步骤(3.5)中具体改进的WGAN整体诊断流程如下:

(3.5.1)将随机噪声(Z)和步骤(3.4)中具有独热编码的样本标签率输入步骤(3.3)优化后的生成器模型中,经过生成器自身网络结构训练生成虚假信号;

其中,随机噪声Z需满足RGB格式且像素与时频图大小相同;

(3.5.2)利用上述改进的CWT对信号进行连续小波变换使其得到标准的时频图,使其更加具备‘欺骗’鉴别器能力;

(3.5.3)将步骤(3.5.2)得到的时频图输入至步骤(3.3)优化后的R-FCN鉴别器网络模型,同时将训练集输入至鉴别器中,经鉴别器迭代训练,判断步骤(3.5.2)输入的时频图是否为真,如果为真,则鉴别器和生成器损失函数达到拟合效果,输出随迭代次数变化生成器和鉴别器的损失函数曲线、改进WGAN网络模型的诊断精度曲线及独热编码标签的故障类型;反之,固定鉴别器参数,不断迭代更新生成器参数,直至生成器生成数据鉴别器无法判断是真是假,最终得到改进WGAN网络模型,再将测试集输入改进WGAN网络模型中进行验证;

(3.5.4)通过Hyperopt优化方法得到诊断模型最优超参数组合,进而优化改进WGAN模型;

(3.5.5)为验证半监督学习是否可以在优化后的改进WGAN网络模型中实现故障诊断,利用不同样本标签率代替整体样本标签输入改进WGAN网络模型进行训练,并输出不同样本标签率的诊断精度。

再者,步骤(4)的具体步骤如下:

(4.1)获取轴承全生命周期运行数据,并将数据以CSV格式保存;

(4.2)将步骤(4.1)中CSV格式的数据通过频谱信号分析获取时间-振幅关系图,并按照振幅对数据进行划分,若振幅在0~A

(4.3)将步骤(4.2)Excel中的数据集按照80%和20%划分为训练集和测试集,并用步骤(2.5)中的标签处理方式对数据集做标签处理;

(4.4)将步骤(4.3)中处理后的数据输入Hyperopt优化后的改进WGAN网络模型中训练,输出随迭代次数变化生成器和鉴别器的损失函数曲线、改进WGAN网络模型的诊断精度曲线及独热编码标签的故障类型。

有益效果:与现有技术相比,本发明具有以下显著优点:

(1)本发明通过改进WGAN网络模型实现对轴承故障诊断,解决了传统故障诊断模型的耗时长、诊断精度低等问题,提高了实际生产效率和安全性;

(2)本发明利用R-FCN代替原始鉴别器模型,通过Resnet101网络和全卷积层实现对真实数据和虚假数据进行更深层次的特征提取,再利用平均池化操作得到每个RoI框架上的得分映射,该方法有效减少了网络层数和提取特征时间;

(3)本发明采用Hyperopt优化卷积核大小、神经元个数等超参数,使鉴别器和生成器具备最佳超参数组合,并通过迭代训练得到Resnet101最优网络层数,不仅大大减少了传统训练过程中生成器和鉴别器寻优时间,还使整体网络模型精度达到最优;

(4)本发明采用半监督学习代替监督学习和无监督学习进行网络训练,并采用标签率作用于独热编码,不仅解决了大量数据标签耗时问题,还实现WGAN网络半监督学习在轴承故障诊断上的应用,提高模型诊断精度,保证模型的高效性和鲁棒性。

附图说明

图1为本发明中加速度传感器安装示意图;

图2为本发明中加速度传感器安装细节图;

图3为本发明故障诊断模型的示意图;

图4为本发明故障诊断的流程示意图;

图5为本发明Hyperopt优化鉴别器流程图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

如图3、图4和图5所示,本发明一种基于改进WGAN网络的轴承故障诊断方法,包括如下步骤:

(1)加速度传感器的选取与安装;将加速度传感器安装在齿轮箱的驱动端,目的是为了可以更好地依据齿轮箱的传动获取轴承振动信号,提高信号采集质量;将加速度传感器安装在齿轮箱驱动端表面9时和12时方向,且加速度传感器安装位置相对垂直,由于离心泵转速固定,经过齿轮箱的轴承转速不会对信号采集造成干扰,具体安装位置如图1和图2所示;其中,安装在9时和12时方向主要是为了采集驱动端垂直方向和水平方向的振动信号,该种方法不仅使轴承信号采集更全面,还可避免冗余的振动信号;

(2)采集样本轴承运行过程中的振动信号并对样本信号进行处理;

具体步骤为:

(2.1)设置采样参数,采样参数包括采样频率f=f′、采样时长t=t′和采样间隔Δt=Δt′,对轴承所受加速度信号进行采样,采集轴承运行过程中的样本数据;

其中,样本数据由人为故障注入获取,主要包括正常轴承和故障轴承,故障轴承包括6种不同类型故障的轴承;7种轴承分配情况为:样本轴承1为损伤直径为R

(2.2)将步骤(2.1)中采样结果以数值形式输出并保存,轴承在高速运转时,驱动端的加速度传感器将采集到加速度振动信号,采集到加速度振动信号通过模数转换器进行转换,转换后的加速度振动信号按照桥式电路放大输出振动信号值;最后将每次采样输出的数值以CSV格式保存,分别对两种不同方向的采样点进行采样,9时方向加速度振动信号放置在CSV文件第一列,12时方向加速度振动信号放置在CSV文件第二列,保存为1.CSV,以此类推,完成数据保存;

(2.3)步骤(2.2)中数据进行分割处理,若一个CSV文件中有N个数据,取前N/1000个数据为一组,以此类推,逐个遍历CSV文件,共得到N

(2.4)对步骤(2.3)中获取的N

(2.5)采用独热编码对步骤(2.4)中数据集按照训练集和测试集分别为80%和20%进行标签处理,利用0和1表示运行数据的故障状态,即使用N位寄存状态器N种状态进行编码,设置1000为正常状态,0100为轻微故障状态,0010为中度故障状态,0001为重度故障状态;并利用反独热编码表示输出类型,其中输出值为0代表正常状态,输出值为1代表轻微故障状态,输出值为2代表中度故障状态,输出值为3代表重度故障状态;

(3)构建改进WGAN诊断模型,利用该模型实现轴承故障诊断和故障分类;

具体步骤为:

(3.1)搭建生成器模型并生成虚假信号;

其中搭建生成器网络模型的具体步骤如下:

(3.1.1)采用二维卷积层作为网络输入,输入端为随机噪声数据,经批量标准化(Batch Normalizaztion)处理实现数据归一化,再采用LeakyRule激活函数激活大量神经元,并依靠神经元间的计算提取深层次特征,最后利用tanh激活函数作为网络输出;

(3.1.2)将设置的具有独热编码标签的随机噪声(Z)输入至生成器中,经过生成器自身网络结构训练生成器生成虚假信号;

(3.1.3)利用改进的CWT对随机噪声生成的虚假信号进行处理,以生成所需的时频图;

(3.2)采用R-FCN网络模型代替原来鉴别器模型,获取改进WGAN诊断模型;

搭建R-FCN网络模型为改进WGAN网络的鉴别器模型,利用鉴别器模型对步骤(3.1)中生成器生成图片进行判断,并输出生成器和鉴别器损失函数及改进WGAN模型的诊断精度,具体步骤如下:

(3.2.1)利用O个二维卷积层(Conv2D)、P个Batch Normalizaztion层、Q个LeakyRule激活函数及ResNet101网络组成鉴别器输入端网络,在通过1个Conv2D得到初始特征图,再对其进行Conv2D操作,最终得到去除冗余图像特征的新特征图;

(3.2.2)通过区域提议网络(Region Proposal Network,RPN)获取新特征图中对应的感兴趣区域(Region-of-Interest,RoI)边缘框,并利用每个RoI边缘框分别获取步骤(3.2.1)中新特征图中的特征;再通过每个RoI边缘框区域的r,s,t,u来确定位置敏感区域的坐标信息(r,s,t,u为边缘框坐标位置),依据该方法得到每个子区域,最终由每个RoI实现特征的分类和回归;

其中,RPN网络是Faster R-CNN中的RPN层,主要用于Faster-RCNN网络提取边缘框;由于提取R-FCN网络中边缘框耗时耗力,因此,在引入卷积神经网络后,采用的二维卷积层以特征提取的形式选择边缘框的位置从而降低了计算时间,在此发明中RPN网络可较快的提取R-FCN网络中的边缘框;

(3.2.3)在每个子区域上利用池化操作寻找合适的响应值,依据RoI边缘框大小设置最小响应值为S,最大响应值为T,若响应值在[S,T]之间,则表示该特征为所需特征;反之,去除该特征,继续寻找合适特征直至找到所有特征;直到获取整张图片中的特征;

(3.2.4)将步骤(3.2.3)中每个RoI得到的特征按照获取边缘框的大小映射至新特征图,得到位置敏感区域(即通过池化操作得到响应值在[S,T]之间的特征区域),其中,得分映射大小(即位置敏感区域获取的边缘框大小)为K*K*(C+1)和4*K*K维,再利用卷积池化操作对新特征图上的位置敏感区域进行特征提取,并将提取结果经全连接层输出;

(3.2.5)将步骤(2.5)中带有标签的真实训练集输入至搭建好的鉴别器模型进行训练,再将步骤(3.1)中生成器生成图片输入至R-FCN中进行训练,利用鉴别器损失函数和生成器损失函数进行判断,如果鉴别器鉴别结果为真,同时生成器损失函数和鉴别器损失函数下降,当两者最终趋于拟合并接近时,达到纳什平衡,表明诊断模型满足要求,则训练结束;再利用softmax函数分类得到带有独热编码标签的故障类型,并输出随迭代次数变化生成器和鉴别器模型的损失函数曲线和改进WGAN网络模型诊断精度曲线;如果鉴别器判断结果为假,则进行步骤(3.2.6);

(3.2.6)训练结果为假时,则表示生成器生成图片效果不好,鉴别器无法正确判断图片真假,生成器模型未达到预期效果,则采用控制变量法控制鉴别器模型及其超参数来优化生成器模型,将鉴别器的模型参数固定,不断迭代优化生成器的模型参数,当鉴别器判断结果为真时,则生成器模型达到最优,此时鉴别器和生成器模型优化效果最优,效果最优就是当生成器和鉴别器损失函数下降,且两者最终趋于拟合并接近时,停止迭代,以此获取改进WGAN诊断模型;其中在获取改进WGAN诊断模型时,其迭代次数为epochs,学习率为Lr,批量大小为Batch_size;

这里的控制变量法就是保持鉴别器模型和参数不变,去优化生成器;

(3.2.7)利用测试集对步骤(3.2.5)中获取的改进WGAN诊断模型进行测试;若鉴别器可以判断生成器生成图片真假,且鉴别器损失函数和生成器损失函数缓慢降低至拟合,不在出现陡坡式的跳跃性波动,即不存在梯度消失或崩塌现象,则停止迭代,输出生成器和鉴别器损失函数和模型训练精度,得到改进的WGAN诊断模型;

为进一步提高步骤(3.2)中改进WGAN诊断模型的诊断速度,对R-FCN网络中Resnet101网络进行层数优化,分别选取R

(3.3)Hyperopt优化改进WGAN诊断模型超参数;由于改进WGAN网络模型仍存在较多网络结构和众多超参数,会影响生成器生成能力和鉴别器的鉴别能力,为实现深层次信号的特征提取,提高诊断精度,利用自动调参(Hyperopt)优化鉴别器模型达到优化改进WGAN模型目的,具体步骤如下:

(3.3.1)初始化网络超参数,获取待优化的卷积核大小、隐藏神经元个数、池化因子等参数组成初始参数集F

其中,初始化参数集F

(3.3.2)建立目标函数,目标函数作为评估先验模型的基础,用于计算更新优化函数的后验概率,得到最优超参数组合;采用交叉熵损失函数作为目标函数,公式如下:

式中,B为样本数,C为类别数,τ

(3.3.3)将步骤(3.3.1)中的初始参数F

(3.3.4)将步骤(3.3.3)数据集A中的第一组数据用于验证集上判断模型是否满足要求;具体可依据模型的超参数组合表达式判断,若鉴别器损失函数迭代趋于拟合,则该组超参数满足要求;反之,进行步骤(3.3.5),公式如下:

I

式中,H(i)为最小化的目标函数;I

设置最小目标函数H(i)≤£时,满足超参数选取要求;

(3.3.5)利用数据集A建立高斯回归模型,通过高斯回归模型不断迭代计算更新损失函数,修正概率模型;

为在高斯分布中获取最优超参数,可利用极大似然估计法,其表达式如下:

式中,K为协方差矩阵;f为前n个样本的后验概率;θ为所选超参数,θ=log

(3.3.6)使用采集函数G

其中,步骤(3.3.6)中采集函数是由当前数据集的后验分布构造,通过最大化采集函数来选取下一组超参数,采集函数公式如下:

G

式中,x为训练集,μ(x)、δ(x)分别为目标函数联合后验分布的均值函数和协方差函数;β为调节参数,可用来调整采样点的选取;

(3.3.7)判断是否满足模型精度要求,若满足,则确定超参数F

得到改进WGAN模型的最优网络超参数,进而实现Hyperopt优化改进WGAN诊断模型的目的,再利用步骤(3.2.6)实现生成器和鉴别器双重优化,获取优化后的改进WGAN诊断模型;

(3.4)采用半监督学习指导改进WGAN诊断模型中生成器和鉴别器训练,为解决大多数WGAN网络无监督学习模型不仅需要大量样本数据,还存在样本标注困难问题;通过更改鉴别器和生成器损失函数,实现半监督学习,目的在于使WGAN网络学习器不依赖外界交互、自动利用未标记样本来提升学习性能,具体步骤如下:

(3.4.1)构建半监督学习中鉴别器的损失函数,

首先,构建WGAN网络的监督学习损失函数,公式如下:

式中,E为数学期望,u,v~P

其次,构建WGAN网络的无监督学习损失函数,公式如下:

式中,D(u)为判别器对真实数据u的评估,G(z)为生成数据,Z为随机噪声,u~P

最后,构建改进WGAN网络模型的鉴别器(L

进一步地,为提高鉴别器损失函数精确度,将监督学习和半监督学习损失函数权值c归一化处理并乘以权值尺度因子α,则更新后的损失函数表达式如下:

(3.4.2)改进WGAN网络半监督学习中生成器(L

(3.4.3)利用步骤(3.3)中优化好的网络模型为基础,训练步骤(3.1)中生成的具有独热编码标签的生成图片和用样本标签率代替整体训练样本标签的真实图片,样本标签率为θ

(3.4.4)对步骤(3.4.3)中的训练结果进行判断,通过不同的样本标签率进行训练分别得到相应准确率£

(3.5)优化后改进的WGAN诊断模型实现轴承故障诊断,具体改进的WGAN整体诊断流程如下:

(3.5.1)将随机噪声(Z)和步骤(3.4)中具有独热编码的样本标签率输入步骤(3.3)优化后的生成器模型中,经过生成器自身网络结构训练生成虚假信号;

其中,随机噪声Z需满足RGB格式且像素与时频图大小相同;

(3.5.2)利用上述改进的CWT对信号进行连续小波变换使其得到标准的时频图,使其更加具备‘欺骗’鉴别器能力;

(3.5.3)将步骤(3.5.2)得到的时频图输入至步骤(3.3)优化后的R-FCN鉴别器网络模型,同时将训练集输入至鉴别器中,经鉴别器迭代训练,判断步骤(3.5.2)输入的时频图是否为真,如果为真,则鉴别器和生成器损失函数达到拟合效果,输出随迭代次数变化生成器和鉴别器的损失函数曲线、改进WGAN网络模型的诊断精度曲线及独热编码标签的故障类型;反之,固定鉴别器参数,不断迭代更新生成器参数,直至生成器生成数据鉴别器无法判断是真是假,最终得到改进WGAN网络模型,再将测试集输入改进WGAN网络模型中进行验证;

(3.5.4)通过Hyperopt优化方法得到诊断模型最优超参数组合,进而优化改进WGAN模型;

(3.5.5)为验证半监督学习是否可以在优化后的改进WGAN网络模型中实现故障诊断,利用不同样本标签率代替整体样本标签输入改进WGAN网络模型进行训练,并输出不同样本标签率的诊断精度;

(4)采集待测轴承运行的全生命周期振动信号并对振动信号进行处理,将处理后的振动信号以时频图形式输入改进WGAN诊断模型,以获取待测轴承的诊断精度和故障类型;

针对实际生产中,对于轴承全生命周期的振动信号,如何利用改进WGAN网络模型来获取故障类型和故障精度,具体步骤如下:

(4.1)获取轴承全生命周期运行数据,并将数据以CSV格式保存;

(4.2)将步骤(4.1)中CSV格式的数据通过频谱信号分析获取时间-振幅关系图,并按照振幅对数据进行划分,若振幅在0~A

(4.3)将步骤(4.2)Excel中的数据集按照80%和20%划分为训练集和测试集,并用步骤(2.5)中的标签处理方式对数据集做标签处理;

(4.4)将步骤(4.3)中处理后的数据输入Hyperopt优化后的改进WGAN网络模型中训练,输出随迭代次数变化生成器和鉴别器的损失函数曲线、改进WGAN网络模型的诊断精度曲线及独热编码标签的故障类型。

实施例1

实施例1一种基于改进WGAN网络的轴承故障诊断方法,包括如下步骤:

(1)加速度传感器的选取与安装;将加速度传感器安装在齿轮箱的驱动端,目的是为了可以更好地依据齿轮箱的传动获取轴承振动信号,提高信号采集质量;将加速度传感器安装在齿轮箱驱动端表面9时和12时方向,且加速度传感器安装位置相对垂直,由于离心泵转速固定,经过齿轮箱的轴承转速不会对信号采集造成干扰,具体安装位置如图1所示;其中,安装在9时和12时方向主要是为了采集驱动端垂直方向和水平方向的振动信号,该种方法不仅使轴承信号采集更全面,还可避免冗余的振动信号;

(2)采集样本轴承运行过程中的振动信号并对样本信号进行处理;

具体步骤为:

(2.1)设置采样参数,采样参数包括采样频率f=12kHz、采样时长t=5s和采样间隔Δt=5ms,对轴承所受加速度信号进行采样,采集轴承运行过程中的样本数据;

其中,样本数据由人为故障注入获取,主要包括正常轴承和故障轴承,故障轴承包括6种不同类型故障的轴承;7种轴承分配情况为:样本轴承1为损伤直径为R

(2.2)将步骤(2.1)中采样结果以数值形式输出并保存,轴承在高速运转时,驱动端的加速度传感器将采集到加速度振动信号,采集到加速度振动信号通过模数转换器进行转换,转换后的加速度振动信号按照桥式电路放大输出振动信号值;最后将每次采样输出的数值以CSV格式保存,分别对两种不同方向的采样点进行采样,9时方向加速度振动信号放置在CSV文件第一列,12时方向加速度振动信号放置在CSV文件第二列,保存为1.CSV,以此类推,完成数据保存;

(2.3)步骤(2.2)中数据进行分割处理,若一个CSV文件中有120000个数据,取前120个数据为一组,以此类推,逐个遍历CSV文件;

(2.4)对步骤(2.3)中获取数据进行连续小波变换处理(Continue WaveletTransform,CWT),W个时频图并保存,时频图为RGB格式且像素为500*500;

(2.5)采用独热编码对步骤(2.4)中数据集按照训练集和测试集分别为80%和20%进行标签处理,利用0和1表示运行数据的故障状态,即使用N位寄存状态器N种状态进行编码,设置1000为正常状态,0100为轻微故障状态,0010为中度故障状态,0001为重度故障状态;并利用反独热编码表示输出类型,其中输出值为0代表正常状态,输出值为1代表轻微故障状态,输出值为2代表中度故障状态,输出值为3代表重度故障状态;

(3)构建改进WGAN诊断模型,利用该模型实现轴承故障诊断和故障分类;

具体步骤为:

(3.1)搭建生成器模型并生成虚假信号;

在进行步骤(3.1)之前,设置无标签的随机噪声作为生成器输入,随机噪声维度大小与步骤(2.3)中获取的时频图维度相同;本发明将随机噪声维度设置为A,且A=m*n,目的是为了避免因维度不统一造成图像大小不一,导致鉴别器无法充分发挥鉴别作用。

其中搭建生成器网络模型的具体步骤如下:

(3.1.1)采用二维卷积层作为网络输入,,相比于一维卷积层可以增强特征提取和计算速度;输入端为随机噪声数据,经批量标准化(Batch Normalizaztion)处理实现数据归一化,再采用LeakyRule激活函数激活大量神经元,并依靠神经元间的计算提取深层次特征,最后利用tanh激活函数作为网络输出;本发明交替使用Conv2D、Batch Normalizaztion层和LeakyRule激活函数,使生成器生成质量更高的假数据;此外,不管是LeakyRule激活函数还是tanh激活函数都可一定程度上代替Dropout层,用于防止过拟合、减少训练时间;

使用LeakyRule激活函数,主要原因可以减少生成器稀疏性梯度的可能性,其公式如下:

式中,y

使用tanh激活函数,因为其最大梯度为1,可以保证梯度传输不削减并加速损失函数收敛,有效缓解梯度消失,公式如下:

式中,z取常数,tanh(z)的输出值在[-1,1]之间;

(3.1.2)将设置的具有独热编码标签的随机噪声(Z)输入至生成器中,经过生成器自身网络结构训练生成器生成虚假信号;

(3.1.3)利用改进的CWT对随机噪声生成的虚假信号进行处理,以生成所需的时频图;

在进行步骤(3.2)之前,本发明利用改进的CWT对随机噪声生成的数据进行处理,以生成所需的样本数据。改进的CWT表达式为:

式中,g为尺度因子,h为时间平移因子,

(3.2)采用R-FCN网络模型代替原来鉴别器模型,获取改进WGAN诊断模型;

搭建R-FCN网络模型为改进WGAN网络的鉴别器模型,R-FCN网络具有更深的共享卷积网络层,可提取步骤(3.1)中生成器生成的虚假图片特征、获取时频图中所需的类别信息和位置信息、减少提取时间、提高训练精度,使鉴别器得到有效训练,强化鉴别效果,并输出生成器和鉴别器损失函数及改进WGAN模型的诊断精度;利用鉴别器模型对步骤(3.1)中生成器生成图片进行判断,并输出生成器和鉴别器损失函数及改进WGAN模型的诊断精度,具体步骤如下:

(3.2.1)利用4个二维卷积层(Conv2D)、3个Batch Normalizaztion层、3个LeakyRule激活函数及ResNet101网络组成鉴别器输入端网络,在通过1个Conv2D得到初始特征图,再对其进行Conv2D操作,最终得到去除冗余图像特征的新特征图;

(3.2.2)通过区域提议网络(Region Proposal Network,RPN)获取新特征图中对应的感兴趣区域(Region-of-Interest,RoI)边缘框,并利用每个RoI边缘框分别获取步骤(3.2.1)中新特征图中的特征;再通过每个RoI边缘框区域的r,s,t,u来确定位置敏感区域的坐标信息(r,s,t,u为边缘框坐标位置),依据该方法得到每个子区域,最终由每个RoI实现特征的分类和回归;

其中,RPN网络是Faster R-CNN中的RPN层,主要用于Faster-RCNN网络提取边缘框;由于提取R-FCN网络中边缘框耗时耗力,因此,在引入卷积神经网络后,采用的二维卷积层以特征提取的形式选择边缘框的位置从而降低了计算时间,在此发明中RPN网络可较快的提取R~FCN网络中的边缘框;

(3.2.3)在每个子区域上利用池化操作寻找合适的响应值,依据RoI边缘框大小设置最小响应值为S,最大响应值为T,若响应值在[S,T]之间,则表示该特征为所需特征;反之,去除该特征,继续寻找合适特征直至找到所有特征;直到获取整张图片中的特征;

(3.2.4)将步骤(3.2.3)中每个RoI得到的特征按照获取边缘框的大小映射至新特征图,得到位置敏感区域(即通过池化操作得到响应值在[S,T]之间的特征区域),其中,得分映射大小(即位置敏感区域获取的边缘框大小)为K*K*(C+1)和4*K*K维,其中,C表示图片类别种数,(C+1)为总类别数,K为图片通道数,且C=4,K=3,再利用卷积池化操作对新特征图上的位置敏感区域进行特征提取,并将提取结果经全连接层输出;

(3.2.5)将步骤(2.5)中带有标签的真实训练集输入至搭建好的鉴别器模型进行训练,再将步骤(3.1)中生成器生成图片输入至R-FCN中进行训练,利用鉴别器损失函数和生成器损失函数进行判断,如果鉴别器鉴别结果为真,同时生成器损失函数和鉴别器损失函数下降,当两者最终趋于拟合并接近时,达到纳什平衡,表明诊断模型满足要求,则训练结束;再利用softmax函数分类得到带有独热编码标签的故障类型,并输出随迭代次数变化生成器和鉴别器模型的损失函数曲线和改进WGAN网络模型诊断精度曲线;如果鉴别器判断结果为假,则进行步骤(3.2.6);

(3.2.6)训练结果为假时,则表示生成器生成图片效果不好,鉴别器无法正确判断图片真假,生成器模型未达到预期效果,则采用控制变量法控制鉴别器模型及其超参数来优化生成器模型,将鉴别器的模型参数固定,不断迭代优化生成器的模型参数,当鉴别器判断结果为真时,则生成器模型达到最优,此时鉴别器和生成器模型优化效果最优,效果最优就是当生成器和鉴别器损失函数下降,且两者最终趋于拟合并接近时,停止迭代,以此获取改进WGAN诊断模型;其中在获取改进WGAN诊断模型时,其迭代次数为epochs=360,学习率为Lr=0.0001,批量大小为Batch_size=32;

这里的控制变量法就是保持鉴别器模型和参数不变,去优化生成器;

(3.2.7)利用测试集对步骤(3.2.5)中获取的改进WGAN诊断模型进行测试;若鉴别器可以判断生成器生成图片真假,且鉴别器损失函数和生成器损失函数缓慢降低至拟合,不在出现陡坡式的跳跃性波动,即不存在梯度消失或崩塌现象,则停止迭代,输出生成器和鉴别器损失函数和模型训练精度,得到改进的WGAN诊断模型;

其中卷积池化操作公式为:

式中,r

本发明中上述损失函数计算公式为:

式中,one

为进一步提高步骤(3.2)中改进WGAN诊断模型的诊断速度,,对R-FCN网络中Resnet101网络进行层数优化,分别选取R

(3.3)Hyperopt优化改进WGAN诊断模型超参数;由于改进WGAN网络模型仍存在较多网络结构和众多超参数,会影响生成器生成能力和鉴别器的鉴别能力,为实现深层次信号的特征提取,提高诊断精度,利用自动调参(Hyperopt)优化鉴别器模型达到优化改进WGAN模型目的,具体步骤如下:

(3.3.1)初始化网络超参数,获取待优化的卷积核大小、隐藏神经元个数、池化因子等参数组成初始参数集F

其中,初始化参数集F

(3.3.2)建立目标函数,目标函数作为评估先验模型的基础,用于计算更新优化函数的后验概率,得到最优超参数组合;采用交叉熵损失函数作为目标函数,公式如下:

式中,B为样本数,C为类别数,τ

(3.3.3)将步骤(3.3.1)中的初始参数F

(3.3.4)将步骤(3.3.3)数据集A中的第一组数据用于验证集上判断模型是否满足要求;具体可依据模型的超参数组合表达式判断,若鉴别器损失函数迭代趋于拟合,则该组超参数满足要求;反之,进行步骤(3.3.5),公式如下:

I

式中,H(i)为最小化的目标函数;I

设置最小目标函数H(i)≤£时,满足超参数选取要求;

(3.3.5)利用数据集A建立高斯回归模型,通过高斯回归模型不断迭代计算更新损失函数,修正概率模型;

为在高斯分布中获取最优超参数,可利用极大似然估计法,其表达式如下:

式中,K为协方差矩阵;f为前n个样本的后验概率;θ为所选超参数,θ=10g

(3.3.6)使用采集函数G

其中,步骤(3.3.6)中采集函数是由当前数据集的后验分布构造,通过最大化采集函数来选取下一组超参数,采集函数公式如下:

G

式中,x为训练集,μ(x)、δ(x)分别为目标函数联合后验分布的均值函数和协方差函数;β为调节参数,可用来调整采样点的选取;

(3.3.7)判断是否满足模型精度要求,若满足,则确定超参数F

得到改进WGAN模型的最优网络超参数,进而实现Hyperopt优化改进WGAN诊断模型的目的,再利用步骤(3.2.6)实现生成器和鉴别器双重优化,获取优化后的改进WGAN诊断模型;

(3.4)采用半监督学习指导改进WGAN诊断模型中生成器和鉴别器训练,为解决大多数WGAN网络无监督学习模型不仅需要大量样本数据,还存在样本标注困难问题;通过更改鉴别器和生成器损失函数,实现半监督学习,目的在于使WGAN网络学习器不依赖外界交互、自动利用未标记样本来提升学习性能,具体步骤如下:

(3.4.1)构建半监督学习中鉴别器的损失函数,

首先,构建WGAN网络的监督学习损失函数,公式如下:

式中,E为数学期望,u,v~P

其次,构建WGAN网络的无监督学习损失函数,公式如下:

式中,D(u)为判别器对真实数据u的评估,G(z)为生成数据,Z为随机噪声,u~P

最后,构建改进WGAN网络模型的鉴别器(L

进一步地,为提高鉴别器损失函数精确度,将监督学习和半监督学习损失函数权值c归一化处理并乘以权值尺度因子α,则更新后的损失函数表达式如下:

(3.4.2)改进WGAN网络半监督学习中生成器(L

(3.4.3)利用步骤(3.3)中优化好的网络模型为基础,训练步骤(3.1)中生成的具有独热编码标签的生成图片和用样本标签率代替整体训练样本标签的真实图片,样本标签率为θ

(3.4.4)对步骤(3.4.3)中的训练结果进行判断,通过不同的样本标签率进行训练分别得到相应准确率£

(3.5)优化后改进的WGAN诊断模型实现轴承故障诊断,具体改进的WGAN整体诊断流程如下:

(3.5.1)将随机噪声(Z)和步骤(3.4)中具有独热编码的样本标签率输入步骤(3.3)优化后的生成器模型中,经过生成器自身网络结构训练生成虚假信号;

其中,随机噪声Z需满足RGB格式且像素与时频图大小相同;

(3.5.2)利用上述改进的CWT对信号进行连续小波变换使其得到标准的时频图,使其更加具备‘欺骗’鉴别器能力;

(3.5.3)将步骤(3.5.2)得到的时频图输入至步骤(3.3)优化后的R-FCN鉴别器网络模型,同时将训练集输入至鉴别器中,经鉴别器迭代训练,判断步骤(3.5.2)输入的时频图是否为真,如果为真,则鉴别器和生成器损失函数达到拟合效果,输出随迭代次数变化生成器和鉴别器的损失函数曲线、改进WGAN网络模型的诊断精度曲线及独热编码标签的故障类型;反之,固定鉴别器参数,不断迭代更新生成器参数,直至生成器生成数据鉴别器无法判断是真是假,最终得到改进WGAN网络模型,再将测试集输入改进WGAN网络模型中进行验证;

(3.5.4)通过Hyperopt优化方法得到诊断模型最优超参数组合,进而优化改进WGAN模型;

(3.5.5)为验证半监督学习是否可以在优化后的改进WGAN网络模型中实现故障诊断,利用不同样本标签率代替整体样本标签输入改进WGAN网络模型进行训练,并输出不同样本标签率的诊断精度;

(4)采集待测轴承运行的全生命周期振动信号并对振动信号进行处理,将处理后的振动信号以时频图形式输入改进WGAN诊断模型,以获取待测轴承的诊断精度和故障类型;

针对实际生产中,对于轴承全生命周期的振动信号,如何利用改进WGAN网络模型来获取故障类型和故障精度,具体步骤如下:

(4.1)、获取轴承全生命周期运行数据,并将数据以CSV格式保存;

(4.2)、将步骤(4.1)中CSV格式的数据通过频谱信号分析获取时间-振幅关系图,并按照振幅对数据进行划分,若振幅在0~A

(4.3)、将步骤(4.2)Excel中的数据集按照80%和20%划分为训练集和测试集,并用步骤(2.5)中的标签处理方式对数据集做标签处理;

(4.4)、将步骤(4.3)中处理后的数据输入Hyperopt优化后的改进WGAN网络模型中训练,输出随迭代次数变化生成器和鉴别器的损失函数曲线、改进WGAN网络模型的诊断精度曲线及独热编码标签的故障类型。

相关技术
  • 一种基于改进的PSO算法优化FSVM的滚动轴承故障诊断方法
  • 基于改进WGAN-GP和Alxnet的轴承故障诊断方法
  • 一种基于改进残差网络和WGAN的轴承剩余寿命预测方法
技术分类

06120116337527