掌桥专利:专业的专利平台
掌桥专利
首页

一种基于对抗域适应的滚动轴承故障诊断方法及装置

文献发布时间:2024-04-18 19:59:31


一种基于对抗域适应的滚动轴承故障诊断方法及装置

技术领域

本发明涉及轴承故障诊断领域,具体提供一种基于对抗域适应的滚动轴承故障诊断方法及装置。

背景技术

基于机器学习的轴承故障诊断算法需要先对轴承诊断信号处理,然后依赖于专家知识经验进行主观判断,具有一定的不确定性。深度学习的出现为轴承故障诊断领域提供了新的方法,使用深度学习技术,算法能够自动化学习并优化参数选择,降低人为干预的风险,并且可以在一定程度上提高轴承故障诊断的准确性和鲁棒性。

尽管深度学习在轴承故障诊断方面取得了一些成果,但是现阶段所采用的数据都是实验室模拟产生的,在实际生产过程中,很难收集到轴承故障数据。由于缺乏数据,所以很难训练出可靠的深度学习模型。

发明内容

本发明是针对上述现有技术的不足,提供一种实用性强的基于对抗域适应的滚动轴承故障诊断方法。

本发明进一步的技术任务是提供一种设计合理,安全适用的基于对抗域适应的滚动轴承故障诊断装置。

本发明解决其技术问题所采用的技术方案是:

一种基于对抗域适应的滚动轴承故障诊断方法,包括以下步骤:

S1、预训练阶段:使用源域数据训练特征提取器和分类器;

S2、对抗适应阶段:对源域数据和目标域数据训练特征提取器和判别器;

S3、测试阶段:目标域数据训练特征提取器和分类器,目标域上测试。

进一步的,在步骤S1中,

首先,使用带有标签的源域数据以有监督的方式训练源域特征提取器和分类器,采用交叉熵损失公式计算预测标签与真实标签之间的损失,计算公式如下所示;

其中,

进一步的,在步骤S2中,进一步包括:

S201、训练判别器;

S202、训练特征提取器。

进一步的,在步骤S201中,从源域和目标域随机抽取一批不带有标签的数据,然后使用特征提取器提取不带有标签数据的特征,用不带有标签数据的特征作为输入训练判别器,能够区分特征是来自源域还是目标域,其中判别器损失函数表示为L

其中,E

进一步的,在步骤S202中,需要更新特征提取器的参数,生成对判别器来说更难以区分特征的来源,为此,需要使用目标域数据,计算判别器在数据上的损失,并通过反向传播更新特征提取器的参数,在这个过程中,判别器的参数保持固定;

直到达到预设的迭代次数或者判别器的损失低于阈值。

进一步的,在步骤S3中,将目标域的标签传入训练好的目标域特征提取器E

进一步的,使用softmax函数来计算给目标域的输入实例每个类的概率,使用Focal Loss损失函数,关注难以分类样本,计算公式如下所示:

FL

其中,α

一种基于对抗域适应的滚动轴承故障诊断装置,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行一种基于对抗域适应的滚动轴承故障诊断方法。

本发明的一种基于对抗域适应的滚动轴承故障诊断方法及装置和现有技术相比,具有以下突出的有益效果:

本发明结合通道注意力机制和Focalloss损失函数,以解决源域和目标域之间的共享特征挖掘不充分、分类器在训练过程中的泛化能力不足和少量数据难以训练出可靠的深度学习模型等问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

附图1是一种基于对抗域适应的滚动轴承故障诊断方法的流程示意图;

附图2是一种基于对抗域适应的滚动轴承故障诊断方法中消融实验结果图;

附图3是一种基于对抗域适应的滚动轴承故障诊断方法中CWRU数据集从工况A迁移到工况B示意图;

附图4是一种基于对抗域适应的滚动轴承故障诊断方法中CWRU数据集从工况A迁移到工况C示意图。

具体实施方式

为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。

下面给出一个最佳实施例:

如图1所示,本实施例中的一种基于对抗域适应的滚动轴承故障诊断方法,包括以下步骤:

S1、预训练阶段:使用源域数据训练特征提取器和分类器;

首先,使用带有标签的源域数据以有监督的方式训练源域特征提取器和分类器,采用交叉熵损失公式计算预测标签与真实标签之间的损失,计算公式如下所示。

其中

算法1提供了使用源域数据训练特征提取器和分类器,包括在源域标签的监督下训练源域特征提取器E

输入:源域

输出:训练好的源特征提取器E

E

C←全连接神经网络

for样本数量do

1:

2:

3:预测值←C(E

4:训练特征提取器E

5:使用Adam优化器更新权重

End

S2、对抗适应阶段:对源域数据和目标域数据训练特征提取器和判别器;

这一阶段主要包括两个互相竞争的过程:特征提取器的目标是使得目标域特征提取器的数据分布逐渐接近源域特征提取器的数据分布,使判别器难以区分源域和目标域;而判别器的目标则是尽可能准确地判断特征是来自源域还是目标域。在这个过程中,特征提取器和判别器将不断地相互优化和调整,直到达到一个平衡点。

在对抗训练阶段使用前一阶段训练好源域特征提取器的参数作为目标域特征提取器的初始化参数,这样做的好处为:初始参数的选择对模型训练速度和收敛性能有很大影响,使用源域特征提取器的参数作为初始值可以加快训练速度,同时还可以将源域的一些泛化能力迁移到目标域,从而降低过拟合的风险。下面详细介绍对抗训练的过程。

S201、训练判别器;

为了训练判别器,从源域和目标域随机抽取一批不带有标签的数据,然后使用特征提取器提取这些数据的特征。接着,用这些特征作为输入训练判别器,使其能够区分特征是来自源域还是目标域,其中判别器损失函数表示为L

其中,E

S202、训练特征提取器;

在此步骤中,需要更新特征提取器的参数,以便生成对判别器来说更难以区分特征的来源。为此,需要使用目标域数据,计算判别器在这些数据上的损失,并通过反向传播更新特征提取器的参数。在这个过程中,判别器的参数保持固定。

重复执行上述两步,直到达到预设的迭代次数或者判别器的损失低于阈值。

S3、测试阶段:目标域数据训练特征提取器和分类器,目标域上测试。

将目标域的标签传入训练好的目标域特征提取器E

FL

其中,α

详细描述本方法的网络结构参数如表1-1所示:

表1-1网络结构参数

在实际应用于轴承的故障诊断时,将预处理后的轴承振动信号数据输入训练完成的对抗域迁移(ADDA)轴承故障诊断模型,经多特征提取网络和标签分类网络后得到轴承的故障类型。

选取了4种公开的数据集来验证本方法的有效性。

(1)凯斯西储(CWRU)轴承数据集,采用该数据集的全部工况进行学习实验,CWRU数据集工况分类表如表1-2所示。

表1-2 CWRU数据集工况分类表

(2)江南大学(Jiangnan Universit,JNU)轴承数据集。该数据集一共包括四种运行状态,分别是正常、内圈故障、外圈故障和滚动体故障。以采样频率为50kHz的振动传感器收集数据。该数据集包含转速为600、800和1000rpm三种不同的任务,分别表示为A、B、C,JNU数据集工况分类表如表1-3所示。

表1-3 JNU数据工况分类表

(3)东南大学(Southeast University,SEU)数据集。SEU数据集由两个子数据集组成,分别是轴承数据集和齿轮数据集,本节只使用SEU数据集中的轴承数据,轴承数据是在两种不同的工况下收集,把电机转速为20Hz,电压负载为0V设为工况A,把电机转速为30Hz,负载电压为2V的设为工况B,每种工况含有18000个样本数据。该轴承数据一共有五种不同的故障类型,SEU故障分类表如表1-4所示。

表1-4 SEU轴承数据集故障分类表

(4)帕德博恩大学(Universitat Paderborn,PU)数据集,该数据集的振动信号由采样频率为64kHz的压电机加速计收集。根据实验装置的转速不同,负载扭矩和轴承上的径向力不同可以分为四种不同的工况,PU数据集工况分类表如表1-5所示。

表1-5 PU数据集工况分类表

实验环境为Windows10操作系统、Pytoch1.13、CUDA11.7、Python3.9、Intel(R)Core(TM)i5-13600KF、NVIDIA GeForce RTX4070ti、32G RAM。本方法选择Adam优化器,批量大小为20,分类器和判别器的学习率都是0.0001,Focal Loss损失函数中α为1、γ为2,每个模型训练150轮。

ADDA表示对抗域适应网络,ADDA+SE表示在对抗域适应网络添加通道注意力机制,ADDA+Focal Loss表示在对抗域适应网络添加Focal Loss损失函数,OURS表示在对抗域适应网络上添加通道注意力机制和Focal Loss损失函数。为了验证本方法的有效性,选取四个轴承数据集作为本次消融实验的对象,在每个数据集都进行5次实验,5次实验结果如图2所示,

可以看出,本方法,即融合了通道注意力机制和Focal Loss损失函数的效果最好。在大多数任务中,添加通道注意力机制和Focal Loss损失函数后,模型的准确率得到了提升,说明了这两种方法的有效性。

平均准确率如下表1-6所示,

表1-6消融实验结果(%)

对比ADDA和ADDA+SE,可以发现在所有数据集上,ADDA+SE方法的表现略优于ADDA。这表明引入SE有助于提高模型对关键特征的关注,从而提升轴承故障诊断精度。ADDA+Focal Loss方法在四个数据集上的表现优于ADDA,这意味着采用Focal Loss能够提高模型对少数类别的分类准确性,并增强对难样本的分类能力,提高模型的泛化能力。从数据集的角度来看,CWRU数据集上四种方法的表现均较好,这可能是因为CWRU数据集相对其他数据集更容易处理。相反,在PU和SEU数据集上,四种方法的表现相对较差,可能是由于这些数据集的复杂性和噪声较高。在所有四个数据集上,本方法表现优于其他三种方法,这表明通过整合采用SE和Focal Loss,在轴承故障诊断方面具有更高的精度和鲁棒性。

为了证明本发明所提出模型的优越性,与自适应批量归一化(Adaptive BatchNormalization,AdaBN)、多核最大均值差异(Multiple Kernel Maximum MeanDiscrepancy MK-MMD)、联合最大均值差异(Joint Maximum Mean Discrepancy,JMMD)、CNN卷积神经网络联合使用的损失函数CORAL和对抗训练网络DAAN进行比较,对比实验结果如下表所示。

表1-7CWRU迁移结果(%)

本方法在所有任务的平均准确率上达到了97.16%,明显优于其他方法,它们的平均准确率均在90%以上。这可能是因为CWRU数据集中工况之间的差异主要体现在转速上,而转速变化幅度相对较小,导致源域和目标域数据的特征变化不明显。因此,在大多数任务中,各种方法都能较好地提取有用特征进行分类。

然而,在工况D迁移到工况A的任务中,所有方法的准确率都低于84%,表明这是一个难迁移任务。这可能是由于工况D和工况A之间数据差异性较大。尽管如此,本方法在这个难迁移任务中仍然优于其他方法,进一步证明了本方法的优越性。总之,本方法在CWRU数据集上具有较高的迁移性能,并在一些难迁移任务中表现出优越性,证明了通道注意力机制和Focal Loss损失函数在提高迁移学习性能方面的有效性。

表1-8PU数据集迁移效果(%)

PU数据集每种工况之间的差异性的比较大,受转速、扭矩力、径向力等三个因素影响,在这种复杂的场景下,本方法的平均精度最高,其平均精度为74.38%,其次是DAAN,它的平均精度为55.78%,这两种方法都是基于对抗神经网络的思想,将对抗神经网络的思想引入到迁移学习中有着较好的效果,但是这两种方法有着一些不同,DANN学习具有域对抗性损失的单个神经网络,而本方法训练两个具有对抗性损失的独立网络以对齐源域和目标域之间的特征分布,能更有效的学习源域和目标域之间的数据特征。

在PU数据集不同任务准确率波动较大,把其他五种方法平均准确率高于75%视为简单的迁移学习任务,低于30%视为难以迁移学习任务。工况A与工况C之间互相迁移学习其他五种方法的平均准确率分别是87.78%和85.52%,本方法较弱与其他方法,如表1-5可知工况A负载扭矩与工况C不同,所以可以把负载扭矩视为一个对数据特征影响较弱的因素。工况A与工况B和工况B与工况D之间互相迁移学习其他五种方法的平均准确率分别是28.55%、24.22%、17.98%、27.37%。

表1-9JNU数据集迁移效果(%)

由上表可知,针对JNU数据集的迁移任务,本方法在平均准确率上达到了94.60%,明显优于其他迁移学习方法。除CORAL方法外,其他方法的平均准确率均在87.20%到93.15%之间,而CORAL方法的平均准确率仅为59.82%,表现较差。本方法在各个任务中准确率均表现良好,证明了其有效性和鲁棒性。在一些难迁移的任务,如任务C迁移到任务B和任务C迁移到任务A,本方法仍然优于其他方法。

表1-10 SEU数据集迁移效果(%)

在工况A迁移到工况B,本方法表现最好,达到70.23%的准确率,而其它方法的迁移效果均低于50%,其中,AdaBN的迁移效果最差,仅为20.68%。在工况B迁移到工况A,本方法仍然表现最好,达到43.08%的准确率,而其它方法的迁移效果均低于55%。平均准确率达到56.66%,而其它方法的平均准确率均低于45%。其中,MK-MMD和DAAN的平均迁移效果分别为42.29%和42.86%,与本方法相比略有差距。

上述实验采用目标域的全部样本,然而目标域的样本数据对模型的迁移效果也是至关重要的,在实际情况很难获取较多的故障样本。因此选取目标域数据数量的5%、10%、20%、30%、50%、80%作为进行实验,以CWRU数据集从工况A迁移到工况B和从工况A迁移到工况C为例进行了5次重复实验,5次实验后的模型故障分类平均准确率如图3和图4所示。

由图可以观察到,DAAN方法在A迁移到B任务中的表现相当出色,然而在A迁移到C任务中的表现却相对较差,这一现象表明该方法的稳定性有待提高。值得注意的是,即使在目标域样本比例较低的情况下,例如5%和10%,本方法仍然能够取得较好的故障分类平均准确率。在各种目标域样本数量比例下,本方法均优于其他对比方法,这表明了该方法在应对不同目标域样本数量时具有较强的鲁棒性和适应性。

基于上述方法,本实施例中的一种基于对抗域适应的滚动轴承故障诊断装置,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行一种基于对抗域适应的滚动轴承故障诊断方法。

上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明权利要求书记载的技术方案且任何所属技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种应用于防水箱的透气防水结构及其防水箱
  • 一种高分子防水透气的塑料膜的制备方法
  • 一种双向拉伸聚丙烯防水透气膜及其制备方法
  • 一种单向防水透气膜及其应用
  • 防水透气膜的制备方法、防水透气膜和应用
技术分类

06120116520531