掌桥专利:专业的专利平台
掌桥专利
首页

基于域适应特征的旋转机械变工况故障诊断方法

文献发布时间:2024-04-18 19:58:21


基于域适应特征的旋转机械变工况故障诊断方法

技术领域

本发明涉及机械故障诊断方法领域,具体是一种基于域适应特征的旋转机械变工况故障诊断方法。

背景技术

随着机器学习等一系列人工智能方法的快速发展,数据驱动的旋转机械故障诊断方法中,基于人工智能的故障诊断框架逐渐成为研究热点。当前,深度学习方法凭借其强大的隐藏特征挖掘能力,受到许多研究者的关注和研究,并取得了许多研究成果。但是,由于实际工业场景中旋转机械的复杂工况,导致基于深度学习的故障诊断模型面临两方面技术问题:(1)缺少足量的有标签故障样本,实际工业场景中,旋转机械在可变的复杂工况下,不同故障状态下的样本数据缺乏,想获取足量有标签样本的成本非常高。(2)不同工况下,相同故障类别下的样本存在分布差异,导致训练的基于人工智能的故障诊断模型泛化能力弱,应用于实际工况下故障诊断的准确率低。(3)目前,虽然基于深度学习的故障诊断方法因其强大的特征挖掘能力而受到广泛关注和研究,但其存在超参数,高耗时及计算复杂度等缺陷。

基于迁移学习的域适应作为解决上述问题的一个有前景的研究方向,在近年来逐渐被研究人员关注和研究,迁移学习方法能够通过从已有领域(源域:已有工况下带标签故障样本)挖掘学习知识和训练故障诊断模型,对来自不同领域(目标域:变工况下无标签故障样本)的故障样本进行识别分类。

现有技术中,电子测量与仪器学报期刊于2021年5月时间发布的论文《变工况轴承的联合分布适应迁移故障诊断》(作者:刘应东;刘韬;李华;王廷轩)中,公开了一种基于迁移学习和联合分布的轴承故障诊断方法,主要包括四个步骤:

(1)数据集划分。将原始轴承数据按照不同工况划分为训练集、测试集和辅助数据集,其中测试集和辅助数据集为同种工况。

(2)特征提取。对轴承数据进行时域特征提取,并对提取完成的时域特征通过FLDA方法对各个特征进行权重计算。

(3)联合分布自适应。将权重值较大的特征组成的特征向量分别通过PCA、KPCA进行降维学习和通过TCA、JDA进行迁移学习。在数据集划分的基础上,通过在训练集中加入与测试集相同工况的辅助数据集对模型进行辅助训练,测试集保持不变。对比在加入不同比例的辅助数据集的情况下,各方法的分类准确率。

(4)故障识别。最后将学习完成后的源域数据作为训练集,目标域数据作为测试集送入KNN分类器进行诊断分类,比较最终各方法的分类准确率该论文的技术方案中主要存在以下问题:

(A)使用FLDA对各个特征进行权重计算,由于在可迁移特征提取过程中仅使用权重来评价特征的重要性,因此忽视了特征判别能力对跨域故障诊断的影响,导致特征提取的结果不够全面。

(B)JDA能够弥补TCA仅考虑边缘概率分布适应的局限,综合考虑了两种概率分布,进而提升了迁移学习效果。但是对源域和目标域样本进行分布适应的过程中未合理同时考虑域间条件概率分布和边缘分布差异,也未考虑在高维特征空间中减小分布差异过程中存在的特征扭曲问题,导致分布适应效果不佳,影响故障诊断模型的泛化能力性能。

(C)使用KNN分类器进行诊断分类,单一分类器分类效果不佳,故障诊断能力不强。

发明内容

本发明提供了一种基于域适应特征的旋转机械变工况故障诊断方法,以解决现有技术存在的忽视了特征判别能力对跨域故障诊断的影响、分布适应效果不佳的问题。

为了达到上述目的,本发明所采用的技术方案为:

基于域适应特征的旋转机械变工况故障诊断方法,包括以下步骤:

步骤1、获取已有工况带标签的旋转机械振动信号、变工况下无标签的旋转机械振动信号,提取已有工况带标签的旋转机械振动信号的时频域统计特征数据作为有标签的源域特征样本集,提取变工况下无标签的旋转机械振动信号的时频域统计特征数据作为无标签的目标域特征样本集;

步骤2、基于有标签源域特征样本集中的统计特征数据,计算获得源域特征样本集中各统计特征数据的特征分类准确率acc,以表征特征的判别性能;基于源域特征样本集中正常状态下统计特征数据和目标域特征样本集中正常状态下统计特征数据,计算获得各统计特征数据的结构相似性指数SSIM和FID分数,以表征特征的域不变性;

基于上述得到的特征分类准确率acc,SSIM和FID,构建各统计特征数据的特征量化评估指标

然后设定阈值,从源域特征样本集中选择特征量化评估指标Z大于设定阈值的多个时频域统计特征数据构建有标签的源域特征样本子集,以及从目标域特征样本集中选择特征量化评估指标Z大于设定阈值的多个时频域统计特征数据构建无标签的目标域特征样本子集;

步骤3、对步骤2得到的源域特征样本子集、目标域特征样本子集中的时频域统计特征数据进行联合分布适应,得到联合分布适应后的源域特征样本子集、目标域特征样本子集;

步骤4、采用步骤3得到的联合分布适应后的源域特征样本子集中的数据对故障诊断分类器进行训练,然后将步骤3得到的联合分布适应后的目标域特征样本子集中的数据输入至训练好的故障诊断分类器中,通过故障诊断分类器得到目标域的故障诊断结果。

进一步的步骤1中,对已有工况带标签的旋转机械振动信号、变工况下无标签的旋转机械振动信号分别进行小波变换分解、重构后得到重构信号,然后分别基于重构信号提取多种统计参数的时域统计特征,接着分别基于重构信号的希尔伯特包络谱计算结果提取多种统计参数的频域统计特征,由此对应得到已有工况带标签的旋转机械振动信号的时频域统计特征数据、变工况下无标签的旋转机械振动信号的时频域统计特征数据。

进一步的,所述统计参数包括均值、标准差、峭度、能量、能量熵、峰度、脉冲因数、形状因子、偏度、极值、极差、功率谱熵、奇异谱熵、近似熵、样本熵、模糊熵、排列熵、包络熵。

进一步的步骤2中,利用Xgboost分类器计算所述源域特征样本集中每个时频域统计特征数据的特征分类准确率acc。

进一步的,步骤3中进行联合适应分布时,以源域特征样本子集中时频域统计特征数据、目标域特征样本子集中时频域统计特征数据的边缘概率分布之间的最大均值差异、条件概率分布之间的最大均值差异均为最小,作为联合适应分布的总优化目标。

进一步的步骤3中,利用有标签的源域特征样本子集中时频域统计特征数据对stacking集成学习模型进行训练,然后利用训练好的stacking集成学习模型预测所述目标域特征样本子集中时频域统计特征数据的类别标签,获得的类别标签即为目标域特征样本子集的伪标签,基于目标域特征样本子集中的时频域统计特征数据和相应的伪标签,计算得到目标域特征样本子集中时频域统计特征数据的条件概率分布。

进一步的步骤4中,所述故障诊断分类器为SVM分类器。

本发明使用特征分类准确率、FID和SSIM对源域和目标域的时频统计特征数据进行有效的量化评估,然后再利用提出的以边缘概率分布和条件概率分布差异为最小目标的联合分布适应对源域和目标域特征子集进行分布适应,最后使用集成学习分类器进行故障分类诊断,提升了跨域故障识别性能。因此与现有技术相比,本发明的有益效果为:

(1)本发明提出基于特征分类准确率,FID分数,和结构相似性指数的域适应特征选取方法,能够对统计特征进行域适应能力的量化评估,有助于选取更有利于跨不同域的轴承故障诊断的特征数据,有效去除干扰和冗余的特征,提高跨域故障诊断的准确率。

(2)本发明中提出的基于强化域泛化能力的改进联合分布自适应,充分考虑条件概率分布和边缘概率分布差异的同时,由于引入了集成学习,强化了分布差异的适应能力,与经典的基于特征的迁移学习方法(迁移成分分析,联合分布适应等)相比,其降低域间分布差异的能力更优,能够促进故障诊断模型泛化能力的提高。

附图说明

图1是本发明实施例流程框图。

图2是本发明实施例中stacking集成学习器原理图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达到相应技术效果的实现过程能充分理解并据以实施。本发明实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案均在本发明的保护范围之内。

显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

如图1所示,本实施例公开了一种基于域适应特征的旋转机械变工况故障诊断方法,包括以下步骤:

步骤1、获取已有工况带标签的旋转机械振动信号(图1中的工况1下采集的振动信号)、变工况下无标签的旋转机械振动信号(图1中的工况2下采集的振动信号),提取已有工况带标签的旋转机械振动信号的时频域统计特征数据作为有标签的源域特征样本集,提取变工况下无标签的旋转机械振动信号的时频域统计特征数据作为无标签的目标域特征样本集。

本实施例中,采用双树复小波包变换对旋转机械的工况1下采集的振动信号、工况2下采集的振动信号分别进行处理,实现对对应信号的分解,将得到的终端节点信号分别进行重构获得重构信号,再分别计算重构信号及其希尔伯特包络谱的18种统计参数,进而提取出已有工况带标签的旋转机械振动信号的时域和频域统计特征,以及变工况下无标签的旋转机械振动信号的时域和频域统计特征,并以已有工况带标签的旋转机械振动信号的时频域统计特征数据作为有标签的源域特征样本集,变工况下无标签的旋转机械振动信号的时频域统计特征数据作为无标签的目标域特征样本集。

具体的,对于已有工况带标签的旋转机械振动信号或者变工况下无标签的旋转机械振动信号,为从原始振动信号中有效提取故障特征,采用双树复小波包变换对对应的振动信号进行4层分解,基于第四层的终端节点的重构信号计算18种统计参数(包括均值、标准差、峭度、能量、能量熵、峰度、脉冲因数、形状因子、偏度、极值、极差、功率谱熵、奇异谱熵、近似熵、样本熵、模糊熵、排列熵、包络熵),提取288种时域统计特征。然后,计算重构信号的希尔伯特包络谱,得到的谱信号用于计算18种统计参数,提取288种频域统计特征。最后,共获得576个统计特征,即有标签的源域特征样本集包含共288种时域统计特征数据和共288种频域统计特征数据,无标签的目标域特征样本集同样包含共288种时域统计特征数据和共288种频域统计特征数据。

步骤2、基于有标签源域特征样本集中的统计特征数据,计算获得源域特征样本集中各统计特征数据的特征分类准确率acc,以表征特征的判别性能;基于源域特征样本集中正常状态下统计特征数据和目标域特征样本集中正常状态下统计特征数据,计算获得各统计特征数据的结构相似性指数SSIM和FID分数,以表征特征的域不变性。

虽然基于小波分析的时频分析方法能够从具有非平稳性的振动信号中提取故障特征,但是会造成特征集维度高,存在干扰和冗余特征,进而影响故障模式识别与分类的准确率。此外,由于旋转机械常工作于复杂工况下,会导致振动信号在不同工况下存在分布差异,且实际故障信号缺乏,进而导致故障诊断效果不佳。

对此,为了减少高维原始特征集中存在的干扰和冗余特征,选取出既有利于故障模式识别与分类且域间分布差异小的特征,故本实施例提出域适应特征选取方法DAFS-AFS。该DAFS-AFS方法从两方面角度对特征进行评价:特征的类别可分性和特征的域不变性。针对类别可分性,采用特征分类准确率acc进行量化评估;对于域不变性,将一维特征数据转换成二维数据,采用结构相似性指数SSIM(Structural Similarity)和FID(FrechetInception Distance)分数FID计算特征在不同域间的相似度,用于表征其域不变性。

具体计算过程说明如下:

(S1)、源域特征样本集中每个时频域统计特征数据的特征分类准确率acc计算。

本实施例中,使用Xgboost分类器计算源域特征样本集中每个时频域统计特征数据的特征分类准确率acc,以表征特征的判别性能,即通过特征分类准确率acc可量化源域特征样本集、目标域特征样本集中统计特征数据的判别能力。

Xgboost分类器是boosting算法的其中一种,Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。在Xgboost分类器训练时,采用源域特征样本集中的时频域统计特征数据作为训练集样本I的数据,记为I={(x

(a)定义损失函数L

公式(1)中,x

对损失函数L

其中,g

公式(2)中,L(y

其中,R

(b)对于训练集样本中的第i个数据计算g

(c)基于当前节点尝试分裂决策树,默认分数score=0,G和H分别为当前节点的一阶、二阶导数之和。

令G

G

H

其中,G

尝试更新最大的分数score如公式(8)所示:

基于最大score对应的划分特征和特征值分裂子树。

如果最大的分数score为0,则当前决策树建立完毕,计算所有叶子区域的ω

在决策树建立完毕后,使用决策树建立完毕后的XGBoost分类器计算源域特征样本集中每个时频域统计特征数据的特征分类准确率acc。当计算得到的特征分类准确率acc值越大,表征对应的时频域统计特征数据的类别可分性越高,越有利于分类。

(S2)、每个时频域统计特征数据的结构相似性指数SSIM计算。

结构相似性指数SSIM是一种度量两个给定信号或样本之间结构相似度的度量指标,其根据亮度比较函数、对比度比较函数、结构比较函数确定。其中:

特征样本集的亮度值取自其中所有统计特征数据的平均值。本实施例中,设有标签源域特征样本集为x,x中的时频域统计特征数据为x={x

公式(9)中,x

同理,设无标签目标域特征样本集为y,y中的时频域统计特征数据为y={y

特征样本集的对比度则取自其中所有统计特征数据的标准差(方差的平方根)。本实施例中,设有标签源域特征样本集的对比度(即有标签源域特征样本集中所有统计特征数据的标准差)为σ

同理,设无标签目标域特征样本集的对比度(即无标签目标域特征样本集中所有统计特征数据的标准差)为σ

设有标签源域特征样本集x、无标签目标域特征样本集y的亮度比较函数为l(x,y),则亮度比较函数l(x,y)如公式(11)所示:

公式(11)中C

设有标签源域特征样本集x、无标签目标域特征样本集y的对比度比较函数为c(x,y),则对比度比较函数c(x,y)如公式(12)所示:

公式(12)中,C

设有标签源域特征样本集x、无标签目标域特征样本集y的结构比较函数设为s(x,y),则结构比较函数s(x,y)如公式(13)所示:

公式(13)中,C

设有标签源域特征样本集x、无标签目标域特征样本集y的特征样本间协方差为σ

则最终结构相似性指数SSIM如公式(15)所示:

SSIM(x,y)=[l(x,y)]

公式(15)中,α,β,和γ为加权系数,一般取1。

公式(15)最终可简化为如公式(16)所示:

(S3)、每个时频域统计特征数据的FID分数FID计算。

本实施例利用弗朗明歇距离算法(Frechet distance),分别计算所述源域特征样本集、目标域特征样本集中每个时频域统计特征数据的FID分数FID,FID指标用于表征两个分布直接-的距离,距离越小代表两分布相似度越高,故FID越小越好。FID的计算如公式(17)所示:

按公式(16)得到结构相似性指数SSIM、按公式(17)得到FID分数后,计算

最终,得到特征分类准确率acc、结构相似性指数SSIM、FID分数FID后,根据这三个指标,对源域特征样本集、目标域特征样本集中每个时频域统计特征数据分别进行特征量化评估。

具体的,构建各统计特征数据的特征量化评估指标

本实施例中,考虑到源域特征样本集为有标签特征集,标签信息先验可得,目标域特征样本集数据除了正常状态数据外均是无标签数据,目标域特征样本集非先验,标签信息不可得,并且源域特征样本集中的统计特征数据类别与目标域特征样本集中统计特征数据类别相同,均有共288种时域统计特征数据和共288种频域统计特征数据,因此本实施例中利用源域特征样本集得到每类统计特征数据的特征分类准确率acc,然后再计算各统计特征数据的结构相似性指数SSIM和FID分数,最后构建各统计特征数据的特征量化评估指标Z。得到各统计特征数据的Z值后,对其进行降序排列,并设定特征量化评估指标的阈值,从源域特征样本集中选择Z值大于设定阈值的统计特征数据来构建对应的样本子集,以及从目标域特征样本集中选择Z值大于设定阈值的统计特征数据来构建对应的样本子集,用于后续的处理步骤。

步骤3、对步骤2得到的源域特征样本子集、目标域特征样本子集中的时频域统计特征数据进行联合分布适应,得到联合分布适应后的源域特征样本子集、目标域特征样本子集。

本实施例提出改进的联合分布适应(Improved Joint DistributionAdaptation,IJDA),对源域特征样本子集和目标域特征样本子集进行联合分布适应,以减小分布差异。改进的联合分布适应过程如下:

设有标签的源域特征样本子集

x

源域和目标域之间的边缘概率分布和条件概率分布均存在差异,即Q

IJDA算法的目标是利用D

(A)实现源域特征样本子集和目标域特征样本子集中时频域统计特征数据的边缘概率分布适应,即P

公式(18)中,X为包含源域和目标域特征样本的数据矩阵;M

边缘概率分布之间的最大均值差异MMD矩阵M

(B)实现源域特征样本子集和目标域特征样本子集中时频域统计特征数据的条件概率分布适应,即Q

公式(20)中,

M

条件概率分布之间的最大均值差异MMD矩阵M

基于上述两方面优化目标,可得改进的联合分布适应总优化目标如公式(22)所示:

公式(22)中,通过c=0,1,2,…,C实现了对式(18)和(20)两种距离的统一,公式(22)中

仅减少边缘分布的差异并不能保证域之间的整体分布差异的减小,仍需进一步考虑条件分布差异。事实上,最小化条件分布Q

本实施例中按照上述思路,基于stacking集成学习器计算条件概率分布中的目标域特征样本子集的伪标签。

如图2所示,集成学习算法是训练一系列基模型,通过某种集成原则将各模型的输出结果进行整合处理,从而获得比单一模型性能更好的一种机器学习方法。Stacking的集成原理是分层组合多种模型,迭代学习上一层模型的分类偏差,提升模型整体性能。Stacking算法可集成不同类型的模型,融合各类模型的分类特性,集成效果往往更好;同时,Stacking的分层结构可以在第1层基模型的基础上进一步学习,训练元模型,最终输出结果。Stacking集成学习模型一般为两层结构,第1层组合多个分类性能较高、差异度较大的基模型,在原始数据集上进行训练,输出各个模型的分类结果;第2层将上一层的输出结果组合成新的数据特征,在新构建的数据集上训练单个元模型,输出分类结果。

本实施例中,利用有标签的源域特征样本子集中时频域统计特征数据对stacking集成学习器进行训练,然后利用训练好的stacking集成学习模型预测所述目标域特征样本子集中时频域统计特征数据的类别标签,获得的类别标签即为目标域特征样本子集的伪标签,基于目标域目标域特征样本子集数据和相应的伪标签,计算得到条件概率分布。

步骤4、采用SVM分类器作为故障诊断分类器,利用步骤3得到的联合分布适应后的源域特征样本子集中的数据对SVM分类器进行训练,然后将步骤3得到的联合分布适应后的目标域特征样本子集中的数据输入至训练好的SVM分类器中,通过SVM分类器得到目标域的故障诊断结果。

以上结合附图详细描述了本发明的优选实施方式,本发明所述的实施例仅仅是对本发明的优选实施方式进行的描述,并非对本发明构思和范围进行限定。在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,这种组合只要其不违背本发明的思想,其同样应当视为本公开所公开的内容。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内以及不脱离本发明设计思想的前提下,本领域技术人员对本发明的技术方案作出的各种变型和改进,均应落入本发明的保护范围,本发明请求保护的技术内容,已经全部记载在权利要求书中。

相关技术
  • 一种基于改进深度子域适应网络的变工况下滚动轴承故障诊断方法及系统
  • 基于多源域类分离对抗网络的变工况机械故障诊断方法
技术分类

06120116479408