掌桥专利:专业的专利平台
掌桥专利
首页

一种基于生成对抗网络的循环水泵导轴承异常检测方法

文献发布时间:2024-04-18 20:01:30


一种基于生成对抗网络的循环水泵导轴承异常检测方法

技术领域

本发明涉及轴承异常检测技术领域,特别涉及一种基于生成对抗网络的循环水泵导轴承异常检测方法。

背景技术

循环水泵为辅助冷却系统提供冷却水,是核电厂第三回路循环水系统中重要的动力设备。导轴承是循环水泵中的关键旋转部件之一,对循环水泵的平稳运行起重要作用,其单边间隙一旦超过设计要求,会导致叶轮碰损,甚至造成机组功率下降、异常停机等问题,造成巨大经济损失。因此,针对循环水泵导轴承的监测信号进行精确、直观的异常检测,能够有效评估设备的运行状态,降低经济损失,提高核电机组的安全性。

循环水泵属于结构复杂的非线性系统,对其运行规律和机械结构进行建模,难度大,检测精确度低。针对海量监测数据进行信号处理,依赖专家经验,检测效率低。基于深度学习的无监督异常检测方法在不引入人工经验的前提下,能够快速实现端到端的异常检测,在设备异常检测领域得到快速发展。

在实际工业场景中,由于设备运行平稳、监测数据量庞大,导致异常数据稀缺、数据标注成本高。其次,数据夹杂大量噪声信号,数据集分布复杂,导致基于数据驱动的异常检测方法难以全面获取健康状态下样本分布信息,异常检测精确率较低。因此,在数据集不平衡的情况下,开展针对循环水泵导轴承的无监督异常检测方法研究,具有重要的工程应用价值。

发明内容

本发明的目的在于提供一种基于生成对抗网络的循环水泵导轴承异常检测方法,以解决现有技术存在的问题。本发明在无故障样本的情况下,通过构建生成对抗网络自动提取正常样本分布特征,实现无监督异常检测,不依赖人工经验,增强样本重构效果,提高异常检测的效率和精确率。

为达到上述目的,本发明采用如下技术方案:

基于生成对抗网络的循环水泵导轴承异常检测方法包括,

步骤1:使用加速度传感器采集循环水泵导轴承运行状态数据,对运行状态数据进行数据预处理并划分训练集和测试集,其中,训练集只包含正常样本,测试集包含正常样本和异常样本;

步骤2:使用自编码器和生成对抗网络构建异常检测模型;

步骤3:使用所述训练集对所述异常检测模型参数进行更新训练,使生成器具有正常样本分布重构能力,判别器具有样本分布判别能力;

步骤4:使用训练好的生成器重构所述测试集,联合测试样本的重构误差和所述判别器输出概率分布计算异常指标;

步骤5:采用3σ准则设定所述异常指标的报警阈值,筛选测试集中的异常样本。

所述的循环水泵导轴承异常检测方法中,所述数据预处理包括数据分割、归一化和标签化;

数据分割为:使用长度固定的滑动时窗无重叠截取运行状态数据,公式如下:

x

式中x

对运行状态数据进行归一化处理,公式如下:

式中y为归一化后的样本,c为输入的运行状态数据,min(·)为取最小值函数,max(·)为取最大值函数;

对归一化的样本进行分类标签化:标签为1表示正常样本,轴承在正常运行状态下的健康信号,标签为0表示异常样本,轴承发生故障时的异常信号;

划分标签化的样本,从正常样本中选取预定比例作为训练集,其余正常样本和全部异常样本作测试集。

所述的循环水泵导轴承异常检测方法中,异常检测模型包括生成器和判别器,生成器由编码器En和解码器De构成,编码器En和解码器De都是由双向长短时记忆网络和全连接层组成,编码器En提取输入样本x的潜在变量编码z

判别器D

所述的循环水泵导轴承异常检测方法中,步骤3包含以下步骤:

步骤3.1,从训练集中取n个样本x={x

步骤3.2,判别器D

式中L

步骤3.3,将正常样本x的潜在变量编码z

式中L

步骤3.4,当判别器D

式中L为生成器的损失计算函数,||x-De(En(x))||

所述的循环水泵导轴承异常检测方法中,步骤4包含以下步骤:

步骤4.1,将测试集中某一个样本p={p

步骤4.2,采用动态时间规整算法计算输入样本p和重构样本

式中p

得到距离矩阵,公式为:

借助动态规划算法,求解D中d(1,1)至d(n,n)的最优规划路径,使路径上的d之和最小,公式为:

R

式中r

为了确定规划路径位置r

γ(i,j)=d(i,j)+min[γ(i-1,j-1),γ(i-1,j),γ(i,j-1)]

式中γ(i,j)为d(1,1)至d(i,j)的最优规划路径上的距离之和,γ(0,0)=0,γ(i,0)=γ(0,j)=∞;

p和

步骤4.3,得到所有测试集样本的重构误差RE(p)和判别器D

式中

计算测试集异常指标,公式为:

式中α(p

所述的循环水泵导轴承异常检测方法中,步骤5中,计算测试集中所有样本的异常指标α={α

式中AD(p

与现有技术相比,本发明具有以下优势:

1.本发明在无故障样本的情况下,仅需要大量轴承健康状态数据训练模型,有效地解决了循环水泵导轴承故障数据稀缺导致异常检测精确度不足的问题,符合工程实际背景。

2.本发明提出了新颖的生成对抗网络模型,构造了多个判别器以增强生成器拟合正常样本的能力,利用Wasserstein-1距离和循环一致性损失训练模型,有效地缓解了生成器梯度消失的问题,提高了生成器的样本重构能力和判别器的识别能力,提高了异常检测的精确度。

3.本发明联合动态时间规整算法和判别器输出概率分布计算样本异常指标,增加了正常样本与异常样本的区分度,提高了模型对异常信号的检测能力。

4.本发明实现了端到端的异常检测,直接将待测样本输入到训练好的生成器中,计算重构样本的异常指标,筛选异常数据,提高了检测效率。

附图说明

图1为本发明方法的流程图;

图2为本发明所构建模型的结构示意图;

图3为本发明异常指标构建过程示意图;

图4(a)为随机抽样得到的一个正常样本时域图;

图4(b)为模型训练好后,一个正常样本通过生成器重构后的时域图;

图5(a)为随机抽样得到的一个异常样本时域图;

图5(b)为模型训练好后,一个异常样本通过生成器重构后的时域图;

图6为根据报警阈值,对测试集样本进行检测的结果示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明,以便本领域的技术人员更好地理解本发明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。为了便于描述,附图中仅示出了与有关发明相关的部分。还需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

参见图1至图6所示,一种基于生成对抗网络的循环水泵导轴承异常检测方法包括以下步骤:

步骤1:使用加速度传感器采集循环水泵导轴承运行状态数据,对原始数据进行数据分割和归一化。将样本分类标签化,划分训练集和测试集,训练集只包含正常样本,测试集包含正常样本和异常样本;

由于循环水泵导轴承是旋转部件,加速度信号能够良好的反映轴承运行状态信息,因此,本发明使用加速度信号作为原始数据。以循环水泵试验台轴承预制故障实验为例对本发明所述的技术方案进行详细的描述。加速度信号由数据采集卡不间断采样,采样频率为10240Hz。在轴承正常运行状态中,信号采集时长为600秒,采样长度为6144000个点。预制故障轴承运行时,信号采集时长为40秒,采样长度为409600个点。使用长度为L=2048的滑动时窗从时间序列中无重叠截取样本,获得3000个正常样本和200个异常样本,公式如下:

x

式中x

对数据样本进行归一化处理,公式如下:

式中y为归一化后的样本,c为输入的原始数据,min(·)为取最小值函数,max(.)为取最大值函数。

对归一化的样本进行分类标签化,具体为:标签为1表示正常样本,即轴承在正常运行状态下的健康信号,标签为0表示异常样本,即轴承发生故障时的异常信号。

划分样本,选取标签为1的2500个正常样本作为训练集,其余500个正常样本和标签为0的200个异常样本作测试集。

步骤2:使用自编码器和生成对抗网络构建异常检测模型;

图2所示为异常检测模型的结构示意图。生成器部分,生成器由编码器En和解码器De构成,编码器En和解码器De都由双向长短时记忆网络和全连接层组成。编码器En提取输入样本x的潜在变量编码z

判别器部分,判别器D

异常检测模型网络结构如表一所示,网络的层数和单元数目可以根据输入样本的长度和复杂程度进行相应的更改。

表一:生成对抗网络结构信息表

步骤3:使用步骤1中的训练集对步骤2中异常检测模型的参数进行更新训练,使生成器具有正常样本分布重构能力,判别器具有样本分布判别能力;

从训练集中取n个样本x={x

如图2所示,判别器D

式中L

将正常样本x的潜在变量编码z

式中L

生成器通过学习正常样本的分布,实现对正常样本的不失真重构。当判别器D

式中L为生成器的损失计算函数,||x-De(En(x))||

异常检测模型训练好,为了形象地展示生成器具有针对正常样本的重构能力,参见图4(a)至图5(b)所示。从样本集中随机抽取一个正常样本和一个异常样本,正常样本的时域图与将其输入到生成器后得到的重构样本的时域图高度相似,而生成器重构异常样本得到的时域图与原样本的时域图存在明显差异。说明生成器对正常样本具有不失真重构能力,但是在重构异常样本时,导致信号数据丢失。

步骤4:使用步骤3中训练好的生成器重构步骤1中的测试集,联合测试样本的重构误差和步骤3中判别器输出概率分布计算异常指标。

图3所示为异常指标构建示意图,将测试集中某一个样本p={p

采用动态时间规整算法计算p和

式中p

得到距离矩阵,公式为:

借助动态规划算法,求解D中d(1,1)至d(n,n)的最优规划路径,使路径上的d之和最小,公式为:

R

式中r

为了确定规划路径位置r

γ(i,j)=d(i,j)+min[γ(i-1,.j-1),γ(i-1,j),γ(i,j-1)]

式中γ(i,j)为d(1,1)至d(i,j)的最优规划路径上的距离之和,γ(0,0)=0,γ(i,0)=γ(0,j)=∞。

p和

得到所有测试集样本的重构误差RE(p)和判别器D

式中

为了增强异常指标感知重构样本与输入样本之间分布差异的能力,联合重构误差和判别器D

式中α(p

步骤5:采用3σ准则设定步骤4中异常指标的报警阈值,筛选测试集中的异常样本。

计算测试集中所有样本的异常指标α={α

式中AD(p

图6为测试集异常检测结果,黑色虚线为上限阈值,超过阈值的样本被检测为异常样本,低于阈值的样本被视为正常样本,检测准确率为96.1%,得到表二的混淆矩阵。

表二:混淆矩阵

本实例对比了本发明与其他3种无监督生成对抗网络模型,模型细节如下:

1)本方法:具有两个判别器,损失函数为Wasserstein-1距离和循环一致性损失的生成对抗网络。

2)GAN:具有一个判别器,损失函数为JS散度的生成对抗网络。

3)LSGAN:具有一个判别器,损失函数为皮尔森卡方散度的生成对抗网络。

4)WGAN:具有一个判别器,损失函数为Wasserstein-1距离的生成对抗网络。

在相同的训练条件下,GAN、LSGAN和WGAN网络生成器梯度易消失,模型难以收敛,而本方法通过改进网络结构和损失函数缓解了梯度消失问题,增强了模型训练的稳定性,生成器重构正常数据分布的能力更强。如表三所示,本方法在准确率、精确率、召回率和F1分数上具有显著优势,结果充分表明了所提出的基于生成对抗网络的循环水泵导轴承异常检测方法的有效性。

表三:异常检测结果

尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

相关技术
  • 一种基于数据驱动的精密运动台静态解耦矩阵校正方法
  • 一种基于数据驱动的精密运动台静态解耦矩阵校正方法
技术分类

06120116561199