掌桥专利:专业的专利平台
掌桥专利
首页

一种基于类不平衡的小样本轴承故障诊断方法

文献发布时间:2023-06-19 09:52:39


一种基于类不平衡的小样本轴承故障诊断方法

技术领域

本发明涉及振动信号分析技术领域,尤其是一种基于类不平衡的小样本轴承故障诊断方法。

背景技术

滚动轴承是旋转机械设备中具有广泛应用的关键部件之一,其健康状态会影响设备的安全稳定运行。由于工况复杂、环境恶劣等原因容易造成部件损坏,导致设备停机停产,甚至造成人员伤亡;同时,故障特征容易被噪声淹没,特征提取困难,故障诊断性能不佳;因此,有效提取出轴承信号中的重要信息,成为实现故障诊断的前提。

由于诊断的装备量大、面广、每台装备测点多、数据采样频率高等特点,推动故障诊断领域进入了“大数据”时代。智能故障诊断是大数据驱动下保障旋转机械平稳可靠运行的重要手段,为了准确识别装备的健康状态,智能诊断需要依靠充足的可用监测数据,训练智能故障诊断模型。在实际工况下,旋转机械长期处于正常服役状态,很难一次性获得现场所有的故障类型。正常样本丰富、故障样本匮乏,导致轴承样本数据处于类不平衡状态,即故障样本远少于正常样本。

目前,解决类不平衡分类问题的策略可以分为数据层面和算法层面两大类,数据层面是改变训练集的样本分布,降低不平衡程度;算法层面考虑不同误分类情况代价的差异性,对算法进行优化,使得该算法在类不平衡数据下也能有较好的诊断效果。但算法方面对各类故障的代价敏感权重不易确定,影响后续故障诊断性能。

发明内容

本发明需要解决的技术问题是提供一种基于类不平衡的小样本轴承故障诊断方法,研究类不平衡程度对故障诊断性能的影响,采用滑动窗口进行数据切分,扩充样本量,提高样本点的利用率;利用深度卷积神经网络提取信号特征,结合集成学习分类算法实现故障分类,提高故障诊断性能。

为解决上述技术问题,本发明所采用的技术方案是:

一种基于类不平衡的小样本轴承故障诊断方法,包括以下步骤:

步骤1,对滚动轴承原始振动数据进行采样获取原始振动信号,设置不同的类不平衡程度,构造不同类不平衡比率下的数据集,研究不平衡比率对故障诊断性能的影响;

步骤2,利用滑动窗口对获取的原始振动信号进行数据切分,将一条原始振动信号样本切分为多条具有相似特性的小样本,提高原始振动信号样本点的利用率,实现数据增强处理;

步骤3,将数据增强处理后的新样本作为输入,利用深度卷积神经网络提取信号特征;利用Adam算法实现梯度下降,解决稀疏梯度和噪声问题;

步骤4,利用集成学习中的投票分类方法,对原本由一条原始振动信号数据切分得到的多个样本进行分类,投票选出标签数量最多的类别作为原始样本的标签,提高故障分类的准确率;同时利用多个指标评估故障诊断效果。

本发明技术方案的进一步改进在于:步骤1中,所述滚动轴承原始振动信号包括正常信号、内圈故障信号、外圈故障信号、滚动体故障信号。

本发明技术方案的进一步改进在于:步骤1中,所述类不平衡比率下的数据集包括多数类的正常样本和少数类的故障样本;采用如下方式构造类不平衡比率下的数据集:

面向类不平衡故障诊断研究,实验构造不同类不平衡率R下的数据集;

R=N

其中,N

将类不平衡比率下的数据集输入到深度卷积神经网络中,通过softmax分类层进行故障诊断与分类,分析类不平衡比率对故障诊断性能的影响。

本发明技术方案的进一步改进在于:步骤2中,所述数据增强处理具体包括:

根据采样频率、电机转速和单样本长度要求,选择合适尺寸的滑动窗口和滑动步长对原始振动信号进行切分;将原始振动信号重构为指定长度的样本,以便样本的扩充与模型的构建;利用轴承故障信号的周期性,沿着一维时间信号进行窗口的滑动;其中,所述原始振动信号是指利用加速度计采集的振动加速度信号,包含健康轴承及各种故障状态下的轴承信号;切分后的样本数量计算如下:

其中,N表示单个样本长度,n表示窗口长度,m表示滑动步长,X表示切分后的新样本数量。

本发明技术方案的进一步改进在于:步骤3中,深度卷积神经网络包括输入层、若干个卷积层、池化层和全局平均池化层。

本发明技术方案的进一步改进在于:步骤3中,所述提取信号特征具体包括:

利用深度学习知识构造深度卷积神经网络,通过多层卷积与池化提取信号特征;其中,采用Adam算法计算梯度的一阶矩估计和二阶矩估计,为不同的参数设计独立的自适应性学习率;

一阶矩估计和二阶矩估计的计算公式为:

m

v

Adam的更新规则为:

其中,η表示步长,θ

本发明技术方案的进一步改进在于:步骤4中,通过集成学习投票法对样本进行分类,识别故障类型,具体步骤如下:

采用硬投票分类算法,选择输出最多的标签,如果标签数量相等,则按升序的次序进行选择,公式如下:

其中,i表示第i个样本,X表示扩增后的样本量,y

由于采用了上述技术方案,本发明取得的技术进步是:

1、本发明直接对一维原始信号进行特征提取和识别,避免了将原始数据转换为频域数据时信息缺失的问题。

2、本发明研究类不平衡程度对故障诊断性能的影响,使研究更贴切于实际应用。

3、本发明采用的数据增强处理方法能够扩大样本量,提高样本点的利用率,进而提高模型对信号的特征提取能力,研究适用于小样本情形。

4、本发明采用的集成学习分类算法基于大数定理,所得结果要高于预测模型序列中任何一个最优模型的准确率。

附图说明

图1是本发明诊断方法的流程图;

图2是本发明中加速度传感器获取的振动信号时域波形图;

图3是本发明类不平衡程度对故障诊断性能研究结果平衡数据集诊断准确率示意图;

图4是本发明类不平衡程度对故障诊断性能研究结果不平衡数据集诊断准确率示意图;

图5是本发明滑动窗口切分数据效果图;

图6是采用本发明的数据增强与集成学习投票分类方法后的类不平衡数据集的故障诊断准确率结果图;

图7是本发明处理前t-SNE可视图;

图8是本发明处理后t-SNE可视图。

具体实施方式

本发明是针对现有技术中算法方面对各类故障的代价敏感权重不易确定,影响后续故障诊断性能等问题而研发的一种基于类不平衡的小样本轴承故障诊断方法。

下面结合附图对本发明做进一步详细说明:

一种基于类不平衡的小样本轴承故障诊断方法,其特征在于:包括以下步骤:

步骤1,对滚动轴承原始振动数据进行采样获取原始振动信号,设置不同的类不平衡程度,构造不同类不平衡比率下的数据集,研究不平衡比率对故障诊断性能的影响;

所述滚动轴承原始振动信号包括正常信号、内圈故障信号、外圈故障信号、滚动体故障信号。

所述类不平衡比率下的数据集包括多数类的正常样本和少数类的故障样本;采用如下方式构造类不平衡比率下的数据集:

面向类不平衡故障诊断研究,实验构造不同类不平衡率R下的数据集;

R=N

其中,N

将类不平衡比率下的数据集输入到深度卷积神经网络中,通过softmax分类层进行故障诊断与分类,分析类不平衡比率对故障诊断性能的影响。

步骤2,利用滑动窗口对获取的原始振动信号进行数据切分,将一条原始振动信号样本切分为多条具有相似特性的小样本,提高原始振动信号样本点的利用率,实现数据增强处理;

所述数据增强处理具体包括:

根据采样频率、电机转速和单样本长度要求,选择合适尺寸的滑动窗口和滑动步长对原始振动信号进行切分;将原始振动信号重构为指定长度的样本,以便样本的扩充与模型的构建;利用轴承故障信号的周期性,沿着一维时间信号进行窗口的滑动;其中,所述原始振动信号是指利用加速度计采集的振动加速度信号,包含健康轴承及各种故障状态下的轴承信号;切分后的样本数量计算如下:

其中,N表示单个样本长度,n表示窗口长度,m表示滑动步长,X表示切分后的新样本数量。

步骤3,将数据增强处理后的新样本作为输入,利用深度卷积神经网络提取信号特征;利用Adam算法实现梯度下降,解决稀疏梯度和噪声问题;

所述提取信号特征具体包括:

利用深度学习知识构造深度卷积神经网络,通过多层卷积与池化提取信号特征;其中,采用Adam算法计算梯度的一阶矩估计和二阶矩估计,为不同的参数设计独立的自适应性学习率;

一阶矩估计和二阶矩估计的计算公式为:

m

v

Adam的更新规则为:

其中,η表示步长,θ

步骤4,利用集成学习中的投票分类方法,对原本由一条原始振动信号数据切分得到的多个样本进行分类,投票选出标签数量最多的类别作为原始样本的标签,提高故障分类的准确率;同时利用多个指标评估故障诊断效果。

通过集成学习投票法对样本进行分类,识别故障类型,具体步骤如下:

采用硬投票分类算法,选择输出最多的标签,如果标签数量相等,则按升序的次序进行选择,公式如下:

其中,i表示第i个样本,X表示扩增后的样本量,y

具体的:

如图1所示,一种基于类不平衡的小样本轴承故障诊断方法,包括以下步骤:

(1)对滚动轴承故障信号进行采样,并设置不同的类不平衡程度,构造不同类不平衡比率下的数据集,类不平衡数据集由多数类的正常样本和少数类的故障样本构成。依据类不平衡数据集研究类不平衡程度对故障诊断性能的影响;将不平衡数据集输入到深度卷积神经网络中,通过softmax分类判断故障诊断性能。

(2)利用滑动窗口对原始信号进行数据切分实现数据增强。

(3)将数据增强后的新样本作为输入,利用深度卷积神经网络提取信号特征。

(4)利用集成学习中的投票法,对原本由一条数据切分得到的多个样本进行分类,选择输出最多的标签,如果标签数量相等,则按升序的次序进行选择,公式如下:

其中,i表示第i个样本,X表示扩增后的样本量,y

如图2所示,为本发明获取的振动信号时域波形图。通过加速度传感器获得滚动轴承在不同运行状态下的多组振动信号,包括正常运行状态、内圈故障运行状态、外圈故障运行状态以及滚动体故障运行状态。数据集是在以采样频率为12.8kHz,电动机转速1920r/min下采集的振动信号。

如图3、4所示,通过平衡数据集与不平衡数据集的故障诊断准确率,研究类不平衡程度对故障诊断性能的影响。其中,平衡数据集为从每类振动信号中随机截取100组采样数据作为样本数据,每组信号长度为6000个采样点,得到滚动轴承在不同运行状态下的400组振动信号。不平衡数据集是根据实验需求设置不同的类不平衡比率,并构造相应的类不平衡数据集。

如图5所示,采用滑动窗口切分方法,将一条原始样本切分为多条尺寸相同,特性相似的新样本,实现数据增强。切分后的样本数量为:

其中,N表示单个样本长度,n表示窗口长度,m表示滑动步长,X表示切分后的新样本个数。

如图6所示,为采用本发明的数据增强与集成学习投票分类方法后的类不平衡数据集的故障诊断准确率。类不平衡比率分别为0.2,0.4,0.6,0.8,1。由图可知,本发明所提方法极大地改善了类不平衡数据集的故障诊断性能。

如图7、8所示,为不平衡率R为0.2时,利用t-SNE算法将提取的全局平均池化层的故障特征降到二维平面,并以散点图呈现的可视化图,通过t-SNE可视图可以观察到使用本发明方法前后的类不平衡数据集的类间分布与类内分布的距离变化,进而对比使用本发明前后的故障特征提取与分类效果。

综上所述,本发明直接对一维原始信号进行特征提取和识别,研究类不平衡程度对故障诊断性能的影响,采用数据增强处理方法扩大样本量、提高样本点的利用率,利用深度卷积神经网络提取信号特征,结合集成学习分类算法实现故障分类,提高故障诊断性能。

相关技术
  • 一种基于类不平衡的小样本轴承故障诊断方法
  • 一种小样本下基于元学习的复杂工况轴承故障诊断方法
技术分类

06120112334979