掌桥专利:专业的专利平台
掌桥专利
首页

一种重型装备数据预处理的故障诊断方法

文献发布时间:2024-04-18 19:58:30


一种重型装备数据预处理的故障诊断方法

技术领域

本发明属于重型装备控制技术领域,尤其涉及一种重型装备数据预处理的故障诊断方法。

背景技术

重型装备的工作状态直接影响着整个矿山磨矿系统运行的状态。重型装备控制具有流程响应大滞后性、控制系统大惯性、多变量强耦合性、工作机理复杂等特点。所以重型装备检测数据呈现多维且高耦合的特点。多维体现在重型装备工况复杂,需传感器监测的部位多,所以其检测数据维数较高,随着检测数据维度的增大,检测数据在空间中的分布也变得稀疏,如果不对其进行处理,将会产生“维数灾难”。耦合性强体现在重型装备所产生的数据分布呈现出“强耦合性与强分散性”的特点,即检测温度数据强耦合性,而流量、压力、电流、振动等数据又呈现强分散性,强耦合与强分散数据同时出现,这也加大了故障诊断的难度。由于重型装备工业数据维度高,直接进行故障诊断,导致诊断时间长,且容易陷入“维度灾难”。由于重型装备工业数据相关性强,数据间具有较强的耦合性,直接进行故障诊断导致故障诊断准确率低。因此,如何针对重型装备工业数据进行正确处理,保证数据的完整结构,成为了重型装备故障诊断一大难点。

发明内容

鉴于现有技术的上述缺点、不足,本发明提供一种重型装备数据预处理的故障诊断方法,解决重型装备数据维度高耦合性强导致诊断准确率低的问题。

为了达到上述目的,本发明采用的主要技术方案包括:

一种重型装备数据预处理的故障诊断方法,包括如下步骤:

步骤S01:获取重型装备故障诊断数据集;

步骤S02:将采集好的重型装备故障诊断数据集进行数据清洗,检查数据异常值和缺失值,缺失数据通过取近十组数据信息的平均值进行填补,异常值直接删除异常数据,将清洗好的数据通过MS-UMAP降维,将降维后的数据用于DNN模型的输入;

步骤S03:将降维后的重型装备故障诊断数据集分为训练集和测试集,通过训练集采用贝叶斯优化算法对全连接神经网络的超参数优化求解,获取最优故障诊断模型;

步骤S04:设置DNN模型的激活函数,根据贝叶斯优化之后的最优超参数组合构建DNN模型,通过测试集对训练好的最优DNN故障诊断模型进行故障诊断测试。

进一步地,所述步骤S01中,通过PLC在现场获取重型装备故障诊断数据集。

进一步地所述步骤S02中,所述MS-UMAP降维具体步骤如下:

采用改进的UMAP算法,获得改进后的原始数据空间的方向相似性度量,构建原始高维空间度量,改进的UMAP算法公式如下:

式中p

采用公式(8)构建低维嵌入空间:

式中:q

利用公式(9)将公式(6)和(8)的两个空间联系起来,使二者差距缩到最小,即两个空间最相似,完成降维;

式(9)中C

进一步地,所述步骤S03具体步骤如下:

将降维后的重型装备数据的70%作为训练集,把DNN超参数的寻优视作黑盒模型问题,如下式表示:

其中

选择高斯过程作为贝叶斯优化的代理模型

式中m(x)为均值函数,k(X,X′)为协方差函数,

式中E[·]表示期望,f

本发明的有益效果是:本发明的重型装备数据预处理的故障诊断方法是基于改进UMAP的马氏距离MS-UMAP降维模型和贝叶斯优化全连接神经网络模型组成的基于数据预处理的故障诊断模型,通过对原始模型的改进,提高了重型装备故障诊断精度和准确率。

附图说明

图1为本发明的重型装备数据预处理的故障诊断方法流程图。

具体实施方式

为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。

本发明提供了一种重型装备数据预处理的故障诊断方法,如图1所示,包括如下步骤:

步骤S01:获取重型装备故障诊断数据集;具体为通过PLC在现场获取重型装备故障诊断数据集。

步骤S02:将采集好的重型装备故障诊断数据集进行数据清洗,检查数据异常值和缺失值,缺失数据通过取近十组数据信息的平均值进行填补,异常值直接删除异常数据,将清洗好的数据通过MS-UMAP降维,将降维后的数据用于DNN模型的输入。

将采集好的数据进行数据清洗,审查数据集,了解数据集中每个数据变量的含义。检查数据异常值和缺失值,对于数据异常值采用直接删除相应数据的方法,对于缺失值,通过取近十组相对应数据的平均值对其进行填补,将清洗好的数据放入MS-UMAP进行数据降维。Ms-umap降维是通过原始输入数据空间构建低维嵌入空间,然后用交叉熵缩小两个分布之间的差异使得低维嵌入空间中的点的相似性与原始输入数据空间中的点近似,以此来实现降维。设重型装备数据样本

式中||·||

p

p

σ

因UMAP原始模型使用欧氏距离作为原始输入数据空间的距离度量,但是重型装备工业数据呈现高维且耦合性强,欧式距离只能单纯计算两个数据点之间的距离而没有考虑其相关性,所以使用欧式距离作为原始输入数据空间的距离度量并不能保证重型装备数据降维后的质量,所以采用具有相关性度量的Mahalanobis距离作为原始输入数据空间的距离度量。Mahalanobis距离考虑了不等方差以及特征之间的相关性,通过数据点的特征分配不同的权重或重要性因子来充分地评估距离。因此,提出改进的MS-UMAP算法。假设x

可得马氏距离:

式(5)中Σ

只有当特征不相关时(此时协方差矩阵等于1),马氏距离度量下的距离才与欧氏距离度量下的距离相等。

改进UMAP算法是在原始样本空间度量样本之间的相似性时用马氏距离代替欧式距离,改进后的相似性表达式为:

式(6)是改进后的原始数据空间的方向相似性度量。为了具有关于i和j的对称度量,需要将其对称化为:

公式(7)中p

构建完高维空间度量后接下来进行低维嵌入空间的构建。设低维点的嵌入为

式(8)中q

式(9)中的第一项是吸引相邻点的嵌入朝向彼此的吸引力。第二项是排斥非相邻点的嵌入彼此远离的排斥力。通过缓慢地减小吸引力和排斥力来保证收敛到局部最小值。对公式(9)拆解可得公式(10):

通过式(10)中可以看到第一个和只取决于p

式(11)中第一项基于采样的方法进行优化,通过对p

步骤S03:将降维后的重型装备故障诊断数据集分为训练集和测试集,通过训练集采用贝叶斯优化算法对全连接神经网络的超参数优化求解,获取最优故障诊断模型。

通过改进UMAP的MS-UMAP算法降维后的重型装备数据导入到全连接神经网络模型(DNN)对其进行故障诊断。DNN是多层隐藏层的全连接神经网络,包括输入层,隐含层和输出层。每层网络包含多个神经元,以全连接方式相连,深度神经网络将上一层的输出特征作为下一层的输入,以此实现特征的映射来学习数据特征的规律。设置DNN模型的输入层神经元数为降维后的重型装备故障样本维数,输出层神经元数为诊断的故障类型数,激活函数设置为ReLU函数。给定降维后的重型装备故障数据集(x,y)x∈R

y=σ(ω

式(12)中x

其中

因为待评估目标函数评估代价高昂且复杂,所以用概率代理模型近似的表示当前的目标函数,概率代理模型从最初的先验知识出发,通过不断的增加数据观测点来完善模型,本文采用的概率代理模型为高斯过程。

高斯过程(Gaussian Process,GP)被定义为在连续域上多元高斯分布的扩展,能从少量的先验知识中获取准确的预测值,并提供了不确定性。其中任意随机变量的线性组合都服从正态分布,由均值函数m(x)和协方差函数k(x,x′)定义:

m(x)=E[f(x)] (14)

k(x,x′)=E[(f(x)-m(x))(f(x′)-m(x′))] (15)

式(14)和式(15)中f(·)为目标函数,E[·]代表期望。

高斯过程表达为:

f(x)~GP(m(x),k(x,x′)) (16)

已知重型装备训练集D={(x

考虑到DNN模型y

式中

加入新的观测样本X

式中T为矩阵转置,K(X,X)为协方差矩阵,K(X,X

μ(x

σ

期望μ(x

采集函数确定下一次在哪里采样来引导搜索达到目标函数的最优。通过查询概率代理模型中已知高适合度区域和置信度高的区域的样本来选择下一个采样点。其数学表达式如下:

x

在选择下一个采样点时,一般会选择均值较高的区域和置信区间比较宽的区域。应用EI算法作为采集函数对模型采样。

EI(Expected Improvement)表示寻找比最优点期望更大的点,表达式如下

式中E[·]表示期望,f

通过与最优点x

公式(24)带入公式(23)转换得:

通过概率代理模型和采集函数,对DNN故障诊断模型进行贝叶斯优化,寻找到最优的模型参数,将MS-UMAP降维好的参数导入到DNN模型,完成重型装备故障诊断。

步骤S04:设置DNN模型的激活函数为ReLU函数,根据贝叶斯优化之后的最优超参数组合构建DNN模型,通过测试集对训练好的最优DNN故障诊断模型进行故障诊断测试。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员对上述实施例进行改动、修改、替换和变型均属于本发明的范围内。

相关技术
  • 一种适用于燃煤电站环保装备运行数据的高效数据预处理方法
  • 一种DPF损坏故障诊断系统,方法及重型柴油车
技术分类

06120116501788