掌桥专利:专业的专利平台
掌桥专利
首页

一种航空发动机设备的剩余寿命预测方法及系统

文献发布时间:2023-06-19 16:06:26



技术领域

本发明涉及航空发动机健康管理领域,通过对机器学习和相似性退化模型的有效结合,提出了基于SDAE神经网络和相似性退化模型融合的发动机剩余寿命预测方法。

背景技术

随着科学技术的飞速发展,机械设备的集成度、复杂度及智能化程度急剧增加,传统的故障诊断、维修保障技术逐渐难以适应新的要求。随着设备监测数据量的爆炸式增长以及存储技术、计算能力的发展,基于机器学习的数据驱动预测方法在设备剩余寿命预测中的应用研究目前越来越被关注。

由于设备传感器数量巨大,种类繁多且高频采样,导致出现了设备数据的空间维度高,依赖关系复杂,规律多变,数据量大等问题,当前很多传统的机器学习算法对设备退化特征缺乏强有力的提取能力,以及需要人工参与手动标注数据标签等问题,且基于单一机器学习模型的预测方法在面临设备繁多且工况复杂等情况时缺乏泛化能力。

航空发动机作为飞机的核心部件,其运行状态对飞机有着重要影响,对发动机进行寿命预测对于提高航空发动机安全可靠工作,保障飞机飞行安全具有重要意义。

发明内容

本发明所要解决的技术问题是,针对现有技术不足,提供一种设备剩余寿命预测方法及系统,解决现有技术预测误差较大的问题。

为解决上述技术问题,本发明所采用的技术方案是:一种设备剩余寿命预测方法,包括以下步骤:

S1、获取设备传感器采集的数据,并对数据进行预处理,将预处理后的数据拆分为训练集和测试集;

S2、利用所述训练集训练SDAE神经网络,利用训练后的SADE神经网络获取测试集中每个设备各个时间点处的设备健康指标,即得到设备健康指标曲线;

S3、利用所述设备健康指标曲线预测设备的剩余寿命。

步骤S1经过删除冗余数据处理后降低了数据的规模,提高了数据的计算效率,且通过对缺失数据的填充处理而不是直接丢弃缺失数据使得数据特征得以保留,防止失去重要数据特征。对经删除和填充后的数据进行归一化处理消除了各维度传感器数据之间的量纲影响。

步骤S2使用SDAE神经网络对设备数据进行特征提取得到设备健康指标,在不依赖专家经验和大量人工输入的情况下考虑了各维度传感器数据对结果的影响,同时SDAE神经网络能避免原始数据中存在的噪声噪声而导致的特征提取结果不佳,具有良好的鲁棒性,且SDAE神经网络具有深层结构,避免了传统浅层结构算法导致的挖掘信息能力不足、识别准确率不高等问题。

步骤S3以数据为支撑建立相似性退化模型,充分利用了历史数据,不需要建立复杂的数学模型,从样本间的相似程度预测剩余寿命,对比复杂机器学习预测模型更为简洁且通用,避免了复杂机器学习预测模型由于不同设备退化过程的随机性导致不能准确地适应测试集使得预测误差较大的问题。

步骤S1中,对数据进行预处理的实现过程包括:删除同一时间点的冗余数据,仅保留一条可用数据;采用缺失数据上、下时间点数据的平均数填充缺失数据;对经删除和填充后的数据进行归一化处理,得到预处理后的数据。经过删除冗余数据处理后降低了数据的规模,提高了数据的计算效率,且通过对缺失数据的填充处理而不是直接丢弃缺失数据使得数据特征得以保留,防止失去重要数据特征。对经删除和填充后的数据进行归一化处理是为了消除各维度传感器数据之间的量纲影响,解决数据的可比性。

步骤S1中,将预处理后的数据集划分为两个互斥的子数据集,即把数据集分割为没有交集的两个集合,其中一个数据集合用作训练集,另一个数据集合用作测试集,训练集的数据样本不会出现在测试集中,同样测试集的数据样本也不会出现在训练集中。

步骤S2的具体实现过程包括:

1)初始化SDAE神经网络结构;

2)选择训练集数据的第j个时间点处的m维样本 x

3)对数据样本x

4)将测试集数据输入到训练好的SDAE神经网络中,通过训练好的 SDAE神经网络的多个隐含层进行自适应特征提取,得到测试集中每个设备各个时间点处的设备健康指标。

步骤S2使用SDAE神经网络对设备数据进行特征提取得到设备健康指标,在不依赖专家经验和大量人工输入的情况下考虑了各维度传感器数据对结果的影响,同时SDAE神经网络能避免原始数据中存在的噪声噪声而导致的特征提取结果不佳,具有良好的鲁棒性,且SDAE神经网络具有深层结构,避免了传统浅层结构算法导致的挖掘信息能力不足、识别准确率不高等问题。

步骤S3的具体实现过程包括:根据测试样本的设备健康指标曲线与训练样本对应的设备健康指标曲线的欧氏距离度量测试样本与训练样本的相似程度,并基于所述相似程度和训练样本的剩余寿命预测测试样本的剩余寿命;所述测试样本指从测试集中提取的某一待预测样本,训练样本指从训练集中提取的所有样本。

步骤S3以数据为支撑建立相似性退化模型,充分利用了历史数据,不需要建立复杂的数学模型,从样本间的相似程度预测剩余寿命,对比复杂机器学习预测模型更为简洁且通用,避免了复杂机器学习预测模型由于不同设备退化过程的随机性导致不能准确地适应测试集使得预测误差较大的问题。

利用测试样本对应的设备健康指标曲线与训练样本对应的各设备健康指标曲线的欧式距离最小值对应的设备编号,判断测试样本对应的设备健康指标曲线与训练样本对应的各设备健康指标曲线相似程度;其中,测试样本对应的设备健康指标曲线与训练样本对应的各设备健康指标曲线的距离最小值对应的设备健康指标曲线编号

测试样本基于训练样本的预测剩余寿命的计算公式为:

其中,

本发明中,

本发明还提供了一种设备剩余寿命预测系统,其包括计算机设备;所述计算机设备被配置或编程为用于执行上述方法的步骤。

与现有技术相比,本发明所具有的有益效果为:

1)本发明提出了基于机器学习与相似性退化模型融合的数据驱动方法用于预测设备剩余寿命,通过SDAE神经网络的强大特征提取能力,大大减少了预测过程的人为参与度,并有效提高了预测方法在不同场景下的适应力;

2)基于相似性退化模型的模型融合预测方法很好的解决了由于不同设备退化过程的随机性导致模型不能准确地适应测试集使得预测误差较大的问题;

3)通过间接预测策略实现对设备剩余寿命的准确预测,在间接预测策略中,预测需要先构建出设备健康指标曲线,再对设备健康指标曲线多步或迭代预测,最终预测剩余寿命值,预测结果能够较好地接近真实寿命值。

附图说明

图1是本发明堆叠降噪自动编码器的结构图。

图2是本发明相似性退化模型的结构图。

图3是本发明特征提取步骤的流程图。

图4是本发明的算法流程图。

具体实施方式

本发明方法选择发动机传感器数据进行发动机退化特征提取。针对传感器数据中包含大量复杂的退化特征,传统的特征提取方法往往依靠人工来处理,本发明方法利用堆叠去噪自编码器较好地解决在缺乏足够的先验知识以及因此难以进行人工类别标注的成本太高的问题,同时去噪自编码器具备降噪能力,面对复杂的工作环境下监测数据中夹杂的噪声,可有效提高预测精度。同时基于相似性退化模型的预测方法很好的解决了由于不同设备退化过程的随机性导致模型不能准确地适应测试集使得预测误差较大的问题。

本发明方案的理论依据如下:

1.自动编码器的提出:

单个的自动编码器是一种分三层的无监督神经网络,分为输入层-隐含层-输出层,目的是尽可能的复现输入信号,让输出值等于输入值,网络分为编码网络与解码网络两个部分,对输入数据加入噪声干扰则变成去噪自动编码机,如图1 所示。以去噪自动编码机为例,训练过程中去噪自编码机会通过编码网络对加入噪声后的数据进行编码,之后利用解码网络对编码结果进行解码,生成的重构数据与原始输入的差作为重构误差,利用梯度下降算法进行训练。

对于单个去噪自动编码机,如给定一个设备数据样本集

通过随机映射函数q

其中编码函数f

h

式中s

θ={W,b} (16)

W是输入层到隐含层的权重,b是偏置项。

之后隐含层输出h

式中g

θ′={W′,b′} (18)

W′是隐含层到输出层的权重,b′是偏置项。并且为了简化权重梯度下降的计算,有W′=W

自动编码机通过最小化x

L(x

采用最小均方差作为代价函数,且利用梯度下降的方法将误差函数

2.相似性退化模型:

基于相似性退化模型的预测方法属于数据驱动方法,其主要思想可以表述为:如果测试样本与参考样本有相似的退化性能,则它们可能有相似的剩余寿命。测试样本指从尚未失效的设备(测试设备)中提取的样本,参考样本指从运行在相同工作条件下已经失效的设备(训练设备)中提取的历史样本。

图2描述了基于相似性退化模型的剩余寿命总体框架。训练阶段,首先对训练设备传感器数据进行特征提取,将其映射为一维设备健康指标HI,拟合各训练单元随时间变化的设备健康指标曲线以表示退化过程。然后从设备健康指标曲线中提取子曲线放入参考样本库中供剩余寿命估计使用。测试阶段,对测试设备传感器数据进行相同的处理提取测试样本,将测试样本与参考样本库匹配,预测剩余寿命。

具体地,本发明实施例预测方法步骤如下:

1)数据预处理:首先对数据进行预处理,包括数据冗余及数据缺失处理、 K-means归一化处理、训练集和测试集的划分。

2)特征提取:设定SDAE的层数、网络批量处理数、加噪率,利用SDAE 神经网络对设备退化过程进行特征提取,融合设备传感器多维参数数据形成单维参数数据作为训练集设备的设备健康指标。

3)剩余寿命预测:对得到的设备健康指标曲线进行滑动平均处理以减小局部噪声,利用相似性退化模型拟合设备性能退化趋势,预测设备的剩余寿命。

步骤(1)中数据预处理步骤如下∶

处理来自设备传感器的多维数值型数据中的数据冗余的方法是直接删除同一时间点的冗余数据,只保留一条可用数据;数据缺失处理为将缺失数据填写为缺失数据上下时间点数据的平均数;K-means归一化处理对原始数据所属工况聚类后归一化到[0,1]区间内,消除各传感器之间量纲差异;训练集和测试集的划分为留出法,其中留出法为直接将数据集划分为两个互斥的部分,即把数据集分割为没有交集的两个集合,其中一个数据集合用作训练集,另一个数据集合用作测试集,训练集的数据样本不会出现在测试集中,同样测试集的数据样本也不会出现在训练集中。通常训练集和测试集的比例为70%:30%。同时,训练集测试集的划分有两个注意事项:1.尽可能保持数据分布的一致性。避免因数据划分过程引入的额外偏差而对最终结果产生影响;2.采用若干次随机划分避免单次使用留出法的不稳定性。

步骤(2)中特征提取步骤如下∶

1)初始化SDAE网络结构,如设置好SDAE的层数,每层节点数等,其中 SDAE网络结构为多个去噪自编码器(Denoising Auto Encoder,DAE)堆叠组成。

2)选择经过归一化后的训练集数据的第j个时间点处的m维样本 x

3)利用逐层训练算法训练隐含层,提取深层特征,其训练流程图如下,对数据样本x

式中,式中

式中

重复这个过程,直到DAE

式中

由于设备的传感器数据包含了设备从正常运行状态到退化状态全过程的重要信息,可以作为设备状态的直接反应,而隐含层N的输出是输入多参数传感器数据的最佳一维数据表示,可作为设备的健康状态表征,则设备在第j个时间点处的设备设备健康指标HI为:

5)当在测试集上进行验证时,将测试数据输入到训练好的SDAE网络中中通过多个隐含层进行自适应特征提取,得到测试集中每个设备各个时间点处的设备健康指标。

步骤(3)中剩余寿命预测步骤如下∶

目前存在着两类数据驱动的剩余寿命预测策略:直接预测和间接预测。前者利用历史状态监测数据及各类试验数据,直接建立原始数据与剩余寿命值的映射关系。而间接预测需要先构建出设备健康指标曲线,再对设备健康指标曲线多步或迭代预测,最终预测剩余寿命值。

y

(5)

HI

(6)

y

(7)

式中,x

本发明结合SDAE神经网络与相似性退化模型采用上文所述的间接预测策略,通过SDAE神经网络对系统退化状态建模,进而获取设备健康指标曲线,之后通过相似性退化模型对设备剩余寿命进行估计,建立从设备健康指标曲线外推到最终剩余寿命值的间接预测模型。

步骤(3)中寿命预测应用的相似性退化模型的主要思想可以表述为:如果测试样本与训练样本有相似的退化过程,则它们可能有相似的剩余寿命。测试样本指从测试集中提取的某一待预测样本,训练样本指从训练集中提取的所有样本。

训练样本中设备i的设备健康指标曲线与测试样本的设备健康指标曲线的距离关系由一个数组S

S

其中

式中:矩阵H

式中

d

此时训练样本i的第d

由于设备健康指标作为设备健康状态的反映,相似的设备健康指标曲线意味着相似的剩余寿命,因此可将训练样本i在运行时长为d

训练样本i在运行时长为d

RUL

结果即测试样本基于训练样本i的预测剩余寿命。

训练样本集中的每个设备i都可以为测试样本生成一个预估的剩余寿命,测试样本的最终剩余寿命通过基于n个训练样本获得的各个剩余寿命的加权进行计算,训练样本i中的最佳匹配曲线与测试样本设备健康指标曲线的欧式距离

权重函数应为单调递减函数,在本发明中权重函数w

本发明实施例中使用的数据集来自C-MAPSS,C-MAPSS是由NASA开发的基于仿真的大型商用涡扇发动机从开始运行到失效的数据。

具体到数据时,数据有27列,每一行表示发动机在某个时间点处的监测数据,第1列表示引发动机编号;第2列表示时间点;第3-5列表示3个操作条件的设置;第6-27列表示发动机上21个传感器的监测值。

首先,本发明实施例定义x

由于设备在运行时处于不同工况,不同工况之间设备运行数据差距很大,因此,需要对不同的工况进行识别再进行归一化处理。主要是以K-means聚类在计算方面时间短,速度快且思想简单容易解释等优点将输入的发动机数据按工况聚类后进行归一化处理。将归一化处理对原始数据归一化到[0,1]区间内,消除各传感器之间量纲差异,本实施例的方法采用线性函数归一化,归一化方法为:

本实施例方法将传感器在时间t时的数据归一化到[0,1],由原始数据x

由于传感器数据为21维,则输入SDAE神经网络数据维度即为21,且隐含层 N的节点数已确定为设备健康指标单参数维度为1,只有中间层层数多少与节点个数作为影响SDAE性能的超参数,需要进行调整,以SDAE模型数据重构误差为指标。重构误差值越小,SDAE模型的特征提取效果越好。经过多次试验确定网络结构为21-10-5-1-5-10-21,网络批量处理数量为256,数据加噪率为0.1,损失函数定义为Mse,优化算法为Adam,全部数据的迭代次数为50,依次将数据的训练集设备和测试集设备带入神经网络进行训练与测试。

本实施例使用了三种不同的预测误差计算公式,其中MAE是绝对误差的平均值。它能更好地反映预测误差的实际情况,定义如下:

MSE是平方误差的平均值。它可以评估数据的变化程度,定义如下:

累积相对准确度(CRA),CRA能够通过汇总相对预测精度来综合评估预测方法的准确性。给定剩余寿命预测结果,CRA值计算公式如下:

式中,w

K是从预测时间起点t

其中ActRUL(t

为了检验该模型对设备剩余寿命的预测能力,并考虑到测试集中大部分发动机运行时长在150h-200h,且由于设备在运行末期更容易出现故障从而对生产工作产生重大影响,因此我们选取预测时间起点t

同时为了验证本发明的有效性,本实施例介绍了两种常用的构建设备健康指标时的数据驱动方法作为对比,即在构建设备健康指标时基于PCA的方法和基于BP网络的方法;以及两种常用的预测RUL时使用的模型作为对比,即基于 LSTM网络的方法和基于BP网络的方法。测试集中的多个发动机的RUL预测结果如表1所示。

表1多个发动机的剩余寿命预测结果

技术分类

06120114707951