掌桥专利:专业的专利平台
掌桥专利
首页

基于混合核慢特征分析的复杂装备参数特征提取方法

文献发布时间:2023-06-19 19:28:50



技术领域:

本发明涉及复杂装备参数提取分析技术领域,具体的说是一种能够有效提取复杂装备的多种运行参数特征,进而提高分析准确率基于混合核慢特征分析的复杂装备参数特征提取方法。

背景技术:

具有大量零部件的复杂装备的运行异常检测需要通过对装备的各运行参数进行监控分析获得,例如具有大量零部件的航空发动机设备,目前国内航空公司对航空发动机进行的异常检测主要依赖发动机制造商提供的客户通知报告(Customer NotificationReport,CNR)。而客户通知报告中只提供故障发生的可能原因和气路参数偏差值,不提供具体判断模型和原理,且航空发动机的特殊性导致了故障样本极少。为了突破国外生产厂家的垄断,提高自主创新能力和核心竞争力,各航空公司和科研机构对民航发动机的气路参数进行了大量的研究,针对民航发动机气路参数原始值的异常检测具有重要意义,但气路参数原始值由于其高维度、高噪音、冗余参数多等问题,难以直接用于异常检测。

以航空发动机运行中气路参数为例,一般情况下发动机监控参数随运行环境小范围波动,性能随着飞行次数的增加逐渐衰退直到必须拆机维护,这一过程是较为缓慢的。而气路异常则会打破这一规律,异常发生时气路参数偏差值将会表现出超出正常范围的波动,如图1所示。

偏差值是经过航空发动机生产厂家根据发动机性能基线模型求出的实际值与基线的差值,偏差值比气路参数原始值平稳且纬度低。而气路参数原始值维度较高,波动较大,难以直接找出异常点。因此必须对气路参数原始值降维和特征提取,尽可能让正常数据波动平缓,异常数据波动剧烈,才能利用其得到更好的异常检测结果。

发明内容:

本发明为了从复杂装备如航空发动机运行气路参数原始值中提取随时间变化最缓慢的特征作为气路的某种本质属性,提出一种基于混合核慢特征分析的复杂装备参数特征提取方法。

本发明通过以下措施达到:

一种基于混合核慢特征分析的复杂装备参数特征提取方法,其特征在于,包括以下步骤:

首先标准化处理n条m维输入数据组成的样本数据集X

Θ=[Φ(x

如公式(23)所示,对Θ中的数据白化处理,得到公式(23),从而特征空间中的协方差矩阵

式中λ——表示特征值;

V——表示特征向量,V的所有解都位于

经过简单的变换得到公式(27),

式中V——表示特征向量,为

分别设核矩阵K和

K

式中1

将公式(25)、(28)和(31)带入公式(32),得到:

式中α——表示特征向量,α=[a

求解

/>

令矩阵.A=[α

如公式(36)所示,做进一步变换,使样本数据协方差矩阵为单位矩阵:

对特征空间的数据白化处理,则输出如公式(37)所示:

式中

则完整的白化处理后输出如公式(38)所示,且满足:E(z

当信号长度不是很大的时候,慢特征提取部分可以采用KPCA来处理,对矩阵

式中W——表示标准化权重向量,W=[w

则全部输入数据的输出如公式(40)所示:

本发明考虑到发动机性能随时间变化缓慢,慢特征分析能提取随时间变化最缓慢的特征,便可以假设使用慢特征分析所提取出的特征能够从某种程度上代表反应发动机性能的本质属性,因此本发明使用慢特征分析对气路参数原始值特征提取,以便实现针对突变异常的异常检测手段。但是慢特征分析存在一定缺陷,映射函数维度越高算法精度越高,但是计算量越大。为了降低计算量,为其引入核技巧,在原始空间中通过内积的形式表达高维空间中的信息,从而实现提高精度而不增加计算量的目的。不同的核函数有不同的特点,使用核技巧时,将多个核函数线性组合为新的混合核函数,充分利用不同核函数的特点,提高算法精度。

使用本发明方法提取出的特征具有很大的信息量;特征具有很好的异常识别能力,对突变异常效果尤为明显;提取出的特征按随时间变化速度确定,排除低效特征的影响;特征之间线性无关,避免了携带冗余信息。因此,如果慢特征分析提取出的慢特征能够代表发动机的某些本质属性,那么该特征提取方法将是一种具有广泛前景的特征提取方法。

附图说明:

附图1是发动机突变异常曲线图。

附图2是本发明中基于混合核慢特征分析的气路参数特征提取方法的原理图。

附图3是基于MKSFA的特征提取结果。

附图4是本发明实施例中气路参数原始值。

附图5是使用高斯核函数的混合核慢特征提取结果。

附图6是使用多项式核函数的混合核慢特征提取结果。

附图7是使用线性核函数的混合核慢特征提取结果。

附图8是基于PCA的特征提取结果。

附图9是基于AE的特征提取结果。

附图10是基于ICA的特征提取结果。

附图11是基于LLE的4特征提取结果。

具体实施方式:

下面结合附图和实施例,对本发明作进一步的说明。

实施例1:

本例针对现有技术中存在的难点,以航空发动机气路参数为例,提出一种基于混合核慢特征分析的民航发动机气路参数原始值特征提取方法,由于外部因素的影响气路参数原始值波动剧烈,但其性能在正常情况下是随时间缓慢衰退的,气路突变异常使得这个本应缓慢变化的过程出现剧烈波动。利用慢特征分析算法能够从气路参数原始值中提取随时间变化最缓慢的一些特征,这些特征可能代表某种反应发动机气路性能的本质属性,如果提取出的慢特征能够反映性能的突变过程,那么将其用于突变异常检测效果将会取得更好的效果。

为了从气路参数原始值中提取随时间变化最缓慢的特征作为气路的某种本质属性,提出如图2所示的基于混合核慢特征分析的特征提取算法。首先假设随时间变化最缓慢的特征能代表气路的某些本质属性,使用这一属性能够找出潜在的异常;然后将核技巧、不同核函数、慢特征分析算法结合为混合核慢特征分析算法,从气路参数原始值中提取随时间变化最缓慢的特征;最后根据特征能够明显表现出异常判断假设是否成立。

慢特征分析(Slow feature analysis,SFA)是一种从快速变化的时序信号中抽取随时间变化最缓慢特征的一种算法,已经成功应用于目标检测,非线性盲源分离等领域。慢特征分析的任务就是找到一个非线性函数f(x),输出 y(t)=f(x(t))随时间变化最缓慢的一组特征。

考虑一个I维时间序列输入:

x(t)=[x

式中t∈[t

慢特征分析算法的目标是找到如公式(2)所示的一个非线性函数:

f(x)=[f

y(t)=f(x(t))=[y

使如公式(3)所示的输出随时间变化尽可能缓慢,对于连续型输入信号,采用时间的一阶导的平方均值作为衡量变化率的度量。对于离散型输入信号,采用一阶差分的平方均值作为衡量变化率的近似度量。

当f(x)中的任意函数f

w

式中w

为得到随时间变化最缓慢的输出,该优化问题等价于:

式中=——表示定义为。

约束条件为:

式中

<·>——表示对时间求均值,如公式(10)所示。

公式(7)、(8)用来将输出信号归一化处理,同时排除无意义的常数解,公式(9)用于保证输出信号各个分量不相关,从而承载不同方面的信息,最终按次序输出随时间变化最缓慢的特征。

对输入数据做非线性映射得到一组新的输入

h(x)=[x

式中h

/>

则优化问题(1)变形为:

式中Z——代表

则优化问题存在唯一解:

式中w

因此输出变为:

y

y(t)=f(x(t))=h(x(t))W=z(t)W(18)

SFA算法的准确性依赖于非线性扩展的程度,非线性扩展越充分,算法越能够学习到系统本身的固有属性。但随着扩展函数h(x)阶数的增加,特征空间维数将指数增加,算法不再具有可计算性,影响SFA算法的应用。

核方法是一种有效利用高维非线性特征的技巧,优点在于在得到高维扩展的精度的同时只需要在原低维空间中计算,降低了计算复杂度。将核方法引入慢特征分析可以在有限的计算复杂度下极大提高SFA对非线性系统的特征提取能力。

根据Mercer定理,当核函数k(x,y)满足一定条件时,它可以重构为x,y的某个非线性映射φ的象的内积,如公式(19)所示。核方法的计算不需要知道映射φ(x)和φ(y)的具体形式,只是隐式的利用了映射函数,因此它的计算复杂度只与样本数量有关。

假设非线性映射Φ:x→Φ(x),R

K

式中x(i)——表示第i个输入数据。

只要矩阵K为半正定矩阵即可满足Mercer条件。

对于民航发动机气路参数的特征提取,一部分发动机记录了海量的数据,核函数的使用可以使我们不需要知道映射函数和特征空间的具体细节,只需要考虑样本数量带来的计算复杂度,不需要考虑高维映射函数导致的维数爆炸的问题。因此选择恰当的核函数能够使我们快速准确的计算大量气路参数输入数据。

核函数的选择对于算法精度是至关重要的。常见的核函数主要包括高斯核函数、多项式核函数和线性核函数。对于本发明研究的问题,使用单一的核函数不能满足精度需要。根据核函数的性质,多个相同特征空间中的核函数的线性组合依然是核函数,因此将以上三个核函数的线性组合作为新的混合核函数:

q≥1,且为非负整数,λ∈[0,1]

本例所述混合核慢特征分析的步骤如下所示,首先标准化处理n条m维输入数据组成的样本数据集X

Θ=[Φ(x

如公式(23)所示,对Θ中的数据白化处理,得到公式(24),从而特征空间中的协方差矩阵

式中λ——表示特征值;

V——表示特征向量,V的所有解都位于

经过简单的变换得到公式(27)。

式中V——表示特征向量,为

分别设核矩阵K和

K

/>

式中1

将公式(25)、(28)和(31)带入公式(27),得到:

式中α——表示特征向量,α=[a

求解

令矩阵.A=[α

如公式(36)所示,做进一步变换,使样本数据协方差矩阵为单位矩阵:

对特征空间的数据白化处理,则输出如公式(37)所示:

式中

则完整的白化处理后输出如公式(38)所示,且满足:E(z

当信号长度不是很大的时候,慢特征提取部分可以采用KPCA来处理,对矩阵

式中W——表示标准化权重向量,W=[w

则全部输入数据的输出如公式(40)所示:

算法的完整描述如表1所示:

表1基于混合核慢分析的特征提取算法

为验证本例方法的有效性,选取12台有异常的CFM56-5B2/3型号发动机对本发明提出的基于慢特征密度聚类的民航发动机点形式异常检测方法进行应用验证。CFM56-5B-2/3型号发动机共需要考虑包括飞行高度(ALT)、风扇转速(FS)、核心机转速(CS)、进口总温(TAT)、排气温度(EGT)、燃油流量(FF)、油液温度(OT)、油液压力(OP)和马赫数(MA)在内的九个监控数据。12台发动机总计31000余条数据,其中部分数据如表2所示,共有17个由CNR报告指出的异常样本。为了证明算法的有效性,选择了另外四个不同特征提取方法作为对照。

航空发动机原始气路参数存在不同量纲,需要对其标准化处理。为了不改变数据的分布,选用Min-max标准化(也称离差标准化)方法,如公式(41)所示:

表2 CFM-5B-2航空发动机气路参数原始值

其中min(x)表示x的最小值,max(x)表示x的最大值。通过Min-max标准化方法,将原始数据线性变换后落到[0,1]区间,同时去除量纲。

本例特征提取过程的应用如下所示:

1)首先对输入数据标准化处理;

2)随机设置初始混合核函数超参数;

3)计算特征空间上内积组成的核矩阵K

4)构建矩阵A和Λ;

5)计算白化后的输出z;

6)对矩阵

7)根据公式(40)计算完整的输出数据。

8)评估特征提取结果,优化超参数设置。当设置超参数为λ=0.5、q=32和δ=3时,数据分布已经比较理想,故不再继续调整。

经过对提取出的特征作对比,发现虽然提取出的特征互不相关,但是他们携带的异常信息极为相似,过多的增加特征的维度对异常检测精度的提升有限,只会增大计算时间。因此选择提取前五个随时间变化最缓慢的特征作为异常检测所用的航空发动机本质特征。

图3为其中一台发动机经过Min-max标准化处理的基于MKSFA的特征提取结果,其中横坐标表示数据点编号,纵坐标数据分布(已经过Max-min标准化处理),被标记“×”的点表示已知的异常点,结果表明本发明提出的方法能够有效反应气路突变异常的特点。

根据图3和图4的对比可以很明显的发现,在混合核函数的超参数设置为λ=0.5、q=32和δ=3的时候,2.3节提出的特征提取方法具有很高的可靠性,正常数据与异常数据差异明显;携带了异常检测所需要的大量信息,甚至可以通过肉眼判断出明显的异常;同时根据前面的推导,本方法提取出的特征互相不相关,具有很强的独立性。因此得出如下结论:基于MKSFA的特征提取方法提取的特征能够正确反映航空发动机气路参数的本质特征;提取出的正常和异常样本具有明显的不同;相对于原始气路参数,选择合适的MKSFA特征提取维度和异常检测算法,能够拥有更好的异常检测效果。

本例首先使用高斯核函数、多项式核函数与线性核函数的核慢特征分析特征提取结果与使用混合核函数的慢特征提取结果做对比。使用不同核函数的特征提取结果如图5、图6、图7所示,其中横坐标表示数据点编号,纵坐标表示特征提取后数据分布,标记为“×”的数据点为CNR报告中已知的异常。

根据以上结果图与图3的对比,可以很直观的发现将核函数混合后得到的特征提取结果拥有更理想的分布:正常数据分布平稳,异常数据分布较为突出。如表3所示为两台发动机使用不同核函数得到的特征提取结果的方差,使用混合核函数得到的特征提取结果的方差比单独使用核函数的方差小了一到两个数量级。

表3使用不同核函数的特征提取结果的方差

为了证明本发明提出的特征提取方法比目前已有的方法效果更好,选择主成分分析法(Principal component analysis,PCA)、自编码器(Auto-encoder, AE)、独立成分分析法(Independent Component Correlation Algorithm,ICA) 和局部线性嵌入法(Locally Linear Embedding,LLE)的特征提取结果作对比,对比结果如下所示。

如图8到图11所示为编号为697511的发动机分别基于PCA、AE、ICA和LLE的特征提取结果。其中横坐标表示数据点编号,纵坐标表示特征提取后数据分布,图中标记的“×”代表CNR报告中给出的异常点。

如表4所示为两台发动机使用不同算法的特征提取结果的方差,本发明的特征提取方法提取出的特征相对于其他特征提取方法提取出的特征,正常数据更为集中,697511号发动机的方差比其他方法的方差小一个数量级,699640号发动机由于数据量更大,慢特征提取结果更为充分,得到的方差比其他方法小两个数量级。

表4使用不同算法的特征提取结果的方差

因为航空发动机气路参数是高度相关的多维时间序列,不同参数间有复杂的联系,因此以自编码器和主成分分析法为代表的传统特征提取方法难以捕捉到参数中随时间变化的特征,特征提取过程中会损失大量必要信息,导致结果波动很大。根据不同特征提取算法的结果图和方差可以认为本发明提出的基于混合核慢特征分析的特征提取方法会在异常检测领域有更好的效果。

本例针对民航发动机原始气路参数异常检测的需要,提出一种基于混合核慢特征分析的气路参数突变异常特征提取方法。首先对慢特征分析提取出的特征的本质做出了假设,即认为其是能够代表发动机性能的某种本质属性。然后将多个核函数线性组合为混合核函数,充分利用不同核函数的优点。将慢特征分析法与混合核函数相结合,减小计算量的同时,充分利用慢特征分析法的特点,从多维时间序列中学习到随时间变化最缓慢的几个特征作为航空发动机气路参数的本质特征。最后经实验检验,混合核慢特征分析提取出的特征能够有效的区分正常样本和突变异常样本,是能够反映发动机性能突变的有效特征。对比试验表明,相比于其他的特征提取方法,本发明提出的方法提取出的特征拥有目前最好的特征提取效果,对异常区分度高,正常点波动较小,突变异常较为明显,能够应用于气路异常检测。

相关技术
  • 基于映射关系挖掘的复杂装备参数特征提取方法
  • 基于判别核慢特征分析的非线性过程故障辨识方法及系统
技术分类

06120115922189