掌桥专利:专业的专利平台
掌桥专利
首页

传动系统多源监测数据的图变分自编码特征提取方法

文献发布时间:2024-04-18 19:58:30


传动系统多源监测数据的图变分自编码特征提取方法

技术领域

本公开属于传动系统故障诊断领域,具体涉及一种传动系统多源监测数据的图变分自编码特征提取方法。

背景技术

传动齿轮箱作为火炮、直升机、航空发动机等重大装备传动系统的重要部件之一,其健康状态对重大装备的运行安全与装备可靠性至关重要。随着智能运维与健康管理技术的不断发展,使用深度学习模型去构建故障特征挖掘与状态映射成为主流方法。通过将采集得到的大量正常数据与故障数据,输入深度网络进行训练,可以得到很好的分类映射模型。但现在大部分智能诊断模型均是通过单传感器数据进行训练完成,即使有少部分模型使用了多个传感器数据进行训练,其也仅仅是对单传感器数据训练出来的特征或决策结果进行简单拼接与融合,没有考虑到传感器之间的空间结构关系。传动系统零部件众多,工况恶劣,内置传感与外置传感采集信息丰富。因此,应用好所有的传感器信息对系统部件进行智能诊断,设计多源传感信息进行融合与故障特征提取策略是诊断的关键所在。

虽然现有卷积神经网络等模型可以很好的提取信号中的特征,但是其难以挖掘不同传感器信号之间的关系,也就很难对多源信息进行融合与特征提取。图神经网络可以很好的挖掘图中传感器节点的空间关系,是实现传感网络数据挖掘的天然技术思路。但常用的图神经网络存在过平滑问题,提取的融合特征较差,丢失信息较多。而基于谱方法的图神经网络一般均为直推式学习,训练图需要整个图作为输入参与,是基于某个具体的图的,换一个图信号,模型就需要从头开始训练。其泛化性一般是较差的,而泛化性又是故障诊断领域所要求的一个重点。

在背景技术部分中公开的上述信息仅仅用于增强对本发明背景的理解,因此可能包含不构成在本领域普通技术人员公知的现有技术的信息。

发明内容

针对现有技术中的不足,本公开的目的在于提供一种传动系统多源监测数据的图变分自编码特征提取方法,图注意力网络是一种归纳式学习,是一种基于空域的方法,可以泛化到别的图上,注意力机制也可以很好的对图信号进行消息传递与传感信息融合,而图变分自编码器可以更好的提取低维图嵌入信息,使得特征提取过程中信息损失的最小化,从而完成多源数据融合与故障特征的提取。

为实现上述目的,本公开提供以下技术方案:

一种传动系统多源监测数据的图变分自编码特征提取方法包括如下步骤:

步骤S100:使用多个传感器采集传动系统的故障模拟实验系统的正常信号与故障信号;

步骤S200:基于所述正常信号与故障信号根据多传感器网络图数据构造方法构造多传感图信号,并划分训练集和测试集;

步骤S300:将训练集数据输入到图注意力变分自编码器模型(GAT-VAE)中进行训练,对多模态异构图信号进行特征提取与编码,获取多模态异构图信号的低维嵌入融合特征表示;

步骤S400:将所述低维嵌入融合特征输入到全局平均池化层中进行图读出操作得到图读出特征,进而将所述图读出特征输入到全连接层分类器,与图注意力变分自编码模型GAT-VAE编码器部分协同训练与分类,并通过测试集进行测试,将测试准确率最高的模型保存为最优的多源数据融合与故障特征提取模型。

所述的方法中,步骤S100中,使用多个振动传感器采集传动系统的故障模拟实验系统的实验数据,传动系统的故障模拟实验系统模拟两种不同的转速条件,每种转速条件中包含一种齿轮正常状态与四种不同故障程度的齿轮健康状态,得到2个正常信号和8个故障信号共10种健康状态,数据采样频率均为10kHz。

所述的方法中,步骤S200中,所述多传感器网络图数据构造方法包含如下步骤:

S201:对于由τ个传感器组成的多变量时间序列X=[X

式中,∏是获得的子样本集,x表示子样本,y表示标签,n表示子样本的数量;

S202:根据所获得的子样本集∏,将每个子样本视为多传感器图网络一个节点来构造具有τ个节点的图,并通过计算余弦距离的方法寻找传感器邻居,记为RadiusGraph方法,通过RadiusGraph方法得到邻接矩阵的方法可以表示如下:

ε=-radius(x

其中,-radius(·)计算节点x

所述的方法中,步骤S300中,所述图注意力变分自编码模型GAT-VAE包括:

S30l:编码器部分使用图注意力层(GAT)与非线性激活函数(ReLU)对图信号生层一个低维特征矩阵:

其中,X为节点特征矩阵,A为邻接矩阵。

S302:第二个GAT层生成隐变量的均值μ与对数方差log σ

S303:从隐变量的均值μ与方差σ中采样出隐变量z,使模型可以继续训练:

z=μ+σ×ε,ε~N(0,1)

其中,N(0,1)表示正态分布,ε从正态分布中进行采样。

S304:对隐变量z进行GATPooling图池化:

Z=GATPooling(Z,A)

其中,GATPooling(·)表示图注意力池化层。

S305:解码器通过两层全连接层(Full Connect layers,FCLayers)解码得到节点特征向量:

X′=FCLayers(FCLayers(Z)),

S306:图注意力变分自编码模型GAT-VAE的损失函数可以表示为:

L=MSELoss(X′,X)

其中,MSELoss(·)指均方误差损失,表示为:

所述的方法中,步骤S301中,GAT层为图注意力网络,其步骤为:

S3011:根据节点特征计算节点注意力系数:

其中,

S3012:基于所述注意力系数计算方法计算多头注意力,多头注意图卷积层GAT定义为:

其中,M表示多头注意的数量,

所述的方法中,步骤S304中,GATPooling为图注意力池化层,池化后的图(X′,A′)表示为:

其中,GATConv为GAT图注意力卷积网络,Z表示通过图注意力网络获得的注意力得分,topk(·)是topk机制,topk机制可以返回最高k个注意力得分的节点,返回指数[kn],k∈(0,1),idx表示索引操作,Z

所述的方法中,步骤S305中,全连接层FCLayers表示如下:

FCLayers(X)=W

其中,W

所述的方法中,步骤S400中,读出层为全局平均池化,其将子图的节点表示转换为图表示,返回一个图嵌入:

其中,x为节点特征矩阵,r为全局平均池化后的图嵌入,N

所述的方法中,步骤S400中,全连接分类层表示为:

FCLayers(r)=W

其中,W

所述的方法中,步骤S400中,对全连接层与图注意力变分自编码模型GAT-VAE编码器部分进行训练通过交叉熵损失函数进行:

其中,M为类别数量,y

与现有技术相比,本公开带来的有益效果为:本公开能够有效地实现多传感器信号的多源数据融合能力与提取故障特征的能力,能提高重大装备传动齿轮箱故障诊断准确率,减少对故障模式进行特征工程设计的人力物力,进而得到一个端到端的故障诊断模型。

附图说明

图1是本公开一个实施例提供一种基于图注意力变分自编码器的多源数据融合与故障特征提取方法流程图;

图2是本公开一个实施例提供的齿轮箱实验台架与齿轮健康状态示意图;

图3是本公开一个实施例提供的多种模型的诊断准确率的示意图;

图4是本公开一个实施例提供的多传感诊断模型的混淆矩阵示意图;

图5是本公开一个实施例提供的多传感诊断模型的t-SNE降维可视化示意图;

图6是本公开另一个实施例提供的单传感诊断模型与多传感诊断模型诊断准确率的示意图。

具体实施方式

下面将参照附图1至图6详细地描述本公开的具体实施例。虽然附图中显示了本公开的具体实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本公开的保护范围当视所附权利要求所界定者为准。

为便于对本公开实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且各个附图并不构成对本公开实施例的限定。

一个实施例中,如图1所示,一种传动系统多源监测数据的图变分自编码特征提取方法,包括如下步骤:

S100:使用多个传感器采集故障模拟实验系统的信号,分别采集正常信号与故障信号,多个传感器要两个及两个以上,可以不仅局限于同一类传感器。

该步骤中,使用了12个振动传感器采集的数据实验,模拟了两种不同的转速条件,每种转速条件中包含一种齿轮正常状态与四种不同故障程度的齿轮健康状态,如图2所示,因此总共有10种健康状态,该任务为10类分类任务,数据采样频率均为10kHz。

S200:使用得到的数据根据多传感器网络图数据构造方法构造多传感图信号,并划分训练集和测试集;

本实施例中,使用了其中12个传感器的信号构建多传感器图信号,将多源传感信号使用RadiusGraph方法构建多传感器时空图信号,每个传感器取1024个点作为图节点特征,12个传感器则有12个节点,通过RadiusGraph生成图信号的边集与边权重。最终样本有10000个样本,每类有1000个样本,测试集与训练集按比例0.5进行划分,因此,训练集有5000个样本,每类有500个样本训练,测试集有5000个样本,每类有500个样本测试。此外,为了对比多源传感信号融合诊断的优势,取其中一个振动传感器信号作为单传感信号故障诊断使用,按单变量时间序列构图方法进行构图,使用RadiusGraph生成单传感图信号的边集与边权重。最终有1000个样本,每类有100个样本,测试集与训练集比例为1∶4,因此,训练样本有800个,测试样本有200个。

S300:将训练集数据输入到图注意力变分自编码器模型(GAT-VAE)中进行训练,对多模态异构图信号进行特征提取与编码,获取多模态异构图信号的低维嵌入融合特征表示;

该步骤中,所述图注意力变分自编码模型GAT-VAE网络架构参数如表1所示。

表1.GFA

S400:继续将所提取的图信号的低维嵌入融合特征输入到全局平均池化层中进行图读出操作,进而将图读出特征输入到全连接层分类器,与图注意力变分自编码模型GAT-VAE编码器部分协同训练与分类,并通过测试集进行测试,将测试准确率最高的模型保存为最优的多源数据融合与故障特征提取模型。

该步骤中,测试准确率定义为:在测试集上正确分类的样本数除以总样本数,具体公式表示为:

其中1[·]为示性函数,括号内的成立则为1,不成立则为0;/>

本公开实现了一种新型的传动系统多源监测数据的图变分自编码特征提取方法,通过将多源传感数据表示成图信号,结合了图神经网络强大的特征提取能力捕捉多模态传感信号的低维图嵌入,并在全模型采用了注意力机制来增强网络的表征能力,此外,结合图变分自编码器的架构也可以更好的对多模态异构异质图信号进行特征提取与编码,其可重构性也保证了特征提取过程中信息损失的最小化。

另一个实施例中,步骤S200中,所述多传感器网络图数据构造方法具体步骤为:

S201:对于由τ个传感器组成的多变量时间序列X=[X

其中,∏是获得的样本集,x表示子样本,y表示标签。n表示子样本的数量。

S202:根据所获得的子样本集∏,将每个子样本视为多传感器图网络一个节点来构造具有τ个节点的图,并通过计算余弦距离的方法寻找传感器邻居,记为RadiusGraph方法,通过RadiusGraph方法得到邻接矩阵的方法可以表示如下:

ε=-radius(x

其中,-radius(·)计算节点x

另一个实施例中,步骤S300,所述图注意力变分自编码模型GAT-VAE包含以下步骤:

S301:编码器部分使用图注意力层(GAT)与非线性激活函数(ReLU)对图信号生层一个低维特征矩阵:

其中,X为图的节点特征矩阵,A为图的邻接矩阵。

S302:第二个GAT层生成隐变量的均值μ与对数方差log σ

S303:从隐变量的均值μ与方差σ中采样出隐变量z,使模型可以继续训练:

z=μ+σ×ε,ε~N(0,1)

其中,N(0,1)表示正态分布,ε从正态分布中进行采样。

S304:对隐变量z进行GATPooling图池化:

Z=GATPooling(Z,A)

其中,GATPooling(·)表示图注意力池化层。

S305:解码器通过两层全连接层(Full Connect layers,FCLayers)解码得到节点特征向量:

X′=FCLayers(FCLayers(Z)),

S306:图注意力变分自编码模型GAT-VAE的损失函数可以表示为:

L=MSELoss(X′,X)

其中,MSELoss(·)指均方误差损失,表示为:

另一个实施例中,步骤S301中GAT层指图注意力网络,其构建步骤为:

S3011:根据节点特征计算节点注意力系数:

其中,

S3012:基于这个注意力系数计算方法,可以计算多头注意力,多头注意图卷积层GAT定义为:

其中,M表示多头注意的数量,

另一个实施例中,步骤S304中,GATPooling指图注意力池化层,池化后的图(X′,A′)可以表示为:

其中,GATConv为GAT图注意力卷积网络,Z表示通过图注意力网络获得的注意力得分,topk(·)是topk机制,topk机制可以返回最高k个注意力得分的节点,返回指数[kn],k∈(0,1),idx表示索引操作,Z

另一个实施例中,步骤S305中,全连接层FCLayers可以表示如下:

FCLayers(X)=W

其中,W

另一个实施例中,步骤S400中,读出层为全局平均池化,其将子图的节点表示转换为图表示,返回一个图嵌入:

其中,x为节点特征矩阵,r为全局平均池化后的图嵌入,N

另一个实施例中,步骤S400中,全连接分类层可以表示为:

FCLayers(r)=W

其中,W

另一个实施例中,步骤S400中,对全连接层与图注意力变分自编码模型GAT-VAE编码器部分进行训练是指通过交叉熵损失函数进行:

其中,M为类别数量,y

还需要说明的是,上述实施例中,测试准确率定义为:在测试集上正确分类的样本数除以总样本数。

下面结合图2至图6对本公开的技术方案进行进一步描述。

在一个具体的实施例中,如图2所示,在某齿轮箱故障测试实验台上进行齿轮故障诊断,具体诊断过程如下:

在某齿轮箱故障测试试验台上设置四组不同状态的齿轮实验,实验台及故障模式如图2所示,每组分别在2种转速下运行,同一状态下的数据共享同一个分类标签,每个状态下的一个图样本采用12个传感器信号进行构图得到传感网络图信号,数据集如表2所示。此外,为了展示使用多传感信号进行故障诊断的优势,取其中一个振动传感器作为单传感故障诊断进行方法对比,构图方法类似,得到的数据集如表3所示。

表2

表3

图3是关于多种模型使用多传感图信号进行深度网络训练后诊断准确率的示意图。GAT-VAE为本公开提出的诊断模型,GCN、ChebyNet为常用的谱域图神经网络,GAT、GraphSAGE为常用的空域图神经网络,GAE-M为图自编码器。以上模型设计层数、学习率、隐藏层特征维度等参数设计均一样,每个模型做十次实验取准确率的平均数作为最终模型的准确率,消除随机性影响。由图3可以看出,本公开所提出方法的诊断准确率是最高的,从而说明了所提出方案的优越性。

图4是实施例的诊断结果混淆矩阵,根据混淆矩阵的的结果可以看出,本发明所使用的模型具有很好的多源数据融合与故障特征提取能力,几乎没有诊断错误。

图5是实施例的诊断结果最后一层的特征经过t-SNE进行特征可视化,从t-SNE特征可视化图中也可以看出,本发明所使用的模型可以很好的将不同故障类型区分开来,进一步说明了本发明具有良好的多源数据融合与故障特征提取能力。

图6是使用相同的图注意力变分自编码模型GAT-VAE,输入数据集分别是多传感图信号数据集与单传感图信号数据集,进行多传感诊断模型与单传感诊断模型的诊断结果对比,其中每个模型做十次实验取准确率的平均数作为最终模型的准确率,消除随机性影响。从图中可以看出,多传感诊断模型的诊断精度比单传感诊断模型的诊断精度要高出许多,这进一步说明了使用多传感信号进行故障诊断的优势,多传感信息的冗余性与互补性可以帮助反应系统状态信息。

以上仅为本公开较佳的实施例,并非因此限制本公开的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本公开说明书内容做出的等同替换和显而易见的变化所得到的方案,均应当包含在本公开的保护范围内。

相关技术
  • 一种基于改进变分自动编码的装备退化多源数据融合方法
  • 一种基于改进变分自动编码的装备退化多源数据融合方法
技术分类

06120116505399