掌桥专利:专业的专利平台
掌桥专利
首页

一种面向工业流式数据的增量式元学习在线故障诊断方法

文献发布时间:2024-04-18 19:58:21


一种面向工业流式数据的增量式元学习在线故障诊断方法

技术领域

本发明涉及机械故障诊断技术领域,特别涉及一种面向流式数据的增量式元学习在线新故障诊断方法。

背景技术

随着现代信息技术、计算机技术及人工智能的快速发展,赋予了复杂装备越来越丰富的内涵和更加复杂的功能。然而,随着各类复杂装备不断向大型化、高速化和精密化发展,设备运行的高负荷、高腐蚀和高作业率成为主要特征,导致复杂装备容易出现不可预料的故障甚至发生灾难性事件,造成巨大的经济损失、环境污染甚至人员伤亡。因此对运行中的复杂装备进行智能诊断与健康状态监测,以确保设备安全可靠运行具有重要意义。

在工业大数据时代下,传感器技术、物联网技术和计算能力的不断提升,数据驱动的智能故障诊断技术以其可以从大量历史数据中快速学习诊断知识的特性在许多工业场景中得到了广泛的应用,并取得了较高的诊断精度和预测性能。然而,复杂装备的运行状态和性能通常伴随时间不断变化,而故障的出现往往也是逐渐发展和演变的过程,设备的运行过程会产生大批量的实时数据流,包括传感器数据、监控数据、日志数据等。工业流式数据往往具有连续性、高速性、大规模性、多样性、实时性和不确定性等特点,这些特点要求模型具备高效的数据处理和快速泛化能力,实时监测故障的演变过程,使模型具备在线更新的能力并能够实现对新生故障的精准诊断。

沈长青等在中国发明公开专利CN116108346A中公开了“一种基于生成特征重放的轴承增量故障诊断终身学习方法”,该方案用于解决现有技术在实际操作过程中工况多变且故障类型复杂多变导致的灾难性遗忘问题。然而,上述发明只解决了故障类型增量的问题,缺乏对未知新故障数据分布的泛化能力以及模型的在线更新能力。因此,有必要研究一种具备强泛化性和可持续性的故障诊断模型,利用从历史数据中学习和发现设备故障的通用特征知识,应用于实时变化的数据流中实现对未知新生故障的快速精准识别,以适应工业流式数据的动态变化和不确定性带来的挑战。

发明内容

为克服现有技术的缺点与不足,本发明提供了一种面向流式数据的增量式元学习在线新故障诊断方法,该方法通过学习任务间的通用知识使模型可以快速适应未知的新诊断任务,并设计了一种动态元更新策略用于平衡模型对新诊断知识的学习和对旧诊断知识的记忆,实现了对工业流式数据中递增故障模式的快速在线诊断。

为实现本发明目的,本发明提供的一种面向工业流式数据的增量式元学习在线故障诊断方法,具体步骤如下:

S1、采集装备在不同工况下不同故障模式的振动加速度响应信号,并将其划分为多组不同诊断阶段的故障数据集;

S2、搭建初始故障诊断模型,并通过损失函数训练获得初始模型参数;

S3、通过引入Herding算法从旧任务训练数据集中选取小批量的代表性样本存入数据缓存模块B

S4、从新阶段的联合训练数据集

S5、根据各子任务模型参数,通过动态平衡的元更新策略更新通用模型参数,并在各新旧诊断任务上测试模型性能。

进一步地,步骤S1中,将采集的样本划分为多组故障诊断任务数据集

进一步地,步骤S2中,通过标签平滑的交叉熵损失函数训练获得初始模型参数。

进一步地,步骤S2中,初始故障诊断模型

S21、对初始阶段数据集

式中,ε表示标签平滑超参数,

S22、计算标签平滑化后的交叉熵损失函数L

其中,δ

进一步地,步骤S3中,通过引入Herding算法从上一阶段随机抽取小批量的样本放入数据缓存模块B

进一步地,步骤S4具体包括以下内容:

S41、对联合训练数据集

S42、输出模型在各子任务数据集样本的概率分布,计算各个子任务的训练损失函数:

S43、在每个子任务上进行r轮迭代更新,更新时将特征映射网络f

进一步地,步骤S5具体包括以下内容:

S51、计算通用模型更新的梯度

其中,

S52、在训练过程中,要求模型在保留旧知识的同时,学习新任务,模型需要在早期的学习阶段迅速适应,在后期学习阶段避免剧烈波动,保持已经学习到的新旧任务间通用诊断知识。因此,引入一个基于动量的动态权重因子α控制模型在早期学习阶段加速梯度更新,在后期学习阶段减速学习:

式中,β为一个随学习阶段变化的衰减速率,代表模型学习新知识的速度。

S53、根据动态变化的权重因子α更新通用模型参数,使通用模型可以朝着所有特定于任务的更新的平均方向学习,保证模型能同时保证新任务和旧任务。模型更新方法如下:

S54、从各新旧诊断任务阶段联合测试数据集{B'

本发明与现有技术相比,具有以下优点和有益效果:

1、现有的数据驱动的故障诊断方法通常需要大量的训练数据帮助模型适应于新的诊断任务,同时需要消耗大量的时间和计算资源,不符合实际工业应用中流式数据在线实时故障诊断的要求。本发明方法设计了一种基于动态权值因子的元更新策略,使模型可以保持在新诊断知识学习和旧诊断知识保持之间的动态平衡,最小化模型对已学诊断知识的灾难性遗忘。

2、本发明充分考虑到模型更新过程中储存空间受限的问题,在训练过程中将特性映射网络和故障分类网络隔离开,减少干扰。特征映射网络参数在所有子任务上更新,促进模型对各个任务之间共享特征空间,增强通用特征的学习;样本分类网络参数则针对每个特定任务调优,减小新任务样本数量对模型训练的影响,缓解任务之前数据不平衡的问题。

3、本发明所构建的增量故障诊断模型通过引入元学习中“学习怎么学习”的思想,使模型可以从旧诊断知识中精炼一致性诊断知识,从而有效实现模型的在线快速更新与对连续产生的未知新故障的精准诊断,为实际工业应用中存在意外新生故障发生导致的故障模式增量化和诊断任务复杂化的场景提供了一种可行有效的解决方案,克服了工业流式数据动态变化和不确定性带来的挑战。

附图说明

图1是本发明实施例提供的面向工业流式数据的增量式元学习在线故障诊断方法的总体流程图。

图2是本发明实施案例中增量式故障诊断模型动态元更新策略的框架图。

图3是本发明方法与其他算法的增量故障分类精度对比图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都是本发明保护的范围。

请参阅图1,本发明提供的一种面向工业流式数据的增量式元学习在线故障诊断方法,具体包括以下步骤:

S1、通过加速度传感器采集装备在不同工况下不同故障模式的振动加速度响应信号,将采集的样本划分为多组故障诊断任务数据集

在本发明的其中一些实施例中,以滚动轴承为例,可能存在的故障模式包括内圈故障,外圈故障,滚动体故障等。

S2、搭建初始故障诊断模型,并通过损失函数训练获得初始模型参数。

在本发明的其中一些实施例中,采用的的损失函数为标签平滑的交叉熵损失函数。在其他实施例中,也可以采用其他损失函数,只需要训练得到模型即可。

初始故障诊断模型

S21、对初始阶段数据集

式中,ε表示标签平滑超参数,

S22、计算标签平滑化后的交叉熵损失函数,训练并更新初始模型参数:

其中,δ

S3、通过引入Herding算法从旧任务训练数据集D

在本发明的其中一些实施例中,步骤S3中,通过引入Herding算法从上一阶段随机抽取小批量的样本放入数据缓存模块B

S4、从新阶段的联合训练数据集

步骤S4具体包括以下内容:

S41、对联合训练数据集

S42、输出模型在各子任务数据集样本的概率分布,计算各个子任务的训练损失函数:

x

S43、在每个子任务上进行r轮迭代更新,更新时将特征映射网络f

S5、根据各子任务模型参数,通过动态平衡的元更新策略更新通用模型参数,并在各新旧诊断任务上测试模型性能。

步骤S5具体包括以下内容:

S51、计算通用模型更新的梯度:

其中,

S52、在训练过程中,要求模型在保留旧知识的同时,学习新任务,模型需要在早期的学习阶段迅速适应,在后期学习阶段避免剧烈波动,保持已经学习到的新旧任务间通用诊断知识。因此,引入一个基于动量的动态权重因子α控制模型在早期学习阶段加速梯度更新,在后期学习阶段减速学习:

式中,β为一个随学习阶段变化的衰减速率,代表模型学习新知识的速度。

S53、根据动态变化的权重因子α更新通用模型参数,使通用模型可以朝着所有特定于任务的更新的平均方向学习,保证模型能同时保证新任务和旧任务。模型更新方法如下:

其中,

S54、从各新旧诊断任务阶段联合测试数据集{B'

在本发明的其中一些实施例中,上述方法中模型训练及参数更新处理策略如图2所示,具体包括如下步骤:

步骤一:数据集重构。将上一诊断阶段获取的通用诊断模型

步骤二:子任务模型参数更新。首先将各个子任务数据集中的故障样本输入到模型得到其预测的类别概率分布,然后根据样本真实标签计算各个子任务的训练损失函数:

在每个子任务上进行r轮迭代得到更新后的各个旧任务和新任务模型参数{φ,θ

步骤三:通用诊断模型更新。首先根据步骤二得到的各个子任务和新任务模型参数{φ,θ

其中,

在训练过程中,要求模型在保留旧知识的同时,学习新任务,模型需要在早期的学习阶段迅速适应,在后期学习阶段避免剧烈波动,保持已经学习到的新旧任务间通用诊断知识。因此,引入一个基于动量的动态权重因子α控制模型在早期学习阶段加速梯度更新,在后期学习阶段减速学习:

式中,β为一个随学习阶段变化的衰减速率,代表模型学习新知识的速度。

根据动态变化的权重因子α更新通用模型参数,使通用模型可以朝着所有特定于任务的更新的平均方向学习,保证模型能同时保证新任务和旧任务。模型更新方法如下:

步骤四:通用诊断模型迭代更新及性能测试。当模型更新迭代次数未达到最大迭代测试e时,重复步骤一~三;当模型更新迭代次数达到最大迭代测试e时,完成通用诊断模型的训练更新,得到最后的稳定情况下的特征映射网络f

在本发明的其中一些实施例中,在公开的PU轴承故障数据集(德国帕德博恩大学提供的滚动轴承数据集)上设计了增量故障诊断实验,来验证本发明所提方法的有效性。PU轴承数据集是机械故障诊断领域最常用验证数据集之一,其实验测试装置包括测试电机、轴、轴承模块、飞轮和负载电机。实验轴承的型号为6203滚动轴承,实验数据是通过在测试装置的测试模块中安装不同损伤类型的滚珠轴承模拟的。实验运行工况中主轴转速、负载转矩和轴承径向力是三个主要变量,其中,主轴分别在1500rpm和900rpm两种转速下运行,负载转矩有0.1Nm和0.7Nm两种工况,轴承径向力分别为400N和1000N。在本实施案例中,采用了具有不同故障位置(内圈和外圈),不同损伤程度(1级和2级)以及不同故障注入方法(电刻,钻孔和电火花加工)的等8种不同类型的人工损伤轴承以测试和评估所提方法的有效性。

基于上述汽车变速器故障数据集,在实验案例中设置了多个跨工况的增量故障诊断任务,具体包括不同转速(T1-T2)、不同负载(T3-T4)、不同轴承径向力(T5-T6)、不同转速及负载(T7-T8)和不同转速及不同轴承径向力(T9-T10)。增量故障诊断实验的详细信息如表1所示,其中“N15_M07_F10”代表转速为1500rpm,负载转矩为0.7Nm,轴承径向力为1000N的工况。每种故障类型有500个样本,每个样本包含2048个数据点。每个增量故障诊断任务包括一个初始训练阶段(采用源域故障数据训练初始模型)和5个增量更新阶段(采用具有不同故障类别的多组目标域故障数据训练更新模型),初始阶段结束后,每个已知故障类别在下一阶段保留25个样本;初始阶段的故障类别数量设置为3个,在递增阶段中,每一阶段新增新故障类型数量为1个。

表1基于汽车变速器故障数据集设计的增量故障诊断实验

在模型训练更新中,采用初始学习率为0.01的RAdam优化器优化模型参数;最大训练次数e为50次;学习率分别在训练次数为20、40、60的时候乘以1/5更新一次。实施例中具体实验参数如表2所示,全部算法在Pytorch框架下进行代码编译和测试,显卡型号为NVIDIA GeForce GTX TITAN X GPU。

表2实验参数设置

本发明方法在不同递增迁移诊断任务的模型测试精度结果如表3所示。从表中可以发现,本发明方法在不同递增迁移诊断任务中均获得了较好的实验表现。具体而言,随着阶段数的不断增加,模型的诊断准确率缓慢下降,这一现象表明,随着阶段数的不断增加,新出现的故障类别数量也在不断增加,因此诊断任务的难度也在不断增加。即便如此,本发明所提出的诊断方法仍然获得了非常优秀的表现性能,这意味着本发明方法可以很好地保留从少量剩余样本中学习到的诊断知识。即使经过多个阶段,本发明方法更新得到的模型在每个任务中的诊断准确率基本都在90%以上,证明了本发明方法的有效性和鲁棒性。除此之外,初始模型采用的训练数据与增量阶段采取的训练数据采集自不同的设备,因此存在一定的数据分布差异。而本发明取得的较高的诊断精度也表明源域和目标域样本的数据分布差异得到了很好的减少。

表3不同增量故障诊断任务下模型故障诊断精度

为了进一步验证本实施例方法的优越性,在各个增量故障诊断任务上还使用了几种经典的故障诊断算法与本发明方法进行对比:

对比方法1:基准方法,仅使用特征提取器和故障分类器进行故障分类,特征提取器结构与所提方法一致,基准方法的损失函数与初始训练阶段的损失函数一致且每个增量阶段中的模型结构都与初始阶段模型一致。

对比方法2:DACNN,网络由特征提取器、标签预测器和域分类器组成,特征提取器结构与所提方法一致,通过对抗训练的策略中提取源域和目标域的域通用特征。

本发明方法和上述对比方法在各个增量诊断任务上的各阶段平均精度如图3所示(每个任务从左到右依次为发明方法、对比方法、对比方法2),可以看出本发明方法取得了最高的平均诊断精度,本发明发法可以有效解决数据驱动模型存在的灾难性遗忘问题,并且实现对工业场景中不断涌现的新生故障的快速识别与诊断。

综上所述,本发明针对来自不同设备的海量数据进行增量故障诊断时,需要解决的新生故障识别和知识灾难性遗忘等问题,设计了一种面向工业流式数据的增量式元学习在线故障诊断方法,实现了模型在多个诊断任务上的在线更新与精准故障诊断,在实际工业生产中具有较高的应用价值。

最后需要说明的是,虽然已经参照实例对本发明实施进行了详细的阐述,但本领域的技术人员容易理解,在不偏离所附权利要求中所阐述的本发明的精神和原则之内所作的任何修改、替换和改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于分布式增量型DBSCAN算法的空间数据流在线聚类方法
  • 一种面向流式数据的并行增量式关联规则挖掘方法
  • 一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法
技术分类

06120116481318