掌桥专利:专业的专利平台
掌桥专利
首页

一种融合报警事件和趋势事件的序列相似性分析方法

文献发布时间:2024-04-18 19:58:21


一种融合报警事件和趋势事件的序列相似性分析方法

技术领域

本发明涉及工业过程故障监测与诊断领域,尤其涉及一种融合报警事件和趋势事件的序列相似性分析方法。

背景技术

随着工业系统设备的更新换代,设备之间的连接愈发复杂,使得控制系统的复杂性日益增长,导致监控过程中的决策任务变得困难。为了避免意外停机,需要利用收集到的过程数据信息进行对比分析。在报警系统中,当过程信号的数据超出设定的报警阈值时视为发生报警。故障的发在通常会产生一系列的规律报警或趋势变化。报警条件通常伴随着过程信号的异常变化作为前兆,这些变化不仅反映在过程信号的幅度上,还反映其方向上。因此,幅值变化和趋势变化都是过程信号不可忽略的特征。由于相同故障可能会引起相似的报警或者趋势变化序列,可以引入序列相似性分析来有效区分不同故障。

现有面向复杂工业过程的事件序列相似性分析方法主要针对报警序列,其反映的是过程数据的幅值变化特征。目前,报警序列的相似性分析方法的研究内容主要包括成对序列的相似性分析、多序列比对、跨设备的序列比对、报警序列在线比对及预测方法等。上述方法都是通过对过程信号设定报警阈值来生成报警信号,然后按时间顺序提取报警事件进而得到报警序列;最后将其与历史报警序列数据库做相似性比对,同一故障的报警序列往往具有较高的相似度,进而通过聚类或者分类方法区分故障。

但由于设备的复杂化,其内部变量之间的强耦合性,同一变量在不同故障下可能导致相似的报警信号,这会导致不同故障的报警序列相似度较高难以区分的情况。因此,为了获得更优的故障区分效果,设计一种融合报警事件和趋势事件的序列相似性分析方法,以提高运行过程中的决策效率和生产率。

发明内容

为了解决上述问题,本发明提供了一种融合报警事件和趋势事件的序列相似分析方法,以实现故障区分。面向实际工业过程采集的原始数据,经过数据预处理得到质量较高的分析数据;通过设定报警阈值,生成多值报警信号后提取报警事件;使用定性趋势分析的方法提取预处理后的过程信号的趋势特征,生成定性趋势信号后提取趋势事件;将报警事件和趋势事件进行融合得到多特征事件和序列;采用改进的史密斯-沃特曼算法(Simth-Waterman,SW)进行序列比对得到不同序列之间的相似度大小;采用层次聚类方法对不同故障的特征融合序列进行聚类,用于故障区分。

本发明方法包括以下步骤:

S1、针对设备过程信号,从幅值上提取报警序列;

S2、针对设备过程信号,从方向上提取趋势序列;

S3、融合所述报警序列与所述趋势序列,得到融合序列;

S4、对融合序列进行相似性计算和聚类分析,得到不同故障类别。

本发明提供的有益效果是:在不同故障的报警序列高度相似难以区分时能实现更好的故障区分,可以满足实际工业实时监测及诊断的决策需求。

附图说明

图1是本发明方法流程示意图;

图2是报警序列的相似性热力图;

图3是融合序列的相似性热力图;

图4是报警序列的层次聚类图;

图5是融合序列的层次聚类图;

图6是报警序列

图7是融合序列

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。

请参考图1,图1是本发明系统结构示意图。

本发明提供了一种融合报警事件和趋势事件的序列相似性分析方法,包括:

S1、针对设备过程信号,从幅值上提取报警序列;

步骤S1具体如下:

S11、对过程信号采用小波去噪,得到时间序列数据x(t)=[x(1),x(2),…,x(N)];根据时间序列数据,得到多报警状态x

S12、从多报警状态中,采用ε采样的闭合延迟定时器,消除抖振报警,得到消除抖振报警后的状态;

S13、从消除抖振报警后的状态中分别提取单个过程变量的报警事件,后按事件先后顺序排列整合所有报警事件,构成报警序列。

作为一种实施例而言,工厂一般通过对设备中众多过程变量的数据进行收集、提取与分析,以此尽可能安全地监控系统运行状态。监测设备将过程数据的当前值与设定的报警阈值进行比较,当其数据大于或者小于报警阈值时,视为发生报警。

典型的二值报警信号为:发生报警视为1,正常为0。二值报警信号有两种表达形式,一是将整个报警期间都视为发生报警,其他视为正常,二是只将报警发生时刻视为发生报警,其他时间视为正常。报警信号的生成时常会伴随着抖振报警的出现,可能会导致提取到的报警序列并不准确,进而影响序列比对的相似度结果。为避免相似性分析误差较大,应首先移除抖动警报。消除干扰报警得到关键性报警后再提取报警事件和报警序列。

步骤具体如下:

(1)报警信号的生成:过程数据通过小波去噪得到时间序列数据x(t)=[x(1),x(2),…,x(N)],取一定样本数量n的正常运行数据,其均值为

利用3δ原则进行报警阈值(T

本发明采取多报警状态:高报警(1)、低报警(-1)、正常(0),定义如下

(2)干扰报警的消除:常用的抖振消除技术包括滤波器、延迟定时器和死区,其中延迟定时器可以直接应用于报警信号。利用ε采样的闭合延迟定时器能够较好消除抖振报警,其定义如下

其中,k=t-ε,t-ε+1,...,t-1,ε为闭合延时器的样本数量。

(3)报警事件和序列提取:先分别提取单个过程变量的报警事件,后按时间先后顺序排列整合所有报警事件构成报警序列。

在本发明中,报警事件定义为变量在某时刻发生了某种报警类别,用a

表1为一个工业故障的报警序列示例:第一列为变量标签,如Tag.12表示监测的第12个变量;第二列为报警类别,如高报警用HI表示,低报警用LO表示;第三列为报警事件发生时间。

表1工业故障的报警序列示例

S2、针对设备过程信号,从方向上提取趋势序列;

步骤S2具体为:

S21、利用均值和方差法检验过程信号的平稳性,得到非平稳时间序列;

S22、对非平稳时间序列,利用PLR进行趋势提取,得到趋势分段;

S23、根据趋势分段,对趋势进行定性分类,包括快速上升、上升、下降、快速下降和平稳五种趋势;

S24、分别提取单个过程变量在故障期间的趋势事件,后按时间先后顺序整合所有趋势事件,构成趋势序列,并对趋势序列,按趋势分段进行合并。

作为一种实施例,现代工业厂房通常存储着丰富且海量的数据,但能从中提取到的有效信息较少。报警信号是针对过程信号在幅值上的征进行提取的,因此,也需要针对过程信号在方向上的特征(即趋势变化)进行提取。分段线性表示(Piece-wise linearrepresentation,PLR)是一种常用且有效的趋势提取技术之一,其原理是将一个长时间序列用多个数据段分开,每个数据段都用直线进行表示,这样处理能将过程信号潜在的趋势变化提取出来。定性趋势分析(Qualitative Trend Analysis,QTA)是分析过程信号趋势变化的有效工具,其目的是将过程信号的趋势变化进行提取并定性表达,从而便于比对分析。

由于不同过程变量的数据在故障发生期间会呈现不一样的趋势变化,有些过程变量的数据变化会很明显,而有些会比较平稳。因此,在进行趋势提取之前需要对过程变量的数据进行平稳性检测。若检测结果为非平稳,则对其进行趋势提取并定性表达。通过PLR得到的连续两个或多个数据段,其定性的趋势变化可能一样。但趋势事件的提取针对的是数据段之间发生趋势变化的时间点,因此,对连续两个或者多个趋势变化相同的趋势事件进行合并是一个很好的解决办法。随后,趋势序列的提取过程与报警序列提取类似。

具体步骤如下:

(1)平稳性检测:利用均值和方差的方法来检验数据的平稳性。对于时间序列x(t)=[x(1),x(2),…,x(N)],N为时间序列的长度,将其分为L个连续的段,用[P

其中,σ

(2)趋势提取:对非平稳的时间序列利用PLR进行趋势提取。将x(t)分成M个首尾相连的数据段,则第m个数据段将表示为[x(1:t

其中,t∈[t

而段数M的索引函数表述为

这本质上是指数η

(3)趋势定性表达:时间序列通过PLR进行趋势提取后,常用上升、下降、平稳的趋势变化来定性表达。由上述假设的线性回归模型可知,

由于上升或下降的速率是有快有慢的,因此,本发明将对趋势变化定性为五种情况:快速上升(2),上升(1),下降(-1),快速下降(-2),平稳(0)。趋势信号定义如下

其中,

(4)趋势序列提取:先分别提取单个过程变量在故障期间的趋势事件,后按时间先后顺序整合所有趋势事件构成趋势序列。在本发明中,趋势事件定义为变量在某时刻发生了某种趋势变化,用q

表2为基于表1的工业故障的趋势序列示例:第一列为变量标签,如Tag.22表示监测的第22个变量;第二列为趋势类别,如UUP表示快速上升,UP表示上升,DDN表示快速下降,DN表示下降,ST表示平稳;第三列为趋势事件发生时间。

表2工业故障的趋势序列示例

(5)趋势段合并:对单个过程变量进行趋势事件的提取,按时间先后顺序进行排列趋势事件得S

S3、融合所述报警序列与所述趋势序列,得到融合序列;

步骤S3具体如下:

S31、构建特征事件f

S32、所述融合序列为:

需要说明的是,在实际工业生产过程中,报警序列由一定规律或者一系列按时间顺序排序的报警信号组成。序列相似性分析常用来反映成对序列或者多序列之间的相似程度,具有高度相似性的序列往往是由同一个故障或者异常引起的。通过比对不同报警序列之间的相似度水平,有助于操作员分析这些报警序列模式,以此来判断最有可能产生该报警的原因并制定出相应的策略。上述两个的主要步骤S1、S2主要是为了得到故障期间的报警事件与趋势事件。本发明的最终目的是对融合序列进行相似性计算和聚类分析,因此,需要融合报警事件和趋势事件得到融合序列。

在本发明中,特征事件定义为变量在某时刻发生了某种特征变化,包括报警和趋势变化,用f

融合表1和表2可以得到如表3所示的融合序列。在报警序列和趋势序列中,存在着变量标签相同但代表意义不同的情况。例如,Tag.12为表1中的含义为:在故障类型一发生时,监测到第12个过程变量信号发生高报警;而在表2中的含义为:在故障发生时,监测到第12个过程变量信号发生快速上升的趋势变化。因此,变量标签需要加以区分,如Tag.12A表示的是第12个过程变量发生的是报警事件,Tag.12T表示的是第12个过程变量发生的是趋势事件。

表3工业故障的融合序列示例

S4、对融合序列进行相似性计算和聚类分析,得到不同故障类别。

步骤S4具体为:

S41、对多种融合序列,采用改进SW法进行相互比对,得到相似度矩阵;

步骤S41具体如下:

S411、计算融合序列f

其中,α和β分别为匹配和不匹配分数,

S412、找找到匹配分数矩阵H中的最大值,按得分路径回溯得到序列S1和S2的局部最优匹配;

S413、利用相似度指标

其中,m

S414、对多组融合序列采用步骤S411~S413进行相互比对,得到多个相似度,构成相似度矩阵。

S42、根据相似度矩阵,采用层次聚类法进行聚类,得到不同类别。

需要说明的是,目前,序列比对算法分为全局序列比对算法和局部序列比对算法两大类,在工业领域里通常使用局部序列比对方法。本发明采改进的SW算法,其本质上是利用时间戳信息在报警发生时间彼此接近时模糊了报警序列中变量的顺序,使其对报警顺序不再敏感。这样处理的好处是能够在大量报警几乎同时发生的情况下,发现序列之间更多的相似部分。通过序列比对得到序列之间得相似度矩阵,采用层次聚类方法对其进行聚类,观察聚类树并利用纯度(Purity)评价指标来衡量聚类效果。

以传统的Simth-Waterman(SW)算法为例,对于序列

其中,i=1,2,…,n

其中,α和β分别为匹配和不匹配分数。通常,α>0,β<0,δ<0,且α>max(|β|,|δ|)。为了优先选择有间接对齐,而不是错配,参数应该设置为β<2δ<0。

改进的SW算法原理如下,假设报警类型一共有Z种,时间权重

其中,|t

对于H中的每一项

得到H后对其进行回溯,即从分数最大的一项开始,根据得分路径进行回溯,找到局部最优匹配。

最后,通过一个相似度指标

本发明采用

步骤S42中的层次聚类法具体如下:

①将每个对象归为一类,共得到N类,每类仅包含一个对象。类与类之间的距离就是它们包含的对象之间的距离;

②找到最接近的两个类合并成一类,于是总的类数减少一个;

③重新计算新类与所有旧类之间的距离;

④重复以上两个步骤,直到最后合并成一个类为止;

⑤根据选择的不同距离,可将层次式聚类方法分为单链接、全链接和均链接等聚类方法。

为了评估分层聚类的性能,本发明采用一个基于密度的纯度指数评价指标。聚类纯度的总体思想是用聚类正确的样本数除以总的样本数,它常被称为聚类的准确率。对于聚类后的结果并不知道每个簇所对应的真实类别,因此需要取每种情况下的最大值。纯度的计算公式定义如下:

其中,N表示样本总数,c

最后,作为一种实施例,本实施例基于TEP模型设计仿真实验,验证方法的有效性。

(1)数据采集

所采用的数据来源于TEP模型,该模型已经被广泛认为是控制和监测研究的基准。TEP仿真模型是一个化工厂的现实模拟程序,它定义了20种故障类型(Disturbances模块可设定不同的故障),允许进行52次测量(41个过程变量,11个操作变量)。在TEP仿真模型结构图中,对这20种故障类型及其加入的时间可以通过仿真模型预先设定,如正常工况时是0,故障1是第一位数字设为1,其他是0;依次加入故障,故障20是第二十位数字设为1,其他是0。TE过程中共有15种已知故障,还有5种没有确定的未知故障,其中故障1~7是与阶跃变化有关的故障,故障8~12是与方差增大有关的故障,故障13是由反应器中反应速率发生缓慢漂移导致的,比较适合用于故障预测,而故障14、15是由于阀门失灵导致的故障。

在本实例中,采样周期设为168h,采样频率设为3min/次。通过调整Disturbances模块在不同的时间点加入不同故障类型,选取6种故障类型进行测试,分别为故障一(F1)、故障二(F2)、故障六(F6)、故障七(F7)、故障八(F8)以及故障二十(F20)。同一故障下产生4组过程数据,6种故障共产生24组数据,其中,故障持续时间为1h和2h分别两条。具体如表4所示。

表4故障数据记录

(2)获取报警序列和融合序列

选取前22个过程变量,首先,对过程信号设置报警阈值得到报警信号,利用闭合延时器干扰报警进行消除,同时,对过程信号进行平稳性检测,对非平稳型号利用PLR进行趋势提取并定性表达;然后,对报警事件和报警序列进行提取,同时,对相同趋势段进行合并对趋势事件和趋势序列进行提取;最后,将报警事件和趋势事件进行融合得到新的特征序列,即融合序列。

(3)基于序列比对的相似性计算

利用改进的SW算法,对不同故障的报警序列和融合序列进行序列比对。首先,调整合适的参数,在满足能间隙对齐的同时使空位罚分取小一些;然后,记录得分路径,以便回溯找到最优匹配结果;最后,通过计算相似度指标

(4)事件序列聚类分析

为了更直观地观察相似性结果,对上一步骤中得到的报警序列和融合序列的相似度矩阵并对其进行层次聚类,获得层次聚类树以观察故障区分结果。图4和图5为报警序列和融合序列的层次聚类图,表5和表6分别为报警序列和融合序列的聚类结果表。

表5报警序列的聚类结果表

表示第i

表6融合序列的聚类结果表

表示第i

如图4所示,这里存在不同故障的报警序列相似且无法区分的情况,例如,

由图可知,

上述的层次聚类结果和序列比对结果分析表明利用融合序列进行相似性分析相较于仅靠报警序列进行相似性分析是具有更好的故障区分能力。因此,可以认为所提出的融合报警事件和趋势事件的序列相似性分析方法对于不同故障序列的区分是很有效的。

本发明的有益效果是:在不同故障的报警序列高度相似难以区分时能实现更好的故障区分,可以满足实际工业实时监测及诊断的决策需求。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 基于事件序列关联融合的业务识别与风险分析方法及系统
  • 一种音频帧序列到事件标签序列的声音事件标注方法
技术分类

06120116483395