掌桥专利:专业的专利平台
掌桥专利
首页

网络告警信息处理方法、装置及设备

文献发布时间:2023-06-19 19:07:35


网络告警信息处理方法、装置及设备

技术领域

本发明涉及信息技术应用技术领域,尤其是涉及一种网络告警信息处理方法、装置及设备。

背景技术

在网络系统中,网元种类繁多,网络结构复杂,在网络运行的过程中,众多的设备会产生海量的告警,运维人员要从这些告警中提取信息,分析问题,排查故障,工作量十分庞大,因此对告警进行关联与压缩在网络运维中有重要的作用,它有助于运维人员高效地对网络进行维护,减少工单的派单量。

目前的网络运维中,通常是先挖掘频繁项,再在频繁项中挖掘告警之间的关联关系,丢掉了出现频率较低的告警,而有一些重要的告警往往出现频率较低。另外,有许多频繁出现的告警是不影响业务的,类似数据中的“噪声”,而基于频繁项挖掘仅考虑告警出现的频率关系,挖掘出的关联关系包含了大量的“噪声”,对现网运维的帮助较小。

发明内容

本发明的目的在于提供一种网络告警信息处理方法、装置及设备,用以解决通过现有方式获取到的告警之间的关联关系不够准确的问题。

为了达到上述目的,本发明提供一种网络告警信息处理方法,包括:

获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;

基于M条所述网络告警信息,构建告警语料;

根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量;

根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵。

其中,基于M条所述网络告警信息,构建告警语料,包括:

将N条网络告警信息的每条网络告警信息中的网管告警标识,按照时间先后顺序排序后,组成目标告警句子,所述N条网络告警信息为M条所述网络告警信息中属于同一资源容器内且在同一时间窗内的网络告警信息,其中,M≥N≥2,且N为正整数。

其中,组成目标告警句子之前,所述方法还包括:

若存在第一网管告警标识不在预设词汇表中,则利用预设的第一特殊词语替代所述第一网管告警标识,得到初始告警句子;或者,

若所有网管告警标识均在预设词汇表中,则将经排序后的网管告警标识组成初始告警句子;

在所述初始告警句子之前添加预设的第二特殊词语,并在所述初始告警句子的末尾添加预设的第三特殊词语,得到所述目标告警句子。

其中,根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量,包括:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:

利用预设的第四特殊词语对目标网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第一向量;

多次利用所述第四特殊词语对两个网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第二向量,所述两个网管告警标识包括:目标网管告警标识以及除所述目标网管告警标识之外的其他网管告警标识中的一者,其中,每次针对其他网管告警标识遮掩的网管告警标识不同。

其中,根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,包括:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:分别计算所述第一向量与每个所述第二向量之间的欧式距离;将计算得到的欧式距离作为目标矩阵的行向量;

将得到的每个网管告警标识对应的目标矩阵的行向量,按照网管告警标识对应的时间先后顺序进行列排序,得到反映网络告警信息之间的影响关系的目标矩阵。

其中,获取预设时间段内的M条网络告警信息之前,所述方法还包括:

获取历史网络告警信息,所述历史网络告警信息包括告警中所使用的资源容器的名称、网管告警标识和告警发生时间;

根据所述历史网络告警信息,构建训练语料库;

根据所述训练语料库,构建预设词汇表;

根据所述训练语料库和所述预设词汇表,对基于转换器的双向编码表征模型进行训练,得到完成训练后的自然语言处理模型。

其中,根据所述历史网络告警信息,构建训练语料库,包括:

将所述历史网络告警信息,按照告警发生时间的先后顺序排序;

以所述历史网络告警信息对应的最早发生时间为起始时间,利用滑动时间窗口对排序后的历史网络告警信息进行切分,得到多组历史网络告警信息;

针对每组历史网络告警信息,将属于同一资源容器内的历史网络告警信息中的网管告警标识按照时间先后顺序排序,组成告警句子,得到多个告警句子;

将所述多个告警句子构建为训练语料库。

其中,根据所述训练语料库,构建预设词汇表,包括:

获取所述训练语料库中所有的网管告警标识;

将所有的网管告警标识中重复的网管告警标识去除,得到去重后的网管告警标识;

将所述去重后的网管告警标识和预设的特殊词语构建为预设词汇表。

本发明还提供一种网络告警信息处理装置,包括:

第一获取模块,用于获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;

第一语料构建模块,用于基于M条所述网络告警信息,构建告警语料;

第一处理模块,用于根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量;

第二处理模块,用于根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵。

本发明还提供一种网络告警信息处理设备,包括处理器和收发器,所述收发器在处理器的控制下接收和发送数据,所述处理器用于执行以下操作:

获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;

基于M条所述网络告警信息,构建告警语料;

根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量;

根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵。

其中,所述处理器还用于:

将N条网络告警信息的每条网络告警信息中的网管告警标识,按照时间先后顺序排序后,组成目标告警句子,所述N条网络告警信息为M条所述网络告警信息中属于同一资源容器内且在同一时间窗内的网络告警信息,其中,M≥N≥2,且N为正整数。

其中,所述处理器还用于:

在存在第一网管告警标识不在预设词汇表中的情况下,利用预设的第一特殊词语替代所述第一网管告警标识,得到初始告警句子;或者,

若所有网管告警标识均在预设词汇表中,则将经排序后的网管告警标识组成初始告警句子;

在所述初始告警句子之前添加预设的第二特殊词语,并在所述初始告警句子的末尾添加预设的第三特殊词语,得到所述目标告警句子。

其中,所述处理器还用于:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:

利用预设的第四特殊词语对目标网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第一向量;

多次利用所述第四特殊词语对两个网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第二向量,所述两个网管告警标识包括:目标网管告警标识以及除所述目标网管告警标识之外的其他网管告警标识中的一者,其中,每次针对其他网管告警标识遮掩的网管告警标识不同。

其中,所述处理器还用于:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:分别计算所述第一向量与每个所述第二向量之间的欧式距离;将计算得到的欧式距离作为目标矩阵的行向量;

将得到的每个网管告警标识对应的目标矩阵的行向量,按照网管告警标识对应的时间先后顺序进行列排序,得到反映网络告警信息之间的影响关系的目标矩阵。

其中,所述处理器还用于:

获取历史网络告警信息,所述历史网络告警信息包括告警中所使用的资源容器的名称、网管告警标识和告警发生时间;

根据所述历史网络告警信息,构建训练语料库;

根据所述训练语料库,构建预设词汇表;

根据所述训练语料库和所述预设词汇表,对基于转换器的双向编码表征模型进行训练,得到完成训练后的自然语言处理模型。

其中,所述处理器还用于:

将所述历史网络告警信息,按照告警发生时间的先后顺序排序;

以所述历史网络告警信息对应的最早发生时间为起始时间,利用滑动时间窗口对排序后的历史网络告警信息进行切分,得到多组历史网络告警信息;

针对每组历史网络告警信息,将属于同一资源容器内的历史网络告警信息中的网管告警标识按照时间先后顺序排序,组成告警句子,得到多个告警句子;

将所述多个告警句子构建为训练语料库。

其中,所述处理器还用于:

获取所述训练语料库中所有的网管告警标识;

将所有的网管告警标识中重复的网管告警标识去除,得到去重后的网管告警标识;

将所述去重后的网管告警标识和预设的特殊词语构建为预设词汇表。

本发明还提供一种网络告警信息处理设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;所述处理器执行所述程序时实现如上述所述的网络告警信息处理方法。

本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的网络告警信息处理方法中的步骤。

本发明的上述技术方案至少具有如下有益效果:

本发明实施例中,通过获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;基于M条该网络告警信息,构建告警语料;根据告警语料和自然语言处理模型,得到与该告警语料相关的告警向量;根据与该告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,如此,通过使用自然语言处理模型,得到告警的向量表征,进而定量计算告警之间影响关系的大小,从而能够获得更加精确地告警之间的关联关系。

附图说明

图1表示本发明实施例的网络告警信息处理方法的流程示意图之一;

图2表示本发明实施例的网络告警信息处理方法的流程示意图之二;

图3表示本发明实施例的网络告警信息处理装置的模块示意图;

图4表示本发明实施例的网络告警信息处理设备的结构示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

本发明针对通过现有方式获取到的告警之间的关联关系不够准确的问题,提供一种网络告警信息处理方法、装置及设备。

如图1所示,为本发明实施例提供的网络告警信息处理方法的流程示意图。

该方法可包括:

步骤101,获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;

本步骤中,具体的,预设时间段的起始时间点为监测到网络告警发生的时刻。比如,预设时间段为10分钟。在一示例中,获取从监测到网络告警发生的时刻开始,10分钟内的网络告警信息。

步骤102,基于M条所述网络告警信息,构建告警语料;

本步骤中,具体的,将从M条所述网络告警信息中提取到的网管告警标识,构建为告警语料。

需要说明的是,网管告警标识是由专业、设备厂家、设备类型、告警类型和告警标题这五种信息编码拼接而成。

步骤103,根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量;

本步骤中,可选地,自然语言处理模型为BERT(Bidirectional EncoderRepresentation from Transformers,基于转换器的双向编码表征)模型。

需要说明的是,Transformer是一种由编码器encoder和解码器decoder组成的seq2seq模型,它具有传统seq2seq模型的优点,即考虑当前词的前文信息,能够将前面位置的词的信息记忆下来,双向的模型可将当前词的上下文信息都利用到。

相比传统的seq2seq模型,Transformer的最大特点是引入了(Attention)注意力机制,注意力机制模拟人类的思考方式,对不同的信息给予不同的重视程度。注意力机制可以更好地对上下文信息进行理解,聚焦到对当前词影响最大的上下文信息。BERT模型在许多自然语言处理任务上都达到了很好的效果。

步骤104,根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵。

本步骤中,目标矩阵中的一行,能够反映各个告警对某一告警的影响程度。

本发明实施例的网络告警信息处理方法,通过获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;基于M条该网络告警信息,构建告警语料;根据告警语料和自然语言处理模型,得到与该告警语料相关的告警向量;根据与该告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,如此,通过使用自然语言处理模型,得到告警的向量表征,进而定量计算告警之间影响关系的大小,从而能够获得更加精确地告警之间的关联关系。

作为一可选的实现方式,本发明实施例的方法步骤102,基于M条所述网络告警信息,构建告警语料可具体包括:

将N条网络告警信息的每条网络告警信息中的网管告警标识,按照时间先后顺序排序后,组成目标告警句子,所述N条网络告警信息为M条所述网络告警信息中属于同一资源容器内且在同一时间窗内的网络告警信息,其中,M≥N≥2,且N为正整数。

这里,网络告警信息包括告警中所使用的资源容器的名称、网管告警标识和告警发生时间。

这里,资源容器的名称为网元名称或者资源池名称。

本步骤中,从M条网络告警信息中,选择出资源容器名称相同的N条网络告警信息;之后,按照告警发生时间的先后顺序进行排序,得到包括网管告警标识的目标告警句子。

例如,得到的某个句子为[A,B,C,D,E,F,G],其中,A~G均为网管告警标识。

基于此,在组成目标告警句子之前,本发明实施例的方法还可包括:

若存在第一网管告警标识不在预设词汇表中,则利用预设的第一特殊词语替代所述第一网管告警标识,得到初始告警句子;

需要说明的是,第一特殊词语表示未知的词语,使用[UNK]表示。预设词汇表为模型训练过程中构建的词汇表。

这里,若存在第一网管告警标识不在预设词汇表中,则使用[UNK]替代。例如,如果F这个词不在预设词汇表中,则得到的句子为[A,B,C,D,E,[UNK],G]。

或者,若所有网管告警标识均在预设词汇表中,则将经排序后的网管告警标识组成初始告警句子;

在所述初始告警句子之前添加预设的第二特殊词语,并在所述初始告警句子的末尾添加预设的第三特殊词语,得到所述目标告警句子。

这里,第二特殊词语表示句子开始的词语,用[CLS]表示;第三特殊词语表示句子分割/结束的词语,用[SEP]表示。

继续以上述示例为例,在得到的初始告警句子[A,B,C,D,E,[UNK],G]的首尾加入相应的特殊词(即句首加入第二特殊词,句末加入第三特殊词),之后得到目标告警句子[[CLS],A,B,C,D,E,[UNK],G,[SEP]]。

还需要说明的是,为了保证句子的长度一致,若得到的初始告警句子在句子首尾添加相应的特殊词后,其长度小于预设句子长度,则之后需要添加预设的表示填充词语的特殊词语。

下面说明基于训练好的自然语言处理模型和目标告警句子,得到网络告警信息之间的影响关系的原理。

对于训练好的自然语言处理模型,如BERT模型,输入一个句子X=[[CLS],X

第一次,将X

第二次,将X

然后,计算两次情况下i位置的词向量之间的欧式距离:

d

需要说明的是,该距离越大,表示X

基于上述原理,如何获得网络告警信息中各个告警对某一告警的影响程度,作为一可选的实现方式,本发明实施例的方法步骤103,根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量可具体包括:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:

利用预设的第四特殊词语对目标网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第一向量;

这里,第四特殊词语表示遮掩掉词汇的词语,使用[MASK]表示。本步骤执行后得到的是在不考虑其他网管告警标识的缺失对预测目标网管告警标识影响的情况下的目标网管告警标识的向量表征。

多次利用所述第四特殊词语对两个网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第二向量,所述两个网管告警标识包括:目标网管告警标识以及除所述目标网管告警标识之外的其他网管告警标识中的一者,其中,每次针对其他网管告警标识遮掩的网管告警标识不同。

本步骤是将可能与目标网管告警标识存在影响关系的目标告警句子中的其他网管告警标识均执行该处理步骤。即最终得到的第二向量的个数为目标告警句子中除目标网管告警标识之外的其他网管告警标识的总个数,本发明实施例第二向量的个数为N-1。

这里,继续以上述得到的目标告警句子X=[[CLS],A,B,C,D,E,[UNK],G,[SEP]]为例,若要判断第三个位置的告警C对第一位置的告警A的影响程度(位置从1开始标识,其中A所在位置为标识为1的位置),首先,先将第一位置的告警A的网管告警标识遮掩MASK掉,得到X\{X

之后,将第一个位置的告警A的网管告警标识和第三位置的告警C的网管告警标识均MASK掉,得到X\{X

最后计算d

进一步地,作为一可选的实现方式,本发明实施例的方法步骤104,根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,可具体包括:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:分别计算所述第一向量与每个所述第二向量之间的欧式距离;将计算得到的欧式距离以及第一向量与其自身之间的欧式距离作为目标矩阵的行向量;

本步骤中,上述N个欧式距离中,第一向量与第二向量之间的欧式距离所涉及的除目标网管告警标识之外的其他网管告警标识在目标告警句子中的所在位置,即为该欧式距离在行向量中的位置,第一向量与其自身之间的欧式距离所涉及的目标网管告警标识在目标告警句子中的所在位置,即为该欧式距离在行向量中的位置。

其中,第一向量与其自身之间的欧式距离为0。

需要说明的是,每个网管告警标识都有对应的目标矩阵的行向量。其中,目标矩阵的行向量中的除第一向量与其自身之间的欧式距离这一元素外的其他元素中的每个元素表示针对该网管告警标识,其他网管告警标识中的一者对该网管告警标识的影响大小,其实质是表征针对一个网管告警,其他网管告警中的一者对该网管告警的影响大小。

将得到的每个网管告警标识对应的目标矩阵的行向量,按照网管告警标识对应的时间先后顺序进行列排序,得到反映网络告警信息之间的影响关系的目标矩阵。

需要说明的是,本发明实施例中目标矩阵为N×N的矩阵,该目标矩阵第i行第j列的元素M

这里,对于矩阵的第i行,可以取最大的两个值所在位置,表示对该告警影响最大的两条告警。例如,若第1行最大的两个元素为M

下面就一实际应用中的示例,参见图2,具体说明本发明实施例的方法的实现过程。

S1:网管系统监测到新的告警信息;

S2:时间滑窗,将告警切片;

采用与训练自然语言处理模型过程中构建训练语料相同的方式进行滑窗,得到10分钟时间段内的告警信息。

S3:告警分组、排序,得到告警句子X=[[CLS],X

具体的,从上述告警信息中提取网元名称相同的网络告警信息,按照告警发生时间的先后顺序进行排序,得到网管告警标识ID组成的告警句子,X=[[CLS],X

S4:i=1;

也就是说,i从1开始取值,需要说明的是,X

S5:i≤N?

判断i是否小于或者等于N;

若是,则执行步骤S6,否则,则执行步骤S13。

S6:j=1;

也就是说,j从1开始取值,需要说明的是,X

S7:j≤N?

判断j是否小于或者等于N;

若是,则执行步骤S8,否则,则执行步骤S12。

S8:将X

本步骤中,将X

S9:将X

本步骤中,将X

S10:计算M

这里,上述S8和S9两次情况下i位置的词向量之间的欧式距离为M

S11:j+=1;

本步骤,将j+1赋予j,即j=j+1;返回执行步骤S7;

S12:i+=1;

本步骤,将i+1赋予i,即i=i+1;返回执行步骤S5;

S13:输出反映告警之间的影响关系的矩阵M。

本发明实施例的方法,一者,不基于频率来挖掘告警之间的关联关系,可有效避免高频出现但实际上不影响业务的不重要的告警带来的干扰,且不会丢失掉出现频率较低但比较重要的告警;二者,对告警进行关联分析时,考虑了告警出现的先后顺序,能够捕捉到告警发生顺序中包含的告警间的因果关系;三者,使用BERT模型来得到告警的向量表征,BERT模型中独有的注意力机制可有效地挖掘各个告警对某一告警的影响程度,能够捕捉到发生时间较远但相互影响强烈的告警;最后,本发明实施例的方法能够定量表征告警之间影响关系的大小,从而更加精确地挖掘到告警之间的关联关系。

为了实现本发明实施例的方法,上述提及的自然语言处理模型需是预先训练好的模型,如何对自然语言处理模型(BERT模型)进行训练,作为一可选的实现方式,本发明实施例的方法还可包括:

获取历史网络告警信息,所述历史网络告警信息包括告警中所使用的资源容器的名称、网管告警标识和告警发生时间;

本步骤中,可选地,告警中所使用的资源容器为资源池或网元。

这里,网管告警标识是由专业、设备厂家、设备类型、告警类型和告警标题这五种信息编码拼接而成。也就是说。网管告警标识能够唯一定位告警发生的源头。

需要说明的是,历史网络告警信息是去掉含有空字段的数据。在构建训练语料库之前,需要将告警发生时间进行格式化,统一转化为datetime格式。

根据所述历史网络告警信息,构建训练语料库;

这里,由于网管告警标识能够唯一定位告警发生的源头,本步骤具体的,可根据历史网络告警信息中的网管告警标识,构建训练语料库。

根据所述训练语料库,构建预设词汇表;

需要说明的是,预设词汇表中包括不同的网管告警标识。

根据所述训练语料库和所述预设词汇表,对基于转换器的双向编码表征模型进行训练,得到完成训练后的自然语言处理模型。

作为一可选的实现方式,根据所述历史网络告警信息,构建训练语料库,可包括:

将所述历史网络告警信息,按照告警发生时间的先后顺序排序;

以所述历史网络告警信息对应的最早发生时间为起始时间,利用滑动时间窗口对排序后的历史网络告警信息进行切分,得到多组历史网络告警信息;

这里,滑动时间窗口说明切分排序后的历史网络告警信息对应的时间窗口为滑动的。利用滑动时间窗口对排序后的历史网络告警信息进行切分可理解为利用滑动时间窗口对排序后的历史网络告警信息进行分组。

可选地,滑动时间窗口的一次滑动步长小于滑动时间窗口的时长。如此,能够使得每组历史网络告警信息中在时间上存在部分重合的数据,这样能够避免错失告警之间的关联关系。

比如,对于告警信息,首先按照告警发生时间的先后顺序进行排序,之后从最小的时间开始,用长度为10分钟的时间窗口进行滑动,滑动步长为5分钟。例如,最小的时间为某天的00:00:00,则得到的各组告警信息对应的时间分别为:00:00:00-00:10:00,00:05:00-00:15:00,00:10:00-00:20:00,00:15:00-00:25:00…。

针对每组历史网络告警信息,将属于同一资源容器内的历史网络告警信息中的网管告警标识按照时间先后顺序排序,组成告警句子,得到多个告警句子;

本步骤针对每组历史告警信息进行上述处理,即将同一时间窗口内同一资源容器(比如同一网元)出现的网管告警ID按照时间顺序排序,组成一个告警句子。

将所述多个告警句子构建为训练语料库。

作为一可选的实现方式,根据所述训练语料库,构建预设词汇表,包括:

获取所述训练语料库中所有的网管告警标识;

本步骤中,将训练语料库中所有语句进行“分词操作”,即将所有的网管告警标识取出。

将所有的网管告警标识中重复的网管告警标识去除,得到去重后的网管告警标识;

将所述去重后的网管告警标识和预设的特殊词语构建为预设词汇表。

这里,预设的特殊词语包括:[PAD]、[UNK]、[CLS]、[SEP]、[MASK],这5个特殊词的作用分别是:填充词,未知的词,表示句子开始的词,句子分割/结束的词,表示遮掩(mask)掉词汇的词。

作为一可选地实现方式,根据所述训练语料库和所述预设词汇表,对基于转换器的双向编码表征模型进行训练,得到完成训练后的自然语言处理模型

这里,BERT(Bidirectional Encoder Representation from Transformers,基于转换器的双向编码表征)模型的预训练任务包含两个:Next Sentence Prediction(下一句预测)和Masked Language Model(掩码语言模型,MLM)。本发明实施例中,句子和句子之间没有太大的关系,所以仅使用Masked Language Model这一任务来对模型进行预训练。

具体的,Masked Language Model随机挑选每一个句子中15%的词,在这15%的词中,80%的用[MASK]代替,用其上下文来对这些mask的词进行预测,10%的随机替换成其他的词,10%的保持不变。

预训练的过程中,损失函数为预测mask掉的词的loss函数。使用loss函数进行反向传播,不断调整模型中各个参数的值,直到训练loss不再下降为止,保存预训练后的BERT模型。

这样,通过这种自监督的方式来对BERT模型进行预训练,模型可以学习到训练数据中告警出现的先后顺序、彼此间的影响程度等规律。

本发明实施例的网络告警信息处理方法,通过获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;基于M条该网络告警信息,构建告警语料;根据告警语料和自然语言处理模型,得到与该告警语料相关的告警向量;根据与该告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,如此,通过使用自然语言处理模型,得到告警的向量表征,进而定量计算告警之间影响关系的大小,从而能够获得更加精确地告警之间的关联关系。

如图3所示,本发明实施例还提供一种网络告警信息处理装置,该装置包括:

第一获取模块301,用于获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;

第一语料构建模块302,用于基于M条所述网络告警信息,构建告警语料;

第一处理模块303,用于根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量;

第二处理模块304,用于根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵。

可选地,所述第一语料构建模块302包括:

第一语料构建单元,用于将N条网络告警信息的每条网络告警信息中的网管告警标识,按照时间先后顺序排序后,组成目标告警句子,所述N条网络告警信息为M条所述网络告警信息中属于同一资源容器内且在同一时间窗内的网络告警信息,其中,M≥N≥2,且N为正整数。

可选地,所述第一语料构建单元具体用于:

若存在第一网管告警标识不在预设词汇表中,则利用预设的第一特殊词语替代所述第一网管告警标识,得到初始告警句子;或者,

若所有网管告警标识均在预设词汇表中,则将经排序后的网管告警标识组成初始告警句子;

在所述初始告警句子之前添加预设的第二特殊词语,并在所述初始告警句子的末尾添加预设的第三特殊词语,得到所述目标告警句子。

可选地,所述第一处理模块303包括:

第一处理单元,用于针对目标告警句子中的每个网管告警标识,分别执行以下步骤:

利用预设的第四特殊词语对目标网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第一向量;

多次利用所述第四特殊词语对两个网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第二向量,所述两个网管告警标识包括:目标网管告警标识以及除所述目标网管告警标识之外的其他网管告警标识中的一者,其中,每次针对其他网管告警标识遮掩的网管告警标识不同。

可选地,所述第二处理模块304包括:

第二处理单元,用于针对目标告警句子中的每个网管告警标识,分别执行以下步骤:分别计算所述第一向量与每个所述第二向量之间的欧式距离;将计算得到的欧式距离作为目标矩阵的行向量;

将得到的每个网管告警标识对应的目标矩阵的行向量,按照网管告警标识对应的时间先后顺序进行列排序,得到反映网络告警信息之间的影响关系的目标矩阵。

可选地,本发明实施例的装置还包括:

第二获取模块,用于获取历史网络告警信息,所述历史网络告警信息包括告警中所使用的资源容器的名称、网管告警标识和告警发生时间;

第二语料构建模块,用于根据所述历史网络告警信息,构建训练语料库;

词汇表构建模块,用于根据所述训练语料库,构建预设词汇表;

模型训练模块,用于根据所述训练语料库和所述预设词汇表,对基于转换器的双向编码表征模型进行训练,得到完成训练后的自然语言处理模型。

可选地,所述第二语料构建模块包括:

信息排序单元,用于将所述历史网络告警信息,按照告警发生时间的先后顺序排序;

第三处理单元,用于以所述历史网络告警信息对应的最早发生时间为起始时间,利用滑动时间窗口对排序后的历史网络告警信息进行切分,得到多组历史网络告警信息;

第四处理单元,用于针对每组历史网络告警信息,将属于同一资源容器内的历史网络告警信息中的网管告警标识按照时间先后顺序排序,组成告警句子,得到多个告警句子;

第二语料构建单元,用于将所述多个告警句子构建为训练语料库。

可选地,所述词汇表构建模块包括:

获取单元,用于获取所述训练语料库中所有的网管告警标识;

第五处理单元,用于将所有的网管告警标识中重复的网管告警标识去除,得到去重后的网管告警标识;

词汇表构建单元,用于将所述去重后的网管告警标识和预设的特殊词语构建为预设词汇表。

本发明实施例的网络告警信息处理装置,通过获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;基于M条该网络告警信息,构建告警语料;根据告警语料和自然语言处理模型,得到与该告警语料相关的告警向量;根据与该告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,如此,通过使用自然语言处理模型,得到告警的向量表征,进而定量计算告警之间影响关系的大小,从而能够获得更加精确地告警之间的关联关系。

为了更好的实现上述目的,如图4所示,本发明实施例还提供一种网络告警信息处理设备,包括处理器400和收发器410,所述收发器410在处理器的控制下接收和发送数据,所述处理器400用于执行如下过程:

获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;

基于M条所述网络告警信息,构建告警语料;

根据所述告警语料和自然语言处理模型,得到与所述告警语料相关的告警向量;

根据与所述告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵。

可选地,所述处理器400还用于:

将N条网络告警信息的每条网络告警信息中的网管告警标识,按照时间先后顺序排序后,组成目标告警句子,所述N条网络告警信息为M条所述网络告警信息中属于同一资源容器内且在同一时间窗内的网络告警信息,其中,M≥N≥2,且N为正整数。

可选地,所述处理器400还用于:

在存在第一网管告警标识不在预设词汇表中的情况下,利用预设的第一特殊词语替代所述第一网管告警标识,得到初始告警句子;或者,

若所有网管告警标识均在预设词汇表中,则将经排序后的网管告警标识组成初始告警句子;

在所述初始告警句子之前添加预设的第二特殊词语,并在所述初始告警句子的末尾添加预设的第三特殊词语,得到所述目标告警句子。

可选地,所述处理器400还用于:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:

利用预设的第四特殊词语对目标网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第一向量;

多次利用所述第四特殊词语对两个网管告警标识进行遮掩,并将经遮掩后的告警句子输入所述自然语言处理模型,得到被所述第四特殊词语遮掩的目标网管告警标识的第二向量,所述两个网管告警标识包括:目标网管告警标识以及除所述目标网管告警标识之外的其他网管告警标识中的一者,其中,每次针对其他网管告警标识遮掩的网管告警标识不同。

可选地,所述处理器400还用于:

针对目标告警句子中的每个网管告警标识,分别执行以下步骤:分别计算所述第一向量与每个所述第二向量之间的欧式距离;将计算得到的欧式距离作为目标矩阵的行向量;

将得到的每个网管告警标识对应的目标矩阵的行向量,按照网管告警标识对应的时间先后顺序进行列排序,得到反映网络告警信息之间的影响关系的目标矩阵。

可选地,所述处理器400还用于:

获取历史网络告警信息,所述历史网络告警信息包括告警中所使用的资源容器的名称、网管告警标识和告警发生时间;

根据所述历史网络告警信息,构建训练语料库;

根据所述训练语料库,构建预设词汇表;

根据所述训练语料库和所述预设词汇表,对基于转换器的双向编码表征模型进行训练,得到完成训练后的自然语言处理模型。

可选地,所述处理器400还用于:

将所述历史网络告警信息,按照告警发生时间的先后顺序排序;

以所述历史网络告警信息对应的最早发生时间为起始时间,利用滑动时间窗口对排序后的历史网络告警信息进行切分,得到多组历史网络告警信息;

针对每组历史网络告警信息,将属于同一资源容器内的历史网络告警信息中的网管告警标识按照时间先后顺序排序,组成告警句子,得到多个告警句子;

将所述多个告警句子构建为训练语料库。

可选地,所述处理器400还用于:

获取所述训练语料库中所有的网管告警标识;

将所有的网管告警标识中重复的网管告警标识去除,得到去重后的网管告警标识;

将所述去重后的网管告警标识和预设的特殊词语构建为预设词汇表。

本发明实施例的网络告警信息处理设备,通过获取预设时间段内的M条网络告警信息,M≥2,且M为正整数;基于M条该网络告警信息,构建告警语料;根据告警语料和自然语言处理模型,得到与该告警语料相关的告警向量;根据与该告警语料相关的告警向量,得到反映网络告警信息之间的影响关系的目标矩阵,如此,通过使用自然语言处理模型,得到告警的向量表征,进而定量计算告警之间影响关系的大小,从而能够获得更加精确地告警之间的关联关系。

本发明实施例还提供一种网络告警信息处理设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的网络告警信息处理方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的网络告警信息处理方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储介质中,使得存储在该计算机可读存储介质中的指令产生包括指令装置的纸制品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他科编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 网络存储设备的告警信息监控管理方法、装置及设备
  • 用于SDN网络的告警处理方法、装置及系统
  • 一种数据处理方法、装置、网络侧设备及终端设备
  • 信息互动设备、数据对象信息处理方法及装置
  • 无源光网络设备告警信息处理方法及光线路终端
  • 无源光网络设备告警信息处理方法及光线路终端
技术分类

06120115803516