掌桥专利:专业的专利平台
掌桥专利
首页

一种基于告警语义分析的告警自动排查处理方法及装置

文献发布时间:2023-06-19 19:33:46


一种基于告警语义分析的告警自动排查处理方法及装置

技术领域

本发明涉及监控技术领域,特别涉及一种基于告警语义分析的告警自动排查处理方法及装置。

背景技术

当前监控技术领域中存在的缺乏有效的告警自动排查处理手段,亦或处理困难,当前运维工作主要依赖于人力投入,并需要专业的运维经验,人力成本高、效率低。

因此需要研发一种基于告警语义分析的告警自动排查处理方法以克服当前监控技术领域中存在的不足。

发明内容

本发明的目的在于提供一种基于告警语义分析的告警自动排查处理方法及装置,解决了当前监控技术领域中存在的缺乏有效的告警自动排查处理手段,亦或处理困难、人力处理效率低的问题。

为实现上述目的,本发明采取的技术方案为:

本发明提供一种基于告警语义分析的告警自动排查处理方法,包括以下步骤:

接收监控装置产生的告警信息;所述告警信息中包含告警特征信息;

解析所述告警特征信息,提取告警的关键词信息;

根据提取到的所述关键词信息,自动关联告警处理脚本,并执行脚本。

进一步地,解析所述告警特征信息,提取告警的关键词信息;包括:

通过最大匹配分词算法、最短路径分词算法、IT运维领域分词字典库,对所述告警特征信息进行解析,提取告警的关键词信息。

进一步地,自动关联告警处理脚本;包括:

根据提取到的所述关键词信息,自动通过所述关键词信息或内置告警内容关联模型关联告警处理脚本。

第二方面,本发明还提供一种基于告警语义分析的告警自动排查处理装置,包括:

告警特征库,用于保存收集并整理后的告警特征信息;

告警特征分析器,用于接收监控装置产生的告警信息;所述告警信息中包含告警特征信息;解析所述告警特征信息,提取告警的关键词信息;

告警处理脚本库,用于保存收集并整理后的告警处理脚本;

告警处理器,用于根据提取到的所述关键词信息与所述告警特征库进行匹配,当匹配成功后关联所述告警处理脚本库的告警处理脚本,并执行告警处理脚本。

进一步地,所述告警特征分析器,具体用于通过最大匹配分词算法、最短路径分词算法、IT运维领域分词字典库,对所述告警特征信息进行解析,提取告警的关键词信息。

进一步地,所述告警处理器,具体用于根据提取到的所述关键词信息,自动通过所述关键词信息或内置告警内容关联模型,在所述告警特征库进行匹配,当匹配成功后关联所述告警处理脚本库的告警处理脚本,并执行告警处理脚本。

与现有技术相比,本发明具有如下有益效果:

本发明实施例提供的一种基于告警语义分析的告警自动排查处理方法,包括以下步骤:接收监控装置产生的告警信息;所述告警信息中包含告警特征信息;解析所述告警特征信息,提取告警的关键词信息;根据提取到的所述关键词信息,自动关联告警处理脚本,并执行脚本。该方法可快速准确识别告警特征信息,提取告警的关键词信息,自动匹配对应处理脚本,通过脚本实现告警处理,节省维护成本,提高处理效率,达到降本增效的作用。

附图说明

图1为本发明实施例提供的基于告警语义分析的告警自动排查处理方法的流程图;

图2为本发明实施例提供的基于告警语义分析的告警自动排查处理装置的框图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

参照图1所示,本发明提供的一种基于告警语义分析的告警自动排查处理方法,包括以下步骤:

(1)接收监控装置产生的告警信息;所述告警信息中包含告警特征信息;

(2)解析所述告警特征信息,提取告警的关键词信息;

(3)根据提取到的所述关键词信息,自动关联告警处理脚本,并执行脚本。

本发明实施例中,通过接收监控装置产生的告警信息,基于告警中携带的告警特征信息;通过解析告警语义特征,从告警语义分析结果中提取所述告警的关键词信息。其中,解析方式包括最大匹配分词算法、最短路径分词算法、IT运维领域分词字典库。另外,可通过优化对运维领域的匹配模型预定义范围来提高运维领域的匹配准确性,优化包括字典优化:保证覆盖IT运维领域的专有名词、初始样本优化:预置大量告警内容关联模型、提高匹配准确性;

解析特征后,根据获取到的告警的关键词特征信息,自动通过关键词或内置告警内容关联模型关联告警处理手段,用以解决当前监控技术领域中存在的缺乏有效的告警自动排查处理手段,亦或处理困难、人力成本高的问题。可快速准确识别告警特征,自动匹配对应处理脚本,通过脚本实现告警处理,节省维护成本,提高处理效率,达到降本增效的作用。

另外,本发明还提供一种基于告警语义分析的告警自动排查处理装置,参照图2所示,包括:

告警特征库,用于保存收集并整理后的告警特征信息;

告警特征分析器,用于接收监控装置产生的告警信息;所述告警信息中包含告警特征信息;解析所述告警特征信息,提取告警的关键词信息;

告警处理脚本库,用于保存收集并整理后的告警处理脚本;

告警处理器,用于根据提取到的所述关键词信息与所述告警特征库进行匹配,当匹配成功后关联所述告警处理脚本库的告警处理脚本,并执行告警处理脚本。

其中,告警特征库用于保存收集并整理后的告警特征信息,告警特征分析器用于接收并扫描告警,提前告警特征,告警处理脚本库用于保存收集并整理后的告警处理脚本,告警处理器用于执行告警处理脚本。

告警特征分析器接收告警后,进行特征提取通过告警特征库进行关键词匹配。当告警特征匹配有效后,移交告警处理器处理。告警处理器接收告警特征后,从告警处理脚本库抽取告警处理脚本,并执行处理。

举例来说:基于告警语义分析的告警自动排查处理方法,可通过软件程序实现,比如该告警产生后,软件程序提供了一键告警排查检测入口,入口以Web页面形式提供,可查看告警排查的目标对象和对应执行的排查脚本,并可手工在页面调整对象和对应执行脚本,同时支持自定义脚本及脚本所需要的参数信息,通过上述页面操作可对产生故障的主机执行脚本,方便运维人员排查故障原因,以便做出解决措施。同时,界面还提供了多步骤脚本执行能力,满足复杂的故障处理场景。此外,针对相同触发器产生的告警,历史的脚本执行记录将自动关联,无需重复检测,以实现故障的快速应对。

场景1:操作系统磁盘空间不足

目的:利用告警检测排查功能,触发脚本释放磁盘空间,恢复告警。

步骤:

(1)第一步:平台接收告警

告警阈值:磁盘空间使用率高于80%,触发告警。

(2)第二步:告警特征提取:磁盘空间使用不足,自动匹配空间释放脚本。

(3)第三步:执行磁盘释放空间脚本。

(4)第四步:查看监控指标,告警故障恢复,可以看到当前的磁盘空间使用率已经低于80%。

场景2:oracle服务停止

目的:利用告警检测排查功能,触发oracle开启服务脚本,恢复告警。

步骤:

第一步:平台接收告警

检测到oracle服务已经停止,No listener(无监听)

第二步:告警特征提取:oracle实例名是关闭状态,自动匹配oracle服务开启脚本;

第三步:执行oracle开启服务脚本;

第四步:查看故障指标,oracle服务已开启,告警恢复。可以看到当前的oracle服务状态已经变成开启状态。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术分类

06120115954800