掌桥专利:专业的专利平台
掌桥专利
首页

基于微服务框架的告警信息的智能抑制方法、介质及系统

文献发布时间:2024-04-18 19:52:40



技术领域

本发明涉及网管告警管理技术领域,特别涉及一种基于微服务框架的告警信息的智能抑制方法、计算机可读存储介质及告警抑制系统。

背景技术

SNMP(Simple Network Management Protocol,简单网络管理协议)是基于TCP/IP五层协议中的应用层协议,SNMP 使网络管理员能够管理网络效能,发现并解决网络问题以及规划网络增长,是目前最为广泛的网管协议。网管服务过程中会产生大量的告警事件,这些告警事件可能因为重复、冲突、不重要等原因而无需处理,因此网管服务中往往设置有告警抑制策略来过滤告警事件。

例如,在SNMP网管系统中,Trap服务器提供接收告警以及事件通知的功能,通常在SNMP网管系统中起到接收网络设备告警信息上报的作用。但由于SNMP trap使用UDP协议传输,无法保证数据的传递准确性,因此多数网络设备出现故障时会持续上报告警或间隔一定时间多次上报告警,导致网管软件接收到大量重复冗余的trap报文,过多地占用服务器资源。为了准确有效抑制这种情况,传统方案是在网管软件处理告警前,先在网管系统接收端的本地增加重复告警抑制方法。这种抑制方法一般使用记录告警代码单位时间内发送次数的方式实现,告警信息经过抑制后才进入网管系统内部,以此来控制重复告警接收处理频率。但是网络环境发生变化或增加新的设备时,需要调整抑制策略或者更新抑制算法,此时需要重启网管软件才能使调整后的抑制策略生效,也就是说更新抑制策略或抑制算法时需要升级重启网管软件才能实现,而网管软件升级重启时需要断开连接,这导致传统方法周期较长且影响面较大,成本也较高。

发明内容

本发明所要解决的技术问题是提供一种无需网管软件升级重启即可实现抑制策略更新的告警信息抑制方法及其系统。

提供一种基于微服务框架的告警信息的智能抑制方法,包括以下步骤:

TRAP端口监听步骤,获取网管系统对SNMPTRAP端口监听事件中的告警事件;

告警判断步骤,根据预设的告警策略判断该告警事件的告警信息是否有效;

具体地,远程调用微服务系统的告警抑制服务接口,该告警抑制服务接口被调用则接收告警事件,并驱动微服务系统执行预设的告警匹配步骤:分别读取当前设备参数和告警策略,从预设的多个告警抑制算法中调用一个或多个与两者相对应的告警抑制算法,来判断该告警事件的告警信息是否有效;

告警抑制步骤,若所述告警判断步骤中对告警信息的判断结果为无效,则丢弃该告警事件。

其中,所述告警判断步骤中调用的告警抑制算法是与设备参数和告警策略的匹配程度均达到预设程度的告警抑制算法。

其中,多个告警抑制算法与设备参数和告警策略的匹配通过预先训练好的智能分配器实现。

其中,所述告警策略有多个,通过链式传递方式依次连接,对各个告警策略的更新不影响其与其他告警策略的连接关系。

其中,若所述告警判断步骤的判断结果为有效,则将告警事件加入网管系统的任务队列等待处理。

其中,还包括应用于服务注册中心和服务管理中心的如下微服务管理步骤:

每隔预设时间从所述服务注册中心获取服务实例形成的服务列表及更新该服务列表中服务实例的状态;

当存在微服务的服务实例发生异常时,获取所述服务实例异常产生的警告信息;

根据该警告信息更新该服务列表中异常服务实例的状态。

其中,根据用户的输入操作对所述服务列表进行预设操作。

其中,所述预设操作为更新所述服务实例的状态、查看所述服务实例、删除所述服务实例、上架所述微服务、下架所述微服务、更新配置信息中的一种或多种。

还提供了一种计算机可读存储介质,其存储有计算机程序,计算机程序被处理器运行时能够实现上述基于微服务框架的告警信息的智能抑制方法。

还提供了一种告警抑制系统,包括处理器和处理器分别连接的网管服务器和微服务器,所述网管服务器具有调用接口,所述微服务器具有告警抑制接口,网管服务器通过调用接口来远程调用微服务器的告警抑制接口,从而获取告警抑制服务;还包括上述计算机可读存储介质,该计算机可读存储介质上的计算机程序可被处理器执行。

有益效果:

该基于微服务框架的告警信息的智能抑制方法,使网管软件通过监听SNMP TRAP端口实现TRAP服务,在该端口处获取网络管理中各处产生并推送的告警事件,提取其中的告警信息,并远程调用微服务器中预存有告警信息判断程序的告警抑制服务接口来确认该告警信息是否有效,告警信息判断结果为无效的告警事件被抑制而直接丢弃,告警信息判断结果为有效的告警事件则加入告警处理队列,等待分配处理。该基于微服务框架的告警信息的智能抑制方法中,告警抑制策略和抑制算法在独立的微服务器中运行,从物理上实现告警信息处理与抑制算法解耦,减少告警抑制方法迭代升级对网管软件的影响,因而无需网管软件升级重启即可实现抑制策略更新,减少抑制策略更新周期,降低抑制策略更新成本。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。

图1是本基于微服务框架的告警信息的智能抑制方法的流程示意图。

图2是本基于微服务框架的告警抑制系统中网管Tarp服务流程图。

图3是本基于微服务框架的告警抑制系统中告警抑制服务流程图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本实施例的告警抑制系统,包括处理器以及与处理器分别连接的网管服务器和微服务器,网管服务器具有调用接口,微服务器具有告警抑制接口,网管服务器通过调用接口来远程调用微服务器的告警抑制接口,从而获取告警抑制服务。见图1,具体的基于微服务框架的告警信息的智能抑制方法包括以下步骤实现。

TRAP端口监听步骤,获取网管系统对SNMPTRAP端口监听事件中的告警事件。见图2,在网管服务器的网关Trap服务进程中,通过端口监听方法接收告警事件,由接收到告警事件来触发调用接口指令,以远程调用微服务器的告警抑制接口。

告警判断步骤,根据预设的告警策略判断该告警事件的告警信息是否有效。具体地,当微服务系统的告警抑制服务接口被调用,则接收网管服务器端口输出的告警事件,并驱动微服务系统执行预设的告警匹配步骤:分别读取当前设备参数和告警策略,从预设的多个告警抑制算法中调用一个或多个与两者相对应的告警抑制算法,来判断该告警事件的告警信息是否有效。

微服务系统具体是利用Spring Boot框架技术构建一个轻量级告警抑制服务,通过提前收集平台设备相关操作数据作为智能分配条件,在接口实现方法中获取函数入参通过调用链式策略集动态获取有效抑制策略,根据当前抑制策略以及设备参数调用智能分配器执行动态抑制算法并返回计算结果给网管Trap服务器。

该基于微服务框架的告警信息的智能抑制方法,远程调用微服务器中预存有告警信息判断程序的告警抑制服务接口来确认该告警信息是否有效,警抑制策略和抑制算法在独立的微服务器中运行,从物理上实现告警信息处理与抑制算法解耦,减少告警抑制方法迭代升级对网管软件的影响,因而无需网管软件升级重启即可实现抑制策略更新,减少抑制策略更新周期;还可以实现多平台实现共享服务。该基于微服务框架的告警信息的智能抑制方法及系统既能即时扩展算法库提供更丰富的策略和算法,还可以减少升级范围降低抑制策略更新成本。

其中,告警判断步骤中调用的告警抑制算法是与设备参数和告警策略的匹配程度均达到预设程度的告警抑制算法,见图3,Trap服务抑制告警采用提前收集设备相关信息,结合本地配置通过在线动态算法实现智能可变抑制。多个告警抑制算法与设备参数和告警策略的匹配通过预先训练好的智能分配器实现。

其中,告警策略有多个,通过链式传递方式依次连接,通过链式策略集实现动态筛选,且对各个告警策略的更新不影响其与其他告警策略的连接关系。

告警抑制步骤,若告警判断步骤中对告警信息的判断结果为无效,则丢弃该告警事件;若告警判断步骤的判断结果为有效,则将告警事件加入网管系统的任务队列等待处理。

另外,本实施例的基于微服务框架的告警抑制系统中,告警抑制还包括应用于服务注册中心和服务管理中心的如下微服务管理步骤:每隔预设时间从服务注册中心获取服务实例形成的服务列表及更新该服务列表中服务实例的状态;当存在微服务的服务实例发生异常时,获取服务实例异常产生的警告信息;根据该警告信息更新该服务列表中异常服务实例的状态。

其中,更新告警抑制策略可以根据用户的输入操作对服务列表进行预设操作,预设操作为更新服务实例的状态、查看服务实例、删除服务实例、上架微服务、下架微服务和更新配置信息。

例如,本实施例中以一个服务提供方提供的微服务来对微服务管理系统进行说明,在本发明的其他实施例中,还可以包括多个服务提供方。服务提供方所提供微服务对应多个告警抑制策略的服务实例,将其所提供的微服务的含服务实例的服务信息注册到服务注册中心。服务提供方每隔s向服务注册中心定时更新其提供的微服务的服务实例的状态信息,其中,该状态信息包括闲置、占用和异常。服务注册中心,注册有微服务的服务实例。服务注册中心注册有服务提供方所提供微服务的含服务实例的服务信息并存储。

本实施例中,服务提供方每隔一个预设时间向服务注册中心发送更新信息,该更新信息包括服务实例状态信息等,服务注册中心根据该更新信息定时更新该服务提供方对应的微服务的服务信息,及时获取服务实例最新状态,减少管理出错的概率。

另外,在本发明的其他实施例中,还可以当服务提供方对应的微服务的服务实例状态发生变化时,服务提供方即时向服务注册中心发送更新信息,服务注册中心根据该更新信息更新该微服务的服务实例的状态,避免了服务提供方向服务注册中心提交无效的更新请求,即服务提供方所提供微服务的服务实例的状态没有发生任何变化时,减少向服务注册中心发送更新信息的次数,在服务提供方所提供微服务的服务实例的状态频繁发生变化时,增加向服务注册中心发送更新信息的次数,服务提供方按需发送更新请求,避免系统拥堵及提高信息的实时有效性。

服务管理中心,每隔预设时间从服务注册中心获取服务实例形成的服务列表及更新该服务列表中服务实例的状态;当微服务的服务实例发生异常时,服务实例发送警告信息至服务管理中心,服务管理中心根据该警告信息更新该服务列表中异常服务实例的状态。

服务管理中心从服务注册中心获取所有微服务及该微服务的服务实例形成的服务列表后添加到数据库中,并查看该服务列表中的可用服务和正在使用的服务,根据该可用服务和正在使用的服务更新该数据库中对应微服务的服务信息,同时每隔预设时间从服务注册中心获取微服务对应服务实例的状态更新信息,根据该更新信息定时更新该服务列表中各个服务实例的状态。同时,服务管理中心还可以从服务注册中心获取新注册的微服务的含服务实例的服务信息并将该微服务添加到服务管理中心数据库中,根据下一时间内更新信息对微服务对应服务实例状态进行更新。

当微服务对应的服务实例发生异常时,服务实例发送警告信息至服务管理中心,服务管理中心根据该警告信息更新其服务列表中微服务的服务信息及各个服务实例的状态,及时定位异常的服务实例,快速排查服务异常。

以上所描述的微服务告警抑制系统实施例仅是示意性的。其中,作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

最后应说明的是:本发明实施例公开的微服务告警抑制系统所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

相关技术
  • 一种γ射线辐射防护复合材料及其制备方法
  • 射线防护复合墙板结构及其施工方法
  • 基于装配式钢结构建筑复合墙板的安装结构、复合墙板及其施工方法
技术分类

06120116334440