掌桥专利:专业的专利平台
掌桥专利
首页

服务器监控系统及方法

文献发布时间:2023-06-19 12:13:22


服务器监控系统及方法

技术领域

本发明涉及数据处理技术领域,特别涉及一种服务器监控系统及方法。

背景技术

随着计算机科学技术的发展,对服务器的性能和可靠性的要求也不断提高;为了确保服务器能持续可靠的执行其任务,需要对服务器的运行情况进行监控。

现有技术中,往往需求管理用户对每一条数据信息都进行心思缜密的严格分析从而判断当前的态势,然而,随着IT规模的扩大和设备的增多,监控数据也呈级数递增趋势,通过人工数据分析方法存在着在处理监控数据的过程中无法满足实时性和准确性的问题。

发明内容

本发明所要解决的技术问题是提供一种服务器监控系统及方法,能够提升对服务器监控的实时性和准确性。

一种服务器监控系统,包括:

至少一个前端数据采集模块、每个所述前端数据采集模块对应的数据传输模块、数据分析模块以及报警模块;其中,每个所述前端数据采集模块部署于每个所述前端数据采集模块各自对应的目标服务器;

每个所述前端数据采集模块,用于在其对应的目标服务器的监控服务处于开启状态的情况下,确定该目标服务器的待监控资源项目,并采集每个所述待监控资源项目的监控数据;

所述数据传输模块,用于按预设的时间间隔将与其对应的所述前端数据采集模块采集到的每个所述待监控资源项目的监控数据,传输至预先设置的数据中心;

所述数据分析模块,用于确定所述数据中心已接收的每个所述待监控资源项目的监控数据,是否满足该待监控资源项目对应的数据异常条件;

所述报警模块,用于确定满足数据异常条件的监控数据的异常报警级别,基于所述异常报警级别执行报警操作。

上述的系统,可选的,还包括系统运行监控模块;

所述系统运行监控模块,用于采集所述报警模块的运行日志,并将所述运行日志在预设的显示界面进行显示。

上述的系统,可选的,所述前端数据采集模块,包括:

第一确定子模块,用于确定监控资源项目集合中的每个监控资源项目的监控服务的开关状态;

第二确定子模块,用于将开关状态表征为开启状态的监控资源项目确定为待监控资源项目。

上述的系统,可选的,还包括:配置模块;

所述配置模块,用于显示配置界面;所述配置界面包含每个所述目标服务器以及每个所述监控资源项目的开关控件;响应于用户对任意一个所述开关控件执行第一操作,将所述开关控件对应的目标服务器或监控资源项目的监控服务的开关状态设置为关闭状态。

上述的系统,可选的,所述报警模块,包括:

第三确定子模块,用于确定所述监控数据的与所述异常报警级别对应的报警字段;

生成子模块,用于基于所述报警字段生成报警信息;

报警子模块,用于将所述报警信息发送至所述监控数据所属的待监控资源项目对应的用户,以向所述用户报警。

一种服务器监控方法,应用于服务器监控系统,所述服务器监控系统包括部署于目标服务器的前端数据采集模块、与所述前端采集模块对应的数据传输模块、数据分析模块以及报警模块,所述方法包括:

所述前端数据采集模块在所述目标服务器的监控服务处于开启状态的情况下,确定该目标服务器的待监控资源项目,并采集每个所述待监控资源项目的监控数据;

所述数据传输模块按预设的时间间隔,将与其对应的所述前端数据采集模块采集到的每个所述待监控资源项目的监控数据,传输至预先设置的数据中心;

所述数据分析模块确定所述数据中心已接收的每个所述待监控资源项目的监控数据,是否满足该待监控资源项目对应的数据异常条件;

所述报警模块确定满足数据异常条件的监控数据的异常报警级别,基于所述异常报警级别执行报警操作。

上述的方法,可选的,所述数据库监控系统还包括系统运行监控模块;所述方法还包括:

所述系统运行监控模块采集所述报警模块的运行日志,并将所述运行日志在预设的显示界面进行显示。

上述的方法,可选的,所述确定待监控资源项目,包括:

确定预先设置的监控资源项目集合中的每个监控资源项目的监控服务的开关状态;

将监控服务的开关状态表征为开启状态的监控资源项目确定为待监控资源项目。

上述的方法,可选的,所述数据库监控系统还包括配置模块;所述方法还包括:

所述配置模块显示配置界面;所述配置界面包含目标服务器以及每个所述监控资源项目的开关控件;

所述配置模块响应于用户对任意一个所述开关控件执行第一操作,将所述开关控件对应的目标服务器或监控资源项目的监控服务的开关状态设置为关闭状态。

上述的方法,可选的,所述基于所述异常报警级别执行报警操作,包括:

确定所述监控数据的与所述异常报警级别对应的报警字段;

基于所述报警字段生成报警信息;

将所述报警信息发送至所述监控数据所属的监控资源项目对应的用户,以向所述用户报警。

与现有技术相比,本发明包括以下优点:

本发明提供了一种服务器监控系统及方法,该系统包括:至少一个前端数据采集模块、每个所述前端数据采集模块对应的数据传输模块、数据分析模块以及报警模块;其中,每个所述前端数据采集模块部署于每个所述前端数据采集模块各自对应的目标服务器;每个所述前端数据采集模块,用于在其对应的目标服务器的监控服务处于开启状态的情况下,确定该目标服务器的待监控资源项目,并采集每个所述待监控资源项目的监控数据;所述数据传输模块,用于按预设的时间间隔将与其对应的所述前端数据采集模块采集到的每个所述待监控资源项目的监控数据,传输至预先设置的数据中心;所述数据分析模块,用于确定所述数据中心已接收的每个所述待监控资源项目的监控数据,是否满足该待监控资源项目对应的数据异常条件;所述报警模块,用于确定满足数据异常条件的监控数据的异常报警级别,基于所述异常报警级别执行报警操作。应用本发明实施例提供的服务器监控系统,通过数据传输模块将前端数据采集模块采集到的监控数据传输至数据中心,使得数据分析模块对监控数据进行分析,能够提升对服务器监控的实时性,通过确定不同的待监控资源项目的监控数据是否满足该待监控资源项目对应的数据异常条件,能够提升对服务器监控的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明提供的一种服务器监控系统的结构示意图;

图2为本发明提供的一种服务器监控系统的又一结构示意图;

图3为本发明提供的一种服务器监控系统的框架示例图;

图4为本发明提供的一种服务器监控方法的方法流程图;

图5为本发明提供的一种确定待监控资源项目的过程的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

参见图1,为本发明实施例提供的一种服务器监控系统的结构示意图,该服务器监控系统,包括:

至少一个前端数据采集模块101、每个所述前端数据采集模块对应的数据传输模块102、数据分析模块103以及报警模块104;其中,每个所述前端数据采集模块部署于每个所述前端数据采集模块101各自对应的目标服务器;

每个所述前端数据采集模块101,用于在其对应的目标服务器的监控服务处于开启状态的情况下,确定该目标服务器的待监控资源项目,并采集每个所述待监控资源项目的监控数据;

所述数据传输模块102,用于按预设的时间间隔将与其对应的所述前端数据采集模块采集到的每个所述待监控资源项目的监控数据,传输至预先设置的数据中心;

所述数据分析模块103,用于确定所述数据中心已接收的每个所述待监控资源项目的监控数据,是否满足该待监控资源项目对应的数据异常条件;

所述报警模块104,用于确定满足数据异常条件的监控数据的异常报警级别,基于所述异常报警级别执行报警操作。

在本发明实施例中,目标服务器可以指当前需要监控的服务器,可以在接收到用户的监控指令的情况下,确定该监控指令所指定的目标服务器,该目标服务器可以为运行预先设置的业务任务的服务器,该业务任务可以指的是数据库任务,服务器通过运行该业务任务,可以实现对业务数据的接收存储或者提供业务数据查询接口。

确定监控指令所指定的服务器之后,可以为该服务器部署前端数据采集模块101。

其中,前端数据采集模块101可以对应的目标服务器的监控服务的开关状态,若该目标服务器的监控服务处于开启状态,则可以采集每个待监控资源项目的监控数据,若该目标服务器的监控服务处于关闭状态,则可以不对该目标服务器进行监控。

具体的,待监控资源项目可以是监控服务处于开启状态的监控资源项目,不同的待监控资源项目的监控数据可以不同。

其中,数据传输模块102采用的时间间隔可以依据实际需求进行设定,例如,可以为1分钟、3分钟或5分钟等等。

在本发明实施例中,该数据中心可以包括核心机,数据分析模块103可以对对数据中心采集上的汇总数据分类整理,筛选出超过监控阈值和服务状态异常的服务器记录,并可根据需求提供一段时间的历史数据进行趋势分析,例如统计每周的数据库空间的使用情况,计算平均增长率来推算出预计的容量预警时间,在数据分析模块可以部署于该数据中心,或者与该数据中心相连接。

其中,监控数据的异常报警级别可以根据该监控数据所属的待监控资源项目的实时性需求或者该监控数据的异常程度进行确定。

应用本发明实施例提供的服务器监控系统,通过数据传输模块将前端数据采集模块采集到的监控数据传输至数据中心,使得数据分析模块对监控数据进行分析,能够提升对服务器监控的实时性,通过确定不同的待监控资源项目的监控数据是否满足该待监控资源项目对应的数据异常条件,能够提升对服务器监控的准确性。

本发明实施例提供的系统,基于上述的方案,具体的,如图2所示,该服务器监控系统还包括系统运行监控模块105;

所述系统运行监控模块,用于采集所述报警模块的运行日志,并将所述运行日志在预设的显示界面进行显示。

在本发明实施例中,该系统运行监控模块可以实时收集报警模块的运行日志,通过对日志的分析,获得监控报警程序的运行监控情况,将监控报警程序的运行监控情况并界面展示,便于数据库管理人员了解。

本发明实施例提供的系统,基于上述的方案,具体的,所述前端数据采集模块,包括:

第一确定子模块,用于确定监控资源项目集合中的每个监控资源项目的监控服务的开关状态;

第二确定子模块,用于将开关状态表征为开启状态的监控资源项目确定为待监控资源项目。

在本发明实施例中,该监控资源项目集合可以包括服务器网络连通性监控、服务器磁盘空间统计监控、服务器系统时间监控、数据库大小监控、数据库表记录数量监控、账号登陆错误监控、数据库作业运行结果监控、数据库主从同步状态监控、Alwayson故障转移监控等以上至少一种监控资源项目。

其中,每个监控资源项目均具有监控服务的开关状态,可以根据每个监控资源项目的监控服务的开关状态确定是否对该监控资源项目进行监控,若该监控资源项目的监控服务的开关状态为开启状态,则可以将该监控资源项目确定为待监控资源项目,并对该待监控资源项目进行监控。

若该监控资源项目的监控服务的开关状态表征为关闭状态,则可以不对该监控资源项目进行监控。

本发明实施例提供的系统,基于上述的方案,具体的,如图3所示,该服务器监控系统还包括:配置模块;

所述配置模块,用于显示配置界面;所述配置界面包含每个所述目标服务器以及每个所述监控资源项目的开关控件;响应于用户对任意一个所述开关控件执行第一操作,将所述开关控件对应的目标服务器或监控资源项目的监控服务的开关状态设置为关闭状态。

在本发明实施例中,响应于用于对于任意一个开关控件执行第二操作,将开关控件对应的目标服务器或监控资源项目的监控服务的开光状态设置为开启状态。

其中,第一操作用于指示关闭对应的目标服务器或监控资源项目的监控服务,第二操作用于指示开启对应的目标服务器或监控资源项目的监控服务。

在本发明实施例中,该配置模块可以通过提供各个监控资源项目及单台服务器的配置界面,实现关闭某类报警或者单台服务器上的某个报警的功能,操作灵活,便于检查,以防人为遗忘造成的报警监控缺失。

本发明实施例提供的系统,基于上述的方案,具体的,所述报警模块,包括:

第三确定子模块,用于确定所述监控数据的与所述异常报警级别对应的报警字段;

生成子模块,用于基于所述报警字段生成报警信息;

报警子模块,用于将所述报警信息发送至所述监控数据所属的待监控资源项目对应的用户,以向所述用户报警。

在本发明实施例中,可以为每个待监控资源项目的监控数据预先设置多个备选报警字段,每个备选报警字段对应不同的异常报警级别。

可以将该报警字段填充至预先设置的报警信息模板,从而生成报警信息,可以通过邮件或短信的形式向用户报警。

在本发明提供的一实施例中,报警模块可以根据每个待监控资源项目的实时性要求,定义及配置各类报警级别,定期对采集数据进行比对,例如对监控数据(如慢查询sql)的环比、同比、TOP指标等方面进行分组汇总分析等,根据报警级别配置短信报警和邮件报警;并调用PAAS接口将相关报警信息发送给PaaS系统,对项目用户进行报警。

参见图3,为本发明实施例提供的一种服务器监控系统的框架示例图,在实际应用过程中,为N个数据库服务器分别设置前端数据采集模块,执行磁盘空间监控、服务器连通性监控、系统时间监控、主从同步状态监控等监控资源项目的监控操作,获得各个监控资源项目的监控数据,将采集到的监控数据传输至数据中心,使得数据分析模型对数据中心中的监控数据进行分析,基于预设的报警规则确定出异常的监控数据,并根据异常数据所属的待监控资源项目的实时性需求,确定报警类别,根据异常数据的报警类型生成报警信息,在web展示操作平台上进行展示,并调用PAAS接口将相关报警信息发送给PaaS系统,对项目负责人进行报警。

应用本发明实施例提供的系统,从部署到更新的自动化数据库报警平台,更改原先的分散的监控脚本到集中的监控平台,使DBA更加专注于数据库的架构和运维工作,基于python的监控系统,提供统一的、标准化的监控平台以及多种形式的页面展示功能,使报警系统运行情况一目了然;提升了监控的透明性增强了可靠性。

在本发明的一实施例中,提供了一种服务器监控方法,可以应用于上述实施例中的服务器监控系统,该服务器监控系统可以包括部署于目标服务器的前端数据采集模块、与所述前端采集模块对应的数据传输模块、数据分析模块以及报警模块,该服务器监控方法的方法流程图如图4所示,包括:

S401:所述前端数据采集模块在所述目标服务器的监控服务处于开启状态的情况下,确定该目标服务器的待监控资源项目,并采集每个所述待监控资源项目的监控数据。

在本发明实施例中,可以先确定目标服务器的监控服务的开关状态,若目标服务器的监控服务处于开启状态,则可以确定该目标服务器的待监控资源项目,其中,目标服务器的待监控资源项目可以为该目标服务器中监控服务处于开启状态的监控资源项目。

其中,目标服务器中的监控资源项目可以包括服务器网络连通性监控、服务器磁盘空间统计监控、服务器系统时间监控、数据库大小监控、数据库表记录数量监控、账号登陆错误监控、数据库作业运行结果监控、数据库主从同步状态监控、Alwayson故障转移监控等以上一种或多种。

S402:所述数据传输模块按预设的时间间隔,将与其对应的所述前端数据采集模块采集到的每个所述待监控资源项目的监控数据,传输至预先设置的数据中心。

其中,该时间间隔可以依据实际需求进行设置,例如可以设置为3分钟。

S403:所述数据分析模块确定所述数据中心已接收的每个所述待监控资源项目的监控数据,是否满足该待监控资源项目对应的数据异常条件。

其中,每个待监控资源项目的数据异常条件各不相同。

例如,对于服务器磁盘空间统计监控中的监控数据,该监控数据可以为服务器磁盘空间,则对应的数据异常条件可以为服务器磁盘空间小于预先设置的磁盘空间阈值。

对于服务器网络连通性监控的监控数据,该监控数据可以为服务器的网络连通状态,则对应的数据异常条件可以为该服务器的网络连通状态表征该服务器的网络未连通。

S404:所述报警模块确定满足数据异常条件的监控数据的异常报警级别,基于所述异常报警级别执行报警操作。

在本发明实施例中,该报警操作可以为向用户发送该监控数据所属的待监控资源项目的报警信息。

应用本发明实施例提供的服务器监控方法,通过数据传输模块将前端数据采集模块采集到的监控数据传输至数据中心,使得数据分析模块对监控数据进行分析,能够提升对服务器监控的实时性,通过确定不同的待监控资源项目的监控数据是否满足该待监控资源项目对应的数据异常条件,能够提升对服务器监控的准确性。

在本发明实施例提供的方法中,基于上述的方案,具体的,所述数据库监控系统还包括系统运行监控模块;所述方法还包括:

所述系统运行监控模块采集所述报警模块的运行日志,并将所述运行日志在预设的显示界面进行显示。

在本发明实施例提供的方法中,基于上述的方案,具体的,所述确定待监控资源项目,如图5所示,包括:

S501:确定预先设置的监控资源项目集合中的每个监控资源项目的监控服务的开关状态。

在本发明实施例中,该监控资源项目集合可以包括服务器网络连通性监控、服务器磁盘空间统计监控、服务器系统时间监控、数据库大小监控、数据库表记录数量监控、账号登陆错误监控、数据库作业运行结果监控、数据库主从同步状态监控、Alwayson故障转移监控等以上至少一种监控资源项目。

S502:将监控服务的开关状态表征为开启状态的监控资源项目确定为待监控资源项目。

其中,每个监控资源项目均具有监控服务的开关状态,可以根据每个监控资源项目的监控服务的开关状态确定是否对该监控资源项目进行监控,若该监控资源项目的监控服务的开关状态为开启状态,则可以将该监控资源项目确定为待监控资源项目,并对该待监控资源项目进行监控。

若该监控资源项目的监控服务的开关状态表征为关闭状态,则可以不对该监控资源项目进行监控。

在本发明实施例提供的方法中,基于上述的方案,具体的,所述数据库监控系统还包括配置模块,所述方法还包括:

所述配置模块显示配置界面;所述配置界面包含目标服务器以及每个所述监控资源项目的开关控件;

所述配置模块响应于用户对任意一个所述开关控件执行第一操作,将所述开关控件对应的目标服务器或监控资源项目的监控服务的开关状态设置为关闭状态。

在本发明实施例提供的方法中,基于上述的方案,具体的,所述基于所述异常报警级别执行报警操作,包括:

确定所述监控数据的与所述异常报警级别对应的报警字段;

基于所述报警字段生成报警信息;

将所述报警信息发送至所述监控数据所属的监控资源项目对应的用户,以向所述用户报警。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

以上对本发明所提供的一种服务器监控方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种服务器监控系统、方法及服务器数据采集方法和系统
  • 一种服务器监控系统及一种服务器监控方法
技术分类

06120113212819