掌桥专利:专业的专利平台
掌桥专利
首页

一种集群数据的监控方法、装置、系统及存储介质

文献发布时间:2023-06-19 10:57:17


一种集群数据的监控方法、装置、系统及存储介质

技术领域

本申请涉及数据监控技术领域,尤其是涉及一种集群数据的监控方法、装置、系统及存储介质。

背景技术

随着社会的发展和时代的进步,现在的日常生活中,对于业务的监控基本成熟,其中,对于监控的过程分为数据采集、提交、存储、展现、异常、告警几个过程,但是目前的业务监控只能监控到服务集群中的服务数据,只能进行服务集群整体的数据监控,不能监控到服务集群中每个单独子业务集群的数据,因此,不能够判断监控数据的健康状态以及所属集群的全部数据。

发明内容

有鉴于此,本申请的目的在于提供一种集群数据的监控方法、装置、系统及存储介质,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

本申请主要包括以下几个方面:

第一方面,本申请实施例提供了一种集群数据的监控方法,所述监控方法包括:

获取目标服务集群对应的第一监控数据;所述目标服务集群包括多个不同子业务集群;所述第一监控数据中携带有属于不同所述子业务集群的集群标识;

针对每个所述子业务集群,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据;

根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量;

根据每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

在一种可能的实施方式中,在获取目标服务集群对应的第一监控数据之前,所述监控方法还包括:

获取目标服务集群对应的初始监控数据;

根据预设的格式规则,从所述初始监控数据中提取出所述目标服务集群对应的第一监控数据。

在一种可能的实施方式中,所述根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量,包括:

根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的服务量;

根据每个所述子业务群,对每个所述子业务群中的各个服务器的服务量进行累加,确定每个所述子业务集群的服务量。

在一种可能的实施方式中,所述根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的服务量,包括:

根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的业务指标数据;其中,所述业务指标用于标识每个所述服务器运行的业务类型;

根据每个所述服务器的业务指标数据,确定每个所述子业务群中的各个服务器的服务量。

在一种可能的实施方式中,针对每个所述子业务集群,所述根据每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态,包括:

根据所述子业务集群的服务量,判断所述子业务集群的服务量是否在所述子业务集群的预设服务量阈值范围内;

若是,则确定所述子业务集群为健康状态;

若否,则每个所述子业务集群为未健康状态。

第二方面,本申请实施例还提供了一种监控平台,所述监控平台包括:

第一获取模块,用于获取目标服务集群对应的第一监控数据;所述目标服务集群包括多个不同子业务集群;所述第一监控数据中携带有属于不同所述子业务集群的集群标识;

提取模块,用于针对每个所述子业务集群,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据;

第一确定模块,用于根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量;

第二确定模块,用于每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

在一种可能的实施方式中,所述监控平台还包括:

第二获取模块,用于目标服务集群对应的初始监控数据;

第三确定模块,用于根据预设的格式规则,从所述初始监控数据中提取出所述目标服务集群对应的第一监控数据。

在一种可能的实施方式中,所述第一确定模块,具体用于:

根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的服务量;

根据每个所述子业务群,对每个所述子业务群中的各个服务器的服务量进行累加,确定每个所述子业务集群的服务量。

第三方面,本申请实施例还提供了一种集群数据的监控系统,第一方面中任一种可能的实施方式中所述的监控平台和业务采集平台;

业务采集平台,用于采集目标服务集群对应的初始监控数据以及将所述初始监控数据发送至所述监控平台;

监控平台,用于由目标服务集群对应的初始监控数据确定第一监控数据,并根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据,根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量,并根据每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的监控方法的步骤。

本申请实施例提供的一种集群数据的监控方法、装置、系统及存储介质,与现有技术中的群数据监控方法相比,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种集群数据的监控方法的流程图;

图2示出了本申请实施例所提供的另一种集群数据的监控方法的流程图;

图3示出了本申请实施例所提供的一种监控平台的结构示意图;

图4示出了本申请实施例所提供的另一种监控平台的结构示意图;

图5示出了本申请实施例所提供的一种集群数据的监控系统的结构示意图。

图中:

10-监控系统;300-监控平台;310-第一获取模块;320-提取模块;330-第一确定模块;340-第二确定模块;350-第二获取模块;360-第三确定模块;400-业务采集平台。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。

首先,经研究发现,目前的业务监控只能监控到服务集群中的服务数据,只能进行服务集群整体的数据监控,不能监控到服务集群中每个单独子业务集群的数据,因此,不能够判断监控数据的健康状态以及所属集群的全部数据。

基于此,本申请实施例提供了一种方法,通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

请参阅图1,图1为本申请实施例所提供的一种集群数据的监控方法的流程图。所如图1中所示,本申请实施例提供的集群数据的监控方法,包括以下步骤:

S101、获取目标服务集群对应的第一监控数据;所述目标服务集群包括多个不同子业务集群;所述第一监控数据中携带有属于不同所述子业务集群的集群标识。

该步骤中,所述目标服务集群为使用者选用的某一特定的服务集群,所述目标服务集群包括多个不同子业务集群,且所述第一监控数据中携带有属于不同所述子业务集群的集群标识。

这里,所述服务集群是指多台服务器运行同一个程序,形成高可用的集群,所述子业务集群是指同一集群下由多台服务器组成,同一集群下每个服务器上运行的服务代码相同,所述集群标识为所述子业务集群的集群服务名称。

其中,所述集群标识可具体包括各大服务平台,例如,百度、腾讯、京东以及阿里。

可选地,在获取目标服务集群对应的第一监控数据之前,所述监控方法还包括:

获取目标服务集群对应的初始监控数据。

这里,通过接口接收服务agent提交的目标服务集群对应的初始监控数据,所述服务agent从各个远程的业务程序中获取初始监控数据。

根据预设的格式规则,从所述初始监控数据中提取出所述目标服务集群对应的第一监控数据。

这里,所述预设的格式规则为JSON格式规则,根据所述JSON格式规则判断初始监控数据的完整性,且将具备完整性的JSON格式的初始监控数据解析为java格式,确定所述初始监控数据中的第一监控数据。

S102、针对每个所述子业务集群,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据。

该步骤中,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据,具体为从第一监控数据中提取出与所述子业务集群的集群标识类型相关的第二监控数据。

其中,所述集群标识为所述子业务集群的集群服务名称,所述集群标识可具体包括各大服务平台,例如,百度、腾讯、京东以及阿里。

S103、根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量。

该步骤中,根据每个所述子业务集群的第二监控数据,对各个所述子业务集群的服务服务量进行累加计算,并将所述数据保存到最后的最新的一帧数据,以及将之前的所述数据进行删除,避免冗余和繁琐。

这里,所述子业务集群只保留服务的最新健康状态和数据。

S104、根据每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

其中,根据所述子业务集群的服务量,判断所述子业务集群的服务量是否在所述子业务集群的预设服务量阈值范围内。

这里,首选设定一个所述子业务集群的预设服务量阈值,将所述子业务集群的服务量的大小与所述业务集群的预设服务量阈值范围大小进行判断,判断所述子业务集群的服务量是否在所述子业务集群的预设服务量阈值范围内。

这里,这里各个所述子业务集群的预设服务量阈值可设置为相同的预设服务量阈值范围,同样,所述子业务集群的预设服务量阈值范围也可以根据不同的子业务集群设置为不同的阈值范围。

然后,将所述子业务集群的服务量的按找集群标识分类进行汇总和展现。

若是,则确定所述子业务集群为健康状态。

若否,则每个所述子业务集群为未健康状态。

这里,将超出所述子业务集群的预设服务量阈值范围的所述子业务集群的服务量进行告警处理。

其中,所述告警处理的方式为语音提醒、声光提醒以及远程控制的APP程序提醒等。

这里,当告警的次数达到预设告警次数后,通过预设的告警规则,以邮件形式通知管理员,进行告警。

本申请实施例提供的集群数据的监控方法,与现有技术中的监控方法相比,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

请参阅图2,图2为本申请另一实施例提供的一种集群数据的监控方法的流程图。如图2中所示,本申请实施例提供的一种集群数据的监控方法,所述监控方法包括以下步骤:

S201、获取目标服务集群对应的第一监控数据;所述目标服务集群包括多个不同子业务集群;所述第一监控数据中携带有属于不同所述子业务集群的集群标识。

S202、针对每个所述子业务集群,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据。

S203、根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的服务量。

该步骤中,其中,根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的业务指标数据;其中,所述业务指标用于标识每个所述服务器运行的业务类型。

这里,所述业务指标可具体但不限制于用户连接数,所述业务指标为用于标识每个所述服务器运行的各类的业务类型。

可选的,根据每个所述服务器的业务指标数据,确定每个所述子业务群中的各个服务器的服务量。

这里,据每个所述服务器的业务指标数据,确定每个所述子业务群中的各个服务器在该业务指标数据下的服务量。

S204、根据每个所述子业务群,对每个所述子业务群中的各个服务器的服务量进行累加,确定每个所述子业务集群的服务量。

该步骤中,累加的计算过程是之累加所述子业务群中该业务指标数据下数据值的合计数,并根据所述合计数,确定每个所述子业务集群的服务量。

S205、根据每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

其中,S201至S202以及S205的描述可以参照S101至S102以及S104的描述,并且能达到相同的技术效果,对此不做赘述。

本申请实施例提供的集成数据的监控方法,与现有技术中的数据监控方法相比,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

请参阅图3、图4,图3为本申请实施例所提供的一种监控平台的结构示意图,图4为本申请实施例所提供的另一种监控平台的结构示意图。如图3中所示,所述监控平台300包括:

第一获取模块310,用于获取目标服务集群对应的第一监控数据;所述目标服务集群包括多个不同子业务集群;所述第一监控数据中携带有属于不同所述子业务集群的集群标识。

提取模块320,用于针对每个所述子业务集群,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据。

第一确定模块330,用于根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量。

可选的,所述第一确定模块330,具体用于:

根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的服务量。

根据每个所述子业务群,对每个所述子业务群中的各个服务器的服务量进行累加,确定每个所述子业务集群的服务量。

可选的,述根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的服务量,包括:

根据每个所述子业务集群的第二监控数据,确定每个所述子业务群中的各个服务器的业务指标数据;其中,所述业务指标用于标识每个所述服务器运行的业务类型。

根据每个所述服务器的业务指标数据,确定每个所述子业务群中的各个服务器的服务量。

第二确定模块340,用于每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

可选的,所述第二确定模块340,具体用于:

根据所述子业务集群的服务量,判断所述子业务集群的服务量是否在所述子业务集群的预设服务量阈值范围内。

若是,则确定所述子业务集群为健康状态。

若否,则每个所述子业务集群为未健康状态。

本申请实施例提供的监控平台,与现有技术中的监控平台相比,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

进一步的,如图4所示,所述监控平台300包括:

第二获取模块350,用于目标服务集群对应的初始监控数据。

第三确定模块360,用于根据预设的格式规则,从所述初始监控数据中提取出所述目标服务集群对应的第一监控数据。

第一获取模块310,用于获取目标服务集群对应的第一监控数据;所述目标服务集群包括多个不同子业务集群;所述第一监控数据中携带有属于不同所述子业务集群的集群标识。

提取模块320,用于针对每个所述子业务集群,根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据。

第一确定模块330,用于根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量。

第二确定模块340,用于每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

本申请实施例提供监控平台,与现有技术中的监控平台,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

请参阅图5,图5为本申请实施例所提供的一种群数据的监控系统的结构示意图。如图5中所示,所述监控系统10包括如图1以及图2所述的监控平台300和业务采集平台400。

业务采集平台400,用于采集目标服务集群对应的初始监控数据以及将所述初始监控数据发送至所述监控平台。

监控平台300,用于由目标服务集群对应的初始监控数据确定第一监控数据,并根据所述子业务集群的集群标识,从所述第一监控数据中提取出所述子业务集群的第二监控数据,根据每个所述子业务集群的第二监控数据,确定每个所述子业务集群的服务量,并根据每个所述子业务集群的服务量,确定每个所述子业务集群的健康状态。

本申请实施例提供的群数据的监控系统,与现有技术中的数据监控系统相比,本申请通过子业务集群的集群标识,从目标服务集群中提取子业务集群的第二监控数据,并根据第二监控数据,确定每个子业务集群的服务量,进而确定了子业务集群的健康状态,实现了对目标服务集群中每个子业务集群的服务量的监控,根据每个子业务集群的服务量,判断每个子业务集群的健康状态以及显示所述目标服务集群中每个子业务集群的全部数据,进一步的提高了数据监控的效果、实用性。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的监控方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种集群数据的监控方法、装置、系统及存储介质
  • 一种多集群运行监控方法、装置、系统及可读存储介质
技术分类

06120112740834