掌桥专利:专业的专利平台
掌桥专利
首页

一种服务器检测方法、检测装置、电子设备及存储介质

文献发布时间:2023-06-19 10:11:51


一种服务器检测方法、检测装置、电子设备及存储介质

技术领域

本发明涉及计算机技术领域,特别是涉及一种服务器检测方法、检测装置、电子设备及存储介质。

背景技术

裸金属服务器,又可以称为云物理服务器,是一种云端专用的高性能、安全隔离的物理服务器或物理服务器集群,通过安全、稳定、便捷的计算服务帮助用户快速构建与扩容高性能需求的应用服务。通过裸金属服务器可以更快捷的搭建私有云,为用户提供虚拟私有网络、负载均衡、NAT(Network Address Translation,网络地址转换)网关、运维、监控、安全防护等功能。

在用户购买了裸金属服务器之后,为了确保交付给用户的裸金属服务器的各项性能正常,云服务厂商需要对待交付的裸金属服务器进行检测,在各项性能指标参数均能达到条件后才能交付。现有技术在对裸金属服务器进行检测时,通常是由人工对每一台裸金属服务器进行检测,其具体过程为:对于待检测的裸金属服务器,由人工将操作系统镜像安装在该裸金属服务器上,然后再运行检测脚本。但是这种基于人工操作的检测方法,存在检测操作流程复杂、检测时间长、检测效率低等问题,难以实现裸金属服务器的高效检测。

发明内容

本发明实施例的目的在于提供一种服务器检测方法、检测装置、电子设备及存储介质,以实现对裸金属服务器的高效检测。具体技术方案如下:

第一方面,本发明实施例提供了一种服务器检测方法,包括:

对裸金属服务器的状态进行监测;

当监测到所述裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测,所述检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,所述检测规则中包含多个用于检测所述裸金属服务器的检测项目;

根据所述裸金属服务器的各个参数与所述检测规则中的检测项目的比对结果,判断所述裸金属服务器是否通过检测。

可选的,所述对裸金属服务器的状态进行监测的步骤,包括:

对裸金属服务器集群中的多台裸金属服务器的状态进行监测;

所述当监测到所述裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测的步骤,包括:

当监测到所述裸金属服务器集群中的裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测,其中,不同服务器集群对应的检测规则中的检测项目不同。

可选的,所述当监测到所述裸金属服务器集群中的裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测的步骤,包括:

当监测到预设的第一表单中新增加一条第一标识时,对与所述第一标识对应的裸金属服务器进行检测,其中,所述第一表单中记录有所述裸金属服务器集群中所有的裸金属服务器的第一标识,所述第一标识用于标识所述裸金属服务器集群中包含的各个裸金属服务器,且一条第一标识对应一台裸金属服务器。

可选的,所述当监测到所述裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测的步骤,包括:

当监测到预设的第二表单中新增加一条第二标识时,对与所述第二标识对应的裸金属服务器进行检测,其中,所述第二表单中记录有第二标识,所述第二标识用于标识用户已购后注销的裸金属服务器;或者,

当监测到预设的第三表单中记录的裸金属服务器的状态改变时,对该状态改变的裸金属服务器进行检测;其中,所述第三表单中记录有已故障裸金属服务器以及所述已故障裸金属服务器对应的当前状态,所述当前状态为已维修状态;或者,

当监测到针对指定裸金属服务器的检测请求时,对所述检测请求指定的裸金属服务器的参数进行检测,所述参数包括裸金属服务器的配置参数和系统设置参数。

可选的,所述对裸金属服务器的状态进行监测之前,所述方法还包括:

将待检测的裸金属服务器添加至待检测队列;

根据裸金属服务器的属性信息是否符合预设的属性信息,判断待检测队列中的各台待检测裸金属服务器是否需要检测,所述属性信息至少包括以下之一:裸金属服务器所属的服务器集群,裸金属服务器的型号,以及裸金属服务器的可用地域。

可选的,所述方法还包括:

如果待检测裸金属服务器的属性信息符合预设的属性信息,确定所述待检测裸金属服务器需要检测;

在所述待检测队列中为所述待检测裸金属服务器添加第四标识,所述第四标识用于标识待检测裸金属服务器需要检测;

所述对裸金属服务器的状态进行监测的步骤,包括:

对所述待检测队列中具有所述第四标识的所述待检测裸金属服务器进行监测。

可选的,所述当监测到所述裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测的步骤,包括:

当监测到所述裸金属服务器的状态符合预设的检测触发条件时,将所述裸金属服务器的各个参数与预设的检测规则中对应的检测项目进行比对。

可选的,所述根据所述裸金属服务器的各个参数与所述检测规则中的检测项目的比对结果,判断所述裸金属服务器是否通过检测的步骤,包括:

如果所述裸金属服务器的各个参数都符合所述检测规则中的检测项目,则确定所述裸金属服务器通过检测;

如果所述裸金属服务器的存在至少一个参数不符合所述检测规则中的检测项目,则确定所述裸金属服务器未通过检测。

可选的,所述确定所述裸金属服务器未通过检测之后,所述方法还包括:

生成针对未通过测试的裸金属服务器的故障通知信息,所述故障通知信息中保存有未通过测试的裸金属服务器的检测项目以及未通过项目。

可选的,所述方法还包括:

在所述未通过测试的裸金属服务器被维修后,重新将维修后的裸金属服务器添加至待检测队列。

第二方面,本发明实施例提供了一种服务器检测装置,包括:

监测模块,用于对裸金属服务器的状态进行监测;

检测模块,用于当监测到所述裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测,所述检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,所述检测规则中包含多个用于检测所述裸金属服务器的检测项目;

第一判断模块,用于根据所述裸金属服务器的各个参数与所述检测规则中的检测项目的比对结果,判断所述裸金属服务器是否通过检测。

可选的,所述监测模块具体用于:

对裸金属服务器集群中的多台裸金属服务器的状态进行监测;

所述检测模块具体用于:

当监测到所述裸金属服务器集群中的裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对所述裸金属服务器进行检测,其中,不同服务器集群对应的检测规则中的检测项目不同。

可选的,所述检测模块具体用于:

当监测到预设的第一表单中新增加一条第一标识时,对与所述第一标识对应的裸金属服务器进行检测,其中,所述第一表单中记录有所述裸金属服务器集群中所有的裸金属服务器的第一标识,所述第一标识用于标识所述裸金属服务器集群中包含的各个裸金属服务器,且一条第一标识对应一台裸金属服务器。

可选的,所述检测模块具体用于:

当监测到预设的第二表单中新增加一条第二标识时,对与所述第二标识对应的裸金属服务器进行检测,其中,所述第二表单中记录有第二标识,所述第二标识用于标识用户已购后注销的裸金属服务器;或者,

当监测到预设的第三表单中记录的裸金属服务器的状态改变时,对该状态改变的裸金属服务器进行检测;其中,所述第三表单中记录有已故障裸金属服务器以及所述已故障裸金属服务器对应的当前状态,所述当前状态为已维修状态;或者,

当监测到针对指定裸金属服务器的检测请求时,对所述检测请求指定的裸金属服务器的参数进行检测,所述参数包括裸金属服务器的配置参数和系统设置参数。

可选的,所述装置还包括:

第一添加模块,用于将待检测的裸金属服务器添加至待检测队列;

第二判断模块,用于根据裸金属服务器的属性信息是否符合预设的属性信息,判断待检测队列中的各台待检测裸金属服务器是否需要检测,所述属性信息至少包括以下之一:裸金属服务器所属的服务器集群,裸金属服务器的型号,以及裸金属服务器的可用地域。

可选的,所述装置还包括:

确定模块,用于如果待检测裸金属服务器的属性信息符合预设的属性信息,确定所述待检测裸金属服务器需要检测;

第二添加模块,用于在所述待检测队列中为所述待检测裸金属服务器添加第四标识,所述第四标识用于标识待检测裸金属服务器需要检测;

所述监测模块具体用于:

对所述待检测队列中具有所述第四标识的所述待检测裸金属服务器进行监测。

可选的,所述检测模块具体用于:

当监测到所述裸金属服务器的状态符合预设的检测触发条件时,将所述裸金属服务器的各个参数与预设的检测规则中对应的检测项目进行比对。

可选的,所述第一判断模块具体用于:

如果所述裸金属服务器的各个参数都符合所述检测规则中的检测项目,则确定所述裸金属服务器通过检测;

如果所述裸金属服务器的存在至少一个参数不符合所述检测规则中的检测项目,则确定所述裸金属服务器未通过检测。

可选的,所述装置还包括:

生成模块,用于生成针对未通过测试的裸金属服务器的故障通知信息,所述故障通知信息中保存有未通过测试的裸金属服务器的检测项目以及未通过项目。

可选的,所述装置还包括:

第三添加模块,用于在所述未通过测试的裸金属服务器被维修后,重新将维修后的裸金属服务器添加至待检测队列。

第三方面,本发明实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现上述第一方面提供的服务器检测方法的方法步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述第一方面提供的服务器检测方法的方法步骤。

第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面提供的服务器检测方法的方法步骤。

第六方面,本发明实施例还提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面提供的服务器检测方法的方法步骤。

本发明实施例提供的一种服务器检测方法、检测装置、电子设备及存储介质,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与所述检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的服务器检测方法的一种流程示意图;

图2为本发明实施例中服务器管理系统与各裸金属服务器交互示意图;

图3为本发明实施例提供的服务器检测方法的另一种流程示意图;

图4为本发明实施例提供的服务器检测方法的再一种流程示意图;

图5为本发明实施例提供的服务器检测装置的一种结构意图;

图6为本发明实施例提供的服务器检测装置的另一种结构意图;

图7为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

现有的裸金属服务器检测过程为:检测人员先在裸金属服务器上人工创建操作系统镜像、检测脚本程序和一些用于检测脚本程序运行的软件环境,该检测程序在运行后,能够获取该待交付的裸金属服务器多项性能指标(例如:中央处理器线程,内存,硬盘,中央处理器频率,网卡队列数等),之后再将获取的这些性能指标和购买该裸金属服务器的用户的需求指标进行人工比对,若每项指标均满足,则确定该裸金属服务器满足交付标准。可见,现有裸金属服务器的检测过程基于人工操作实现,因此难以实现对裸金属服务器的高效检测。

有鉴如此,本发明实施例首先提供了一种服务器检测方法,

如图1所示,本发明实施例提供了一种服务器检测方法,该方法可以包括以下步骤:

S101,对裸金属服务器的状态进行监测。

本发明实施例的执行主体可以是服务器管理系统,该服务器管理系统具体可以为一台管理服务器,如图2所示,服务器管理系统可以与各裸金属服务器交互,更具体而言,服务器管理系统可以与服务器集群中的各裸金属服务器交互。本发明实施例中的裸金属服务器又可以称为云物理服务器。

服务器管理系统中可以设置数据库,该数据库可以以裸金属服务器不同的监测维度建立多个表单,不同表单中记录有裸金属服务器不同维度的状态。

例如,有的表单可以记录服务器集群中所有的裸金属服务器的信息及各裸金属服务器的唯一标识,这样当该表单中新增加一条唯一标识首次出现的裸金属服务器的记录时,服务器管理系统便可以监测到新增一台裸金属服务器。

再例如,有的表单可以记录已购后注销裸金属服务器的信息及各已购后注销裸金属服务器的唯一标识,这样当该表单中新增加一条唯一标识首次出现的裸金属服务器的记录时,服务器管理系统便可以监测到该已购后注销裸金属服务器,从而对其检测。上述已购后注销裸金属服务器可以是指在用户购买裸金属服务器后,不再需要使用并注销的裸金属服务器,云服务提供商可以对这些已购后注销裸金属服务器再次回收,并在检测通过后再次投入使用。

再例如,有的表单可以记录已故障服务器的信息和唯一标识,该标识可以表示已故障服务器被修复,这样当该表单中新增加一条唯一标识首次出现的裸金属服务器的记录时,服务器管理系统也可以监测到该已故障服务器的状态发生变化。

S102,当监测到裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测。

如前文所述,服务器管理系统中可以保存不同的表单,服务器管理系统通过监测这些表单中记录的内容实现对裸金属服务器状态的监测。当表单中记录的内容变化时,即监测到裸金属服务器的状态符合预设的检测触发条件时,服务器管理系统可以利用预设的检测规则对裸金属服务器进行检测。

本发明实施例的检测触发条件可以包括但不限于:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,上述检测触发条件可以伴随对应的表单中新增加一条唯一标识首次出现的裸金属服务器的记录。

检测规则中包含多个用于检测裸金属服务器的检测项目,这些检测项目通常是裸金属服务器的配置参数和系统设置参数。例如,RAID(Redundant Arrays of IndependentDisks,磁盘阵列)模式,CPU(Central Processing Unit,中央处理器)线程,内存大小,硬盘大小,NVME(Non-Volatile Memory express,一种闪存设备协议)大小,NVME版本,CPU中央处理器频率,网口数量,禁用板载网卡,网卡队列数,KDUMP(在系统崩溃、死锁或死机时用来转储内存运行参数的一个工具和服务)值,MTU(Maximum Transmission Unit,最大传输单元)值,网卡速率,GPU(Graphics Processing Unit,图形处理器)型号,以及CPU图形处理器微码等。

本发明实施例可以基于不同的服务器集群制定不同的检测规则,还可以基于不同的用户需求制定不同的检测规则,从而使检测内容更具灵活性,更符合用户的需求。根据不同用户的裸金属服务器要求标准不同,针对裸金属服务器的检测规则也不相同,具体实现方式可以为分集群配置检测规则,例如,针对用户A的服务器集群和公有的服务器集群中的裸金属服务器,分别制定不同的检测规则,该检测规则中的检测项目和检测通过标准也可以不同,以实现针对不同用户需求的定制化检测,提高用户体验。

示例性地,可以根据不同用户的检测需求设置不同的检测项目,例如:

对用户A设置以下15项检测项:RAID,CPU线程,内存,硬盘,NVME大小,NVME版本,CPU频率,网口数量,禁用板载网卡,网卡队列数,KDUMP,MTU值,网卡速率,GPU,CPU微码。

对用户B设置以下9项检测项:RAID,CPU线程,内存,硬盘,CPU频率,网卡队列数,KDUMP,MTU值,网卡速率。

其中,CPU线程:一台裸金属服务器机型可能有多个线程标准,例如32/40就代表这个机型可能存在32线程和40线程,符合其中一种即判定为该项目通过。

内存:裸金属服务器的内存可能不是整数,取近似值。例如,如果内存是10.24GB,则取近似值后可以为10GB。

硬盘:裸金属服务器的系统盘可能会存在少几十个G的现象,这是由于裸金属服务器系统是1024进制,而硬盘厂商是1000进制导致的。

CPU频率:裸金属服务器所有的线程频率都超过此数值,例如2550+就代表所有线程频率都超过2550。

KDUMP:检测KDUMP执行成功,并有日志输出,则判定该项目通过。

网卡队列数:网卡设置的队列数和支持的最大队列(CPU线程和网卡支持最大队列数取小的值)数一致,则判定该项目通过。

MTU值:执行PING后测试通过,表示MTU值没有问题,则判定该项目通过。

网卡速率:网卡的速率,例如20/50,当网卡速率为20Gbps或50Gbps时判定该项目通过,但是10Gbps时不通过。

GPU:通过NVIDIA指令匹配显卡型号,如果型号匹配则该项目通过。

NVME版本:扫描BIOS(Basic Input Output System,基本输入输出系统),检查NVME固件版本是否需要升级,如果不需要则该项目通过。

CPU微码:根据CPU型号检查是否需要BIOS升级CPU微码版本,如果不需要则该项目通过。

可选地,服务器管理系统可以将裸金属服务器的各个参数与预设的检测规则中对应的检测项目逐一进行比对,以确定待检测的裸金属服务器是否通过检测。

S103,根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

通过将裸金属服务器的各个参数与检测规则中的检测项目进行比对,服务器管理系统便可以确定裸金属服务器的哪些参数与检测规则中的检测项目一致,哪些参数与检测规则中的检测项目不一致,从而判断该裸金属服务器是否通过检测。具体判断过程将在下述实施例中描述。

如图3所示,本发明实施例还提供了一种服务器检测方法,包括:

S301,对裸金属服务器集群中的多台裸金属服务器的状态进行监测。

裸金属服务器集群中的多台裸金属服务器通常具有相同的参数,为了更好地实现对裸金属服务器集群中的多台裸金属服务器批量化检测,服务器管理系统可以对裸金属服务器集群中的多台裸金属服务器的状态进行监测,其监测过程与图1所示实施例中的监测过程相同,本发明实施例在此不再赘述。

S302,当监测到裸金属服务器集群中的裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测。

同样地,当监测到裸金属服务器集群中的裸金属服务器的状态符合预设的检测触发条件时,例如,裸金属服务器集群中新增裸金属服务器时,或者裸金属服务器集群中的裸金属服务器被注销时,或者裸金属服务器集群中已故障的裸金属服务器的状态发生变化时,或者裸金属服务器集群中的裸金属服务器被指定为待检测对象时,服务器管理系统可以利用预设的检测规则对裸金属服务器进行检测。

可以理解,不同裸金属服务器集群对应的检测规则中的检测项目可以不同,服务器管理系统可以使用针对不同裸金属服务器集群的检测规则对该服务器集群中的裸金属服务器进行检测。

S303,根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

可以理解的是,服务器管理系统可以根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果来判断裸金属服务器是否通过检测,例如,如果二者的比对结果完全一致则判定检测通过。

本发明实施例能够实现对裸金属服务器集群中的多台裸金属服务器批量化检测,进一步提高了对裸金属服务器的检测效率,尤其是裸金属服务器集群中的多台裸金属服务器的检测效率。

作为本发明实施例一种可选的实施方式,上述利用预设的检测规则对裸金属服务器进行检测的步骤具体可以包括:

当监测到预设的第一表单中新增加一条第一标识时,对与第一标识对应的裸金属服务器进行检测。

本发明实施例中的第一表单可以预先建立在服务器管理系统的数据库中。第一表单中可以记录有裸金属服务器集群中所有的裸金属服务器的第一标识,其中,该第一标识用于标识裸金属服务器集群中包含的各个裸金属服务器,且一条第一标识对应一台裸金属服务器。这样,当第一表单中出现一条新的第一标识时,服务器管理系统便可以监测到新增一台裸金属服务器,从而对该新增加的裸金属服务器进行检测,而无需再由人工发现该新增加的裸金属服务器,亦无需手动对该新增加的裸金属服务器进行检测。

作为本发明实施例一种可选的实施方式,上述利用预设的检测规则对裸金属服务器进行检测的步骤具体可以包括:

当监测到预设的第二表单中新增加一条第二标识时,对与第二标识对应的裸金属服务器进行检测。

上述已购后注销裸金属服务器可以是指在用户购买裸金属服务器后,不再需要使用并注销的裸金属服务器,云服务提供商可以对这些已购后注销裸金属服务器再回收,再回收过程中通常需要对该裸金属服务器进行检测。

本发明实施例中的第二表单同样可以预先建立在服务器管理系统的数据库中。第二表单中记录有第二标识,第二标识用于标识用户已购后注销的裸金属服务器。这样当该第二表单中新增加一条第二标识时,服务器管理系统便可以监测到该已购后注销的裸金属服务器,从而对其检测,而无需再由人工发现被用户注销的裸金属服务器,亦无需手动对该注销的裸金属服务器进行检测。

作为本发明实施例一种可选的实施方式,上述利用预设的检测规则对裸金属服务器进行检测的步骤具体可以包括:

当监测到预设的第三表单中记录的裸金属服务器的状态改变时,对该状态改变的裸金属服务器进行检测。

本发明实施例中的第三表单同样可以预先建立在服务器管理系统的数据库中。其中,第三表单中记录有已故障裸金属服务器以及已故障裸金属服务器对应的当前状态,例如,当前状态为已维修状态。具体而言,当已故障的裸金属服务器被维修后,维修人员可以在第三表单中为该已维修裸金属服务器添加一个第三标识,例如:已维修,则服务器管理系统便可以监测到已故障裸金属服务器的状态发生变化,从而对该已被维修的裸金属服务器进行检测,而无需再由人工发现已维修的裸金属服务器,亦无需手动对该已维修的的裸金属服务器进行检测。

需要说明的是,上述第一表单、第二表单、第三表单均可以通过现有的表单建立方法预先在服务器管理系统的数据库中建立,并且,表单中记录的各裸金属服务器与各标识之间可以基于常用的键(key)-值(value)方式建立对应关系,本发明实施例在此不再赘述。

作为本发明实施例一种可选的实施方式,上述利用预设的检测规则对裸金属服务器进行检测的步骤具体可以包括:

当监测到针对指定裸金属服务器的检测请求时,对检测请求指定的裸金属服务器的参数进行检测。

本发明实施例中,操作人员如果希望指定对某一台裸金属服务器进行检测,则可以向服务器管理系统发送针对该裸金属服务器的检测请求,服务器管理系统监测到针对所指定的裸金属服务器的检测请求,然后对该裸金属服务器进行检测。当然,检测请求中还可以携带操作人员希望检测的参数,这样,服务器管理系统可以针对上述参数进行检测,能够实现更灵活的检测过程,提高了用户体验。这些参数可以包括裸金属服务器的配置参数和系统设置参数。

作为本发明实施例一种可选的实施方式,在对裸金属服务器的状态进行监测之前,如图4所示,本发明实施例的检测方法还可以包括:

S401,将待检测的裸金属服务器添加至待检测队列。

本发明实施例可以预先建立一个待检测队列,服务器管理系统可以将待检测的裸金属服务器添加至待检测队列,使所有待进行检测的裸金属服务器位于该待检测队列中。

S402,根据裸金属服务器的属性信息是否符合预设的属性信息,判断待检测队列中的各台待检测裸金属服务器是否需要检测。

本发明实施例中,并非所有待检测的裸金属服务器可能都需要检测,并且,服务器管理系统在监测各裸金属服务器时也要消耗计算资源,对于不需要检测的待检测裸金属服务器,可以将这些待检测的裸金属服务器从待检测队列中排除,以提高批量化检测的检测效率,并能够节约服务器管理系统的计算资源。

服务器管理系统可以判断待检测的裸金属服务器的属性信息是否符合预设的属性信息,然后根据判断结果确定待检测队列中的各台待检测裸金属服务器是否需要检测。

上述属性信息例如可以包括但不限于以下之一:裸金属服务器所属的服务器集群,例如:用户A集群,公用集群;裸金属服务器的型号;以及裸金属服务器的可用地域,上述可用地域是指裸金属服务器能够使用的地域,例如:北京6区,上海2区,俄罗斯1区。

作为本发明实施例一种可选的实施方式,如果待检测裸金属服务器的属性信息符合预设的属性信息,则服务器管理系统可以确定该待检测裸金属服务器需要检测,服务器管理系统可以在待检测队列中为待检测裸金属服务器添加第四标识,该第四标识用于标识该待检测裸金属服务器需要检测,然后服务器管理系统便可以对待检测队列中具有第四标识的待检测裸金属服务器进行监测,而无需对其他待检测裸金属服务器进行监测,节省了服务器管理系统的计算资源。本发明对第四标识的具体形式不做限定,例如可以是文字、字母、字符、数字等。

作为本发明实施例一种可选的实施方式,在服务器管理系统判断裸金属服务器是否通过检测时,如果裸金属服务器的各个参数都符合检测规则中的检测项目,则确定裸金属服务器通过检测。如果裸金属服务器存在至少一个参数不符合检测规则中的检测项目,则确定裸金属服务器未通过检测。通过这种判断方式,可以确保裸金属服务器严格按照检测规则中的检测项目进行配置,保证交付质量。

作为本发明实施例一种可选的实施方式,如果服务器管理系统确定裸金属服务器未通过检测,则可以生成针对未通过测试的裸金属服务器的故障通知信息,售后人员可以查看到故障通知信息。售后人员还可以通过服务器管理系统将上述故障通知信息发送给维修人员,使维修人员在看到故障通知信息后,及时地对出现故障的裸金属服务器进行维修,并在第三表单中为该已维修裸金属服务器添加已维修标识,再次触发服务器管理系统对该已维修的裸金属服务器进行检测。可见,通过上述一系列的方法流程,能够使检测未通过的裸金属服务器及时得到维修,并在维修后,服务器管理系统根据在第三表单中添加的已维修标识自动触发第二次检测,提高了对已故障裸金属服务器的检测效率。

作为本发明实施例一种可选的实施方式,在未通过测试的裸金属服务器被维修后,该裸金属服务器的状态转变为已维修状态,则服务器管理系统可以重新将维修后的裸金属服务器添加至待检测队列,以重新对该裸金属服务器检测,从而使该裸金属服务器在检测后尽快投入运行,进一步提高了对裸金属服务器的检测效率。

在本发明一种可选的实施方式中,还提供了一种服务器检测方法的具体流程,包括:

步骤1、服务器管理系统依据裸金属服务器集群、机型、可用区等维度组合出的条件,判断进入待检测队列的裸金属服务器是否需要进行检测;

步骤2,如果需要检测,则对需要检测的裸金属服务器进行标注;

步骤3、对已标注的裸金属服务器进行装机:系统调用OpenAPI通过Ipmi(Intelligent Platform Management Interface,智能平台管理接口)对裸金属服务器发起装机指示,裸金属服务器上的装机脚本调用OpenAPI获取装机信息,并选择从系统部镜像群内,选择安装操作系统镜像和调用openapi获取检测脚本。

步骤4、装机完成后,该裸金属服务器开机,之后通过FTP(File TransferProtocol,文件传输协议),从预先存储有检测脚本的服务器上获取检测脚本,并执行检测脚本,以获取该裸金属服务器的实际配置信息和系统设置信息。上述检测脚本可以是预先由人工编写好并存储在服务器上的可执行脚本,该脚本用于对裸金属服务器进行检测,可以基于python和shell编写,该检测脚本的编写过程可以通过现有的检测脚本编写方法实现,只要能实现对裸金属服务器中的各参数与检测规则中的检测项目进行比对即可,本发明实施例在此不再赘述。

步骤5、检测脚本运行结束后,检测脚本调用OpenAPI回传该裸金属服务器的实际配置信息和系统设置信息,对照Apollo动态配置中心中的标准服务器配置和系统设置信息。

其中,Apollo动态配置中心是一个开源配置管理中心,由Key-Value对组成,其中保存着裸金属服务器各个机型的标准配置信息和设置信息。

步骤6、如果全部项目符合要求,则检测通过。服务器镜像自动销毁,格式化并回归初始状态,保证交付给用户的服务器为初始状态。检测结果保存在服务器管理系统的数据库的一个表单中,可供人员在服务器管理系统查询。

步骤7、如果出现任一项未能符合要求,则检测不通过。服务器管理系统发送故障工单,服务器进入检测不通过状态,并保持检测实例运行。检测结果通过OpenAPI存储在服务器管理系统同一个数据库的表单中,可供人员在服务器管理系统查询。

步骤8、人员登录服务器管理系统系统,并处理服务器故障,故障处理完毕后,完结故障工单,回传工单完结状态,并在判定服务器上实例依旧为检测实例后,重新对裸金属服务器触发检测流程。

本发明实施例提供的一种服务器检测方法,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。

相应于上面的方法实施例,本发明实施例还提供了相应的装置实施例。

如图5所示,本发明实施例提供了一种服务器检测装置,包括:

监测模块501,用于对裸金属服务器的状态进行监测。

检测模块502,用于当监测到裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测,检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,检测规则中包含多个用于检测裸金属服务器的检测项目。

第一判断模块503,用于根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

其中,监测模块具体用于:

对裸金属服务器集群中的多台裸金属服务器的状态进行监测;

检测模块具体用于:

当监测到裸金属服务器集群中的裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测,其中,不同服务器集群对应的检测规则中的检测项目不同。

其中,检测模块具体用于:

当监测到预设的第一表单中新增加一条第一标识时,对与第一标识对应的裸金属服务器进行检测,其中,第一表单中记录有裸金属服务器集群中所有的裸金属服务器的第一标识,第一标识用于标识裸金属服务器集群中包含的各个裸金属服务器,且一条第一标识对应一台裸金属服务器。

其中,检测模块具体用于:

当监测到预设的第二表单中新增加一条第二标识时,对与第二标识对应的裸金属服务器进行检测,其中,第二表单中记录有第二标识,第二标识用于标识用户已购后注销的裸金属服务器;或者,

当监测到预设的第三表单中记录的裸金属服务器的状态改变时,对该状态改变的裸金属服务器进行检测;其中,第三表单中记录有已故障裸金属服务器以及已故障裸金属服务器对应的当前状态,当前状态为已维修状态;或者,

当监测到针对指定裸金属服务器的检测请求时,对检测请求指定的裸金属服务器的参数进行检测,参数包括裸金属服务器的配置参数和系统设置参数。

其中,在图5所示装置结构的基础上,如图6所示,本发明实施例的服务器检测装置还可以包括:

第一添加模块601,用于将待检测的裸金属服务器添加至待检测队列。

第二判断模块602,用于根据裸金属服务器的属性信息是否符合预设的属性信息,判断待检测队列中的各台待检测裸金属服务器是否需要检测,属性信息至少包括以下之一:裸金属服务器所属的服务器集群,裸金属服务器的型号,以及裸金属服务器的可用地域。

其中,本发明实施例的服务器检测装置还可以包括:

确定模块,用于如果待检测裸金属服务器的属性信息符合预设的属性信息,确定待检测裸金属服务器需要检测;

第二添加模块,用于在待检测队列中为待检测裸金属服务器添加第四标识,第四标识用于标识待检测裸金属服务器需要检测;

则监测模块具体用于:

对待检测队列中具有第四标识的待检测裸金属服务器进行监测。

其中,检测模块具体用于:

当监测到裸金属服务器的状态符合预设的检测触发条件时,将裸金属服务器的各个参数与预设的检测规则中对应的检测项目进行比对。

其中,本发明实施例的服务器检测装置还可以包括:

生成模块,用于生成针对未通过测试的裸金属服务器的故障通知信息,故障通知信息中保存有未通过测试的裸金属服务器的检测项目以及未通过项目。

其中,本发明实施例的服务器检测装置还可以包括:

第三添加模块,用于在未通过测试的裸金属服务器被维修后,重新将维修后的裸金属服务器添加至待检测队列。

本发明实施例提供的服务器检测装置,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。

本发明实施例还提供了一种电子设备,具体可以为服务器,如图7所示,该服务器700包括处理器701和机器可读存储介质702,机器可读存储介质存储有能够被处理器执行的机器可执行指令,处理器执行机器可执行指令实现以下步骤:

对裸金属服务器的状态进行监测;

当监测到裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测,检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,检测规则中包含多个用于检测裸金属服务器的检测项目;

根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

机器可读存储介质可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例提供的电子设备,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时,用以执行如下步骤:

对裸金属服务器的状态进行监测;

当监测到裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测,检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,检测规则中包含多个用于检测裸金属服务器的检测项目;

根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

本发明实施例提供的计算机可读存储介质,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。

本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行以下步骤:

对裸金属服务器的状态进行监测;

当监测到裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测,检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,检测规则中包含多个用于检测裸金属服务器的检测项目;

根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

本发明实施例提供的包含指令的计算机程序产品,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。

本发明实施例还提供了一种计算机程序,当其在计算机上运行时,使得计算机执行以下步骤:

对裸金属服务器的状态进行监测;

当监测到裸金属服务器的状态符合预设的检测触发条件时,利用预设的检测规则对裸金属服务器进行检测,检测触发条件包括:裸金属服务器被注销,已故障的裸金属服务器的状态发生变化,或者裸金属服务器被指定为待检测对象,检测规则中包含多个用于检测裸金属服务器的检测项目;

根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测。

本发明实施例提供的包含指令的计算机程序,通过对裸金属服务器的状态进行监测,当裸金属服务器的状态符合预设的检测触发条件时触发检测机制,无需再由人工判断哪些裸金属服务器需要检测;利用预设的检测规则对裸金属服务器进行检测,无需再由人工对检测项目逐一比对;再根据裸金属服务器的各个参数与检测规则中的检测项目的比对结果,判断裸金属服务器是否通过检测,而无需由人工判断裸金属服务器是否通过检测。可见,本发明实施例实现了对裸金属服务器的高效检测,并且更加适合应用于需对多台裸金属服务器批量检测的应用场景。

对于装置/电子设备/存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

相关技术
  • 一种服务器检测方法、检测装置、电子设备及存储介质
  • 一种服务器故障检测方法、系统及电子设备和存储介质
技术分类

06120112457494