掌桥专利:专业的专利平台
掌桥专利
首页

服务器上电检测方法、电子设备及系统

文献发布时间:2023-06-19 13:29:16


服务器上电检测方法、电子设备及系统

技术领域

本发明涉及服务器技术领域,具体涉及服务器上电检测方法、电子设备及系统。

背景技术

在服务器架构中,主板连接的硬件器件包含RISER、PCIe卡等。现有方案中一般是在主板与硬件器件安装之后上电以进行带电检测。若主板与硬件器件的连接正常,那么可以正常上电检测。然而,在实际业务应用中,主板烧焦的情况频发,主要在于RISER卡等硬件器件与主板连接处位置,如此严重影响客户现场环境与业务评测。

发明内容

有鉴于此,本发明实施例提供了一种服务器上电检测方法、电子设备及系统,以解决主板与硬件器件的连接处的故障检测的问题。

根据第一方面,本发明实施例提供了一种服务器上电检测方法,应用于目标服务器,所述方法包括:

在检测到上电操作时,启动短路检测并生成检测电流;

控制所述检测电流流经目标检测位置的检测元件并获取所述检测元件的工作参数,所述目标检测位置为所述目标服务器的主板与硬件器件的连接处;

基于所述检测元件的工作参数,确定所述目标检测位置是否存在短路。

本发明实施例提供的服务器上电检测方法,通过在目标服务器的主板与硬件器件的连接处设置检测元件,在检测电流的作用下利用检测元件的工作参数确定是否存在短路,从而可以准确检测出连接处的短路情况,有效减少了服务器因短路引发的主板烧毁问题,保障了服务器的运营成本。

结合第一方面,在第一方面第一实施方式中,所述生成检测电流,包括:

控制电源模块生成所述检测电流;

或者,

控制预设电源模块生成所述检测电流。

本发明实施例提供的服务器上电检测方法,利用目标服务器的电源模块生成检测电流,可以避免其他电源模块的设置,简化了电路结构;或者,利用预设电源模块生成检测电流,可以简化控制过程,以避免对目标服务器正常的影响。

结合第一方面,在第一方面第二实施方式中,所述启动短路检测,包括:

获取上电保护开关目标预留位的值;

当所述目标预留位的值为预设值时,启动所述短路检测。

本发明实施例提供的服务器上电检测方法,利用预留位实现短路检测的开关,可以充分利用现有资源,而避免引入其他模块,实现资源的最大化利用。

结合第一方面,在第一方面第三实施方式中,所述基于所述检测元件的工作参数,确定所述目标检测位置是否存在短路,包括:

当所述目标检测位置存在短路时,获取所述目标检测位置的位置信息;

基于所述位置信息生成告警信息。

本发明实施例提供的服务器上电检测方法,利用位置信息生成告警信息,可以准确的定位到目标检测位置处,为后续的维护提供了条件。

结合第一方面第三实施方式,在第一方面第四实施方式中,所述基于所述位置信息生成告警信息,包括:

利用所述位置信息,确定短路对应的目标硬件器件;

利用硬件器件与告警灯闪烁状态的映射关系,确定所述目标硬件器件对应的告警信息,以控制所述告警灯的闪烁状态。

本发明实施例提供的服务器上电检测方法,利用硬件器件与告警灯闪烁状态的映射关系,确定告警信息,后续基于告警灯的闪烁状态就可以确定出存在短路的硬件器件,进而就可以准确定位到该硬件器件。

结合第一方面第三实施方式,在第一方面第五实施方式中,所述获取所述目标检测位置在所述目标服务器中的位置信息,包括:

获取所述目标检测位置对应的槽位,以确定所述位置信息。

本发明实施例提供的服务器上电检测方法,利用槽位信息确定位置信息,并在告警信息中包括该槽位信息,以便于故障的准确定位。

结合第一方面,在第一方面第六实施方式中,所述基于所述检测元件的工作参数,确定所述目标检测位置是否存在短路,包括:

当所述目标检测位置不存在短路时,停止生成所述检测电流。

根据第二方面,本发明实施例提供了一种服务器上电检测装置,应用于目标服务器,所述装置包括:

启动模块,用于在检测到上电操作时,启动短路检测并生成检测电流;

控制模块,用于控制所述检测电流流经目标检测位置的检测元件并获取所述检测元件的工作参数,所述目标检测位置为所述目标服务器的主板与硬件器件的连接处;

检测模块,用于基于所述检测元件的工作参数,确定所述目标检测位置是否存在短路。

本发明实施例提供的服务器上电检测装置,通过在目标服务器的主板与硬件器件的连接处设置检测元件,在检测电流的作用下利用检测元件的工作参数确定是否存在短路,从而可以准确检测出连接处的短路情况,有效减少了服务器因短路引发的主板烧毁问题,保障了服务器的运营成本。

根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的服务器上电检测方法。

根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的服务器上电检测方法。

根据第五方面,本发明实施例提供一种服务器上电检测系统,包括:

主板;

硬件器件,所述硬件器件与所述主板连接;

检测元件,设置在所述主板与所述硬件器件之间的目标检测位置处;

本发明第三方面所述的电子设备,所述电子设备与所述主板连接。

本发明实施例提供的服务器上电检测系统,通过在目标服务器的主板与硬件器件的连接处设置检测元件,在检测电流的作用下利用检测元件的工作参数确定是否存在短路,从而可以准确检测出连接处的短路情况,有效减少了服务器因短路引发的主板烧毁问题,保障了服务器的运营成本。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的服务器上电检测系统的结构框图;

图2是根据本发明实施例的服务器上电检测方法的流程图;

图3是根据本发明实施例的服务器上电检测方法的流程图;

图4是根据本发明实施例的服务器上电检测方法的流程图;

图5是根据本发明实施例的服务器上电检测装置的结构框图;

图6是本发明实施例提供的电子设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的服务器上电检测方法,是用于在服务器上电过程中,对主板与硬件器件连接处的短路进行检测,以避免短路对主板的损坏。

基于此,本发明实施例提供了一种服务器上电检测系统,如图1所示,该检测系统包括电子设备10、主板20、硬件器件30以及检测元件40。其中,主板20所连接的硬件器件30的数量并不限于图1中所示的一个,也可以为多个,具体可以根据实际需求进行相应的设置。

具体地,将主板20与硬件器件30连接的位置中需要进行短路检测的位置称之为目标检测位置,在目标检测位置处设置有检测元件。其中,检测元件用于检测目标检测位置处是否发生短路。所述的检测元件可以是热敏电路,或热电偶,或其他检测元件,只需保证该检测元件能够检测出短路即可。

以热敏电阻为例,当发生短路时,热敏电阻的温度会升高,两端电压也会发生变化。因此,就可以通过检测热敏电阻的温度变化,或电压变化,确定是否目标检测位置是否短路。

在检测系统中设置有检测回路,使得检测电流流经检测元件。例如,从产生检测电流的电源流出,经过主板,再由目标检测位置流经检测元件,经过检测元件流经硬件器件,再返回至产生检测电流的电源。在检测完成之后,停止产生检测电流,那么该检测回路就不会对服务器的正常上电及工作产生影响。

关于具体的检测方法将在下文中进行详细描述。

根据本发明实施例,提供了一种服务器上电检测方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

在本实施例中提供了一种服务器上电检测方法,可用于电子设备,如目标服务器,或目标服务器的主控芯片等,图2是根据本发明实施例的服务器上电检测方法的流程图,如图2所示,该流程包括如下步骤:

S11,在检测到上电操作时,启动短路检测并生成检测电流。

在主控芯片检测到上电操作时,该目标服务器启动上电自检,且启动短路检测。其中,短路检测所用的检测电流与目标服务器正常上电过程互不影响,该检测电流很小,与目标服务器的正常电流而言,检测电流相对较小,可以对短路位置进行检测,而且短路产生的危害也会小。即使发生短路情况,但是由于检测电流较小,该检测电流也不会产生较大的危害,即不会对主板产生损坏性的影响。

S12,控制检测电流流经目标检测位置的检测元件并获取检测元件的工作参数。

其中,所述目标检测位置为所述目标服务器的主板与硬件器件的连接处。

如上文所述,在检测系统中设置有检测回路,主控芯片通过对检测电流进行控制,使得其流经目标检测位置处的检测元件。利用测量元件对检测元件的工作参数进行检测,并将检测结果发送至主控芯片。相应地,主控芯片就能够获取到检测元件的工作参数。其中,所述的检测参数可以是温度,也可以是电压等等,具体可以根据实际情况进行相应的设置。

例如,在检测系统中设置有温度传感器,在检测过程中,温度传感器将测得的温度值实时反馈给主控芯片,即主控芯片获取到检测元件的工作参数。或者,在检测系统中设置有电压检测元件,用于测量检测元件两端的电压,并将测得的电压值反馈给主控芯片。

可选地,服务器开机上电,通过自检过程后,检测电流启动对目标检测位置的流转检测,可由BMC芯片控制,此时的BMC已经可以启动,将该流程烧录在芯片中。

S13,基于检测元件的工作参数,确定目标检测位置是否存在短路。

在目标服务器上电过程中,主控芯片可以基于检测元件的工作参数的变化,或者实时工作参数与阈值的大小关系,确定目标检测位置是否存在短路。

本实施例提供的服务器上电检测方法,通过在目标服务器的主板与硬件器件的连接处设置检测元件,在检测电流的作用下利用检测元件的工作参数确定是否存在短路,从而可以准确检测出连接处的短路情况,有效减少了服务器因短路引发的主板烧毁问题,保障了服务器的运营成本。

在本实施例中提供了一种服务器上电检测方法,可用于电子设备,如目标服务器,或目标服务器的主控芯片等,图3是根据本发明实施例的服务器上电检测方法的流程图,如图3所示,该流程包括如下步骤:

S21,在检测到上电操作时,启动短路检测并生成检测电流。

详细请参见图2所示实施例的S11,在此不再赘述。

S22,控制检测电流流经目标检测位置的检测元件并获取检测元件的工作参数。

其中,所述目标检测位置为所述目标服务器的主板与硬件器件的连接处。

详细请参见图2所示实施例的S12,在此不再赘述。

S23,基于检测元件的工作参数,确定目标检测位置是否存在短路。

具体地,上述S23包括:

S231,判断目标检测位置是否存在短路。

如上文所述,主控芯片可以利用工作参数的变化确定目标检测位置是否存在短路。当所述目标检测位置存在短路时,执行S232;否则,表示无短路故障,目标服务器可以正常上电启动,即执行S234。

S232,获取目标检测位置的位置信息。

如上文所述,主板可以与多个硬件器件连接,主控芯片在接收检测元件的工作参数时,可以对属于不同检测元件的工作参数进行标记,以区分不同的检测元件对应的目标检测位置;即,各个目标检测位置均对应有唯一的标识。在出现短路故障时,主控芯片利用该标识以区分是哪个目标检测位置,从而确定出目标检测位置的位置信息。所述的位置信息可以是硬件器件所在的槽位,也可以是主板对应的引脚等等。在此对其具体表现形式并不做任何限定,具体可以根据实际需求进行相应的设置。

在本实施例的一种可选实施方式中,上述S232可以包括获取目标检测位置对应的槽位,以确定位置信息。利用槽位信息确定位置信息,并在告警信息中包括该槽位信息,以便于故障的准确定位。

S233,基于位置信息生成告警信息。

主控芯片在确定出位置信息之后,基于该位置信息生成告警信息。所述的告警信息用于通知相应人员进行故障处理,在告警信息中包括有出现短路故障的位置信息。

在本实施例的一些可选实施方式中,上述S233包括:

(1)利用位置信息,确定短路对应的目标硬件器件。

主控芯片确定出目标检测位置的位置信息之后,就可以确定出连接该目标检测位置处的硬件器件,进而就可以确定短路对应的硬件器件。为便于区分,将短路对应的硬件器件确定为目标硬件器件。

(2)利用硬件器件与告警灯闪烁状态的映射关系,确定目标硬件器件对应的告警信息,以控制告警灯的闪烁状态。

在主控芯片中存储有硬件器件与告警灯闪烁状态的映射关系,例如,硬件器件1对应闪烁状态1,即告警灯连续闪烁3次;硬件器件2对应闪烁状态2,即告警灯连续一长两短闪烁;硬件器件3对应闪烁状态3,即告警灯连续一短两长闪烁。

具体闪烁状态的定义可以根据实际需求进行,在此对其并不做任何限定,只需其能够区分出不同的硬件器件即可。

例如,硬件器件包括RISER卡以及PCIe卡,映射关系如下所示:

其中,1表示亮的时间长;0表示亮的时间短;001表示短短长,目标硬件器件为RISER卡;010表示短长短,目标硬件器件为PCIe卡。

或者,也可以在此基础上,增加数据位,以具体表征出目标硬件器件。

利用硬件器件与告警灯闪烁状态的映射关系,确定告警信息,后续基于告警灯的闪烁状态就可以确定出存在短路的硬件器件,进而就可以准确定位到该硬件器件。

S234,停止生成检测电流。

停止生成检测电流之后,目标服务器再正常上电。

本实施例提供的服务器上电检测方法,利用位置信息生成告警信息,可以准确的定位到目标检测位置处,为后续的维护提供了条件。

在本实施例中提供了一种服务器上电检测方法,可用于电子设备,如目标服务器,或目标服务器的主控芯片等,图4是根据本发明实施例的服务器上电检测方法的流程图,如图4所示,该流程包括如下步骤:

S31,在检测到上电操作时,启动短路检测并生成检测电流。

具体地,上述S31包括:

S311,获取上电保护开关目标预留位的值。

上电保护开关为主控芯片中的功能模块,用于控制目标服务器的上电过程,也可称之为系统维护开关。在本实施例中,利用上电保护开关中的目标预留位作为是否启动短路检测的触发开关。其中,关于上电保护开关具体如下所示:

将X1的3位确定为目标预留位,具体定义如下:

OFF(缺省)=未启用上电保护方案;

ON=启动上电保护方案。

在本实施例的一些可选实施方式中,上电保护开关也可以使用软件方案,加装在BIOS选项中。

S312,当目标预留位的值为预设值时,启动短路检测。

当需要启动上电保护方案,即短路检测时,将X1的3位设置为ON;当不需要启用上电保护方案,即不需要进行短路检测时,将X1的3为设置为OFF。

主控芯片通过对上电保护开关的目标预留为的值进行确定,判断其是否为预设值,例如,是否为ON。当目标预留位的值为预设值时,启动短路检测。

S313,控制电源模块生成检测电流。

电源模块用于提供目标服务器的工作电源,在启动短路检测时,主控芯片控制该电源模块生成检测电流。如上文所述,该检测电流小于目标服务器的正常工作电流。

具体地,目标服务器采用主备电源供电时,可以控制备用电源产生检测电流进行短路检测。即,利用纽扣电池放电产生检测电流。

在本实施例的一些可选实施方式中,还可以控制预设电源模块生成所述检测电流,例如,纽扣电池等。利用预设电源模块生成检测电流,可以简化控制过程,以避免对目标服务器正常的影响。

S32,控制检测电流流经目标检测位置的检测元件并获取检测元件的工作参数。

其中,所述目标检测位置为所述目标服务器的主板与硬件器件的连接处。

详细请参见图3所示实施例的S22,在此不再赘述。

S33,基于检测元件的工作参数,确定目标检测位置是否存在短路。

详细请参见图3所示实施例的S23,在此不再赘述。

本实施例提供的服务器上电检测方法,利用预留位实现短路检测的开关,可以充分利用现有资源,而避免引入其他模块,实现资源的最大化利用。且利用目标服务器的电源模块生成检测电流,可以避免其他电源模块的设置,简化了电路结构。

在本实施例中还提供了一种服务器上电检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

本实施例提供一种服务器上电检测装置,应用于目标服务器,如图5所示,包括:

启动模块41,用于在检测到上电操作时,启动短路检测并生成检测电流;

控制模块42,用于控制所述检测电流流经目标检测位置的检测元件并获取所述检测元件的工作参数,所述目标检测位置为所述目标服务器的主板与硬件器件的连接处;

检测模块43,用于基于所述检测元件的工作参数,确定所述目标检测位置是否存在短路。

本实施例提供的服务器上电检测装置,通过在目标服务器的主板与硬件器件的连接处设置检测元件,在检测电流的作用下利用检测元件的工作参数确定是否存在短路,从而可以准确检测出连接处的短路情况,有效减少了服务器因短路引发的主板烧毁问题,保障了服务器的运营成本。

本实施例中的服务器上电检测装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。

上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。

本发明实施例还提供一种电子设备,具有上述图5所示的服务器上电检测装置。

请参阅图6,图6是本发明可选实施例提供的一种电子设备的结构示意图,如图6所示,该终端可以包括:至少一个处理器51,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口53,存储器54,至少一个通信总线52。其中,通信总线52用于实现这些组件之间的连接通信。其中,通信接口53可以包括显示屏(Display)、键盘(Keyboard),可选通信接口53还可以包括标准的有线接口、无线接口。存储器54可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器54可选的还可以是至少一个位于远离前述处理器51的存储装置。其中处理器51可以结合图5所描述的装置,存储器54中存储应用程序,且处理器51调用存储器54中存储的程序代码,以用于执行上述任一方法步骤。

其中,通信总线52可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线52可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器54可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器54还可以包括上述种类的存储器的组合。

其中,处理器51可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。

其中,处理器51还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。

可选地,存储器54还用于存储程序指令。处理器51可以调用程序指令,实现如本申请图2至4任一实施例中所示的服务器上电检测方法。

本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的服务器上电检测方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。

虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

相关技术
  • 服务器上电检测方法、电子设备及系统
  • 一种基于CPLD-FPGA的服务器上电时序检测方法与系统
技术分类

06120113693798