掌桥专利:专业的专利平台
掌桥专利
首页

一种保持BMC网络稳定的方法、系统、存储介质及设备

文献发布时间:2023-06-19 19:35:22


一种保持BMC网络稳定的方法、系统、存储介质及设备

技术领域

本发明涉及服务器技术领域,尤其涉及一种保持BMC网络稳定的方法、系统、存储介质及设备。

背景技术

近年来随着互联网和云计算迅速发展,对于服务器的需求也在不断增长,服务器数量不断增多,对服务器的远程管理需求也越来越高。远程管理,顾名思义就是不需要工程师直接操作服务器,而是通过网络完成相关的服务器维护工作,因此对管理网络的稳定性要求也越来越高。

BMC(Baseboard Management Controller,基板管理控制器)系统的网络链路中,一般包含两个网口:专用网口和共享网口,其中专用网口是千兆网口,共享网口使用NCSI(Network Controller Sideband Interface,网络控制器边带接口,是一个由分布式管理任务组定义的用于支持服务器带外管理的边带接口网络控制器的工业标准)协议,最大只支持百兆速率。

专用网口链路是BMC控制芯片到PHY(Physical端口物理层,是一个对OSI模型物理层的共同简称)芯片,再到RJ45(光/电模块接口,计算机网络中对标准8位模块化接口的简称)。

共享网口是利用NCSI接口通过服务器主机系统的网卡发送网络报文,如果专用网口的PHY芯片出现异常将会导致专口网络无法使用,需要切换到共享网口,使用共享网口访问web等操作影响不大。但BMC网口在大的网络压力下,对一些网口速率要求高的操作,可能会出现异常丢包的问题。例如远程管理中经常使用的KVM(Keyboard Video Mouse,KVM通过直接连接键盘、视频或鼠标端口,能够访问和控制计算机)安装系统,需要先将镜像文件挂载到BMC中,然后通过网络读取镜像内容进行系统安装,这个操作要求网络要够快够稳定,一旦出现网络不稳定或者速率不够,就会导致镜像文件读取失败,经常会出现系统安装到一半发现安装失败,严重影响客户体验。因此,仍然需要专用网口来保证BMC网络的速率和稳定性。

发明内容

有鉴于此,本发明的目的在于提出一种保持BMC网络稳定的方法、系统、存储介质及设备,用以解决现有技术中BMC专用网口PHY芯片运行异常影响BMC网络的稳定性的问题。

基于上述目的,本发明提供了一种保持BMC网络稳定的方法,包括以下步骤:

响应于BMC启动,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化;

响应于初始化完成,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态;

响应于第一PHY芯片运行异常,通过BMC控制专用网口切换连接至第二PHY芯片,并向第二PHY芯片发送心跳报文,以判断第二PHY芯片的运行状态;

响应于第二PHY芯片运行正常,BMC通过第二PHY芯片进行数据收发。

在一些实施例中,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化包括:

响应于BMC启动,对与专用网口连接的第一PHY芯片进行初始化;

响应于第一PHY芯片初始化完成,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片,并对第二PHY芯片进行初始化。

在一些实施例中,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片包括:

通过BMC向CPLD发送切换命令;

响应于CPLD接收到切换命令,控制逻辑芯片将专用网口连接至第二PHY芯片。

在一些实施例中,方法还包括:

通过第一逻辑芯片使专用网口与第一PHY芯片连接;

通过第二逻辑芯片使专用网口与第二PHY芯片连接。

在一些实施例中,判断第一PHY芯片的运行状态包括:

基于第一PHY芯片对心跳报文的响应结果判断第一PHY芯片的运行状态。

在一些实施例中,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态包括:

通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,并等待响应报文;

响应于在预设时长内未接收到响应报文,重复上述发送心跳报文并等待响应报文的步骤;

响应于重复次数达到预设阈值后仍未收到响应报文,确定第一PHY芯片运行异常。

在一些实施例中,判断第二PHY芯片的运行状态包括:

基于第二PHY芯片对心跳报文的响应结果判断第二PHY芯片的运行状态。

本发明的另一方面,还提供了一种保持BMC网络稳定的系统,包括:

初始化模块,配置用于响应于BMC启动,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化;

第一判断模块,配置用于响应于初始化完成,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态;

第二判断模块,配置用于响应于第一PHY芯片运行异常,通过BMC控制专用网口切换连接至第二PHY芯片,并向第二PHY芯片发送心跳报文,以判断第二PHY芯片的运行状态;以及

数据收发模块,配置用于响应于第二PHY芯片运行正常,BMC通过第二PHY芯片进行数据收发。

本发明的又一方面,还提供了一种计算机可读存储介质,存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述方法。

本发明的再一方面,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该计算机程序被处理器执行时执行上述方法。

本发明至少具有以下有益技术效果:

本发明的保持BMC网络稳定的方法,通过BMC专用网口双PHY芯片冗余设计,使用第一PHY芯片和第二PHY芯片分别作为主芯片和备芯片,能够保证BMC网络的稳定性;通过向PHY芯片发送心跳报文来检测其运行状态,能够简便且准确地判断PHY芯片是否正常;通过自动判断连接的PHY芯片异常后识别并切换到另一PHY芯片,保证了BMC网络的速率;进而有效保证了对服务器的远程管理功能,提高了客户远程管理服务器的速度和效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为根据本发明实施例提供的保持BMC网络稳定的方法的示意图;

图2为根据本发明实施例提供的实现保持BMC网络稳定的方法的结构示意图;

图3为根据本发明实施例提供的保持BMC网络稳定的系统的示意图;

图4为根据本发明实施例提供的实现保持BMC网络稳定的方法的计算机可读存储介质的示意图;

图5为根据本发明实施例提供的执行保持BMC网络稳定的方法的计算机设备的硬件结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称的非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备固有的其他步骤或单元。

基于上述目的,本发明实施例的第一个方面,提出了一种保持BMC网络稳定的方法的实施例。图1示出的是本发明提供的保持BMC网络稳定的方法的实施例的示意图。如图1所示,本发明实施例包括如下步骤:

步骤S10、响应于BMC启动,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化;

步骤S20、响应于初始化完成,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态;

步骤S30、响应于第一PHY芯片运行异常,通过BMC控制专用网口切换连接至第二PHY芯片,并向第二PHY芯片发送心跳报文,以判断第二PHY芯片的运行状态;

步骤S40、响应于第二PHY芯片运行正常,BMC通过第二PHY芯片进行数据收发。

本发明实施例的保持BMC网络稳定的方法,通过BMC专用网口双PHY芯片冗余设计,使用第一PHY芯片和第二PHY芯片分别作为主芯片和备芯片,能够保证BMC网络的稳定性;通过向PHY芯片发送心跳报文来检测其运行状态,能够简便且准确地判断PHY芯片是否正常;通过自动判断连接的PHY芯片异常后识别并切换到另一PHY芯片,保证了BMC网络的速率;进而有效保证了对服务器的远程管理功能,提高了客户远程管理服务器的速度和效率。

本发明实施例对于备用的PHY芯片的数量不设限制,可以是一个或多个备用的PHY芯片。专用网口也可以切换连接多个备用PHY芯片。对于每个备用PHY芯片,均通过BMC向其发送心跳报文来检测运行状态。

在一些实施例中,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化包括:响应于BMC启动,对与专用网口连接的第一PHY芯片进行初始化;响应于第一PHY芯片初始化完成,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片,并对第二PHY芯片进行初始化。

在一些实施例中,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片包括:通过BMC向CPLD发送切换命令;响应于CPLD接收到切换命令,控制逻辑芯片将专用网口连接至第二PHY芯片。

在一些实施例中,方法还包括:通过第一逻辑芯片使专用网口与第一PHY芯片连接;通过第二逻辑芯片使专用网口与第二PHY芯片连接。

在一些实施例中,判断第一PHY芯片的运行状态包括:基于第一PHY芯片对心跳报文的响应结果判断第一PHY芯片的运行状态。

在一些实施例中,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态包括:通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,并等待响应报文;响应于在预设时长内未接收到响应报文,重复上述发送心跳报文并等待响应报文的步骤;响应于重复次数达到预设阈值后仍未收到响应报文,确定第一PHY芯片运行异常。

在一些实施例中,判断第二PHY芯片的运行状态包括:基于第二PHY芯片对心跳报文的响应结果判断第二PHY芯片的运行状态。

图2示出了实现保持BMC网络稳定的方法的结构示意图。如图2所示,本发明的保持BMC网络稳定的方法的一示例性实施例如下:

通过BMC(Baseboard Management Controller,基板管理控制器)专用网口的双PHY芯片冗余设计保持BMC网络稳定的过程主要分为3部分:一是BMC上电启动时PHY(Physical端口物理层,是一个对OSI模型物理层的共同简称)芯片初始化的过程,二是通过BMC判断PHY芯片的运行状态,三是PHY芯片运行异常后,切换到备用PHY芯片的过程。

1)BMC上电启动时PHY芯片初始化的过程:

BMC上电启动时,首先会对连接的PHY1芯片(即第一PHY芯片)进行初始化流程,初始化完成后,发送切换PHY芯片命令到CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件),CPLD控制逻辑芯片,将BMC专用网口与PHY2芯片(即第二PHY芯片)连接,然后重新启动一次PHY初始化流程,两次初始化完成后,再切换到PHY1芯片,系统默认初始化完成后使用PHY1芯片运行。

逻辑芯片包括逻辑芯片1(即第一逻辑芯片)和逻辑芯片2(即第二逻辑芯片),逻辑芯片1使专用网口和PHY1芯片连接,逻辑芯片2使专用网口和PHY2芯片连接。

2)BMC判断PHY芯片运行状态:

BMC发送心跳报文到PHY1芯片获取运行状态,发送心跳报文后等待响应信号,若超时未获取到响应报文,则重复发送心跳报文,连续三次均超时未收到响应报文后,判断PHY1芯片运行异常。

3)PHY芯片运行异常后,切换到备用PHY芯片过程:

BMC判断PHY1芯片运行异常后,向CPLD发送切换PHY芯片信号,CPLD收到信号后,通过控制逻辑芯片,完成BMC专用网口的PHY2芯片连接的切换后,发送信号给BMC;BMC发送心跳报文确认PHY2芯片链接状态,若BMC收到了PHY2芯片的响应报文,则确定PHY2芯片正常,然后通过专用网口和PHY2芯片进行数据收发。

由此,本实施例实现了:BMC专用网口双PHY冗余设计,PHY连接故障自动判断,以及PHY运行异常后自动切换;从而提高了BMC网络的稳定性,有效的保证了对服务器的远程管理功能,有利于提高客户远程管理服务器的速度和效率。

本发明实施例的第二个方面,还提供了一种保持BMC网络稳定的系统。图3示出的是本发明提供的保持BMC网络稳定的系统的实施例的示意图。如图3所示,一种保持BMC网络稳定的系统包括:初始化模块10,配置用于响应于BMC启动,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化;第一判断模块20,配置用于响应于初始化完成,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态;第二判断模块30,配置用于响应于第一PHY芯片运行异常,通过BMC控制专用网口切换连接至第二PHY芯片,并向第二PHY芯片发送心跳报文,以判断第二PHY芯片的运行状态;以及数据收发模块40,配置用于响应于第二PHY芯片运行正常,BMC通过第二PHY芯片进行数据收发。

本发明实施例的保持BMC网络稳定的系统,通过BMC专用网口双PHY芯片冗余设计,使用第一PHY芯片和第二PHY芯片分别作为主芯片和备芯片,能够保证BMC网络的稳定性;通过向PHY芯片发送心跳报文来检测其运行状态,能够简便且准确地判断PHY芯片是否正常;通过自动判断连接的PHY芯片异常后识别并切换到另一PHY芯片,保证了BMC网络的速率;进而有效保证了对服务器的远程管理功能,提高了客户远程管理服务器的速度和效率。

在一些实施例中,初始化模块10进一步配置用于响应于BMC启动,对与专用网口连接的第一PHY芯片进行初始化;响应于第一PHY芯片初始化完成,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片,并对第二PHY芯片进行初始化。

在一些实施例中,初始化模块10包括切换模块,配置用于通过BMC向CPLD发送切换命令;响应于CPLD接收到切换命令,控制逻辑芯片将专用网口连接至第二PHY芯片。

在一些实施例中,系统还包括逻辑芯片连接模块,配置用于通过第一逻辑芯片使专用网口与第一PHY芯片连接;通过第二逻辑芯片使专用网口与第二PHY芯片连接。

在一些实施例中,第一判断模块20进一步配置用于基于第一PHY芯片对心跳报文的响应结果判断第一PHY芯片的运行状态。

在一些实施例中,第一判断模块20进一步还配置用于通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,并等待响应报文;响应于在预设时长内未接收到响应报文,重复上述发送心跳报文并等待响应报文的步骤;响应于重复次数达到预设阈值后仍未收到响应报文,确定第一PHY芯片运行异常。

在一些实施例中,第二判断模块30进一步配置用于基于第二PHY芯片对心跳报文的响应结果判断第二PHY芯片的运行状态。

本发明实施例的第三个方面,还提供了一种计算机可读存储介质,图4示出了根据本发明实施例提供的实现保持BMC网络稳定的方法的计算机可读存储介质的示意图。如图4所示,计算机可读存储介质3存储有计算机程序指令31。该计算机程序指令31被处理器执行时实现如下步骤:

响应于BMC启动,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化;

响应于初始化完成,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态;

响应于第一PHY芯片运行异常,通过BMC控制专用网口切换连接至第二PHY芯片,并向第二PHY芯片发送心跳报文,以判断第二PHY芯片的运行状态;

响应于第二PHY芯片运行正常,BMC通过第二PHY芯片进行数据收发。

在一些实施例中,控制专用网口依次与第一PHY芯片和第二PHY芯片连接,以对第一PHY芯片和第二PHY芯片进行初始化包括:响应于BMC启动,对与专用网口连接的第一PHY芯片进行初始化;响应于第一PHY芯片初始化完成,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片,并对第二PHY芯片进行初始化。

在一些实施例中,通过BMC向CPLD发送切换命令,以使专用网口切换连接至第二PHY芯片包括:通过BMC向CPLD发送切换命令;响应于CPLD接收到切换命令,控制逻辑芯片将专用网口连接至第二PHY芯片。

在一些实施例中,步骤还包括:通过第一逻辑芯片使专用网口与第一PHY芯片连接;通过第二逻辑芯片使专用网口与第二PHY芯片连接。

在一些实施例中,判断第一PHY芯片的运行状态包括:基于第一PHY芯片对心跳报文的响应结果判断第一PHY芯片的运行状态。

在一些实施例中,通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,以判断第一PHY芯片的运行状态包括:通过BMC向专用网口当前连接的第一PHY芯片发送心跳报文,并等待响应报文;响应于在预设时长内未接收到响应报文,重复上述发送心跳报文并等待响应报文的步骤;响应于重复次数达到预设阈值后仍未收到响应报文,确定第一PHY芯片运行异常。

在一些实施例中,判断第二PHY芯片的运行状态包括:基于第二PHY芯片对心跳报文的响应结果判断第二PHY芯片的运行状态。

应当理解,在相互不冲突的情况下,以上针对根据本发明的保持BMC网络稳定的方法阐述的所有实施方式、特征和优势同样地适用于根据本发明的保持BMC网络稳定的系统和存储介质。

本发明实施例的第四个方面,还提供了一种计算机设备,包括如图5所示的存储器402和处理器401,该存储器402中存储有计算机程序,该计算机程序被该处理器401执行时实现上述任意一项实施例的方法。

如图5所示,为本发明提供的执行保持BMC网络稳定的方法的计算机设备的一个实施例的硬件结构示意图。以如图5所示的计算机设备为例,在该计算机设备中包括一个处理器401以及一个存储器402,并还可以包括:输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接,图5中以通过总线连接为例。输入装置403可接收输入的数字或字符信息,以及产生与保持BMC网络稳定的系统的用户设置以及功能控制有关的键信号输入。输出装置404可包括显示屏等显示设备。

存储器402作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的保持BMC网络稳定的方法对应的程序指令/模块。存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储保持BMC网络稳定的方法的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器401通过运行存储在存储器402中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的保持BMC网络稳定的方法。

最后需要说明的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RAM可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、以及直接Rambus RAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。

以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。

应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

相关技术
  • 网络设备系统、网络设备系统的实现方法以及计算机可读存储介质
  • 一种网络存储系统的配置方法、装置、设备及介质
  • 一种BMC服务管理方法、装置、终端及存储介质
  • 一种服务器的BMC版本的升级方法、装置及存储介质
  • 一种BMC与BIOS的Setup交互实现方法、装置、终端及存储介质
  • 基于BMC网络的测试控制方法、系统、计算机设备及存储介质
  • BMC网络Bond功能检测方法、装置、电子设备及存储介质
技术分类

06120115968573