掌桥专利:专业的专利平台
掌桥专利
首页

管理网络智能切换系统、方法、计算机设备和存储介质

文献发布时间:2023-06-19 18:35:48


管理网络智能切换系统、方法、计算机设备和存储介质

技术领域

本申请涉及网络管理的技术领域,特别是涉及一种管理网络智能切换系统、方法、计算机设备和存储介质。

背景技术

随着市场对服务器系统的可靠性和稳定性要求逐渐提高,服务器设计中增加了许多冗余方案,以保障故障发生时,不需要断电,整个服务器系统仍可正常工作。例如服务器设计中常见的PSU(电源单元)冗余设计等,当一个PSU发生故障失效,另一个PSU会继续为系统供电,而不需要将整个系统断电,更换新的PSU,这些冗余设计都大大提高了服务器系统的稳定性和可靠性。

同理的,目前市面上主流的服务器系统设计一般采用单管理板,从而导致服务器中网络出现故障时,整个系统管理网络将失去管理控制,部分高密度服务器系统采用双管理板冗余方案,但系统网络无法实现智能切换,用户需要检查到网络连接出现问题后,手动将网线插到从管理板CMC1(CMC,CHAS I S MANAGEMENT CONTROLLER,机箱管理控制器)上,然后更换问题部件CMC0,基于上述问题都将导致系统的稳定性和可靠性较差。

因此,亟需提出一种可以提高服务器系统网络设计稳定性和可靠性的管理网络智能切换系统、方法、计算机设备和存储介质。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高服务器系统网络设计稳定性和可靠性的管理网络智能切换系统、方法、计算机设备和存储介质。

一方面,提供一种管理网络智能切换系统,所述系统包括:多个计算节点、第一管理模块、第二管理模块和信息交互背板;

所述第一管理模块和第二管理模块通过双向二线制同步串行总线进行通信连接,用于管理网络的智能切换;

所述信息交互背板上设有芯片寄存器,所述芯片寄存器通过所述双向二线制同步串行总线分别与所述第一管理模块、第二管理模块进行通信连接,用于发送/接收系统信息;

所述多个计算节点与所述信息交互背板进行连接。

在其中一个实施例中,还包括:所述系统消息包括计算节点的配置、各计算节点的管理网络信息以及电源信息。

另一方面,提供了一种管理网络智能切换方法,所述方法包括:

步骤A:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;

步骤B:第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;

步骤C:若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

在其中一个实施例中,还包括:在所述启动管理网络智能切换系统之前,所述方法还包括:利用芯片寄存器读取所述第一管理模块和第二管理模块的信息并进行比对;若所述信息保持一致,则对所述管理网络智能切换系统进行上电并启动,使得服务器处于正常开机状态;若所述信息不一致,则利用芯片寄存器通知所述第一管理模块和第二管理模块重新进行加载,直至二者信息一致进行上电启动。

在其中一个实施例中,还包括:在所述管理网络智能切换系统正常运行期间,所述方法还包括:利用芯片寄存器不间断的读取所述第一管理模块和第二管理模块的信息并进行比对;当所述信息不一致时,所述第一管理模块和第二管理模块同时重新进行加载,直至二者信息保持一致。

在其中一个实施例中,还包括:所述第二管理模块在接管所述第一管理模块网络管理工作之后,所述方法还包括:保持所述第一管理模块和第二管理模块之间的通信连接;当所述第二管理模块重新获取到所述第一管理模块的信号时,所述第二管理模块切换回待命状态,所述第一管理模块重新对信息交互背板进行配置,接管所述第二管理模块的网络管理工作。

在其中一个实施例中,还包括:所述第二管理模块接收所述第一管理模块的实时运行参数,结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障包括:接收所述系统消息中的管理网络列表,提取所述管理网络列表中的信号强度和网络速率;将所述信号强度与第一预设值进行比较,将所述网络速率与第二预设值进行比较;若所述信号强度小于第一预设值,和/或,所述网络速率小于第二预设值,提取所述第一管理模块的实时运行参数;若所述实时运行参数不符合预设标准,判断所述第一管理模块发生故障。

在其中一个实施例中,还包括:若所述实时运行参数符合预设标准,获取所述信号强度小于第一预设值的时间周期,和/或,所述网络速率小于第二预设值的时间周期;若所述时间周期大于大三预设值,判断所述第一管理模块发生故障。

再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

步骤A:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;

步骤B:第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;

步骤C:若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

步骤A:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;

步骤B:第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;

步骤C:若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

上述管理网络智能切换系统、方法、计算机设备和存储介质,所述系统包括:多个计算节点、第一管理模块、第二管理模块和信息交互背板;所述第一管理模块和第二管理模块通过双向二线制同步串行总线进行通信连接,用于管理网络的智能切换;所述信息交互背板上设有芯片寄存器,所述芯片寄存器通过所述双向二线制同步串行总线分别与所述第一管理模块、第二管理模块进行通信连接,用于发送/接收系统信息;所述多个计算节点与所述信息交互背板进行连接,本申请相较于现有技术可以保证单个管理板故障时,管理网络可自动识别到网络故障问题并切换到另一个管理板,无需手动插拔网线,保证了系统的稳定性和可靠性,提升了产品的竞争力。

附图说明

图1为一个实施例中管理网络智能切换方法的应用环境图;

图2为一个实施例中管理网络智能切换系统的结构框图;

图3为一个实施例中管理网络智能切换系统的另一结构框图;

图4为一个实施例中管理网络智能切换方法的流程示意图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的管理网络智能切换方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与设置于服务器104上的数据处理平台进行通信,其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

实施例1

在一个实施例中,如图2-3所示,提供了一种管理网络智能切换系统,所述系统包括多个计算节点、第一管理模块、第二管理模块和信息交互背板,其中:

所述第一管理模块和第二管理模块通过双向二线制同步串行总线进行通信连接,用于管理网络的智能切换;

所述信息交互背板上设有芯片寄存器,所述芯片寄存器通过所述双向二线制同步串行总线分别与所述第一管理模块、第二管理模块进行通信连接,用于发送/接收系统信息;

所述多个计算节点与所述信息交互背板进行连接。

在一个实施例中,所述系统消息包括计算节点的配置、各计算节点的管理网络信息以及电源信息。

如图3所示为本发明的管理网络智能切换系统构成框图,所述第一管理模块为管理板CMC0,所述第二管理模块为管理板CMC1,所述信息交互背板为LAN SW I TCH板以及其他一些用于连接或命令寄存的其他硬件,其中,CMC0和CMC1之间通过I 2C进行通信,CMC0和LAN SWI TCH、CMC1和LAN SWI TCH之间各有一路I 2C,用于完成CMC0和CMC1对LAN SWI TCH的配置。

作为一种较优的实施方式,本发明实施例中,基于上述管理网络智能切换系统进行网络切换的具体步骤为:

启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;

第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;

若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

作为一种较优的实施方式,本发明实施例中,在所述启动管理网络智能切换系统之前,还包括:

利用芯片寄存器读取所述第一管理模块和第二管理模块的信息并进行比对;

若所述信息保持一致,则对所述管理网络智能切换系统进行上电并启动,使得服务器处于正常开机状态;

若所述信息不一致,则利用芯片寄存器通知所述第一管理模块和第二管理模块重新进行加载,直至二者信息一致进行上电启动。

作为一种较优的实施方式,本发明实施例中,在所述管理网络智能切换系统正常运行期间,还包括:

利用芯片寄存器不间断的读取所述第一管理模块和第二管理模块的信息并进行比对;

当所述信息不一致时,所述第一管理模块和第二管理模块同时重新进行加载,直至二者信息保持一致。

作为一种较优的实施方式,本发明实施例中,所述第二管理模块在接管所述第一管理模块网络管理工作之后,还包括:

保持所述第一管理模块和第二管理模块之间的通信连接;

当所述第二管理模块重新获取到所述第一管理模块的信号时,所述第二管理模块切换回待命状态,所述第一管理模块重新对信息交互背板进行配置,接管所述第二管理模块的网络管理工作。

作为一种较优的实施方式,本发明实施例中,所述第二管理模块接收所述第一管理模块的实时运行参数,结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障包括:

接收所述系统消息中的管理网络列表,提取所述管理网络列表中的信号强度和网络速率;

将所述信号强度与第一预设值进行比较,将所述网络速率与第二预设值进行比较;

若所述信号强度小于第一预设值,和/或,所述网络速率小于第二预设值,提取所述第一管理模块的实时运行参数;

若所述实时运行参数不符合预设标准,判断所述第一管理模块发生故障。

若所述实时运行参数符合预设标准,获取所述信号强度小于第一预设值的时间周期,和/或,所述网络速率小于第二预设值的时间周期;

若所述时间周期大于大三预设值,判断所述第一管理模块发生故障。

关于管理网络智能切换系统的具体限定可以参见下文中对于管理网络智能切换方法的限定,在此不再赘述。上述管理网络智能切换系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

实施例2

在一个实施例中,如图4所示,提供了一种管理网络智能切换方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

S1:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置。

需要说明的是,在所述启动管理网络智能切换系统之前,所述方法还包括:

利用芯片寄存器读取所述第一管理模块和第二管理模块的信息并进行比对;

若所述信息保持一致,则对所述管理网络智能切换系统进行上电并启动,使得服务器处于正常开机状态;

若所述信息不一致,则利用芯片寄存器通知所述第一管理模块和第二管理模块重新进行加载,直至二者信息一致进行上电启动。

具体的,为保证第一管理模块和第二管理模块在切换管理状态时可以无差别接管,需要对第一管理模块和第二管理模块的信息进行比对,即利用芯片寄存器分别读取CMC0和CMC1进行比对,若二者保持一致,则利用BMC控制电源上电并开机。

进一步的,在所述管理网络智能切换系统正常运行期间,所述方法还包括:

利用芯片寄存器不间断的读取所述第一管理模块和第二管理模块的信息并进行比对;

当所述信息不一致时,所述第一管理模块和第二管理模块同时重新进行加载,直至二者信息保持一致。

上述步骤可以保证在网络出现故障时快速的切换连接口且能保持正常的网络通信。

更近一步的,正常开机时,由所述第一管理模块完成对信息交互背板(LAN switch)的配置,将sw i tch芯片port SerDes_CMC0 enab l e,SerDes_CMC1 d i sab l e,这样所述第一管理模块和所述第二管理模块上RJ45可同时插上网线,但是只有所述第一管理模块上的RJ45是连通的,所述第而管理模块上的RJ45不通,从而避免发生网络环路的问题。

S2:第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障。

需要说明的是,在管理网络智能切换系统正常运行期间,所述第二管理模块不间断地接收所述第一管理模块的实时运行参数,将所述实时运行参数结合芯片寄存器所接收的系统消息来判断所述第一管理模块是否发生故障,其步骤具体为:

接收所述系统消息中的管理网络列表,提取所述管理网络列表中的信号强度和网络速率;

将所述信号强度与第一预设值进行比较,将所述网络速率与第二预设值进行比较;

若所述信号强度小于第一预设值,和/或,所述网络速率小于第二预设值,提取所述第一管理模块的实时运行参数,其中,所述第一管理模块的实时运行参数可以是;

若所述实时运行参数不符合预设标准,判断所述第一管理模块发生故障。

若所述实时运行参数符合预设标准,获取所述信号强度小于第一预设值的时间周期,和/或,所述网络速率小于第二预设值的时间周期;

若所述时间周期大于大三预设值,判断所述第一管理模块发生故障。

S3:若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

需要说明的是,若所述第一管理模块发生故障,所述第二管理模块通过I 2C对Swi tch芯片寄存器进行配置:SerDes_CMC0 d i sab l e,SerDes_CMC1 enab l e,所述第一管理模块上的RJ45不通,所述第二管理模块上的RJ45连通,实现网络的自动切换。

进一步的,所述第二管理模块在接管所述第一管理模块网络管理工作之后,所述方法还包括:

保持所述第一管理模块和第二管理模块之间的通信连接;

当所述第二管理模块重新获取到所述第一管理模块的信号时,其中,该信号为所述第一管理模块故障恢复的信号,所述第二管理模块切换回待命状态,所述第一管理模块重新对信息交互背板进行配置,接管所述第二管理模块的网络管理工作。

上述管理网络智能切换方法中,所述方法包括:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作,本申请相较于现有技术可以保证单个管理板故障时,管理网络可自动识别到网络故障问题并切换到另一个管理板,无需手动插拔网线,保证了系统的稳定性和可靠性,提升了产品的竞争力。

应该理解的是,虽然图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

实施例3

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入系统。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种管理网络智能切换方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入系统可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

S1:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;

S2:第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;

S3:若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

利用芯片寄存器读取所述第一管理模块和第二管理模块的信息并进行比对;

若所述信息保持一致,则对所述管理网络智能切换系统进行上电并启动,使得服务器处于正常开机状态;

若所述信息不一致,则利用芯片寄存器通知所述第一管理模块和第二管理模块重新进行加载,直至二者信息一致进行上电启动。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

利用芯片寄存器不间断的读取所述第一管理模块和第二管理模块的信息并进行比对;

当所述信息不一致时,所述第一管理模块和第二管理模块同时重新进行加载,直至二者信息保持一致。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

保持所述第一管理模块和第二管理模块之间的通信连接;

当所述第二管理模块重新获取到所述第一管理模块的信号时,所述第二管理模块切换回待命状态,所述第一管理模块重新对信息交互背板进行配置,接管所述第二管理模块的网络管理工作。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

接收所述系统消息中的管理网络列表,提取所述管理网络列表中的信号强度和网络速率;

将所述信号强度与第一预设值进行比较,将所述网络速率与第二预设值进行比较;

若所述信号强度小于第一预设值,和/或,所述网络速率小于第二预设值,提取所述第一管理模块的实时运行参数;

若所述实时运行参数不符合预设标准,判断所述第一管理模块发生故障;

若所述实时运行参数符合预设标准,获取所述信号强度小于第一预设值的时间周期,和/或,所述网络速率小于第二预设值的时间周期;

若所述时间周期大于大三预设值,判断所述第一管理模块发生故障。

实施例4

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

S1:启动管理网络智能切换系统,利用第一管理模块对信息交互背板进行配置;

S2:第二管理模块接收所述第一管理模块的实时运行参数,并结合芯片寄存器所接收的系统消息判断所述第一管理模块是否发生故障;

S3:若所述第一管理模块发生故障,利用第二管理模块对信息交互背板进行配置,接管所述第一管理模块网络管理工作。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

利用芯片寄存器读取所述第一管理模块和第二管理模块的信息并进行比对;

若所述信息保持一致,则对所述管理网络智能切换系统进行上电并启动,使得服务器处于正常开机状态;

若所述信息不一致,则利用芯片寄存器通知所述第一管理模块和第二管理模块重新进行加载,直至二者信息一致进行上电启动。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

利用芯片寄存器不间断的读取所述第一管理模块和第二管理模块的信息并进行比对;

当所述信息不一致时,所述第一管理模块和第二管理模块同时重新进行加载,直至二者信息保持一致。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

保持所述第一管理模块和第二管理模块之间的通信连接;

当所述第二管理模块重新获取到所述第一管理模块的信号时,所述第二管理模块切换回待命状态,所述第一管理模块重新对信息交互背板进行配置,接管所述第二管理模块的网络管理工作。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

接收所述系统消息中的管理网络列表,提取所述管理网络列表中的信号强度和网络速率;

将所述信号强度与第一预设值进行比较,将所述网络速率与第二预设值进行比较;

若所述信号强度小于第一预设值,和/或,所述网络速率小于第二预设值,提取所述第一管理模块的实时运行参数;

若所述实时运行参数不符合预设标准,判断所述第一管理模块发生故障;

若所述实时运行参数符合预设标准,获取所述信号强度小于第一预设值的时间周期,和/或,所述网络速率小于第二预设值的时间周期;

若所述时间周期大于大三预设值,判断所述第一管理模块发生故障。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synch l i nk)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

技术分类

06120115628722