掌桥专利:专业的专利平台
掌桥专利
首页

一种交换机的重启方法、装置、终端设备和存储介质

文献发布时间:2023-06-19 09:55:50


一种交换机的重启方法、装置、终端设备和存储介质

技术领域

本发明涉及网络设备技术领域,特别是涉及一种交换机的重启方法、装置、终端设备和存储介质。

背景技术

随着网络的进步和发展,组建网络的网络产品的要求也越来越高,不仅要求有高效的数据转发,也要有强大的故障诊断恢复能力,看门狗功能就能提供简单有效的故障恢复能力。

看门狗技术方案如图1所示,看门狗其实就是一个可以在一定时间内被复位的计数器。当看门狗启动后,计数器开始自动计数,经过一定时间,如果没有被复位,计数器溢出就会对CPU产生一个复位信号使系统重启(俗称“被狗咬”)。系统正常运行时,需要在看门狗允许的时间间隔内对看门狗计数器清零(俗称“喂狗”),不让复位信号产生。如果系统不出问题,程序保证按时“喂狗”,一旦程序跑飞,没有“喂狗”,系统“被咬”复位。

针对于交换机而言,看门狗功能可以检测交换机的CPU芯片的状态提供故障自愈能力,但是交换机单个端口的故障问题却无法这样简单的监测自愈。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种交换机的重启方法、装置、终端设备和存储介质。

第一个方面,本发明实施例提供一种交换机的重启方法,所述方法应用于交换机中的处理器,所述交换机还包括交换单元,包括:

获取所述交换单元中的MIB库信息,其中,所述MIB库信息包括交换机的端口状态,所述交换机的端口状态至少包括端口的流量状态和错误事件;

对所述MIB库信息中的交换机的端口状态进行判断;

若所述端口状态为异常状态,则向所述交换机发送与所述异常状态对应的端口发送复位指令,以使所述交换机的端口重启。

可选地,所述对所述MIB库信息中的交换机的端口状态进行判断,包括:

对所述端口流量状态和所述错误事件进行判断,其中,所述错误事件包括错误帧、以太网超长帧或以太网丢弃事件中的一种或多种;

若所述端口流量状态正常,且没有出现错误事件时,则确定所述交换机的端口为正常状态;

若所述流量状态异常,或者出现错误事件,或出现告警信息时,则确定所述交换机的端口为异常状态。

可选地,所述方法还包括:

若判断所述交换机的端口为异常状态,则将所述交换机的端口的流量状态、错误事件和告警信息清除。

可选地,所述方法还包括::

在预设时间段内,所述端口的异常状态的次数大于第一预设值时,则向交换机发送与所述异常状态对应的端口发送复位指令。

可选地,所述方法还包括:

若所述交换机的全部端口为异常状态,则向所述交换机发送交换机设备的重启指令。

第二个方面,本发明实施例提供一种交换机的重启装置,所述装置应用于交换机中的处理器,所述交换机还包括交换单元,所述装置包括:

获取模块,用于获取所述交换单元中的MIB库信息,其中,所述MIB库信息包括交换机的端口状态,所述交换机的端口状态至少包括端口的流量状态和错误事件;

判断模块,用于对所述MIB库信息中的交换机的端口状态进行判断;

重启模块,用于若所述端口状态为异常状态,则向所述交换机发送与所述异常状态对应的端口发送复位指令,以使所述交换机的端口重启。

可选地,所述判断模块用于:

对所述端口流量状态和所述错误事件进行判断,其中,所述错误事件包括错误帧、以太网超长帧或以太网丢弃事件中的一种或多种;

若所述端口流量状态正常,且没有出现错误事件时,则确定所述交换机的端口为正常状态;

若所述流量状态异常,或者出现错误事件,或出现告警信息时,则确定所述交换机的端口为异常状态。

可选地,所述装置还包括删除模块,所述删除模块用于:

若判断所述交换机的端口为异常状态,则将所述交换机的端口的流量状态、错误事件和告警信息清除。

可选地,所述判断模块用于:

在预设时间段内,所述端口的异常状态的次数大于第一预设值时,则向交换机发送与所述异常状态对应的端口发送复位指令。

可选地,所述重启模块还用于:

若所述交换机的全部端口为异常状态,则向所述交换机发送交换机设备的重启指令。

第三个方面,本发明实施例提供一种终端设备,包括:至少一个处理器和存储器;

所述存储器存储计算机程序;所述至少一个处理器执行所述存储器存储的计算机程序,以实现第一个方面提供的交换机的重启方法。

第四个方面,本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时实现第一个方面提供的交换机的重启方法。

本发明实施例包括以下优点:

本发明实施例提供的交换机的重启方法、装置、终端设备和存储介质,通过获取交换单元中的MIB库信息,其中,MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

附图说明

图1是现有技术的看门狗技术方案的步骤流程图;

图2是本发明的一种交换机的重启方法实施例的步骤流程图;

图3是本发明的另一种交换机的重启方法实施例的步骤流程图;

图4是本发明的又一种交换机的重启方法实施例的步骤流程图;

图5是本发明的一种交换机的重启装置实施例的结构框图;

图6是本发明的一种终端设备的结构示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

名词解释如下:

管理信息库(MIB,Management Information Base)是TCP/IP网络管理协议标准框架的内容之一,MIB定义了受管设备必须保存的数据项、允许对每个数据项进行的操作及其含义,即管理系统可访问的受管设备的控制和状态信息等数据变量都保存在MIB中。

CPLD(Complex Programmable Logic Device):复杂可编程逻辑器件,是从PAL和GAL器件发展出来的器件,相对而言规模大,结构复杂,属于大规模集成电路范围。是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。其基本设计方法是借助集成开发软件平台,用原理图、硬件描述语言等方法,生成相应的目标文件,通过下载电缆("在系统"编程)将代码传送到目标芯片中,实现设计的数字系统。

PD69104A:为一具自动模式的4端口以太网络供电 (Power-over-Ethernet,PoE)供电端设备(Power Source Equipment,PSE) 管理器。

具体地:内建Rds(on)为0.3欧姆的MOSFET,内部DC/DC整流器,整合最多可达4端口的动态电源管理,紧急电源管理,具3组电源良好输入(power good input),支持检测所有标准之前(pre-standard)设计的PD设备,LED 直接驱动端口,可显示4端口及PoE最大供电状态(PoE MAX),完整的4 端口PoE解决方案,仅需20个外围器件,UART和I2C通讯端口,可实时监测每个端口的电压、电流、功耗和温度做完整监测,在IEEE802.3at-2009 模式下,系统总功率消耗小于1.2W,在IEEE802.3af-2003模式下,系统总功率消耗小于0.52W。

本发明一实施例提供一种交换机的重启方法,用于对交换机的端口进行重启。本实施例的执行主体为交换机的重启装置,设置在交换机上。

参照图2,示出了本发明的一种交换机的重启方法实施例的步骤流程图,该方法可以应用于交换机中的处理器,所述交换机还包括交换单元,具体可以包括如下步骤:

S201、获取所述交换单元中的MIB库信息,其中,所述MIB库信息包括交换机的端口状态,所述交换机的端口状态至少包括端口的流量状态和错误事件;

具体地,本发明实施例应用于交换机,在该交换机中包括处理器和交换单元,交换机中的处理器从交换单元中获取MIB库信息,MIB库信息包括交换机的端口状态,所述交换机的端口状态至少包括端口的流量状态和错误事件。

S202、对所述MIB库信息中的交换机的端口状态进行判断;

具体地,交换机中的处理器对MIB库信息中的交换机的端口状态进行判断,其中,MIB库信息中的交换机的端口状态包括:端口的流量状态和错误事件,其中,所述错误事件包括错误帧、以太网超长帧或以太网丢弃事件中的一种或多种。

S203、若所述端口状态为异常状态,则向所述交换机发送与所述异常状态对应的端口发送复位指令,以使所述交换机的端口重启。

具体地,交换机中的处理器对MIB库信息中的交换机的端口状态进行判断后,若端口的流量状态正常,且没有错误事件时,则确定所述交换机的端口为正常状态,其他状态均为异常状态,当端口的状态为异常状态时,则向交换机的某一个端口发送复位指令。

本发明实施例提供的交换机的重启方法,通过获取交换单元中的MIB库信息,其中,MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

本发明又一实施例对上述实施例提供的交换机的重启方法做进一步补充说明。

可选地,所述对所述MIB库信息中的交换机的端口状态进行判断,包括:

对所述端口流量状态和所述错误事件进行判断,其中,所述错误事件包括错误帧、以太网超长帧或以太网丢弃事件中的一种或多种;

若所述端口流量状态正常,且没有出现错误事件时,则确定所述交换机的端口为正常状态;

若所述流量状态异常,或者出现错误事件,或出现告警信息时,则确定所述交换机的端口为异常状态。

具体地,处理器可以是ARM芯片。

交换单元中的MIB库信息至少包括如下表1中的参数所示:

交换单元至少包括Switch Marvell 88E6320芯片,该交换单元与电源管理模块相连,电源管理模块至少包括Microsemi PD69104B芯片,该芯片有4个给以太网供电的端口,通过该4个端口与PD1、PD2、PD3和PD4相连,此时,交换单元可以获取到电源管理模块的4个端口的状态,包括收发流量状态或以太网帧丢弃事件等。

进而,交换机的处理器对换机的端口的流量状态以及错误事件进行判断,若端口的流量状态正常,且没有错误事件时,则确定所述交换机的端口为正常状态,其他状态均为异常状态。

具体MIB库信息包括异常事件即错误事件,例如FCS(Frame Check Sequence,帧校验序列)错误帧、以太网超长帧、以太网丢弃事件等,还包括端口,其中,发送数据包括发送单播数据、发送广播数据、发送组播数据和发送IGMP离开报文;接收数据包括接收单播数据、接收组播数据、接收广播数据、接收组播端口离开报文、接收IPV6的组播校验和错误报文、接收多播碰撞帧、接收抑制离开丢弃报文、接收MLD离开报文和接收MLD加入成功报文等。

表1 MIB库信息

可选地,所述方法还包括:

若判断所述交换机的端口为异常状态,则将所述交换机的端口的流量状态、错误事件和告警信息清除。

可选地,所述方法还包括:

在预设时间段内,所述端口的异常状态的次数大于第一预设值时,则向交换机发送与所述异常状态对应的端口发送复位指令。

具体地,重启判断依据流程示意图如下:

查询频次为2S一次,查询确认周期为1分钟,每分钟做一次判断判断方法为:

端口收发流量的状态以及是否有以太网帧丢弃的事件,只有收发有流量,且没有丢弃事件时才是正常状态,其他状态为异常状态,查询一次就清空一次;

当一分钟内的正常状态的次数占了60%(数值可调,用来控制灵敏度) 以上时,判定正常,继续查询;

当一分钟内的正常状态的次数低于60%时,判定异常,重启该异常端口;

当所有端口均异常时,重启交换机。

可选地,所述方法还包括:

若所述交换机的全部端口为异常状态,则向所述交换机发送交换机设备的重启指令。

如图3所示,示出了本发明的另一种交换机的重启方法实施例的步骤流程图,CPLD逻辑芯片与交换芯片连接,通过检索芯片的MIB库信息,来判断交换机各个接口状态,从而判断是否需要重启交换机或重启交换机某个端口,若端口正常,则清空寄存器中的数据,并继续检索,若端口异常,则对交换机的所有已连接的端口运行状态进行判断,若是只有某个端口异常,则重启端口,若全部端口都异常,则重启交换机设备。

如图4所示,示出了本发明的又一种交换机的重启方法实施例的步骤流程图,该交换机的重启方法包括:

对MIB库信息进行查询,查询该MI库信息中的每项参数;

对接收数据值之和、发送数据值之和与0进行判断;

若接收数据值之和大于0,且发送数据值之和大于0,则统计正常运行值为1;

若接收数据值之和、发送数据值之和不符合上述条件,则统计异常运行值为1;

将正常运行值和异常运行值相加,得到30;

若正常运行值占用此30%的比例大于60%,且无错误事件,则确定该端口为正常;

若否,则确定该端口为异常状态;

不论哪种状态,都将正常运行值以及异常运行值全部清零,相关接收发送寄存器全部清零;2s后继续查询。

现有的交换机看门狗技术是通过喂狗型号来重新定刷新计时器来避免设备的复位,一旦设备出现问题,芯片无法获取到喂狗信号,导致设备整体复位来自愈部分问题。

本发明实施例是使用交换机的MIB库中的实时流量来确定交换机转发数据状态的,通过每分钟30次的数据采集来确认交换机接口状态是否正常,一旦出现数据异常时(收发异常或者以太网数据丢弃事件就会记录为异常事件)且持续出现一分钟异常时,则判定为交换机问题,并复位该接口,避免了复位整体交换机,当交换机整体出现问题时,所有已连接的接口会转发异常,则复位整个交换机。

从上述实现方法来看,基于MIB的看门狗相比一般的看门狗而言具有如下优点:

单接口问题时复位单接口,不影响其他接口数据的正常传输,自愈影响的范围小;

基于MIB的看门狗是采用的1分钟内30次数据综合评估的方式来判定交换机是否异常,具有更加科学准确的判定,1分钟30次,也就是2s一次,这样的采集评估的频率适中,CPU处理无压力,不会造成设备CPU过高导致设备运行卡顿异常,如果频率太低,则看门狗的自动自愈时间会加长。所以认为2s一次较为合适。

由于MIB库数据的丰富性,可针对不同应用需求做定制化看门狗。

本发明实施例可以监测交换机每个运行端口的流量,状态,告警等等信息,提供更加全面的监测数据来进行故障自愈判断,可以针对不同的信息做复位动作。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

本发明实施例提供的交换机的重启方法,通过获取交换单元中的MIB库信息,其中,MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

本发明另一实施例提供一种交换机的重启装置,用于执行上述实施例提供的交换机的重启方法。

参照图5,示出了本发明的一种交换机的重启装置实施例的结构框图,该装置可以应用于交换机中的处理器,所述交换机还包括交换单元,具体可以包括如下模块:获取模块501、判断模块502和重启模块503,其中:

获取模块501用于获取所述交换单元中的MIB库信息,其中,所述MIB 库信息包括交换机的端口状态,所述交换机的端口状态至少包括端口的流量状态和错误事件;

判断模块502用于对所述MIB库信息中的交换机的端口状态进行判断;

重启模块503用于若所述端口状态为异常状态,则向所述交换机发送与所述异常状态对应的端口发送复位指令,以使所述交换机的端口重启。

本发明实施例提供的交换机的重启装置,通过获取交换单元中的MIB库信息,其中,MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

本发明又一实施例对上述实施例提供的交换机的重启装置做进一步补充说明。

可选地,所述判断模块用于:

对所述端口流量状态和所述错误事件进行判断,其中,所述错误事件包括错误帧、以太网超长帧或以太网丢弃事件中的一种或多种;

若所述端口流量状态正常,且没有出现错误事件时,则确定所述交换机的端口为正常状态;

若所述流量状态异常,或者出现错误事件,或出现告警信息时,则确定所述交换机的端口为异常状态。

可选地,所述装置还包括删除模块,所述删除模块用于:

若判断所述交换机的端口为异常状态,则将所述交换机的端口的流量状态、错误事件和告警信息清除。

可选地,所述判断模块用于:

在预设时间段内,所述端口的异常状态的次数大于第一预设值时,则向交换机发送与所述异常状态对应的端口发送复位指令。

可选地,所述重启模块还用于:

若所述交换机的全部端口为异常状态,则向所述交换机发送交换机设备的重启指令。

需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本申请不做限定。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本发明实施例提供的交换机的重启装置,通过获取交换单元中的MIB库信息,其中,MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

本发明再一实施例提供一种终端设备,用于执行上述实施例提供的交换机的重启方法。

图6是本发明的一种终端设备的结构示意图,如图6所示,该终端设备包括:至少一个处理器601和存储器602;

所述存储器存储计算机程序;所述至少一个处理器执行所述存储器存储的计算机程序,以实现上述实施例提供的交换机的重启方法。

本实施例提供的终端设备,通过获取交换单元中的MIB库信息,其中, MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

本申请又一实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时实现上述任一实施例提供的交换机的重启方法。

根据本实施例的计算机可读存储介质,通过获取交换单元中的MIB库信息,其中,MIB库信息包括交换机的端口状态,交换机的端口状态至少包括端口的流量状态和错误事件;对MIB库信息中的交换机的端口状态进行判断;若端口状态为异常状态,则向交换机发送与异常状态对应的端口发送复位指令,以使交换机的端口重启,这样,若交换机的某个端口发生故障,仍然可以通过重启来恢复。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、电子设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理电子设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理电子设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者电子设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者电子设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者电子设备中还存在另外的相同要素。

相关技术
  • 一种交换机的重启方法、装置、终端设备和存储介质
  • 硬件交换机控制流向的方法、装置、终端设备及存储介质
技术分类

06120112349960