掌桥专利:专业的专利平台
掌桥专利
首页

基于EVIT的数据中心服务器故障诊断方法

文献发布时间:2023-06-19 11:05:16


基于EVIT的数据中心服务器故障诊断方法

技术领域

本发明涉及数据中心服务器运行处理技术领域,具体是基于EVIT的数据中心服务器故障诊断方法。

背景技术

数据中心是全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。数据中心大部分电子元件都是由低压直流电源驱动运行的,数据中心面临的物理问题是服务器本身和用来连接这些服务器到其他应用环境的电缆。

中国专利号CN111405074B提供一种基于混合链的数据中心网络故障诊断和自动配置方法,使用智能合约对超大规模的数据中心网络群组实现去中心化的故障诊断和系统自动配置。基于混合链完成超大规模数据中心网络架构建立,完成混合链中私有链和联盟链的安全参数初始化。在私有链中,利用智能合约完成独立数据中心网络的故障节点诊断,将识别出的故障节点放入故障集,将正常的节点放入正常集,同时发布交易并完成自动配置;在联盟链中,实现有数据依赖关系的数据中心网络之间的交易发布和数据传输。对于任何交易均可以实现完整性验证和证据溯源。能保障以服务器为中心的新型的数据中心网络的去中心化、可靠性、可追踪性、鲁棒性和隐私性。

中国专利号CN110493042A提供一种故障诊断方法、装置及服务器。本发明的故障诊断方法包括建立网络系统的拓扑;获取网络系统中的告警信息;将该告警信息与该拓扑中的节点进行关联,确定故障链路;根据预设的故障概率计算规则确定故障链路中的故障根节点。该方法通过将告警信息与网络系统的拓扑关联,确定故障链路,从而可以快速获知告警造成的业务影响范围和程度,通过在故障链路中按照预设的规则确定故障根节点,实现了故障的自动定位和精准定位,提高了故障处理的效率。

上述所述的故障诊断方法在使用时诊断不全面,只能够单一对某一方面进行诊断,同时上述诊断方法在使用时需要由多名网络管理员分段排查网络的方式,其执行效率低下,导致网络业务受到比较严重的影响,因此,亟需设计一种基于EVIT的数据中心服务器故障诊断方法来解决上述问题。

发明内容

本发明的目的在于提供基于EVIT的数据中心服务器故障诊断方法,以解决上述背景技术中提出的上述故障诊断方法在使用时诊断不全面与执行效率低下的问题。

本发明的技术方案是:基于EVIT的数据中心服务器故障诊断方法,包括以下步骤:

S1.故障出现与采集数据:数据中心服务器在运行时出现故障,此时工作人员可以通过数据采集模块对服务器运行时的数据进行采集,而后在传输给故障诊断模块;

S2.故障诊断:待故障诊断模块收到数据采集模块传入的数据信息时,此时故障诊断模块对数据进行分析、对比,以便于确定数据中心服务器故障点,同时故障诊断模块在将故障数据存入故障数据库进行备案;

S3.通知与修复:故障诊断模块将诊断的数据传输给工作人员的移动客户端上,而后工作人员通过传输的信息对故障点进行修复,使得数据中心服务器可以正常工作。

进一步地,所述S1中数据采集模块包括设备模块与信息模块,且数据采集模块采集的信息为设备信息与网络信息。

进一步地,所述设备模块包括安装在服务器本体机柜内部的电力故障检测仪与定位传感器,且电力故障检测仪用于对服务器本体机柜内部电路进行检测。

进一步地,所述定位传感器用于传回服务器本体机柜故障位置,且定位传感器采用蓝牙传感器、红外传感器、超声波传感器、WIFI传感器中任一种。

进一步地,所述信息模块包括探测信息发送模块与度量信息接收模块,且探测信息发送模块用于对客户端发射探测信息,而度量信息接收模块用于接收客户端发回的信息。

进一步地,所述度量信息接收模块传回的信息包括客户端与服务器之间的网络时延以及服务器针对网络业务的处理时间。

进一步地,所述S2中故障诊断模块包括分析模块、对比模块、信息发送模块及故障数据库,且分析模块分析时若网络时延小于第一阈值且处理时间大于第二阈值,则确定故障发生位置为服务器本体;而当网络时延大于第二阈值或者网络时延小于第一阈值时,则表明业务处理出现了问题,从而可以推定业务服务器故障。

进一步地,所述分析模块分析时若网络时延大于第三阈值时,则表明数据的网络传输出现了问题,从而可以推定网络设备或网络链路故障。

进一步地,所述对比模块包括历史数据库与对比软件,且历史数据库用于储存数据中心服务器往常工作时的数据信息。

进一步地,所述信息发送模块通过无线网络向维修人员的移动客户端发送信息。

本发明通过改进在此提供基于EVIT的数据中心服务器故障诊断方法,与现有技术相比,具有如下改进及优点:

(1)本发明所设计的数据采集模块,在使用该方法对数据服务器进行诊断时,数据采集模块可以通过对网络与服务器本体机柜同时进行信息采集,有利于提高该方法的全面性。

(2)本发明所设计的信息模块,在使用时,信息模块可以向客户端发射探测信息,从而探测网络是否出问题,即可一次性定位网络中发生故障的位置,无需对网络进行分段排查,从而能够快速完成故障诊断,尽可能降低故障对网络业务的影响。

(3)本发明所设计的对比模块,对比模块可以存储数据中心服务器往常的数据信息,从而在对比时快速找到故障信息,有利于提高找到故障信息的效率。

(4)本发明所设计的定位传感器,可实现服务器在数据中心位置的快速便捷定位和导航,提高数据中心的服务质量和运维效率,减轻运维人员的工作负担,提高云计算运维管理的自动化水平,同时较室内定位技术,成本较较低。

附图说明

下面结合附图和实施例对本发明作进一步解释:

图1是本发明的工作流程图;

图2是本发明的数据采集模块采集故障数据示意图;

图3是本发明的数据采集模块结构示意图;

图4是本发明的故障诊断模块工作示意图;

图5是本发明的故障诊断模块结构示意图。

具体实施方式

下面将结合附图1至图5对本发明进行详细说明,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本发明通过改进在此提供基于EVIT的数据中心服务器故障诊断方法,如图1-图5所示,包括以下步骤:

S1.故障出现与采集数据:数据中心服务器在运行时出现故障,此时工作人员可以通过数据采集模块对服务器运行时的数据进行采集,而后在传输给故障诊断模块;

S2.故障诊断:待故障诊断模块收到数据采集模块传入的数据信息时,此时故障诊断模块对数据进行分析、对比,以便于确定数据中心服务器故障点,同时故障诊断模块在将故障数据存入故障数据库进行备案;

S3.通知与修复:故障诊断模块将诊断的数据传输给工作人员的移动客户端上,而后工作人员通过传输的信息对故障点进行修复,使得数据中心服务器可以正常工作。

进一步地,S1中数据采集模块包括设备模块与信息模块,且数据采集模块采集的信息为设备信息与网络信息。

进一步地,设备模块包括安装在服务器本体机柜内部的电力故障检测仪与定位传感器,且电力故障检测仪用于对服务器本体机柜内部电路进行检测。

进一步地,定位传感器用于传回服务器本体机柜故障位置,且定位传感器采用蓝牙传感器、红外传感器、超声波传感器、WIFI传感器中任一种。

进一步地,信息模块包括探测信息发送模块与度量信息接收模块,且探测信息发送模块用于对客户端发射探测信息,而度量信息接收模块用于接收客户端发回的信息。

进一步地,度量信息接收模块传回的信息包括客户端与服务器之间的网络时延以及服务器针对网络业务的处理时间。

进一步地,S2中故障诊断模块包括分析模块、对比模块、信息发送模块及故障数据库,且分析模块分析时若网络时延小于第一阈值且处理时间大于第二阈值,则确定故障发生位置为服务器本体;而当网络时延大于第二阈值或者网络时延小于第一阈值时,则表明业务处理出现了问题,从而可以推定业务服务器故障。

进一步地,分析模块分析时若网络时延大于第三阈值时,则表明数据的网络传输出现了问题,从而可以推定网络设备或网络链路故障。

进一步地,对比模块包括历史数据库与对比软件,且历史数据库用于储存数据中心服务器往常工作时的数据信息。

进一步地,信息发送模块通过无线网络向维修人员的移动客户端发送信息。

本发明的工作原理为:S1.故障出现与采集数据:数据中心服务器在运行时出现故障,此时工作人员可以通过数据采集模块对服务器运行时的数据进行采集,数据采集模块采集的信息为设备信息与网络信息,而后在传输给故障诊断模块;S2.故障诊断:待故障诊断模块收到数据采集模块传入的数据信息时,故障诊断模块对数据进行分析、对比,以便于确定数据中心服务器故障点,此时分析模块分析时若网络时延小于第一阈值且处理时间大于第二阈值,则确定故障发生位置为服务器本体;而当网络时延大于第二阈值或者网络时延小于第一阈值时,则表明业务处理出现了问题,从而可以推定业务服务器故障,若网络时延大于第三阈值时,则表明数据的网络传输出现了问题,从而可以推定网络设备或网络链路故障,同时故障诊断模块在将故障数据存入故障数据库进行备案;S3.通知与修复:故障诊断模块将诊断的数据传输给工作人员的移动客户端上,而后工作人员通过传输的信息对故障点进行修复,使得数据中心服务器可以正常工作。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 基于EVIT的数据中心服务器故障诊断方法
  • 一种基于容错哈密顿圈的数据中心网络故障诊断方法
技术分类

06120112790028