掌桥专利:专业的专利平台
掌桥专利
首页

一种设备故障预测方法、系统及相关装置

文献发布时间:2023-06-19 10:08:35


一种设备故障预测方法、系统及相关装置

技术领域

本申请涉及电子设备故障检测领域,特别涉及一种设备故障预测方法、系统及相关装置。

背景技术

目前的服务器管理平台中,通常平台会对当前设备的资产信息、监控信息、告警信息进行管理,更多的时候关注的是实时的信息,但未对设备的变更信息加以利用,例如,通常某个版本、型号的设备或者部件会存在一些问题,通常在出现问题时才能感知到,这时已经或多或少产生了一些损失。

发明内容

本申请的目的是提供一种设备故障预测方法、设备故障预测系统、计算机可读存储介质和电子设备,能够对设备进行故障预测。

为解决上述技术问题,本申请提供一种设备故障预测方法,具体技术方案如下:

获取待测设备的设备信息;所述设备信息包括性能信息、故障信息和资产信息中的至少一种;

根据所述资产信息确定所述待测设备的变更信息;

确定与所述待测设备任一种设备信息相同的异常报告;

将所述异常报告与所述变更信息进行比对,根据所述异常报告中的异常事件对所述待测设备进行故障预测,得到故障预测信息。

可选的,得到故障预测信息之后,还包括:

调用预设缓存介质缓存所述设备信息、所述变更信息、所述异常报告和所述故障预测信息。

可选的,还包括:

根据所述故障预测信息对所述待测设备进行检测维护。

可选的,若所述故障预测信息包括所述待测设备在第一性能信息条件下运行第一时间出现的温度异常,所述根据所述故障预测信息对所述待测设备进行检测维护包括:

判断所述待测设备在第一性能信息条件下运行第一时间是否出现温度异常;

若是,控制所述待测设备的单次运行时间不超过所述第一时间,或提高所述待测设备中散热器的转速。

可选的,确定与所述待测设备任一种设备信息相同的异常报告包括:

从设备检测数据库中检索与所述待测设备任一种设备信息相同的异常报告。

可选的,还包括:

采集设备的性能数据、故障告警信息、资产信息和系统日志并生成所述设备检测数据库;

所述设备检测数据库用于维护性能信息、资产信息和故障信息之间的映射关系。

本申请还提供一种设备故障预测系统,包括:

获取模块,用于获取待测设备的设备信息;所述设备信息包括性能信息、故障信息和资产信息中的至少一种;

变更信息确定模块,用于根据所述资产信息确定所述待测设备的变更信息;

异常确定模块,用于确定与所述待测设备任一种设备信息相同的异常报告;

故障预测模块,用于将所述异常报告与所述变更信息进行比对,根据所述异常报告中的异常事件对所述待测设备进行故障预测,得到故障预测信息。

可选的,异常确定模块为用于从设备检测数据库中检索与所述待测设备任一种设备信息相同的异常报告的模块。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。

本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。

本申请提供一种设备故障预测方法,包括:获取待测设备的设备信息;所述设备信息包括性能信息、故障信息和资产信息中的至少一种;根据所述资产信息确定所述待测设备的变更信息;确定与所述待测设备任一种设备信息相同的异常报告;将所述异常报告与所述变更信息进行比对,根据所述异常报告中的异常事件对所述待测设备进行故障预测,得到故障预测信息。

本申请通过检测资产信息的变更信息,将与待测设备任一种设备信息相同的异常报告与变更信息进行比对,利用已产生的异常报告对设备信息相类似的待测设备进行故障预测,可以有效对设备的潜在故障进行预测诊断,从而降低了运维成本,提高了管理效率。

本申请还提供一种设备故障预测系统、计算机可读存储介质和电子设备,具有上述有益效果,此处不再赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种设备故障预测方法的流程图;

图2为本申请实施例所提供的一种设备故障预测系统结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参考图1,图1为本申请实施例所提供的一种设备故障预测方法的流程图,该方法包括:

S101:获取待测设备的设备信息;

本步骤旨在获取设备信息,该设备信息包括性能信息、故障信息和资产信息中的至少一种。资产信息指待测设备所包含的组件信息,例如内存、处理器、GPU、硬盘等等,而性能信息指待测设备包含的各组件的具体参数,例如处理器的频率,内存大小,硬盘大小等,故障信息指待测设备已经发生过程的故障信息。

S102:根据所述资产信息确定所述待测设备的变更信息;

本步骤旨在确定待测设备的变更信息,所谓变更信息,指待测设备的资产信息中存在变更的信息。

S103:确定与所述待测设备任一种设备信息相同的异常报告;

本步骤旨在确定异常报告,该异常报告要求与待测设备任一种设备信息相同,或者至少一种设备信息相同。一旦设备信息相同,意味着该异常报告具备故障参考价值。需要注意的是,该异常报告为已经发生异常的报告,其应包括异常相关信息,例如异常发生原因、异常发生条件和异常发生环境等数据,用于对待测设备进行参考。

作为本步骤的一种优选执行方式,可以从设备检测数据库中检索与待测设备任一种设备信息相同的异常报告。则此时默认需要先采集设备的性能数据、故障告警信息、资产信息和系统日志并生成设备检测数据库,该设备检测数据库用于维护性能信息、资产信息和故障信息之间的映射关系。换句话说,设备检测数据库记录的设备在何种资产和性能条件下发生的故障,可以应用于本实施例,并用于指导在相似资产信息和性能信息下的故障预测。

S104:将所述异常报告与所述变更信息进行比对,根据所述异常报告中的异常事件对所述待测设备进行故障预测,得到故障预测信息。

本步骤旨在利用异常报告和变更信息进行比对,其实质是比对异常报告对应异常设备的设备信息与变更信息进行比对,即进行设备信息之间的比对,从而得到当前待测设备与异常设备之间的关联,从而判断该异常报告对应的异常是否有可能在待测设备上出现。

举例而言,若故障预测信息包括待测设备在第一性能信息条件下运行第一时间出现的温度异常,在执行本步骤时可以先判断待测设备在第一性能信息条件下运行第一时间是否出现温度异常,若出现温度异常,控制待测设备的单次运行时间不超过第一时间,或提高待测设备中散热器的转速。

容易理解的是,若设备信息存在相似性,则同样的异常有较大概率会在待测设备上出现,则可据此对待测设备进行故障预测。当然,设备信息的相似度越高,则发生相同异常的概率越高。

需要注意的是,本实施例得到的故障预测信息,仅为对待测设备的故障可能预测,其故障可能性可以参考对应异常报告的数量而定,即为相对值,用于指示故障发生的相对概率。

此外,本实施例中的设备信息、变更信息、异常报告和故障预测信息,均可以缓存至预设缓存介质,并在预设缓存介质中对上述信息进行比对。在此对于预设缓存介质不作具体限定。

在本实施例从基础上,在确定故障预测信息后,还可以根据故障预测信息对待测设备进行检测维护。

本申请实施例通过检测资产信息的变更信息,将与待测设备任一种设备信息相同的异常报告与变更信息进行比对,利用已产生的异常报告对设备信息相类似的待测设备进行故障预测,可以有效对设备的潜在故障进行预测诊断,从而降低了运维成本,提高了管理效率。

下文对本申请提供的一种设备故障预测方法的具体应用过程进行描述,在具体应用时,可建立采集器、比对模块等组件,其具体实施过程可以如下:

(1)创建采集器,用于收集设备的信息,其信息包括性能信息、故障信息、资产信息、日志信息等。即通过采集器采集设备性能信息、故障信息、资产信息、日志信息等,该采集过程为持续过程,并可根据采集器采集得到的信息构建设备检测数据库。

采集器是一个信息收集的装置,其功能包含:定时主动采集设备的性能信息,并结合设定的阈值进行告警;接收设备主动上报的故障告警信息;定时采集刷新设备的资产信息;定时收集设备系统日志。

(2)创建信息对比模块,用于对比判断生成信息变更记录。设备的变更记录信息包含设备状态变更、部件变更、固件变更、硬件版本变更、驱动变更等;通过信息对比模块对比设备信息,生成变更信息。

信息对比模块是一个数据对比判断模块,其用于调用预设存储介质设备信息查询服务获取待测设备当前信息;接收采集器发送的数据,并与设备当前信息进行数据对比判断;如信息有变化,则生成一条设备信息变更记录;将数据发送到预设存储介质进行变更记录存储。

(3)配置预设存储介质,用于提供数据存储管理服务对设备信息及变更信息进行存储管理,同时提供设备信息缓存,为信息对比模块高效的查询对比服务,同时在信息变更时更新设备信息缓存;通过预设存储介质对采集器发送的数据以及信息对比模块生成的变更记录信息进行存储,同时对外提供高效的信息查询服务。预设存储介质是一个设备信息数据存储管理的模块,其用于接收采集器发送的设备信息并对信息进行存储;接收来自信息对比模块的数据,并对信息进行存储;提供设备信息缓存、设备信息查询服务。

(4)创建一个分析器,基于变更记录以及设备的信息对同类设备的健康状态进行预测分析;根据已有的设备信息以及信息变更记录数据,通过分析器进行数据分析预测,再反向对现有同类设备的健康状态进行预测分析,最终得出数据中心现有设备的健康报告。分析器用于对现有设备信息数据以及变更数据进行数据分析,得出设备的健康参考值;根据设备健康参考值对现在设备进行反向分析预测,得出现有设备的健康预测报告

(5)通过采集器采集到的设备数据并将采集到的数据发送到信息对比模块与预设存储介质进行处理,信息对比模块在接收到数据后与当前已有数据进行对比分析,如信息产生变化则生成一条信息变更记录并将数据发送到预设存储介质进行存储记录,预设存储介质接收来自采集器和信息对比模块的数据,并对数据进行存储维护管理。

(6)根据变更信息结合设备信息和设备检测数据库中的异常报告,对待测设备进行分析处理和故障预测,分析出设备在特定信息状态下的故障可能,例如某一固件版本、某一配置、已运行时长下是否可能发生故障。

(7)结合变更信息分析后的故障可能,对当前数据中心中的其他设备进行整体的故障预测,从而提前着手准备对设备进行检查维护,同时可结合故障预测对潜在的问题设备进行提前的维护管理。

下面对本申请实施例提供的一种设备故障预测系统进行介绍,下文描述的设备故障预测系统与上文描述的设备故障预测方法可相互对应参照。

参见图2,图2为本申请实施例所提供的一种设备故障预测系统结构示意图,本申请还提供一种设备故障预测系统,该系统包括:

获取模块100,用于获取待测设备的设备信息;所述设备信息包括性能信息、故障信息和资产信息中的至少一种;

变更信息确定模块200,用于根据所述资产信息确定所述待测设备的变更信息;

异常确定模块300,用于确定与所述待测设备任一种设备信息相同的异常报告;

故障预测模块400,用于将所述异常报告与所述变更信息进行比对,根据所述异常报告中的异常事件对所述待测设备进行故障预测,得到故障预测信息。

基于上述实施例,作为优选的实施例,异常确定模块300为用于从设备检测数据库中检索与所述待测设备任一种设备信息相同的异常报告的模块。

基于上述实施例,作为优选的实施例,还包括:

缓存模块,用于调用预设缓存介质缓存所述设备信息、所述变更信息、所述异常报告和所述故障预测信息。

基于上述实施例,作为优选的实施例,还包括:

维护模块,用于根据所述故障预测信息对所述待测设备进行检测维护。

基于上述实施例,作为优选的实施例,还包括:

数据库建立模块,用于采集设备的性能数据、故障告警信息、资产信息和系统日志并生成所述设备检测数据库;

所述设备检测数据库用于维护性能信息、资产信息和故障信息之间的映射关系。

本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

相关技术
  • 一种设备故障预测方法、系统及相关装置
  • 一种训练方法、故障预测方法、相关装置及设备
技术分类

06120112437556