掌桥专利:专业的专利平台
掌桥专利
首页

一种实时故障诊断和预警方法、装置及计算机存储介质

文献发布时间:2023-06-19 10:06:57


一种实时故障诊断和预警方法、装置及计算机存储介质

技术领域

本发明涉及服务器技术领域,特别是涉及一种实时故障诊断和预警方法、装置及计算机存储介质。

背景技术

随着系统的组件越来越多,系统一旦有组件产生故障,则其所连带的组件也会受到一定的影响,从而使系统大规模损耗。因此,需要一个故障诊断装置对系统的故障进行实时检测。

现有的故障诊断方式多为基于图论和专家系统的诊断方式,图论是根据节点和节点的连接关系来判断故障的产生原因及影响,专家系统是根据领域专家在长期实践中积累起来的经验建立知识库,并设计一套计算机程序模拟人类专家的推理和决策过程进行故障诊断。

因为环境的变化也会对系统某个组件造成影响,而现有的故障诊断方式无法实时根据环境的变化对系统的故障实时进行诊断,并且其应用面具有局限性。

发明内容

本发明主要解决的技术问题是提供一种实时故障诊断和预警方法,能够解决系统故障因环境变化无法实时诊断的问题。

为解决上述技术问题,本发明采用的一个技术方案是:一种实时故障诊断和预警方法,包括:

根据应用环境生成环境故障导向图并发送监控信息,根据监控信息对应用环境进行监控并初始化环境数据,当环境数据发生变化时,应用环境发生故障并发送遍历指令,根据遍历指令遍历环境故障导向图的路径得出故障的产生原因和故障将导致的新故障,并生成告警信息;

当生成环境故障导向图时,录入应用环境的故障信息,故障信息作为环境故障导向图的若干节点,节点之间的因果关系作为环境故障导向图的边,边的长度和边的方向组成故障的分析路径。

进一步,录入的故障信息导入到内存中生成环境故障导向图,故障导向图的节点根据节点之间的因果关系通过故障导向图的边连接;所述故障信息包括应用环境的组件信息、历史故障和特殊关注的节点事件;所述环境故障导向图包括有向无环图、有向有环图和顶点自关联图。

进一步,所述环境导向图的边的长度表示节点之间关联性的大小,边的方向表示节点之间的追溯方向;

所述边的方向包括指出故障方向和指向故障方向;指出故障方向表示所述故障通过所述指出故障方向的边连接的节点为所述故障的产生原因;指向故障方向表示所述故障通过所述指向故障方向的边连接的节点为所述故障将导致的新故障。

进一步,当所述环境故障导向图生成后,对所述环境故障导向图的每个节点数据和应用环境的环境数据初始化;当每个所述节点的数据发生变化时,应用环境的环境数据发生变化,应用环境发生故障;当应用环境的环境数据发生变化时,每个所述节点的数据发生变化,应用环境发生故障。

进一步,所述有向无环图的节点包括开始节点、中间节点和最终汇点,开始节点有所述指出故障方向的边,最终汇点有所述指向故障方向的边,中间节点既有指向故障方向的边也有指出故障方向的边;

当开始节点的数据变化时,开始节点发生故障,根据开始节点所包含的边的方向预测所述故障将要导致的新故障;当最终汇点的数据变化时,最终汇点发生故障,根据最终汇点所包含的边的方向追溯所述故障产生的原因;当中间节点的数据发生变化时,中间节点发生故障,根据中间节点所包含的边的方向追溯所述故障产生的原因和预测所述故障将要导致的新故障。

进一步,所述有向有环图至少包括两个节点且节点和边连接为闭合环状;当任一节点数据发生变化时,所述节点发生故障,所述发生故障的节点导致其包含的边所指向的节点发生新故障,发生新故障的节点导致初始发生故障的节点的数据再次发生变化;当遍历有向有环图时,判断初始发生故障的节点为应用环境产生故障的原因。

进一步,所述顶点自关联图有一个节点,所述节点所包含的边指向其本身,所述节点数据发生变化时,所述节点发生故障,所述节点影响其本身数据再次发生变化;当遍历顶点自关联图时,判断所述节点为应用环境产生故障的原因。

进一步,对遍历到的故障的产生原因生成告警信息;对遍历到的故障将会导致的新故障生成重点监控事件;当对相同分析路径遍历到的故障产生原因生成告警信息时,所述告警信息为重点告警信息。

一种实时故障诊断和预警装置,包括:生成模块、监控模块和遍历模块;所述监控模块分别与所述生成模块和遍历模块连接;

所述生成模块用于生成环境故障导向图并向所述监控模块发送监控信息;

所述监控模块用于初始化环境数据和环境导向图节点数据并向所述遍历模块发送遍历指令;

所述遍历模块用于遍历环境导向图作出故障诊断并生成告警信息。

一种计算机存储介质,用于储存所述实时故障诊断和预警方法所用的计算机软件指令,其包含用于执行上述为实时故障诊断和预警方法所设计的程序。

本发明的有益效果是:本发明能够根据环境的变化对系统的故障进行实时的监控、诊断、溯源及预警,且具有良好的扩展性。

附图说明

图1是本发明提供的一种实时故障诊断和预警方法流程示意图;

图2是环境故障导向图中的有向无环图;

图3是环境故障导向图中的有向有环图;

图4是环境故障导向图中的顶点自关联图;

图5是本发明提供的一种实时故障诊断和预警装置的结构示意图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。

本发明实施例包括:

第一方面,见图1至图4,一种实时故障诊断和预警方法,包括:

设计一种环境故障导向图,在环境故障导向图中,事件或者故障分布在环境故障导向图的节点上,事件或故障之间的因果关系由边和边的方向表示,系统中有图中各项节点的数据值,当系统发生故障或者产生事件时,图中偏离正常数据值的节点为故障节点,根据图中的边的关系和图中各个节点之间的关系可以分析出故障的导致原因以及该故障还存在的隐患会导致其他的故障,从而对系统现有故障进行定位以及对系统未来时间的事件或故障作出预测。

环境故障导向图包括:有向无环图、有向有环图、顶点自关联图和环境因素;

见图1,该图为有向无环图,其中根据事件或故障的产生原因以及导致的新故障将各个顶点分为开始节点、最终汇点和中间节点;其中至少有一条开始节点经过中间节点到最终汇点的路径,且不存在环,每个开始节点是导致故障或事件产生的源头,开始节点不会有产生原因,即开始节点所包含的边的方向只会指向别的节点,如果开始节点的数据发生变化,则可以根据开始节点所包含的边所指向的路径去预测将要发生的事件或故障;每个最终汇点是故障或者事件可产生的最终故障,最终汇点不会再去产生新故障,即最终汇点所包含的边的方向只会指向最终汇点本身,如果最终汇点的数据发生变化,则可以根据指向最终汇点的边的路径反向追溯故障或事件产生原因;每个中间节点既是产生新故障的结果,又是下个节点的产生原因,即中间节点所包含的边的方向既会指向中间节点,也会通过中间节点指向其他节点,当中间节点的数据发生变化时,可以根据中间节点所包含的边指向其他节点的路径去预测将会发生的故障或事件,也可以根据中间节点所包含的边指向其本身的路径去反向追溯故障或事件的产生原因;在图1中,节点A和节点D为开始节点,节点G和节点F为最终汇点,节点B、节点C和节点E为中间节点;节点A因为路径二导致节点B,其他节点以此类推。

见图2,该图为有向有环图,其中至少有三个或者三个以上的顶点形成环,其中每个顶点互相连接,当某一顶点发生故障或事件时,引起循环,导致又触发该顶点的故障或事件,当该循环发生故障或事件时,可能会导致无限死循环或者故障或事件升级产生其他故障或事件;所以,在发生循环后,追溯的规则为,最多一次循环;在图2中,当节点X的数据发生改变时,导致节点Y的数据发生改变,节点Y的数据发生改变导致节点Z的数据也发生改变,节点Z的数据发生改变又会导致节点X的数据发生改变,追溯到此时,停止循环,认为节点X是故障或事件的产生原因。

见图3,该有向有环图为图2的一种特殊形式,其同样遵循最多循环一次的原则,在图3中,节点H的数据发生改变导致I的数据发生改变,节点I的数据发生改变又导致节点H的数据发生改变,追溯到此时,停止循环,认为节点H是故障或事件的产生原因。

见图4,该顶点自关联图,其同样遵循最多循环一次的原则,在图4中,节点J的数据发生改变之后又导致节点J的数据进一步改变,追溯到此时,停止循环,认为节点J是故障或事件的产生原因。

所有的环境故障导向图中包含环境因素,环境因素对所有的节点都有影响,但根据不同的应用环境,环境因素对其影响不同,所以在应用环境中设定环境因素对各个组件的影响产生的数据变化范围,当环境产生变化时,各个顶点的数据变化范围是不同的,因此也会产生不同的事件;

所有环境故障导向图中边的长短代表事件或故障产生原因的可能性大小,可能性大的边的长度<可能性小的边的长度。

设计环境故障导向图的生成模块,环境故障导向图可以存储于任何形式的存储介质中,在环境故障导向图所要应用的系统启动时,环境故障导向图的生成模块将其系统当前的各个组件的信息、历史所发生的故障、发生故障的时间、发生故障的原因、多次发生的故障、系统特别关注的节点事件导入到环境故障导向图的存储介质中,该模块将环境故障导向图的存储介质中的数据导入到内存中,生成环境故障导向图;环境故障导向图的生成没有性能要求的限制,环境故障导向图的遍历效率根据所应用的系统尽量达到最高,环境故障导向图的节点映射系统的各个组件、事件。

设计环境故障导向图的遍历模块,当系统中某组件发生故障或事件时,该模块根据环境故障导向图的所有类别的导向图,确定该故障或事件节点,根据图中节点所包含的边的指向路径及长度进行预测及反向追溯,并把遍历到的产生原因及产生新故障根据边的长度进行排序,以此来判断故障或事件的产生原因和产生新故障的可能性。

设计环境故障导向图环境因素影响监控模块,该模块定义系统中环境数据的变化和所属系统的各个组件的初始数据相互影响并变化,当组件数据发生变化时,环境数据会产生变化,当环境数据变化时,组件数据也会发生变化,所以此模块可以对系统中是否产生事件或故障进行监控。

系统启动时,生成模块在内存中生成环境故障导向图,并向监控模块发送监控指令,监控模块开始实时监控环境数据是否变化,当环境数据一旦发生变化,监控模块向遍历模块发送遍历信号,遍历模块收到遍历信号后对环境故障导向图进行遍历,对环境故障导向图中发生变化的数据进行产生原因和产生新故障的追溯,并将得到的产生原因和产生新故障按环境故障导向图中边的长度来对产生原因和产生新故障排序,最终得到故障或事件的产生原因和预测未来将会产生的新故障并告警;对于故障或事件的预测结果可添加到重点监控事件中,并将此数据保存,根据此数据可以分析出更精细的原始数据;若产生原因或产生新故障的节点经过路径相同且被告警多次,可以提升该节点的告警级别,并记录此数据;如图1中节点D经过路径一导致节点E,图2中节点Z也经过路径一导致X,则遍历模块对节点D和节点Z进行重点告警。

第二方面,见图5,基于与前述实施例中一种实时故障诊断和预警方法同样的发明构思,本说明书实施例还提供一种实时故障诊断和预警装置,包括:生成模块、监控模块和遍历模块;生成模块用于生成环境故障导向图并向监控模块发送监控信息;监控模块用于初始化环境数据和环境导向图节点数据并向遍历模块发送遍历指令;遍历模块用于环境导向图作出故障诊断并告警;生成模块与监控模块连接,监控模块与遍历模块连接。

第三方面,基于与前述实施例中一种实时故障诊断和预警方法同样的发明构思,本说明书实施例还提供一种计算机存储介质,用于储存所述一种实时故障诊断和预警方法所用的计算机软件指令,其包含用于执行上述为实时故障诊断和预警方法所设计的程序。

区别于现有技术,本方法及装置基于环境故障导向图适合多种系统的故障监控,不同的系统都可以用本方法及装置根据系统环境的变化对其系统中的故障进行实时监控、溯源和预警,并且具有很强的扩展性。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 一种实时故障诊断和预警方法、装置及计算机存储介质
  • 一种实时状态预警方法、装置、电子设备及存储介质
技术分类

06120112422959