掌桥专利:专业的专利平台
掌桥专利
首页

量子设备业务故障诊断装置及其方法

文献发布时间:2023-06-19 13:26:15


量子设备业务故障诊断装置及其方法

技术领域

本发明涉及量子通信领域,具体涉及量子设备业务故障诊断装置及其方法。

背景技术

现有的技术针对经典通信专业的故障分析,比如传输网络故障分析,IP网络故障分析,无法根据量子通信业务特点进行故障分析,无法进行量子网络业务故障的分析。现有的技术只针对单一硬件故障场景进行分析,未有针对完整的业务场景进行全面分析。比如现有技术只针对硬件故障分析或光缆故障分析,未有按业务把量子业务故障涉及到的全有故障类型全部分析和诊断。

发明内容

为了解决上述技术问题,本发明提供一种量子设备业务故障诊断装置,所述装置包括数据采集单元、故障发现单元和故障诊断单元,数据采集单元实现把数据从量子设备自动采集和上报,故障发现单元通过事先配置的故障发现策略,实现业务故障的采集和发现;和故障诊断单元支持量子业务故障的全流程、全方位的自动分析和诊断。

在一种实施方式中,周期采集模块通过配置周期采集策略,周期轮询采集量子设备硬件信息、周期性能指标信息,所述周期采集模块为故障自动发现提供了数据支撑和分析依据;实时采集模块通过预先封装和开发的量子设备实时性能采集接口,实现实时采集量子设备的实时性能数据和实时状态数据;实时采集模块采集通过“故障诊断单元”按需调用发起执行,能够采集量子设备当前最新的实时的性能指标,能够收集到所述装置对量子设备干预和诊断的结果反馈;告警实时接收模块实时监听和接收量子设备主动上报的设备告警信息;和指令下发模块把控制指令下发给量子设备,提供了对量子设备的干预和诊断的能力。

在一种实施方式中,周期采集模块、实时采集模块、告警实时接收模块和指令下发模块都采用采用SNMP协议。

在一种实施方式中,故障发现单元包括策略管理模块和业务故障发现模块;策略管理模块提供策略配置功能,支持配置故障发现的分析规则,包括规则名称,规则条件;和故障发现模块定期加载所述策略管理模块配置的业务故障发现策略,并且能够实时查询所述周期采集模块采集的周期性能指标,通过业务故障发现策略自动分析周期性能数据,发现业务故障,并且自动启动业务故障分析诊断流程。

在一种实施方式中,所述故障诊断单元包括设备故障分析和诊断模块、攻击分析和诊断模块和光缆分析和诊断模块;所述设备故障分析和诊断模块通过故障分析策略和定义的故障分析流程,实时量子设备告警查询、量子设备性能指标的实时采集,实现对设备故障的分析和诊断,和输出设备故障分析和诊断结果;所述攻击分析和诊断模块通过故障分析策略和定义的故障分析流程,实时量子设备告警查询、量子设备性能指标的实时采集,实现对量子设备攻击分析的分析和诊断,和输出攻击分析和诊断结果;所述光缆故障分析和诊断模块通过故障分析策略和定义的故障分析流程,实时量子设备告警查询、量子设备性能指标的实时采集,实现对光缆故障分析和诊断,和输出攻击分析和诊断结果。

在一种实施方式中,本发明提供应用上述的量子设备业务故障诊断装置的方法,包括以下过程:数据自动采集和上报、业务故障自动发现、设备故障分析和诊断、攻击分析和诊断、光缆故障分析和诊断。

在一种实施方式中,所述数据自动采集包括量子设备硬件信息的采集、性能数据采集和设备状态信息采集,数据上报主要指告警信息采集;所述性能数据指能够描述量子设备工作情况和业务情况的指标信息,包括:成码率、误码率、光功率;和设备状态信息是指量子设备当前的运行状态。

在一种实施方式中,通过事先配置的分析和预警触发策略,对周期上报的成码率进行判断,实现对业务故障的发现。

在一种实施方式中,攻击分析和诊断的业务流程包括:设备状态获取、设备状态分析、设备告警获取和分析、误码率的实时获取和分析。

在一种实施方式中,光缆故障分析和诊断的业务流程包括:设备状态获取和判断、告警获取和判断、误码率获取和判断。

现在的技术只针对经典网络的上报的存量数据进行分析,本发明通过数据采集单元增加了量子设备的设备状态、量子设备成码率、误码率等量子专业指标周期采集和实时采集,实现量子网络和经典网络存量数据融合分析能力。

本发明增加指令下发模块,支持控制指令下发给量子设备技术,并且在分析流程引入量子设备重启等诊断环节,实现量子业务故障分析和设备诊断一体化。本发明提出了一种适合于量子通信网络业务特点的新型网络故障分析和诊断装置和方法,本发明装置和方法可以实现硬件故障、光缆故障和攻击故障等通信网络业务故障全方位分析和诊断技术。本发明通过周期采集模块的周期采集技术和实时采集模块的实时监听和接收技术,结合业务故障分析流程的驱动,实现业务故障诊断全流程的自动化分析和诊断。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本发明实施例的量子设备业务故障诊断装置的结构示意图;

图2是本发明实施例的量子设备业务故障诊断装置的业务流程示意图;

图3是本发明实施例的数据自动采集和上报的流程示意图;

图4是本发明实施例的业务故障发现的流程示意图;

图5是本发明实施例的设备故障分析和诊断的流程示意图;

图6是本发明实施例的攻击分析和诊断的流程示意图。

具体实施方式

为了使本领域技术领域人员更好地理解本申请中的技术方案,下面将结合实施例对本发明作进一步说明,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都应当属于本申请保护的范围。下面结合附图及实施例对本发明作进一步描述

如图1所示,本发明量子设备业务故障诊断装置包括三个部分,分别是数据采集单元、故障发现单元和故障诊断单元。

数据采集单元:数据采集单元实现把数据从量子设备单元自动采集和上报到装置的存储单元里,这里主要是MYSQL数据库。数据采集单元包括周期采集模块、实时采集模块、告警实时接收模块和指令下发模块。

周期采集模块:设备周期采集模块主要采用SNMP协议、通过配置周期采集策略,周期轮询采集量子设备硬件信息、周期性能指标信息。周期采集模块为故障自动发现提供了数据支撑和分析依据。性能周期包括30秒周期,自动采集的性能包括成码率、误码率、光功率等。本发明主要采用30秒周期数据进行分析,采集成码率进行故障发现。

实时采集模块:量子设备实时采集装置采用SNMP协议,通过定义和实现实时性能采集接口,实时采集量子设备的实时性能数据。实时采集模块采集通过“故障诊断单元”按需调用发起执行,能够采集当前最新的实时的性能指标,能够收集到本装置对量子设备干预和诊断的结果反馈,提供给分析流程进行决策。

告警实时接收模块:量子设备告警实时接收模块采用SNMP协议,实时监听和接收是了量子设备主动上报的设备告警信息。量子设备告警信息包括主控模块异常、光源模块参数异常、光源模块温度异常、探测器模块温控异常、探测器模块异常、强光攻击、量子链路异常等。

指令下发模块:量子设备指令下发模块采用SNMP协议,把控制指令下发给量子设备,提供了对量子设备的干预和诊断的能力。下发指令包括重启指令、实时信息获取等。

故障发现单元:故障发现单元通过事先配置的故障发现策略,实现业务故障的采集和发现。包括策略管理模块和业务故障发现模块。

策略管理模块:策略管理模块提供策略配置功能力,支持配置故障发现的分析规则,包括规则名称,规则条件。本专利配置的策略分析规则包括两个条件,一是,同一个量子设备成码率为“0”;二是,成码率为“0”持续时间为30分钟,也就是60个周期。

故障发现模块:“故障发现模块”能够定期加载“策略管理模块”配置的业务故障发现策略,并且能够实时查询“数据采集单元”的“周期采集模块”采集的周期性能指标,通过业务故障发现策略自动分析周期性能数据,这里是成码率指标。当发现成码率为“0”,并且连续30个周期,那“故障发现模块”自动判定为业务故障。“故障发现模块”会自动调用“故障诊断单元”的“设备故障分析和诊断模块”、“攻击分析和诊断模块”、“光缆分析和诊断模块”设备故障、攻击故障和网络故障的全方位,全流程自动分析和诊断。故障发现模块定期加载所述策略管理模块配置的业务故障发现策略,并且能够实时查询所述周期采集模块采集的周期性能指标,通过业务故障发现策略自动分析周期性能数据,发现业务故障,并且自动启动业务故障分析诊断流程。

故障诊断单元:本单元支持量子业务故障的全流程、全方位的自动分析和诊断。包括设备故障分析和诊断、攻击分析和诊断和光缆分析和诊断模块。

设备故障分析和诊断模块:本模块主要通过故障分析策略和定义的故障分析流程,实时量子设备告警查询、量子设备性能指标的实时采集,实现对设备故障的分析和诊断,和输出设备故障分析和诊断结果。

a)当“故障发现单元”的“故障发现模块”分析出业务故障,则通过“故障诊断单元”提供接口,调用“设备故障分析和诊断模块”进行设备硬件故障分析。

b)“设备故障分析和诊断模块”调用“数据采集单元”的“实时采集模块”,实时获取设备状态信息,判断设备状态是否为Abnormal(异常状态)。

c)如果有设备状态Abnormal(异常状态),“数据采集单元”的“告警实时接收模块”查询实时告警信息,判断是否有设备硬件异常告警,设备硬件异常告警包括:主控模块异常、光源模块参数异常、光源模块温度异常、探测器模块温控异常、探测器模块异常。如果没有,则调用“攻击分析和诊断模块”进行攻击自动分析。

d)如果有硬件异常告警,则输出结果为“设备硬件故障”。

攻击分析和诊断模块:本模块主要通过故障分析策略和定义的故障分析流程,实时量子设备告警查询、量子设备性能指标的实时采集,实现对量子设备攻击分析的分析和诊断,和输出攻击分析和诊断结果。

a)本模块通过调用“数据采集单元”的“实时采集模块”,实时获取设备状态信息,判断设备状态是否为Abnormal(异常状态)。

b)如果有设备状态Abnormal(异常状态),“数据采集单元”的“告警实时接收模块”查询量子设备告警信息,判断是否有攻击告警。如果没有设备状态异常,则结束。

c)如果有“强光攻击”告警,则输出结果为“强光攻击”。

d)如果没有强光攻击告警,调用“数据采集单元”的“实时采集模块”,获取实时设备误码率信息。

e)如果误码率小于35并且误码率大于25,则输出结果为“窃听攻击”。如果误码率为“0”,则调用“光缆故障分析和诊断模块”进行光缆故障自动分析。

光缆故障分析和诊断模块:本模块主要通过故障分析策略和定义的故障分析流程,实时量子设备告警查询、量子设备性能指标的实时采集,实现对光缆故障分析和诊断和输出攻击分析和诊断结果。

a)通过调用“数据采集单元”的“实时采集模块”,实时获取误码率数据,如果有“误码率”为0,则通过“数据采集单元”的“告警实时接收模块”查询量子“设备告警”信息。如果有“误码率”不为“0”,则通过“数据采集单元”的“告警实时接收模块”查询量子“链路告警”信息。

b)如果无设备硬件告警,则输出结果为“光纤中断”,流程结束。

c)如果有链路告警,则重启量子设备,等待5分钟。通过“数据采集单元”重新获取实时成码率数据。如果没有链路告警,则需要人工排障。链路告警指的是“量子链路异常”告警。

d)如果成码率数据不为0,则输出光纤抖动。如果成码率为0,则需要人工排障。

本发明量子设备业务故障诊断装置业务流程如下。

量子设备业务故障诊断包括下面五个步骤,分别是数据自动采集和上报、业务故障自动发现、设备故障分析和诊断、攻击分析和诊断、光缆故障分析和诊断。如图2所示:

1.数据采集单元进行数据自动采集和上报,数据自动采集主要是指量子设备硬件信息的采集、性能数据采集和设备状态信息采集,数据上报主要指告警信息采集。

性能数据指能够描述量子设备工作情况和业务情况的指标信息。主要包括:成码率、误码率、光功率等。主要性能指标采用周期采集方式,采集时间根据需要进行设置,例如为30秒。由周期数据采集模块周期下发采集指令,性能数据并入库。

设备状态信息:设备状态信息是指量子设备当前的运行状态。主要包括:Idle(空闲状态)、Starting(启动状态)、Running(运行状态)、Abnormal(异常状态)、CODE(成码状态)。Abnormal(异常状态)包括:Under Attack(攻击状态)、Light_Intensity_FEEDBACK(光强反馈状态)等。

告警实时接收模块进行告警数据采集,包括设备硬件告警的自动实时上报。告警信息是通过量子设备代理程序,自动从设备上报到本装置的告警实时接收模块。

2.如图3所示,故障发现单元进行业务故障发现,采集功能提供周期采集成码率性能指标的能力,本环节提供了业务故障发现功能,也就是成码率数据的分析和预警功能,通过策略管理模块事先配置的分析和预警触发策略,对周期上报的成码率进行判断,故障发现模块实现对业务故障的发现。当发现业务故障时,自动触发设备故障分析和诊断流程。

业务故障发现触发策略是成码率为“0”,持续一段时间,支持配置时间长度,默认是30分钟。目前成码率的采集周期为30秒,当了现60个周期性能数据都为0,则触发自动分析策略。

3.如图4所示,设备故障分析和诊断模块进行设备故障分析和诊断,本环节主要判断业务故障是否由设备故障导致的,负责对设备故障的分析和诊断。设备故障分析和诊断主要过程如下:

当业务故障发现捕获业务故障信息,触发设备故障分析和诊断流程。

a)本模块提供调用接口,当业务故障分析模块发现业务故障,调用本模块进行设备硬件故障分析。

b)本模块调用实时设备状态采集装置,实时获取设备状态信息,判断设备状态是否为Abnormal(异常状态)。

c)如果有设备状态Abnormal(异常状态),从实时告警接口,查询实时告警信息,判断是否有设备硬件异常告警,主要的硬件异常告警包括:主控模块异常、光源模块参数异常、光源模块温度异常、探测器模块温控异常、探测器模块异常。如果没有,则调用攻击分析和诊断流程。

d)如果有硬件异常告警,则输出结果为“设备硬件故障”。

4.如图5所示,攻击分析和诊断模块进行攻击分析和诊断,本环节主要判断业务故障是否由攻击导致的,负责对设备和光路攻击的分析和诊断。主要的业务流程包括:设备状态获取、设备状态分析、设备告警获取和分析、误码率的实时获取和分析。

a)攻击分析和诊断模块通过调用实时采集模块,获取实时设备状态信息,判断设备状态是否为Abnormal(异常状态)。

b)如果有设备状态Abnormal(异常状态),从实时告警接口查询实时告警存信息,判断是否有攻击告警。如果没有设备状态异常,则结束。

c)如果有“强光攻击”告警,则输出结果为“强光攻击”。

d)如果没有强光攻击告警,则调用实时采集模块,获取实时设备误码率信息。

e)如果误码率小于35并且误码率大于25,则输出结果为“窃听攻击”。如果误码率为“0”,则调用光纤故障分析和诊断流程。

5.如图6所示,光缆故障分析和诊断模块进行光缆故障分析和诊断,本环节主要判断业务故障是否由光缆故障导致的,负责对光缆故障的分析和诊断。主要流程包括设备状态获取和判断、告警获取和判断、误码率获取和判断。

a)则实时获取误码率数据,如果有“误码率”为0,通过告警接口查询硬件告警信息。如果有“误码率”不为“0”,通过告警接口查询链路告警。

b)如果无设备硬件告警,则输出结果为“光纤中断”。流程结束。

c)如果有链路告警,则等待5分钟。重新获取实时成码率数据。如果没有链路告警,则需要人工排障。链路告警指的是“量子链路异常”告警。

d)如果成码率数据不为0,则输出光纤抖动。如果成码率为0,则需要人工排障。

本领域的技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。

以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

相关技术
  • 量子设备业务故障诊断装置及其方法
  • 基于量子密钥池状态的量子业务部署方法和装置
技术分类

06120113675474