掌桥专利:专业的专利平台
掌桥专利
首页

网络故障定位方法、网络设备和存储介质

文献发布时间:2024-04-18 19:58:53


网络故障定位方法、网络设备和存储介质

技术领域

本申请涉及网络故障定位技术领域,尤其涉及一种网络故障定位方法、网络设备和存储介质。

背景技术

现有技术中,网络诊断主要是被动地通过对网络设备的监控来捕获网络中故障信息。故障管理系统网管接收网络设备通过SNMP等网络层协议通过北向接口传递的设备告警CDR话单,并基于预先设定规则对话单进行解析,按照关键字段进行告警标准化输出,转变为系统的网络设备实时告警。现有的方式存在以下问题:1)IP网络层承载于光网络层之上,网络故障除自身硬件设备问题外,也有可能是光网络层问题导致的;而光网络层出现故障时反应在IP网络层可能为多处故障。IP网络层和光网络层控制平面因各自独立运行缺乏协同机制而不能进行互网络信息和状态信息的有效交互,更不能互通拓扑和资源信息。2)在大型网络中,IP流量端到端承载涉及的专业及资源众多。且告警信息由设备传送原始数据标准化后产生,不涉及去重或关联,从而导致单个故障触发大数量告警,而当出现大面积设备故障时,更增加了维护人员辨别有用信息的难度,降低故障处理运维效率。

发明内容

本申请实施例提供一种网络故障定位方法、网络设备和存储介质,通过该方法至少可以解决IP网络层和光网络层控制平面因各自独立运行缺乏协同机制而不能进行互网络信息和状态信息的有效交互,更不能互通拓扑和资源信息的问题。

第一方面,本申请实施例提供一种网络故障定位方法,所述方法包括:在IP网络网元和光网络网元配置链路层发现协议,以简单图表征设备之间的邻接关系,并构建跨层关联的简单图邻接矩阵;基于跨层关联简单图邻接矩阵的告警,对故障范围及故障设备进行界定,并得到关联信息;以及基于所述关联信息确定故障位置。通过该方法不仅能解决IP网络层和光网络层控制平面因各自独立运行缺乏协同机制而不能进行互网络信息和状态信息的有效交互,还可以有效解决光网络层故障时引起IP网络层告警风暴的定位问题。

进一步地,所述简单图邻接矩阵以对角线为轴,并且矩阵中的元素对称分布。

进一步地,所述在IP网络网元和光网络网元配置链路层发现协议,以简单图表征设备之间的邻接关系,并构建跨层关联的简单图邻接矩阵包括:对所述IP网络网元和所述光网络网元配置链路层发现协议;通过简单网络管理协议采集联合网络网元侧管理信息库,以获取联合网络网元间的设备邻接信息;以及根据联合网络的网元设备顶点集构建用以存放顶点元素邻接关系的二维数组,并在二维数组元素设置为设定值时,确定简单图邻接矩阵构建完成。

进一步地,所述基于跨层关联简单图邻接矩阵的告警,对故障范围及故障设备进行界定,并得到关联信息包括:将标准化输出的网管告警划分为设备级告警和链路级告警,以本段设备、对端设备以及互联链路进行告警去重、关键告警提取;将清洗后告警向跨层关联简单图邻接矩阵映射,设备告警映射至关联简单图邻接矩阵的行元素,链路告警映射至关联简单图邻接矩阵的单个元素;将有所述告警关联关系的简单图邻接矩阵元素设置为第一设定值,并将没有所述关联关系的简单图邻接矩阵元素设置为第二设定值,从而构建跨层关联告警邻接矩阵;以及基于跨层关联告警邻接矩阵,通过设定算法对故障范围及故障设备进行界定,并得到关联信息。

进一步地,所述关联信息包括:在所述通过设定算法对故障范围及故障设备进行界定后,针对每个故障从跨层关联简单图邻接矩阵抽取相关顶点设备的关联信息。

进一步地,所述基于所述关联信息确定故障位置包括:基于所述关联信息,结合简单网络管理协议采集的联合网络网元侧管理信息库存储的接口标识、资管系统板卡信息以及设备自身重要告警信息进行故障定位。

第二方面,本申请实施例还提供一种电子设备,所述设备包括:处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现如第一方面提供的网络故障定位方法。

第三方面,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面提供的网络故障定位方法。

第四方面,本申请实施例还提供一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现如第一方面提供的网络故障定位方法。

通过上述技术方案,通过光网协同的跨层关联简单图邻接矩阵的构建,能够有效表征IP网络设备与光网络设备的连接关系,此基础上构建跨层拓扑,能够直观展现光网络层与IP网络层设备的承载关系;光网络层告警和IP网络层告警向跨层关联简单图邻接矩阵的映射,能够有效解决告警风暴和跨专业告警无法关联问题;跨层关联简单图邻接矩阵网络故障定位方法,实现了IP网络与光网络层的关联协同,提升了故障定位的准确性和实时性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为相关技术中人工协商方式跨层建路及基于ASON架构跨层建路方式示意图;

图2为本申请一个实施例提供的跨层关联简单图邻接矩阵故障定位体系流程示意图;

图3为本申请一个实施例提供的网络故障定位方法流程示意图;

图4为本申请一个实施例提供的跨层关联简单图邻接矩阵故障定位体系流程示意图;

图5为本申请一个实施例提供的跨层关联简单图邻接矩阵及告警关联邻接矩阵构建示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

IP网络层承载于光网络层之上,IP层需要向光网络层请求资源和连接。IP数据流与光网络层资源的关系可以看作端到端的IP流业务承载在光网络层的端到端传输通道之上的关系。当前的主流管控方式是IP网络层与光网络层分别管控。

图1为相关技术中人工协商方式跨层建路及基于ASON架构跨层建路方式示意图。参照图1所示,目前部分运营商主要以ODUk(Optical Data Unit,光通路数据单元)作为光网络层的传输通道,通过人工协商跨层的资源和流量的映射。IP网络维护人员根据IP网络层路由需求,与光网络层维护人员沟通构建光网络层通道。网络层IP流在光网络层的信源节点被封装成ODUk,ODUk被进一步复用进OCh(Optical Channel,光信道)中。根据光网络节点所支持的功能,OCh被进一步的复用进入OMS(Optical Multiplex Section,光复用段)中,并通过光纤传输到下一个光网络层节点;光网络信号到达光网络层信宿节点后,会通过一步步解复用还原成ODUk,通过支路板还原成IP流。

参照图1所示,另一部分运营商采用基于GMPLS的ASON作为光网络中的智能架构,对光网络层采用GMPLS协议进行智能控制。当IP网络层业务需通过光网络层通道进行传输时,需通过UNI(User Network Interface,用户网络接口)向GMPLS控制平面发出端到端的连接请求。跨控制域之间的连接则通过E-NNI(Extro Network Node Interface,外部网络接口)交互信息。在应用中,ASON网络正是在控制平面采用GMPLS协议进而实现传输网的信令和路由计算的自动化,进而建立和拆除呼叫/连接。但GMPLS作为IP网络协议MPLS在光网络层的扩展,仅能实现对光网络层的管控,导致必须存在独立运行的两个控制逻辑。

现网中应用的网络诊断主要是被动地通过对网络设备的监控(监控设备自身运行指标)来捕获对网络中故障信息。故障管理系统网管接收网络设备通过SNMP等网络层协议通过北向接口传递的设备告警CDR话单,并基于预先设定规则对话单进行解析,并按照关键字段进行告警标准化输出,而转变为系统的网络设备实时告警。批量标注化转换以及逐条呈现是故障管理系统的主要功能。当网络故障较大有可能造成告警监控窗口刷屏显示告警的情况。故障定位只能依靠人工导出告警并进行分析。

基于现有技术中提出的上述实施方案,存在以下缺点:

1、IP网络层与光网络层协同问题

IP网络层承载于光网络层之上,网络故障除自身硬件设备问题外,也有可能是光网络层问题导致的;而光网络层出现故障时反应在IP网络层可能为多处故障。无论采取人工协商方式还是采用基于ASON架构,IP网络层和光网络层控制平面因各自独立运行缺乏协同机制而不能进行互网络信息和状态信息的有效交互,更不能互通拓扑和资源信息。

2、告警风暴导致无法进行有效故障原因定位

在大型网络中,IP流量端到端承载涉及的专业及资源众多。且告警信息由设备传送原始数据标准化后产生,不涉及去重或关联,从而导致单个故障触发大数量告警,而当出现大面积设备故障时,更增加了维护人员辨别有用信息的难度,降低故障处理运维效率。

为克服上述技术问题,本申请实施例提供一种网络故障定位方法,图2为本申请一个实施例提供的跨层关联简单图邻接矩阵故障定位体系流程示意图,如图2所示,在跨层关联简单图邻接矩阵基础上进行告警降维映射,并以聚类的方式进行告警范围及故障设备界定,最后基于界定故障区域内的设备告警等多信息进行故障根因定位。

图3为本申请一个实施例提供的网络故障定位方法流程示意图,如图3所示,该方法包括以下步骤:

步骤301:将链路层发现协议(Link Layer Discovery Protocol,LLDP)在IP网络层和光网络层设备中同时部署,引入简单图以表征设备之间的邻接关系,并构建跨层关联的简单图邻接矩阵。

图4为本申请一个实施例提供的跨层关联简单图邻接矩阵故障定位体系流程示意图。示例性的,如图4所示,以某地市城域网为例构建图G,该地市CMNet城域网BRAS至PA的IP网络承载在市县一、二平面传输光网络环上。以N台设备作为图G的顶点集V(N阶),以设备之间的链路作为图G的边集E,如果图G的边α={Vi,Vj}∈E,(i,j=0,1,…N)则α连接的两台设备Vi和Vj是邻接的,用一维数组存放图G所有顶点数据,所有顶点作为行、列表头构建的用以存放顶点间关系(边)的二维数组则成为邻接矩阵。当顶点之间的邻接关系不存在重边时,构成的图G为简单图,记作G

在一种实施方式中,步骤301可以通过以下具体步骤实现:

步骤301a:对IP网络和光网络配置LLDP。

其中,通过对IP网络和光网络网元共同配置LLDP,实现IP网络和光网络组成的跨层联合网络的设备信息、互联关系、接口标识等数据的相互发布收集,实现这些数据信息通过MIB形式暂存联合网络网元内部。

步骤301b:跨层综合网管通过简单网络管理协议(SNMP)采集联合网络网元侧管理信息库(MIB),以获取联合网络网元间的设备邻接信息。

步骤301c:根据联合网络的网元设备顶点集构建用以存放顶点元素邻接关系的二维数组,并在二维数组元素设置为设定值时,确定简单图邻接矩阵构建完成。

其中,以联合网络的N台网元设备顶点集V

N阶简单图邻接矩阵以对角线为轴,矩阵中的元素对称分布,如图4所示,共需要N*(N-1)/2个存储单元进行数据存储,可以高效地进行图元素的索引。

步骤302:基于跨层关联简单图邻接矩阵的告警,对故障范围及故障设备进行界定,并得到关联信息。

其中,由于IP网络层和光网络层均为独立运维,它们的控制平面不能有效地交互网络信息和状态而缺乏协同机制,通过IP网管告警管理系统与光网络告警管理系统中的相关告警,降维关联至跨层关联简单图邻接矩阵,构建跨层关联告警邻接矩阵。进而可以通过以下具体步骤实现步骤302:

步骤302a:将标准化输出的网管告警,划分为设备级告警和链路级告警,以本段设备、对端设备以及互联链路进行告警去重、关键告警提取等清洗工作。

步骤302b:将清洗后告警向跨层关联简单图邻接矩阵映射,设备告警映射至关联简单图邻接矩阵的行元素;链路告警映射至关联简单图邻接矩阵的单个元素。

步骤302c:将有告警关联关系的简单图邻接矩阵元素设置为第一设定值(如,第一设定值为1),并将没有关联关系的简单图邻接矩阵元素设置为第二设定值(如,第二设定值为0),从而构建跨层关联告警邻接矩阵。

步骤302d:如图5所示,基于跨层关联告警邻接矩阵,采用图团体聚类、K-均值聚类或者快速贪婪模块性最大化聚类等算法,对故障范围及故障设备进行界定,并得到关联信息,具体可以为针对每个故障从跨层关联简单图邻接矩阵抽取相关顶点元素(设备)关联信息。

步骤303:基于关联信息确定故障位置。

其中,聚类获取的故障设备范围界定后,针对每个故障从跨层关联简单图邻接矩阵抽取相关顶点元素(设备)关联信息,结合SNMP采集的设备MIB存储的接口标识、资管系统板卡信息以及设备自身重要告警信息进行故障定位。

以上通过本申请实施例提供的网络故障定位方法可以通过光网协同的跨层关联简单图邻接矩阵的构建,能够有效表征IP网络设备与光网络设备的连接关系,此基础上构建跨层拓扑,能够直观展现光网络层与IP网络层设备的承载关系;光网络层告警和IP网络层告警向跨层关联简单图邻接矩阵的映射,能够有效解决告警风暴和跨专业告警无法关联问题;跨层关联简单图邻接矩阵网络故障定位方法,实现了IP网络与光网络层的关联协同,提升了故障定位的准确性和实时性。

本申请实施例还提供一种电子设备,该设备可包括处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现本申请任一实施例提供的网络故障定位方法。

本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任一实施例提供的网络故障定位方法。

本申请实施例还提供一种计算机程序产品,包括计算机程序或指令,计算机程序或指令被处理器执行时实现本申请任一实施例提供的网络故障定位方法。

需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。

可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本申请实施例对此不进行限定。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

相关技术
  • 网络设备系统、网络设备系统的实现方法以及计算机可读存储介质
  • 解调参考信号传输方法、网络设备及计算机可读存储介质
  • 频点切换处理方法、网络设备、终端和计算机存储介质
  • 随机接入方法、终端、网络设备及计算机可读存储介质
  • 测量配置方法、网络设备、终端及计算机可读存储介质
  • 网络故障定位方法、装置、网络设备及计算机存储介质
  • 网络故障定位方法、装置、网络设备及计算机存储介质
技术分类

06120116510660