掌桥专利:专业的专利平台
掌桥专利
首页

一种基于时序挖掘的派单准确性校验方法、装置及计算设备

文献发布时间:2024-04-18 19:59:31


一种基于时序挖掘的派单准确性校验方法、装置及计算设备

技术领域

本申请涉及数据挖掘领域,特别地,涉及一种时序挖掘的方法、装置及计算设备。

背景技术

近年来,全球通信行业得到显著发展,网络规模不断扩大,业务种类越来越丰富。在市场竞争日益激烈的今天,如何保证电信网络安全、稳定、可靠的运行成为电信领域热门的研究课题。因此,提高派单的准确率在故障管理的过程中愈发重要,受到网络运营部门的重视。

在传统管理模式中,网络故障的诊断与定位采用人工的方式,依靠经验丰富的专家完成。然而,专家数量毕竟有限,且人工诊断费时,难以对派单的准确性进行及时校验。在这种情况下,自动化、智能化的故障诊断技术变得愈发重要。

现有技术未能充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,使得现有算法计算效率低下、无法保证模型计算的实时性。此外,现有算法针对特定小规模数据设计,未能充分考虑对生产数据的普适性。

为此,亟需一种校验方案来解决现有技术之缺陷。

发明内容

本发明之目的在于提供一种基于时序挖掘的派单准确性校验方法、装置及计算设备,不仅能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,还能够根据实际需求指定告警字段,进而广泛满足各种生产环境的需要。

为实现上述目的,本发明公开的一种基于时序挖掘的派单准确性校验方法,方法包括通过匹配派单标识和告警标识进而提取任一派单时间和该派单时间对应的所有告警发生时间,以及通过计算多组派单时间与其告警发生时间之间的最大时间间隔来生成相应的告警采样时间窗口,公式表示如下:

可选地,在根据本申请的方法中,在匹配派单标识和告警标识之前,创建多组派单结构对象以及告警结构对象,对相应赋值的字符串的识别匹配来提取相应结构对象的参数及将赋值中的非法字符识别并删除以及对多组派单结构对象以及告警结构对象进行相应赋值及赋值类型的过滤转换。其中,派单结构对象包括派单标识、派单时间和派单标题。告警结构对象包括告警标识、机房信息、告警标准名称和告警发生时间。

可选地,在根据本申请的方法中,在将告警序列按照发生频率进行统计时,计算一个二元告警序列时,统计计算序列(A,B)出现的频率f1和序列(B,A)出现的频率f2。如果f1,f2小于预设频率阈值φ,则仅保留出现频率较大的告警序列。如果f1,f2均大于预设频率阈值φ,则保留上述两个告警序列。其中,预设频率阈值φ取值为0.05。

可选地,在根据本申请的方法中,在以派单时间为采样时间起点,派单时间与告警发生时间之间的最大时间间隔作为告警采样时间窗口的大小,进而生成相应的告警采样时间窗口后,对每组告警相关数据逐个进行采样。将采集到的每一条派单对应的告警参数按时间顺序存入一维列表中,以及将一维列表堆叠成二维列表,该二维列表记录了同一派单标题对应的全部告警参数。并且,在将一维列表堆叠成二维列表后,将输入采集的告警参数,且使用序列模式挖掘算法对告警参数构成的告警数据集进行挖掘,以及根据该挖掘算法生成及输出告警序列。

本发明提供一种基于时序挖掘的派单准确性校验装置,其包括:告警窗口分析模块,通过匹配派单标识和告警标识进而提取任一派单时间和该派单时间对应的所有告警发生时间,以及通过计算多组派单时间与其告警发生时间之间的最大时间间隔来生成相应的告警采样时间窗口,公式表示如下:

可选地,在根据本申请的装置中,还包括:告警数据预处理模块,用以创建多组派单结构对象以及告警结构对象,以及对多组派单结构对象以及告警结构对象进行相应赋值及赋值类型的过滤转换。其中,派单结构对象包括派单标识、派单时间和派单标题。告警结构对象包括告警标识、机房信息、告警标准名称和告警发生时间。并且,告警数据预处理模块包括:数据类型过滤转换模块,通过对相应赋值的字符串的识别匹配来提取相应结构对象的参数及将赋值中的非法字符识别并删除。

可选地,在根据本申请的装置中,挖掘结果合并模块计算一个二元告警序列时,统计计算序列(A,B)出现的频率f1和序列(B,A)出现的频率f2。如果f1,f2小于预设频率阈值φ,则仅保留出现频率较大的告警序列。如果f1,f2均大于预设频率阈值φ,则保留上述两个告警序列。其中,预设频率阈值φ取值为0.05。

可选地,在根据本申请的装置中,还包括:告警数据集挖掘模块,以派单时间为采样时间起点,派单时间与告警发生时间之间的最大时间间隔作为告警采样时间窗口的大小,对每组告警相关数据逐个进行采样。将采集到的每一条派单对应的告警参数按时间顺序存入一维列表中,并且,将一维列表堆叠成二维列表,该二维列表记录了同一派单标题对应的全部告警参数。序列模式挖掘模块,将告警数据集挖掘模块采集的告警参数输入序列模式挖掘模块,使用序列模式挖掘算法对告警参数构成的告警数据集进行挖掘,以及根据该挖掘算法生成及输出告警序列。

本发明提供了一种计算设备,包括:一个或多个处理器存储器。一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上任一方法的指令。

本发明提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令在被计算设备执行时,使得计算设备执行如上的任一方法。

在此,对本发明涉及的术语含义解释如下:

时间序列:是指按时间顺序排列的一组数据,是—类重要的复杂数据对象。作为数据库中的—种数据形式,它广泛存在于各种大型的商业、医学、工程和社会科学等数据库中。大量时间序列数据真实地记录了系统在各个时刻的所有重要信息若能改进某种高效的数据处理方法,发现其中各时间序列之间的相互关系,必将大大提高人们对这类系统的认识和理解,进而进行有效的预测和控制。

数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但是又潜在有用的信息和知识的过程。

时间序列数据:时间序列数据是—类常见而重要的数据,对其挖掘分析研究引起了国内外很多学者的兴趣和注意,目前已成为数据挖掘研究的—个重要分支和研究热点,其成果已应用于金融、生物医学、天文、气象等领域。

时序挖掘:时间序列数据挖掘(Time Series Data Mining,TSDM)就是要从大量的时间序列数据中提取人们事先不知道的、与时间属性相关的有用信息和知识,用于指导人们的社会、经济、军事和生活等活动。时间序列挖掘对人类社会、科技和经济的发展具有重大意义,正逐渐成为数据挖掘的研究热点之—。

网络告警:网络通信时会产生大量的告警数据,传统的网络故障的诊断与定位采用人工的方式来判断网络故障,计算效率低下、无法保证模型计算的实时性。

派单:通常为后台设定的一些既定派单标准,从上游系统把工单派发到终端。

综上,根据本申请的方案,不仅能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,还能够根据实际需求指定告警字段,进而广泛满足各种生产环境的需要。

与现有技术相比,本发明的方法、装置及计算设备具有以下优点具有以下优点:

1、充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,使得算法计算效率极高、有效保证模型计算的实时性。

2、针对特定大规模数据设计,且能够根据实际需求指定告警字段,充分考虑对生产数据的普适性。

附图说明

图1为本发明的流程示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。在此记载的实施方式为本发明的特定的具体实施方式,用于说明本发明的构思,均是解释性和示例性的,不应解释为对本发明实施方式及本发明范围的限制。除在此记载的实施方式外,本领域技术人员还能够基于本申请权利要求书和说明书所公开的内容采用显而易见的其它技术方案,这些技术方案包括采用对在此记载的实施方式做出任何显而易见的替换和修改之技术方案。

本说明书的附图为示意图,辅助说明本发明的构思,示意性地表示各部分的相互关系。

近年来,全球通信行业得到显著发展,网络规模不断扩大,业务种类越来越丰富。在市场竞争日益激烈的今天,如何保证电信网络安全、稳定、可靠的运行成为电信领域热门的研究课题。因此,提高派单的准确率在故障管理的过程中愈发重要,受到网络运营部门的重视。

在传统管理模式中,网络故障的诊断与定位采用人工的方式,依靠经验丰富的专家完成。然而,专家数量毕竟有限,且人工诊断费时,难以对派单的准确性进行及时校验。在这种情况下,自动化、智能化的故障诊断技术变得愈发重要。

现有技术未能充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,使得现有算法计算效率低下、无法保证模型计算的实时性。此外,现有算法针对特定小规模数据设计,未能充分考虑对生产数据的普适性。

本发明的技术核心就是根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,以及根据实际需求指定告警字段,进而广泛满足各种生产环境的需要。

如图1所示,本发明提供一种基于时序挖掘的派单准确性校验装置。其包括:告警窗口分析模块,通过匹配派单标识和告警标识进而提取任一派单时间和该派单时间对应的所有告警发生时间,以及通过计算多组派单时间与其告警发生时间之间的最大时间间隔来生成相应的告警采样时间窗口,公式表示如下:

其中,T

挖掘结果合并模块,将告警序列按照发生频率进行统计,若序列一出现的频率为f1且序列二出现的频率为f2,当f1和f2均小于预设频率阈值φ时,则仅保留序列一和序列二两者间出现频率更大的告警序列。并且,当f1和f2均大于等于预设频率阈值φ,则保留序列一和序列二两个告警序列。

更进一步地,挖掘结果合并模块计算一个二元告警序列时,统计计算序列(A,B)出现的频率f1和序列(B,A)出现的频率f2。如果f1,f2小于预设频率阈值φ,则仅保留出现频率较大的告警序列。如果f1,f2均大于预设频率阈值φ,则保留上述两个告警序列。预设频率阈值φ取值为0.05。

在根据本发明的实施例中,一种基于时序挖掘的派单准确性校验装置还包括:告警数据预处理模块,用以创建多组派单结构对象以及告警结构对象,以及对多组派单结构对象以及告警结构对象进行相应赋值及赋值类型的过滤转换。

更具体地,告警数据预处理模块包括:数据类型过滤转换模块,通过对相应赋值的字符串的识别匹配来提取相应结构对象的参数及将赋值中的非法字符识别并删除。派单结构对象包括派单标识、派单时间和派单标题。告警结构对象包括告警标识、机房信息、告警标准名称和告警发生时间。

在根据本发明的实施例中,一种基于时序挖掘的派单准确性校验装置还包括:告警数据集挖掘模块,以派单时间为采样时间起点,派单时间与告警发生时间之间的最大时间间隔作为告警采样时间窗口的大小,对每组告警相关数据逐个进行采样。将采集到的每一条派单对应的告警参数按时间顺序存入一维列表中,并且,将一维列表堆叠成二维列表,该二维列表记录了同一派单标题对应的全部告警参数。

在根据本发明的实施例中,一种基于时序挖掘的派单准确性校验装置还包括:序列模式挖掘模块,将告警数据集挖掘模块采集的告警参数输入序列模式挖掘模块,使用序列模式挖掘算法对告警参数构成的告警数据集进行挖掘,以及根据该挖掘算法生成及输出告警序列。

现有技术未能充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,使得现有算法计算效率低下、无法保证模型计算的实时性。此外,现有算法针对特定小规模数据设计,未能充分考虑对生产数据的普适性。

本发明提供的一种基于时序挖掘的派单准确性校验装置,不仅能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,还能够根据实际需求指定告警字段,进而广泛满足各种生产环境的需要。

与现有技术相比,本发明的装置具有以下优点:

1、充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,使得算法计算效率极高、有效保证模型计算的实时性。

2、针对特定大规模数据设计,且能够根据实际需求指定告警字段,充分考虑对生产数据的普适性。

如图1所示,本发明提供的一种基于时序挖掘的派单准确性校验方法,方法包括通过匹配派单标识和告警标识进而提取任一派单时间和该派单时间对应的所有告警发生时间,以及通过计算多组派单时间与其告警发生时间之间的最大时间间隔来生成相应的告警采样时间窗口,公式表示如下:

其中,T

将告警序列按照发生频率进行统计,若序列一出现的频率为f1且序列二出现的频率为f2,当f1和f2均小于预设频率阈值φ时,则仅保留序列一和序列二两者间出现频率更大的告警序列;并且,当f1和f2均大于等于预设频率阈值φ,则保留序列一和序列二两个告警序列。

更进一步地,计算一个二元告警序列时,统计计算序列(A,B)出现的频率f1和序列(B,A)出现的频率f2。如果f1,f2小于预设频率阈值φ,则仅保留出现频率较大的告警序列。如果f1,f2均大于预设频率阈值φ,则保留上述两个告警序列。预设频率阈值φ取值为0.05。

在根据本发明的实施例中,一种基于时序挖掘的派单准确性校验方法还包括:在匹配派单标识和告警标识之前,创建多组派单结构对象以及告警结构对象,以及对多组派单结构对象以及告警结构对象进行相应赋值及赋值类型的过滤转换。

更具体地,进行相应赋值及赋值类型的过滤转换包括:通过对相应赋值的字符串的识别匹配来提取相应结构对象的参数及将赋值中的非法字符识别并删除。派单结构对象包括派单标识、派单时间和派单标题。告警结构对象包括告警标识、机房信息、告警标准名称和告警发生时间。

在根据本发明的实施例中,一种基于时序挖掘的派单准确性校验方法还包括:以派单时间为采样时间起点,派单时间与告警发生时间之间的最大时间间隔作为告警采样时间窗口的大小,对每组告警相关数据逐个进行采样。将采集到的每一条派单对应的告警参数按时间顺序存入一维列表中,并且,将一维列表堆叠成二维列表,该二维列表记录了同一派单标题对应的全部告警参数。并且,在将一维列表堆叠成二维列表后,将输入采集的告警参数,且使用序列模式挖掘算法对告警参数构成的告警数据集进行挖掘,以及根据该挖掘算法生成及输出告警序列。

如图1所示,在根据本发明的实施例中,一种基于时序挖掘的派单准确性校验方法分为六个步骤,计算流程如下:

步骤S1数据字段抽取:根据实际需求,选取输入模型的数据字段;

步骤S2数据清洗过滤:清洗过滤派单数据,对告警数据中的非法字符并进行格式转化,过滤替换nan、null等非法字段,并完成数据格式转化;

步骤S3数据匹配确定采样窗口尺寸:对派单数据和告警数据进行匹配,自适应的确定告警数据采样窗口的大小,将派单数据和告警数据两者之间的最大时间间隔作为采样窗口大小;

步骤S4告警数据采集:按照采样窗口尺寸采集告警数据,并按照二维列表形式进行告警数据集组织;

步骤S5序列模式挖掘:使用序列模式挖掘算法PrefixSpan对告警数据集进行挖掘;

步骤S6告警序列结果后处理:对挖掘结果后处理,过滤冗余结果,对挖掘结果按照需求进行合并。

其中步骤S1的数据字段抽取具体包括以下过程:

使用中国联通某省2022年6月1号~2022年6月30号的派单数据和告警数据进行实验。抽取的派单数据字段:

其中,派单标识是派单数据的唯一标识符,用于匹配派单数据和告警数据。派单时间表示派单发生的时间。派单标题表示派单内容。

抽取的告警数据字段:

其中,告警标识由四个字段进行表示,是告警数据的唯一标识符。机房信息记录机房名称,是告警数据的一种物理范畴的表示。告警标准名称表示该告警的标准名称。告警发生时间记录该告警的发生时间。上述字段可以根据生产数据和实际需求自行指定。

其中步骤S2的数据清洗过滤具体包括以下过程:

对上述字段的数据进行清洗,去除含有nan、null等非法字符的数据。统一数据的格式,将时间信息转化为np.float64()格式,其他数据转化为字符串格式。

其中步骤S3的数据匹配确定采样窗口尺寸具体包括以下过程:

使用派单标识、告警标识对派单数据和告警数据进行匹配,记录成功匹配数据的相关信息。自适应的确定告警数据采样窗口的大小,计算派单时间和其对应告警发生时间的时间间隔,将最大时间间隔作为采集告警数据的时间窗口,公式表示如下:

其中,T

其中步骤S4的告警数据采集具体包括以下过程:

根据实际需求指定机房和派单标题(以‘小区退服’为样例),以派单时间为采样时间起点,最大时间间隔作为时间窗口大小,对告警数据进行采样。每一条派单采集的告警数据按时间顺序存入一维列表中。将一维列表堆叠成二维列表,记录同一派单标题采集的告警数据。

其中步骤S5的序列模式挖掘具体包括以下过程:

序列模式挖掘模块使用序列模式挖掘算法PrefixSpan进行挖掘,算法的最小支持度设置为0.01。将步骤4采集的告警数据输入序列模式挖掘模块,模块输出序列模式挖掘结果。

其中步骤S6的告警序列结果后处理具体包括以下过程:

过滤冗余结果,对挖掘结果按照需求进行合并。过滤规则如下:

对于一个二元告警序列,统计计算序列(A,B)出现的频率f1和序列(B,A)出现的频率f2。如果f1,f2小于频率阈值φ,则仅保留出现频率较大的告警序列;如果f1,f2均大于频率阈值φ,则保留上述两个告警序列。阈值φ取值为0.05。

与现有技术相比,本发明的方法具有以下优点:

1、充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,使得算法计算效率极高、有效保证模型计算的实时性。

2、针对特定大规模数据设计,且能够根据实际需求指定告警字段,充分考虑对生产数据的普适性。

根据本申请的校验方法和装置可以通过一台或多台计算设备实现。需要说明的是,在实践中,用于实施本申请的计算设备可以是任意型号的设备,本申请对计算设备的具体硬件配置情况不做限制。计算设备优选地可以包括系统存储器和一个或者多个处理器。存储器总线可以用于在处理器和系统存储器之间的通信。

取决于期望的配置,处理器可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器可以包括诸如一级高速缓存和二级高速缓存之类的一个或者多个级别的高速缓存、处理器核心和寄存器。处理器核心可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理(DSP)核心或者它们的任何组合。示例的存储器控制器可以与处理器一起使用,或者在一些实现中,存储器控制器可以是处理器的一个内部部分。

取决于期望的配置,系统存储器可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM,磁盘中的数据需要加载至物理内存中才能够被处理器读取。系统存储器可以包括操作系统、一个或者多个应用以及程序数据。在一些实施方式中,应用可以布置为在操作系统上由一个或多个处理器利用程序数据执行指令。操作系统例如可以是Linux、Windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用包括用于实现各种用户期望的功能的程序指令,应用例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境IDE、编译器等)等,但不限于此。当应用被安装到计算设备中时,可以向操作系统添加驱动模块。

在计算设备启动运行时,处理器会从系统存储器中读取操作系统的程序指令并执行。应用运行在操作系统之上,利用操作系统以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用时,应用会加载至系统存储器中,处理器从系统存储器中读取并执行应用的程序指令。

计算设备还包括储存设备,储存设备包括可移除储存器(例如CD、DVD、U盘、可移动硬盘等)和不可移除储存器(例如硬盘驱动器HDD等),可移除储存器和不可移除储存器均与储存接口总线连接。

计算设备还可以包括储存接口总线。储存接口总线实现了从储存设备(例如,可移除储存器和不可移除储存器)经由总线/接口控制器到基本配置的通信。操作系统、应用以及程序数据的至少一部分可以存储在可移除储存器和/或不可移除储存器上,并且在计算设备上电或者要执行应用时,经由储存接口总线而加载到系统存储器中,并由一个或者多个处理器来执行。

计算设备还可以包括有助于从各种接口设备(例如,输出设备、外设接口和通信设备)到基本配置经由总线/接口控制器的通信的接口总线。示例的输出设备包括图像处理单元和音频处理单元。它们可以被配置为有助于经由一个或者多个A/V端口与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口可以包括串行接口控制器和并行接口控制器,它们可以被配置为有助于经由一个或者多个I/O端口和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备可以包括网络控制器,其可以被布置为便于经由一个或者多个通信端口与一个或者多个其他计算设备通过网络通信链路的通信。

计算设备可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。当然,计算设备也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。甚至可以被实现为服务器,如文件服务器、数据库服务器、应用程序服务器和WEB服务器等。本申请的实施例对此均不做限制。

在根据本申请的实施例中,计算设备被配置为执行根据本申请的校验方法。其中,布置在操作系统上的应用中包含用于执行方法的多条程序指令,这些程序指令可以指示处理器执行本申请的方法。

此外,本申请的方法和装置的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本申请的设备。

在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本申请的非矢量数据的处理方法。

以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。

在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本申请的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的优选实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

本发明通过匹配告警数据、派单数据,自适应确定采集窗口尺寸,通过对数据进行采样,提高算法计算速度和计算结果准确率。

本发明的挖掘结果示例如下表所示:

本发明对‘小区退服’派单的检验时间为593秒,远低于告警树算法1296秒的校验时间,可以满足系统实时检验的速度要求。

本发明对‘小区退服’派单共产生194条序列模式挖掘结果。经业务专家确认,其中的130条结果存在价值,模型挖掘结果的有效性高达67.01%。远高于告警树算法35.00%的有效性。

现有技术未能充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,使得现有算法计算效率低下、无法保证模型计算的实时性。此外,现有算法针对特定小规模数据设计,未能充分考虑对生产数据的普适性。

本发明提供的一种基于时序挖掘的派单准确性校验方法、装置及计算设备,不仅能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,还能够根据实际需求指定告警字段,进而广泛满足各种生产环境的需要。

与现有技术相比,本发明的方法、装置及计算设备具有以下优点:

1、充分考虑通信网络故障处理的复杂性和电信告警数据的海量特性,能够根据生产数据自适应地确定窗口大小及通过对告警数据进行划分以提高模型的计算效率,使得算法计算效率极高、有效保证模型计算的实时性。

2、针对特定大规模数据设计,且能够根据实际需求指定告警字段,充分考虑对生产数据的普适性。

以上对本发明的一种基于时序挖掘的派单准确性校验方法、装置及计算设备的实施方式进行了说明,其目的在于解释本发明之精神。请注意,本领域技术人员可以在不脱离本发明的精神的情况下对上述各实施方式的特征进行修改和组合,因此,本发明并不限于上述各实施方式。对于本发明的一种基于时序挖掘的派单准确性校验装置及计算设备的具体特征如形状、尺寸和位置可以上述披露的特征的作用进行具体设计,这些设计均是本领域技术人员能够实现的。而且,上述披露的各技术特征并不限于已披露的与其它特征的组合,本领域技术人员还可根据发明之目的进行各技术特征之间的其它组合,以实现本发明之目的为准。

技术分类

06120116523297