掌桥专利:专业的专利平台
掌桥专利
首页

一种彩铃播放异常检测方法及系统

文献发布时间:2024-01-17 01:17:49


一种彩铃播放异常检测方法及系统

技术领域

本发明涉及无线通信、人工智能技术,特别涉及一种彩铃播放异常检测方法及系统。

背景技术

彩铃是“个性化多彩回铃音业务”(Coloring Ring Back Tone)的简称,它是一项由被叫客户为呼叫自己移动电话的其他主叫客户设定特殊音效(音乐、歌曲、故事情节、人物对话)的回铃音的业务。关于彩铃播放异常问题,以下为检索到的相关彩铃播放异常检测方法。

现有专利“一种时序数据的异常检测方法、装置、设备及存储介质”,申请号为2021111173536,提供了一种时序数据的异常检测方法,包括以下步骤:步骤A.将目标待检测时刻的时序数据分别输入多个异常检测模型,获得每个异常检测模型分别输出的异常检测结果;步骤B.基于预设评价指标在测试样本集上的交叉验证结果,确定异常检测模型的权重;步骤C.基于每个异常检测模型分别输出的异常检测结果和每个异常检测模型的权重,确定时序数据的最终异常检测结果。该专利综合了多个异常检测模型,模型权重需要根据对应类型数据的测试样本,通过网格搜索后确定的,且数据样本属于已标注状态。但是多数异常检测场景无法精准划分出异常样本,且通过网格搜索确定权重,当数据类型发生变化,则需要根据改变的数据类型(且需要被标注)重新确定各模型权重,时间资源耗费较大。

现有专利“一种业务异常预测方法、装置、存储介质及电子装置”,申请号为202111124591X”,提供了一种业务异常预测方法、装置、存储介质及电子装置,该方法包括:采集当前时间的实时业务数据;将实时业务数据进行多维度指标聚集,得到多维度实时数据指标;将多维度实时数据指标输入到目标神经网络模型中,得到目标神经网络模型输出的该当前时间之后预设时间段内业务的预测结果;将预测结果输入目标随机森林模型中,得到目标随机森林模型输出的该预设时间内业务的异常检测结果,可以解决相关技术中异常发生后运维人员才开始进行异常诊断,导致异常处理不及时的问题,对网络未来可能发生的异常进行预测,可以使运维人员提前干预、提前处置,降低投诉风险。另外,该现有专利准确率取决于目标神经网络预测精准度,这就决定了只能解决单一数据类型的异常检测问题,比如周期型指标数据,存在能力单一问题。

发明内容

本发明的目的,在于解决现有技术方案中彩铃播放异常检测存在的上述问题。

为实现上述目的,一方面,本发明提供了一种彩铃播放异常检测方法,该方法包括以下步骤:

从时序数据中获取指标数据,所述指标数据包括:媒体面抖动、媒体面丢包、媒体面时延指标数据和网络协商中的一项或多项;

将获取的指标数据和时间传入数据类型算法中,并根据数据类型程度评分,确定数据所属类型标签;

根据数据类型标签,选择对应的异常检测算法;

输出异常检测结果清单。

另一方面,本发明提供了一种彩铃播放异常检测系统,该系统包括:

第一处理单元,用于从时序数据中获取指标数据,所述指标数据包括:媒体面抖动、媒体面丢包、媒体面时延指标数据和网络协商中的一项或多项;

第二处理单元,将获取的指标数据和时间传入数据类型算法中,并根据数据类型程度评分,确定数据所属类型标签;

第三处理单元,根据数据类型标签,选择对应的异常检测算法;

第四处理单元,输出异常检测结果清单。

本发明可以通过异常检测,确定各指标异常情况,其次通过对数据类型的判定,使得异常检测模型表现更加精准,且当数据类型发生变化时无需重新建立模型。结合了多种异常检测算法,使得该检测方法能力更加多元,输入时序数据内容可根据业务弹性变化。

附图说明

图1为本发明实施例提供的一种彩铃播放异常检测方法示意图;

图2为图1所示方法中数据类型算法示意图;

图3为图1所示方法中异常检测算法示意图;

图4为本发明实施例提供的一种彩铃播放异常检测系统结构示意图。

具体实施方式

通过以下结合附图以举例方式对本发明的实施方式进行详细描述后,本发明的其他特征、特点和优点将会更加明显。

本发明实施例对用户历史彩铃呼叫话单和媒体面话单、用户订购时序数据进行采集、汇聚,筛选获取彩铃播放指标特征,通过数据类型分析,利用机器学习技术搭建针对彩铃播放不同指标数据类型的异常检测算法,用于彩铃播放异常检测。

图1为本发明实施例提供的一种彩铃播放异常检测方法示意图;如图1所示,彩铃播放异常检测方法包括以下步骤:

步骤一,获取指标数据,所述指标数据包括:媒体面抖动、媒体面丢包、媒体面时延指标数据和网络协商中的一项或多项。

具体地,从用户历史彩铃呼叫话单和媒体面话单、用户订购时序数据中,分别获取媒体面抖动、媒体面丢包和媒体面时延指标数据;以及从彩铃播放话单中,获取网络协商指标数据,网络协商指标数据包括:路由UDP(user datagram protocol,用户数据包协议)、主叫收到Ring 180(Ringing 180,表示已通知对方振铃)的时延。

步骤二,将获取的指标数据和时间传入数据类型算法中,并根据数据类型程度评分,确定数据所属类型标签。

具体地,如图2所示,将获取的媒体面抖动、媒体面丢包、媒体面时延指标数据、网络协商指标数据,以及时间,根据数据列个数、和数据特性,进行组合,并传入数据类型算法中。

在一个示例中,将指标数据进行组合,组合后的指标数据如下所示:

Time,name,value

2023-04-24 08:05:24,媒体面抖动,122

........

2023-04-25 08:05:24,媒体面抖动,0

2023-04-24 08:05:24,媒体面丢包,100

........

2023-04-25 08:05:24,媒体面丢包,0

进一步根据数据类型程度评分,确定数据所属类型标签,步骤如下:

首先,统计组合后指标数据中NaN和0值的总和,并计算其在总样本数中的占比,如果超过预设阈值(如0.5),则为稀疏性数据;否则,使用傅里叶变换(傅里叶变换公式:

步骤三,根据数据类型标签,选择对应的异常检测算法。

具体地,如图3所示,当数据类型标签为稀疏性数据时,选择基于密度的异常检测算法;或当数据类型标签为周期型数据时,选择基于时序预测的异常检测算法;或当数类型标签为平稳型数据时,选择基于孤立森林的异常检测算法;或当数据类型标签为波动型数据时,选择基于距离的异常检测算法;或当数据类型标签为趋势型数据时,选择基于时序预测的异常检测算法。

所述基于时序预测的异常检测方法步骤为:对于周期/趋势型数据,将指标数据中的空值采用左右值填充,保留时间列和数据列,传入时序预测模型-Prophet预测模型中,输出对该数据的预测数值。据其预测出来的时序曲线和真实的数据相比,求出每个点的残差,并对残差序列建模。采用K-Sigma对残差序列进行异常检测,输出异常检测结果。

基于孤立森林的异常检测方法步骤为:对于平稳型数据,将指标数据中的空值采用左右值填充。只保留数据列数据,传入孤立森林算法模型中,输出异常检测结果。

基于密度的异常检测方法步骤为:对于稀疏型数据,将NaN值采用0值填充。获取时间列和数据列,对时间列数据进行数值转化,对数据列进行标准化,将数据传入基于密度的异常检测算法-Local Outlier Factor异常检测算法中,输出异常检测结果。

基于距离的异常检测方法步骤为:对于波动型数据,将NaN值采用0值填充。对数据列进行标准化,对时间列数据进行encode编码,将数据传入KNN异常检测算法中,输出异常检测结果。

步骤四,输出异常检测结果清单。

本发明实施例进一步对输出的异常检测结果进行统计,并计算F1指数(F1分数可以看作是模型精准率和召回率的一种加权平均,它的最大值是1,最小值是0)和AUC评分(AUC(area under the curve)是模型评估指标,特别是二分类模型使用的主要离线评测指标之一),确定评价指标为score=(F1+AUC)/2,模型表现评价阈值为0.96。

相应地,本发明实施例提供了一种彩铃播放异常检测系统。

图4为本发明实施例提供的一种彩铃播放异常检测系统结构示意图。如图4所示,该系统包括:

第一处理单元410,用于从时序数据中获取指标数据,所述指标数据包括:媒体面抖动、媒体面丢包、媒体面时延指标数据和网络协商中的一项或多项;

第二处理单元420,用于将获取的指标数据和时间传入数据类型算法中,并根据数据类型程度评分,确定数据所属类型标签;

第三处理单元430,用于根据数据类型标签,选择对应的异常检测算法;

第四处理单元440,用于输出异常检测结果清单。

具体地,第一处理单元410,具体用于:从媒体面话音数据中,解析数据,分别获取媒体面抖动、媒体面丢包和媒体面时延指标数据;以及从彩铃播放话单中,解析数据,获取网络协商指标数据。

第二处理单元420,具体用于:判断指标数据中包含的Nan和0值是否超过一定阈值,如果超过则为稀疏性数据;否则,使用傅里叶变换,求得样本数据中的周期,若样本数据周期为一个可表达数值,则判断其周期长度和样本数据长度之间的关系,若周期小于样本长度的一半,则进入下一步;根据求得的周期,选取两个周期的数据,对两个周期的数据差分后求方差,若值小于1,则为周期型数据;否则,采用ADF平稳型检验算法判断序列是否存在单位根:如果序列平稳,就不存在单位根;否则,就会存在单位根;p值若小于0.05,则可以认为拒绝原假设,数据不存在单位根,序列平稳;若大于或等于0.05,则不能显著拒绝原假设,需要进行下一步判断;第二步进行T检验,如果T统计量小于5%水平下的数字就可以拒绝原假设,认为数据平稳;否则,采用样本熵进行判定,求得样本熵大于阈值1.4则为波动型数据,否则样本为具有单一趋势的数据。

第三处理单元430,具体用于:当数据类型为稀疏性数据时,选择基于密度的异常检测算法;或当数据类型为周期型数据时,选择基于时序预测的异常检测算法;或当数据类型为平稳型数据时,选择基于孤立森林的异常检测算法;或当数据类型为波动型数据时,选择基于距离的异常检测算法;或当数据类型为趋势型数据时,选择基于时序预测的异常检测算法。

第四处理单元440,还用于:对输出的异常检测结果进行统计,并计算F1指数和AUC评分,确定评价指标为score=(F1+AUC)/2,模型表现评价阈值为0.96。

本发明实施例可以通过异常检测,确定各指标异常情况,其次通过对数据类型的判定,使得异常检测模型表现更加精准,且当数据类型发生变化时无需重新建立模型。结合了多种异常检测算法,使得该检测方法能力更加多元,输入时序数据内容可根据业务弹性变化。

显而易见,在不偏离本发明的真实精神和范围的前提下,在此描述的本发明可以有许多变化。因此,所有对于本领域技术人员来说显而易见的改变,都应包括在本权利要求书所涵盖的范围之内。本发明所要求保护的范围仅由所述的权利要求书进行限定。

技术分类

06120116115278