掌桥专利:专业的专利平台
掌桥专利
首页

电力计量终端异常检测方法、装置、计算机设备和介质

文献发布时间:2023-06-19 10:11:51


电力计量终端异常检测方法、装置、计算机设备和介质

技术领域

本发明涉及电力检测技术领域,特别是涉及一种电力计量终端异常检测方法、装置、计算机设备和介质。

背景技术

目前,电力计量系统通常为电力计量自动化系统。该系统可以实现对用户电力负荷集中检测和有序配电,并且能够减少用户停电损失,保障整个电网的供需平衡。因此,对电力计量系统中的电力计量终端是否存在异常检测非常重要。检测电力计量终端发生异常的处理过程通常为发现异常、认为定性、上报审查、结果认定和现场维修,整个处理过程会耗费较多的人力和物力。

传统技术中,通常采用传统的聚类分析算法对可以反映电力计量终端的数据进行异常检测。但是,传统的聚类分析算法通常是根据数据之间的亲疏关系进行分类,这需要数据的重要性相同并且彼此独立。然而,电力计量终端的数据之间不可避免的会存在高度的相关性,因此,传统的聚类分析算法的适用性较低。

发明内容

基于此,有必要针对上述技术问题,提供一种电力计量终端异常检测方法、装置、计算机设备和介质。

第一方面,本申请一个实施例提供一种电力计量终端异常检测方法,包括:

获取电力计量终端的多个目标数据集,其中,每个目标数据集包括电力计量终端的多个数据;

基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵;

计算主成分矩阵中的每行元素之间的加权距离;

基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵;

根据隶属度矩阵判断电力计量终端是否存在异常。

在其中一个实施例中,根据隶属度矩阵判断电力计量终端是否存在异常,包括:

获取隶属度矩阵中的最大值;

若隶属度矩阵中的最大值大于或等于预设异常阈值,则隶属度矩阵中的最大值对应的聚类类别中的数据均为异常数据,确定电力计量终端存在异常。

在其中一个实施例中,计算主成分矩阵中的每行元素之间的加权距离,包括:

计算主成分矩阵的多个特征值;

计算每个特征值的权值贡献值;

根据每个特征值的权值贡献值和主成分矩阵,计算主成分矩阵中每行元素之间的加权距离。

在其中一个实施例中,基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵,包括:

获取初始聚类类别数和初始聚类中心;

基于所述模糊C均值聚类算法,根据初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵中的每行元素的隶属度矩阵;

根据隶属度矩阵,更新初始聚类中心,得到新的聚类中心;

计算新的聚类中心与初始聚类中心之间差值的绝对值;

若绝对值大于或等于预设误差阈值,则将新的聚类中心作为初始聚类中心,返回执行根据所述初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵对应的隶属度矩阵的步骤。

在其中一个实施例中,基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵,包括:

将多个目标数据集转换为目标数据矩阵,并计算目标数据矩阵的协方差矩阵;

计算目标数据矩阵的协方差矩阵的多个特征值和多个特征向量;

根据多个特征值、多个特征向量和目标数据矩阵,确定主成分矩阵。

在其中一个实施例中,根据多个特征值、多个特征向量和目标数据矩阵,确定主成分矩阵,包括:

获取多个特征值的累加总和;

将多个特征值降序排列,得到特征值序列;

从大到小依次选取特征值序列中的特征值进行累加,并计算累加后的和与多个所述特征值的累加总和的比值;

若比值大于或等于预设比值阈值,则将选取的多个特征值均作为主特征值;

根据主特征值对应的特征向量和目标数据矩阵,确定主成分矩阵。

在其中一个实施例中,获取电力计量终端的多个目标数据集,包括:

获取电力计量终端的多个初始数据集;

将多个初始数据集中非数值型数据量化为数值型数据,并对多个初始数据集中的数据进行补充或删除处理,得到多个预处理数据集;

对多个预处理数据集进行归一化处理,得到多个目标数据集。

第二方面,本申请一个实施例提供一种电力计量终端异常检测装置,包括:

获取模块,用于获取电力计量终端的多个目标数据集,其中,每个目标数据集包括电力计量终端的多个数据;

确定模块,用于基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵;

计算模块,用于计算主成分矩阵中每行元素之间的加权距离;

确定模块,用于基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵;

判断模块,用于根据隶属度矩阵判断电力计量终端是否存在异常。

第三方面,本申请一个实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述实施例提供的方法的步骤。

第四方面,本申请一个实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例提供的方法的步骤。

本申请提供一种电力计量终端异常检测方法、装置、计算机设备和介质。该该方法通过基于主成分分析法对获取的多个目标数据集进行降维处理,得到主成分矩阵;根据主成分矩阵,计算加权距离;根据模糊C均值聚类算法和加权距离,对所述主成分矩阵中的元素进行聚类分析,得到隶属度矩阵;根据所述隶属度矩阵判断所述电力计量终端是否存在异常。本申请提供的电力计量终端异常检测方法在对主成分矩阵中的每行元素进行聚类分析时,使用根据主成分矩阵计算得到的加权距离,在主成分矩阵中的元素之间具有高度的相关性时,可以避免聚类分析中的失真问题,从而能够提高聚类的效果,进而可以准确的判断电力计量终端是否存在异常。

附图说明

为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域不同技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图2为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图3为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图4为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图5为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图6为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图7为本申请一个实施例提供的电力计量终端异常检测方法的步骤流程示意图;

图8为本申请一个实施例提供的电力计量终端异常检测装置的结构示意图;

图9为本申请一个实施例提供的计算机设备的结构示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。

本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。

下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

电力计量自动化系统具备的功能包括检测电能质量、远程抄表、线损分析、菜价数据、负荷监控和用电异常信息报警等。对电力计量自动化系统中的电力计量终端是否存在异常的监测对于电力计量自动化系统的正常使用非常重要。本申请提供的电力计量终端异常检测方法可以实现对电力计量终端是否存在异常的检测。

本申请提供的电力计量终端异常检测方法可以通过计算机设备实现。计算机设备包括但不限于控制芯片、个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。本申请提供的方法可以通过JAVA软件实现,也可以应用于其他软件。

请参见图1,本申请一个实施例提供一种电力计量终端异常检测方法,具体的实现步骤包括:

步骤100、获取电力计量终端的多个目标数据集,其中,每个目标数据集包括电力计量终端的多个数据;

每个目标数据集均为可以反映电力计量终端状态特征的数据,例如:电力计量终端运行时的电压数据和电流数据,本地通信模块读写数据流、远程通信模块数据流、开关量输入输出状态数据,电力计量终端的停电告警实时检测和综合分析能力等。多个目标数据集可以是对电力计量终端多个时刻的采集的目标数据集。本实施例对计算机设备获取电力计量终端的多个目标数据集的具体方法不作任何限制,只要能够实现其功能即可。假设,每个目标数据集中包括m个数据,总共有n个目标数据集,则获取的多个目标数据集可以表示为X={x

在一个可选的实施例中,在电力计量终端中可以包括多个可能出现异常的预置异常模块,通过获取该预置异常模块中的电力计量终端的数据得到多个目标数据集。多个异常预置异常模块是工作人员根据实际情况确定的电力计量终端中容易出现异常的部分。这样计算机设备无需获取电力计量终端的全部数据,能够提高获取目标数据集的效率,同时可以提高后续计算机设备对该数据的处理效率。

步骤200、基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵。

主成分分析(Principal Component Analysis,PAC)是一种具有代表性的数据降维算法。主成分分析法可以降低目标数据集的维度,并使得降低了维度后的多个目标数据之间的方差最大,能够保留更多的信息。计算机设备根据主成分分析法对获取到的多个目标数据集进行降维处理,并将降维后的多个目标数据用矩阵表示,将该矩阵称为主成分矩阵。本实施例对使用主成分分析法对多个目标数据集进行降维处理的具体过程不作任何限制,只要能够实现其功能即可。

步骤300、计算主成分矩阵中的每行元素之间的加权距离。

步骤400、基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵。

主成分矩阵中的每行元素表示每个目标数据集。模糊C均值(Fuzzy C-means)算法简称为FCM算法,该算法可以提供更加灵活的聚类结果,由于在实际情况中,主成分矩阵中的每行元素不能划分为明显分离的聚类类别,指派主成分矩阵中一行元素到一个聚类类别中特别生硬,也容易出错。所以,使用模糊C均值算法对主成分矩阵中的每行元素对应于每个聚类类别分别赋予一个隶属度,指明主成分矩阵中的每行元素属于每个聚类类别的程度。根据主成分矩阵中的每行元素和聚类类别,以及主成分矩阵中的每行元素分别对应于每个聚类类别的隶属度可以形成隶属度矩阵。计算机设备利用模糊C均值聚类算法通过计算到的加权距离对主成分矩阵中的每行元素进行聚类分析。也就是说,计算机设备在使用模糊C均值聚类算法进行聚类分析使用加权距离确定每行元素分别对应于每个聚类类别的隶属度,形成隶属度矩阵。本实施例对使用模糊C均值聚类算法和加权距离对主成分矩阵中的每行元素进行聚类分析的具体过程不作限制。

步骤500、根据隶属度矩阵判断电力计量终端是否存在异常。

计算机设备在隶属度矩阵后,可以根据隶属度矩阵中每个元素对应于每个聚类类别的隶属度,判断每个元素是否存在异常,既,降维后的目标数据集中是否存在异常的数据,从而可以判断电力计量终端是否存在异常。若降维后的目标数据集中存在异常的数据,则可以确定电力计量终端存在异常;若降维后的目标数据集中不存在异常的数据,则可以确定电力计量终端不存在异常。本实施例对根据隶属度矩阵判断电力计量终端是否存在异常的具体方法不作任何限制,只要能够实现其功能即可。

本申请实施例提供的电力计量终端检测方法基于主成分分析法,对获取的多个目标数据集进行降维处理,得到主成分矩阵;计算主成分矩阵中的每行元素之间的加权距离;基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵;根据隶属度矩阵判断电力计量终端是否存在异常。本申请实施例提供的电力计量终端异常检测方法在对主成分矩阵中每行元素进行聚类分析时,使用根据主成分矩阵计算得到的加权距离。这样在主成分矩阵中的元素之间具有高度的相关性时,可以避免出现聚类分析中的失真问题,从而能够提高聚类的效果,进而可以准确的判断电力计量终端是否存在异常。

请参见图2,在一个实施例中,步骤500“根据隶属度矩阵判断电力计量终端是否存在异常”的一种可能的实现方式包括:

步骤510、获取隶属度矩阵中的最大值。

计算机设备对得到的隶属度矩阵中的元素进行对比,可以得到隶属度矩阵中的最大值,该最大值表示隶属度矩阵中某一元素属于对应的聚类类别的程度。

步骤520、若隶属度矩阵中的最大值大于或等于预设异常阈值,则隶属度矩阵中的最大值对应的聚类类别中的数据均为异常数据,确定电力计量终端存在异常。

计算机设备判断得到的隶属度矩阵中的最大值与预设异常阈值之间的关系。若隶属度矩阵中的最大值大于或者等于预设异常阈值,则说明隶属度矩阵中的最大值对应的聚类类别中的数据均为异常数据,从而确定电力计量终端存在异常;若隶属度矩阵中的最大值小于预设异常阈值,则说明隶属度矩阵中的最大值对应的聚类列别中的数据不是异常数据,从而可以确定电力计量终端不存在异常。预设异常阈值可是是由工作人员根据实际情况设置的值。在一个可选的实施例中,将根据电力计量终端异常检测方法得到结果与获取的现场检查的结果进行对比,更新预设异常阈值,这样可以提高异常检测准确度。

请参见图3,在一个实施例中,步骤200“基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵”的一种可能的实现方式包括:

步骤210、将多个目标数据集转换为目标数据矩阵,并计算目标数据矩阵的协方差矩阵。

多个目标数据集可以表示X={x

步骤220、计算目标数据矩阵的协方差矩阵的多个特征值和多个特征向量。

计算机设备在得到目标数据矩阵的协方差矩阵后,计算该协方差矩阵的特征值和相对应的特征向量。本实施例对计算协方差矩阵的特征值和特征向量的具体过程不作限制。假设,目标数据矩阵的协方差矩阵的特征值可以表示为λ

步骤230、根据多个特征值、多个特征向量和目标数据矩阵,确定主成分矩阵。

计算机设备根据计算得到的多个特征值、多个特征向量和目标数据矩阵,可以确定主成分矩阵。在一个实施例中,具体的确定方法如图4所示,方法步骤包括:

步骤231、获取多个特征值的累加总和。

计算机设备通过协方差矩阵可以得到多个特征值,将该多个特征值累加,可以表示为

步骤232、将多个特征值降序排列,得到特征值序列。

计算机设备将得到的多个特征值从大到小依次排列,得到特征值序列,特征值序列可以表示为{λ

步骤233、从大到小依次选取特征值序列中的特征值进行累加,并计算累加后的和与多个特征值的累加总和的比值。

步骤234、若比值大于或等于预设比值阈值,则将选取的多个特征值均作为主特征值。

计算机设备第一次选择特征值序列中的第一个特征值,计算第一个特征值与多个特征值的累加总和的比值η,可以表示为

预设比值阈值可以是工作人员根据实际情况设置的值。在一个可选的实施例中,工作人员根据主成分碎石检测调整预设比值阈值。通过主成分碎石检测绘制特征值与主成分数图形,该图形可以清晰的展示图形弯曲的状况。获取图形变化最大处以上的主成分的比值与预设比值阈值进行对比,将其中最大的值作为新的预设比值阈值。

步骤235、根据主特征值对应的特征向量和目标数据矩阵,确定主成分矩阵。

计算机设备根据确定的主特征值确定主特征值对应的特征向量。特征向量的数量与特征值的数量相同。则k个特征值对应的特征向量可以表示为U=[μ

在本实施例中,由于电力计量终端涵盖着发、输、变、配和用电的各个环节,获取到的目标数据集数量较多。通过主成分分析法,将多个目标数据集进行降维处理,可以提取目标数据集中主要的数据,便于后续的计算,从而可以提高后续计算效率。

请参见图5,在一个实施例中,步骤300“计算主成分矩阵中的每行元素之间的加权距离”的一种可能的实现方式包括:

步骤310、计算主成分矩阵的多个特征值。

步骤320、计算每个特征值的权值贡献值。

根据上述实施例的计算,可以得到成分矩阵的多个特征值。每个特征值的权重贡献值为每个特征值与主成分矩阵的多个特征值的和的比值。每个特征值的权值贡献值可以表示为

步骤330、根据每个特征值的权值贡献值和主成分矩阵,计算主成分矩阵中每行元素之间的加权距离。

计算机设备根据计算得到的每个特征值的权值贡献值和主成分矩阵,计算主成分矩阵中每行元素之间的加权距离。具体的,主成分矩阵中每行元素之间的加权距离可以表示为

请参见图6,在一个实施例中,步骤400“基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵”的一种可能的实现方式包括:

步骤410、获取初始聚类类别数和初始聚类中心。

初始聚类类别数可以是由工作人员根据经验设置并存储在计算机设备的存储器中的。初始聚类中心是在主成分矩阵中的每行元素中选取的。计算机设备在进行聚类分析时,直接在存储器中获取初始聚类类别数和初始聚类中心。本实施例对获取初始聚类类别数和初始聚类中心的方法不作任何限制,只要能够实现其功能即可。

步骤420、基于模糊C均值聚类算法,根据初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵对应的隶属度矩阵。

计算机设备基于模糊C均值聚类算法的具体聚类过程,可以根据初始聚类类别数、初始聚类中心和加权距离,计算得到主成分矩阵中每行元素的隶属度矩阵。具体的,假设,初始聚类类别数为G(2

步骤430、根据隶属度矩阵,更新初始聚类中心,得到新的聚类中心。

步骤440、计算新的聚类中心与初始聚类中心之间差值的绝对值。

计算机设备根据隶属度矩阵通过计算可以得到新得初始聚类中心,具体的公式为

步骤450、若绝对值大于或等于预设误差阈值,则将新的聚类中心作为初始聚类中心,返回执行步骤420至步骤450。

计算机设备对绝对值与预设误差阈值进行对比,若绝对值大于或等于预设误差阈值,则说明此时的隶属度矩阵并不是最优的,则将计算得到的新的聚类中心作为初始聚类中心返回执行步骤420至步骤450;若绝对值小于预设误差阈值,则说明此时的隶属度矩阵是最优的,从而可以得到主成分矩阵对应的隶属度矩阵。

在本实施例中,在计算主成分矩阵中每行元素之间的距离时,考虑了每个特征值的权值贡献值,使得使用计算得到的加权距离对主成分矩阵中的每行元素的分类效果较好。

请参见图7,在一个实施例中,步骤100“获取电力计量终端的多个目标数据集”一种可能的实现方式包括:

步骤110、获取电力计量终端的多个初始数据集。

步骤120、将多个初始数据集中非数值型数据量化为数值型数据,并对多个初始数据集中的数据进行补充或删除处理,得到多个预处理数据集。

每个初始数据集均为可以反映电力计量终端状态特征的数据。初始数据集是获取的电力计量终端的未处理过的数据集。本实施例对获取多个初始数据集的方法不作任何限制,只要能够实现其功能即可。由于可以反映电力计量终端状态特征的数据中会存在非数值型数据。例如,电力计量终端的综合分析能力是工作人员对电力计量终端的分析能力的判断,是非数值型数据。通过对电力计量终端的分析能力进行量化,可以得到数值型数据。并且计算机设备在每个初始数据集中存在冗余的数据时,对冗余的数据进行删除处理;在每个初始数据集中存在缺失的数据时,对数据进行补充处理,最终可以得到多个预处理数据集。本实施例对每个初始数据集进行量化、删除和补充的具体过程不作任何限制,只要能够实现其功能即可。

步骤130、对多个预处理数据集进行归一化处理,得到多个目标数据集。

计算机设备对每个预处理数据进行归一化处理,可以将有量纲的数据,经过变化,转换为无量纲的数据。并且可以将每个预处理数据集中的数据映射到为0至1之间,最终得到多个目标数据集。这样后续对目标数据集进行计算时非常简单方便,从而可以提高对电力计量终端异常检测的效率。

应该理解的是,虽然图中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

请参见图8,本申请一个实施例提供一种电力计量终端异常检测装置10,包括获取模块100、确定模块100、计算模块300和判断模块400。其中,

获取模块100用于获取电力计量终端的多个目标数据集,其中,每个目标数据集包括电力计量终端的多个数据;

确定模块200用于基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵;

计算模块300用于计算主成分矩阵中的每行元素之间的加权距离;

确定模块200还用于基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵;

判断模块400用于根据隶属度矩阵判断电力计量终端是否存在异常。

在一个实施例中,判断矩阵400具体用于获取隶属度矩阵中的最大值;若隶属度矩阵中的最大值大于或等于预设异常阈值,则隶属度矩阵中的最大值对应的聚类类别中的数据均为异常数据,确定电力计量终端存在异常。

在一个实施例中,计算模块300具体用于计算主成分矩阵的多个特征值;计算每个特征值的权值贡献值;根据每个特征值的权值贡献值和主成分矩阵,计算主成分矩阵中每行元素之间的加权距离。

在一个实施例中,确定模块200具体用于获取初始聚类类别数和初始聚类中心;基于模糊C均值聚类算法,根据初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵中的每行元素的隶属度矩阵;根据隶属度矩阵,更新初始聚类中心,得到新的聚类中心;计算新的聚类中心与初始聚类中心之间差值的绝对值;若绝对值大于或等于预设误差阈值,则将新的聚类中心作为初始聚类中心,返回执行根据初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵对应的隶属度矩阵的步骤。

在一个实施例中,确定模块200具体还用于将多个目标数据集转换为目标数据矩阵,并计算目标数据矩阵的协方差矩阵;计算目标数据矩阵的协方差矩阵的多个特征值和多个特征向量;根据多个特征值、多个特征向量和目标数据矩阵,确定主成分矩阵。

在一个实施例中,确定模块200具体还用于获取多个特征值的累加总和;将多个特征值降序排列,得到特征值序列;从大到小依次选取特征值序列中的特征值进行累加,并计算累加后的和与多个特征值的累加总和的比值;若比值大于或等于预设比值阈值,则将选取的多个特征值均作为主特征值;根据主特征值对应的特征向量和目标数据矩阵,确定主成分矩阵。

在一个实施例中,获取模块100具体用于获取电力计量终端的多个初始数据集;将多个初始数据集中非数值型数据量化为数值型数据,并对多个初始数据集中的数据进行补充或删除处理,得到多个预处理数据集;对多个预处理数据集进行归一化处理,得到多个目标数据集。

关于上述电力计量终端异常检测装置10的具体限定可以参见上文中对于电力计量终端异常检测方法的限定,在此不在赘述。电力计量终端异常检测装置10中的各个模块可以全部或部分通过软件、硬件及其组合来实现。上述各装置、各模块或者各单元可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个装置或模块对应的操作。

请参见图9,在一个实施例中,提供了一种计算机设备,计算机设备可以是服务器,其内部结构图可以如图9所示。计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,计算机设备的处理器用于提供计算和控制能力。计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。计算机设备的数据库用于存储目标数据集合初始数据集等。计算机设备的网络接口用于与外部的终端通过网络连接通信。计算机设备被处理器执行时以实现一种电力计量终端异常检测方法。

本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现以下步骤:

获取电力计量终端的多个目标数据集,其中,每个目标数据集包括电力计量终端的多个数据;

基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵;

计算主成分矩阵中的每行元素之间的加权距离;

基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵;

根据隶属度矩阵判断电力计量终端是否存在异常。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取隶属度矩阵中的最大值;若隶属度矩阵中的最大值大于或等于预设异常阈值,则隶属度矩阵中的最大值对应的聚类类别中的数据均为异常数据,确定电力计量终端存在异常。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算主成分矩阵的多个特征值;计算每个特征值的权值贡献值;根据每个特征值的权值贡献值和主成分矩阵,计算主成分矩阵中每行元素之间的加权距离。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取初始聚类类别数和初始聚类中心;基于模糊C均值聚类算法,根据初始聚类类别数、初始聚类中心和所述加权距离,确定主成分矩阵中的每行元素的隶属度矩阵;根据隶属度矩阵,更新初始聚类中心,得到新的聚类中心;计算新的聚类中心与初始聚类中心之间差值的绝对值;若绝对值大于或等于预设误差阈值,则将新的聚类中心作为初始聚类中心,返回执行根据所述初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵对应的隶属度矩阵的步骤。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:将多个目标数据集转换为目标数据矩阵,并计算目标数据矩阵的协方差矩阵;计算目标数据矩阵的协方差矩阵的多个特征值和多个特征向量;根据多个特征值、多个特征向量和目标数据矩阵,确定主成分矩阵。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多个特征值的累加总和;将多个特征值降序排列,得到特征值序列;从大到小依次选取特征值序列中的特征值进行累加,并计算累加后的和与多个特征值的累加总和的比值;若比值大于或等于预设比值阈值,则将选取的多个特征值均作为主特征值;根据主特征值对应的特征向量和目标数据矩阵,确定主成分矩阵。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取电力计量终端的多个初始数据集;将多个初始数据集中非数值型数据量化为数值型数据,并对多个初始数据集中的数据进行补充或删除处理,得到多个预处理数据集;对多个预处理数据集进行归一化处理,得到多个目标数据集。

本申请一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取电力计量终端的多个目标数据集,其中,每个目标数据集包括电力计量终端的多个数据;

基于主成分分析法,对多个目标数据集进行降维处理,得到主成分矩阵;

计算主成分矩阵中的每行元素之间的加权距离;

基于模糊C均值聚类算法,根据加权距离对主成分矩阵中的每行元素进行聚类分析,得到隶属度矩阵;

根据隶属度矩阵判断电力计量终端是否存在异常。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取隶属度矩阵中的最大值;若隶属度矩阵中的最大值大于或等于预设异常阈值,则隶属度矩阵中的最大值对应的聚类类别中的数据均为异常数据,确定电力计量终端存在异常。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算主成分矩阵的多个特征值;计算每个特征值的权值贡献值;根据每个特征值的权值贡献值和主成分矩阵,计算主成分矩阵中每行元素之间的加权距离。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取初始聚类类别数和初始聚类中心;基于模糊C均值聚类算法,根据初始聚类类别数、初始聚类中心和所述加权距离,确定主成分矩阵中的每行元素的隶属度矩阵;根据隶属度矩阵,更新初始聚类中心,得到新的聚类中心;计算新的聚类中心与初始聚类中心之间差值的绝对值;若绝对值大于或等于预设误差阈值,则将新的聚类中心作为初始聚类中心,返回执行根据所述初始聚类类别数、初始聚类中心和加权距离,确定主成分矩阵对应的隶属度矩阵的步骤。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将多个目标数据集转换为目标数据矩阵,并计算目标数据矩阵的协方差矩阵;计算目标数据矩阵的协方差矩阵的多个特征值和多个特征向量;根据多个特征值、多个特征向量和目标数据矩阵,确定主成分矩阵。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个特征值的累加总和;将多个特征值降序排列,得到特征值序列;从大到小依次选取特征值序列中的特征值进行累加,并计算累加后的和与多个特征值的累加总和的比值;若比值大于或等于预设比值阈值,则将选取的多个特征值均作为主特征值;根据主特征值对应的特征向量和目标数据矩阵,确定主成分矩阵。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取电力计量终端的多个初始数据集;将多个初始数据集中非数值型数据量化为数值型数据,并对多个初始数据集中的数据进行补充或删除处理,得到多个预处理数据集;对多个预处理数据集进行归一化处理,得到多个目标数据集。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

相关技术
  • 电力计量终端异常检测方法、装置、计算机设备和介质
  • 设备异常变更的检测方法、装置、计算机可读存储介质及终端
技术分类

06120112456007