掌桥专利:专业的专利平台
掌桥专利
首页

一种基于FCM算法的终端窃电检测方法、系统、设备及可读存储介质

文献发布时间:2023-06-19 13:26:15


一种基于FCM算法的终端窃电检测方法、系统、设备及可读存储介质

技术领域

本发明属于电力系统技术领域,具体涉及一种基于FCM算法的终端窃电检测方法、系统、设备及可读存储介质。

背景技术

随着社会生产生活的发展,人民的各项需求也随之变大,这其中也就需要各行各业之间相互联系,能源行业作为联系各部门的中间的纽带,起着不可或缺的作用,电力行业之尤其处于中心位置。近年来,对电能的需求变得越来越大,同时也衍生出一系列的窃电问题,如果窃电行为得不到制止,给供电公司造成的重大的经济损失的同时,也会损害电能质量和电力设备的正常运行。据有关研究,我国每年由于窃电造成的损失达到几百亿元,窃电问题也是在一直困扰着供电企业,因此研究一项先进的窃电检测技术具有重要意义。传统人工抄表的方式是抄表员每个月上门抄表,一旦发现计量装置或计量箱有异常即可及时处理。自从采用集抄系统后,抄表次数大幅度减少,给大用电客户营造了通过窃电降低生产成本的侥幸心理。

目前研究窃电方式主要有以下几种。第一,欠流法窃电。通过人为改变电流回路或者人为造成电流回路故障,使电流回路流过少量电流甚至无电流,继而达到窃电的目的。第二,移相法窃电。其原理是通过人为改变电能表的正常接线方式,使电流和电压的相位关系发生变化,从而达到窃电的目的。第三,扩差法窃电。其原理是通过改变电能表的内部结构,使性能发生变化,增大计量误差,减少计量的电能,从而达到窃电的目的。第四,借零法窃电。其原理是通过置换电能表的火线和零线,使火线和零线不能形成回路,从而停止运转。近年来,利用高新科技的窃电技术层出不穷,窃电手段也出现多元化发展和隐蔽性态势,甚至成为一整套产业化生产链。从电能表外使用高仿铅封、加装反检查继电器模块与延时电容,到电能表内焊接二极管进行半波整流、主动分断电路改变相位等,无不体现“高精尖”水平,随之而来的是更大的反窃电难度。

其中,不少供电企业采取了一定手段,但主要还是依托第三方公司,采购大量昂贵的仪器设备,并加装成套监测模块,对现行电路构架进行深度改造,以达到可监测、可管理的目的;或者建立新的防窃电信息系统,增设特有通讯信道,经过后台特定数据库处理环节,与现有供电企业的业务系统进行接口设计以达到信息与资源共享。但以上两方面,无疑增加了系统投资与运营成本,且未因地制宜,充分运用好现有的系统资源与硬件设施,造成了不必要的浪费。

发明内容

本发明的目的是提供了一种基于FCM算法的终端窃电检测方法、系统、设备及可读存储介质,所述方法采用了FCM聚类算法来实现窃电终端的检测鉴别。其中,FCM算法是一种以隶属度来确定每个数据点属于某个聚类程度的算法。因FCM聚类算法对特性比较复杂而人们又缺少认识的对象进行分类,可以有效地实施人工干预,加入人脑思维信息,使分类结果更符合客观实际,可以给出相对的最优分类结果,因而具有一定的实用性,得出的结果更加精确,因此,本发明引入FCM聚类算法对终端的用电量曲线进行聚类,基于聚类结果识别异常的用电量曲线得到窃电检测结果,提高了窃电检测的精度。

一方面,本发明提供的一种基于FCM算法的终端窃电检测方法,其包括以下步骤:

步骤1:获取待检测终端的用电量参数;

步骤2:基于所述用电量参数得到所述待检测终端的用电量曲线;

步骤3:利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类;

其中,设置聚类类别为2,一个聚类中心表征异常数据,另一个聚类中心表征正常数据;

步骤4:将异常数据的聚类中心对应簇下的待测终端的用电量数量作为窃电疑似数据。

可选地,步骤3中所述利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类的过程如下:

针对同一类用电模式的待检测终端,将待检测终端的用电量曲线与若干个所述用电模式下的全零日用电量曲线作为FCM聚类算法的输入数据;

利用FCM聚类算法进行聚类得到聚类结果。

可选地,所述FCM聚类算法中聚类中心以及隶属度矩阵的更新公示如下:

式中,第b轮更新过程中第i个聚类中心,

可选地,所述FCM聚类算法中聚类中心以及隶属度矩阵的更新迭代终止条件为:

判断相邻两次的聚类中心之间的欧式距离是否小于预设阈值,若小于,输出隶属度矩阵,并进行标准化处理得到聚类结果;否则,继续迭代更新聚类中心和隶属度矩阵。

可选地,步骤4的具体过程如下:

步骤4-1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4-2:计算步骤4-1中待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离;

步骤4-3:判断步骤4-2中马氏距离是否大于或等于预设值,若大于或等于,对应待检测终端为潜在窃电可能的终端。

在一些实现方式中,步骤4-3识别出的潜在窃电可能的终端视为窃电终端;在一些实现方式中,针对步骤4-3识别出潜在窃电可能的终端进一步研判,譬如,利用现有的一些标准或者人为去鉴别。

可选地,步骤4的具体过程如下:

步骤4.1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4.2:计算步骤4.1中待检测终端的用电量曲线与全零日用电量曲线的马氏距离1;以及计算n倍待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离2;

其中,n与0.4的差值位于预设误差范围内;

步骤4.3:判断步骤4.2中同一待检测终端的马氏距离1是否大于或等于马氏距离2,若大于或等于,对应待检测终端为潜在窃电可能的终端。

可选地,所述方法还包括:

根据窃电疑似数据统计目标区域内各个用电模式的可疑窃电用户数据/窃电用户数据,得到可疑窃电用户/窃电用户分布情况。

其中,统计分布情况后,分布结果可以用于指导后续排查或者监督范围,譬如,重点监督窃电用户多的一类终端。如何利用分布结果指导后续排查或者监督,可以根据实际应用的需求进行设置

可选地,所述方法还包括:

利用待测终端的窃电疑似数据分别计算其与同一用电模式下的全零日用电量曲线之间的马氏距离,以及同一用电模式下正常用电量曲线与全零日用电量曲线之间的马氏距离;

将马氏距离作为偏差度,并基于偏差度、待测终端容量以及功率预估窃电量。

第二方面,本发明提供的一种基于上述方法的系统,其包括:

数据获取模块,用于获取待检测终端的用电量参数;

数据预处理模块,用于基于所述用电量参数得到所述待检测终端的用电量曲线;

聚类模块,用于利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类;

其中,设置聚类类别为2,一个聚类中心表征异常数据,另一个聚类中心表征正常数据;

检测模块,用于基于异常数据对应的聚类中心,获取对应的待检测终端的用电量曲线,并判断所述待检测终端是否发生窃电。

第三方面,本发明提供一种设备,其包括:

一个或多个处理器;

存储一个或多个程序的存储器;

所述处理器调用所述存储器的程序以实现:一种基于FCM算法的终端窃电检测方法的步骤。

第四方面,本发明提供一种可读存储介质,其存储了一个或多个程序,所述程序被处理器调用以实现:一种基于FCM算法的终端窃电检测方法的步骤。

有益效果

本发明提供的一种基于FCM算法的终端窃电检测方法,其利用FCM算法实现了终端窃电的识别,其中,充分利用了FCM算法的自身优势,将其引入到窃电检测中,提高了窃电检测结果的可靠性以及准确性。其次,本发明所述方法只需要利用用电量数据进行处理,而用电量数据本身就是本领域常规监测数据,并不需要额外采购大量昂贵的设备或者监测系统来实现窃电检测,同时也无需对电路结构进行深度改造,因此,本发明所述方法在实际应用中具有较为大的发展空间。

附图说明

图1是本发明实施例提供的一种基于FCM算法的终端窃电检测方法的技术流程图;

图2是一个区域的窃电用户统计分布示意图;

图3是可疑待测终端的用电量曲线与正常用电量曲线、全零日用电量曲线的对比图。

具体实施方式

本发明提供的一种基于FCM算法的终端窃电检测方法,其目的在于利用常规监测下的用电量数据实现终端窃电监测。其中,终端(再电气化能源消费终端)可以是港口岸电、工业电锅炉、电动汽车、居民煤改电、农排灌溉等再电气化能源消费终端,应用范围广泛,促使本发明所述方法可以应用于用户终端的窃电监测,也可以应用于一个目标区域的终端窃电监测,如一个工业园。其中,本发明的核心是利用FCM聚类算法实现窃电监测,根据需下面将结合实施例对本发明做进一步的说明。

实施例1:

本实施例提供了一种基于FCM算法的终端窃电检测方法,其包括以下步骤:

步骤1:获取待检测终端的用电量参数。

其中,根据实际需求设定待检测终端,本发明对此不进行具体的限定。应当理解,不论待检测终端包含哪些,本发明依据待检测终端的用电模式进行类别划分,得到各个用电模式下的待检测终端,其中,划分标准可以是依据商用电、民用电、用电峰值、高峰时段等等确定,具体的规则是可以根据本领域的常规技术手段进行设置的。

此外,用电量数据可以是功率、电压、电流等可以表征用电量的数据。

步骤2:基于所述用电量参数得到所述待检测终端的用电量曲线。

本实施例中优选对用电量参数进行预处理,其包括但是不局限于:数据清洗、数据标准化、数据集成等现有数据处理手段,其目的在于:剔除异常值、缺失值,以及不同格式的数据标准化等,使得多个数据源的数据整合统一,可以确保电企业颗粒收回具有重要意义。

其中,用电量曲线用于表征随时间变化的用电量,本实施例中选择随时间变化的功率来表征用电量。

步骤3:利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类;

其中,设置聚类类别为2,一个聚类中心表征异常数据,另一个聚类中心表征正常数据;

本实施例中为了提高结果的可靠性,针对同一用电模式的终端,在原有获取的用电量曲线的基础上,增加5条同一用电模式下的全零日用电量曲线作为对比,其可以视为标准曲线,从而,本实施例中将同一用电模式下的终端用电量曲线以及5条全零日用电量曲线共同作为FCM聚类算法的输入数据进行聚类,得到两个聚类中心及其隶属于两个聚类中心的其他用电量曲线的聚类结果。其中,FCM聚类算法的内容如下:

首先,初始化隶属度矩阵:采用随机生成n×c个0到1之间的随机数,并使其每一行的和为1,表示每条用电量数据对不同聚类中心的隶属度和为1,n为用电量曲线的个数,c为聚类类别,本实施例中c=2。

其次,按照如下公示更新聚类中心以及隶属度矩阵;

式中,第b轮更新过程中第i个聚类中心,

然后,判断是否达到更新迭代终止条件,若达到,输出隶属度矩阵,并进行标准化处理得到聚类结果,即标准化隶属度矩阵U过程,u

其中,以相邻两次的聚类中之间的欧式距离是否小于预设阈值A为更新迭代终止条件,若小于,视为满足;否则,视为不满足。本实施例的预设阈值A取值为经验值。

应当理解,其他可行的实施例中,可以对更新迭代终止条件进行适应性调整;且其他可行的实施例中,也可以选择加入其他数量的全零日用电量曲线或者不加入全零日用电量曲线,本发明对此不进行具体的限定。

步骤4:异常数据的聚类中心对应簇下的待测终端的用电量数量作为窃电疑似数据。

在一些实现方式中,选择将异常数据对应的聚类中心对应簇下的终端的用电量数据作为窃电疑似数据,对应终端均视为潜在窃电可能的终端,可以对其数据进行检查研判(认为鉴别或者其他现有鉴别标准实现自动鉴别)。

在一些实现方式中,选择将异常数据对应的聚类中心对应簇下的终端的用电量数据作为窃电疑似数据,利用窃电疑似数据,进行如下处理:

步骤4-1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4-2:计算步骤4-1中待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离;

步骤4-3:判断步骤4-2中马氏距离是否大于或等于预设值,若大于或等于,对应待检测终端为潜在窃电可能的终端。

在一些实现方式中,选择将异常数据对应的聚类中心对应簇下的终端的用电量数据作为窃电疑似数据,利用窃电疑似数据,进行如下处理:

步骤4.1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4.2:计算步骤4.1中待检测终端的用电量曲线与全零日用电量曲线的马氏距离1;以及计算n倍待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离2;

其中,n与0.4的差值位于预设误差范围内。本实施例中n取值为0.4。

步骤4.3:判断步骤4.2中同一待检测终端的马氏距离1是否大于或等于马氏距离2,若大于或等于,对应待检测终端为潜在窃电可能的终端。

在一些实现方式中,也可以直接跳过马氏距离计算以及研判,直接视FCM聚类结果中异常数据下的终端视为发生了窃电行为的终端,应当理解,其检测效果以及可靠性远低于前两者。

此外,为了丰富后续窃电监督以及其他功能应用,本发明所述方法还包括:

根据窃电疑似数据统计目标区域内各个用电模式的可疑窃电用户数据/窃电用户数据,得到可疑窃电用户/窃电用户分布情况。如图2所示,在目标区域随机选取1000个用户终端进行统计,基于统计结果,后续可以重点监督大工业区的窃电情况。

为了预计窃电量,本发明所述方法还包括:

利用待测终端的窃电疑似数据分别计算其与同一用电模式下的全零日用电量曲线之间的马氏距离,以及同一用电模式下正常用电量曲线与全零日用电量曲线之间的马氏距离;

将马氏距离作为偏差度,并基于偏差度、待测终端容量以及功率预估窃电量。

如图3所示可以看出用电量的偏差情况,进而基于偏差度、待测终端容量以及功率预估窃电量,以供后续相关应用。

实施例2:

本实施例在所述终端窃电检测方法的基础上,提供一种终端窃电检测系统,其包括:

数据获取模块,用于获取待检测终端的用电量参数;

数据预处理模块,用于基于所述用电量参数得到所述待检测终端的用电量曲线;

聚类模块,用于利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类;

其中,设置聚类类别为2,一个聚类中心表征异常数据,另一个聚类中心表征正常数据;

检测模块,用于将异常数据的聚类中心对应簇下的待测终端的用电量数量作为窃电疑似数据并进行检查。

在一些实现方式中,检测模块选择将隶属于异常数据对应的聚类中心的终端均视为潜在窃电可能的终端,可以对其数据进行检查研判。

在一些实现方式中,检测模块选择将异常数据对应的聚类中心对应簇下的终端的用电量数据作为窃电疑似数据,利用窃电疑似数据进行步骤4-1至步骤4-3的处理或者进行步骤4.1至步骤4.3的处理。具体的,检查模块包括:获取单元、计算单元、鉴别单元。

其中,获取单元用于获取异常数据的聚类中心对应簇下的待测终端的用电量曲线。

计算单元用于计算获取单元获取的待检测终端的用电量曲线与全零日用电量曲线的马氏距离1;以及计算n倍待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离2。

鉴别单元用于判断同一待检测终端的马氏距离1是否大于或等于马氏距离2,若大于或等于,对应待检测终端为潜在窃电可能的终端。

或者:

获取单元用于获取异常数据的聚类中心对应簇下的待测终端的用电量曲线。

计算单元用于计算获取单元获取的待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离。

鉴别单元用于判断计算单元计算出的马氏距离是否大于预设阈值,若大于,对应待检测终端为潜在窃电可能的终端。

在一些实现方式中,检测模块选择直接跳过马氏距离计算以及研判,直接视FCM聚类结果中异常数据下的终端视为发生了窃电行为的终端,应当理解,其检测效果以及可靠性远低于前两者。

其中,各个单元模块的具体实现过程请参照前述方法的对应过程。应当理解,上述单元模块的具体实现过程参照方法内容,本发明在此不进行具体的赘述,且上述功能模块单元的划分仅仅是一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。同时,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

实施例3:

本实施例提供一种设备,其包括:

一个或多个处理器;

存储一个或多个程序的存储器;

所述处理器调用所述存储器的程序以实现:一种基于FCM算法的终端窃电检测方法的步骤。

具体如下:

步骤1:获取待检测终端的用电量参数。

步骤2:基于所述用电量参数得到所述待检测终端的用电量曲线。

步骤3:利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类;

步骤4:将异常数据的聚类中心对应簇下的待测终端的用电量数量作为窃电疑似数据。

在一些实现方式中,所述处理器调用所述存储器的程序还执行:

利用窃电疑似数据,进行如下处理:

步骤4-1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4-2:计算步骤4-1中待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离;

步骤4-3:判断步骤4-2中马氏距离是否大于或等于预设值,若大于或等于,对应待检测终端为潜在窃电可能的终端。

在一些实现方式中,所述处理器调用所述存储器的程序还执行:

利用窃电疑似数据,进行如下处理:

步骤4.1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4.2:计算步骤4.1中待检测终端的用电量曲线与全零日用电量曲线的马氏距离1;以及计算n倍待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离2;

其中,n与0.4的差值位于预设误差范围内;

步骤4.3:判断步骤4.2中同一待检测终端的马氏距离1是否大于或等于马氏距离2,若大于或等于,对应待检测终端为潜在窃电可能的终端。

该设备还包括:通信接口,用于与外界设备进行通信,进行数据交互传输。

其中,存储器可能包含高速RAM存储器,也可能还包括非易失性除颤器,例如至少一个磁盘存储器。

如果存储器、处理器和通信接口独立实现,则存储器、处理器和通信接口可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构总线,外部设备互联总线或扩展工业标准体系结构总线等。所述总线可以分为地址总线、数据总线、控制总线等。

可选的,在具体实现上,如果存储器、处理器和通信接口集成在一块芯片上,则存储器、处理器即通信接口可以通过内部接口完成相互之间的通信。

各个步骤的具体实现过程请参照前述方法的阐述。

应当理解,在本发明实施例中,所称处理器可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。

实施例4:

本实施例提供一种可读存储介质,其存储了一个或多个程序,所述程序被处理器调用以实现:一种基于FCM算法的终端窃电检测方法的步骤。

具体如下:

步骤1:获取待检测终端的用电量参数。

步骤2:基于所述用电量参数得到所述待检测终端的用电量曲线。

步骤3:利用FCM聚类算法对同一用电模式的待检测终端的用电量曲线进行聚类;

步骤4:将异常数据的聚类中心对应簇下的待测终端的用电量数量作为窃电疑似数据。

在一些实现方式中,所述处理器调用所述存储器的程序还执行:

利用窃电疑似数据,进行如下处理:

步骤4-1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4-2:计算步骤4-1中待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离;

步骤4-3:判断步骤4-2中马氏距离是否大于或等于预设值,若大于或等于,对应待检测终端为潜在窃电可能的终端。

在一些实现方式中,所述处理器调用所述存储器的程序还执行:

利用窃电疑似数据,进行如下处理:

步骤4.1:获取异常数据的聚类中心对应簇下的待测终端的用电量曲线;

步骤4.2:计算步骤4.1中待检测终端的用电量曲线与全零日用电量曲线的马氏距离1;以及计算n倍待检测终端的用电量曲线与同一用电模式下的正常用电量曲线的马氏距离2;

其中,n与0.4的差值位于预设误差范围内;

步骤4.3:判断步骤4.2中同一待检测终端的马氏距离1是否大于或等于马氏距离2,若大于或等于,对应待检测终端为潜在窃电可能的终端。

各个步骤的具体实现过程请参照前述方法的阐述。

所述可读存储介质为计算机可读存储介质,其可以是前述任一实施例所述的控制器的内部存储单元,例如控制器的硬盘或内存。所述可读存储介质也可以是所述控制器的外部存储设备,例如所述控制器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述可读存储介质还可以既包括所述控制器的内部存储单元也包括外部存储设备。所述可读存储介质用于存储所述计算机程序以及所述控制器所需的其他程序和数据。所述可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要强调的是,本发明所述的实例是说明性的,而不是限定性的,因此本发明不限于具体实施方式中所述的实例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,不脱离本发明宗旨和范围的,不论是修改还是替换,同样属于本发明的保护范围。

相关技术
  • 一种基于FCM算法的终端窃电检测方法、系统、设备及可读存储介质
  • 窃电行为检测方法、系统、终端设备及存储介质
技术分类

06120113677678