掌桥专利:专业的专利平台
掌桥专利
首页

智能电表故障多目标分类方法、存储介质及设备

文献发布时间:2023-06-19 18:34:06


智能电表故障多目标分类方法、存储介质及设备

技术领域

本发明涉及电能计量分析技术领域,尤其涉及一种智能电表故障多目标分类方法、存储介质及设备。

背景技术

近些年来,随着计量自动化系统的深入应用,工作人员可以通过系统后台获得智能电表的运行数据,供电企业对于智能电表数据的管理有了更高的需求。但目前针对大量的智能电表运行数据,缺少程序化的运维手段,容易造成诊断不准确或者误诊断的情况,例如一些错误接线长时间没有发现,计量装置长时间带病运行,进而导致退补电量计算纠纷事件的发生,难以满足计量精益化管理需求。

现有技术中,只能反映运行数据的单一异常情况,例如,是过电压、失压、断相、负电流或者功率因数异常等问题,不能给出更多有用信息。现在的计量自动化系统产生的数据量庞大,再加上计量运维人员日常处理工作量大,仅仅通过单一的异常情况,计量运维人员是不能准确及时地发现计量装置“带病”运行的情况,或存在错误接线的情况。计量运维人员无法快速在大量的数据中快速定位问题,不能为现场运维工作提供精细化的支撑指导,从而无法保证供电企业的工作效率和工作质量。不利于推进计量数据监督与分析系统建设。

发明内容

基于此,有必要针对上述问题,提出了一种智能电表故障多目标分类方法、存储介质及设备。

一种智能电表故障多目标分类方法,方法包括:

获取智能电表的历史运行数据,历史运行数据包括多种故障;

根据历史运行数据得到第一训练集,第一训练集包括多个第一分类故障标签;

根据第一训练集对初始模型进行训练得到第一目标模型;

根据第一训练集和第一目标模型得到第二训练集,第二训练集包括多个第二分类故障标签,每一个第二分类故障标签对应多个第一分类故障标签;

根据第一训练集和第二训练集对第一目标模型进行训练得到第二目标模型;以及,

将电表的待测试数据输入第二目标模型得到故障分类结果。

可选地,在获取智能电表的历史运行数据之后,还包括:

筛选出历史运行数据中的异常数据、重复数据和缺失数据;以及,

删除与异常数据、重复数据和缺失数据关联的数据。

可选地,历史运行数据为连续数据,根据历史运行数据得到第一训练集,具体包括:

根据多种故障得到多个第一分类故障标签;

根据随机森林模型对历史运行数据进行离散化得到多个第一训练数据;以及,

将第一训练数据与第一分类故障标签进行匹配得到第一训练集。

可选地,根据第一训练集和第一目标模型得到第二训练集,具体包括:

将第一训练集输入第一目标模型得到多个第一分类故障预测标签;以及,

将多个第一分类故障预测标签与第二分类故障标签进行关联得到第二训练集。

可选地,根据C4.5算法对历史运行数据进行离散化得到多个第一训练数据。

可选地,根据C4.5算法对历史运行数据进行离散化得到多个第一训练数据,具体包括:

从历史运行数据中获取多个历史数据;

给历史数据添加预设的标签,并根据预设的标签对多个历史数据进行处理得到分裂阈值;

根据分裂阈值得到决策树模型;以及,

根据决策树模型和多个历史数据得到多个第一训练数据。

可选地,在将电表的待测试数据输入第二目标模型得到故障分类结果之前,还包括:

将第二训练集转化为第二测试集;

将第二测试集输入第二目标模型,得到第二预测结果集;

根据第二测试集和第二预测结果集得到第二目标模型的准确度;以及,

当准确度到达预设值时,得到第二目标模型。

可选地,方法还包括:

获取智能电表的当前运行数据;以及,

根据当前运行数据更新第二目标模型。

一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如上述中方法的步骤。

一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如上述中任一项方法的步骤。

采用本发明实施例,具有如下有益效果:获取智能电表的历史运行数据,历史运行数据包括多种故障,根据历史运行数据得到第一训练集,第一训练集包括多个第一分类故障标签;根据第一训练集对初始模型进行训练得到第一目标模型。在本发明中,通过第一训练集中包含的数据得到智能电表中单一异常情况,单一异常情况包含了过电压、负电流以及功率因数异常等情况。根据第一训练集和第一目标模型得到第二训练集,第二训练集包括多个第二分类故障标签,每一个第二分类故障标签对应多个第一分类故障标签;根据第一训练集和第二训练集对第一目标模型进行训练得到第二目标模型;将电表的待测试数据输入第二目标模型得到故障分类结果。然后通过根据多个单一的异常情况找出智能电表实际存在的问题,例如,计量装置“带病”运行的情况,以及存在错误接线的情况。从而从多个维度发现问题。本发明能够快速在大量的数据中快速定位问题,同时为现场运维工作提供精细化的支撑指导,从而保证供电企业的工作效率和工作质量,实现推进计量数据监督与分析系统建设的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

其中:

图1为本发明第一个实施例中智能电表故障多目标分类方法的流程图;

图2为本发明第二个实施例中智能电表故障多目标分类方法的流程图;

图3为本发明第一个实施例中步骤S102的流程图;

图4为本发明第一个实施例中步骤S104的流程图;

图5为本发明第一个实施例中步骤S1022的流程图;

图6为本发明第三个实施例中智能电表故障多目标分类方法的流程图;

图7为本发明第四个实施例中智能电表故障多目标分类方法的流程图;

图8为本发明第一个实施例中计算机设备的内部结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请结合参看图1,其为本发明第一个实施例中智能电表故障多目标分类方法的流程图。其中,本发明实施例提供的智能电表故障多目标分类方法具体包括下面步骤。

步骤S101,获取智能电表的历史运行数据,历史运行数据包括多种故障。在本实施例中,智能电表运行历史运行数据包括表计资产编号、档案数据、计量点接线方式、正向有功总、正向无功总、反向有功总、反向无功总、有功功率(总、A、B、C相)、无功功率(总、A、B、C相)、功率因数(总、A、B、C相)、电压(A、B、C相)、电流(A、B、C相)等数据,历史运行数据中有一些是离散的有一些是连续的。

步骤S102,根据历史运行数据得到第一训练集,第一训练集包括多个第一分类故障标签。在本实施例中,第一分类故障标签包括过电压、负电流以及功率因数异常等情况。为异常数据添加第一分类故障标签,得到第一训练集。

步骤S103,根据第一训练集对初始模型进行训练得到第一目标模型。具体地,利用第一训练集对初始的随机森林模型进行训练得到第一目标模型。其中,随机森林(RandomForest)是一种经典的Bagging模型,其弱学习器为决策树模型。随机森林模型会在原始数据集中随机抽样,构成n个不同的样本数据集,然后根据这些数据集搭建n个不同的决策树模型,最后根据这些决策树模型的平均值或者投票情况来获取最终结果。

步骤S104,根据第一训练集和第一目标模型得到第二训练集,第二训练集包括多个第二分类故障标签,每一个第二分类故障标签对应多个第一分类故障标签。在本实施例中,多目标分类包括第一分类故障标签和第二分类故障标签,且多目标分类结果并不采用独立单个目标的分类,独立单个目标分类会忽略目标之间的关系,影响整个分类结果的质量,在本方法随机森林的机器学习过程中,保留分类目标之间的关联性,模型构建的第一阶段,将训练集数据n组数据

步骤S105,根据第一训练集和第二训练集对第一目标模型进行训练得到第二目标模型。具体地,多类目分类的预测结果包括多个维度的标签,将第一训练集和第二训练集输入第一目标模型进行训练得到具有多类目分类功能的第二目标模型。

步骤S106,将电表的待测试数据输入第二目标模型得到故障分类结果。具体地,故障分类结果为该地区的异常数据项,例如,筛选得到一个高供高计用户运行数据异常,一、二元件接入电压分别为102.7V和101.4V、接入电流分别为-3.205A和2.934A、功率因数分别为-0.885、0.789、有功功率分别为-0.292kW、0.235kW,反向有功走字,分类结果为三相三线高供高计,电流互感器接线回路为-Ia、Ic。

运用本发明方法,可以根据电压、电流数据信息初步判断,再结合功率因数以及功率单独得到的相角信息等,将不同数据得到的结果再次联合判断,关联其中结果信息,最终可以判别得到这组数据满足以下式(1)的关系,即电流互感器接线回路为-Ia、Ic,为错误接线。

其中,P为电表的有功功率,U

采用本发明实施例,通过第一训练集中包含的数据得到智能电表中单一异常情况,单一异常情况包含了过电压、负电流以及功率因数异常等情况。然后通过根据多个单一的异常情况找出智能电表实际存在的问题,例如,计量装置“带病”运行的情况,以及存在错误接线的情况。从而从多个维度发现问题。本发明能够快速在大量的数据中快速定位问题,同时为现场运维工作提供精细化的支撑指导,从而保证供电企业的工作效率和工作质量,实现推进计量数据监督与分析系统建设的效果。

请结合参看图2,其为本发明第二个实施例中智能电表故障多目标分类方法的子流程图。第二实施例提供的智能电表故障多目标分类方法与第一实施例提供的智能电表故障多目标分类方法的差异在于在获取智能电表的历史运行数据之后,第二实施例提供的智能电表故障多目标分类方法还包括下面步骤。

步骤S201,筛选出历史运行数据中的异常数据、重复数据和缺失数据。

步骤S202,删除与异常数据、重复数据和缺失数据关联的数据。

具体地,在数据采集过程中可能会遇到一些电压值高于实际存在的情况,和因为数据传输问题导致的重复和缺失,在本实施例中,剔除基础数据库中的重复、缺失以及异常数据项,处理后的数据分为训练集以及测试集以及验证集。直接删除上述存在异常的数据,减少异常数据对数据分析带来的影响。

请结合参看图3,其为本发明第一个实施例中步骤S102的流程图。其中,历史运行数据为连续数据,步骤S102,根据历史运行数据得到第一训练集,具体包括下面步骤。

步骤S1021,根据多种故障得到多个第一分类故障标签。其中,第一分类故障标签包括过电压、失压、断相、电流为负、电流为零、功率因数异常(分相及总功率因数为负、过低等)、有功反走等。

步骤S1022,根据随机森林模型对历史运行数据进行离散化得到多个第一训练数据。进一步地,根据C4.5算法对历史运行数据进行离散化得到多个第一训练数据。C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的。在本实施例中,C4.5算法也可以用于统计分类。

步骤S1023,将第一训练数据与第一分类故障标签进行匹配得到第一训练集。在本实施例中,利用第一训练数据与第一分类故障标签进行匹配,增加了多类目之间的联系,使得多类目分类的训练效果更加接近实际的结果。

请结合参看图4,其为本发明第一个实施例中步骤S104的流程图。其中,步骤S104,根据第一训练集和第一目标模型得到第二训练集,具体包括下面步骤。

步骤S1041,将第一训练集输入第一目标模型得到多个第一分类故障预测标签。

步骤S1042,将多个第一分类故障预测标签与第二分类故障标签进行关联得到第二训练集。

上述实施例,根据第一目标模型得到多个第一分类故障预测标签,将多个第一分类故障预测标签与第二分类故障标签进行关联得到第二训练集。能够解决智能电表分类无法实现多目标分类的不足的问题,实现对计量自动化电能量大数据的故障的多层次分类,从单一的过电压、负电流以及功率因数异等单一数据发现的问题,进而发现导致当前问题产生的更进一步的问题,准确的定位点智能电表的问题。

请结合参看图5,其为本发明第一个实施例中步骤S1022的流程图。其中,步骤S1022,根据随机森林模型对历史运行数据进行离散化得到多个第一训练数据,具体包括下面步骤。在本实施例中。C4.5算法用于统计分类。

步骤S501,从历史运行数据中获取多个历史数据。在本实施例中,C4.5算法将连续属性离散化的过程:设连续属性A的值为{g

其中,T为划分点。进一步地,在划分点集合T中选择最优划分点,计算公式为:

其中,Gain(S,A)为训练集S中属性A的信息增益,Entropy代表对应的信息熵,

得到连续属性数据离散化的划分点(共k个)后,通过计算分裂信息以及信息增益率,完成决策树的构成,计算公式如下:

其中,GainRatio(S,A)、Gain(S,A)、SplitInformation(S,A)分别为训练集S中属性A的信息增益率、信息增益以及分裂信息,|S

步骤S502,给历史数据添加预设的标签,并根据预设的标签对多个历史数据进行处理得到分裂阈值,具体地,作为相邻数据g

步骤S503,根据分裂阈值得到决策树模型。具体地,基于粒子群寻优算法对随机森林中的每一颗决策树中连续数据的分支阈值进行更新,将该阶段决策树连续属性分裂节点阈值作为粒子群算法的初始种群参数,满足公式(8)的约束条件,即连续属性的离散划分点任位于相邻数据gi、g

其中,

步骤S504,根据决策树模型和多个历史数据得到多个第一训练数据。在本实施例中,Pright为测试集中分类正确的样本数,Pall为测试集样本总数。根据Pright和Pall得到多个第一训练数据。进一步地,设置预测目标之间关系的权重,加快模型计算速度。

请结合参看图6,其为本发明第三个实施例中智能电表故障多目标分类方法的子流程图。第三实施例提供的智能电表故障多目标分类方法与第一实施例提供的智能电表故障多目标分类方法的差异在于在将电表的待测试数据输入第二目标模型得到故障分类结果之前,第三实施例提供的智能电表故障多目标分类方法还包括下面步骤。

步骤S601,将第二训练集转化为第二测试集。

步骤S602,将第二测试集输入第二目标模型,得到第二预测结果集。

步骤S603,根据第二测试集和第二预测结果集得到第二目标模型的准确度。

步骤S604,当准确度到达预设值时,得到第二目标模型。

上述实施例中,用第二测试集检测第二目标模型的分类能力,根据第二测试集和第二预测结果集得到第二目标模型的准确度也就是第二目标模型的分类能力,当第二目标模型的分类能力达到预设的标准时,直接将第二目标模型进行使用,去分析智能电表的数据,当第二目标模型的分类能力没有达到预设的标准时,添加新的训练样本或者是增加训练次数,以提高第二目标模型的准确度。

请结合参看图7,其为本发明第四个实施例中智能电表故障多目标分类方法的子流程图。第四实施例提供的智能电表故障多目标分类方法还包括下面步骤。

步骤S701,获取智能电表的当前运行数据。

步骤S702,根据当前运行数据更新第二目标模型。

在本实施例中,智能电表的运行数据是不断产生的,将新产生的数据转化为训练样本,训练第二目标模型,使得第二目标模型的分析更加准确,从而更好的帮助工作人员定位电表问题,提升工作效率。本发明通过利用计量自动化系统的电能量大数据,采用随机森林机器学习训练模型,大大简化了计量运维人员的工作量,满足实际工作中对电能量大数据进行分析需求,实现电能表数据异常诊断分类方法,并且能够帮助计量运维人员全面、高效、准确地判断计量装置的运行状态。

从上述实例可以看出,本发明通过改进随机森林机器学习算法,实现多目标分类,并且保留了各个分类目标之间的内在关系,随机森林决策树的生成后,在保留原有决策树特性的基础上,基于粒子群寻优算法对连续属性数据离散化的划分点进行寻优,通过提高每一颗决策树的精度来提高整个模型的精度,改进随机森林多目标分类模型,可以及时发现“带病”运行的计量装置或错误接线的情况,有针对性的给出结果,能够精细化支撑供电单位的现场运维工作。

本发明实施例还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述的任一项方法的步骤。具体地,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

请结合参看图8,其为本发明第一个实施例中计算机设备的内部结构示意图。计算机设备900包括存储器910和处理器920,存储器910存储有计算机程序,计算机程序被处理器执行时,使得处理器920执行上述任一项方法的步骤。

计算机设备900还包括通过系统总线930连接的处理器920、存储器910和网络接口940。其中,存储器910包括非易失性存储介质和内存储器。该计算机设备900的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器920执行时,可使得处理器920实现智能电表故障多目标分类方法。该内存储器910中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行智能电表故障多目标分类方法。

其中,存储器910至少包括一种类型的计算机可读存储介质,该计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器910在一些实施例中可以是计算机设备900的内部存储单元,例如计算机设备900的硬盘。存储器910在另一些实施例中也可以是计算机设备900的外部存储设备,例如计算机设备900上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字卡(Secure Digital,SD),闪存卡(Flash Card)等。进一步地,存储器910还可以既包括计算机设备900的内部存储单元也包括外部存储设备。存储器910不仅可以用于存储安装于计算机设备900的应用软件及各类数据,例如智能电表故障多目标分类方法的计算机程序等,还可以用于暂时地存储已经输出或者将要输出的数据,例如智能电表故障多目标分类方法执行产生的数据等。处理器920在一些可行的实施例中可以中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

具体地,处理器920执行智能电表故障多目标分类方法的计算机程序以控制计算机设备900实现智能电表故障多目标分类方法。

进一步地,计算机设备900还可以包括系统总线930可以是外设部件互连标准总线(peripheral component interconnect,简称PCI)或扩展工业标准结构总线(extendedindustry standard architecture,简称EISA)等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

具体地,计算机设备900还可以包括网络接口940网络接口可选的可以包括有线网络接口和/或无线网络接口(如WI-FI网络接口、蓝牙网络接口等),通常用于在计算机设备900与其他设备之间建立通信连接,例如,计算机设备900与波形显示设备之间的通信连接。

在另一些可行的实施例中,计算机设备900还可以包括显示组件(图未示)。显示组件可以是LED(Light Emitting Diode,发光二极管)显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示组件也可以适当的称为显示装置或显示单元,用于显示在计算机设备900中处理的信息以及用于显示可视化的用户界面。

图8仅示出了具有组件910-940以及实现智能电表故障多目标分类方法的计算机设备900,本领域技术人员可以理解的是,图8示出的结构并不构成对计算机设备900的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。由于计算机设备900采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再赘述。

此外,根据本发明的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中部分或全部步骤的计算机程序代码指令。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 一种数字电表读数方法、装置、系统、计算机设备及存储介质
  • 智能设备的交互方法、装置、智能设备和存储介质
  • 基于智能穿戴设备的显示方法、智能穿戴设备及存储介质
  • 多目标跟踪方法、装置、设备及存储介质
  • 一种数据存储方法、系统、智能可穿戴设备及存储介质
  • 智能电表误差分类方法及系统、设备、存储介质
  • 智能电表故障确定方法、装置、计算机设备和存储介质
技术分类

06120115616623