掌桥专利:专业的专利平台
掌桥专利
首页

一种日清电量异常的自动识别方法及系统

文献发布时间:2023-06-19 19:27:02


一种日清电量异常的自动识别方法及系统

技术领域

本公开属于电力营销技术领域,具体涉及一种日清电量异常的自动识别方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。

随着电网公司业务的发展和电力体制改革的进一步深入,电力营销部门所承担的核算业务越来越复杂化、多元化,涵盖了用电客户、市场化客户,分布式电源用户、统调电厂、非统调电厂等发用两侧多种类型客户的电量结算;随着市场化现货交易和购售同期的推进,使得计算周期变短,频率增高、结算时间更集中。

随着抄核自动化、智能化、精益化要求的提升,对电量审核的精准性、高效性提出了更高的要求,现有的电量审核主要存在以下问题:

(1)电量抄表数据的质量低,存在着采集失败,表码倒走、不平等现象;

(2)电量数据的审核精准度不高,需要核算员人工介入电量异常的处理,同时存在漏拦截的现象。

(3)缺乏未形成审核共享能力,档案及采集数据问题是造成电量结清通过率低的主要原因,目前抄表数据复核及电量电费审核不具备对外输出共享审核服务。

(4)缺乏基于历史数据的审核规则有效性、阈值合理性、命中率等指标综合分析,审核规则改进缺乏数据支撑。

发明内容

为了解决上述问题,本公开提出了一种日清电量异常的自动识别方法及系统,通过对用户的用电量进行每日清算,及时筛选出日清电量异常的数据,保障市场化交易的电量结算精准无误。

根据一些实施例,本公开的第一方案提供了一种日清电量异常的自动识别方法,采用如下技术方案:

一种日清电量异常的自动识别方法,包括:

获取电能表的表码计量数据;

对所获取的表码计量数据进行分析校验,完成电量异常的自动识别;

其中,在分析校验的过程中,基于配置审核规则核查所获取的表码计量数据,得到初步识别筛查数据;根据所得到的初步识别筛查数据和异常校验模型,识别核查后表码计量数据中的异常数据,实现日清电量异常的自动识别。

作为进一步的技术限定,根据电能表的所处场景,选择合适的配置审核规则,对所获取的电能表表码计量数据进行核查,初步筛查异常的表码计量数据,识别出明显异常数据,得到初步识别筛查数据,完成日清电量异常的初步识别筛查。

作为进一步的技术限定,所述配置审核规则至少包括电量突增、电量突减、抄表数据错误和表码示数前后不一致。

作为进一步的技术限定,根据所得到的初步识别筛查数据的数据特征和电能表的所处场景,选择相应的异常校验模型,根据所选择的异常校验模型和初步识别筛查数据,自动识别异常数据,完成日清电量异常的自动识别。

作为进一步的技术限定,所述异常校验模型采用3sigma异常校验模型,假设初步识别筛查数据中仅包含随机误差,对初步识别筛查数据进行计算处理得到标准偏差,通过判断所得到的标准偏差与设定的标准偏差阈值之间的关系,判断电量数据是否存在异常,实现日清电量异常的自动识别。

作为进一步的技术限定,所述异常校验模型采用BoxPlot异常校验模型,通过判断数据的离散程度和偏向程度识别数据的异常,判断初步识别筛查数据中是否存在异常数据,实现日清电量异常的自动识别。

作为进一步的技术限定,所述异常校验模型采用基于Manhattan的OPTICS聚类分析异常校验模型,对有限个相邻的初步识别筛查数据中的电量数据进行聚类,得到不同领域参数下的聚类结果,根据设定的Manhattan距离进行聚类分析,判断初步识别筛查数据中是否存在异常数据,实现日清电量异常的自动识别。

根据一些实施例,本公开的第二方案提供了一种日清电量异常的自动识别系统,采用如下技术方案:

一种日清电量异常的自动识别系统,包括:

获取模块,其被配置为获取电能表的表码计量数据;

识别模块,其被配置为对所获取的表码计量数据进行分析校验,完成电量异常的自动识别;

其中,在分析校验的过程中,基于配置审核规则核查所获取的表码计量数据,得到初步识别筛查数据;根据所得到的初步识别筛查数据和异常校验模型,识别核查后表码计量数据中的异常数据,实现日清电量异常的自动识别。

根据一些实施例,本公开的第三方案提供了一种计算机可读存储介质,采用如下技术方案:

一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的日清电量异常的自动识别方法中的步骤。

根据一些实施例,本公开的第四方案提供了一种电子设备,采用如下技术方案:

一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的日清电量异常的自动识别方法中的步骤。

与现有技术相比,本公开的有益效果为:

本公开基于校验规则和机器学习方法,针对不同情况的数据进行异常校核,避免电量异常数据影响电费结清效率,实现电量电费结清向自动化和高效化转变,大大降低了人力验收核算成本,减少电费结算时间,提升企业服务水平;基于机器学习的数据智能异常识别方法能够极大程度的提高数据准确度,提升员工核算效率,具有巨大的推广价值。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1是本公开实施例一中的日清电量异常的自动识别方法的流程图;

图2是本公开实施例一中的3sigma异常校验模型的识别结果示意图;

图3是本公开实施例一中的BoxPlot异常校验模型的识别结果示意图;

图4是本公开实施例一中的基于Manhattan的OPTICS聚类分析异常校验模型的识别结果示意图;

图5是本公开实施例二中的日清电量异常的自动识别系统的结构示意图。

具体实施方式

下面结合附图与实施例对本公开作进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在本公开中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本公开各部件或元件结构关系而确定的关系词,并非特指本公开中任一部件或元件,不能理解为对本公开的限制。

本公开中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本实公开中的具体含义,不能理解为对本公开的限制。

在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。

实施例一

本公开实施例一介绍了一种日清电量异常的自动识别方法。

本实施例通过对表码数据质量核查,提高电量结清成功率、准确率;从不同层级视角对计量表码数据进行监控分析、校验核查,及时处理计量表码异常数据,对采集工作质量进行评价分析,促进采集数据质量提升,提高了电量核算准确率。

为全面提升海量日清电量数据的准确性,推动电力公司电量核算的高效性,本实施例引入基于规则的电量校验方法和机器学习算法对异常电量进行分析校验;通过基于规则的电量校验方法,系统能够根据配置好的内置规则对数据进行快速筛查及异常识别,其优势在于处理速度快,占用电脑CPU较少,缺点是一些隐藏的异常数据难以识别;在此基础上,利用机器学习算法对电量数据进行二次异常识别,通过对历史数据拟合、聚类等分析,挖掘深层次异常电量数据。

如图1所示的一种日清电量异常的自动识别方法,包括:

获取电能表的表码计量数据;

对所获取的表码计量数据进行分析校验,完成电量异常的自动识别;

其中,在分析校验的过程中,基于配置审核规则核查所获取的表码计量数据,得到初步识别筛查数据;根据所得到的初步识别筛查数据和异常校验模型,识别核查后表码计量数据中的异常数据,实现日清电量异常的自动识别。

为实现海量日清电量异常的自动识别,需要开展采集抄表数据日校验,每日对采集数据进行总体监测分析,按日统计采集抄表及时情况、抄表数据完整情况、抄表异情况;从抄表可靠性、抄表异常两大方面进行数据的识别分析。

表码计量数据的异常检验主要从以下两个方面进行分析:

一是通过配置审核规则实现表码计量数据的初步识别筛查,即通过配置的核查规则对采集每日抄表数据进行核查,可以针对不同的条件设定不同的异动比例,快速识别明显异常数据,通过配置采集异常自动处理规则,改变现有审核结果异常直接转入人工干预的唯一异常处理方式,对表码倒转、表码示数不平、过周等异常数据配置相应的自动化处理逻辑,自动处理采集异常,减少人工干预;

二是通过建立异常校验模型,对初步筛查识别数据进行异常识别,即结合多种机器学习算法,包括3sigma异常校验、BoxPlot异常校验和聚类分析异常校验,能够结合历史数据分析当前采集数据是否存在异常,检测效果更具科学性和准确性,极大地提升了日清电量数据的质量。

作为一种或多种实施方式,通过配置核查规则对采集每日抄表数据进行核查,可以针对不同的条件设定不同的异动比例,生成当日异常清单,部分核查规则示例:

(1)电量突增,前一日24时冻结电量与上月日平均电量比较;

(2)电量突减,前一日24时冻结电量与上月日平均电量比较;

(3)抄表数据差错,出现总电量小于峰谷汇总;

(4)本月上次示数与采集示数不一致;

(5)本月本次示数与采集示数不一致;

(6)抄见需量值非抄表周期内采集需量示数最大值;

(7)需量表计编程错例日当天与前一日需量示数相等;

(8)需量冻结日异常筛查。

作为一种或多种实施方式,基于机器学习的异常校验模型有很多,异常校验模型的建立需要根据不同的数据特性和异常校验场景去选择合适的校验模型。本实施例中介绍的异常校验模型有3sigma异常校验模型、BoxPlot异常校验模型和基于Manhattan的OPTICS聚类分析异常校验模型。

(1)3sigma异常校验模型

3sigma准则又称为拉依达准则,先假设一组检测数据(电量数据)只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是异常数据,含有该误差的数据应识别为异常电量数据。

3sigma准则适用于直购电大用户现货交易日清分时电量的异常校验,当数据对象值偏离均值3倍标准差的时候,该数据合理的出现可能性小于3‰,所以可以直接认定,电量数据偏离均值±3倍标准差时,为异常日清分时电量数据,具体如图2所示。

以某用户A为例,提取用户近1个月的日清分时用电量,那么们得到一组用电量数据[q1,q2,q3,q4,q5,……,qn],对其求标准偏差,即:

标准偏差

其中,n为样本数据量。

当进行电量审核时,通过以下公式进行判断识别:

偏差值=abs(待校验日清分时用电量-电量平均值)

偏差值>3*σ时,则判断为异常数据。

2)BoxPlot异常校验

对于3sigma校验不适合的情况,可以采用BoxPlot异常检验模型,BoxPlot又称为箱形图,其绘制须使用常用的统计量,能提供有关数据位置和分散情况的关键信息,在分析数据异常分布时尤其有效。

通过箱形图,在分析数据的时候,箱形图能够有效地帮助识别数据的特征:直观地识别数据集中的异常值(查看离群点)。判断数据集的数据离散程度和偏向(观察箱子的长度,上下隔间的形状,以及胡须的长度)。

BoxPlot异常校验适用于市场化直购电用户、售电公司日电量的异常校验,以某用户A为例,考虑到用户的月度用电量一定是在一个区间内波动,其识别结果如图3所示。

(3)基于Manhattan的OPTICS聚类分析异常校验

通过聚类可以创建数据的模型,而异常点的存在可以扭曲、破坏该模型;一个对象是基于聚类的离群点,如果该对象不强属于任何簇,或者说是丢弃、远离其他簇的小簇,该对象就是异常数据。

在传统DBSCAN算法中,使用了统一的ε值,当数据密度不均匀的时候,较小的ε值,会导致较稀疏的簇中的节点密度小于预设距离,而被认为是边界点,不被用于进一步的扩展,导致聚类错误或额外分类,使得异常检测效果较差。

在本实施例中,构建基于Manhattan的OPTICS聚类算法,设置Manhattan距离,其聚类效果强于传统KMEANS和DBSCAN等算法,对于异常电量的识别具有更好的效果,提升异常检测精确度;Manhattan距离为

OPTICS是基于密度的聚类结构,能够呈现出一种特殊的顺序,该顺序所对应的聚类结构包含了每个层级的聚类的信息,并且便于分析,主要解决对输入参数敏感的问题。即选取有限个邻域参数进行聚类,能够得到不同邻域参数下的聚类结果。

现阶段日电量的异常检测是通过配置阈值来识别是否为异常值,例如针对市场化零售用户,配置校核规则,“相比上一日,日电量波动超过50%”,这种方法存在“一刀切”的问题,在异常高温、低温天气的情况下并不适用,然而通过聚类分析可以较好解决该问题,有效减少无效异常数。

基于以上思路,以某大用户为例,对该用户的日冻结电量校验,提取用户近3年的日冻结电量,得到一组用电量数据[q1,q2,q3,q4,q5,……,qn],并在这些电量中随机加入波动较大的异常数据,采用OPTICS聚类算法对日冻结电量进行聚类分析,距离函数取Manhattan距离,通过聚类分析,可准确判断异常数据信息,其识别结果如图4所示。

本实施例基于校验规则和机器学习方法,针对不同情况的数据进行异常校核,避免电量异常数据影响电费结清效率,实现电量电费结清向自动化和高效化转变,大大降低了人力验收核算成本,减少电费结算时间,提升企业服务水平;基于机器学习的数据智能异常识别方法能够极大程度的提高数据准确度,提升员工核算效率,具有巨大的推广价值。

实施例二

本公开实施例二介绍了一种日清电量异常的自动识别系统。

如图5所示的一种日清电量异常的自动识别系统,包括:

获取模块,其被配置为获取电能表的表码计量数据;

识别模块,其被配置为对所获取的表码计量数据进行分析校验,完成电量异常的自动识别;

其中,在分析校验的过程中,基于配置审核规则核查所获取的表码计量数据,得到初步识别筛查数据;根据所得到的初步识别筛查数据和异常校验模型,识别核查后表码计量数据中的异常数据,实现日清电量异常的自动识别。

详细步骤与实施例一提供的日清电量异常的自动识别方法相同,在此不再赘述。

实施例三

本公开实施例三提供了一种计算机可读存储介质。

一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例一所述的日清电量异常的自动识别方法中的步骤。

详细步骤与实施例一提供的日清电量异常的自动识别方法相同,在此不再赘述。

实施例四

本公开实施例四提供了一种电子设备。

一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例一所述的日清电量异常的自动识别方法中的步骤。

详细步骤与实施例一提供的日清电量异常的自动识别方法相同,在此不再赘述。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

相关技术
  • 一种电力用户用电量异常识别方法、装置及终端设备
  • 一种CT影像肺部异常组织的自动识别方法
  • 一种基于多阶机器学习的电量异常智能识别方法及系统
  • 一种计量自动化系统电表分时电量异常判断与修复方法
技术分类

06120115917832