掌桥专利:专业的专利平台
掌桥专利
首页

一种电力设备静态数据质量评估方法及系统

文献发布时间:2023-06-19 11:22:42


一种电力设备静态数据质量评估方法及系统

技术领域

本发明涉及数据质量评估的技术领域,尤其涉及一种电力设备静态数据质量评估方法及系统。

背景技术

目前,随着电力负荷的逐年增长,清洁能源利用和分布式发电技术快速发展,更多的分布式电源和非线性负荷接入配电网从而对电能质量产生影响,对电力设备的电能数据质量进行评估成为当前热门的研究话题。

由于电力设备数据本身无时无刻都在变化,其中的各项指标复杂多变。这种随机性和不确定性很难用一个确定的指标体系来描述,因此还没有一个确定的指标体系来完整地描述电能数据质量。同时电力设备数据质量评估的赋权方法多种多样,容易受主、客观因素的影响,如何获得准确的指标权重有待进一步研究。

鉴于此,如何获取更为准确的电力设备数据评估指标权重,进行电力设备数据质量的评估,成为本领域技术人员亟待解决的问题。

发明内容

本发明提供一种电力设备静态数据质量评估方法,通过利用基于机器学习混合模型的电力设备异常数据检测算法进行电力设备异常数据的检测,并利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,同时利用结合优化算法的随机森林算法进行电力设备等级的评估。

为实现上述目的,本发明提供的一种电力设备静态数据质量评估方法,包括:

获取电力设备静态数据,并计算得到电力设备静态数据质量指标;

构建多个电力设备异常数据检测子模型,利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,得到子模型检测判别结果;

根据多个子模型的检测判别结果,对错误的判别结果进行修正,得到电力设备异常数据的检测结果;

利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,得到电力设备数据质量的评估结果;

根据电力设备数据质量的评估结果,利用结合优化算法的随机森林算法进行电力设备等级的评估。

可选地,所述计算得到电力设备静态数据质量指标,包括:

所述电力设备静态数据包括电力设备电压值、频率、谐波等;

所述电力设备数据质量指标计算公式为:

1)电压偏差:

其中:

ΔU为电力设备的电压偏差;

U

U为电力设备的标称电压;

2)电压波动:

d=(U

其中:

U

d为电压波动值;

U为电力设备的标称电压;

3)频率偏差:

所述频率为正弦量在单位时间内交变的次数,其中交变的时间称为周期;

Δf=f

其中:

f

f为电力设备频率的标称值;

4)电压谐波:

其中:

U

THD

U

U

可选地,所述利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,包括:

所述LOF模型的电力设备异常数据检测流程为:

LOF模型输入包含短时间跨度电力设备当月的用电数据特征,具体的特征维度包含当月内日用电量最大值及最小值,当月内日用电量平均绝对离差、标准差、偏度、峰度,当月内日用电量排序的25%分位数、50%分位数、75%分位数,当月内日用电量变化百分比的最大值、最小值,当月内日用电量的图像特性(包括极大值点个数、极小值点个数、最长连续重复序列长度、最长连续上升序列长度、最长连续下降序列长度),以及上述指标在当月内每周的统计值,其输出则为每个电力设备数据异常与否的判别结果;

所述SVM模型的电力设备异常数据检测流程为:

SVM模型的输入为去年同期的全部正常电力设备的用电数据特征,具体的特征维度包含当月内日用电量最大值及最小值,当月内日用电量平均绝对离差、标准差、偏度、峰度,当月内日用电量排序的25%分位数、50%分位数、75%分位数,当月内日用电量变化百分比的最大值、最小值,当月内日用电量的图像特性(包括极大值点个数、极小值点个数、最长连续重复序列长度、最长连续上升序列长度、最长连续下降序列长度),以及上述指标在当月内每周的统计值,输出为记录模型对于特征数据学习状况的模型文件,在检测阶段,SVM模型的输入是当月包含相同特征维度的短时间跨度电力设备数据指标,输出为每个电力设备数据异常与否的判别结果;

所述LSTM模型的电力设备异常数据检测流程为:

LSTM模型的训练输入包含第k-1月全体正常电力设备的月用电量均值、平均绝对离差、标准差、偏度、峰度无偏标准差、无偏误差、最大用电量,以及第k月全体正常电力设备的月用电量均值,输出则为记录模型对于特征数据学习状况的模型文件;在检测阶段,LSTM模型的输入是上月包含相同特征维度的全体正常电力设备的月用电数据,输出为对当月全体正常电力设备的月用电量均值的预测,在预测得到当月正常用电电力设备的月用电量均值后,对于短时间跨度电力设备数据异常与否的判别公式如下:

其中:

正常电力设备数据标签为0,异常电力设备数据标签为1;

ρ为异常系数,将其设置为0.4;

E

E

可选地,所述根据多个子模型的检测判别结果,对错误的判别结果进行修正,包括:

根据多个子模型的检测判别结果,分别保存为记录模型对于特征数椐学习的模型文件;

在进行预测时,计箅LOF的判别结果,并调用SVM和LSTM的模型给出判定;

最终以SVM的类别判定结果为基准进行修正,若SVM判定的电力设备异常数据在LOF中密度正常,且月总用电量与LSTM所预测的电力设备用电量差距在合理范围内,则将该电力设备异常数据修正为正常设备,若SVM判断为正常电力设备数据,则无需对其进行修正,并最终输出所判别得到的所有电力设备异常数据。

可选地,所述利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,包括:

1)构建电力设备数据质量评估矩阵X,其中x

其中:

m表示电力设备静态数据质量指标的数量;

n表示电力设备的数量;

2)利用组合赋权法对不同电力设备静态数据质量指标进行赋权,所述组合赋权法的计算公式为:

其中:

w

q

σ

e

3)对x

所述效益型指标的标准化公式为:

所述成本型指标的标准化公式为:

其中:

max(x

将指标权重w

r

4)计算不同电力设备到正负理想解的加权欧式距离s

其中:

s

s

5)计算不同电力设备i到正负理想解的灰色关联度

其中:

γ为分辨系数,将其设置为0.3;

6)将加权欧式距离s

7)计算各电力设备数据质量的评估结果:

其中:

η

可选地,所述利用结合优化算法的随机森林算法进行电力设备等级的评估,包括:

所述电力设备等级共分为1、2、3、4这四个等级,其中1级为最优等级其余逐级次之,1级即代表电力设备满足特殊行业高水平的电能质量要求,2级即代表电力设备电能质量符合国家标准,3级即代表电力设备电能质量各评估指标满足国家标准规定的电能质量限值要求,4级即代表电力设备电能质量不符合国家标准;

所述结合优化算法的随机森林算法流程为:

根据训练电力设备数据集U中的数据确定随机森林综合评估模型中决策树的数目nt和属性特征的子集大小mt,其中mt≤m,m为电力设备数据质量评估指标的个数;

采用CART算法建立nt棵决策树,并选取Gini指数最小的特征变量作为最佳分裂节点;

计算模型的平均袋外误差,若此时模型的迭代次数小于预设定的最大迭代次数,则利用粒子群算法更新nt以及mt的取值,重复上述步骤,直到达到最大迭代次数,并输出最终的随机森林模型;

将电力设备的数据质量评估结果输入随机森林模型进行评估等级的决策,根据所有决策树的结果确定最终的电力设备等级。

此外,为实现上述目的,本发明还提供一种电力设备静态数据质量评估系统,所述系统包括:

电力设备数据获取装置,用于获取电力设备静态数据,并计算得到电力设备静态数据质量指标;

数据处理器,用于构建多个电力设备异常数据检测子模型,利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,得到子模型检测判别结果,并根据多个子模型的检测判别结果,对错误的判别结果进行修正,得到电力设备异常数据的检测结果;

数据质量评估装置,用于利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,得到电力设备数据质量的评估结果,从而利用结合优化算法的随机森林算法进行电力设备等级的评估。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有电力设备数据质量评估程序指令,所述电力设备数据质量评估程序指令可被一个或者多个处理器执行,以实现如上所述的电力设备静态数据质量评估的实现方法的步骤。

相对于现有技术,本发明提出一种电力设备静态数据质量评估方法,该技术具有以下优势:

首先,本发明构建多个电力设备异常数据检测子模型,利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,对于所述多个电力设备异常数据检测子模型,分别通过LOF模型基于密度对个体数据是否异常进行判别,通过SVM模型利用蛋类模型进行异常判别,构建LSTM神经网络,依据上月正常电力设备的用电特征预测本月正常电力设备的用电均值,再设定阈值以划分正常电力设备数据和异常电力设备数据:

其中:正常电力设备数据标签为0,异常电力设备数据标签为1;ρ为异常系数,将其设置为0.4;E

同时本发明提出一种基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,首先构建电力设备数据质量评估矩阵X,其中x

其中:m表示电力设备静态数据质量指标的数量;n表示电力设备的数量;并利用组合赋权法对不同电力设备静态数据质量指标进行赋权,所述组合赋权法的计算公式为:

其中:w

r

通过计算不同电力设备到正负理想解的加权欧式距离s

其中:s

其中:

因此本发明利用下式计算各电力设备数据质量的评估结果:

其中:η

附图说明

图1为本发明一实施例提供的一种电力设备静态数据质量评估方法的流程示意图;

图2为本发明一实施例提供的一种电力设备静态数据质量评估系统的结构示意图;

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

通过利用基于机器学习混合模型的电力设备异常数据检测算法进行电力设备异常数据的检测,并利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,同时利用结合优化算法的随机森林算法进行电力设备等级的评估。参照图1所示,为本发明一实施例提供的电力设备静态数据质量评估方法示意图。

在本实施例中,电力设备静态数据质量评估方法包括:

S1、获取电力设备静态数据,并计算得到电力设备静态数据质量指标。

首先,本发明获取电力设备静态数据,在本发明一个具体实施例中,所述电力设备静态数据包括电力设备电压值、频率、谐波等;

根据所获取的电力设备静态数据,本发明计算得到电力设备静态数据质量指标,所述电力设备数据质量指标计算公式为:

1)电压偏差:

其中:

ΔU为电力设备的电压偏差;

U

U为电力设备的标称电压;

2)电压波动:

d=(U

其中:

U

d为电压波动值;

U为电力设备的标称电压;

3)频率偏差:

所述频率为正弦量在单位时间内交变的次数,其中交变的时间称为周期;

Δf=f

其中:

f

f为电力设备频率的标称值;

4)电压谐波:

其中:

U

THD

U

U

S2、构建多个电力设备异常数据检测子模型,利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,得到子模型检测判别结果。

进一步地,本发明通过构建多个电力设备异常数据检测,所述电力设备异常数据检测子模型包括LOF模型、SVM模型以及LSTM模型;

利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,得到子模型检测判别结果;

所述LOF模型的电力设备异常数据检测流程为:

LOF模型输入包含短时间跨度电力设备当月的用电数据特征,具体的特征维度包含当月内日用电量最大值及最小值,当月内日用电量平均绝对离差、标准差、偏度、峰度,当月内日用电量排序的25%分位数、50%分位数、75%分位数,当月内日用电量变化百分比的最大值、最小值,当月内日用电量的图像特性(包括极大值点个数、极小值点个数、最长连续重复序列长度、最长连续上升序列长度、最长连续下降序列长度),以及上述指标在当月内每周的统计值,其输出则为每个电力设备数据异常与否的判别结果;

所述SVM模型的电力设备异常数据检测流程为:

SVM模型的输入为去年同期的全部正常电力设备的用电数据特征,具体的特征维度包含当月内日用电量最大值及最小值,当月内日用电量平均绝对离差、标准差、偏度、峰度,当月内日用电量排序的25%分位数、50%分位数、75%分位数,当月内日用电量变化百分比的最大值、最小值,当月内日用电量的图像特性(包括极大值点个数、极小值点个数、最长连续重复序列长度、最长连续上升序列长度、最长连续下降序列长度),以及上述指标在当月内每周的统计值,输出为记录模型对于特征数据学习状况的模型文件,在检测阶段,SVM模型的输入是当月包含相同特征维度的短时间跨度电力设备数据指标,输出为每个电力设备数据异常与否的判别结果;

所述LSTM模型的电力设备异常数据检测流程为:

LSTM模型的训练输入包含第k-1月全体正常电力设备的月用电量均值、平均绝对离差、标准差、偏度、峰度无偏标准差、无偏误差、最大用电量,以及第k月全体正常电力设备的月用电量均值,输出则为记录模型对于特征数据学习状况的模型文件;在检测阶段,LSTM模型的输入是上月包含相同特征维度的全体正常电力设备的月用电数据,输出为对当月全体正常电力设备的月用电量均值的预测,在预测得到当月正常用电电力设备的月用电量均值后,对于短时间跨度电力设备数据异常与否的判别公式如下:

其中:

正常电力设备数据标签为0,异常电力设备数据标签为1;

ρ为异常系数,将其设置为0.4;

E

E

S3、根据多个子模型的检测判别结果,对错误的判别结果进行修正,得到电力设备异常数据的检测结果。

进一步地,根据多个子模型的检测判别结果,分别保存为记录模型对于特征数椐学习的模型文件,在进行预测时,计箅LOF的判别结果,并调用SVM和LSTM的模型给出判定,最终以SVM的类别判定结果为基准进行修正,若SVM判定的电力设备异常数据在LOF中密度正常,且月总用电量与LSTM所预测的电力设备用电量差距在合理范围内,则将该电力设备异常数据修正为正常设备,若SVM判断为正常电力设备数据,则无需对其进行修正,并最终输出所判别得到的所有电力设备异常数据。

S4、利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,得到电力设备数据质量的评估结果。

进一步地,本发明利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,所述基于组合赋权的电力设备数据质量评估方法流程为:

1)构建电力设备数据质量评估矩阵X,其中x

其中:

m表示电力设备静态数据质量指标的数量;

n表示电力设备的数量;

2)利用组合赋权法对不同电力设备静态数据质量指标进行赋权,所述组合赋权法的计算公式为:

其中:

w

q

σ

e

3)对x

所述效益型指标的标准化公式为:

所述成本型指标的标准化公式为:

其中:

max(x

v

将指标权重w

r

4)计算不同电力设备到正负理想解的加权欧式距离s

其中:

s

s

5)计算不同电力设备i到正负理想解的灰色关联度

其中:

γ为分辨系数,将其设置为0.3;

6)将加权欧式距离s

7)计算各电力设备数据质量的评估结果:

其中:

η

S5、根据电力设备数据质量的评估结果,利用结合优化算法的随机森林算法进行电力设备等级的评估。

进一步地,根据电力设备数据质量的评估结果,本发明利用结合优化算法的随机森林算法进行电力设备等级的评估,所述电力设备等级共分为1、2、3、4这四个等级,其中1级为最优等级其余逐级次之,1级即代表电力设备满足特殊行业高水平的电能质量要求,2级即代表电力设备电能质量符合国家标准,3级即代表电力设备电能质量各评估指标满足国家标准规定的电能质量限值要求,4级即代表电力设备电能质量不符合国家标准;

所述结合优化算法的随机森林算法流程为:

根据训练电力设备数据集U中的数据确定随机森林综合评估模型中决策树的数目nt和属性特征的子集大小mt,其中mt≤m,m为电力设备数据质量评估指标的个数;

采用CART算法建立nt棵决策树,并选取Gini指数最小的特征变量作为最佳分裂节点;

计算模型的平均袋外误差,若此时模型的迭代次数小于预设定的最大迭代次数,则利用粒子群算法更新nt以及mt的取值,重复上述步骤,直到达到最大迭代次数,并输出最终的随机森林模型;

将电力设备的数据质量评估结果输入随机森林模型进行评估等级的决策,根据所有决策树的结果确定最终的电力设备等级。

下面通过一个算法实验来说明本发明的具体实施方式,并对发明的处理方法进行测试。本发明算法的硬件测试环境为:操作系统是Ubuntu16.04,计算机处理器为Inteli5-8500CPU@3GHZ×6,内存条的大小为16G,Tensorflow-gpu 1.18版本,keras 2.24版本;对比处理方法为基于随机森林的电力设备静态数据质量评估方法以及基于SVM的电力设备静态数据质量评估方法。

在本发明所述算法实验中,数据集为采集到的100G电力设备静态数据数据。本实验将采集数据输入到本发明所述方法以及对比方法中,将电力设备静态数据质量评估的准确率作为评价算法性能的指标。

根据实验结果,基于随机森林的电力设备静态数据质量评估方法的电力设备静态数据质量评估准确率为84.31%,基于SVM的电力设备静态数据质量评估方法的电力设备静态数据质量评估准确率为81.75%,本发明所述方法的电力设备静态数据质量评估准确率为86.32%,相较于对比方法,本发明所提出的电力设备静态数据质量评估方法具有更高的电力设备静态数据质量评估准确率。

发明还提供一种电力设备静态数据质量评估系统。参照图2所示,为本发明一实施例提供的电力设备静态数据质量评估系统的内部结构示意图。

在本实施例中,所述电力设备静态数据质量评估系统1至少包括电力设备数据获取装置11、数据处理器12、数据质量评估装置13,通信总线14,以及网络接口15。

其中,电力设备数据获取装置11可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。

数据处理器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。数据处理器12在一些实施例中可以是电力设备静态数据质量评估系统1的内部存储单元,例如该电力设备静态数据质量评估系统1的硬盘。数据处理器12在另一些实施例中也可以是电力设备静态数据质量评估系统1的外部存储设备,例如电力设备静态数据质量评估系统1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,数据处理器12还可以既包括电力设备静态数据质量评估系统1的内部存储单元也包括外部存储设备。数据处理器12不仅可以用于存储安装于电力设备静态数据质量评估系统1的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。

数据质量评估装置13在一些实施例中可以是一中央处理器(Central ProcessingUnit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行数据处理器12中存储的程序代码或处理数据,例如电力设备数据质量评估程序指令等。

通信总线14用于实现这些组件之间的连接通信。

网络接口15可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该系统1与其他电子设备之间建立通信连接。

可选地,该系统1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(OrganicLight-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电力设备静态数据质量评估系统1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-15以及电力设备静态数据质量评估系统1,本领域技术人员可以理解的是,图1示出的结构并不构成对电力设备静态数据质量评估系统1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

在图2所示的系统1实施例中,数据处理器12中存储有电力设备数据质量评估程序指令;数据质量评估装置13执行数据处理器12中存储的电力设备数据质量评估程序指令的步骤,与电力设备静态数据质量评估方法的实现方法相同,在此不作类述。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有电力设备数据质量评估程序指令,所述电力设备数据质量评估程序指令可被一个或多个处理器执行,以实现如下操作:

获取电力设备静态数据,并计算得到电力设备静态数据质量指标;

构建多个电力设备异常数据检测子模型,利用电力设备异常数据检测子模型对电力设备静态数据质量指标进行电力设备异常数据检测,得到子模型检测判别结果;

根据多个子模型的检测判别结果,对错误的判别结果进行修正,得到电力设备异常数据的检测结果;

利用基于组合赋权的电力设备数据质量评估方法进行电力设备数据质量的评估,得到电力设备数据质量的评估结果;

根据电力设备数据质量的评估结果,利用结合优化算法的随机森林算法进行电力设备等级的评估。

需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 一种电力设备静态数据质量评估方法及系统
  • 一种互联网质量指标评估方法以及质量优化方法及系统
技术分类

06120112899893