导航：首页> 医学或兽医学；卫生学>一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法、系统、设备及介质

一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法、系统、设备及介质

文献发布时间：2024-04-18 19:52:40

技术领域

本发明属于窃电检测技术领域，具体涉及一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法、系统、设备及介质。

背景技术

随着社会经济的高速发展，用电需求与日俱增，为保障电力供应、优化能源结构，世界各国均扩大了智能电网的投资规模。然而，受可观经济利益的驱使，用户的窃电行为屡禁不止；全世界范围内每年由于窃电而造成的经济损失高达960亿美元，仅我国电力企业每年的窃电经济损失就高达200亿元。此外，窃电分子的不法、违规操作可能会损坏价格高昂的供电设备，甚至出现大面积停电，引发火灾，造成人员伤亡，危害社会公共安全。在智能电网环境下，窃电方式出现高科技手段且具有广泛性、多样性、隐蔽性和成本低的特点，这使得窃电形势愈来愈严峻。因此，为了有效遏制甚至杜绝智能电网窃电问题，亟需加强窃电检测技术的科学研究和应用推广，建设高可靠、高安全的智能电网。

现有技术方案中的智能电网时代下用户的电力消耗数据具有海量、高速和多样(Volume,Velocity&Variety，3V)的特性。公共事业公司存储了用户大量的历史用电数据及用户的智能电表周期性上报其电力消耗数据，这为基于数据驱动的窃电检测提供了基础。该类方法主要基于聚类、支持向量机，决策树、集成学习、人工神经网络等数据挖掘、机器学习算法分析用户的用电数据及天气、日期等相关数据，旨在发现与窃电行为相关的异常用电模式。初期的窃电检测方法多依赖于单一模型，其检测精度相对较低。而后的窃电检测方法多数是通过集成学习的方式结合多个模型、多种方法，进行窃电检测，其检测精度相对较高。目前较先进的窃电检测方法结合卷积神经网络、长短期记忆神经网络等人工神经网络，利用用电数据的时序特征及其隐含的用电模式特征进一步提高了检测精度。

众所周知的是，用户的用电模式具有显著的周期性，存在某些用户与用户自身的用电模型具有显著的相似性。目前绝大多数基于数据驱动的窃电检测方法是基于用户的一维用电量时序数据进行的，不仅没有充分利用用户自身用电模式的周期性特征，还忽略了最近邻用户间用电模式的相似性特征，方法的检测精度较低，漏检率、误检率较高。

公开号为CN113377827B的专利申请，公布了一种基于Conv-LSTM网络的窃电检测方法和系统，该方法将用户的一维用电量时序数据构建为一个包含用电量数据和几个相邻日之间用电量差异的二维矩阵序列，基于ConvLSTM网络充分利用了用户自身用电模式的周期性特征；然而，该方法完全忽略了最近邻用户间用电模式的相似性特征；此外，该方法中ConvLSTM网络的参数较多，在训练过程中易于陷入局部最优，导致其检测精度显著下降，漏检率、误检率显著上升。

发明内容

为了克服上述现有技术的不足，本发明的目的在于提供一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法、系统、设备及介质，通过将用户自身及其最近邻的一维用电量时序数据重构为二维邻近日矩阵序列和二维最近邻矩阵序列，充分利用邻近日矩阵序列中用户自身用电模式的周期性特征和最近邻矩阵序列中最近邻用户间用电模式的相似性特征，实现了低误检率、低漏检率、高检测精度的窃电检测。

为了实现上述目的，本发明采取的技术方案是：

一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法，包括以下步骤：

步骤S1：获取智能电网中某一区域内所有用户在某一时间段内的用电量数据，并对其进行预处理，构建包含预处理后所有用户一维用电量数据的时序数据集合；

步骤S2：通过步骤S1构建的一维用电量时序数据集合构建各用户的最近邻用户集合；

步骤S3：将预处理后某一用户的一维用电量时序数据重构为二维邻近日矩阵序列；基于步骤S2构建的最近邻用户集合，将预处理后用户自身及其最近邻的一维用电量时序数据重构为二维最近邻矩阵序列；

步骤S4：通过步骤S3构建的用户的二维邻近日矩阵序列和二维最近邻矩阵序列构建窃电检测方法的检测样本数据集，将检测样本数据集划分为训练集和测试集；

步骤S5：构建融合自身与最近邻用电信息的ConvLSTM检测模型，即ETD-SENICON检测模型，通过步骤S4构建的训练集训练、优化ETD-SENICON检测模型，通过步骤S4构建的测试集测试ETD-SENICON检测模型。

进一步地，所述步骤S1包括：

步骤S11：获取智能电网中某一区域内n个用户在某一段时间内的用电量时序数据，标记q

步骤S12：通过插值方法填补步骤S11时序数据q

步骤S13：通过分段聚合近似方法降低步骤S11时序数据q

步骤S14：通过步骤S12所述的插值方法和步骤S13所述的分段聚合近似方法对步骤S11构建的集合Q中n个用户的用电量时序数据进行预处理，标记

进一步地，所述步骤S2包括：

步骤S21：获取预处理后n个用户一周的用电量时序数据，标记q′

步骤S22：通过局部敏感哈希技术，将步骤S21构建的集合

步骤S23：计算步骤S22构建的候选集合U′中任一用户的周用电量时序数据与时序数据

进一步地，所述步骤S3包括：

步骤S31：基于用户u的最近邻用户集合U，将预处理后用户自身及其最近邻的一维用电量时序数据构建为集合，标记

步骤S32：将预处理后用户u的一维用电量时序数据

步骤S33：对步骤S32中二维邻近日矩阵Q′

进一步地，所述步骤S4为：对步骤S33中得到的用户的二维邻近日矩阵序列和二维最近邻矩阵序列进行划分，将其构建为检测样本数据集；对检测样本数据集进行标记，将标记完成的检测样本数据集划分为训练集和测试集。

进一步地，所述步骤S5包括：

步骤S51：构建融合自身与最近邻用电信息的ConvLSTM检测模型，即ETD-SENICON检测模型，模型由“横向”ConvLSTM网络、“纵向”ConvLSTM网络和卷积层组成；

步骤S52：将步骤S4构建的训练集作为模型输入，以二分类交叉熵作为模型训练的损失函数，使用小批量梯度下降算法在反向传播机制下训练ETD-SENICON检测模型；

步骤S53：将步骤S4构建的训练集作为模型输入，以模型输出对应的F1-measure值作为目标函数值，使用一种智能优化算法优化步骤S52训练后的ETD-SENICON检测模型；

步骤S54：通过步骤S4构建的测试集测试ETD-SENICON检测模型，将测试集输入至步骤S53优化后的ETD-SENICON检测模型中，输出检测结果，判别用户u是否存在窃电行为。

本发明还提供了一种融合自身与最近邻用电信息的ConvLSTM窃电检测系统，包括：

数据处理模块：用于获取智能电网中某一区域内所有用户在某一时间段内的用电量数据，并对其进行预处理，构建包含预处理后所有用户一维用电量数据的时序数据集合；

集合构建模块：用于实现通过所构建的一维用电量时序数据集合构建各用户的最近邻用户集合；

序列重构模块：用于实现将预处理后某一用户的一维用电量时序数据重构为二维邻近日矩阵序列；基于构建的最近邻用户集合，将预处理后用户自身及其最近邻的一维用电量时序数据重构为二维最近邻矩阵序列；

数据集划分模块：用于实现通过用户的二维邻近日矩阵序列和二维最近邻矩阵序列构建窃电检测方法的检测样本数据集，将检测样本数据集划分为训练集和测试集；

模型处理模块：构建融合自身与最近邻用电信息的ConvLSTM检测模型，即ETD-SENICON检测模型，通过训练集训练、优化ETD-SENICON检测模型，通过测试集测试ETD-SENICON检测模型。

本发明还提供了一种融合自身与最近邻用电信息的ConvLSTM窃电检测设备，包括：

存储器：存储上述一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法的计算机程序，为计算机可读取的设备；

处理器：用于执行所述计算机程序时实现所述的一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时能够实现所述的一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法。

与现有技术相比，本发明的有益效果为：

1.本发明通过将用户自身及其最近邻的一维用电量时序数据重构为二维邻近日矩阵序列和二维最近邻矩阵序列，突出了用户自身用电模式的周期性特征和最近邻用户间用电模式的相似性特征。

2.本发明通过构建ETD-SENICON检测模型，融合了“横向”ConvLSTM网络所提取的二维邻近日矩阵序列中用户自身用电模式的周期性特征和“纵向”ConvLSTM网络所提取的二维最近邻矩阵序列中最近邻用户间用电模式的相似性特征。ConvLSTM网络不仅继承了LSTM网络的优势，还在LSTM网络中引入了卷积机制，可以很好地提取矩阵序列中用电数据的时序特征及其隐含的用电模式特征。

3.本发明通过一种智能优化算法优化ETD-SENICON模型，较大程度地避免了模型陷入局部最优，提高了模型的泛化能力，有效地改善了模型的综合性能。

综上，本发明通过将用户自身及其最近邻的一维用电量时序数据重构为二维邻近日矩阵序列和二维最近邻矩阵序列，充分利用邻近日矩阵序列中用户自身用电模式的周期性特征和最近邻矩阵序列中最近邻用户间用电模式的相似性特征，实现了低误检率、低漏检率、高检测精度的窃电检测。

附图说明

图1为本发明的方法流程图。

图2为本发明实施例中一维用电量时序数据重构为二维矩阵序列示意图。

图3为本发明实施例中ETD-SENICON检测模型示意图。

图4为本发明实施例中ConvLSTM网络示意图。

图5为本发明实施例中PGHA算法流程图。

图6为本发明实施例与现有技术性能对比仿真实验结果图；其中，图6(a)为F1-measure指标对比图，图6(b)为FNR指标对比图，图6(c)为FPR指标对比图。

具体实施方式

下面结合附图对本发明做进一步的详细说明。

如图1所示，本实施例提供了一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法，包括以下步骤：

步骤S11：在日常生活中，配电公司所安装的智能电表以特定的频率(通常15min/次)上报用户在一个测量周期内的用电量，每日上报96个用电量数据。在本实施例中，获取智能电网中某小区内n个用户在某一段时间内的用电量数据，构建集合Q，标记L表示此时间段内智能电表上报的用电量数据个数，则q

步骤S12：由于智能电表故障、数据传输异常、数据存储异常等原因，用户的用电量时序数据往往会出现缺失值，通过插值方法填补步骤S11时序数据q

步骤S13：智能电表通常以较高的频率报告用户的用电数据，而用户日常的主要生活行为往往会由于各种原因提前或推迟(如做饭会因工作原因提前或推迟)，这导致用户的用电量时序数据具有较大的时间偏移噪声，通过分段聚合近似方法降低步骤S11时序数据q

步骤S14：通过步骤S12所述的插值方法和步骤S13所述的分段聚合近似方法对步骤S11集合Q中所有用户的用电量时序数据进行预处理，构建集合

步骤S2：通过步骤S1构建的一维用电量时序数据集合构建各用户的最近邻用户集合，用户自身与其最近邻用户的负荷曲线具有高度相似性；

步骤S21：获取预处理后n个用户一周的用电量时序数据构建集合

步骤S22：选取基于角相似度距离度量方式实现的LSH技术，其对应的哈希函数族中的任一哈希函数定义为：

上式中，v表示一个满足高斯分布的随机投影向量。

随机选择25个投影向量{v

步骤S23：标记

上式中，a

通过最小二乘估计法构建各分段的近似线性分段，将相邻的近似线性分段的交点

对用户u和候选集合U′中任一用户l的时序数据

r′

上式中，a′

当且仅当δ

以三元组(a′

计算用户u和用户l的日负荷曲线近似线性分段集合的形态差异度和数值差异度，计算公式为：

计算用户u和用户l连续一周的日用电量时序数据所对应的日负荷曲线近似线性分段集合形态差异度的平均值

计算用户u和候选集合U′中用户负荷曲线的形态差异度集合

上式中，

计算用户u和用户l负荷曲线的相似度θ(u,l)，计算公式为：

上式中，α表示形态差异度

计算候选集合U′中任一用户l的周用电量时序数据

步骤S31：基于用户u的最近邻用户集合U，将预处理后用户自身及其最近邻的一维用电量时序数据构建为集合

步骤S32：将预处理后用户u的一维用电量时序数据

步骤S33：对二维邻近日矩阵Q′

将步骤S33中得到的二维邻近日矩阵序列和二维最近邻矩阵序列分别以每7个子矩阵进行划分，并将其构建为一个检测样本，共

步骤S5：构建融合自身与最近邻用电信息的ConvLSTM检测模型，即ETD-SENICON检测模型，通过步骤S4构建的训练集训练、优化ETD-SENICON检测模型，通过步骤S4构建的测试集测试ETD-SENICON检测模型；

如图3所示，步骤S51：ETD-SENICON检测模型由“横向”ConvLSTM网络、“纵向”ConvLSTM网络和卷积层组成；“横向”ConvLSTM网络用于提取邻近日矩阵子序列中用户自身用电模式的周期性特征，“纵向”ConvLSTM网络用于提取最近邻矩阵子序列中最近邻用户间用电模式的相似性特征；融合“横向”ConvLSTM网络和“纵向”ConvLSTM网络提取的特征，将融合特征通过卷积层输出窃电检测结果；

具体的，如图4所示，“横向”ConvLSTM网络和“纵向”ConvLSTM网络具有相同的结构，均是由一个或多个ConvLSTM层组成，每个ConvLSTM层由多个连接的ConvLSTM节点组成；在任意两个ConvLSTM层之间插入一个批处理规范化层(BatchNormalization)以加速模型收敛。ConvLSTM网络由依次连接的抽象层、池化层和缩减层组成；其中，抽象层为1个convLSTM层，卷积核大小为3×3，步长为1，使用“相同填充”策略，用以提取特征矩阵序列中的数据特征；池化层由3个convLSTM层组成，卷积核大小为3×3，步长为1，使用“有效填充”策略，去除冗余信息，压缩提取的数据特征；缩减层为1个convLSTM层，卷积核大小为3×3，步长为1，使用“相同填充”策略，进一步提取压缩数据特征中的时间依赖特征，作为ConvLSTM网络提取的数据特征；

分别标记H

上式中，β表示“横向”ConvLSTM网络和“纵向”ConvLSTM网络之间提取的数据特征融合的权重因子，在本实施例中，选取β＝0.5；

将融合特征输入到卷积层，通过Sigmoid函数输出输入检测样本中是否存在窃电数据的概率，若输出大于等于0.5，则判别该用户为窃电用户，反之则判别其为正常用户；

步骤S53：将步骤S52训练完成后模型的可优化权值展开得到的权值向量x作为算法的待优化解向量，以模型输出对应的的F1-measure值作为优化算法的目标函数值，将步骤S4构建的训练集作为模型输入，使用一种基于GA算法和PSO算法的混合智能优化算法PGHA算法优化步骤S52训练后的ETD-SENICON检测模型的权值；由于模型的可优化的权值较多，算法在更新大规模参数时会耗费大量时间，因此冻结模型中ConvLSTM网络的抽象层和池化层权值，仅优化更新模型中ConvLSTM网络的缩减层和卷积层权值；具体的，PGHA算法流程如图5所示，分别初始化GA算法子系统和PSO算法子系统并分别执行GA操作和PSO操作，比较两个子系统的最优解，选择最优解向量作为PGHA算法系统的最优解，若未达到算法的最大迭代次数或满足算法终止条件，则在符合条件(标记t表示当前迭代次数，标记T表示指定迭代次数，t％T＝0)的迭代过程结束后，根据解向量目标函数值从两个子系统中随机选择p＝0.1*min(N

实验分析如下：

如图6所示，模拟现实中的窃电攻击，设置窃电攻击模型

本发明还提供了一种融合自身与最近邻用电信息的ConvLSTM窃电检测系统，包括：

数据处理模块：用于实现步骤S1中获取智能电网中某一区域内所有用户在某一段时间内的用电量数据，并对其进行预处理，构建包含预处理后所有用户一维用电量数据的时序数据集合；

集合构建模块：用于实现步骤S2中通过所构建的一维用电量时序数据集合构建各用户的最近邻用户集合；

序列重构模块：用于实现步骤S3中将预处理后某一用户的一维用电量时序数据重构为二维邻近日矩阵序列；基于构建的最近邻用户集合，将预处理后用户自身及其最近邻的一维用电量时序数据重构为二维最近邻矩阵序列；

数据集划分模块：用于实现步骤S4中通过用户的二维邻近日矩阵序列和二维最近邻矩阵序列构建窃电检测方法的检测样本数据集，将检测样本数据集划分为训练集和测试集；

模型处理模块：用于实现步骤S5中构建融合自身与最近邻用电信息的ConvLSTM检测模型，即ETD-SENICON检测模型，通过训练集训练、优化ETD-SENICON检测模型，通过测试集测试ETD-SENICON检测模型。

本发明还提供了一种融合自身与最近邻用电信息的ConvLSTM窃电检测设备，包括：

存储器：存储上述一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法的计算机程序，为计算机可读取的设备；

处理器：用于执行所述计算机程序时实现所述的一种融合自身与最近邻用电信息的ConvLSTM窃电检测方法。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：西安电子科技大学;

上一篇：一种单细胞转录组RNA污染去除方法、介质和设备
下一篇：一种具有显影可回收封堵器系统