掌桥专利:专业的专利平台
掌桥专利
首页

基于smote函数的非介入式负荷辨识数据样本均衡化方法和系统

文献发布时间:2023-06-19 19:28:50


基于smote函数的非介入式负荷辨识数据样本均衡化方法和系统

技术领域

本发明属于配用用电领域,具体涉及一种基于smote函数的非介入式负荷辨识数据样本均衡化方法和系统。

背景技术

随着智能电网的发展,传统电力行业将向高度集约化、知识化、技术化方向发展,除关注发电侧的数量和质量外,还应重视对需求侧的管理。因此,在功率分配和消耗方面的智能化需求越来越大。应用需求侧管理优化低压用户客户端,实现有效的负荷管理。功耗侧的智能技术引起了越来越多的关注。电力需求侧管理的关键是获取家庭能源效率的详细信息,分析家庭用电能耗结构,更好地了解用户行为对家庭能源效率的影响,引导用户自觉采取节能行动,负荷辨识是负荷管理的核心技术。

然而对于实际场景中,不同家庭用电设备使用次数存在较大的差异,数据样本的不均衡对于分类器的分类结果影响巨大,往往在高频繁使用的电器中,低频率使用电器被淹没。

现有技术文件1(CN113406433A)公开了一种基于非侵入式电力负荷的模糊聚类感知方法,包括:S1、电网数据采集:通过SPI总线,将计量芯片实时推送的负荷信息数据传送到嵌入式终端,嵌入式模块采用DMA的方式进行数据的传输,从而降低MCU的cpu消耗。在本项目中,将这个数据采集作为一个任务并通过信号量等方式传递给下一个任务,及负荷事件检测;S2、特征分析:在获取得到的实时数据中,为了降低数据纬度,采用了谐波统计方法,从而将每次采样得到的数据压缩到15*4个字节范围了,以降低数据的储存量;同时,在特征分析上,主要以谐波特征为主,结合一些潜在的负荷特征;S3、模糊聚类感知:在辨识过程中,尤其是检测到负荷事件,考虑到上述三类的负荷特征,模糊感知算法的输入需要结合三种特征进行负荷辨识,每一种负荷特征作为一个隶属度度量标准,依次实现多个特征的隶属度评价,综合这些隶属度,获取概率密度最大的情况下的负荷匹配,实现负荷辨识。现有技术文件1中阐述了负荷辨识的三个步骤,包括数据采集、特征分析和模糊聚类,其在S2特征分析步骤中基于S1中计量芯片采集的数据进行特征提取,出于存储量限制做了简单数据降维,但是并未考虑负荷设备类型,如使用频率高低、人均占有率高低等因素,未对计量芯片采集的数据进行数据质量层面的降噪、均衡化等二次处理,导致低频率使用电器的特征淹没在家庭总负荷波形中。

发明内容

为解决现有技术中存在的不足,提高负荷辨识精确度,本发明提供一种基于smote函数的非介入式负荷辨识数据样本均衡化方法和系统。

本发明采用如下的技术方案。

一种基于smote函数的非介入式负荷辨识数据样本均衡化方法,包括如下步骤:

步骤1,将多个家庭设备作为多个样本,分别采样每一个样本的负荷波形,提取出对应的电压电流信号;

步骤2,基于电压电流信号,计算各个样本的有功功率、无功功率与谐波有效值,并得到每一个样本对应的启停特征;

步骤3,将启停特征作为特征向量,并基于smote函数,均衡化不同种类的家庭设备的样本数量。

优选地,所述步骤2具体包括:

步骤2.1,基于傅里叶变换将电压电流信号从时序信号转变为频域信号,从而得到谐波有效值;

步骤2.2,根据谐波有效值,计算得到有功功率、无功功率、二次谐波与三次谐波;

步骤2.3,根据有功功率、无功功率、二次谐波与三次谐波形成计算每一个家庭设备的事件特征;

步骤2.4,根据事件特征得到启停特征,包括:开启有功功率、开启无功功率、开启三次谐波、开启二次谐波、变档有功功率、变档无功功率、变档三次谐波、变档二次谐波、变档次数、关断有功功率、关断无功功率、关断三次谐波、关断二次谐波、电器运行时长。

优选地,所述步骤2.1具体包括:

电流k次谐波有效值i

I(k)=a(k)+jb(k)

其中,n为采样周期,N

a(k)和b(k)分别为k阶频域信号的实部和虚部,j为虚数单位。

优选地,所述步骤2.2具体包括:

有功功率p与无功功率q分别为:

式中,

优选地,所述步骤2.3具体包括:

事件特征为:

P={p

事件特征的约束条件为:

w=t

其中,TH

优选地,所述步骤3具体包括:

步骤3.1,统计不同种类的家庭设备的样本数量,判断每一种种类的样本数量与其他种类的样本数量是否均衡;

步骤3.2,若所述种类的样本数量不均衡,获取所述种类下的所有样本的特征向量;

步骤3.3,基于所述种类下的所有样本的特征向量,进行样本扩张,直到满足所述种类的样本数量与其他种类的样本数量均衡为止。

优选地,所述步骤3.1具体包括:

对不同种类的家庭设备的样本数量按照从小到大进行排序,得到序列[N

其中,C为种类数量,N

若上式成立,则判定为种类为c的样本数量与其他种类的样本数量不均衡,否则判定为种类为c的样本数量与其他种类的样本数量均衡。

优选地,步骤3.3中样本扩张具体包括:

选取所述种类下的其中一个样本的特征向量x;

计算所述种类下的所有其他样本的特征向量与特征向量x的欧氏距离,从小到大排序,以选出特征向量x的k近邻,依次为x

计算出新的特征向量x

x

其中,rand(0,1)为随机数公式,i=1,2,…,k;

将新的样本x

优选地,还包括步骤4,根据均衡化后的样本,利用支持向量机,对待辨识样本进行负荷辨识。

优选地,所述步骤4具体包括:

步骤4.1,均衡化的样本包括待辨识样本与测试样本,将待辨识样本划分为正样本X

步骤4.2,根据划分后的正、负样本,构造超平面将正、负样本分开;

步骤4.3,基于超平面对每一个待辨识样本x

w·x

则判定待辨识样本x

优选地,所述步骤4.2具体包括:

超平面为:

H:w·x+b=0

其中,参数w与b如下式所示:

式中,ε

一种基于smote函数的非介入式负荷辨识数据样本均衡化系统,包括:电流电压采集模块、逻辑计算模块、样本扩张模块;

其中,电流电压采集模块用于分别采样每一个样本的负荷波形,提取出对应的电压电流信号;

逻辑计算模块用于计算各个样本的有功功率、无功功率与谐波有效值,并得到每一个样本对应的启停特征;

样本扩张模块用于均衡化不同种类的家庭设备的样本数量。

一种终端,包括处理器及存储介质;所述存储介质用于存储指令;

所述处理器用于根据所述指令进行操作以执行所述方法的步骤。

计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述方法的步骤。

本发明的有益效果在于,与现有技术相比,本发明增加了数据均衡化处理的环节,以居民家庭中全年使用频率相对较低的加湿器为例,冬季供暖时居民家庭每天使用1-2小时,在春夏秋三个季节基本不用使用,如果没有数据均衡化处理,那么在春、夏、秋三季辨识时,加湿器的负荷特征会淹没在电热水壶、热水器等高频使用电器,因为数据样本质量与负荷辨识准确度直接相关,所以本发明对数据样本,尤其是使用频率低的负荷进行数据均衡化处理,能够提升不同的负荷辨识分类器低频率使用电器的敏感性,从而提升负荷辨识准确性。

附图说明

图1是一种基于smote函数的非介入式负荷辨识数据样本均衡化方法的流程图。

图2是本公开实施例的一种电热开启、变档、关闭的波形图。

图3是本公开实施例的定频冰箱进行均衡化过程的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。本申请所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有作出创造性劳动前提下所获得的有所其它实施例,都属于本发明的保护范围。

一种基于smote函数的非介入式负荷辨识数据样本均衡化方法,如图1所示,包括以下步骤:

步骤1,将多个家庭设备作为多个样本,分别采样每一个样本的负荷波形,提取出对应的电压电流信号;

其中,可以通过负荷辨识终端采样家庭设备的负荷波形,负荷辨识终端包括:智能终端采样模块;家庭设备可以是多个用户的多个设备之一。

其中,步骤1中负荷辨识终端采样家庭设备负荷波形,提取电压电流信号,智能终端采样模块采样频率6.4K,对多个用户的用电数据持续采样,获取不同的设备的基本数据样本Ω。

步骤2,基于电压电流信号,计算各个样本的有功功率、无功功率与谐波有效值,并得到每一个样本对应的启停特征;

步骤2具体包括:

步骤2.1:基于傅里叶变换将电压电流信号从时序信号转变为频域信号,从而得到谐波有效值;

以电流I为例,其k阶频域信号为I(k)=a(k)+jb(k),a(k)和b(k)分别为k阶频域信号的实部和虚部,j为虚数单位,则电流k次谐波有效值为:

式中,n为采样周期,N

步骤2.2:提取家庭用户不同工况下设备的有功功率p、无功功率q、二次谐波I2、三次谐波I3。二次谐波,三次谐波代表了偶次谐波和奇次谐波,电力电子装置电器滤波时,会产生偶次谐波和奇次谐波,是设备特异性的重要特征。

有功功率p与无功功率q分别为:

式中,

步骤2.3:计算样本的事件特征为:

P={p

需要说明的是,该公式主要是为了确定每一个t与p

w=t

式中,TH

步骤2.4,根据事件特征、有功功率、无功功率、二次谐波与三次谐波,计算每一个样本对应的启停特征,包括:开启有功功率、开启无功功率、开启三次谐波、开启二次谐波、变档有功功率、变档无功功率、变档三次谐波、变档二次谐波、变档次数、关断有功功率、关断无功功率、关断三次谐波、关断二次谐波、电器运行时长。

以图2某电热为例,依次检测到5个事件(3个上升2个下降),且上升事件功率和等于下降事件功率和,基于时间规律判断开启、关断、变档。其启停特征与计算如表1所示。

表1

步骤3,考虑到实际中设备使用次数的差异,基于smote函数均衡化不同种类的样本;

需要说明的是,在步骤1中的多个样本指的是多种不同家庭设备的多个样本。这就意味着:不同种类的家庭设备的样本数量可能差异巨大。例如:受其使用频率的影响:使用次数越多的设备,该种类家庭设备所能获得的样本数量自然就越多;而使用次数越少的设备,该种类家庭设备所能获得的样本数量自然就越少。

因此,步骤3的目的在于均衡化不同种类的家庭设备的样本数量。

步骤3中考虑到实际中设备使用次数的差异,从而导致不同设备样本量存在较大的差异,将启停特征作为特征向量,并基于smote函数均衡化不同种类的家庭设备的样本数量,其具体步骤如下:

步骤3.1,获取训练样本数据,标签化样本数据,统计不同种类的家庭设备的样本数量,判断每一种种类的样本数量与其他种类的样本数量是否均衡。

具体的,

首先对不同种类的家庭设备的样本数量按照从小到大进行排序,得到序列[N

其中,[]为取整符号,σ,ε均为介于0至1之间的固定实数,分别可以取0.9与0.5。

若上式成立,则判定为种类为c的样本数量与其他家庭设备的样本数量不均衡,否则判定为种类为c的样本数量与其他家庭设备的样本数量均衡。

步骤3.2,依次判断每一种种类,假设种类为c的家庭设备不均衡,获取种类c中所有样本的特征向量;

步骤3.3,基于种类c中的所有样本的特征向量,进行样本扩张,直到种类c中的样本数量与其他种类的样本数量均衡为止。

其中,样本扩张具体包括:

选取种类c下的其中一个样本的特征向量x;

计算种类c下的所有其他样本的特征向量与特征向量x的欧氏距离,从小到大排序,以选出特征向量x的k近邻,依次为x

计算出新的特征向量x

x

其中,rand(0,1)为随机数公式,i=1,2,…,k;

将新的样本x

图3表示定频冰箱进行均衡化过程,因作图便利,仅以两个启停特征为例。

进一步优选地,本发明方法还包括步骤4,根据均衡化后的样本,利用支持向量机(SVM)进行负荷辨识。

基于smote均衡化后的样本利用支持向量机进行负荷辨识,其步骤如下:

步骤4.1:经过样本均衡化后,将待辨识样本划分为正样本X

步骤4.2:构造一个超平面H:w·x+b=0使得X

式中,ε

步骤4.3,基于超平面对每一个待辨识样本x

w·x

则判定待辨识样本x

相应的,本发明还公开了一种基于smote函数的非介入式负荷辨识数据样本均衡化系统,包括:电流电压采集模块、逻辑计算模块、样本扩张模块;

其中,电流电压采集模块用于分别采样每一个样本的负荷波形,提取出对应的电压电流信号;

逻辑计算模块用于计算各个样本的有功功率、无功功率与谐波有效值,并得到每一个样本对应的启停特征;

样本扩张模块用于均衡化不同种类的家庭设备的样本数量。

还包括负荷辨识模块用于利用支持向量机,对待辨识样本进行负荷辨识。

一种终端,包括处理器及存储介质;所述存储介质用于存储指令;

所述处理器用于根据所述指令进行操作以执行所述方法的步骤。

计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述方法的步骤。

本发明的有益效果在于,与现有技术相比,本发明增加了数据均衡化处理的环节,以居民家庭中全年使用频率相对较低的加湿器为例,冬季供暖时居民家庭每天使用1-2小时,在春夏秋三个季节基本不用使用,如果没有数据均衡化处理,那么在春、夏、秋三季辨识时,加湿器的负荷特征会淹没在电热水壶、热水器等高频使用电器,因为数据样本质量与负荷辨识准确度直接相关,所以本发明对数据样本,尤其是使用频率低的负荷进行数据均衡化处理,能够提升不同的负荷辨识分类器低频率使用电器的敏感性,从而提升负荷辨识准确性。

本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

相关技术
  • 一种用于非侵入式负荷辨识的负荷事件检测的数据处理方法及设备
  • 一种非介入式负荷辨识的事件检测方法及系统
  • 一种非介入式负荷辨识的事件检测方法及系统
技术分类

06120115924479