掌桥专利:专业的专利平台
掌桥专利
首页

一种负荷特征提取方法、装置、设备及介质

文献发布时间:2024-04-18 20:02:40


一种负荷特征提取方法、装置、设备及介质

技术领域

本发明属于配电网负荷优化技术领域,具体涉及一种负荷特征提取方法、装置、设备及介质。

背景技术

随着新型电力系统建设,产生新型发用电负荷特征。在发电侧,随着分布式新能源发电渗透率不断提高,电源由确定可控的连续电源向不确定的随机波动电源转变;在用电侧,从机械电磁系统和高转动惯量系统向电力电子器件及弱转动惯量系统转变,对配电网规划和运行形成挑战。因此,针对新型电力负荷特征,有必要开发精准可靠的负荷特征提取和分析方法,熟悉电网负荷发用电特点,进行有效的分类,对负荷预测、需求响应管理、配网规划投资等意义重大。

目前的负荷特征分析,多局限于峰谷值、平均值、增长率等统计学指数,无法满足新型电力系统条件下,负荷预测、需求响应管理、配网规划等对高精细度负荷特征分析需求。同时,对于负荷的分类,也多局限于营销系统中对用户按照居民工商业等不同行业进行划分,无法体现不同规模、不同电压等级、不同区域、不同用户不同时间等因素对用电负荷的影响。

因此,亟需构建负荷特征分析的系统性框架,能够对新型电力负荷发用电特征进行精细化提取和分析。

发明内容

本发明的目的在于提供一种负荷特征提取方法、装置、设备及介质,以解决现有负荷特征提取多针对统计学指数,难以量化,导致提取结果准确的技术问题。

为实现上述目的,本发明采用如下技术方案予以实现:

第一方面,本发明提供一种负荷特征提取方法,包括以下步骤:

S1、获取预设区域内的若干组负荷数据;

S2、采用快速傅里叶变换处理若干组负荷数据生成频率-幅值图;

S3、根据频率-幅值图获取各组负荷数据的主要构成频率,根据主要构成频率和频率-幅值图生成候选特征集;

S4、采用层次聚类法处理候选特征集得到第一聚类结果;

S5、采用随机森林分类器处理第一聚类结果得到分类结果,根据分类结果设置重要限度值,根据重要限度值筛选分类结果得到特征数据集;

S6、采用层次聚类法处理特征数据集得到第二聚类结果;

S7、将第一聚类结果与第二聚类结果进行比较,若吻合度大于等于预设值则输出特征数据集;

若吻合度小于预设值则返回S5,调整重要限度值。

本发明的进一步改进在于:所述获取预设区域内的若干组负荷数据的步骤中,还包括对负荷数据进行预处理:

所述预处理包括:

对负荷数据进行数据治理,删除无效数据,统一负荷数据的时间跨度和时间颗粒度;

对负荷数据进行最大值归一化。

本发明的进一步改进在于:所述快速傅里叶变换的公式:

X

式中,X

本发明的进一步改进在于:所述候选特征集中还包括预设频率的幅值和相角。

本发明的进一步改进在于:所述调整重要限度值的步骤中,重要限度值逐渐减小。

本发明的进一步改进在于:所述预设值为80%。

本发明的进一步改进在于:所述主要构成频率为频率-幅值图中的各峰值。

第二方面,本发明提供一种负荷特征提取装置,包括:

数据获取模块:用于获取预设区域内的若干组负荷数据;

数据处理模块:采用快速傅里叶变换处理若干组负荷数据生成频率-幅值图;

数据分析模块:用于根据频率-幅值图获取各组负荷数据的主要构成频率,根据主要构成频率和频率-幅值图生成候选特征集;

第一聚类模块:采用层次聚类法处理候选特征集得到第一聚类结果;

筛选模块:用于采用随机森林分类器处理第一聚类结果得到分类结果,根据分类结果设置重要限度值,根据重要限度值筛选分类结果得到特征数据集;

第二聚类模块:采用层次聚类法处理特征数据集得到第二聚类结果;

迭代输出模块:用于将第一聚类结果与第二聚类结果进行比较,若吻合度大于等于预设值则输出特征数据集;

若吻合度小于预设值则返回筛选模块,调整重要限度值。

第三方面,本发明提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种负荷特征提取方法。

第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种负荷特征提取方法。

与现有技术相比,本发明至少包括以下有益效果:

1、本发明通过快速傅里叶变换将负荷数据转换至频域,通过不同频率下的幅值和相位特征,实现负荷特征量化描述;

2、本发明通过随机森林分类器对特征进行筛选,并将筛选前后的数据进行聚类比较,从而剔除无效数据,提高负荷特征提取的准确性;

3、本发明通过设置重要限度值进行特征筛选,并在后续迭代过程中对重要限度值进行调整,避免数据过度删减导致特征提取不准确。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明一种负荷特征提取方法的流程图;

图2为本发明一种负荷特征提取装置的结构框图;

图3为本发明一种负荷特征提取方法中数据归一化后的时间-归一化负荷图;

图4为本发明一种负荷特征提取方法中频率-幅值图;

图5为本发明一种负荷特征提取方法中第一次聚类结果图;

图6为本发明一种负荷特征提取方法中随机森林分类器分类结果图;

图7为本发明一种负荷特征提取方法中第二次聚类结果图。

具体实施方式

下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本发明所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。

实施例1

一种负荷特征提取方法,如图1所示,包括以下步骤:

S1、获取预设区域内的若干组负荷数据;

具体的,每组负荷数据可以是不同地区、不同行业、不同电压等级或不同用户;

作为本实施例的一种优选实施方式,获取预设区域内的负荷数据的步骤中,负荷数据的采集周期为5分钟一次数据采集或15分钟一次数据采集,采集周期不宜超过1小时一次,负荷数据的时间跨度大于等于1年,从而保证获取的负荷数据准确性和全面性,提高最终负荷提取的准确性。

具体的,在S1中还包括:

S11、对负荷数据进行数据治理,删除无效数据,统一负荷数据的时间跨度和时间颗粒度;

S12、对负荷数据进行最大值归一化;

X

其中x

具体的,最大值归一化是指将找到每组负荷数据中的最大值,并每个负荷数据与本组最大负荷数据相除,得到最大值均为1的负荷数据;

根据归一化后的数据可以得到归一化结果和时间折线图,如图4所示;

通过两步预处理,有效清除无效数据,提高数据准确性,简化后续计算,提高准确性。

S2、采用快速傅里叶变换处理若干组负荷数据生成频率-幅值图;

具体的,快速傅里叶变换处理根据公式:

X

式中,X

具体的,频率-幅值图也可称为周期-能量图,如图3所示,纵坐标为不同周期成分的能量,图3是由若干不同周期、不同强度的正弦波构成,某周期(频率)对应的能量越高,则该周期(频率)正弦波参与构成曲线的比例越高。

S3、根据频率-幅值图获取各组负荷数据的主要构成频率,根据主要构成频率和频率-幅值图生成候选特征集;

具体的,图3中的峰值所对应的频率,即主要构成频率。

作为本实施例的一种具体算例,在图3中主要构成频率为8736、6553、4368、3276、2184、1092、156、12、6和3等;

具体的,候选特征集中的数据为主要构成频率对应的幅值和相角;

具体的,根据实际需求可以在候选特征集中手动增加某段频率对应的幅值和相角,即预设频率的幅值和相角;

比如,希望比较居民用户用电负荷与工商业用电负荷特征,可定义幅值a

本实施例中,选取8736、6553、4368、3276、2184、1092、156、12、6、3等周期的归一化幅值和相位作为候选特征,幅值记为“m”,相位记为“ph”,候选特征记为[‘8736m’,‘8736ph’,‘6553m’,‘6553ph’,……];

S4、采用层次聚类法处理候选特征集得到第一聚类结果;

具体的,聚类接通过如图5所示,

以0/1/2/3分别代表不同类,则p1~p24分属类型为:

[0,1,1,2,0,2,1,3,1,1,2,0,0,1,2,1,3,0,1,0,1,1,2,0];

S5、采用随机森林分类器处理第一聚类结果得到分类结果,根据分类结果设置重要限度值,根据重要限度值筛选分类结果得到特征数据集;

具体的,通过随机森林分类器得到的结果如图6所示;

根据图6预设重要度下限为0.025;筛除重要度低于该值的特征,将['2184m','8736m','6553m','3276ph','1092ph','6m','3ph','12ph','6ph','4368ph']作为保留特征。

具体的,重要度限值非固定值,也是无法预先计算的。只有根据上述特征重要度分析结果,进行初步设定,然后在后续迭代过程中修正。

S6、采用层次聚类法处理特征数据集得到第二聚类结果;

具体的,第二次聚类结果如图7所示;

以0/1/2/3分别代表不同类,则p1~p24分属类型为:

[0,1,1,0,0,2,1,3,1,1,0,0,0,1,0,1,3,0,1,0,1,1,1,0];

S7、将第一聚类结果与第二聚类结果进行比较,若吻合度大于等于预设值则输出特征数据集;若吻合度小于预设值则返回步骤S5降低重要限度值;

作为本实施例的一种优选实施方式,预设值为80%,考虑到原候选特征分类可能存在“过拟合”情况,且经过筛选后能够获得更为清晰的聚类结果,因此对筛选后保留的特征予以保留,作为该系列负荷数据的频域特征。

实施例2

一种负荷特征提取装置,如图2所示,包括:

数据获取模块:用于获取预设区域内的若干组负荷数据;

具体的,每组负荷数据可以是不同地区、不同行业、不同电压等级或不同用户;

作为本实施例的一种优选实施方式,获取预设区域内的负荷数据的步骤中,负荷数据的采集周期为5分钟一次数据采集或15分钟一次数据采集,采集周期不宜超过1小时一次,负荷数据的时间跨度大于等于1年,从而保证获取的负荷数据准确性和全面性,提高最终负荷提取的准确性。

具体的,在数据获取模块中还包括:

对负荷数据进行数据治理,删除无效数据,统一负荷数据的时间跨度和时间颗粒度;

对负荷数据进行最大值归一化;

X

其中x

具体的,最大值归一化是指将找到每组负荷数据中的最大值,并每个负荷数据与本组最大负荷数据相除,得到最大值均为1的负荷数据;

根据归一化后的数据可以得到归一化结果和时间折线图,如图4所示;

通过两步预处理,有效清除无效数据,提高数据准确性,简化后续计算,提高准确性。

数据处理模块:采用快速傅里叶变换处理若干组负荷数据生成频率-幅值图;

具体的,快速傅里叶变换处理根据公式:

X

式中,X

具体的,频率-幅值图也可称为周期-能量图,如图3所示,纵坐标为不同周期成分的能量,图3是由若干不同周期、不同强度的正弦波构成,某周期(频率)对应的能量越高,则该周期(频率)正弦波参与构成曲线的比例越高。

数据分析模块:用于根据频率-幅值图获取各组负荷数据的主要构成频率,根据主要构成频率和频率-幅值图生成候选特征集;

具体的,图3中的峰值所对应的频率,即主要构成频率。

作为本实施例的一种具体算例,在图3中主要构成频率为8736、6553、4368、3276、2184、1092、156、12、6和3等;

具体的,候选特征集中的数据为主要构成频率对应的幅值和相角;

具体的,根据实际需求可以在候选特征集中手动增加某段频率的幅值比;

比如,希望比较居民用户用电负荷与工商业用电负荷特征,可定义幅值a

本实施例中,选取8736、6553、4368、3276、2184、1092、156、12、6、3等周期的归一化幅值和相位作为候选特征,幅值记为“m”,相位记为“ph”,候选特征记为[‘8736m’,‘8736ph’,‘6553m’,‘6553ph’,……];

第一聚类模块:采用层次聚类法处理候选特征集得到第一聚类结果;

具体的,聚类接通过如图5所示,

以0/1/2/3分别代表不同类,则p1~p24分属类型为:

[0,1,1,2,0,2,1,3,1,1,2,0,0,1,2,1,3,0,1,0,1,1,2,0];

筛选模块:用于采用随机森林分类器处理第一聚类结果得到分类结果,根据分类结果设置重要限度值,根据重要限度值筛选分类结果得到特征数据集;

具体的,通过随机森林分类器得到的结果如图6所示;

根据图6预设重要度下限为0.025;筛除重要度低于该值的特征,将['2184m','8736m','6553m','3276ph','1092ph','6m','3ph','12ph','6ph','4368ph']作为保留特征。

具体的,重要度限值非固定值,也是无法预先计算的。只有根据上述特征重要度分析结果,进行初步设定,然后在后续迭代过程中修正。

第二聚类模块:采用层次聚类法处理特征数据集得到第二聚类结果;

具体的,第二次聚类结果如图7所示;

以0/1/2/3分别代表不同类,则p1~p24分属类型为:

[0,1,1,0,0,2,1,3,1,1,0,0,0,1,0,1,3,0,1,0,1,1,1,0];

第二聚类模块:采用层次聚类法处理特征数据集得到第二聚类结果;

迭代输出模块:用于将第一聚类结果与第二聚类结果进行比较,若吻合度大于等于预设值则输出特征数据集;

若吻合度小于预设值则返回筛选模块,降低重要限度值。

作为本实施例的一种优选实施方式,预设值为80%,考虑到原候选特征分类可能存在“过拟合”情况,且经过筛选后能够获得更为清晰的聚类结果,因此对筛选后保留的特征予以保留,作为该系列负荷数据的频域特征。

实施例3

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例1所述的一种负荷特征提取方法。

实施例4

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现实施例1所述的一种负荷特征提取方法。

由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

相关技术
  • 一种图像特征提取方法、装置、设备及可读存储介质
  • 一种热负荷预测方法、装置、可读介质及电子设备
  • 一种电力负荷监测方法、装置、设备及可读存储介质
  • 一种配电网的负荷转供方法、装置、终端设备及存储介质
  • 一种电力负荷匹配方法、装置、设备及可读存储介质
  • 家用负荷电气特征提取方法、装置及计算机可读存储介质
  • 家用负荷电气特征提取方法、装置及计算机可读存储介质
技术分类

06120116587271