掌桥专利:专业的专利平台
掌桥专利
首页

基于用户自身用电特点的自调整中长期负荷聚类预测方法

文献发布时间:2023-06-19 19:28:50


基于用户自身用电特点的自调整中长期负荷聚类预测方法

技术领域

本发明属于电网用电预测技术领域,具体涉及一种基于用户自身用电特点的自调整中长期负荷聚类预测方法。

背景技术

随着环境问题的日益加剧和化石能源的日益短缺,构建一个环境友好型的低碳电力系统已经势在必行。电力系统的首要目标是在最小化运行成本并满足各约束条件的前提下,满足负荷的需求,并力争达到供需平衡。然而,负荷自身的不确定性和随机性,以及新能源的间歇性和不稳定性,都为电力系统的供需平衡带来了挑战。在这种背景下,一个合理准确的中长期负荷预测模型将有助于了解负荷端需求,从而合理地进行发电侧规划,为供需平衡提供指引。

目前用于负荷预测的方法很多,包括回归分析法、灰色预测法、神经网络法等方法。其核心方法都是基于历史数据来建立预测模型,对未来负荷需求进行预测。这些方法虽然各有优势,但是这些方法都没有全面地考虑随机变量,且在面对多类随机的、模糊的信息时,没有办法提供精确度足够高的预测方案。另一方面,在对预测模型进行评估时,选取不同的评价指标往往会得到不同的评价结果,或者用同一指标在评价两个预测误差完全不同的模型时,会得到相同的评价结果,因此无法利用单一评价指标全面评价预测模型的精度。

发明内容

本发明的目的就是为了解决上述背景技术存在的不足,提供一种基于用户自身用电特点的自调整中长期负荷聚类预测方法,不受用电结构组成、地域特性、季节特性等影响因素的约束,可以根据每个用户自身的实际情况进行聚类预测,实现中长期负荷的精准预测。

本发明采用的技术方案是:一种基于用户自身用电特点的自调整中长期负荷聚类预测方法,包括以下步骤:

获取待测用户历史用电数据,构建待测用户的用电负荷数据库;

构建影响用户用电情况的影响因素集合以及评价预测模型结果的评价指标集合;

识别每个评价指标下影响用户用电情况的主要影响因素项集;利用待测用户的用电负荷数据库,分别针对每个评价指标下的每个主要影响因素项集,采用DNN模型进行待测用户的中长期用电负荷预测;

分别将每个评价指标下的每个主要影响因素项集相应的预测结果进行融合,得到基于每个评价指标的预测结果;再将得到的每个评价指标的预测结果进行融合,得到最终的预测结果。

上述技术方案中,还包括以下步骤:实时更新待测用户的用电负荷数据库;基于预测结果和实际用电负荷数据的偏差调整DNN模型;采用新的用电负荷数据库和调整后的DNN模型进行下一轮中长期负荷预测。

上述技术方案中,构建待测用户的用电负荷数据库的过程包括:收集待测用户过去5年、每年365天、共43800小时的每小时用电量,并剔除其中不合理的数据,形成待测用户的用电负荷数据库。

上述技术方案中,所述影响用户用电情况的影响因素集合包括:用电时间、尖峰时刻时段电价、高峰时段电价、平段电价、低谷时段电价、负荷消耗电力那一时刻的环境温度、周日期信息、节假日信息、待测用户的家庭人口组成、待测用户的房屋面积、待测用户的家庭收入和待测用户的家庭所有用电设备功率总和。

上述技术方案中,所述评价预测模型结果的评价指标包括:相对误差、平均绝对误差、平均绝对百分比误差、均方根误差、标准差误差、均方对数误差和预测有效度。

上述技术方案中,识别每个评价指标下影响用户用电情况的的主要影响因素项集的过程包括:设置最小支持度和最小置信度;针对不同的评价指标,生成相应的影响因素项集;每个影响因素项集为考虑待测用户特定用电状况的影响因素集合,每个影响因素项集中包含的影响因素不完全相同;调用Apriori算法,识别每个评价指标下影响终端用户用电的主要影响因素项集。

上述技术方案中,分别针对每个评价指标下的每个主要影响因素项集,采用DNN模型进行待测用户的中长期用电负荷预测的过程包括:

使用D-S证据理论,确定每个评价指标下的每个主要影响因素项集中各影响因素的权重;

基于每个评价指标下的每个主要影响因素项集及其相应的权重构建预测矩阵;

基于用电负荷数据库中负荷数据所对应的时间段获取预测矩阵相应的参数;通过每个评价指标下的每个主要影响因素项集参数和相应的负荷数据构建样本集;基于样本集调用DNN模型进行训练和预测,得到基于每个评价指标下的每个主要影响因素项集的预测结果。

上述技术方案中,分别将每个评价指标下的每个主要影响因素项集相应的预测结果进行融合,得到基于每个评价指标的预测结果;再将得到的每个评价指标的预测结果进行融合,得到最终的预测结果的过程包括:构建基于不同评价指标的不同影响因素项集的预测值矩阵;调用D-S证据理论,确定同一评价指标下不同主要影响因素项集预测值的权重;基于每个评价指标下主要影响因素项集预测值及其权重,融合计算每个评价指标的预测值;计算每个评价指标的预测值的预测值权重;基于每个评价指标的预测值及其权重进行融合计算,得到最终的预测结果。

上述技术方案中,基于预测结果和实际用电负荷数据的偏差调整DNN模型的过程包括:比较预测结果和实际数据的偏差,若在误差容许范围内,记录预测模型参数;若误差超出容许范围,返回重新筛选各评价指标的主要影响因素项集后,重新采用DNN模型进行待测用户的中长期用电负荷预测。

本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述技术方案所述基于用户自身用电特点的自调整中长期负荷聚类预测方法步骤。

本发明的有益效果是:本发明结合电力系统中不同终端用户自身的负荷特性,以该用户历史数据为基础,基于不同的评价指标构建不同的评价模型,每个评价模型拥有独特的影响因素项集,通过D-S证据理论,将多类随机的、模糊的信息进行融合。通过不断更新历史数据库来不断更改修正各模型的特征值及相应的特征值权重,达到对每一用户进行独立的中长期负荷预测的目标。本发明采用的方法不受用电结构组成、地域特性、季节特性等影响因素的约束,可以根据每个用户自身的实际情况进行聚类预测,可用于中长期负荷规划及相关专题分析的各种场合。

进一步的,本发明通过对待测用户的历史数据进行处理,剔除不合理的数据,进一步保证了预测模型的有效性以及准确性。

进一步的,本发明通过设置影响因素集合,充分考虑用电负荷的不确定性和随机性,应从多角度描述负荷的影响因素,进一步考虑待测用户的用电环境和习惯,提高预测模型的有效性。

进一步的,本发明通过设置评价指标集合,将基于不同影响因素项集生成预测模型进行融合,将多类随机的、模糊的信息进行融合,生成有效的预测结果。

进一步,本发明通过不断更新的负荷数据库,及时更新预测模型,不断深化本发明的预测精度。

进一步的,本发明通过实际数据与预测结果的比较实现待测模型的参数调整,保证本发明的预测精度。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的详细说明,便于清楚地了解本发明,但它们不对本发明构成限定。

如图1所示,本发明提供了一种基于用户自身用电特点的自调整中长期负荷聚类预测方法,包括以下步骤:

步骤1,获取待测用户历史用电数据,构建待测用户的用电负荷数据库;

步骤2,构建影响用户用电情况的影响因素集合以及评价预测模型结果的评价指标集合;

步骤3,识别每个评价指标下影响用户用电情况的主要影响因素项集;利用待测用户的用电负荷数据库,分别针对每个评价指标下的每个主要影响因素项集,采用DNN模型进行待测用户的中长期用电负荷预测;

步骤4,分别将每个评价指标下的每个主要影响因素项集相应的预测结果进行融合,得到基于每个评价指标的预测结果;再将得到的每个评价指标的预测结果进行融合,得到最终的预测结果。

步骤5,实时更新待测用户的用电负荷数据库;基于预测结果和实际用电负荷数据的偏差调整DNN模型;采用新的用电负荷数据库和调整后的DNN模型进行下一轮同时期中长期负荷预测。

具体地,步骤1中,收集待测用户过去5年、每年365天、共43800小时的每小时用电量,并提出其中不合理的数据,形成待测用户的用电负荷数据库,记为P。本具体实施例中剔除不合理数据的方法是:取某一数据点前5个数值和后5个数值,计算这11个点的标准差和期望值,若该点的期望值大于三倍标准期望值,则认为该点为异常数据。剔除异常数据后可以利用插值法根据前后数据趋势模拟出该点数值,作为正常数据使用。

具体地,步骤2中,所述影响用户用电情况的影响因素集合R包括:用电时间t、尖峰时刻时段电价p

其中,

待测用户的家庭人口组成F

其中,

和待测用户的家庭所有用电设备功率总和L。

其中,根据国家统计局发布的中国统计年鉴2021年版,将居民收入按人均可支配收入水平平均分为五个等份,即低收入(7868.8元),中等偏下(16442.7元),中等收入(26248.9元),中等偏上(41171.7元),高收入(80293.8元)。故本发明将家庭人均收入低于16442.7元的设置为低收入,即I

其中用电时间以小时为单位,按照时间段来进行划分。若输入数据为43800小时的数据,用电时间即为尖峰时段、高峰时段、平时段和低谷时段,用电时间会反映出用电动作发生在哪个时段。

所述评价指标集合Γ={Γ

具体地,步骤3具体包括以下步骤:

步骤3.1:由于不同的评价指标会从不同角度对预测模型进行评价,因此需要通过调用Apriori算法,识别基于不同评价指标的预测模型的主要影响因素项集。首先针对不同的评价指标,生成相应的影响因素项集;每个影响因素项集中包含的影响因素集合不完全相同。每个影响因素不一定会出现在所有的评价指标相应的影响因素项集中,每个评价指标适用的各个影响因素项集中,影响因素可能存在部分交集,不同的各个影响因素项集用于反映评价指标不同的特性。

设置最小支持度min

其中,

对于评价指标Γ

其中,R

步骤3.2:使用D-S证据理论(Dempster-Shafer Evidence Theory),确定第i个评价指标中第j个主要影响因素项集中第n个影响因素的权重p

记第i个评价指标的第j个主要影响因素项集的权重为P

N

步骤3.3:构建影响因素项集矩阵M。记基于第i个评价指标第j个主要影响因素项集的预测矩阵为M

步骤3.4:基于第i个评价指标第j个主要影响因素项集的预测矩阵为Μ

具体地,本具体实施例中,由于用户历史负荷数据集合中包括43800小时历史负荷数据,故需要获取该43800小时历史负荷数据相对应的各个主要主要影响因素项集中各个影响因素数据,即第i个评价指标的第j个主要影响因素项集中各个影响因素在过去43800小时相应的数据,通过上述历史负荷数据和预测矩阵中对应的数据生成样本集。

调用DNN(Deep Neural Network)模型,采用上述样本集分别进行训练和预测,得到i*j个预测结果。DNN函数可以表示为:

D=f

D

故基于第i个评价指标的第j个主要影响因素项集的预测结果D

D

其中,M

具体地,步骤4包括以下步骤:

所述步骤4中,使用D-S证据理论,确定基于每个评价指标的预测值D

步骤4.1:构建基于不同评价指标的不同主要影响因素项集的预测值D

D

步骤4.2:调用D-S证据理论,确定同一评价指标模型下不同主要影响因素项集预测值D

N

步骤4.3:针对单个评价指标,计算其对应的主要影响因素项集预测值融合结果,作为该评价指标的预测值D

步骤4.4:计算每一个评价指标预测值的权值P

步骤4.3:将每个评价指标通过DNN预测得到的结果进行融合,得到最终预测结果:

本具体实施例,基于D-S证据理论(Dempster-Shafer Evidence Theory),根据各评价指标之间的冲突程度,对基于不同评价指标而构建的预测模型进行权值分配,并依据分配后对应的比例进行融合。

具体地,步骤5包括以下步骤:

步骤5.1:验证预测数据是否通过。比较训练预测数据和实际数据的偏差,若在误差容许范围内,记录预测模型参数,则采用相应特征值及其权重对用户中长期负荷进行预测。

若误差超出容许范围,记录下各模型抽取的影响因素及各模型的权重值并返回步骤3.1,通过更改最小支持度和最小置信度来改变约束,重新筛选基于各评价指标的主要影响因素项集。

步骤5.2:基于预测模型进行中长期负荷预测,并随时更新用户负荷数据集合P。从而可进行预测模型自适应调整。

由于本具体实施实例的历史数据库即包含了待测用户过去5年(包含上一年度)、每年365天、共43800小时的每小时用电量信息,那么本具体实施例基于当前可以按照年度为单位输出针对当前年度的365天每天每小时的待测用户用电负荷预测结果,作为待测用户的中长期负荷预测。本具体实施实例的历史数据库以年为单位进行更改。即:假设目前基于2017,2018,2019,2020,2021年数据预测2026-2030年的负荷,当拿到2022年数据后,可以基于2018,2019,2020,2021,2022年的数据预测2027-2031年的数据。

本具体实施例是模拟数据结果如表1所示。表1列举了四种不同方法和本专利方法对同一组数据进行预测后的评价结果。可以看到,若以平均绝对百分误差(MAPE)和均方根误差(RMSE)对预测结果进行评价,则MAPE以及RMSE结果均需越小越好。如模拟数据结果所示,本发明与最优结果非常相近,而且本发明的优势是通过计算一定能得到与最优结果接近的预测值,不用尝试多种方法最后筛选出最优方法。

如表1所示,通过本发明的方法得到的结果均可以提供与真实值非常接近的结果。

表1不同方法预测误差统计

相比其他方法,本发明不仅考虑了多类随机的、模糊的变量,还可以确定得到与真实值非常接近的较优预测值。而其他方法可能无法考虑较多随机的、模糊的变量信息,或者在采用不同评估方法评估某一预测方案时可能会出现波动,甚至对于两个预测误差完全不同的模型得到相同的评价结果。本发明可以有效避免上述不足。

本发明结合电力系统中不同终端用户的负荷特性,以该用户历史数据为基础,基于不同的评价指标构建不同的评价模型,每个评价模型拥有独特的影响因素项集,通过D-S证据理论,将多类随机的、模糊的信息进行融合。通过不断更新历史数据库来不断更改修正各模型的特征值及相应的特征值权重,达到对每一用户进行独立的中长期负荷预测的目标。此方法不受用电结构组成、地域特性、季节特性等影响因素的约束,可以根据每个用户自身的实际情况进行聚类预测,可用于中长期负荷规划及相关专题分析的各种场合。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

技术分类

06120115921002