掌桥专利:专业的专利平台
掌桥专利
首页

一种短期电力量测数据的预测方法及系统

文献发布时间:2023-06-19 19:30:30


一种短期电力量测数据的预测方法及系统

技术领域

本发明涉及电力量测数据的预测技术领域,特别是涉及一种短期电力量测数据的预测方法及系统。

背景技术

随着新型电力系统的建设,电网的设备运维、运行调度、客户营销和安全监督等环节信息化、数据化程度提升,更高细粒度的负荷预测成为新型电力系统运行控制和管理的重要技术之一。通过分析数据中蕴涵的信息,电力行业从业者和研究者可以对电力行业的供需关系作出更精确的调度,为此,本发明提出一种针对客户(发电客户或负荷客户)的短期电力量测数据进行预测的数据挖掘模型,提升量测数据在新型电力系统建设中的应用价值。

在学术和科研领域,已有不少研究论文或专利成果将数据科学领域的创新技术,如神经网络、深度学习等,应用于解决电力量测数据预测/修复问题。但是,当前技术一般使用监督学习的方法训练回归器模型用以预测未来电力数据,包括多元线性回归、神经网络或LSTM等算法模型。以上模型训练完成后参数和输出都是固定的,若用于预测则会使模型缺少随机性。

发明内容

本发明的目的在于,提出一种短期电力量测数据的预测方法及系统,如何优化了模型训练的流程,更快搜寻到高精度预测的参数集合的技术问题。

一方面,提供一种短期电力量测数据的预测方法,包括:

获取全量样本数据,并对获取的全量样本数据进行预处理,;

将预处理后的全量样本数据作为输入项输入预先训练的序列生成对抗网络模型,得到预测的数据序列;

其中,所述预先训练的序列生成对抗网络模型内至少包括一预先训练的生成器,所述生成器根据从左到右的预设策略进行序列生成,用于提取输出单元与之前时刻相关信息的特征信息并生成预设长度的数据序列。

优选地,所述全量样本数据至少包括从电力量测系统数据库随机抽取的多个用户日电量数据及用户连续多个用电周期的用电数据,并将抽取的一个用户的日电量数据及该用户连续多个用电周期的用电数据作为一个样本,其中,每个样本之间的时间参数为连续设置。

优选地,所述生成器内至少设置一个生成策略、一个采样策略及一个判别器,

所述判别器基于输入项中的电力量测数据训练所述生成策略,并初始化所述生成策略中的参数。

优选地,所述预先训练的序列生成对抗网络模型通过以下过程进行训练:

从全量样本数据中按照预设比例随机抽取数据作为测试数据并将其余数据作为训练数据;

将所述训练数据作为输入项输入预设的序列生成对抗网络模型,通过所述训练数据对预设的生成器和判别器进行训练,直到生成器和判别器的损失函数梯度下降参数同时低于预设的参数水平值,输出训练好的序列生成对抗网络模型。

优选地,,所述通过所述训练数据对预设的生成器和判别器进行训练具体包括:

生成器从左到右的策略对输入的训练数据进行处理,生成训练数据序列;

将生成的训练数据序列重新拼接到输入的所述训练数据后面,形成完整的虚拟序列样本;

其中,生成器将目前为止已生成的训练数据序列作为当前状态,将下一个要生成的训练数据序列作为采取的动作;所述生成器生成多个序列中的每一个数据时,都使用判别器计算一次已生成的训练数据序列和测试数据中对应的多个项数据间的交叉熵,输出为对应时刻采取的动作的奖励;当生成完整的序列后,将所有项交叉熵进行累加,作为生成器在当前判别器参数下的损失函数。

优选地,所述通过所述训练数据对预设的生成器和判别器进行训练还包括:

将测试数据和训练数据作为判别器的预训练数据,通过训练后的生成器对所述预训练数据生成对应的虚拟序列样本,以该虚拟序列样本的交叉熵作为目标函数预训练判别器。

优选地,所述生成器根据从左到右的预设策略进行序列生成包括:

S=(h1;…;h

G

其中,LSTM表示生成器,C

优选地,所述生成器在当前判别器参数下的损失函数包括:

用该公式更新生成器参数θ:

其中,θ表示生成器参数,φ表示判别器参数,s表示当前生成器进行数据预测状态,y

优选地,根据以下目标函数预训练判别器:

其中,φ表示判别器的模型参数,

另一方面,还提供一种短期电力量测数据的预测系统,用以实现所述的方法,包括:

预处理模块,用以获取全量样本数据,并对获取的全量样本数据进行预处理,;

预测模块,用以将预处理后的全量样本数据作为输入项输入预先训练的序列生成对抗网络模型,得到预测的数据序列;

其中,所述预先训练的序列生成对抗网络模型内至少包括一预先训练的生成器,所述生成器根据从左到右的预设策略进行序列生成,用于提取输出单元与之前时刻相关信息的特征信息并生成预设长度的数据序列。

综上,实施本发明的实施例,具有如下的有益效果:

本发明提供的短期电力量测数据的预测方法及系统,引入强化学习中的动作价值和状态价值概念,使训练的生成网络可以针对原数据中对于预测性能有不同影响的区间赋予权重,强化其中对于数据预测价值较高的区间,使模型更好地学习历史数据中数据的隐性规律,提升模型的数据预测性能和普适性,使模型对领域知识的需求更少,符合细粒度的、高随机性的数据预测场景。在电力量测数据的预测任务上使用序列生成对抗模型,使预测模型灵活性更大,突破数据预测任务的模型瓶颈;在模型中,生成器数据输入判别器之前进行蒙地卡罗搜索树和采样策略对生成序列进行逐步评分、采样,考虑后续多步的价值而不只是单步价值,优化了模型训练的流程,使其更快搜寻到高精度预测的参数集合。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。

图1为本发明实施例中一种短期电力量测数据的预测方法的主流程示意图。

图2为本发明实施例中一种短期电力量测数据的预测系统的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。

如图1所示,为本发明提供的一种短期电力量测数据的预测方法的一个实施例的示意图。在该实施例中,所述方法包括以下步骤:

步骤S1,获取全量样本数据,并对获取的全量样本数据进行预处理,;

步骤S2,将预处理后的全量样本数据作为输入项输入预先训练的序列生成对抗网络模型,得到预测的数据序列;

其中,所述预先训练的序列生成对抗网络模型内至少包括一预先训练的生成器,所述生成器根据从左到右的预设策略进行序列生成,用于提取输出单元与之前时刻相关信息的特征信息并生成预设长度的数据序列。所述生成器内至少设置一个生成策略、一个采样策略及一个判别器,所述判别器基于输入项中的电力量测数据训练所述生成策略,并初始化所述生成策略中的参数。

具体实施例中,步骤S1中,所述全量样本数据至少包括从电力量测系统数据库随机抽取的多个用户日电量数据及用户连续多个用电周期的用电数据,并将抽取的一个用户的日电量数据及该用户连续多个用电周期的用电数据作为一个样本,其中,每个样本之间的时间参数为连续设置。也就是,从电力量测系统数据库获取随机抽取N个用户日电量数据连续T个周期(T日)的用电数据,每个样本时间必须连续,类型为单变量序列数据,对全量样本数据使用softmax函数进行归一化处理,统一量纲,缺失值、极端值不需清洗。

具体实施例中,步骤S2中,所述预先训练的序列生成对抗网络模型通过以下过程进行训练:

从全量样本数据中按照预设比例随机抽取数据作为测试数据并将其余数据作为训练数据;

将所述训练数据作为输入项输入预设的序列生成对抗网络模型,通过所述训练数据对预设的生成器和判别器进行训练,直到生成器和判别器的损失函数梯度下降参数同时低于预设的参数水平值,输出训练好的序列生成对抗网络模型。

也就是,初始化序列生成对抗网络模型(Sequence Generative AdversarialNetwork),其中生成器包含一个生成策略G

具体地,所述通过所述训练数据对预设的生成器和判别器进行训练具体包括:生成器从左到右的策略对输入的训练数据进行处理,生成训练数据序列;将生成的训练数据序列重新拼接到输入的所述训练数据后面,形成完整的虚拟序列样本;其中,生成器将目前为止已生成的训练数据序列作为当前状态,将下一个要生成的训练数据序列作为采取的动作;所述生成器生成多个序列中的每一个数据时,都使用判别器计算一次已生成的训练数据序列和测试数据中对应的多个项数据间的交叉熵,输出为对应时刻采取的动作的奖励;当生成完整的序列后,将所有项交叉熵进行累加,作为生成器在当前判别器参数下的损失函数。可理解的,上述步骤中,生成策略基于长短期记忆神经网络(Long-Short TermMemory,LSTM)生成。生成器采用从左到右的策略进行序列生成,基于长短期记忆神经网络(Long-Short Term Memory,LSTM)用于提取输出单元与之前时刻相关的特征信息,前馈神经网络生成长度为T-t的数据序列。生成器可用其他前向序列生成算法代替,如RNN等,但在本发明面向的对象数据集上不使用存在后向相关性假设的算法,如双向长短期记忆模型。

本实施例中,所述生成器根据从左到右的预设策略进行序列生成包括:

S=(h1;…;h

Gθ:C

其中,LSTM表示生成器,C

其中,生成器训练:将生成器生成序列的过程理解为一个强化学习中的序列决策过程。生成器被看作一个决策智能体,目前为止已生成的序列表示当前状态,下一个要生成的数据则是采取的动作,在生成器生成T-t个序列中的每一个数据时,都使用判别器计算一次已生成序列S

使用策略梯度更新优化生成器:只考虑每一个生成数据的状态价值的公式如下:

其中,

使用似然比率(likelihood ratios)建立上述公式的无偏估计,实现公式的展开,等效于累加生成器每一个动作的奖励函数:

用该公式更新生成器参数θ:

以上公式中,θ表示生成器参数,φ表示判别器参数,s表示当前生成器进行数据预测状态,a表示生成器进行数据预测的动作,α表示生成器参数学习率,,y

上述展开使动作价值公式从原来的只考虑最终序列的状态改进为考虑单步的动作价值以及其对后续步骤的状态价值的总和。

策略梯度具体实现如下:使用蒙地卡罗搜索树方法对要生成的T-t个样本进行采样:

和/>

具体地,将测试数据和训练数据作为判别器的预训练数据,通过训练后的生成器对所述预训练数据生成对应的虚拟序列样本,以该虚拟序列样本的交叉熵作为目标函数预训练判别器。可理解的,判别器基于卷积神经网络(Convolutional Neural Network,CNN)搭建。使用最大似然估计方法(MLE)基于模型输入数据S预训练生成策略G

具体地,根据以下目标函数预训练判别器:

其中,φ表示判别器的模型参数,

其中,φ表示判别器的模型参数,

本实施例中,重复上述生成器和判别器的训练过程,直到整个序列生成对抗网络收敛,即生成器和判别器损失函数梯度下降

如图2所示,本发明还提供一种短期电力量测数据的预测系统,用以实现所述短期电力量测数据的预测方法,包括:

预处理模块,用以获取全量样本数据,并对获取的全量样本数据进行预处理,;

预测模块,用以将预处理后的全量样本数据作为输入项输入预先训练的序列生成对抗网络模型,得到预测的数据序列;

其中,所述预先训练的序列生成对抗网络模型内至少包括一预先训练的生成器,所述生成器根据从左到右的预设策略进行序列生成,用于提取输出单元与之前时刻相关信息的特征信息并生成预设长度的数据序列。

需说明的是,上述实施例所述系统与上述实施例所述方法对应,因此,上述实施例所述系统未详述部分可以参阅上述实施例所述方法的内容得到,此处不再赘述。

综上,实施本发明的实施例,具有如下的有益效果:

本发明提供的短期电力量测数据的预测方法及系统,引入强化学习中的动作价值和状态价值概念,使训练的生成网络可以针对原数据中对于预测性能有不同影响的区间赋予权重,强化其中对于数据预测价值较高的区间,使模型更好地学习历史数据中数据的隐性规律,提升模型的数据预测性能和普适性,使模型对领域知识的需求更少,符合细粒度的、高随机性的数据预测场景。在电力量测数据的预测任务上使用序列生成对抗模型,使预测模型灵活性更大,突破数据预测任务的模型瓶颈;在模型中,生成器数据输入判别器之前进行蒙地卡罗搜索树和采样策略对生成序列进行逐步评分、采样,考虑后续多步的价值而不只是单步价值,优化了模型训练的流程,使其更快搜寻到高精度预测的参数集合。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

技术分类

06120115934293