掌桥专利:专业的专利平台
掌桥专利
首页

一种电价概率预测方法、系统、计算机设备和存储介质

文献发布时间:2023-06-19 09:35:27


一种电价概率预测方法、系统、计算机设备和存储介质

技术领域

本发明涉及电网电价预测领域,特别是涉及一种基于误差聚类的电价概率预测方法、系统、计算机设备和存储介质。

背景技术

目前,国家发展改革委、国家能源局确定的第一批8个电力现货市场建设试点全部进入试运行阶段,我国电力市场建设取得又一重要突破。随着电力行业市场化竞争程度逐步加深,基于节点电价理论的电力批发市场结算将随着市场条件的不同而发生变化,电价的波动性也会日益明显,如何进行科学准确的电价预测并能给出合理有效的风险评估对于市场主体来说显得十分重要。

国内外已有的电价预测研究成果主要集中在价格确定性的预测,极少涉及到其不确定性或风险性研究,其主要原因如下:一方面,周期性社会活动难以建模,容易引入电价预测误差,且总体上考虑误差并不能体现不同时段电价误差的特性;另一方面,预测得到的电价数据会应用于风险评估等大规模的优化问题上,考虑过多的风险场景会引入大量风险分析的工作量。在实际应用上,如果提供的电价预测方法只能保证电价预测的相对准确性,且只进行较简单的误差分析,而不能兼顾误差概率的分析精度和预测结果用于风险分析的可行性,其难以直接用于发电商的定价决策和风险评估。然而,发电商参与批发市场的报价策略往往基于对未来电价的预估,并希望通过其预测误差大小的不同可能性来评估决策风险。因此,引入科学可行的误差分布电价概率预测对于发电侧主体具有重要意义。

发明内容

本发明的目的是进行电价预测时,既能保证电价预测的科学准确和误差概率的分析精度,又能兼顾预测结果用于风险分析的可行性的效果。

为了实现上述目的,有必要针对上述技术问题,提供了一种电价概率预测方法、系统、计算机设备和存储介质。

第一方面,本发明实施例提供了一种电价概率预测方法,所述方法包括以下步骤:

根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;

根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;

采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;

根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;

根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。

进一步地,所述根据训练时段电价数据,采用预测模型预测得到第一电价预测数据的步骤之前包括:建立预测模型;

进一步地,所述预测模型为xgboost预测模型,所述建立预测模型的步骤包括:

初始化所述xgboost预测模型的参数和样本集权重;

根据所述样本集权重,迭代计算得到误差数据;

根据所述误差数据更新所述样本集权重。

进一步地,所述训练时段电价数据和所述目标时段电价数据均至少包括预测日类型、预测日周末标识、预测日负荷高峰时刻系统供需比、预测日系统负荷统计量、预测日系统负荷值、预测日前一天的历史电价统计量和历史电价值、预测日前两天的历史电价统计量和历史电价值;

所述第一电价预测数据为所述训练时段的电价预测值;

所述第二电价预测数据均为所述目标时段的电价预测值。

进一步地,所述根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征的步骤包括:

根据所述第一电价预测数据和所述训练时段电价数据,计算所述第一电价预测数据的误差;

采用logistic分布模型对所述第一电价预测数据的误差进行拟合,得到所述第一电价预测数据的误差特征。

进一步地,所述采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征的步骤包括:

根据第一电价预测数据的误差特征构建二维平面;

在所述二维平面上,随机选取特定数量中心点;

根据所述特定数量中心点,采用Kmeans聚类算法进行聚类分析,得到所述第一电价预测数据的中心特征。

进一步地,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤包括:

将所述第二电价预测数据与所述第一电价预测数据的中心特征的均值求和,得到所述目标时段的电价概率预测数据;所述中心特征包括均值和标准差。

进一步地,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤还包括:

将所述中心特征的均值与特定倍数所述中心特征的标准差求和或求差,得到目标时段不同置信水平的电价概率预测区间。

第二方面,本发明实施例提供了一种电价概率预测的系统,所述系统包括:

第一电价预测模块,用于根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;

电价误差分析模块,根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;

误差聚类分析模块,用于采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;

第二电价预测模块,用于根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;

电价预测修正模块,用于根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。

第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

上述本申请提供了一种电价概率预测方法、系统、计算机设备和存储介质,通过所述方法,实现了基于日类型、周末标识、预测日负荷高峰时刻的系统供需比、预测日系统负荷统计量、预测日各时刻点系统负荷值、预测日前一天和预测日前两天的历史电价统计量和历史电价值等训练时段电价数据进行预测,得到训练时段的电价预测值,采用分布模型拟合预测误差提取预测误差特征,再对误差特征进行聚类分析得到误差中心特征,并用其进行对目标时段电价预测数据进行修正得到对应的电价概率预测值和不同置信水平下的电价概率预测区间的效果。与现有技术相比,该方法在未来电价预测的应用上,给出预测日各时刻点电价预测值的同时,充分分析预测误差在不同时段的差异性,既能保证电价预测的科学准确和误差概率的分析精度,又能兼顾预测结果用于风险分析的可行性,对发电商的定价决策和风险评估有重大意义。

附图说明

图1是本发明实施例中电价概率预测方法的应用场景示意图;

图2是本发明实施例中电价概率预测方法的流程示意图;

图3是图2中步骤S11和步骤S14所使用的xgboost预测模型建立的流程示意图;

图4是图2中步骤S12采用logistic分布模型拟合误差特征的流程示意图;

图5是图2中步骤S13采用Kmeans聚类算法对误差特征聚类分析的流程示意图;

图6是图5中基于PJM数据测试集误差聚类效果示意图;

图7是图2中步骤S15电价预测值修正的流程示意图;

图8是图7中所述方法基于PJM日前数据测试集得到的90.51%置信水平的电价概率预测区间与实际电价曲线对比示意图;

图9是本发明实施例中电价概率预测系统的结构示意图;

图10是本发明实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案和有益效果更加清楚明白,下面结合附图及实施例,对本发明作进一步详细说明,显然,以下所描述的实施例是本发明实施例的一部分,仅用于说明本发明,但不用来限制本发明的范围。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的电价概率预测方法,可以应用于如图1所示的终端或服务器上。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器可生成最终的电价概率预测结果,将生成的电价概率预测结果发送至终端,终端接收到电价概率预测结果后,供终端的使用者查看分析。

在一个实施例中,如图2所示,提供了一种电价概率预测方法,包括以下步骤:

S11、根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;

S12、根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;

S13、采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;

S14、根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;

S15、根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。

其中,电价预测时使用的训练时段电价数据和目标时段电价数据均至少包括预测日类型、预测日周末标识、预测日负荷高峰时刻系统供需比、预测日系统负荷统计量、预测日系统负荷值、预测日前一天的历史电价统计量和历史电价值、预测日前两天的历史电价统计量和历史电价值等数据。由于前一天和前两天的电价数据与预测日的电价有着很强的相关性,基于该数据得到的预测日电价值是科学有效的。训练时段电价数据和目标时段电价数据中的预测日类型分别用1到7来标记星期一到星期日,预测日周末标识分别用0和1来标记工作日和周末,预测日系统负荷统计量包括负荷最小值、负荷均值和负荷最大值,预测日前一天和前两天的历史电价统计量包括电价最小值、电价均值和电价最大值。结合实际的电价预测场景,用户对预先收集到的相关电价数据进行清洗后,可按需将清洗后的数据以固定比例划分为训练时段电价数据、目标时间段电价数据,且具体每一天的电价都包括24小时各时刻点的电价,充分考虑同日不同时电价的差异性和异日同时电价的相关性,进而为目标时段预测日24小时电价预测结果的准确性提供很好的保证。

本申请实施例中考虑到同日不同时电价数据和预测误差的差异性,使用预测模型对训练时段内的各时刻点电价值进行预测得到对应各时刻点的电价预测值,并对各时刻的预测误差采用分布拟合得到对应各时刻点的误差特征,结合异日同时电价和预测误差的相关性,对各时刻点的误差特征聚类分析得到对应误差特征的中心特征,并依此对目标时段预测日各时刻点的电价预测值进行修正,给出可靠的电价概率预测值为发电商的定价决策提供了有力支持。将该方法应用于实际电价预测时,既保证了预测日各时刻点电价预测科学准确和误差概率的分析精度,又能有效避免因采用分时误差分析而引入过多的风险增加风险评估工作量的问题,进而做到了预测结果用于风险分析的可行性,对于发电商的定价决策和风险评估有重大意义。

在一个实施例中,如图3所示,所述预测模型为xgboost预测模型,建立预测模型的步骤包括:

S111、初始化所述xgboost预测模型的参数和样本集权重;

其中,xgboost模型的参数分为通用参数、Booster参数和学习目标参数三类,该实施例中重点关注树深、迭代次数和收缩长度的训练,其他参数均使用模型自带的默认值,并将训练集样本权重系数在初始化时置为相同,即假设有n个样本,则每个样本点的初始权重的百分值为100/n,后续根据每次得到的迭代误差分别对每个样本点的权重进行更新。

S112、根据所述样本集权重,迭代计算得到误差数据;

其中,第m次迭代误差err

w

S113、根据所述误差数据更新所述样本集权重。

其中,每次迭代完成需要使用当前迭代误差更新训练样本的权重,以保证分类误差大的样本将会被赋一个更高的权重,同时降低分类正确的样本权重,使用更新训练样本权重w

其中,a

本实施例中采用的xgboost预测模式是一种提升树模型,它将许多树模型集成在一起,形成一个很强的分类器,通过多线程实现了回归树的并行构建,在原有梯度提升树(Gradient Boosting)算法基础上加以改进,从而极大地提升了模型训练速度和预测精度,是一个准确率和运算效率都很高的预测模型,并且其分布式版本有广泛的可移植性,支持多个平台运行,可以很好的解决工业界规模预测的问题。本实施例选用xgboost模型对电价进行预测能够保证电价预测值的精准和预测过程的高效。

在一个实施例中,如图4所示,所述根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征的步骤S12包括:

S121、根据所述第一电价预测数据和所述训练时段电价数据,计算所述第一电价预测数据的误差;

其中,第一电价预测数据的误差用第一电价预测数据和训练时段电价数据的绝对误差来衡量,绝对误差E的计算公式如下:

E=P

P

S122、采用logistic分布模型对所述第一电价预测数据的误差进行拟合,得到所述第一电价预测数据的误差特征。

其中,第一电价预测数据的误差特征为训练时段内的各时刻点的均值和标准差。

Logistic分布模型是最重要且应用最广泛的非线性统计模型之一,其概率密度和累计密度函数分别为:

该分布模型对变量要求低,可以接受非正态分布的数据,且总体预测准确率较高,模型稳定,利于推广创新。本实施例中选用该模型对预测误差进行分布拟合可以得到准确率较高的特征参数,进而保证了误差分析的精准性。

在一个实施例中,如图5所示,所述采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征的步骤S13包括:

S131、根据第一电价预测数据的误差特征构建二维平面;

其中,二维平面上的点由训练时段各时刻点的误差特征的均值μ和标准差σ组成,记为(μ,σ)。

S132、在所述二维平面上,随机选取特定数量中心点;

其中,随机选取特定数量中心点即先确定聚类数,再随机选取与聚类数相同的点作为中心点。Kmeans聚类算法执行时选择合适的聚类数K非常关键,现有的K值选取方法有:(1)简单设置法,即直接用样本量n除以2再开方出来的值作为K值,具体公式为

上述5种方法都可以用于聚类数的选取,但都有其最佳适用场景,因此,在实际应用过程中使用者可以根据现有的数据规模和具体预测场景选取确定聚类数的方法。本实施例中考虑到聚类分析中数据集到各类中心点的总距离d会随着类数K的增加而下降的特性,结合实际电价预测分时误差数据的特点和误差分析的需求,在手肘法的基础上融入了拐点的特定选取方法来确定最佳聚类数,即先依据聚类数K和总距离d作出曲线图,将下一次总距离减少量小于上一次的1/6时的点置为曲线的拐点,将该拐点处对应的聚类数K确定为聚类分析的类数,该方法应用于PJM(PennsylvaniaNew JerseyMaryland)日前市场2020年1月至6月的数据测试集的误差分布聚类上得到了较好的聚类效果,具体请参见图6。

S133、根据所述特定数量中心点,采用Kmeans聚类算法进行聚类分析,得到所述第一电价预测数据的中心特征。

其中,Kmeans聚类分析中,使用的计算中心点μ

x

本实施例中采用的Kmeans聚类算法是一种收敛速度较快的聚类分析法,由于电价预测误差数据的同日不同时的差异性和异日同时的相关性可以保证簇内的密集性和簇之间的区别性,进而能够得到很好的聚类效果,获得准确的类中心特征用于对预测值的修正,进而得到科学合理的预测值。

在一个实施例中,如图7所示,所述根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据的步骤S15包括:

S151、将所述第二电价预测数据与所述第一电价预测数据的中心特征的均值求和,得到所述目标时段的电价概率预测数据;所述中心特征包括均值和标准差;

其中,目标时段内各时刻点的电价概率预测数据的计算公式为:

μ为各时刻点所属类的中心特征的均值,p

S152、将所述中心特征的均值与特定倍数所述中心特征的标准差求和或求差,得到目标时段不同置信水平的电价概率预测区间。

其中,目标时段不同置信水平的各时刻点电价概率预测区间[δ

δ

μ为各时刻点所属类的中心特征的均值,σ为各时刻点所属类的中心特征的标准差,n为与所取置信水平相对应的σ倍数。

本实施例中,基于异日同时误差的相关性,使用误差聚类分析得到的各时刻点中心特征,并使用中心特征的均值对预测值进行修正,可以有效的减少实际预测引入的误差,进而得到一个更精准的电价预测值,与此同时也给出了不同置信水平的电价概率预测区间,为发电商的报价决策和风险评估提供了有力的支撑,采用实施例所述方法基于PJM日前数据测试集得到的90.51%置信水平的电价概率预测区间与实际电价的对比如图8所示。

需要说明的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行,如果图2中步骤S14的位置是可以前移的,只要保证在步骤S11之后,步骤S15之前即可。

在一个实施例中,如图9所示,提供了一种电价概率预测系统,所述系统包括:

第一电价预测模块91,用于根据训练时段电价数据,采用预测模型预测得到第一电价预测数据;

电价误差分析模块92,用于根据所述第一电价预测数据,采用分布模型拟合得到第一电价预测数据的误差特征;

误差聚类分析模块93,用于采用聚类算法将所述第一电价预测数据的误差特征聚类分析,得到第一电价预测数据的中心特征;

第二电价预测模块94,用于根据目标时段电价数据,采用预测模型预测得到第二电价预测数据;

电价预测修正模块95,用于根据所述第一电价预测数据的中心特征修正所述第二电价预测数据,得到目标时段的电价概率预测数据。

关于电价概率预测系统的具体限定可以参见上文中对于电价概率预测方法的限定,在此不再赘述。上述电价概率预测系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图10示出一个实施例中计算机设备的内部结构图,该计算机设备具体可以是终端或服务器。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示器和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电价概率预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域普通技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算设备可以包括比途中所示更多或更少的部件,或者组合某些部件,或者具有同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。

综上,本发明实施例提供的一种电价概率预测方法、系统、计算机设备和存储介质,其误差聚类的电价概率预测方法在充分分析电价预测误差在不同时段差异性的基础上,提取出各时段误差分布的特征,再基于各时段的特征本身对其进行聚类操作,使用各类中心的特征得到准确的电价概率预测值和不同置信水平下的电价概率区间。该方法应用于实际的电价预测时,可以在不引入过多风险情形的前提下,给出精确的电价概率预测值和不同置信水平下的电价概率区间,既保证电价预测的科学准确和误差概率的分析精度,又兼顾了预测结果用于风险分析的可行性,给发电商的定价决策和风险评估提供了重要且有意义的依据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。

本说明书中的各个实施例均采用递进的方式描述,各个实施例直接相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统、计算机设备和存储介质的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种电价概率预测方法、系统、计算机设备和存储介质
  • 一种电价预测方法、系统和计算机可读存储介质
技术分类

06120112224707