导航：首页> 燃烧发动机；热气或燃烧生成物的发动机装置>基于历史数据集时间跨度优化的光伏发电功率预测方法

基于历史数据集时间跨度优化的光伏发电功率预测方法

文献发布时间：2023-06-19 16:09:34

技术领域

本发明涉及光伏发电预测的技术领域，更具体地，涉及一种基于历史数据集时间跨度优化的光伏发电功率预测方法。

背景技术

光伏发电功率预测是高效利用太阳能资源的前提和基础，对提升光伏发电消纳能力，保障系统安全起着至关重要的作用。一个高效稳定的光伏发电系统，必然要对光伏发电功率进行预测，进而克服控制系统的滞后性，提升系统的效率，同时参照预测结果又能提前进行传统能源调度以达到电力系统的功率平衡，从而保障电力系统的安全稳定运行。在具体光伏发电功率预测的过程中，预测数值越准确，输出功率也就更加稳定，对电网造成的不良影响越小。

由于光伏发电系统受气象环境因素、太阳能资源变化的影响较大，具有较强的间歇性和波动性，对光伏发电功率的预测提出了挑战，从预测精度来看，即使目前存在各种智能算法应用于光伏发电预测中，但光伏发电功率预测的平均绝对百分比误差(MAPE)的整体水平仍在10％左右，商业应用的预测软件MAPE超过15％，与电力系统和工业产业的应用要求差距很大，更难以满足日益提高的光伏发电功率精度需求。

现有技术公开了一种发电功率预测方法，包括以下步骤：采集历史发电功率数据，并根据历史发电功率数据获取发电影响因素；对历史发电功率数据进行预处理，得到预处理后历史发电功率数据，然后根据发电影响因素和预处理后历史发电功率数据，建立发电功率预测模型，最后使用发电功率预测模型得到发电功率预测结果。在该方案中，历史数据的处理主要是对于历史发电功率数据中发电影响因素和数据本身的归一化处理、异常数据提出、缺失值补充以及降维处理等，在整个预测过程中，对于历史数据集，依据经验设定为一定时间跨度下的固定值或者笼统地选取所有已获得的数据，历史数据集选取方式粗糙，使得光伏发电功率的预测精度大受影响。实际上，历史数据集的选取对光伏功率预测起着关键性的作用，在实际预测中，获得的数据可能很多，但过多的选取历史数据，既增加了计算量又可能引入不必要的干扰，如果选取的历史数据集时间跨度太长，历史数据集的数目选取则较大，不仅仅会使得预测计算量增大，也有可能引入过期的干扰因素而影响预测精度，而选取的历史数据时间跨度过短，历史数据集的数目选取较少，则会使得有效的历史数据流失而使得预测能获得的信息量不够完整，同样也影响预测精度。

发明内容

为解决传统光伏发电预测时，由于历史数据集选取粗糙，导致计算量大及干扰大的问题，本发明提出一种基于历史数据集时间跨度优化的光伏发电功率预测方法，对历史数据集时间跨度进行优化，选取时间跨度下的最佳历史数据集数据样本数目，提高了光伏发电功率的预测精度。

为了达到上述技术效果，本发明的技术方案如下：

一种基于历史数据集时间跨度优化的光伏发电功率预测方法，所述方法包括以下步骤：

S1.确定用于光伏发电功率预测的历史功率数据来源，从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集，并对历史数据集进行预处理；

S2.基于已预处理的历史数据集，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

S3.以P为历史数据集的数据样本数按时间跨度方向增加的间隔，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

S4.判断历史数据集的数据样本数是否达到设置值，若是，执行步骤S5；否则，返回步骤S3；

S5.形成预测误差指标随历史数据集的样本数变化的趋势曲线，确定趋势曲线中的最低点，以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标；

S6.以P为历史数据集的数据样本数按时间跨度方向增加的间隔，将最低点对应的时间跨度下的历史数据集的数据样本数增加P，然后进行光伏发电功率预测，判断预测误差指标是否减小，若是，将历史数据集的数据样本数增加P，执行步骤S7；否则，以H为历史数据集的数据样本数按时间跨度方向减小的间隔，将历史数据集的数据样本数减少H，H≠P，执行步骤S7；

S7.判断历史数据集的数据样本数是否达到设置值，若是，形成预测误差指标随历史数据集的样本数变化的趋势曲线，确定趋势曲线中的拐点，以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测；否则，返回步骤S6。

优选地，在步骤S1中，从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集时，以历史功率数据来源对应的时间跨度为基础，自历史功率来源中选取最新近时刻开始的时间跨度下、具有若干数据样本数的数据集作为历史数据集。

优选地，所述的预处理操作包括对历史数据集中的数据进行数据清洗，以去除历史数据集中的异常数据和干扰。

优选地，所述的预处理操作还包括聚类，在聚类时，以光伏发电系统的运行工况和运行环境为聚类基础进行聚类。

优选地，在步骤S3及步骤S6中，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测前，数据样本数增加后的历史数据数据集也进行预处理操作。

优选地，光伏发电功率预测算法A为长短期记忆网络法LSTM或极限学习机ELM或非线性自回归神经网络NARX或支持向量回归SVR。

优选地，所述预测误差指标选用平均绝对百分比误差MAPE，计算平均绝对百分比误差MAPE的公式为：

其中，Y

优选地，平均绝对百分比误差MAPE越小，光伏发电功率预测结果越好，反之，光伏发电功率预测结果越差。

优选地，在步骤S5中，确定趋势曲线中的最低点时，通过多项式拟合的方式将趋势曲线拟合，然后获得趋势曲线的拟合表达式，根据拟合表达式确定确定趋势曲线中的最低点。

本申请还提出一种基于历史数据集时间跨度优化的光伏发电功率预测系统，所述系统包括：

数据预处理模块，确定用于光伏发电功率预测的历史功率数据来源，从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集，并对历史数据集进行预处理；

初始预测模块，基于已预处理的历史数据集，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

变换预测模块，以P为历史数据集的数据样本数按时间跨度方向增加的间隔，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

第一判断模块，用于判断历史数据集的数据样本数是否达到设置值，若是，形成预测误差指标随历史数据集的样本数变化的趋势曲线，确定趋势曲线中的最低点，以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标；否则，在变换预测模块中以P为历史数据集的数据样本数增减变换间隔，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

预测判断模块，以P为历史数据集的数据样本数按时间跨度方向增加的间隔，将最低点对应的时间跨度下的历史数据集的数据样本数增加P，然后进行光伏发电功率预测，判断预测误差指标是否减小，若是，将历史数据集的数据样本数增加P，输入第二判断模块；否则，以H为历史数据集的数据样本数按时间跨度方向减小的间隔，将历史数据集的数据样本数减少H，H≠P，输入第二判断模块；

第二判断模块，判断历史数据集的数据样本数是否达到设置值，若是，形成预测误差指标随历史数据集的样本数变化的趋势曲线，确定趋势曲线中的拐点，以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测；否则，返回预测判断模块。

与现有技术相比，本发明技术方案的有益效果是：

本发明提出一种基于历史数据集时间跨度优化的光伏发电功率预测方法，首先确定用于光伏发电功率预测的历史功率数据来源，以历史数据集在时间跨度下的样本数目作为调整对象，按时间跨度调整用于预测光伏发电功率的历史数据集的样本数据数目，在历史数据集的数据样本数设置值的限定下，获取预测误差指标随历史数据集的样本数变化的趋势曲线，在预测误差指标最优点附近搜寻最优的历史数据集样本数，根据调整后的历史数据集重新进行预测，往复进行，加快最佳历史数据集样本数的搜寻过程，直至选择最佳的历史数据集样本数目，该方案侧重于用于光伏发电功率预测的历史数据集的优化选取，提高了光伏发电功率预测精度，避免历史数据集选取粗糙，导致计算量大及干扰大的问题。

附图说明

图1表示本发明实施例1中提出的基于历史数据集时间跨度优化的光伏发电功率预测方法的流程示意图；

图2表示本发明实施例2中提出的利用长短期记忆网络法LSTM进行光伏发电预测时，预测误差指标随历史数据集的样本数变化的趋势曲线图；

图3表示本发明实施例2中提出的利用极限学习机ELM进行光伏发电预测时，预测误差指标随历史数据集的样本数变化的趋势曲线图；

图4表示本发明实施例2中提出的利用非线性自回归神经网络NARX进行光伏发电预测时，预测误差指标随历史数据集的样本数变化的趋势曲线图；

图5表示本发明实施例2中提出的利用支持向量回归SVR进行光伏发电预测时，预测误差指标随历史数据集的样本数变化的趋势曲线图；

图6表示本发明实施例3中提出的基于历史数据集时间跨度优化的光伏发电功率预测系统的结构图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好地说明本实施例，附图某些部位会有省略、放大或缩小，并不代表实际尺寸；

对于本领域技术人员来说，附图中某些公知内容说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

附图中描述位置关系的仅用于示例性说明，不能理解为对本专利的限制；

实施例1

在本实施例中，如图1所示，提出了一种基于历史数据集时间跨度优化的光伏发电功率预测方法的流程示意图，该方法包括以下步骤：

S2.基于已预处理的历史数据集，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

S4.判断历史数据集的数据样本数是否达到设置值，若是，执行步骤S5；否则，返回步骤S3；

整体上，首先确定用于光伏发电功率预测的历史功率数据来源，按时间跨度调整用于预测光伏发电功率的历史数据集的样本数据数目，在历史数据集的数据样本数设置值的限定下，获取预测误差指标随历史数据集的样本数变化的趋势曲线，在预测误差指标最优点附近搜寻最优的历史数据集样本数，根据调整后的历史数据集重新进行预测，往复进行，加快最佳历史数据集样本数的搜寻过程，直至选择最佳的历史数据集样本数目，在步骤S7中，所述的拐点即：若预测误差指标持续减小，将历史数据集样本数目继续增大，直至与前一次的预测误差指标比较，预测误差指标增大，则预测误差指标的拐点出现，拐点对应最佳历史数据集的样本数目；若预测误差指标持续增大，将历史数据集样本数目继续减少，通过光伏预测算法进行光伏发电功率预测，直至与前一次的预测误差指标比较，预测误差指标减小，则预测误差指标的拐点出现，拐点对应最佳历史数据集的样本数目。提高了光伏发电功率预测精度，避免历史数据集选取粗糙，导致计算量大及干扰大的问题。

实施例2

在本实施例中，为了考察历史数据集的时间跨度对光伏发电功率预测精度的影响，从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集时，以历史功率数据来源对应的时间跨度为基础，自历史功率来源中选取最新近时刻开始的时间跨度下、具有若干数据样本数的数据集作为历史数据集。具体的，选取某光伏电站2018年的180天光伏发电数据作为数据来源，共计1.2万个时间点的监测数据，在本实施例中，假设1.2万个时间点的最新近的时刻为t，则以最新近时刻t开始，选取2400个时间点数据作为光伏发电功率预测的历史数据集，并进行预处理操作，预处理操作包括对历史数据集中的数据进行数据清洗，以去除历史数据集中的异常数据和干扰，还包括聚类，在聚类时，以光伏发电系统的运行工况和运行环境为聚类基础进行聚类，有利于保证后续光伏发电功率预测的精度。在步骤S3及步骤S6中，P为历史数据集的数据样本数按时间跨度方向增加的间隔，代表着宏观上为历史数据集的时间跨度进行一个变换，也即是时间跨度的变动趋势，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测前，数据样本数增加后的历史数据数据集也进行预处理操作。

在本实施例中，光伏发电功率预测算法A为长短期记忆网络法LSTM或极限学习机ELM或非线性自回归神经网络NARX或支持向量回归SVR，预测误差指标选用平均绝对百分比误差MAPE，计算平均绝对百分比误差MAPE的公式为：

其中，Y

平均绝对百分比误差MAPE越小，光伏发电功率预测结果越好，反之，光伏发电功率预测结果越差。

比较利用长短期记忆网络法LSTM、极限学习机ELM、非线性自回归神经网络NARX、支持向量回归SVR算法进行光伏发电功率预测的预测误差指标，如图2～5所示，实线为预测误差指标MAPE，在确定趋势曲线中的最低点时，通过多项式拟合的方式将趋势曲线拟合，然后获得趋势曲线的拟合表达式，根据拟合表达式确定确定趋势曲线中的最低点，图2～图5中，虚线为多项式拟合的误差变化趋势。由图2～图5可知，随着历史数据集样本增加，预测误差指标也会发生变化，并呈现出一定的变化趋势，而预测误差在此趋势的上下波动。可见，历史数据集样本数并不是越多越好，而是有个最佳的值，使得光伏发电预测的误差最小。不同的预测算法受到历史数据集时间跨度的影响也不同，四种预测算法中，随着历史数据集样本数的增加，除了SVR误差还有持续降低的趋势外，其他三种算法都有误差降低然后变高的趋势，可见恰当地选择历史数据集，可以有效提升光伏发电预测精度。

表1为历史数据集数据样本数目长度对光伏发电功率预测误差的影响量，其中最大误差和最小误差分别为改变历史数据集长度进行预测，在此区间内可能产生的最大误差和最小误差，精度提升量为两者之差，可见通过调整历史数据集长度，有很大的预测精度提升可能。趋势线最大误差和趋势线最小误差及其精度提升量标明了通过历史数据长度的调整可以整体上提升预测精度。

表1

选用平均绝对百分比误差MAPE作为衡量光伏发电功率预测效果好坏的指标，MAPE越小，说明预测结果越好，反之则越差。整体过程分为数据预处理、搜寻MAPE变化趋势的最低点和搜寻最佳历史数据集三个步骤。数据预测主要是对历史数据进行数据清洗和归类，去除数据集中的异常数据和外界特殊干扰，聚类分析对光伏发电系统运行工况和运行环境相近的数据归集到一起进行预测。为了选取最佳的历史数据集，需要选取一定数据的数据对预测算法进行验证，作为衡量预测算法的标准，一般选用最新近的数据来进行检验。对选定的历史数据集进行光伏发电功率预测，并计算出其MAPE，然后增加历史数据集的样本数目，继续进行预测，如此循环多次，获得MAPE的变化趋势。通过曲线模拟(如高次多项式模拟)获得MAPE变化趋势的表达式，进而获得MAPE变化趋势的最低点。最佳的历史数据集样本数目在此最低点附近，因此通过比较搜索的方式来搜索最佳的历史数据集样本数。首先增大或减少历史数据集样本数，进行预测之后与上一次的预测MAPE相比较，如果MAPE减小，则继续增大或减少样本数，反之则改变历史数据集调整方向调整历史数据集，直到找到MAPE的拐点，即局部最低点，该点即为最佳历史数据样本数目点。

实施例3

如图6所示，本申请还提出了一种基于历史数据集时间跨度优化的光伏发电功率预测系统，所述系统包括：

数据预处理模块101，确定用于光伏发电功率预测的历史功率数据来源，从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集，并对历史数据集进行预处理；

初始预测模块102，基于已预处理的历史数据集，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

变换预测模块103，以P为历史数据集的数据样本数按时间跨度方向增加的间隔，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

第一判断模块104，用于判断历史数据集的数据样本数是否达到设置值，若是，形成预测误差指标随历史数据集的样本数变化的趋势曲线，确定趋势曲线中的最低点，以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标；否则，在变换预测模块中以P为历史数据集的数据样本数增减变换间隔，将历史数据集的数据样本数增加P，利用光伏发电功率预测算法A进行光伏发电功率预测，并计算光伏发电功率预测结果的预测误差指标；

预测判断模块105，以P为历史数据集的数据样本数按时间跨度方向增加的间隔，将最低点对应的时间跨度下的历史数据集的数据样本数增加P，然后进行光伏发电功率预测，判断预测误差指标是否减小，若是，将历史数据集的数据样本数增加P，输入第二判断模块；否则，以H为历史数据集的数据样本数按时间跨度方向减小的间隔，将历史数据集的数据样本数减少H，H≠P，输入第二判断模块；

第二判断模块106，判断历史数据集的数据样本数是否达到设置值，若是，形成预测误差指标随历史数据集的样本数变化的趋势曲线，确定趋势曲线中的拐点，以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测；否则，返回预测判断模块。

显然，本发明的上述实施例仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

完整全部详细技术资料下载