掌桥专利:专业的专利平台
掌桥专利
首页

一种光伏发电功率预测方法及预测系统

文献发布时间:2024-01-17 01:26:37


一种光伏发电功率预测方法及预测系统

技术领域

本发明属于电力能源技术领域,具体涉及一种光伏发电功率预测方法及预测系统。

背景技术

光伏发电是太阳能开发利用的主要形式之一,具有清洁、分布广泛等特点。然而,由于太阳能具有的波动性、间歇性等问题,大规模高比例光伏发电并网势必对电力系统的安全稳定运行带来极大风险。光伏发电功率预测是消除威胁维护电网安全稳定的关键技术之一,可用于电网调度、平滑控制、故障检测,能平衡电力能源供需,提高电网运行的经济性,推进光伏电站智能化和智能电网的建设。因此,精确可靠的光伏发电出力预测对于大规模光伏电站并网和电力系统的可靠运行具有重要意义。

目前常见的光伏发电功率预测方法主要有物理法、回归法、灰色预测法、时间序列法和机器学习法。机器学习法是目前最流行的预测方法,可以完成回归、时间序列挖掘等任务。深度学习是机器学习技术最新的研究领域,得益于学界近几年深入的研究,深度学习已经在图像识别、自然语言处理等多种领域有了成功的应用,目前深度学习技术已经初步应用到光伏发电功率预测中。LSTM是一种时间递归神经网络,适合于处理和预测时间序列,LSTM已经在语音识别、视频分析等领域有了多种应用,但是在光伏发电功率预测中的应用仍具有很大的优化空间。

有鉴于此,特提出本发明。

发明内容

本发明所要解决的技术问题是,针对现有技术的不足,提供一种基于改进K-means聚类和Attention-LSTM网络模型的光伏发电功率预测方法。

为解决上述技术问题,本发明所采用的技术方案是:一种光伏发电功率预测方法,包括以下步骤:

获取光伏电站的原始气象数据和光伏出力数据;

计算光伏电站的原始气象数据和光伏出力数据中历史功率数据的平均值、标准差、偏态系数和峰度作为改进K-means算法的输入因子,采用改进K-means算法对该输入因子进行聚类分析,计算不同聚类类别中气象数据与发电功率的相关度;

将与发电功率相关度大于0.6的气象数据作为预测模型的输入因子输入Attention-LSTM模型,训练模型获取最优参数,输出最终预测结果。

优选地,所述原始气象数据包括下述中的至少一种:总辐照度、法向直射辐照度、水平面散射辐照度、气温、气压和相对湿度。

优选地,所述一种光伏发电功率预测方法,还包括对所述光伏电站的原始气象数据和光伏出力数据进行预处理,所述预处理包含数据清洗、缺失值的插补步骤、删除缺失数据以及异常值的识别与处理。

优选地,所述删除缺失数据是将连续缺失16个时刻以上的数据视为缺失数据做删除处理;所述异常值的识别与处理是利用箱线图识别异常值,并用K近邻互补法进行处理。

优选地,所述改进K-means算法的输入因子包括平均功率值、功率标准差、功率标准离差率、功率偏态系数、功率峰度和总功率值,所述平均功率值、功率标准差、功率标准离差率、功率偏态系数、功率峰度和总功率值的计算公式如下:

①平均功率值

②功率标准差σ的公式如下:

③功率标准离差率c

④功率偏态系数Skew(P)的公式如下:

⑤功率峰度Kurtosis(P)的公式如下:

⑥总功率值Sum(P)的公式如下:

上述公式中,N为每天选取的样本功率个数,p为功率,i为数据集中第i天,N为数据总数。

优选地,所述改进K-means算法是基于原始K-means算法,对随机选取初始聚类中心进行改进,包括如下步骤:

在样本集中随机选取一个样本点作为初始的聚类中心z

计算除初始聚类中心z

根据概率的计算结果,按照轮盘法选出下一个聚类中心,重复第二步直至选出K个聚类中心。

优选地,所述计算不同聚类类别中气象数据与发电功率的相关度包括:

其中r表示相关度,y

优选地,所述预测模型的输入因子为与发电功率的相关度大于0.6的气象数据。

优选地,所述将获取的输入因子输入Attention-LSTM模型,训练模型获取最优参数,输出最终预测结果包括:

以LSTM的隐层输出向量H={h

e

其中:W

将注意力机制权值α

h′

从而得到引入注意力机制的隐层特征向量H'={h′

本发明还提供了一种光伏发电功率预测系统,包括:

构建数据库,配置为获取光伏电站的原始气象数据和光伏出力数据;

构建改进K-means算法模型,配置为计算光伏电站的原始气象数据和光伏出力数据中历史功率数据的平均值、标准差、偏态系数和峰度作为改进K-means算法的输入因子,采用改进K-means算法对该输入因子进行聚类分析,计算不同聚类类别中气象数据与发电功率的相关度;

构建基于改进K-means聚类和Attention-LSTM的网络模型,配置为将与发电功率相关度大于0.6的气象数据作为预测模型的输入因子输入Attention-LSTM模型,训练模型获取最优参数,输出最终预测结果。

优选地,一种光伏发电功率预测系统,还包括:

构建预处理模块,配置为对所述光伏电站的原始气象数据和光伏出力数据进行预处理,

所述预处理包含数据清洗、缺失值的插补步骤、删除缺失数据以及异常值的识别与处理;

所述删除缺失数据是将连续缺失16个时刻以上的数据视为缺失数据做删除处理;所述异常值的识别与处理是利用箱线图识别异常值,并用K近邻互补法进行处理。

本发明还提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1-7中任一所述的光伏发电功率预测方法。

与现有技术相比,本发明的有益效果如下:

本发明提供基于改进K-means算法和注意力机制(Attention)与LSTM相结合的光伏发电功率预测方法,采用改进K-means聚类算法对原始数据进行聚类处理,采用Attention-LSTM对不同聚类类别的光伏数据进行训练模型最优参数,将测试集输入最优模型输出最终结果,从而有效提高光伏发电功率的预测精度,为清洁能源多能互补系统短期发电计划提供一定的依据。其中,改进后的K-Means算法具有算法简单、易于实现、易于扩展,能够处理大数据集的优点外,还在一定程度上降低了传统K-Means算法对初始值的依赖,提高了算法的效率和稳定性。LSTM具有较强的时间序列特征提取能力,当预测时间范围增大时,LSTM比传统预测模型更具有优势;LSTM对时间序列进行特征提取,其隐层会输出成百上千的特征量,使用注意力机制可以自动关注特征量中的有用项,减小无用项对模型的影响,进一步提高了特征提取的质量。基于上述算法的组合优化,能够规避单一预测方法的预测风险,提升预测精度,增强预测模型的稳定性。

将本发明基于改进K-means聚类和Attention-LSTM网络模型应用到某光伏电站的预测,结果显示:与单一LSTM网络模型、基于改进K-means聚类和BP神经网络模型的预测效果相比较,当功率波动不大时三种模型的预测结果都比较好,但是组合BP模和Attention-LSTM模型的RMSE和R

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是实施例基于改进K-means算法和注意力机制与LSTM相结合的光伏发电功率预测方法;

图2是实施例改进K-means算法的原理图;

图3是实施例Attention-LSTM算法的原理图;

图4a-4c是实施例预测结果与真实结果的对比图。

具体实施方式

为了更好地理解本发明,下面结合实施例进一步清楚阐述本发明的内容,但本发明的保护内容不仅仅局限于下面的实施例。在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明可以无需一个或多个这些细节而得以实施。

如图1所示,一种基于改进K-means聚类和Attention-LSTM网络模型光伏发电功率预测方法,包括以下步骤:

获取光伏电站的原始气象数据和光伏出力数据,对光伏电站的原始气象数据和光伏出力数据进行预处理;

根据预处理后的光伏电站的原始气象数据和光伏出力数据,计算平均功率值、功率标准差、功率标准离差率、功率偏态系数、功率峰度和总功率值,作为改进K-means算法的输入因子,利用改进K-means算法对前述输入因子进行聚类分析,计算不同聚类类别中气象数据与发电功率的相关度;

将相关度大于0.6的气象数据作为预测模型的输入因子输入Attention-LSTM模型,训练模型获取最优参数,输出最终预测结果。

如图2所示,改进K-means算法是基于原始K-means算法,对随机选取初始聚类中心进行改进,包括如下步骤:

在样本集中随机选取一个样本点作为初始的聚类中心z

计算除初始聚类中心z

根据概率的计算结果,按照轮盘法选出下一个聚类中心,

若达到给定的类数,则按样本点到聚类中心最小的原则进行分类,更新聚类中心,计算聚类效果评价函数,直至满足终止条件;

若未达到给定的类数,则重复第二步的直至选出K个聚类中心,满足终止条件。

如图3所示,Attention-LSTM模型使用每一个时刻的气象数据(X

以下为应用本发明提供的基于改进K-means算法和注意力机制(Attention)与LSTM相结合的光伏发电功率预测方法的具体案例说明。

步骤一:获取数据。采用华中某省份光伏电站数据,时间跨度为2019年1月1日至2020年12月31日。数据中所包含的内容有此光伏电站的历史发电功率、对应时间点的总辐照度、法向直射辐照度、水平面散射辐照度、气温、气压和相对湿度,时间分辨率为15分钟。

步骤二:数据预处理。该气象站点无缺失数据,对于异常数据利用箱线图进行识别。由于气象数据具有很强的随机性,因此本发明对于单个异常值,利用K近邻互补法进行处理,K值取2,对于连续异常值,不进行处理。

步骤三:改进K-means算法聚类。选取K值为2,3,4,5进行聚类试验,不同K值下的聚类效果如表1所示:

表1不同K值下的聚类效果

根据表1可知,当K值为2时的平均轮廓系数最小,但是有8个样本点的轮廓系数为负数,而K值为3时的轮廓系数为0.7442略小于0.7616,并且仅有2个样本点的轮廓系数为负数,因此综合考虑以上两个因素后,确定选取K值为3。

通过使用改进K-means算法对历史发电功率的统计数据进行聚类后的结果为:第一种类型总共包含71天,第二种类型总共包含138天,第三种类型总共包含154天,聚类中心信息如表2所示,具体的聚类效果如图4a、图4b和图4c所示。

表2聚类中心信息

通过聚类结果图可以看出,将聚类算法的K值选为3是较为合理的,从聚类效果来看这三种类型有着明显的区别,第一类的功率变化最为剧烈,第二类的功率相对于第一类而言波动较小,第三类的功率变化最为平缓。

步骤四:筛选预测模型的输入因子。对于不同类型的气象数据,均选择总辐照度、法向直射辐照度、水平面散射辐照度和气温作为输入因子。

步骤六:基于改进K-means聚类和注意力机制-LSTM的模型训练与对比分析。分别采用单一LSTM网络模型、基于改进K-means聚类和BP神经网络模型、基于改进K-means聚类和Attention-LSTM网络模型对三种类型下的光伏功率进行预测。

为了更好地比较各模型预测的效果,以上三种模型均采用单隐藏层网络且隐藏层神经元个数保持一致。

使用均方根误差RMSE和决定系数R

其中:P

三种预测模型在不同类型下预测效果的评价指标计算结果如表3所示:

表3不同模型的预测效果

从上述比较结果可知:(1)当功率波动不大时,三种模型的预测结果都比较好,但是基于改进K-means聚类和BP神经网络模型和基于改进K-means聚类和Attention-LSTM网络模型的RMSE和R

综上,基于改进K-means聚类和Attention-LSTM网络模型能够更有效地提高光伏功率预测的精度,具有显著的工程应用价值。

本发明还提供了一种光伏发电功率预测系统,包括:

构建数据库,配置为获取光伏电站的原始气象数据和光伏出力数据;

构建改进K-means算法模型,配置为计算光伏电站的原始气象数据和光伏出力数据中历史功率数据的平均值、标准差、偏态系数和峰度作为改进K-means算法的输入因子,采用改进K-means算法对该输入因子进行聚类分析,计算不同聚类类别中气象数据与发电功率的相关度;

构建基于改进K-means聚类和Attention-LSTM的网络模型,配置为将与发电功率相关度大于0.6的气象数据作为预测模型的输入因子输入Attention-LSTM模型,训练模型获取最优参数,输出最终预测结果。

一种光伏发电功率预测系统,还包括:

构建预处理模块,配置为对光伏电站的原始气象数据和光伏出力数据进行预处理,

预处理包含数据清洗、缺失值的插补步骤、删除缺失数据以及异常值的识别与处理;

删除缺失数据是将连续缺失16个时刻以上的数据视为缺失数据做删除处理;异常值的识别与处理是利用箱线图识别异常值,并用K近邻互补法进行处理。

本发明还提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述光伏发电功率预测方法。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

相关技术
  • 一种分布式光伏发电系统动态功率预测系统
  • 光伏发电功率预测模型构建及光伏发电功率预测方法
  • 光伏发电功率预测模型的构建方法及功率预测方法
技术分类

06120116214312