掌桥专利:专业的专利平台
掌桥专利
首页

综合气象因子数据的多数据融合光伏功率预测算法

文献发布时间:2023-06-19 19:30:30


综合气象因子数据的多数据融合光伏功率预测算法

技术领域

本发明涉及光伏发电功率预测技术领域,具体涉及一种综合气象因子数据的多数据融合光伏功率预测算法。

背景技术

光伏发电功率预测是基于历史和当前数据,对未来一段时间的光伏功率进行预测。传统光伏发电功率预测方法主要为物理建模法,但此类方法构建复杂,需要考虑诸多地理环境因素及安装设备参数,且随时间的推移受气象变化干扰严重。随着人工智能技术在电网中大规模应用,智能算法对预测的精度、速度和模型的复杂度都有着不错的优化,光伏发电功率预测技术已由传统的物理建模预测过渡到数据驱动的人工智能算法预测。但目前所使用的智能算法如支持向量机、BP神经网络、卷积神经网络等预测性能较差,无法深度学习历史数据之中的时序信息,难以挖掘输入特征与输出功率之间的映射关系,尤其在天气波动幅度较大的日期中预测精度下降明显。

现有专利文献CN113988364A记载了一种基于变分模态分解和多尺度下采样的光伏功率出力预测方法,使用变分模态分解(VMD)将光伏功率和气象数据分解为多个尺度,并在每个尺度下构建卷积神经网络进行光伏功率预测;但传统卷积神经网络对高维特征提取能力有限。本申请采用“引入注意力机制”,针对不同特征的重要程度赋予其贡献率,加强预测模型对关键特征的挖掘能力。

专利文献CN108549929A记载了一种基于深层卷积神经网络的光伏功率预测方法,用VMD对获取的历史光伏功率序列分解为多个频率分量和余项分量,每个频率分量又建立深层卷积神经网络进行预测、余项分量使用支持向量机结合气象数据进行预测。该技术方案一是在频率分量下预测时没有考虑当前气象,致使功率预测实时精度有限;二是全频率分量下的深层卷积神经网络,将使模型计算代价过大。本申请通过AE将VMD分解后多个模态重构为两种分量,减少模型的复杂程度;使用PCA融合多维气象数据作为两种分量下的输入,气象因素对光伏功率的影响给予了考虑。

专利文献CN113779861A记载了一种光伏功率的预测方法及终端设备,是将光伏功率通过奇异值分解为高频分量和低频分量的分解个数,利用VMD对两种分量进行二次分解、结合RBF神经网络进行预测。该技术方案对任一种气象条件下光伏功率序列都需进行两次分解、计算过于繁琐;另解释性不强。本申请使用VMD-AE将光伏功率直接重构为反映变化趋势的低频分量和反映波动程度的高频分量,分解过程简单、重构结果可解释性强的特点。

因光伏发电功率数据具有较强的前后时间关联性,但上述三种方案中使用的预测模型均不属于循环神经网络、缺少对时序信息的提取能力、预测模型对关键特征的提取能力不足,造成预测效果不佳。本专利使用AttGRU作为基本预测模型,在充分提取时序信息的同时把握了数据中的关键特征,同时使用PCA将多维气象因素融合成1维综合气象因子,减小了数据冗余对模型特征挖掘能力的干扰。

发明内容

本发明所要解决的技术问题是提供一种综合气象因子数据的多数据融合光伏功率预测算法,模型依据多数据融合后、生成的综合气象因子与光伏输出功率间的映射关系,构造了一种用于管理光伏发电站的功率预测算法,该算法可提高光伏电站管理系统中功率预测的准确性。

为解决上述技术问题,本发明所采用的技术方案是:

综合气象因子数据的多数据融合光伏功率预测算法,包括以下步骤:Step1、在开始预测前对采集到的光伏电站输出功率及天气特征数据进行数据预处理;Step2、预处理完的数据集中包含历史气象数据和历史光伏发电功率数据,历史气象数据输入到气象特征选取模块,进行相关性分析,以提取对光伏发电功率影响大于设定值的气象特征,根据相关性分析结果剔除相关系数低于设定值或呈现负相关的无效气象特征,保留余下的气象特征输入到气象数据融合模块,利用PCA,即气象因素主成分的分析Principal ComponentAnalysis,构造综合气象因子;

Step3、在Step2的同时,预处理完的历史光伏发电功率数据,在功率模态重构模块中利用变分模态分解VMD将光发发电功率进行分解为一系列具有特定带宽的固有模态函数Intrinsic Mode Function,即IMF,并通过计算每个IMF的近似熵AE,将所有IMF重构为高频分量和低频分量,高频分量反映了功率的波动特征,低频分量反映了功率的变化趋势;

Step4、在门控循环神经网络Gated Recurrent Unit Neural Network,即GRU中加入注意力机制Attention Mechanism,即Att,构建AttGRU预测模型,AttGRU预测模型由AttGRU1和AttGRU2构成,STEP2中得到的历史综合气象因子和STEP3中功率模态重构模块得到的历史高频功率分量输入AttGRU1,对未来时间点的高频功率分量做出预测;STEP2中得到的历史综合气象因子和STEP3中功率模态重构模块得到的历史低频功率分量输入AttGRU2,对未来时间点的低频功率分量做出预测;然后对两种频率模态下的预测结果进行叠加重构,得到最终预测结果。

上述的Step1的数据预处理的具体过程为:

Step1.1、对于采集到的光伏电站输出功率及天气特征数据中的缺失值,采用前后5分钟记录均值进行填补,对于其中的异常值,采用孤立森林算法Isolation Forest,即IF按照STEP1.2的后续步骤进行检测并剔除;

Step1.2、IF对数据样本不断分割直至每个样本空间只包含一种数据点,分割过程如下:

Step1.2.1、对于数据集X,使用一棵具有N个节点的二叉树T进行描述,每一节点N

Step1.2.2、对于某层所包含的数据集X

Step1.2.3、当遇到下面情况时得到完整的二叉树,划分结束:

A.数据树的深度达到设定的最大值;

B.节点N

上述的Step2的具体过程为:

Step2.1、不同的气象特征对发电功率的影响程度不同,利用皮尔逊相关系数Pearson Correlation Coefficient,即PCC对气象特征进行相关性分析,计算各气象特征与光伏发电功率间的相关系数,公式(1)为PCC计算方法:

公式(1)中x

Step2.2、根据相关性分析结果剔除相关系数低于设定值或呈现负相关的无效气象特征,保留余下的气象特征输入到气象数据融合模块;

Step2.3、在气象数据融合模块内,PCA对图1特征选取模块输出的多维气象特征进行降维,得到多个成分及对应贡献率,将每个成分按照其贡献率加权求和得到综合气象因子,具体过程如下:

Step2.3.1、将具有m个气象特征的n个样本的数据创建为一个m×n维矩阵X;

Step2.3.2、随后将对X中数据进行标准化处理,并计算协方差矩阵R;

Step2.3.3、通过求解特征方程|λI-R|=0计算特征值和特征向量,其中I是单位矩阵,λ是特征值,各成分根据各自的特征向量按特征值的顺序排列,具有最高特征值的成分称为第一主成分,其次是第二主成分,以此类推;

Step2.3.4、通过公式(2)、(3)计算主成分贡献率η

Step2.3.5、根据公式(4)计算各主成分值z

z

式中a

Step2.3.6、使用公式(5)将选取的各成分按照其对应的贡献率加权求得综合气象因子:

F=η

公式(5)中:z

上述的Step3中得到高频分量和低频分量的具体过程为:

Step3.1、采用希尔伯特变换对光伏发电功率数据P(t)进行分解,对每个模态使用指数调谐算子

Step3.2、利用解调信号的H

公式(6)中P(t)为待分解的时间序列,u

Step3.3、根据公式(7)引入二次平衡参数α和拉格朗日乘子λ,将约束变分问题转换为一个无约束变分问题;

Step3.4、利用公式(8)、(9)令(u

公式(8)、(9)中,n为迭代次数,

Step3.5、当满足以下收敛准则时,完成迭代;

Step3.6、利用AE衡量每个IMF的复杂程度,按计算得到的AE值对IMF进行重构,将VMD分解得到的多个IMF重新组合为高频分量和低频分量,具体过程如下:Step3.6.1、预先设置参数m和r,其中m代表嵌入维数,r代表相似容限;Step3.6.2、重建m维向量{X(i),X(2),…,X(n-m+1)},X(i)={u(i),u(i+1),…,u(i+m-1)};

Step3.6.3、对于1≤i≤n-m+1以及给定的r值,计算下式;

k=numb

公式(11)中,u(a)和u

Step3.6.5、按公式(15)计算分解得到的每个IMF的近似熵AE值;

AE=Φ

公式(15)中参数m设置为2,r设置为0.15SD,SD表示时间序列的标准差;Step3.6.6、将IMF按对应AE值重新组合成高频分量和低频分量。

上述的Step4中AttGRU模型内部结构计算方法如下:

Step4.1、AttGRU由GRU神经网络与注意力机制结合而成,其中GRU利用其内部的两个门结构处理输入信息,计算公式如下:

r

z

g

h

y

式(16)-(20)中,x

Step4.2、注意机制根据观察输入信息选择性地获取影响输出结果的某些重要部分,赋予重要特征相对较高的权重,不重要特征赋予较低的权重,计算公式如下:

β

式(21)中h

本发明提供的一种综合气象因子数据的多数据融合光伏功率预测算法,具有如下有益效果:

(1)通过对气象因素主成分的分析(Principal Component Analysis,PCA),以各气象特征的主成分值和贡献率为要素、构造综合气象因子函数,其函数值代替训练预测模型原有多个气象特征,一方面实现在保留原始高维气象特征数据中重要信息的同时,减少输入特征维度、消除冗余信息生成的敏感性;另一方面,综合气象因子函数值可强化预测模型的学习能力与特征挖掘能力、可有效应变天气突发情况,相较于传统数据驱动型方法具有更高的预测精度。

(2)变分模态分解近似熵VMD-AE(Variational Mode Decomposition-Approximate Entropy)技术,是利用VMD对历史输出功率进行分解、AE再将其重构为代表波动程度的高频分量和变化趋势的低频分量,方便预测模型提取每日光伏发电功率中的变化趋势和波动特性;从而提高模型对气象波动的抗干扰能力、降低传统频域分解技术带来的模型高复杂度问题。

(3)由于光伏发电的随机性和波动性,致使传统预测模型很难拟合输入输出关系、时序信息特征提取能力有限;故此,在门控循环神经网络(Gated Recurrent Unit NeuralNetwork,GRU)中加入注意力机制(Attention Mechanism,Att)构建AttGRU预测模型;利用GRU提取时序信息能力强的特点,以把握前后时刻数据间的关联性;注意力机制可深度挖掘高/低频分量下综合气象因子与输出功率间的映射关系,把握输入数据中对光伏发电功率影响大的特征和时段,从而实现预测精度的提高。

附图说明

下面结合附图和实施例对本发明作进一步说明:

图1为本发明光伏发电功率预测算法流程图;

图2为IF异常值检测流程图;

图3为综合气象因子构建流程图;

图4为AttGRU预测模型;

图5为实施例中的光伏功率预测系统结构图;

图6为实施例中的综合气象因子构造结果;

图7为实施例中光伏功率模态分解结果;

图8为实施例中光伏功率模态重构结果;

图9为实施例中预测结果1;

图10为实施例中预测结果2。

具体实施方式

以下结合附图和实施例详细说明本发明技术方案。

综合气象因子数据的多数据融合光伏功率预测算法,算法如图1所示,主要包括数据预处理、气象特征选取模块、气象数据融合模块、功率模态分解模块和预测模块。

本发明主要提供了一种光伏发电功率预测算法,用以解决上述背景技术中提出的问题,下面对算法中各部分流程进行说明:

首先,本发明在开始预测前对采集到的光伏电站输出功率及多维天气特征数据进行数据预处理;由于设备老化、系统故障或人为因素等特殊情况导致传感器记录数据存在异常值和缺失值,需要对此类数据进行预处理;对于数据中的缺失值,采用前后5分钟记录均值进行填补;对于异常值,采用孤立森林算法(Isolation Forest,IF)按照图2流程进行检测并剔除。

图2中,IF对数据样本不断分割直至每个样本空间只包含一种数据点,分割过程如下:

步骤一、对于数据集X,使用一棵具有N个节点的二叉树T进行描述,每一节点N

步骤二、对于某层所包含的数据集X

步骤三、当遇到下面情况时得到完整的二叉树,划分结束:

1)数据树的深度达到设定的最大值;

2)节点N

进一步的,处理好的数据集中包含历史气象数据和历史光伏发电功率数据,历史气象数据输入到图1中气象特征选取模块,进行相关性分析,以提取对光伏发电功率影响较大的气象特征;光伏设备因其对太阳能的转化利用方式,其发电功率受天气状况的影响较大;光伏发电功率与每日气温(摄氏度)、相对湿度(%)、风速(米/秒)、散射辐照度(瓦/平方米)、水平辐照度(瓦/平方米)等气象因素均有一定的影响。但不同的气象特征对发电功率的影响程度不同,利用皮尔逊相关系数(Pearson Correlation Coefficient,PCC)对气象特征进行相关性分析,计算各气象特征与光伏发电功率间的相关系数,公式(1)为PCC计算方法:

公式(1)中x

进一步的,根据相关性分析结果剔除相关系数过低或呈现负相关的无效气象特征,保留余下的气象特征输入到图1中气象数据融合模块,利用PCA构造综合气象因子,综合气象因子构建流程如图3所示。

图3中,利用PCA对图1特征选取模块输出的多维气象特征进行降维,得到多个主成分及对应贡献率,将每个主成分按照其贡献率加权求和得到综合气象因子,具体过程如下:

步骤一、将具有m个气象特征的n个样本的数据创建为一个m×n维矩阵X;

步骤二、随后将对X中数据进行标准化处理,并计算协方差矩阵R;

步骤三、通过求解特征方程|λI-R|=0计算特征值和特征向量,其中I是单位矩阵,λ是特征值;主成分根据各自的特征向量按特征值的顺序排列,具有最高特征值的主成分称为第一主成分,其次是第二主成分,以此类推;

步骤四、通过公式(2)、(3)计算主成分贡献率η

步骤五、根据公式(4)计算各主成分值z

z

式中a

步骤六、使用公式(5)将选取的各主成分按照其对应的贡献率加权求得综合气象因子:

F=v

公式(5)中:z

进一步的,在图1功率模态重构模块中利用VMD将光发发电功率进行分解为一系列具有特定带宽的固有模态函数(Intrinsic Mode Function,IMF),并通过计算每个IMF的AE值,将所有IMF重构为高频分量和低频分量,高频分量反映了功率的波动特征,低频分量反映了功率的变化趋势,VMD分解过程如下:

步骤一、采用希尔伯特变换对光伏发电功率数据P(;)进行分解,对每个模态使用指数调谐算子

步骤二、利用解调信号的H

公式(6)中P(;)为待分解的时间序列,u

步骤三、根据公式(7)引入二次平衡参数α和拉格朗日乘子λ,将约束变分问题转换为一个无约束变分问题;

步骤四、利用公式(8)、(9)令(u

公式(8)、(9)中,n为迭代次数,

步骤五、当满足以下收敛准则时,完成迭代。

进一步的,利用AE衡量每个IMF的复杂程度,按计算得到的AE值对IMF进行重构,将VMD分解得到的多个IMF重新组合为高频分量和低频分量,具体过程如下:步骤一、预先设置参数m和r,其中m代表嵌入维数,r代表相似容限;

步骤二、重建m维向量{X(i),X(2),…,X(n-m+1)},X(i)={u(i),u(i+1),…,u(i+m-1)};

步骤三、对于1≤i≤n-m+1以及给定的r值,计算下式;

k=numb

公式(11)中,u(a)和u

/>

步骤五、按公式(15)计算分解得到的每个IMF的近似熵AE值;

AE=Φ

公式(15)中参数m设置为2,r设置为0.15SD,SD表示时间序列的标准差;

步骤六、将IMF按对应AE值重新组合成高频分量和低频分量;

进一步的,利用AttGRU作为图1中预测模型,AttGRU结构如图4所示。

AttGRU模型内部结构计算方法说明如下:

1)AttGRU由GRU神经网络与注意力机制结合而成,其中GRU利用其内部的两个门结构处理输入信息,计算公式如下:

r

z

g

h

y

式(16)-(20)中,x

2)注意机制根据观察输入信息选择性地获取影响输出结果的某些重要部分,赋予重要特征较高的权重,不重要特征较低的权重,计算公式如下:

β

式(21)中h

进一步的,图1中预测部分由两个AttGRU组成,其中AttGRU1利用图1气象数据融合模块得到的历史综合气象因子,与图1功率模态重构模块得到的历史高频功率分量作为输入,对未来时间点的高频功率分量做出预测;同理AttGRU对未来时间点的低频功率分量进行预测,对两种频率模态下的预测结果进行叠加重构,得到所提算法的最终预测结果。

实施例:

下面结合工程实例对本发明多数据融合的综合气象因子数据驱动型光伏功率预测及算法进行具体说明,在实际案例中使用硬件部分包括气象数据采集模块、数据传输模块和预测系统终端,系统结构如图5所示。

图5中各组成部分所选设备型号在表1中列出:

表1所选设备及型号

表1中,12要素气象传感器JD-WQX12可针对PM2.5、PM10、CO、SO2、NO2、O3六项污染物参数以及空气温度、相对湿度、风速、风向、大气压力以及降雨量共计12项参数进行监测;双向电表DDSD1352对太阳能电池板进行检测并记录输出参数,包括实时功率、电压、电流、频率、相位等参数;太阳总辐射传感器FSP10,可对水平辐照度、散射辐照度等进行测量;全网通无线通讯模组RM500U将气象数据采集模块、设备工况记录模块、辐照度测量模块中记录到的数据通过信道传输到预测系统终端;预测系统终端负责完成对收到数据的预处理,模型的训练及输出预测结果。

在实际案例中,按照以上方法对型号为Q.PEAK-G4.1 290-310的太阳能电池板输出功率按图1流程进行预测,具体做法与实验结果如下。

使用每天7:30到18:00每5分钟记录一次的光伏发电输出功率和气象数据作为原始数据,每天共126个时间节点,气象数据包括水平辐照度、散射辐照度、温度、风速等;由于设备原因数据中存在一些缺失值和异常值,按图2流程剔除异常值,并使用均值插入法对缺失值进行填补,最终得到218天数据,其中70%作为训练集用于预测模型的训练,30%作为测试集对模型预测效果进行评价。

按图1气象特征提取模块,分析与光伏发电功率相关性较强的气象因素,分析结果见表2,选取水平辐照度、散射辐照度、温度、风速和气压5个气象特征。

表2气象因子相关性分析结果

按图3综合气象因子提取流程,利用PCA对这5个气象特征进行降维,结果见表3。

表3主成分分析结果

从表3中可以看出,前4个主成分的累计贡献率达到了95%,故综合气象因子9可以由前4个主成分按公式(5)线性加权得到,综合气象因子构造结果见图6;由图6可以看出综合气象因子将原有的5维气象特征降低至1维的同时,保留了原有气象特征绝大部分信息,与实际光伏发电功率呈现强相关性。

根据图1中功率模态重构流程,利用VMD-AE对光伏发电功率进行模态重构,VMD分解模态数设置为7,对光伏发电功率的分解结果如图7所示。

通过计算分解后7个IMF的AE值衡量每个模态的复杂程度,各模态及原始功率的AE值计算结果见表4。

表4AE值计算结果

选取AE值小于原始功率的子模态IMF1、IMF2、IMF3重构为低频分量,其余模态重构为高频分量,重构结果如图7所示。

由图8可以看出高频分量代表光伏功率波动特性,低频分量代表光伏功率变化趋势。

在两种频率模态下分别构建AttGRU预测模型,训练过程中AttGRU1的输入为前6个时间节点的历史综合气象因子与历史高频功率分量,即输入维度为(6,2),学习与下一个时间节点高频功率分量间的映射关系;AttGRU2按同样方法学习输入与历史低频功率分量间的映射关系;AttGRU模型拥有1个GRU输入层,1个隐藏层,1个注意力层和1个输出层;隐藏层含有20个神经元,与注意力层一起对输入输出间的映射关系进行深度解析,输出层1个神经元用于输出预测点功率;训练时网络参数批大小batch_size为50,训练次数epoch为30;采用adam优化器,学习率设置为0.001,选择均方误差(Mean Squared Error,MSE)作为损失函数进行训练。

预测精度定义为预测值与实际值的偏离程度,利用MSE、平均绝对误差(MeanAbsolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)作为模型评估指标衡量模型预测精度,MSE、MAE、RMSE的计算式如下:

/>

公式(24)、(25)、(26)中,P

为说明所提VMD-AE-AttGRU模型在突变天气下的预测性能,选取单一的AttGRU模型与不含模态重构和注意力机制的VMD-GRU模型作为对照组,对未来30分钟的光伏发电功率进行预测,图9、图10为三种模型的预测结果。对三种模型预测精度使用MSE、MAE、RMSE的评估结果如表3所示:

表5各模型预测结果对比

从表中可以看出,所提VMD-AE-AttGRU模型三种指标评估结果均优于其他两种模型,在三种预测模型中的准确度最高,其次是AttGRU模型,VMD-GRU模型表现较差。在MSE、MAE、RMSE三项评估指标下相较于VMD-GRU模型分别减小了58.82%、56.06%、35.78%,说明仅靠传统GRU模型提取时序信息中关键特征能力不够。相较于AttGRU模型分别减小了32.69%、37.11%、17.96%,说明频域分解技术通过提取历史功率数据中的波动特征可使预测精度进一步提高。综上所述,注意力机制的引入和波动性提取的结合使所提模型相较于传统模型具有更高的预测精度,对于突变天气带来的波动性影响具有更强的抵抗力。

相关技术
  • 一种多数据模型融合的光伏发电功率预测方法和系统
  • 一种基于气象因子权重相似日的短期光伏功率预测方法
技术分类

06120115937913