掌桥专利:专业的专利平台
掌桥专利
首页

基于LightGBM-SARIMA的风功率中长期组合预测方法及介质

文献发布时间:2024-04-18 20:01:30


基于LightGBM-SARIMA的风功率中长期组合预测方法及介质

技术领域

本发明涉及电网管理技术领域,具体涉及一种基于LightGBM-SARIMA的风功率中长期组合预测方法。

背景技术

风能具有可再生、清洁、资源丰富等特点,在全世界范围内得到了广泛的开发和利用。风力发电在全球已成为具备最大规模开发和工业化前景的新型电力能源。迄今为止,中国风电装机容量已经达到3亿kW,年装机量达到2200万kW,风电已占全国电力的8.7%以上,但随着中国风电的快速发展,电网接入运行难、风电制造盲目发展等问题逐步产生,需要在风电开发规划和建设管理,风电开发与电网的协调。风电在一定程度上缓解能源危机和环境压力的同时,大规模的风电并网也给电力系统带来了一些不利影响。风电场的有功出力由风速决定,由于风速本身固有的随机性和间歇性!加大了风速预测的难度,由此会导致风电场的输出功率的可控性降低。随着风电在电网中所占比例的不断增加,风电输出功率的不确定性和波动性将会给电力系统的稳定运行带来挑战,进而制约风电发展规模,因此准确预测风电功率可以提高电网运行的安全性和可靠性。

风电功率预测方法按照预测时间长短可分为:长期预测、中期预测、短期预测和超短期预测。其中长期预测为依据往年的年发电情况预测年发电量大小、中期预测为预测未来一周每天的功率数值大小、短期预测为预测未来几天的功率数值大小、超短期预测为预测未来几小时的功率数值大小。

风电功率预测方法按照模型分类可分为物理法、统计预测法、人工智能法等3大类。其中,物理模型的建立过程较为复杂,由于风电功率信号具有典型非平稳时间序列的特征,传统的物理预测方法效果较差。相比较于物理预测方法,统计预测方法模型更简单。利用风电功率的季节性特点,对风电功率进行预测,其预测精度均好于传统类物理模型。随着人工智能技术的飞速发展和广泛应用,人工智能法通过挖掘人工智能模型来实现未来时刻的风电功率数值的预测愈来愈成为当下的主流方式,然而单一的模型有其固有应用的特点和场景。因此将不同类型的模型进行组合预测也越来越被更多的人们所采用,在文献《LSTM-RF的中长期风电功率组合预测方法》中,综合考虑功率数据和气象数据等多维特征,采用LSTM算法和随机森林算法(RF)搭建组合预测模型,进行了中期风电功率出力预测,能够解决突变气象条件下功率预测效果不高的问题。在文献《基于自适应权重的CNN-LSTM&GRU组合风电功率预测方法》中,针对单一模型难以获得最优预测结果的问题,提出一种多模型组合短期风电功率预测方法。首先,利用卷积神经网提取数据局部特征,并结合长短期记忆网络构造出融合局部特征预提取模块的CNN-LSTM网络结构;然后,将其与门控循环单元(GRU)网络并行,在实际应用中实现风功率的精准预测。此外,文献《考虑气象特征与波动过程关联的短期风电功率组合预测》提出了一种考虑气象特征与波动过程关联的短期风电功率组合预测方法。首先,通过分析数值天气预报的气象特征因素来划分天气波动过程。其次,考虑天气波动过程与功率波动过程的关联关系,建立了以气象特征因素为输入、以风电功率为输出的波动过程关联的短期组合预测模型。最后,将不同天气波动过程下的风电功率预测值进行重新组合,以得到短期风电功率预测结果。

虽然已有大量文献从组合预测模型算法等方面进行风电功率预测技术研究,且在一定程度上改善了预测效果,但其组合预测结果的方法过于粗放,亟需更高精度的风电功率组合预测方法来满足电网能量管理严格的要求。尤其是在风电功率的中长期预测方面,虽然中长期的风电预测应用相对于风电功率的短期超短期预测偏少,但其能够协助风电的资源评测,方便风电场的机组检修安排,从宏观上也能减少弃风,提高风电场的发电量和容量系数,为风电的长期发展以及电网的建设调度提供辅助支撑,因此研究高精度的风电功率中长期预测具有重要应用意义。现有的风电功率中长期预测技术中主要有以下几点问题,一是风电功率中长期预测相对于短期预测来说其精度较低,且呈现随着预测时长的增加预测精度也逐步降低,二是以天气预报数据作为输入的预测模型极易受天气预报数值准确的影响,天气预报的偏差是功率预测精度的重要因素,三是智能挖掘法需要精准的组合权重计算支撑,用于融合不同类型预测模型的输出结果,为此本发明特提供了一种基于LightGBM-SARIMA的风功率中长期组合预测方法。LightGBM模型不仅能够挖掘输出与相关输入变量之间的空间和时序关联性,对于大数据驱动的模型训练过程拟合能力更强,且不易陷入局部最优和过拟合,更适用于挖掘天气状态变化与风功率波动的内在关联和潜在规律。

发明内容

本发明为了克服以上技术的不足,提供了一种提高了风电功率中长期预测的准确性和稳定性的基于LightGBM-SARIMA的风功率中长期组合预测方法及介质。本发明克服其技术问题所采用的技术方案是:

一种基于LightGBM-SARIMA的风功率中长期组合预测方法,包括如下步骤:

a)收集风电场所在地区风速、气温、风电功率信息,得到数据集R;

b)将气候历史特征和气候预测值输入到LightGBM模型中进行训练,得到气象数据修正模型Model_R,利用气象数据修正模型Model_R得到数据集矩阵Gr;

c)将数据集矩阵Gr划分为训练集矩阵S、测试集矩阵T、验证集矩阵V;

d)对LightGBM模型进行训练,得到LightGBM预测模型Model_L,对SARIMA模型进行训练,得到SARIMA预测模型Model_S;

e)计算LightGBM预测模型Model_L的权重W

f)收集风电场所在地区7天的风速、气温、预报风速、预报气温、风电功率信息,将采集的预报风速数据、预报气温数据输入到修正模型Model_R中,得到预报风速修正日均值和预报气温的修正日均值,根据7天的风速计算得到风速日均值,根据7天的气温得到气温日均值,根据7天的风电功率得到风电功率日均值;

g)将得到的风速日均值、预报风速修正日均值、气温日均值、预报气温的修正日均值输入到LightGBM预测模型Model_L中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

h)将得到的风电功率日均值输入到SARIMA预测模型Model_S中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

i)根据预测结果F

进一步的,步骤a)包括如下步骤:

a-1)根据风电场所在地区位置信息获取24个月的气象预报历史数据csv文件,得到时间间隔为15分钟的风速信息和气温信息;

a-2)从SCADA数据库中读取该风电场的风电功率参数的24个月历史数据保存的csv文件,得到时间间隔为15分钟的n个风电功率信息;

a-3)将获得的风速信息、气温信息、风电功率信息利用Python软件进行合并处理,得到行向量为样本、列向量为特征的二维矩阵的数据集R,数据集R的大小为n*m,n为样本总量,m为特征量维度,m取值为5,5个特征分别为风电功率、风速、预报风速、气温、预报气温。

进一步的,步骤b)包括如下步骤:

b-1)将数据集R的第i列数据作为序列B

b-2)利用线性插值法对数据集R的空数据填充,填充后得到数据集矩阵Y;

b-3)使用长度为120的时间窗计算数据集矩阵Y各个特征的时间窗均值,将间隔为15分钟的数据集矩阵Y转化为间隔为1天的数据集矩阵G,数据集矩阵G中的5个特征分别为风电功率日均值、风速日均值、预报风速日均值、气温日均值、预报气温日均值;

b-4)设固定时间窗口为8天,将前7天的气象及气象预报日均值数据作为LightGBM模型的输入向量,将最后一天的气象日均值数据作为LightGBM模型的输出向量,使用数据集矩阵G对LightGBM模型进行优化,得到修正模型Model_R;

b-5)将数据集矩阵Y的风速、预报风速、气温、预报气温数据输入到修正模型Model_R中,得到风速修正数据和气温的修正数据,将风速修正数据替代数据集矩阵G中的预报风速数据,将气温修正数据替代数据集矩阵G中的预报气温数据,得到数据集矩阵Gr,数据集矩阵Gr与数据集矩阵G大小相同,数据集矩阵Gr中的5个特征分别为风电功率日均值、风速日均值、预报风速修正日均值、气温日均值、预报气温修正日均值。

进一步的,步骤b-4)中使用数据集矩阵G对LightGBM模型进行优化时,对LightGBM模型的超参数和权重进行初始化,通过贝叶斯优化方法和均方根误差评价指标获取优化后的LightGBM模型最佳参数,输入特征数值对参数优化的LightGBM模型进行训练。

优选的,步骤c)中将数据集矩阵Gr以8:1:1的比例划分为训练集矩阵S、测试集矩阵T、验证集矩阵V。

进一步的,步骤d)包括如下步骤:

d-1)将训练集矩阵S中的风速日均值、预报风速修正日均值、气温日均值、预报气温修正日均值作为LightGBM模型的输入,以训练集矩阵S中的风电功率日均值作为LightGBM模型的输出,对LightGBM模型进行训练,采用验证集矩阵V获取LightGBM模型最佳参数,得到LightGBM预测模型Model_L;

d-2)将训练集矩阵S中的风电功率日均值作为SARIMA模型的输入,对SARIMA模型进行训练,训练时对训练集矩阵S中的风电功率日均值进行时序数据的平稳化处理,通过相关系数图、部分自相关图方法进行模型定阶,得到SARIMA模型的阶数参数(p,q)和季节参数(P,Q),其中p为自回归阶数,q为移动平均阶数,P为季节性自回归阶数,Q为季节性移动平均阶数,使用最大似然法估计SARIMA模型的参数,得到模型参数为(p,d,q)×(P,D,Q)s的SARIMA预测模型Model_S,其中d为差分次数,D为季节性差分阶数,s为季节周期数。

进一步的,步骤e)中将测试集矩阵T输入到LightGBM预测模型Model_L中利用Frank-Wolfe算法计算得到LightGBM预测模型Model_L的权重W

进一步的,步骤i)中通过公式F=W

优选的,W

一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

保存收集风电场所在地区风速、气温、风电功率信息,得到的数据集R;

将气候历史特征和气候预测值输入到LightGBM模型中进行训练,得到气象数据修正模型Model_R,利用气象数据修正模型Model_R得到数据集矩阵Gr;将数据集矩阵Gr划分为训练集矩阵S、测试集矩阵T、验证集矩阵V;

对LightGBM模型进行训练,得到LightGBM预测模型Model_L,对SARIMA模型进行训练,得到SARIMA预测模型Model_S;

计算LightGBM预测模型Model_L的权重W

保存收集风电场所在地区7天的风速、气温、预报风速、预报气温、风电功率信息,将采集的预报风速数据、预报气温数据输入到修正模型Model_R中,得到预报风速修正日均值和预报气温的修正日均值,根据7天的风速计算得到风速日均值,根据7天的气温得到气温日均值,根据7天的风电功率得到风电功率日均值;

将得到的风速日均值、预报风速修正日均值、气温日均值、预报气温的修正日均值输入到LightGBM预测模型Model_L中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

将得到的风电功率日均值输入到SARIMA预测模型Model_S中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

根据预测结果F

本发明的有益效果是:针对于风电功率因外部因素(如风速数据)造成的随机性和波动性强的特点,利用经过LightGBM修正后的NWP数据输入到另一个新的LightGBM模型中,输出新的发电量预测值,该方法能够充分利用发电量的历史数据和NWP数据,为更高的预测精度提供可能性。本发明采用Frank-Wolfe算法可利用模型评价指标求解不同模型输出预测结果合理组合的权重系数,输出模型结果包含两个不同类型模型的信息,即能够实现SARIMA的深层结构在预测时间延长时所展现出的优势的表达能力,也能将LightGBM模型对NWP数据和风电功率的非线性关系的准确表达。本发明针对NWP数据存在的周期性的特点,应用SARIMA模型考虑数据中的季节性因素,能够将数据处理成非平稳非周期性的时间序列,使得模型的预测能力更强,从而提升了模型的总体预测精度。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面结合附图1对本发明做进一步说明。

如附图1所示一种基于LightGBM-SARIMA的风功率中长期组合预测方法,包括两个阶段,一是风电功率预测模型的训练,二是风电功率预测模型的应用,具体的,包括如下步骤:

a)收集风电场所在地区风速、气温、风电功率信息,得到数据集R。风电功率主要依赖于风电场的地理环境与气象条件,其中以风速最为重要,考虑到数据采集的方便,故收集风速、气温、风电功率等相关气象参数作为为建立预测模型所需的历史数据来源,采集后的数据用于后续预测模型构建的输入。

b)将气候历史特征和气候预测值输入到LightGBM模型中进行训练,得到气象数据修正模型Model_R,利用气象数据修正模型Model_R得到数据集矩阵Gr。

c)将数据集矩阵Gr划分为训练集矩阵S、测试集矩阵T、验证集矩阵V。

d)对LightGBM模型进行训练,得到LightGBM预测模型Model_L,对SARIMA模型进行训练,得到SARIMA预测模型Model_S。

e)计算LightGBM预测模型Model_L的权重W

f)收集风电场所在地区7天的风速、气温、预报风速、预报气温、风电功率信息,将采集的预报风速数据、预报气温数据输入到修正模型Model_R中,得到预报风速修正日均值和预报气温的修正日均值,根据7天的风速计算得到风速日均值,根据7天的气温得到气温日均值,根据7天的风电功率得到风电功率日均值。

g)将得到的风速日均值、预报风速修正日均值、气温日均值、预报气温的修正日均值输入到LightGBM预测模型Model_L中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

h)将得到的风电功率日均值输入到SARIMA预测模型Model_S中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

i)根据预测结果F

将LightGBM回归模型和非线性SARIMA时序模型的预测结果进行组合预测,可得到比单一模型预测更能得到令人满意的结果,分散了单一模型的预测风险,融合了时序模型和非线性预测模型的优势,进一步提升了预测模型的泛化能力,提高了风电功率中长期预测的准确性和稳定性。

在本发明的一个实施例中,步骤a)包括如下步骤:

a-1)根据风电场所在地区位置信息获取24个月的气象预报历史数据csv文件,得到时间间隔为15分钟的风速信息和气温信息。

a-2)从SCADA数据库中读取该风电场的风电功率参数的24个月历史数据保存的csv文件,得到时间间隔为15分钟的n个风电功率信息。

a-3)将获得的风速信息、气温信息、风电功率信息利用Python软件进行合并处理,得到行向量为样本、列向量为特征的二维矩阵的数据集R,数据集R的大小为n*m,n为样本总量,m为特征量维度,m取值为5,5个特征分别为风电功率、风速、预报风速、气温、预报气温。

例如根据某风电场的所在地区具体位置信息获取风速、气温2种气象信息的2020年及2021年过去24个月的气象数据以及气象预报历史数据csv文件,数据时间间隔为15分钟。同时从SCADA数据库里读取该风电场的风电功率参数的相同时间段的24个月历史数据保存成csv文件,数据时间间隔为15分钟,共计70080条数据。对获取的历史数据csv文件使用python软件进行合并处理,得到行向量为样本、列向量为特征的二维矩阵的数据集R。R的大小为n*m,这里n为70080,指从2020年1月到2021年12月的样本总数。

在本发明的一个实施例中,步骤b)包括如下步骤:

b-1)将数据集R的第i列数据作为序列B

b-2)利用线性插值法对数据集R的空数据填充,填充后得到数据集矩阵Y。具体的,应用箱线图异常识别法在原数据集矩阵R中识别出963条异常数据,将963处对应的数据全部置为空值,然后用线性插值法对数据集矩阵R的空数据填充,填充得到数据集矩阵Y,这里数据集矩阵Y和R大小相同,均为70080*5。b-3)使用长度为120的时间窗计算数据集矩阵Y各个特征的时间窗均值,将间隔为15分钟的数据集矩阵Y转化为间隔为1天的数据集矩阵G,数据集矩阵G中的5个特征分别为风电功率日均值、风速日均值、预报风速日均值、气温日均值、预报气温日均值。数据集矩阵G的大小为730*5,这里5个特征是指风电功率日均值、风速日均值、预报风速日均值、气温日均值、预报气温日均值。

b-4)设固定时间窗口为8天,将前7天的气象及气象预报日均值数据作为LightGBM模型的输入向量,将最后一天的气象日均值数据作为LightGBM模型的输出向量,使用数据集矩阵G对LightGBM模型进行优化,得到修正模型Model_R。具体的使用730条样本数据集G训练LightGBM模型作为修正模型。b-5)将数据集矩阵Y的风速、预报风速、气温、预报气温数据输入到修正模型Model_R中,得到风速修正数据和气温的修正数据,将风速修正数据替代数据集矩阵G中的预报风速数据,将气温修正数据替代数据集矩阵G中的预报气温数据,得到数据集矩阵Gr,数据集矩阵Gr与数据集矩阵G大小相同,均为730*5,数据集矩阵Gr中的5个特征分别为风电功率日均值、风速日均值、预报风速修正日均值、气温日均值、预报气温修正日均值。

在本发明的一个实施例中,步骤b-4)中使用数据集矩阵G对LightGBM模型进行优化时,对LightGBM模型的超参数和权重进行初始化,通过贝叶斯优化方法和均方根误差评价指标获取优化后的LightGBM模型最佳参数,输入特征数值对参数优化的LightGBM模型进行训练。

在本发明的一个实施例中,步骤c)中将数据集矩阵Gr以8:1:1的比例划分为训练集矩阵S,其大小为584*5、测试集矩阵T,其大小为73*5、验证集矩阵V,其大小为73*5。其中训练集矩阵S用于后续步骤LightGBM、SARIMA模型的训练,验证集矩阵V用于后续模型最佳参数的计算,测试集矩阵T用于评价LightGBM、SARIMA模型在测试数据上的预测性能。

在本发明的一个实施例中,步骤d)包括如下步骤:

d-1)将训练集矩阵S中的风速日均值、预报风速修正日均值、气温日均值、预报气温修正日均值作为LightGBM模型的输入,以训练集矩阵S中的风电功率日均值作为LightGBM模型的输出,对LightGBM模型进行训练,采用验证集矩阵V获取LightGBM模型最佳参数,得到LightGBM预测模型Model_L。

d-2)将训练集矩阵S中的风电功率日均值作为SARIMA模型的输入,对SARIMA模型进行训练,训练时对训练集矩阵S中的风电功率日均值进行时序数据的平稳化处理,通过相关系数图、部分自相关图方法进行模型定阶,得到SARIMA模型的阶数参数(p,q)和季节参数(P,Q),其中p为自回归阶数,q为移动平均阶数,P为季节性自回归阶数,Q为季节性移动平均阶数,使用最大似然法估计SARIMA模型的参数,得到模型参数为(p,d,q)×(P,D,Q)s的SARIMA预测模型Model_S,其中d为差分次数,D为季节性差分阶数,s为季节周期数。通过分析2020~2021两年的风电功率跟风速气温的联合波动趋势表明,风电功率大小受风速周期及气温季节特征影响较大,具有明显的季节、周等周期性波动趋势,且具有逐步上升的趋势。SARIMA模型能够描述风电功率的增长或减小趋势,风电功率的周期性以及季节性,因此可选用SARIMA模型对于风电功率未来数值进行预测。

在本发明的一个实施例中,步骤e)中将测试集矩阵T输入到LightGBM预测模型Model_L中利用Frank-Wolfe算法计算得到LightGBM预测模型Model_L的权重W

在本发明的一个实施例中,步骤i)中通过公式F=W

在该实施例中,优选的,W

一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

保存收集风电场所在地区风速、气温、风电功率信息,得到的数据集R;

将气候历史特征和气候预测值输入到LightGBM模型中进行训练,得到气象数据修正模型Model_R,利用气象数据修正模型Model_R得到数据集矩阵Gr;将数据集矩阵Gr划分为训练集矩阵S、测试集矩阵T、验证集矩阵V;

对LightGBM模型进行训练,得到LightGBM预测模型Model_L,对SARIMA模型进行训练,得到SARIMA预测模型Model_S;

计算LightGBM预测模型Model_L的权重W

保存收集风电场所在地区7天的风速、气温、预报风速、预报气温、风电功率信息,将采集的预报风速数据、预报气温数据输入到修正模型Model_R中,得到预报风速修正日均值和预报气温的修正日均值,根据7天的风速计算得到风速日均值,根据7天的气温得到气温日均值,根据7天的风电功率得到风电功率日均值;

将得到的风速日均值、预报风速修正日均值、气温日均值、预报气温的修正日均值输入到LightGBM预测模型Model_L中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

将得到的风电功率日均值输入到SARIMA预测模型Model_S中,应用递归多步预测策略,得到未来7天的风电功率预测结果F

根据预测结果F

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120116561715