掌桥专利:专业的专利平台
掌桥专利
首页

基于健康评估的Informer风电功率预测模型的优化方法

文献发布时间:2024-05-31 01:29:11


基于健康评估的Informer风电功率预测模型的优化方法

技术领域

本发明涉及风电功率技术领域,特别是涉及一种基于健康评估的Informer风电功率预测模型的优化方法。

背景技术

风能的波动性,造成风电的间歇性,并网后可能影响电网运行。为了保障电网安全,需要进行风电功率预测,以便及时调控。

早期基于数值天气预报(Numerical Weather Prediction)的预测方法,目前已被神经网络取代。虽然神经网络的预测精度较高,但预测速度慢、结构复杂、后期维护难度大。寻找新的预测模型,成为近年来的研究热点。Informer凭借预测速度快、模型轻量化的特点,可代替传统神经网络,进行功率预测。然而,Informer的预测精度较低,预测速度难以满足实际需求,预测性能不足之处较为明显。

针对Informer预测性能的不足,研究者从多方面进行优化。潘立群,张倩,Gong M

等优化编码流程,强化Informer的序列分析能力,提升预测精度;赵懂宇,冯霞,Yang Z

等引进对抗机制,增强Informer的抗干扰能力,提升预测精度;余琼芳,梁英杰,Zhu Q等改进采样方法,提高Informer的多元采样能力,提升预测速度。目前,大部分优化方法,不能同时提升Informer的预测精度和速度,优化效果不理想,且增加了Informer复杂度,影响其实际应用。

Informer是一种基于概率稀疏自注意力的预测模型,由Zhou Haoyi等人于2021年提出。和传统神经网络不同,Informer采用了Encoder-Decoder分离的结构。预测过程中,编码输出送入解码器处理,得到解码输出,并通过全连接层,输出预测结果。

Informer预测流程如图1所示。在Informer中,存在3个要点:

(1)自注意蒸馏操作(Self-attention Distilling Operation):Encoder模块中,每个编码层的深度递减,输出长度随之递减,从而提取特征,并在模块结尾,将所有特征进行连接,作为Decoder模块的输入。

(2)生成式解码器(Generative Style Decoder):Decoder模块中,使用了一种新的生成式解码器,只需要一个前向推导过程,便可获得指定长度的预测结果,有效避免了累积误差的扩散。

(3)概率稀疏自注意机制(ProbSparse Self-attention Mechanism):基于高得分点积对贡献主要关注的结论,Informer对强相关特征进行额外关注,在自注意过程中,仅计算强相关特征部分,降低预测成本。

现有的Informer预测模型,保证一定精度和速度的同时,仍存在下列不足:

1、计算频繁:Encoder模块中,为了提升强相关特征的关注度,需要频繁进行自注意力计算,降低了预测速度;

2、解码缺陷:Decoder模块中,使用了序列占位符,进行辅助预测,且占位符和特征数据具有相同的权重。权重分配的不合理,导致预测精度下降。

3、计算复杂:Informer需要引进额外模块,或提升特征维度,从而完成自注意机制,增加了计算复杂度,减小了模型轻量化的优势。

健康评估是一种权重优化算法,由Lars Landberg于2011年提出。它依据模型输出统计学概率分布的特点,将二维的概率密度函数,转化为权重健康矩阵。

健康评估的流程如图2所示,具体为:

(1)数据采集:通过传感器和SCADA系统,采集风速、温度、压力、转速、功率等风机数据;

(2)数据清洗:针对数据中的缺失值、异常值、传输噪声,进行清洗工作,提高数据可靠性;

(3)特征筛选:从清洗后的数据中,筛选出特征数据,并基于特征数据的维度,得到健康矩阵的维度;

(4)状态分类:使用特征数据,计算特征权重,并根据权重数值高低,划分正常、轻微故障、严重故障等风机状态;

特征权重的计算如下:

式中,i是特征编号,从1到n,μ是均值向量,Σ是协方差矩阵。

(5)矩阵生成:将相同状态的特征权重,排列成健康矩阵。每个矩阵元素,代表该状态下,对应特征的权重系数。

将式(1)的特征权重,按照顺序排列,得到权重矩阵Q

对特征数据使用因子分析法,得到相关矩阵R

A

式中,n是健康矩阵维度,常取6-12。n大于12时,需要降维。

健康评估的原理如下:

假设预测模型的初始输入z

在预测模型中,第i层输入z

D

将z

式(4)中,A降低了D

因不同模型的预测流程不同,z和D对预测的影响也不同,优化后,可能提升模型的预测精度或速度。

现有健康评估算法,存在两点缺陷:

1、处理成本高:筛选特征时,需要多维度的风机数据,提高了数据采集,处理和分析的成本;

2、复杂度高:为提高评估可靠性,引入复杂的特征选取模块,增加了评估复杂度。

发明内容

针对上述要解决的技术问题,本发明提供一种基于健康评估的Informer风电功率预测模型的优化方法,实时监控,降低救援风险,缩短救援时间,提高救援成功率,确保救援工作有序进行。

为解决上述技术问题,本发明提出的技术方案为:

一种基于健康评估的Informer风电功率预测模型的优化方法,所述优化方法至少包括以下内容中的两种结合:

1)编码器优化:提升第i层的输入x

2)解码器优化:提升第L层的输入c

3)嵌入向量优化:提升模块的初始输入x

4)预测过程优化:根据模块的初始输入x

作为上述技术方案的进一步改进为:

优选地,所述编码器优化,具体为:

假设Encoder模块由多个编码层和卷积层组成,第i层的输入为x

式(5)中,Conv表示卷积层的卷积计算;Attention表示概率稀疏自注意力函数,

式(6)中,softmax表示归一化函数;

提升x

式(7)中以

优选地,所述解码器优化,具体为:

假设Decoder模块由L个解码层构成,每个解码层中,输入c

c

式中,Decoder

提升c

c

式中,h为健康因子,由健康矩阵A

优选地,所述嵌入向量优化,具体为:

Encoder模块的初始输入x

式中,x

优选地,所述预测过程优化,具体为:

嵌入向量x

健康评估对c

其中,

本发明提供的基于健康评估的Informer风电功率预测模型的优化方法,与现有技术相比,有以下优点:

(1)本发明的基于健康评估的Informer风电功率预测模型的优化方法,采用健康评估,优化Informer模型,提升预测精度和速度,首先,基于运行数据,进行健康评估,得到风机健康矩阵;然后,通过健康矩阵,优化编码方式,提升Informer的预测速度;接着,使用健康矩阵,改进解码方式、嵌入向量和预测流程,提高Informer的预测精度。

(2)本发明的基于健康评估的Informer风电功率预测模型的优化方法,基于健康评估而设计的Informer优化模型,可加速Informer收敛,提升模型的预测精度和速度。Encoder结合优化后的Informer模型,是优质的风电功率预测模型。与未优化模型比较,基于健康评估的Informer优化模型,进行风电功率预测时,数据成本更小,优化效果更好。

附图说明

图1为现有技术中Informer预测流程图。

图2为现有技术中健康评估流程图。

图3为本发明应用实施时嵌入向量结构图。

图4为本发明应用实施时优化前后

图5为本发明验证时K-C 5号机组预测效果图。

图6为本发明验证时K-C 33号机组预测效果图。

图7为本发明验证时龙源1号机组预测效果图。

图8为本发明验证时龙源12号机组预测效果图。

图9为本发明验证时5th 1-36号机组预测效果图。

图10为本发明验证时5th 2-30号机组预测效果图。

图11为本发明验证时GEFC 5号机组预测效果图。

图12为本发明验证时GEFC 6号机组预测效果图。

具体实施方式

以下对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

如图1至图4所示,本发明的基于健康评估的Informer风电功率预测模型的优化方法,包括以下内容:

1)编码器优化

假设Encoder模块由多个编码层和卷积层组成,第i层的输入为x

式(5)中,Conv表示卷积层的卷积计算;Attention表示概率稀疏自注意力函数,即

式(6)中,softmax表示归一化函数;

在x

式(7)中以

Encoder模块的优化效果论证:

式(6)中,矩阵

式中,q

p(k

式(6)和式(8)中,使用了稀疏度量为M(q

式中,L

在稀疏自注意力中,查询和键的长度相等,即L

由式(3)和式(4)得知,在式(7)中,优化后的

2)解码器优化

假设Decoder模块由L个解码层构成,每个解码层中,输入c

c

式中,Decoder

由于c

c

式中,h为健康因子,由健康矩阵A

由于提升了Decoder模块的解码精度,优化后,Informer的预测精度上升。

Decoder模块的优化效果论证:

Decoder模块的第1层输入可表示为

式中,

虽然掩蔽多头注意力的应用,防止了

采用式(11)的优化方案,等价于提高

3)嵌入向量优化

嵌入向量是指Encoder模块的初始输入x

式中,x

因嵌入向量中,强相关特征的权重提升,优化后,Informer的预测精度提高。

嵌入向量模块的优化效果论证:

假设第t个序列输入为X

式中,j∈{1,…,[d

式中,i∈{1,…,L

嵌入向量结构如图3所示。因三角函数sin,cos自带采样权重,式(14)和式(15)得到的

式(13)结合了特征分布的偏差,对嵌入向量进行优化。由式(3)和式(4)可知,优化后,由特征分布变化引起的系统误差,在后续的编码-解码过程中会逐渐减小,从而提升Informer的预测精度。

4)预测过程优化

由图2和式(3)-式(12)得知,嵌入向量x

且健康评估改为对c

其中,

因结合了特征分布的变化,优化后,Informer的预测精度上升。

预测过程的优化效果论证:

假设x

1≤e≤g

由式(3)至式(16)可知,预测过程中,不涉及强相关特征的数量增减,因此,存在下列约束条件:

f-e=h-g=k,k为正整数(20)

对于嵌入向量x

D

类似地,对于解码输出c

和/>

由式(16)和图3得知,x

采用式(17)和式(18)的优化方案,可以针对

k=2时,优化前后的

5)组合优化

因为Encoder模块的优化,以速度提升为主,Decoder模块、嵌入向量和预测过程的优化,以精度提升为主。为了避免过度优化,本发明选择了Encoder-Decoder,Encoder-嵌入向量,Encoder-预测过程,共3种结合优化模型,进行训练、测试。

优化验证:

1)误差指标设置

采用R

式中,y

若优化有效,理想情况下,R

2)仿真测试

本次验证方法使用了百度KDD CUP 2022数据集、“中国软件杯”——龙源风电赛道数据集,第五届全国工业互联网数据创新应用大赛的数据集,和Global EnergyForecasting Competition 2014的Task15数据集等四个数据集。每个数据集,具有17000-21000条数据。选择未优化、Encoder优化、Decoder优化,Encoder-Decoder优化、嵌入向量优化、预测过程优化、Encoder-嵌入向量优化、Encoder-预测过程优化,共8套模型进行仿真测试。每套模型,分别进行3轮训练和6轮训练的仿真测试。数据集的前80%作为训练集,剩余20%为测试集。

为了减少量纲差异的影响,对所有预测结果进行标准化,如下所示:

式中,z

Informer模型的组件细节见表1。

表1Informer模型组件细节

采用KDD CUP数据集的预测效果如图5和图6所示。采用龙源风电数据集的预测效果如图7和图8所示。采用第五届大赛数据集的预测效果如图9和图10所示。采用GEFC 2014数据集的预测效果如图11和图12所示。

各数据集的预测结果对比见表2至表9。

表2KDD CUP 5号机组预测指标

/>

表3KDD CUP 33号机组预测指标

表4龙源风电1号机组预测指标

/>

表5龙源风电12号机组预测指标

表6 5th 1号风场36号机组预测指标

表7 5th 2号风场30号机组预测指标

/>

表8GEFC 5号机组预测指标

表9GEFC 6号机组预测指标

/>

图5-图12中,V1代表未优化的预测效果、V2代表Encoder优化的预测效果、V3代表Decoder优化的预测效果、V4代表Encoder-Decoder结合优化的预测效果、V5代表嵌入向量优化的预测效果、V6代表预测过程优化的预测效果、V7代表Encoder-预测过程结合优化的预测效果、V8代表Encoder-嵌入向量结合优化的预测效果。所有预测效果图,均在6轮训练下绘制。

由图5-图12知,除Encoder独立优化外,其余的优化模型,与未优化模型相比,预测精度均有所上升。由表2至表9可知,所提出的7种优化模型,实现了预测精度提升15%,或是预测速度提升100%中,至少一种的优化效果。并且,3种Encoder结合优化模型,均同时实现了预测精度提升15%,预测速度提升100%的优化效果。此外,所选的结合优化模型,只需要一半的训练轮数,其预测精度就已接近,或是超过未优化的模型。这说明基于健康评估进行的Informer优化,是合理且有效的。Encoder结合优化的Informer模型,是优质的风电功率预测模型。

上述实施案例只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。

相关技术
  • 基于SDAE-SVR-BA的风电功率深度学习预测模型优化方法
  • 风电功率预测模型的训练方法、风电功率预测方法及设备
技术分类

06120116625645