导航：首页> 计算；推算；计数>基于健康评估的Informer风电功率预测模型的优化方法

基于健康评估的Informer风电功率预测模型的优化方法

文献发布时间：2024-05-31 01:29:11

技术领域

本发明涉及风电功率技术领域，特别是涉及一种基于健康评估的Informer风电功率预测模型的优化方法。

背景技术

风能的波动性，造成风电的间歇性，并网后可能影响电网运行。为了保障电网安全，需要进行风电功率预测，以便及时调控。

早期基于数值天气预报(Numerical Weather Prediction)的预测方法，目前已被神经网络取代。虽然神经网络的预测精度较高，但预测速度慢、结构复杂、后期维护难度大。寻找新的预测模型，成为近年来的研究热点。Informer凭借预测速度快、模型轻量化的特点，可代替传统神经网络，进行功率预测。然而，Informer的预测精度较低，预测速度难以满足实际需求，预测性能不足之处较为明显。

针对Informer预测性能的不足，研究者从多方面进行优化。潘立群，张倩，Gong M

等优化编码流程，强化Informer的序列分析能力，提升预测精度；赵懂宇，冯霞，Yang Z

等引进对抗机制，增强Informer的抗干扰能力，提升预测精度；余琼芳，梁英杰，Zhu Q等改进采样方法，提高Informer的多元采样能力，提升预测速度。目前，大部分优化方法，不能同时提升Informer的预测精度和速度，优化效果不理想，且增加了Informer复杂度，影响其实际应用。

Informer是一种基于概率稀疏自注意力的预测模型，由Zhou Haoyi等人于2021年提出。和传统神经网络不同，Informer采用了Encoder-Decoder分离的结构。预测过程中，编码输出送入解码器处理，得到解码输出，并通过全连接层，输出预测结果。

Informer预测流程如图1所示。在Informer中，存在3个要点：

(1)自注意蒸馏操作(Self-attention Distilling Operation)：Encoder模块中，每个编码层的深度递减，输出长度随之递减，从而提取特征，并在模块结尾，将所有特征进行连接，作为Decoder模块的输入。

(2)生成式解码器(Generative Style Decoder)：Decoder模块中，使用了一种新的生成式解码器，只需要一个前向推导过程，便可获得指定长度的预测结果，有效避免了累积误差的扩散。

(3)概率稀疏自注意机制(ProbSparse Self-attention Mechanism)：基于高得分点积对贡献主要关注的结论，Informer对强相关特征进行额外关注，在自注意过程中，仅计算强相关特征部分，降低预测成本。

现有的Informer预测模型，保证一定精度和速度的同时，仍存在下列不足：

1、计算频繁：Encoder模块中，为了提升强相关特征的关注度，需要频繁进行自注意力计算，降低了预测速度；

2、解码缺陷：Decoder模块中，使用了序列占位符，进行辅助预测，且占位符和特征数据具有相同的权重。权重分配的不合理，导致预测精度下降。

3、计算复杂：Informer需要引进额外模块，或提升特征维度，从而完成自注意机制，增加了计算复杂度，减小了模型轻量化的优势。

健康评估是一种权重优化算法，由Lars Landberg于2011年提出。它依据模型输出统计学概率分布的特点，将二维的概率密度函数，转化为权重健康矩阵。

健康评估的流程如图2所示，具体为：

(1)数据采集：通过传感器和SCADA系统，采集风速、温度、压力、转速、功率等风机数据；

(2)数据清洗：针对数据中的缺失值、异常值、传输噪声，进行清洗工作，提高数据可靠性；

(3)特征筛选：从清洗后的数据中，筛选出特征数据，并基于特征数据的维度，得到健康矩阵的维度；

(4)状态分类：使用特征数据，计算特征权重，并根据权重数值高低，划分正常、轻微故障、严重故障等风机状态；

特征权重的计算如下：

式中，i是特征编号，从1到n，μ是均值向量，Σ是协方差矩阵。

(5)矩阵生成：将相同状态的特征权重，排列成健康矩阵。每个矩阵元素，代表该状态下，对应特征的权重系数。

将式(1)的特征权重，按照顺序排列，得到权重矩阵Q

对特征数据使用因子分析法，得到相关矩阵R

式中，n是健康矩阵维度，常取6-12。n大于12时，需要降维。

健康评估的原理如下：

假设预测模型的初始输入z

在预测模型中，第i层输入z

将z

式(4)中，A降低了D

因不同模型的预测流程不同，z和D对预测的影响也不同，优化后，可能提升模型的预测精度或速度。

现有健康评估算法，存在两点缺陷：

1、处理成本高：筛选特征时，需要多维度的风机数据，提高了数据采集，处理和分析的成本；

2、复杂度高：为提高评估可靠性，引入复杂的特征选取模块，增加了评估复杂度。

发明内容

针对上述要解决的技术问题，本发明提供一种基于健康评估的Informer风电功率预测模型的优化方法，实时监控，降低救援风险，缩短救援时间，提高救援成功率，确保救援工作有序进行。

为解决上述技术问题，本发明提出的技术方案为：

一种基于健康评估的Informer风电功率预测模型的优化方法，所述优化方法至少包括以下内容中的两种结合：

1)编码器优化：提升第i层的输入x

2)解码器优化：提升第L层的输入c

3)嵌入向量优化：提升模块的初始输入x

4)预测过程优化：根据模块的初始输入x

作为上述技术方案的进一步改进为：

优选地，所述编码器优化，具体为：

假设Encoder模块由多个编码层和卷积层组成，第i层的输入为x

式(5)中，Conv表示卷积层的卷积计算；Attention表示概率稀疏自注意力函数，

式(6)中，softmax表示归一化函数；

提升x

式(7)中以

优选地，所述解码器优化，具体为：

假设Decoder模块由L个解码层构成，每个解码层中，输入c

式中，Decoder

提升c

式中，h为健康因子，由健康矩阵A

优选地，所述嵌入向量优化，具体为：

Encoder模块的初始输入x

式中，x

优选地，所述预测过程优化，具体为：

嵌入向量x

健康评估对c

其中，

本发明提供的基于健康评估的Informer风电功率预测模型的优化方法，与现有技术相比，有以下优点：

(1)本发明的基于健康评估的Informer风电功率预测模型的优化方法，采用健康评估，优化Informer模型，提升预测精度和速度，首先，基于运行数据，进行健康评估，得到风机健康矩阵；然后，通过健康矩阵，优化编码方式，提升Informer的预测速度；接着，使用健康矩阵，改进解码方式、嵌入向量和预测流程，提高Informer的预测精度。

(2)本发明的基于健康评估的Informer风电功率预测模型的优化方法，基于健康评估而设计的Informer优化模型，可加速Informer收敛，提升模型的预测精度和速度。Encoder结合优化后的Informer模型，是优质的风电功率预测模型。与未优化模型比较，基于健康评估的Informer优化模型，进行风电功率预测时，数据成本更小，优化效果更好。

附图说明

图1为现有技术中Informer预测流程图。

图2为现有技术中健康评估流程图。

图3为本发明应用实施时嵌入向量结构图。

图4为本发明应用实施时优化前后

图5为本发明验证时K-C 5号机组预测效果图。

图6为本发明验证时K-C 33号机组预测效果图。

图7为本发明验证时龙源1号机组预测效果图。

图8为本发明验证时龙源12号机组预测效果图。

图9为本发明验证时5th 1-36号机组预测效果图。

图10为本发明验证时5th 2-30号机组预测效果图。

图11为本发明验证时GEFC 5号机组预测效果图。

图12为本发明验证时GEFC 6号机组预测效果图。

具体实施方式

以下对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

如图1至图4所示，本发明的基于健康评估的Informer风电功率预测模型的优化方法，包括以下内容：

1)编码器优化

假设Encoder模块由多个编码层和卷积层组成，第i层的输入为x

式(5)中，Conv表示卷积层的卷积计算；Attention表示概率稀疏自注意力函数，即

式(6)中，softmax表示归一化函数；

在x

式(7)中以

Encoder模块的优化效果论证：

式(6)中，矩阵

式中，q

p(k

式(6)和式(8)中，使用了稀疏度量为M(q

式中，L

在稀疏自注意力中，查询和键的长度相等，即L

由式(3)和式(4)得知，在式(7)中，优化后的

2)解码器优化

假设Decoder模块由L个解码层构成，每个解码层中，输入c

式中，Decoder

由于c

式中，h为健康因子，由健康矩阵A

由于提升了Decoder模块的解码精度，优化后，Informer的预测精度上升。

Decoder模块的优化效果论证：

Decoder模块的第1层输入可表示为

式中，

虽然掩蔽多头注意力的应用，防止了

采用式(11)的优化方案，等价于提高

3)嵌入向量优化

嵌入向量是指Encoder模块的初始输入x

式中，x

因嵌入向量中，强相关特征的权重提升，优化后，Informer的预测精度提高。

嵌入向量模块的优化效果论证：

假设第t个序列输入为X

式中，j∈{1,…,[d

式中，i∈{1,…,L

嵌入向量结构如图3所示。因三角函数sin，cos自带采样权重，式(14)和式(15)得到的

式(13)结合了特征分布的偏差，对嵌入向量进行优化。由式(3)和式(4)可知，优化后，由特征分布变化引起的系统误差，在后续的编码-解码过程中会逐渐减小，从而提升Informer的预测精度。

4)预测过程优化

由图2和式(3)-式(12)得知，嵌入向量x

且健康评估改为对c

其中，

因结合了特征分布的变化，优化后，Informer的预测精度上升。

预测过程的优化效果论证：

假设x

1≤e≤g

由式(3)至式(16)可知，预测过程中，不涉及强相关特征的数量增减，因此，存在下列约束条件：

f-e＝h-g＝k,k为正整数(20)

对于嵌入向量x

类似地，对于解码输出c

和/>

由式(16)和图3得知，x

采用式(17)和式(18)的优化方案，可以针对

k＝2时，优化前后的

5)组合优化

因为Encoder模块的优化，以速度提升为主，Decoder模块、嵌入向量和预测过程的优化，以精度提升为主。为了避免过度优化，本发明选择了Encoder-Decoder，Encoder-嵌入向量，Encoder-预测过程，共3种结合优化模型，进行训练、测试。

优化验证：

1)误差指标设置

采用R

式中，y

若优化有效，理想情况下，R

2)仿真测试

本次验证方法使用了百度KDD CUP 2022数据集、“中国软件杯”——龙源风电赛道数据集，第五届全国工业互联网数据创新应用大赛的数据集，和Global EnergyForecasting Competition 2014的Task15数据集等四个数据集。每个数据集，具有17000-21000条数据。选择未优化、Encoder优化、Decoder优化，Encoder-Decoder优化、嵌入向量优化、预测过程优化、Encoder-嵌入向量优化、Encoder-预测过程优化，共8套模型进行仿真测试。每套模型，分别进行3轮训练和6轮训练的仿真测试。数据集的前80％作为训练集，剩余20％为测试集。

为了减少量纲差异的影响，对所有预测结果进行标准化，如下所示：

式中，z

Informer模型的组件细节见表1。

表1Informer模型组件细节

采用KDD CUP数据集的预测效果如图5和图6所示。采用龙源风电数据集的预测效果如图7和图8所示。采用第五届大赛数据集的预测效果如图9和图10所示。采用GEFC 2014数据集的预测效果如图11和图12所示。

各数据集的预测结果对比见表2至表9。

表2KDD CUP 5号机组预测指标

表3KDD CUP 33号机组预测指标

表4龙源风电1号机组预测指标

表5龙源风电12号机组预测指标

表6 5th 1号风场36号机组预测指标

表7 5th 2号风场30号机组预测指标

表8GEFC 5号机组预测指标

表9GEFC 6号机组预测指标

图5-图12中，V1代表未优化的预测效果、V2代表Encoder优化的预测效果、V3代表Decoder优化的预测效果、V4代表Encoder-Decoder结合优化的预测效果、V5代表嵌入向量优化的预测效果、V6代表预测过程优化的预测效果、V7代表Encoder-预测过程结合优化的预测效果、V8代表Encoder-嵌入向量结合优化的预测效果。所有预测效果图，均在6轮训练下绘制。

由图5-图12知，除Encoder独立优化外，其余的优化模型，与未优化模型相比，预测精度均有所上升。由表2至表9可知，所提出的7种优化模型，实现了预测精度提升15％，或是预测速度提升100％中，至少一种的优化效果。并且，3种Encoder结合优化模型，均同时实现了预测精度提升15％，预测速度提升100％的优化效果。此外，所选的结合优化模型，只需要一半的训练轮数，其预测精度就已接近，或是超过未优化的模型。这说明基于健康评估进行的Informer优化，是合理且有效的。Encoder结合优化的Informer模型，是优质的风电功率预测模型。

上述实施案例只是本发明的较佳实施例，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。因此，凡是未脱离本发明技术方案的内容，依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均应落在本发明技术方案保护的范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：湖南工程学院;

上一篇：一种基于FLAC软件实现非结构化网格拉伸快速建模方法及系统
下一篇：一种测试用例优化的softAPFD评价方法