掌桥专利:专业的专利平台
掌桥专利
首页

一种基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法

文献发布时间:2023-06-19 18:37:28


一种基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法

技术领域

本发明涉及煤炭需求量预测技术领域,尤其涉及一种基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法。

背景技术

煤作为主要的能源,每年的供应和需求量极不平衡,同时我国目前每年需要进口2.7亿-3亿吨煤,进口煤量直接影响全国煤炭供应体系。同时在2021年因为煤炭的需求不平衡,进而导致了拉闸限电。如何平抑煤炭需求量,是保证能源平稳运行的关键。煤炭需求预测作为保证能源平稳供应的关键技术,当前技术一般采用多元回归法、经验判断法和神经网络法。其预测效果极不稳定,误差很大,因此亟需一种新的预测技术来对煤炭需求进行精准预测。同时,在预测方面,由于缺乏在预测前期对煤炭特征进行分析技术研究,从而导致了其预测效果极不稳定,误差很大,预测精度低。

发明内容

本发明提供一种基于CNN-BILSTM-Attention的煤炭需求量预测方法,提高了对煤炭需求量的预测精度。

本发明一实施例提供一种基于CNN-BILSTM-Attention的煤炭需求量预测方法,包括以下步骤:

构建GRA-PCA模型,通过所述GRA-PCA模型对第一煤炭需求特征因素和煤炭需求量进行灰色关联度分析得到第二煤炭需求特征因素,根据所述第二煤炭需求特征因素构建第一数据集,再对所述第一数据集进行降维处理得到第二数据集;

根据CNN-BILSTM-Attention混合神经网络和PSO算法建立基于PSO-CNN-BILSTM-Attention的煤炭需求量预测模型,所述煤炭需求量预测模型根据PSO算法更新权重系数;

采用所述第二数据集将所述煤炭需求量预测模型训练至收敛;

获取所述第二煤炭需求特征因素对应的近几个月的煤炭需求特征数据作为预测数据集,将所述预测数据集输入至所述煤炭需求量预测模型,得到预测的下一个月的煤炭需求量。

进一步的,其特征在于,通过所述GRA-PCA模型对第一煤炭需求特征因素和煤炭需求量进行灰色关联度计算,得到所述第一煤炭需求特征因素和煤炭需求量的关联度,选择所述关联度大于预设阈值的第一煤炭需求特征因素作为第二煤炭需求特征因素;

选择所述第二煤炭需求特征因素对应的煤炭需求特征数据构建第一数据集;

通过主成分分析对所述第一数据集进行降维处理,得到第二数据集。

进一步的,采用所述第二数据集对所述煤炭需求量预测模型进行训练,具体为:

将所述第二数据集输入至CNN卷积层,通过所述CNN卷积层的多池化操作对所述第二数据集进行数据特征提取后依次输入至BILSTM网络层和Attention层进行训练,并根据PSO算法对训练过程的权重系数进行更新。

进一步的,所述CNN卷积层的卷积计算公式为:

c

C=[c

其中,K表示卷积核,m表示所述卷积核的宽度,f表示所述卷积尺度,T为激活函数;b

进一步的,所述CNN卷积层采用线性整流函数计算误差梯度。

进一步的,所述BILSTM网络层的每个单元状态中均包括正向LSTM层和反向LSTM层,所述正向LSTM层和反向LSTM层分别用于获取输入数据的过去信息和未来信息。

本发明的实施例,具有如下有益效果:

本发明提供了一种基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法,该方法通过建立基于PSO-CNN-BILSTM-Attention的煤炭需求量预测模型,不仅利用了GRA-PCA模型对数据的特征进行了提取选择和分析,同时通过CNN-BILSTM-Attention混合深度学习模型对GRA-PCA模型提取的特征数据进行了学习,解决了对煤炭需求特征因素进行分析和提取的问题。同时加入了PSO优化算法优化了学习参数,解决了煤炭需求预测模型单一、拟合效果差、预测不稳定、技术老的问题,大大提高了预测的精度和预测的稳定性。

附图说明

图1是本发明一实施例提供的基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法的流程示意图;

图2是本发明一实施例提供的基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法的CNN卷积层的多池化操作流程示意图;

图3是本发明一实施例提供的基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法的BILSTM网络层的结构示意图。

具体实施方式

下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明一实施例提供的一种基于PSO-CNN-BILSTM-Attention的煤炭需求量预测方法,包括以下步骤:

步骤S101:构建GRA-PCA模型,通过所述GRA-PCA模型对第一煤炭需求特征因素和煤炭需求量进行灰色关联度分析得到第二煤炭需求特征因素,根据所述第二煤炭需求特征因素构建第一数据集,再对所述第一数据集进行降维处理得到第二数据集,所述煤炭需求特征因素是指影响煤炭需求量的特征因素,包括煤炭价格、煤炭需求量、煤炭供应量、煤炭政策、电力需求负荷、天气,煤炭在电力中的占比;所述煤炭需求特征因素对应的煤炭需求特征数据包括煤炭价格数据、煤炭需求量数据、煤炭供应量数据、煤炭政策数据、电力需求负荷数据、天气数据,煤炭在电力中的占比数据。

作为其中一种实施例,通过所述GRA-PCA模型对第一煤炭需求特征因素和煤炭需求量进行灰色关联度计算,得到所述第一煤炭需求特征因素和煤炭需求量的关联度,选择所述关联度大于预设阈值的第一煤炭需求特征因素作为第二煤炭需求特征因素;

选择所述第二煤炭需求特征因素对应的煤炭需求特征数据构建第一数据集;

通过主成分分析对所述第一数据集进行降维处理,得到第二数据集。

作为其中一种实施例,所述步骤S101包括以下子步骤:

子步骤S1011:根据煤炭需求量和煤炭需求特征因素对应的煤炭需求特征数据(所述煤炭需求特征数据的时间段为历史20年至今)构建以下矩阵:

Y=[Y

X

其中,i=1,2,…,m,表示比较序列中的一行,对应一个煤炭需求特征因素。

子步骤S1012:对矩阵进行归一化处理。

其中,i=1,2,…,m;k=1,2,…,n;k表示时间段。

子步骤S1013:计算煤炭需求特征因素和煤炭需求量之间的关联系数ξ

记Δ

其中,ρ表示分辨系数;k对应时间段k=1,2,…,n;i=1,2,…,m。

子步骤S1014:计算煤炭需求特征因素和煤炭需求量之间的关联度r

在多指标研究中,由于变量过多,会增加一定的复杂性,而且变量之间可能存在着一定的相关性,使得所观测的数据在一定程度上有信息重叠。为了克服这一困难,就需要通过主成分分析进行降维,用较少的新变量代替原来较多的旧变量,而且使新变量尽可能多地保留旧变量较多的信息,且新变量之间相互独立,从而达到简化的目的。

子步骤S1015:根据所述煤炭需求特征数据构建以下观测样本的矩阵:

其中,n表示样本个数,p表示每个样本的变量个数。为了最小化样本集的方差,需要通过以下两步进行计算:一是样本的坐标进行旋转变化,使矩阵能够正交化;二是选取新的主成分。

子步骤S1016:根据公式(8)将样本集中的元素x

根据公式(9)和(10)计算样本集的方差:

根据公式(11)计算样本集的相关系数矩阵:

通过特征方程|R-λ

则贡献率和累计贡献率分别为:

其中,i=1,2,…p,α

子步骤S1017:选择m(m≤p)个新的主成分。选取前m个因子Z

步骤S102:根据CNN-BILSTM-Attention混合神经网络和PSO算法建立基于PSO-CNN-BILSTM-Attention的煤炭需求量预测模型,所述煤炭需求量预测模型根据PSO算法更新权重系数。所述CNN-BILSTM-Attention混合神经网络包含若干层神经单元。

步骤S103:采用所述第二数据集将所述煤炭需求量预测模型训练至收敛。

作为其中一种实施例,采用所述第二数据集对所述煤炭需求量预测模型进行训练,具体为:

将所述第二数据集输入至CNN卷积层,通过所述CNN卷积层的多池化操作对所述第二数据集进行数据特征提取后依次输入至BILSTM网络层和Attention层进行训练,并根据PSO算法对训练过程的权重系数进行更新。

影响煤炭需求量预测的因素多种多样,单个模型并不能完全解决预测中所出现的问题。如卷积神经网络虽然提取的特征丰富,但在处理学习时间数据上并不擅长。长短期记忆网络虽然适用于处理序列数据,但是提取特征上并不占优势。因此,需要在LSTM的基础上进行改进,本发明采用双向长短期记忆网络(BiLSTM),能够通过利用正反LSTM来获得前后时间段的关系,提高学习效果。

作为其中一种实施例,所述煤炭需求量预测模型的训练过程包括:

子步骤S1031:首先将第二数据集输入到CNN卷积层进行数据特征提取;具体的,采用如图2所示的卷积多池化操作流程,在所述CNN卷积层通过多池化操作对所述第二数据集进行数据特征提取。本发明考虑到卷积神经网络模型对数据的需求较大,而池化层可能会忽略掉信息整体与部分间的相关性,遗漏许多潜在有用信息,因此使用多池化操作代替单池化结构,从而可以提取更多不同的主题特征和防止单池化造成的潜在有效信息的丢失,达到提高模型预测精度的目的。

为便于卷积计算和减少计算量,将卷积核K的宽度设置为m、卷积尺度设置为f,卷积计算公式如下所示:

c

C=[c

其中,T为激活函数;b

在计算误差梯度过程中,当计算量较大时可能会出现梯度爆炸。为了解决这个问题,本发明在卷积处理中加入了线性整流函数(Rectified Linear Unit,ReLU),具体为公式(17)。该含函数不像sigmoid等其他激活函数那样存在饱和问题,其能够在卷积过程中增大网络稀疏性。

ReLU(x)=max(0,1) (17)

子步骤S1032:将经过CNN卷积层处理后的数据输入到BILSTM网络层和Attention网络层进行学习,图3所示BiLSTM为LSTM的改进版本,每个单元状态中都包含两个LSTM层。通过正向LSTM层

式中,σ表示激活函数;b表示相对应的偏置向量;

子步骤S1033:最后利用PSO算法对训练过程的权重系数进行优化更新。PSO在参数选取和收敛速度等方面具有一定的优势。PSO算法源于对鸟群捕食行为的研究,其基本思想是通过群体中个体之间的信息传递及信息共享来寻找最优解。根据公式(21)和(22)对所述煤炭需求量预测模型的权重系数进行优化更新:

v

X

其中,“i”表示第i个粒子,i=1,2,…,M,M是该群体中粒子的总数。

下标“j”表示微粒的第j维,即算法所优化的第j个参数。

ω为惯性权重因子,其值非负,ω值的大小影响整体寻优能力,为了避免出现早熟收敛,保证其收敛到全局最优,采用权值ω在最大值ω

t表示此时优化的代数;v

r

p

在每一次迭代过程中,每个粒子都需要根据目标函数来计算其适应值大小,目标函数可以是均方误差、方差、标准差等。然后根据适应值来确定当前粒子最优位置p

步骤S104:获取所述第二煤炭需求特征因素对应的近几个月的煤炭需求特征数据作为预测数据集,将所述预测数据集输入至所述煤炭需求量预测模型,得到预测的下一个月的煤炭需求量。

与现有技术相比,本发明通过建立的GRA-PCA模型对数据特征分析提取及权重分析的技术,同时引入了混合深度学习算法CNN-BILSTM-Attention增加了预测模型的复杂性使得数据拟合的效果预测效果大大的提高。当前煤炭预测技术很少,在现有技术中的预测均方根误差在18%左右,最好的效果能达到15%,同时预测也极不稳定波动幅度在5%。而本发明的预测准确率平均均方根误差在9%。上下浮动在2%以内,最佳预测效果能达到7%。极大的提高了预测的精准度和稳定性。

本发明构建的基于混合深度学习算法的煤炭需求量预测模型,在现有数据下充分挖掘出已有数据中的潜在分布信息,对能源数据进行了更好的学习分析,准确的对煤炭需求进行了实时的预测,为能源预警提供了技术支撑,提高煤炭需求的经济性和安全性。

本发明建立的基于PSO-CNN-BILSTM-Attention的煤炭需求量预测模型,不仅利用了GRA-PCA模型对数据的特征进行了提取选择和分析,同时建立了CNN-BILSTM-Attention混合深度学习模型对GRA-PCA模型提取的特征数据进行了学习,解决了对煤炭需求特征因素进行分析和提取的问题,同时加入了PSO优化算法优化了学习参数,解决了煤炭需求预测模型单一、拟合效果差、预测不稳定、技术老的问题,大大提高了预测的精度和预测的稳定性。

示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。

所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。

所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中,所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质(即上述可读存储介质)中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

本领域普通技术人员可以理解实现上述实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

技术分类

06120115637701