掌桥专利:专业的专利平台
掌桥专利
首页

气象温度预测模型构建方法、装置、设备及存储介质

文献发布时间:2024-05-31 01:29:11


气象温度预测模型构建方法、装置、设备及存储介质

技术领域

本发明涉及气象预测技术领域,尤其涉及一种气象温度预测模型构建方法、装置、设备及存储介质。

背景技术

气温是日常生活和工农业生产的关键参数之一,准确预测气温对于气象、农业、交通、能源等领域都具有极大的实用价值。近年来,气象温度预测日益成为全球的热门话题。然而,受地理分布、大气环流、洋流、阳光、风速、水体、植被覆盖和地貌特征等诸多因素的影响,温度变化具有动态性、不确定性和非线性等复杂特征,准确的温度预测难度极大。

现有预测方式是利用LSTM模型对日最高温度进行预测,LSTM模型是一种具有长短期记忆的循环神经网络模型,具有捕捉序列特征和保持长期记忆的能力。然而,传统的LSTM模型输出本身包含有时间信息,在遗忘门作用下,这种时间信息会随时间增长顺序逐渐衰减,导致其预测结果并不准确。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供了一种气象温度预测模型构建方法、装置、设备及存储介质,旨在解决传统的LSTM模型输出本身包含有时间信息,在遗忘门作用下,这种时间信息会随时间增长顺序逐渐衰减,导致其预测结果并不准确的技术问题。

为实现上述目的,本发明提供了一种气象温度预测模型构建方法,所述方法包括以下步骤:

通过随机森林算法对气象数据进行特征选择,获得特征子集;

将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型;

通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,获得模型最优参数,所述自适应粒子群鲸鱼优化算法基于粒子群算法和自适应思想改进获得;

根据所述模型最优参数和历史气象数据对所述初始LSTM模型进行训练,获得气象温度预测模型。

可选地,所述通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,获得模型最优参数,包括:

通过鲸鱼优化算法设置鲸鱼种群数量和最大迭代次数;

利用粒子群算法和所述鲸鱼种群数量对所述鲸鱼优化算法对应的鲸鱼种群进行初始化,生成初始鲸鱼种群;

基于自适应粒子群鲸鱼优化算法,对所述初始鲸鱼种群和所述初始LSTM模型进行动态更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。

可选地,所述基于自适应粒子群鲸鱼优化算法,对所述初始鲸鱼种群和所述初始LSTM模型进行动态更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数,包括:

通过自适应粒子群鲸鱼优化算法对所述初始鲸鱼种群的个体和所述初始LSTM模型进行更新,确定所述初始鲸鱼种群的个体适应度值;

判断所述个体适应度值是否达到预设阈值;

若否,则对所述初始鲸鱼种群和进行动态螺旋更新迭代和动态速度更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。

可选地,所述通过自适应粒子群鲸鱼优化算法对所述初始鲸鱼种群的个体和所述初始LSTM模型进行更新,确定所述初始鲸鱼种群的个体适应度值,包括:

对所述初始鲸鱼种群进行更新,确定所述初始鲸鱼种群的最优个体;

获得所述最优个体的自适应度函数值和当前最佳位置;

基于所述最优个体的自适应度函数值和当前最佳位置,通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行更新,以确定所述初始鲸鱼种群的个体适应度值。

可选地,所述通过随机森林算法对气象数据进行特征选择,获得特征子集,包括:

对气象数据进行归一化处理,获得所述气象数据对应的归一化数据;

通过随机森林算法对所述归一化数据进行特征选择,获得所述归一化数据对应的特征因子;

将所述特征因子作为所述气象数据的特征子集。

可选地,所述将所述特征因子作为所述气象数据的特征子集之后,还包括:

创建日循环特征和年循环特征,获得日期循环机制;

将所述日期循环机制与所述特征子集融合,获得日期循环特征子集;

所述将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型,包括:

将注意力机制融入所述日期循环特征子集,并输入至LSTM模型,获得初始LSTM模型。

可选地,所述根据所述模型最优参数和历史气象数据对所述初始LSTM模型进行训练,获得气象温度预测模型,包括:

将采集的历史气象数据按预设比例进行划分,获得所述历史气象数据对应的训练样本集和测试样本集;

根据所述模型最优参数和所述训练样本集对所述初始LSTM模型进行训练,获得训练模型;

将所述测试样本集输入至所述训练模型,并对输出结果进行评估;

若所述输出结果符合预设评估指标,则将符合所述预设评估指标所对应的训练模型作为气象温度预测模型。

此外,为实现上述目的,本发明还提出一种气象温度预测模型构建装置,所述装置包括:

特征选择模块,用于通过随机森林算法对气象数据进行特征选择,获得特征子集;

注意力机制模块,用于将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型;

动态寻优模块,用于通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,获得模型最优参数,所述自适应粒子群鲸鱼优化算法基于粒子群算法和自适应思想改进获得;

模型训练模块,用于根据所述模型最优参数和历史气象数据对所述初始LSTM模型进行训练,获得气象温度预测模型。

此外,为实现上述目的,本发明还提出一种气象温度预测模型构建设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的气象温度预测模型构建程序,所述气象温度预测模型构建程序配置为实现如上文所述的气象温度预测模型构建方法的步骤。

此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有气象温度预测模型构建程序,所述气象温度预测模型构建程序被处理器执行时实现如上文所述的气象温度预测模型构建方法的步骤。

本发明提出了一种气象温度预测模型构建方法,首先通过随机森林算法对气象数据进行特征选择,获得特征子集;然后将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型;接着通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,获得模型最优参数,所述自适应粒子群鲸鱼优化算法基于粒子群算法和自适应思想改进获得;最后根据所述模型最优参数和历史气象数据对所述初始LSTM模型进行训练,获得气象温度预测模型。由于本发明将注意力机制融入LSTM模型中,可预防特征权重衰减,然后引入自适应粒子群鲸鱼优化算法对初始LSTM模型进行动态寻优,可解决模型主观定参易陷入局部最优的不足,从而提高了模型的温度预测精度。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的气象温度预测模型构建设备的结构示意图;

图2为本发明气象温度预测模型构建方法第一实施例的流程示意图;

图3为本发明气象温度预测模型构建方法第一实施例的LSTM示意图;

图4为本发明气象温度预测模型构建方法第二实施例的流程示意图;

图5为本发明气象温度预测模型构建方法第二实施例中座头鲸的模拟泡泡网捕食行为的场景示意图;

图6为本发明气象温度预测模型构建方法第二实施例的特征相关性图;

图7为本发明气象温度预测模型构建方法第二实施例的日循环图;

图8为本发明气象温度预测模型构建方法第二实施例的年循环图;

图9为本发明气象温度预测模型构建方法第二实施例中模型构建的流程示意图;

图10为本发明气象温度预测模型构建方法第二实施例中温度数据样本示意图;

图11为本发明气象温度预测模型构建方法第二实施例中24小时温度误差图;

图12为本发明气象温度预测模型构建方法第二实施例中六大特征与温度关系的热力图;

图13为本发明气象温度预测模型构建方法第二实施例中APSOWOA优化LSTM适应度曲线变化示意图;

图14为本发明气象温度预测模型构建装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的气象温度预测模型构建设备的结构示意图。

如图1所示,该气象温度预测模型构建设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对气象温度预测模型构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及气象温度预测模型构建程序。

在图1所示的气象温度预测模型构建设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明气象温度预测模型构建设备中的处理器1001、存储器1005可以设置在气象温度预测模型构建设备中,所述气象温度预测模型构建设备通过处理器1001调用存储器1005中存储的气象温度预测模型构建程序,并执行本发明实施例提供的气象温度预测模型构建方法。

本发明实施例提供了一种气象温度预测模型构建方法,参照图2,图2为本发明气象温度预测模型构建方法第一实施例的流程示意图。

需要说明的是,气温是日常生活和工农业生产的关键参数之一,准确预测气温对于气象、农业、交通、能源等领域都具有极大的实用价值。目前大多数研究都集中在预测每日气温、月平均气温和年平均气温,很少研究关注每小时步长的实时温度预测。

其中,传统的温度预测方法主要包括数值预测和经验统计预测。这类预测方法多依赖于物理模型,且易受到数据、模型、时间尺度、不确定性和外部因素等影响,导致预测结果准确性差,实际应用存在诸多限制。近年来,机器学习和深度学习取得迅猛发展,在温度预测领域广泛应用这类数据驱动模型,以提高预测准确性和实时性。刘豫等提出基于改进PSO-SVR的气温预测模型,采用改进粒子群算法对支持向量机模型进行参数优化,对单一数据特征预测效果较好,但对多特征预测效果方面还需进一步研究。刘红等利用随机森林模型预测日光温室的最高、最低温度值,最高、最低温度预测效果较好,但对室内环境因素以及温度预测的实时性考虑不足。蒋艮维提出基于PSO-RBF-ANN的温度预测模型,应用粒子群算法优化径向基神经网络参数,对每日最高气温预测效果较好,但在实时性温度预测精度方面还需进一步考证。毛晓娟等提出一种基于GWO-LSTM的蔬菜温室温度预测模型,对短时间温度预测效果较好,但对温室外界的环境因素考虑不足。武双新提出基于LSTM的气温数据建模研究,利用LSTM模型对日最高温度进行预测,其对日最高气温预测精度表现良好,但对其实时预测和短时预测精度方面还需要进一步探究。结合已有研究成果,长短期记忆网络等基于机器学习和深度学习的预测方法中,长短期记忆网络LSTM作为一种重要的循环神经网络模型,被广泛应用于时间序列预测领域,具有捕捉序列特征和保持长期记忆的能力。

然而,传统LSTM模型输出本身包含有时间信息,在遗忘门作用下,这种时间信息会随时间增长顺序逐渐衰减。为了克服这一问题,本发明实施例提出了一种气象温度预测模型构建方法,使模型在气象温度预测方面具有更高准确率和适用性。

本实施例中,所述气象温度预测模型构建方法包括以下步骤:

步骤S10:通过随机森林算法对气象数据进行特征选择,获得特征子集。

需要说明的是,本实施例方法的执行主体可以是具有特征选择、模型优化以及模型训练功能的计算服务设备,例如个人电脑、服务器等,还可以是能够实现相同或相似功能的其他电子设备,例如上述气象温度预测模型构建设备,本实施例对此不加以限制。此处以上述气象温度预测模型构建设备(简称构建设备)对本实施例和下述各实施例进行具体说明。

可理解的是,随机森林算法是一种集成学习方法,由多个决策树组成,每个决策树都是由对数据集进行随机抽样得到的子数据集构建的。通过随机森林算法,可处理大规模的气象数据,以降低数据冗余和维数灾难,提高模型预测效率。

应理解的是,气象数据是指用于描述大气现象和气象条件的各种观测和测量数据,包括气温、湿度、气压、降水量、风速、风向、能见度等。

可理解的是,特征子集是通过随机森林算法,从气象数据中选择出的对气象温度有最大影响力的子集。

在具体实现中,在获取大规模的气象数据时,构建设备可通过随机森林算法对气象数据进行特征选择,从中选择出的对气象温度有最大影响力的特征子集,以降低数据冗余和维数灾难,提高模型预测效率。

步骤S20:将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型。

需要说明的是,注意力机制是一种模拟人类注意力行为的机制,可使模型在处理数据时,能够根据重要信息的权重来集中关注特定的部分。在传统的LSTM神经网络模型中,每个输入部分的权重都是固定的,而通过注意力机制引入可学习的注意力权重,使模型能够根据输入的上下文和任务的需求,动态地调整对输入的关注程度,从而提高模型的性能和表现力。

应理解的是,LSTM模型是一种具有长短期时记忆的时间循环神经网络模型。它是循环神经网络RNN的变体。相较于传统的前馈神经网络,LSTM具有出色的多元时间序列建模能力,可以更好地提取时间序列数据中的丰富内在信息。参考图3,图3为本发明气象温度预测模型构建方法第一实施例的LSTM示意图。

如图3所示,LSTM模型在RNN循环神经网络基础上引入了一个内部的“细胞状态”c,用于存储和传递网络中的长期信息。同时,LSTM还引入了三个门控单元:遗忘门f

其中,遗忘门f

f

式中,σ为sigmoid函数,w

其中,输入门i

i

c'

c

式中,w

其中,输出门o

o

h

式中,w

在具体实现中,构建设备可将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型,以预防特征权重衰减。

步骤S30:通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,获得模型最优参数,所述自适应粒子群鲸鱼优化算法基于粒子群算法和自适应思想改进获得。

需要说明的是,自适应粒子群鲸鱼优化算法基于粒子群算法和自适应思想改进的鲸鱼优化算法。

其中,鲸鱼优化算法WOA是受到座头鲸捕食行为启发而提出的一种较新的启发式算法。它通过模拟座头鲸的捕食行为来进行全局搜索。WOA算法操作简易、需调整的参数少,它采用随机或最佳搜索代理来模拟捕猎行为,并使用螺旋形式的泡泡网攻击机制。其具有良好的全局搜索能力,通过灵活应用捕猎、泡泡网和随机搜索等策略,有效地找到最优解。

粒子群算法(Particle Swarm Optimization,PSO)是一种优化算法,可模拟了鸟群或鱼群等群体的行为,用于解决优化问题。通过引入粒子群算法以及自适应思想(例如在鲸鱼优化算法中进行动态螺旋更新以及动态速度更新)对鲸鱼优化算法的初始种群质量、搜索能力和全局搜索与局部开发能力均衡进行改进,可提高鲸鱼优化算法的搜索精度。

可理解的是,模型最优参数是通过自适应粒子群鲸鱼优化算法对模型进行动态寻优,获得的最优参数。

步骤S40:根据所述模型最优参数和历史气象数据对所述初始LSTM模型进行训练,获得气象温度预测模型。

在具体实现中,构建设备可通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,经过多次迭代的寻优,获得模型最优参数。最后可利用模型最优参数重新对历史气象数据得训练样本集进行训练。并利用训练后的模型对测试集进行预测;输出最优气象温度预测值,并对模型进行评估,在评估合格后,获得气象温度预测模型。

本实施例构建设备在获取大规模的气象数据时,可通过随机森林算法对气象数据进行特征选择,从中选择出的对气象温度有最大影响力的特征子集,以降低数据冗余和维数灾难,提高模型预测效率。然后可将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型,以预防特征权重衰减。接着可通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,经过多次迭代的寻优,获得模型最优参数。最后利用模型最优参数重新对历史气象数据得训练样本集进行训练。并利用训练后的模型对测试集进行预测;输出最优气象温度预测值,并对模型进行评估,在评估合格后,获得气象温度预测模型。由于本发明首先引入粒子群算法、动态螺旋更新和动态速度更新对鲸鱼优化算法的初始种群质量、搜索能力和全局搜索与局部开发能力均衡进行改进,提高鲸鱼算法的搜索精度。然后利用改进的鲸鱼算法对LSTM模型的关键参数动态寻优,解决模型主观定参易陷入局部最优的不足,从而提升模型学习能力。同时融入注意力机制预防特征权重衰减,以提升温度预测精度。并利用随机森林进行特征选择,以降低数据冗余和维数灾难,提高模型预测效率。从而使模型在气象温度预测方面具有更高准确率和适用性。

参考图4,图4为本发明气象温度预测模型构建方法第二实施例的流程示意图。基于上述第一实施例,在本实施例中,所述步骤S30包括:

步骤S31:通过鲸鱼优化算法设置鲸鱼种群数量和最大迭代次数。

需要说明的是,鲸鱼优化算法WOA是受到座头鲸捕食行为启发而提出的一种较新的启发式算法。它通过模拟座头鲸的捕食行为来进行全局搜索。WOA算法操作简易、需调整的参数少,它采用随机或最佳搜索代理来模拟捕猎行为,并使用螺旋形式的泡泡网攻击机制。其具有良好的全局搜索能力,通过灵活应用捕猎、泡泡网和随机搜索等策略,有效地找到最优解。

其中,鲸鱼种群数量是在鲸鱼优化算法中,表示算法中参与搜索的鲸鱼个体数量。最大迭代次数是指算法运行的迭代轮次。每一轮迭代,鲸鱼个体根据算法设计的规则进行位置和速度的更新,并根据更新后的位置评估其解的质量。通过多轮迭代,算法尝试不断优化找到更好的解。

WOA算法的搜索过程参考图5,图5为本发明气象温度预测模型构建方法第二实施例中座头鲸的模拟泡泡网捕食行为的场景示意图。如图5所示,包围猎物时,座头鲸在追捕猎物时会选择最佳路径,使用以下公式对最优位置的位置向量进行更新:

D=|CX

X(t+1)=X

式中,D为猎物与最优搜索代理之间的距离;X*(t)为猎物位置;X(t)为鲸鱼位置;t为迭代次数;A、C均为系数向量。

冒泡攻击。模拟座头鲸捕猎行为时,采用收缩包围和螺旋更新两种方法来更新座头鲸的位置,从而使其向猎物移动。通过随机产生的概率,交替更新最优搜索代理,具体计算公式为:

X(t+1)=D'e

D'=|X

式中,b为对数螺旋的形状参数;l为0~1之间的随机数。

搜索猎物。座头鲸会通过观察最近的搜索代理来决定自己的移动方向和位置,具体计算公式为:

D=|CX

X(t+1)=X

式中,X

WOA算法寻优过程中,生成一个介于0和1之间的随机数p。当p大于0.5时,进入泡泡网攻击模式;否则,检查系数向量A的绝对值。如果|A|大于等于1,对目标猎物进行搜索;如果|A|小于1,对目标猎物进行包围。随着WOA算法的迭代次数增加,逐渐从重点关注猎物的位置转向对其进行包围以实现更好的优化效果。

步骤S32:利用粒子群算法和所述鲸鱼种群数量对所述鲸鱼优化算法对应的鲸鱼种群进行初始化,生成初始鲸鱼种群。

需要说明的是,鉴于传统WOA算法存在容易陷入局部最优、寻优精度低和收敛速度慢等问题,本发明实施例提出一种改进WOA算法的自适应粒子群鲸鱼优化算法(APSOWOA),融入粒子群优化和自适应思想对WOA算法的全局搜索能力进行改进。

在实际实现中,鲸鱼优化算法中初始解的位置是影响寻优效果与收敛性的重要指标。因此,利用粒子群算法对种群进行初始化可保证得到较好的初始种群解。粒子群算法结构简单,通过不断更新粒子的速度和位置,能较快地搜索到全局最优解。其表达式为:

式中,i=1,2,...,N,N是此群中粒子的总数;v

式中,x

对粒子群算法的权重参数w

w

式中,w

通过粒子群算法和所述鲸鱼种群数量对所述鲸鱼优化算法对应的鲸鱼种群进行初始化,可对鲸鱼优化算法的全局搜索能力进行改进,生成初始鲸鱼种群。

步骤S33:基于自适应粒子群鲸鱼优化算法,对所述初始鲸鱼种群和所述初始LSTM模型进行动态更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。

在具体实现中,构建设备可通过鲸鱼优化算法设置鲸鱼种群数量和最大迭代次数;然后利用粒子群算法和所述鲸鱼种群数量对所述鲸鱼优化算法对应的鲸鱼种群进行初始化,生成初始鲸鱼种群;最后基于自适应粒子群鲸鱼优化算法,对所述初始鲸鱼种群和所述初始LSTM模型进行动态更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。从而通过融入粒子群优化和自适应思想可对鲸鱼优化算法的全局搜索能力进行改,以提高鲸鱼算法的搜索精度。

进一步地,本实施例中在步骤S33包括:通过自适应粒子群鲸鱼优化算法对所述初始鲸鱼种群的个体和所述初始LSTM模型进行更新,确定所述初始鲸鱼种群的个体适应度值;判断所述个体适应度值是否达到预设阈值;若否,则对所述初始鲸鱼种群和进行动态螺旋更新迭代和动态速度更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。

需要说明的是,个体适应度值是种群中每个个体在解空间中的适应性评价指标。可通过某种评价函数或目标函数来度量个体在解空间中的优劣程度来获得个体适应度值。

可理解的是,预设阈值是构建设备中预先设置的用于判断个体适应度值是否达标的阈值。

应理解的是,动态螺旋更新迭代是提高鲸鱼算法在螺旋搜索阶段精度的动态更新方式。为了提高鲸鱼算法的全局搜索能力和收敛精度,在螺旋搜索阶段中,将常数b值替换为一个动态值,并随着迭代次数的增加而进行调整。通过引入动态b值,个体鲸鱼在螺旋搜索后期能够根据当前迭代次数的变化自适应地调整螺旋形状。这种动态调整使得算法能够更好地探索潜在的全局最优解,从而增强算法的全局搜索能力。动态b的更新公式为:

b=1/(1+e

式中,max_iter表示最大迭代次数,t表示当前迭代次数。

可理解的是,动态速度更新是提高鲸鱼算法在搜索过程的速度的动态更新方式。为了提高基本鲸鱼算法的搜索性能和收敛能力,引入一个动态调整机制来改进参数a的计算方式。通过这种机制,鲸鱼在搜索过程中会随着迭代次数的增加逐渐降低参数a的值,实现从全局搜索阶段平稳过渡到局部搜索阶段。具体而言,本实施例使用递减函数来动态更新参数a的值,初始阶段通过设置较大的a值来加速整个搜索过程。然而,随着迭代次数的增加,参数a逐渐减小,使得鲸鱼的搜索范围逐渐缩小,可更加精确地找到局部最优解,进而提高收敛精度。通过这种改进,结合全局和局部搜索策略,使算法能够兼顾整个搜索空间,提高寻最优解的准确性和效率。动态a的取值如下:

a=2/(1+t×max_iter) (17)

式中,max_iter表示最大迭代次数,t表示当前迭代次数。

具体的,在迭代过程中,构建设备可通过自适应粒子群鲸鱼优化算法对所述初始鲸鱼种群的个体和所述初始LSTM模型进行更新,确定所述初始鲸鱼种群的个体适应度值;然后判断所述个体适应度值是否达到预设阈值;若否,则对所述初始鲸鱼种群和进行动态螺旋更新迭代和动态速度更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。从而通过动态螺旋更新和动态速度更新,结合全局和局部搜索策略,使算法能够兼顾整个搜索空间,提高寻最优解的准确性和效率。

进一步地,本实施例中所述通过自适应粒子群鲸鱼优化算法对所述初始鲸鱼种群的个体和所述初始LSTM模型进行更新,确定所述初始鲸鱼种群的个体适应度值,包括:对所述初始鲸鱼种群进行更新,确定所述初始鲸鱼种群的最优个体;获得所述最优个体的自适应度函数值和当前最佳位置;基于所述最优个体的自适应度函数值和当前最佳位置,通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行更新,以确定所述初始鲸鱼种群的个体适应度值。

需要说明的是,最优个体是在鲸鱼优化算法中,从初始鲸鱼种群中选出的具有最高适应度值的个体,适应度值高代表个体的解质量更好,更接近所要求的优化目标。

在实际实现中,构建设备可对所述初始鲸鱼种群进行更新,确定所述初始鲸鱼种群的最优个体;获得所述最优个体的自适应度函数值和当前最佳位置;然后通过APSOWOA算法鲸鱼位置更新机制更新参数;并比较更新后的适应度值确定鲸鱼最优位置;以确定所述初始鲸鱼种群的个体适应度值。

进一步地,本实施例中在步骤S10包括:对气象数据进行归一化处理,获得所述气象数据对应的归一化数据;通过随机森林算法对所述归一化数据进行特征选择,获得所述归一化数据对应的特征因子;将所述特征因子作为所述气象数据的特征子集。

在实际实现中,特征选择能够从庞大的气象数据中选择出对目标变量有最大影响力的特征子集。为了提高预测模型学习效率,避免模型出现维数灾难,本实施例进一步引入随机森林算法对气象数据进行特征选择。随机森林通过构建多个决策树模型,在每个决策树的叶节点上,统计属于该叶节点的训练样本的目标变量值(即温度),使用叶节点上目标变量值的平均值作为预测结果来评估特征的重要性。计算公式如下:

式中,N表示叶节点上的样本数量,y

结合随机森林的特征相关值的实验结果可参考图6,图6为本发明气象温度预测模型构建方法第二实施例的特征相关性图。如图6所示,根据所得特征相关性值大小发现,特征集中前六个最相关特征(露点温度、气压、蒸发量、土壤含水量、太阳辐射和南北向风速)与目标变量之间存在显著关联,相关性值分别为0.511044、0.308818、0.084396、0.038716、0.037271、0.004804。因此,通过随机森林选择这六个特征因子作为特征子集,输入预测模型进行气象温度预测。

进一步地,为了本实施例中所述将所述特征因子作为所述气象数据的特征子集之后,还包括:创建日循环特征和年循环特征,获得日期循环机制;将所述日期循环机制与所述特征子集融合,获得日期循环特征子集;所述步骤S20包括:将注意力机制融入所述日期循环特征子集,并输入至LSTM模型,获得初始LSTM模型。

需要说明的是。由于温度预测具有很强的时间特性,如昼夜温差和季节性气候等因素的影响。因此,考虑到时间的周期性和对称性,在6个特征因素基础上,可添加日期循环机制以提升预测精度。其中,日循环特征可参考图7,图7为本发明气象温度预测模型构建方法第二实施例的日循环图。年循环特征可参考图8,图8为本发明气象温度预测模型构建方法第二实施例的年循环图。

其中,创建日循环特征的公式如下所示:

创建年循环公式:

式中,x表示时间戳。

进一步地,在LSTM神经网络中,输入数据的特征对于信息处理的重要性是不同的。注意力机制可以根据不同特征的影响程度对关键性数据赋予其更高的权重,以提高神经网络处理信息的效率和准确性。在LSTM中,注意力机制使其可以有选择地关注和利用最相关和有用的特征。注意力机制使得神经网络能够更好地利用输入数据中的信息,提高模型的表现和解决复杂任务的能力。同时也能解决随着时间增长和遗忘门作用下,导致LSTM模型输出本身包含的时间信息逐渐衰减的问题。

本实施例将软注意力机制Soft Attention引入预测模型。将Softmax函数定义为:

式中,x

进一步地,本实施例中在步骤S40包括:将采集的历史气象数据按预设比例进行划分,获得所述历史气象数据对应的训练样本集和测试样本集;根据所述模型最优参数和所述训练样本集对所述初始LSTM模型进行训练,获得训练模型;将所述测试样本集输入至所述训练模型,并对输出结果进行评估;若所述输出结果符合预设评估指标,则将符合所述预设评估指标所对应的训练模型作为气象温度预测模型。

需要说明的是,训练样本集是用来训练模型的数据集,可从历史气象数据中提取出来一部分,包含了已经标记好的输入特征和对应的输出标签,以便能够在未见过的输入数据上进行预测或分类。

测试样本集是用来评估模型性能的数据集,可从历史气象数据中提取出来一部分,但与训练样本集是独立的。测试样本集通常包含了输入特征,但没有提供对应的输出标签。通过在测试样本集上运行已训练好的模型,并将预测结果与实际标签进行比较,可以评估模型的准确性、精度和泛化能力。

可理解的是,预设评估指标是在训练模型之前提前选择的一组指标,用于评估模型的性能和效果。

在实际实现中,基于上述各实施例,参考图9,图9为本发明气象温度预测模型构建方法第二实施例中模型构建的流程示意图。考虑到LSTM模型的参数选择直接影响其训练和泛化性能,每个LSTM层的神经元数、学习率、批次大小、弃用率是需要调整的参数。可采用改进鲸鱼优化算法APSOWOA优化LSTM参数,并建立APSOWOA-LSTM融合注意力机制的气象温度实时预测模型。具体过程如图9所示:

步骤1:首先对气象数据进行归一化预处理,再利用随机森林进行选择特征因子,并将特征融入日期循环功能。

步骤2:将注意力机制融入所选特征因子并输入LSTM模型。

步骤3:设置鲸鱼种群数量、最大迭代次数和LSTM的优化参数及寻优范围。

步骤4:利用粒子群算法生成初始鲸鱼种群,计算个体适应度值(均方误差),确定最优位置。

步骤5:通过自适应粒子群鲸鱼优化算法的鲸鱼位置更新机制更新参数。更新最优个体,并记录其适应度函数值和当前最佳位置。然后更新参数3层LSTM模型中神经元数、弃用率、学习率和批次大小。

步骤6:然后重新计算适应度值,并比较更新后的适应度值确定鲸鱼最优位置。由于在WOA算法寻优过程中,生成一个介于0和1之间的随机数p。当p大于0.5时,进入泡泡网攻击模式,按照式(9)、(10)更新位置,产生螺旋气泡,捕食猎物。否则,检查系数向量A的绝对值。如果|A|大于等于1,按照式(11)、(12)对目标猎物进行随机搜索。如果|A|小于1,则按照式(7)、(8)更新位置,对目标猎物进行包围。

步骤7:检查是否达到最大迭代次数,若满足则进行下一步操作,否则进入步骤5。

步骤8:在满足最大迭代次数时,输出最优鲸鱼个体位置和目标函数,获得LSTM模型的最优参数。

步骤9:将最优参数输入到模型中重新对训练样本集进行训练。

步骤10:利用训练好的模型对测试集进行预测。

步骤11:输出最优气象温度预测值,并对模型进行评估。评估合格则结束模型构建过程。

进一步的,为便于理解,以构建过程为例进行说明。例如,本实施例采用的实验环境配置可为Windows 10专业版操作系统,使用Python 3.8.0作为开发语言,并基于TensorFlow 2.2.0框架进行开发。在硬件配置方面,计算设备可配备搭载Intel(R)Core(TM)i5-8300H CPU,主频为2.30GHz的处理器,搭配GeForce GTX 1050显卡以及8.00GB的内存。本实施例将标准LSTM(1)、LSTM(2)、LSTM(3)、Date-LSTM(3)、Date-attention-LSTM(3)、CNN、GRU模型作为APSOWOA-LSTM的对比模型,各参数设定为:各模型的LSTM层神经元数都设为32,批次大小为128,初始学习率为0.01,初始弃用率为0.5,最大训练周期数设为100。同时设置APSOWOA的种群规模为10。为了使模型的训练效果更好,使用APSOWOA来选择合适的各层节点数、学习率、弃用率、批次大小等,利用优化后的APSOWOA-LSTM去预测实时温度。

例如,可从欧洲中期天气预报中心ECMWF获取2021年1月1日至2022年12月31日中国武汉气象站17448条逐时气象资料。气象要素包括露点温度、气压、气温、风速、降水量、太阳光辐射等优选特征因子。表1给出了部分样本数据。参考图10,图10为本发明气象温度预测模型构建方法第二实施例中温度数据样本示意图,图10给出了温度样本的全部数据。实验设置时间窗口以前48小时数据预测未来1小时温度,将2021年1月1日至2022年12月31日之间17448条数据按照比例9∶1划分成训练样本集和测试样本集。

表1

对实验数据缺失值和异常值进行处理。对缺失值采用前向填充法处理,对异常值采用标准差法进行判断,再采用替换法进行处理。为了加快模型训练速度,采用最大最小归一化方法对数据集预处理,生成样本的相同量纲。根据每个气象因素的安全标准划分出相应的安全区间,采用如下公式将数据归一化到[0,1]区间内:

式中,x为原始数据,x

参考图11,图11为本发明气象温度预测模型构建方法第二实施例中24小时温度误差图。通过图11可以有助于观察评估的准确性和稳定性。可见,温度与其他特征之间存在着明显关联性,这种关联性主要受到昼夜温差和季节变化等自然因素影响,这意味着温度是一个受环境和季节变化影响较大的特征,在不同的时间尺度上都会呈现出明显的波动和趋势。因此,在分析和预测温度变化时,需要考虑这些外部因素的影响,以更准确地理解和解释数据的变化。

然后可进一步观察特征因子与气象温度间的关系,参考图12,图12为本发明气象温度预测模型构建方法第二实施例中六大特征与温度关系的热力图。图中显示颜色强度越深的区域,表示对温度影响较大的特征。可以看出,零点温度、气压和蒸发量这三个特征对温度的影响较为显著。这也与前文所计算的特征相关值的大小顺序是一致的。这三个因子与温度之间显示出较强的相关性和影响程度,它们在更大程度上决定了温度变化。

接着对模型进行指标评估,选用平均绝对误差MAE、平均绝对误差百分比MAPE、均方根误差RMSE、可解释方差ExplVar、中值绝对误差MedAE和拟合优度R

/>

MedAE=median(|y

式中,y

气象温度预测模型利用最优参数构建。该模型采用测试样本预测值的均方误差作为适应度函数,其适应度的迭代曲线参考图13,图13为本发明气象温度预测模型构建方法第二实施例中APSOWOA优化LSTM适应度曲线变化示意图。经过自适应粒子群鲸鱼优化算法迭代搜索得到气象温度预测模型的最优参数。迭代完成后,算法求解的最优参数取值如下:隐藏层单元数分别为5、5、5,学习率为0.000318128435,弃用率为0.00180044462,批次大小为5。通过实验可知,本实施例的气象温度预测模型在预测未来1h的气象温度变化上具有更高的准确率,模型避免了人工调参,提高了模型参数调优效率,能够为气象温度实时预测提供有效的理论支撑。

本实施例提出了一种改进鲸鱼算法APSOWOA优化长短期记忆神经网络LSTM并融合注意力机制的气象温度实时预测模型。首先引入粒子群算法、动态螺旋更新和动态速度更新对鲸鱼优化算法的初始种群质量、搜索能力和全局搜索与局部开发能力均衡进行改进,提高鲸鱼算法的搜索精度。然后利用改进鲸鱼算法对LSTM关键参数动态寻优,解决模型主观定参易陷入局部最优的不足,从而提升模型学习能力。同时融入注意力机制预防特征权重衰减,以日期循环功能提升温度预测精度。并利用随机森林进行特征选择,以降低数据冗余和维数灾难,提高模型预测效率。本实施例的气象温度预测模型在预测未来1h的气象温度变化上具有更高的准确率,模型避免了人工调参,提高了模型参数调优效率,能够为气象温度实时预测提供有效的理论支撑。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有气象温度预测模型构建程序,所述气象温度预测模型构建程序被处理器执行时实现如上文所述的气象温度预测模型构建方法的步骤。

参照图14,图14为本发明气象温度预测模型构建装置第一实施例的结构框图。

如图14所示,本发明实施例提出的气象温度预测模型构建装置包括:

特征选择模块101,用于通过随机森林算法对气象数据进行特征选择,获得特征子集;

注意力机制模块102,用于将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型;

动态寻优模块103,用于通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,获得模型最优参数,所述自适应粒子群鲸鱼优化算法基于粒子群算法和自适应思想改进获得;

模型训练模块104,用于根据所述模型最优参数和历史气象数据对所述初始LSTM模型进行训练,获得气象温度预测模型。

本实施例构建设备在获取大规模的气象数据时,可通过随机森林算法对气象数据进行特征选择,从中选择出的对气象温度有最大影响力的特征子集,以降低数据冗余和维数灾难,提高模型预测效率。然后可将注意力机制融入所述特征子集,并输入至LSTM模型,获得初始LSTM模型,以预防特征权重衰减。接着可通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行动态寻优,经过多次迭代的寻优,获得模型最优参数。最后利用模型最优参数重新对历史气象数据得训练样本集进行训练。并利用训练后的模型对测试集进行预测;输出最优气象温度预测值,并对模型进行评估,在评估合格后,获得气象温度预测模型。由于本发明首先引入粒子群算法、动态螺旋更新和动态速度更新对鲸鱼优化算法的初始种群质量、搜索能力和全局搜索与局部开发能力均衡进行改进,提高鲸鱼算法的搜索精度。然后利用改进的鲸鱼算法对LSTM模型的关键参数动态寻优,解决模型主观定参易陷入局部最优的不足,从而提升模型学习能力。同时融入注意力机制预防特征权重衰减,以提升温度预测精度。并利用随机森林进行特征选择,以降低数据冗余和维数灾难,提高模型预测效率。从而使模型在气象温度预测方面具有更高准确率和适用性。

基于本发明上述气象温度预测模型构建装置第一实施例,提出本发明气象温度预测模型构建装置的第二实施例。

在本实施例中,所述动态寻优模块103,还用于通过鲸鱼优化算法设置鲸鱼种群数量和最大迭代次数;利用粒子群算法和所述鲸鱼种群数量对所述鲸鱼优化算法对应的鲸鱼种群进行初始化,生成初始鲸鱼种群;基于自适应粒子群鲸鱼优化算法,对所述初始鲸鱼种群和所述初始LSTM模型进行动态更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。

进一步地,所述动态寻优模块103,还用于通过自适应粒子群鲸鱼优化算法对所述初始鲸鱼种群的个体和所述初始LSTM模型进行更新,确定所述初始鲸鱼种群的个体适应度值;判断所述个体适应度值是否达到预设阈值;若否,则对所述初始鲸鱼种群和进行动态螺旋更新迭代和动态速度更新迭代,直至迭代次数达到所述最大迭代次数,获得模型最优参数。

进一步地,所述动态寻优模块103,还用于对所述初始鲸鱼种群进行更新,确定所述初始鲸鱼种群的最优个体;获得所述最优个体的自适应度函数值和当前最佳位置;基于所述最优个体的自适应度函数值和当前最佳位置,通过自适应粒子群鲸鱼优化算法对所述初始LSTM模型进行更新,以确定所述初始鲸鱼种群的个体适应度值。

进一步地,所述特征选择模块101,还用于对气象数据进行归一化处理,获得所述气象数据对应的归一化数据;通过随机森林算法对所述归一化数据进行特征选择,获得所述归一化数据对应的特征因子;将所述特征因子作为所述气象数据的特征子集。

进一步地,所述特征选择模块101,还用于创建日循环特征和年循环特征,获得日期循环机制;将所述日期循环机制与所述特征子集融合,获得日期循环特征子集;所述注意力机制模块102,还用于将注意力机制融入所述日期循环特征子集,并输入至LSTM模型,获得初始LSTM模型。

进一步地,所述模型训练模块104,还用于将采集的历史气象数据按预设比例进行划分,获得所述历史气象数据对应的训练样本集和测试样本集;根据所述模型最优参数和所述训练样本集对所述初始LSTM模型进行训练,获得训练模型;将所述测试样本集输入至所述训练模型,并对输出结果进行评估;若所述输出结果符合预设评估指标,则将符合所述预设评估指标所对应的训练模型作为气象温度预测模型。

本发明气象温度预测模型构建装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • MR图像预测模型的训练方法、装置、设备及存储介质
  • CT图像预测模型的训练方法、装置、设备及存储介质
  • 一种存储系统的构建方法、装置、设备及存储介质
  • 温度控制方法、装置、设备、存储介质及处理器
  • 温度信息上传方法、装置、系统、电子设备及存储介质
  • 设备寿命预测模型构建方法、装置、可读存储介质及设备
  • 预测模型构建方法、数据预测方法、装置、电子设备和可读存储介质
技术分类

06120116626100