掌桥专利:专业的专利平台
掌桥专利
首页

一种基于随机森林和GRU的台风路径预报方法

文献发布时间:2023-06-19 19:05:50


一种基于随机森林和GRU的台风路径预报方法

技术领域

本发明涉及机器学习和台风路径预测,具体涉及一种基于随机森林和GRU的台风路径预报方法。

背景技术

西北太平洋是全球热带气旋最活跃的海域,该海域每年生成的热带气旋频数约占全球总频数的1/3以上。而我国处在太平洋的西侧,有18000km以上的海岸线,是世界上受热带气旋影响最严重的国家之一。台风是一种暖核的大型气旋,往往伴随着强风,强降水和风暴潮,并引发严重灾害,对人们的生命、财产安全和沿海地区的经济发展构成严重威胁。由于台风灾害的不可抗性和潜在的破坏性,提前准确地预测台风的移动可以为受灾地区提供充足的时间做好防灾工作。

目前,台风路径的预报方法主要分为两类。主流方法是数值模式预报,该模式通过微分方程模拟台风路径类型的变化过程,并用超级计算机进行计算和求解。主要的数值模型包括GRAPES-TYM(CMA),GEFS(NCEP)和IFS(ECWMF)。同时,集合预报模式(GRAPES-GEFS,ECMWF-EPS,NCEP-GEFS)的提出可以减少各种不确定性对数值预测结果的影响。另一种方法是统计方法,主要基于回归技术,利用台风路径与其相关因子之间的回归方程来解决预报问题。气候与持续预报方法即CLIPER(Climatology and Persistence)方法是国内外应用最广泛应用的方法之一,取台风运动的气候规律与初始时刻持续性特征作为因子,用来预报大西洋飓风路径。虽然目前数值预报可以提供精准的结果,但它需要大量的时间和资源来处理复杂的动力学方程。而传统的台风统计方法大多采用线性回归方法建模,对于台风路径预报这种强非线性问题难以预测出准确的结果。

深度学习是基于神经网络算法从样本数据中获取非线性和复杂关系的统计模型,神经网络预测方法通过模仿动物神经网络的结构特点,以大量历史数据为实验依据,在反复训练下自动调整网络节点之间的权重因子,具有适应能力强、容错能力强的优势。台风路径预报是非线性问题,台风具有复杂的动力机制,易受环境转向流、Beta效应、下垫面条件、内核非对称结构、中尺度环流等多种因素的影响。人工神经网络由于其较强的学习能力和模拟非线性系统方面的优势,已被应用于预测热带气旋路径。直到2010年代,人工神经网络(ANN)和前馈神经网络(BP)网络一直是预测热带气旋强度和路径的主流神经网络方法,自2010年代中期以来,由于深度学习的发展,更多新方法被引入到热带气旋预报中。

发明内容

本发明的目的在于提供一种基于随机森林和GRU的台风路径预报方法,能够快速的预测台风路径,并提高了预测的准确度。

实现本发明目的的技术解决方案为:一种基于随机森林和GRU的台风路径预报方法,包括:

采用随机森林方法对训练数据进行拟合,筛选重要特征,重构训练数据集;

通过训练数据集对GRU神经网络进行训练,获取满足精度要求的GRU神经网络;

通过GRU神经网络预测台风路径。

进一步地,所述随机森林方法包含N个决策树,决策树生成过程采用boostrap。

进一步地,所述随机森林方法筛选重要特征包括:

选择袋外数据,计算袋外数据误差error:

其中,f

随机对袋外数据所有样本的特征加入噪声干扰,再次计算袋外数据误差error

其中,

基于袋外数据误差和加入噪声干扰的袋外数据误差计算所有特征的重要性I;

其中,N为决策树的数目,error

重复上述三个步骤,计算所有特征重要性,按照特征重要性的排序,依次删除重要性小于阈值的特征。

进一步地,重构训练数据集时对数据进行归一化处理:

其中,x为原始数据,x’为归一化后数值,x

进一步地,所述GRU神经网络使用过去24h的路径数据,预测台风路径为未来6-72h的台风移动路径

进一步地,所述GRU神经网络包括输入层、隐藏层和输出层,输入层是一个二维的向量,分别是特征维与时间维,隐藏层由多个门控循环细胞组成,输出层有24个神经元,即输出序列中每个元素的维数为24,网络初始参数为0到1之间的随机数,将预报和真实位置之间的均方根误差作为损失函数。

进一步地,所述隐藏层通过重置门r

r

其中x

进一步地,所述更新门z

进一步地,所述当前隐藏层h

与现有技术相比,本发明的有益效果在于:本发明利用随机森林方法筛选重要特征,并通过GRU层从时间序列数据集中提取台风历史数据的深层非线性和复杂时间特征,当一个新的热带气旋从海上生成时,可以在几秒内快速地给出未来台风移动路径的预测结果,提高了预测速度;同时,可以更好地预报出台风的中长期路径,提高了预测的准确度。

附图说明

图1为本发明中GRU的结构图。

图2为本发明的台风路径预测方法流程图。

图3为基于随机森林方法判断各个特征的重要性程度示意图。

图4为不同特征组合对应的袋外数据(OOB)的评分示意图。

图5为GRU神经网络预测的所有测试样本的经纬度与实际情况的对比图,图5中的(a)、(c)、(e)、(g)、(i)分别为6h、12h、24h、48h、72h的经度预测结果图,图5中的(b)、(d)、(f)、(h)、(j)分别为6h、12h、24h、48h、72h的纬度预测结果图。

具体实施方式

鉴于台风运动的不确定性、大气系统固有的复杂性和非线性以及海洋观测数据的稀缺性,准确预测台风的中心位置一直是气象预报中的难点。台风的演化取决于不同尺度和不同高度的因素,深度学习技术为提高热带气旋预测的准确性和效率提供了新的途径。循环神经网络通过使用自反馈的神经元,能够处理任意长度的时序数据。循环神经网络包括普通循环神经网络(RNN)、长短期记忆循环神经网络(LSTM)、门控循环单元神经网络(GRU)。一方面,LSTM和GRU在解决序列相关问题上比普通RNN更有效,且GRU是在LSTM的基础上改进和优化的模型,因此我们选择GRU神经网络用于模型训练,并与其他两种循环神经网络方法的结果进行对比。另一方面,随机森林方法具有特征分析的能力,即训练好的模型可以衡量每个输入特征的重要性。因此本申请发明提供了一种基于随机森林方法(RF)和门控循环单元(GRU)神经网络的台风路径预测方法。使用随机森林模型分析输入特征的重要性,并选择一些重要的输入特征结合GRU神经网络进行预测。

如图2,本发明预测方法由两部分组成:随机森林方法构建训练数据集和GRU循环神经网络预测。首先使用随机森林模型对训练数据进行拟合,其次根据训练数据得到每个输入特征的重要性得分,从而筛选出较重要的输入特征,重构训练数据集。其次,将新的训练数据按时间顺序导入GRU神经网络进行训练,并用验证数据监控训练过程,防止训练过拟合。最后,将测试数据导入训练好的GRU神经网络进行预测。接下来,我们分别介绍随机森林方法构建训练数据集方法和GRU神经网络模型。

基于特征选择重要性是机器学习模型中的一个基本步骤,它是将变量使用定向到机器学习模型最有效的方法。随机森林是一种有监督学习方法,根于输入数据,选择最佳特征组合,减少特征冗余。随机森林中包含N个决策树,这里N一般取100,由于随机决策树生成过程采用的是boostrap(有放回的随机抽样),所以在一棵树的生成过程并不会使用所有的样本,未使用的样本就叫(out_of_bag)袋外样本,通过袋外样本,可以评估这个树的准确度,其他子树叶按这个原理评估,而后取平均值,袋外误差是评判特征重要性的指标。

基于随机森林方法的特征选择主要分为以下四步:

(1)选择袋外数据,计算袋外数据误差error。

其中,f

(2)随机对袋外数据所有样本的特征加入噪声干扰,再次计算袋外数据误差error

其中,

(3)计算所有特征的重要性I。

其中,N:决策树的数目,error

(4)按照特征重要性的排序,依次删除重要性小的特征,重复上述三个步骤,计算袋外数据误差,选择误差最小的组合,OOB

其中,f

将随机森林方法筛选后的特征放入到GRU模型中,我们的目标使用过去24h的路径数据预测台风未来6-72h的移动路径。为了客观定量地预报台风未来路径,将台风中心以当前时刻为标准,在未来72小时内的经、纬度变化作为预报量。由于预测的最大时效是72h,输入的序列时间长度是24h,首先要筛选出生命史大于96h的台风。基于输入序列长度-预测长度的滑动窗口,并按时间划分为三组:训练集、验证集和测试集。我们使用1979年至2018年的历史数据来训练,训练样本是36473个,其中90%进行训练(1979-2014),剩余的10%进行验证(2015-2018),而2019年至2021年的49个热带气旋,用于测试,测试样本是2095个。

输入数据量纲的不同将导致数值大的变量对模型的影响大,而数值小的变量影响小,因此在模型训练前,有必要对数据进行归一化处理,使输入数据映射为0~1之间的数,消除量纲不同对模型的影响,原始值x进行归一化处理后的值x

其中,x

门控循环单元(GRU)循环神经网络是长短期记忆(LSTM)循环神经网络的变体,具有较少的收敛参数。结合图1,GRU中的每个隐藏层都可以通过重置门r

r

其中x

更新门z

z

当前隐藏层h

GRU神经网络分为三层,即输入层、隐藏层和输出层。输入层是一个二维的向量,分别是特征维与时间维。隐藏层由多个门控循环细胞组成。输出层有24个神经元,即输出序列中每个元素的维数为24。在训练网络时,所有网络参数都初始化为0到1之间的随机数,而后逐个读取序列中的每个元素来训练样本。在隐藏层和输出层之后导出输出向量,模型基于Adam优化器,并将预报和真实位置之间的均方根误差作为损失函数来训练网络,误差通过BPTT算法向后传播。测试过程与训练过程遵循相同的方式。

最后我们用RMSE(Root Mean Square Error)评估预测结果,公式如下:

其中,P

在评估过程中,因为每个纬度、经度代表以公里为单位的不同空间距离,所以在比较不同模型时,以公里为单位计算距离误差(Dis),公式如下:

Dis=R×arccos(cos(Lat

+sin(Lat

其中,R为地球半径,Lat

实施例

本实施例的一种基于随机森林方法和GRU的西北太平洋台风路径预报方法,采用Keras深度学习包和Scikit-learn机器学习包分别用于实现GRU神经网络和随机森林方法;

本专利使用的数据台风路径数据来自于IBTrACS,该数据集涵盖了全球发生的所有热带气旋。每个气旋都记录了间隔3小时的纬度和经度,中心气压、最大风速、方向、移速等。数据集包含来自不同海域,台风在不同的海域表现出不同的特征,本专利只选择发生在西北太平洋的气旋。为了更好地挖掘出数据中隐含信息,还计算了有关台风移动的其他特征,包括过去24h的经度、纬度、气压、风速、经向移速、纬向移速、方向、总移速,过去24h与当前时刻经度差、纬度差、气压差、最大风速差、移速差、方向差,过去24h与当前时刻形成的角度、纬向距离、经向距离,以及与上一个时刻的方向差,此外,用过去24h所在纬度对应的科氏参数,作为地转偏向力对台风的影响。共计19个特征。

在模型训练之前,需要判断19个特征对预报结果是否都有影响。图3展示的是使用随机森林方法计算的19个特征的重要性排序,对于预报未来72h以内的经度差和纬度差来说,过去时刻与当前时刻形成的角度,过去时刻的经度等是非常重要的特征。但是一些不重要的特征是否需要排除还需要进一步考量,图4展示了不同特征组合下的OOB评分,图中大的圆点表示最大值,依次放入特征变量并计算结果,按重要性排序前11个特征的情况下得分最高,且之后放入的特征将不再影响到结果,也就是前11个特征的组合结果是最佳组合。

将最佳路径集划分为训练集,验证集和测试集后,由随机森林按重要性筛选的11个特征维,8个时间维,36473个训练样本作为GRU循环神经网络的输入,并对19-21年的49个台风进行测试。我们将批次大小(Batch Size)的值设置为64,迭代次数(Epoch)设置为100。我们对隐藏层中不同数量的神经元进行实验,我们发现当隐藏层的神经元个数设置为128时,模型效果最好。早停法(Early Stopping)用来防止过拟合,即当模型在验证集上的表现开始下降时,停止训练,避免继续训练造成过拟合的问题。从图5所示的GRU循环神经网络预报6h,12h,18h,24h,48h,72h的经纬度结果来看,在24h内的预测结果和实际情况基本吻合,随着预报时效增加,误差也逐渐增大。

GRU与另外两种循环神经网络(LSTM、RNN)模型的性能评估见表1,通过计算预测经纬度与实际经纬度的均方根误差RMSE,包括训练结果,验证结果,测试结果,以粗字体强调了结果中的最佳性能,在预报结果中GRU实现几乎所有结果的最佳性能,在测试集中均方根误差最小,经纬度最接近实际值。可以看出基于GRU和LSTM的模式明显优于基于RNN的模式,这证明RNN在处理热带气旋路径的长期依赖方面较差。GRU是LSTM的变体,将LSTM中的遗忘门和输入门合成了一个更新门,同时还混合了细胞状态和隐藏状态,因此在参数的数量上也是要少于LSTM的,最终的模型比标准的LSTM模型要简单,因此整体上GRU的训练速度要快于LSTM的。

表1GRU与RNN、LSTM的模型性能评估(RMSE)对比

GRU与另外两种循环神经网络(RNN、LSTM)以及两种传统台风预报方法(CLIPER、BP)的对比结果见表2,其中显示了预报结果的平均绝对误差距离,GRU模型预测结果在长期预报中体现了绝对优势,首先与两种传统方法对比,即CLIPER和BP神经网络方法,可以明显看出循环神经网络的优势,且GRU是通过各种门函数来将重要特征保留下来,这样就保证了在长时间传播的时候也不会丢失,所以相比较于普通的循环神经网络(RNN),可以更好地预报出台风的中长期路径,且GRU是在LSTM的基础上进行改进和优化,GRU理论上与LSTM相似,可以达到和LSTM相同的效果甚至更好。在6h,24h,48h,72h的平均距离误差分别是19.51km,134.73km,357.25km,607.44km。

表2GRU模型与RNN、LSTM模型和CLIPER、BP模型预测结果的绝对距离误差(km)对比

本发明提出的一种新的基于随机森林方法和GRU的台风路径预测神经网络模型,利用随机森林方法筛选重要特征,并通过GRU层从时间序列数据集中提取台风历史数据的深层非线性和复杂时间特征,当一个新的热带气旋从海上生成时,该模型可以在几秒内快速地给出未来台风移动路径的预测结果。

相关技术
  • 一种基于预估偏差的台风路径集合预报方法
  • 一种基于深层神经网络的台风路径预报方法
技术分类

06120115797815