掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的海浪高度预测方法及其应用

文献发布时间:2023-06-19 11:39:06


一种基于深度学习的海浪高度预测方法及其应用

技术领域

本发明属于时间序列预测技术领域,涉及一种基于深度学习的海浪高度预测方法及其应用,特别涉及一种基于深度学习和CatBoost的多变量海浪高度预测方法及其应用。

背景技术

近年来,人类的探索重心逐渐从陆地转向海洋,海水养殖、海洋运输和滨海旅游等海洋资源的开发利用对经济产值有很大促进作用。世界各国,主要沿海国家都充分认识到发展海洋经济的战略意义。海浪高度是海洋学研究中的重要参数之一,其变化会对海上作业、港口码头建设和沿海居民生活都产生很大的影响,甚至会导致沿海活动暂停和海上相关工作减少的极端情况。因此,海浪高度的准确预测在人类的海洋活动中起着至关重要的作用,进行浪高的预测研究具有十分重要的现实意义。

国内外很多的研究人员都对海浪高度的预测方法进行了深入的探究。目前已经提出了传统数值模型、单一预测模型和组合预测模型的方法用于海浪的高度预测。

早期,传统数值模型是研究海浪高度预测中最主要的方法,如WAM、JSONSWAP、SWAN、WIS、WAVEWATCH III已被用来预测海浪高度。文献一(苗琪,徐福敏,俞茂玲.WAVEWATCHⅢ不同海冰源项的海浪模拟效果对比[J].海洋学报,2020,42(09):22-29.)验证了第三代数值模型在不同海冰源项的海浪模拟效果对比。文献二(冯司宇,马小舟,董国海.波高非线性概率分布高阶谱数值模型研究[J].海洋学报,2019,41(03):44-51.)通过使用高阶谱模型对不同初始条件下海浪高度数值模拟。然而当计算大型模型时,由于大量数据和计算的复杂性,需要高性能计算机和显著的时间成本,在需要快速结果的紧急情况下,数值计算不可靠。

随着信息技术的不断发展和大数据时代的到来,很多研究人员开始采用机器学习方法对海浪高度的预测。其中的单一预测模型是指采用一种模型或者算法进行研究,如文献三(Spanos P T D.ARMA algorithms for ocean wave modeling[J].1983.)使用ARMA模型模拟了短期平稳周期中的单个浪高时间序列。人工神经网络模型(ANN)也被用于海浪高度预测,文献四(Deo M C,Naidu C S.Real time wave forecasting using neuralnetworks[J].Ocean engineering,1998,26(3):191-203.)提出了一种前馈网络来实时预测海浪高度,与自回归模型相比,它们的方法表现出了更普遍、更灵活和适应性更强的能力。文献五(Mandal S,Prabaharan N.Ocean wave forecasting using recurrent neuralnetworks[J].Ocean engineering,2006,33(10):1401-1410.)使用循环神经网络(RNN)进行波高预测,发现RNN的相关系数高于前馈网络的相关系数。文献六(Fan S,Xiao N,DongS.A novel model to predict significant wave height based on long short-termmemory network[J].Ocean Engineering,2020,205:107298.)提出了一种长短期记忆(LSTM)网络,用于快速预测有效波高,比传统神经网络具有更高的精度。文献七(MahjoobiJ,Mosabbeb E A.Prediction of significant wave height using regressive supportvector machines[J].Ocean Engineering,2009,36(5):339-347.)使用支持向量机(SVM)来预测波高,结果表明,与人工神经网络模型相比,SVM模型具有可接受的精度,并且需要较少的计算时间。

随着研究的深入,运用的技术越来越多。文献八(Abed-Elmdoust A,KerachianR.Wave height prediction using the rough set theory[J].Ocean Engineering,2012,54:244-250.)将粗糙集理论RST应用于北美苏必利尔湖,寻找一些简单的规则,称为决策规则,并将其用于海浪高度预测。文献九(Savitha R,Al Mamun A.Regional oceanwave height prediction using sequential learning neural networks[J].OceanEngineering,2017,129:605-612.)利用不同的神经网络,并考虑到地理位置的差异,进行了一系列比较实验。结果表明,最小资源分配网络具有较好的结构和较强的适应性。文献十(Akbarifard S,Radmanesh F.Predicting sea wave height using SymbioticOrganisms Search(SOS)algorithm[J].Ocean Engineering,2018,167:348-356.)提出了共生生物搜索(SOS)算法,根据大量精确的气象数据,包括浮标测得的海浪高度,预测两个时间范围内的海浪高度。SOS算法的性能优于支持向量回归、人工神经网络和模拟波浪近岸动态模型。

单一预测模型有其特定的适用目标和工作环境,混合预测模型应运而生。文献十一(毛科峰,萧中乐,王亮,季卫海.数值模式与统计模型相耦合的近岸海浪预报方法[J].海洋学报(中文版),2014,36(09):18-29.)对数值模式和统计模型预报近岸海浪存在的局限性,构建了数值模式和统计模型相耦合的近岸海浪预报框架。文献十二(杨俊钢,张杰,王桂忠.北极海域海面风场和海浪遥感观测能力分析[J].海洋学报,2018,40(11):105-115.)以在轨多源卫星遥感数据为主,开展北极海域海面风场和海浪分布特征与变化规律研究。文献十三(Alexandre E,Cuadra L,Nieto-Borge J C,et al.A hybrid geneticalgorithm—extreme learning machine approach for accurate significant waveheight reconstruction[J].Ocean Modelling,2015,92:115-123.)应用遗传算法和极限学习机方法重建波高,这种方法被证实在从浮标恢复丢失的波浪数据方面是有效的。文献十四(Duan WY,Han Y,Huang L M,et al.A hybrid EMD-SVR model for the short-termprediction of significant wave height[J].Ocean Engineering,2016,124:54-73.)提出了一种基于经验模态分解(EMD)和支持向量回归(SVR)的混合模型,并用于非线性非平稳浪高的短期预测。文献十五(Kumar N K,Savitha R,Al Mamun A.Ocean wave heightprediction using ensemble of extreme learning machine[J].Neurocomputing,2018,277:12-20.)利用极限学习机(ELM)中初始化的随机性来获得更好的泛化性能,构造一个ELM集合来完成海浪高度的预测。文献十六(Ali M,Prasad R.Significant wave heightforecasting via an extreme learning machine model integrated with improvedcomplete ensemble empirical mode decomposition[J].Renewable and SustainableEnergy Reviews,2019,104:281-295.)将极限学习机模型与改进的自适应噪声完全集成经验模式分解方法相结合,并用于预测澳大利亚东部沿海地区的浪高。文献十七(Lu P,LiangS,Zou G,et al.M-LSTM,A HYBRID PREDICTION MODEL FOR WAVE HEIGHTS[J].JOURNAL OFNONLINEAR AND CONVEX ANALYSIS,2019,20(5):775-786.)提出了将长短期记忆(LSTM)模型和多元线性回归(MLR)模型组合,该模型在预测波高方面优于LSTM模型和多元线性回归模型。

虽然以上模型或算法能够完成对波高的预测,但其均有其劣势:传统数值模型预测需要大量数据和计算的复杂性;单一预测模型有其特定的适用目标和工作环境;现有的混合预测模型可能无法充分挖掘海浪高度数据之间的关系。

因此,开发一种数据需求及处理量小、适应性好且可充分挖掘海浪高度数据之间的关系的海浪高度预测方法极具现实意义。

发明内容

本发明的目的在于克服现有波高预测方法数据需求及处理量大、适应性较差且无法充分挖掘海浪高度数据之间的关系的缺陷,提供一种数据需求及处理量小、适应性好且可充分挖掘海浪高度数据之间的关系的海浪高度预测方法。

为实现上述目的,本发明提供如下技术方案:

一种基于深度学习的海浪高度预测方法,应用于电子设备,将海浪数据信息分别输入AM-LSTM模型(全称为加入了注意力机制的长短期记忆神经网络)和CatBoost模型获取输出P1和P2后,按照以下公式对P1和P2进行重构,更深入地挖掘特征之间的关系,得到预测序列P;

P=q2*P1+q1*P2,

其中,w1是指经AM-LSTM模型输出的MAE(平均绝对误差)、RMSE(均方根误差)及MAPE(平均绝对百分比误差)的均值,w2是指经CatBoost模型输出的MAE、RMSE及MAPE的均值,q1和q2分别为P1和P2的权重系数,本发明为给评价指标值(w值)较小的模型分配了较大的权重系数,从而降低了组合模型的误差,提高了整体预测精度。

本发明结合了深度学习中的LSTM及CatBoost方法,实现了深度学习中的LSTM在处理长期数据预测方面的优势以及注意力机制本身的特点和CatBoost的参数少、训练快和不易过拟合特点的有机结合,对预测后的数据进行重构,大大提高了预测精度,同时具有较强的泛化性能,极具应用前景。

在重构过程中本发明选定MAE(平均绝对误差)、RMSE(均方根误差)及MAPE(平均绝对百分比误差)这三个指标作为重构参数。其中,MAE可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小;RMSE衡量观测值同真值之间的偏差;MAPE考虑到预测值与真实值的误差和比例。以三个重构参数的均值作为最终的参数能够较为准确地实现对其权重系数的分配。

作为优选的技术方案:

如上所述的一种基于深度学习的海浪高度预测方法,所述海浪数据信息在输入AM-LSTM模型和CatBoost模型前进行了数据预处理。

如上所述的一种基于深度学习的海浪高度预测方法,所述数据预处理是指对海浪数据信息进行分析确认异常值(异常值包括缺失值及数据异常值)后,算得该异常值左右值的平均值并以所述平均值替换该异常值,最后对数据进行归一化处理。进行以上数据预处理后能够方便模型进行数据处理。

如上所述的一种基于深度学习的海浪高度预测方法,所述海浪数据信息包括风速、风向等变量和浪高值。

本发明还提供了应用如上所述的一种基于深度学习的海浪高度预测方法的电子设备,包括一个或多个处理器、一个或多个存储器、一个或多个程序及获取所述海浪数据信息的参数获取设备;

所述一个或多个程序被存储在所述存储器中,当所述一个或多个程序被所述处理器执行时,使得所述电子设备执行如上所述的基于深度学习的海浪高度预测方法。

有益效果:

(1)本发明的基于深度学习的海浪高度预测方法,兼顾了深度学习中的LSTM在处理长期数据预测方面的优势以及注意力机制本身的特点和CatBoost的参数少、训练快和不易过拟合的特点,对预测后的数据进行重构;

(2)本发明的基于深度学习的海浪高度预测方法,不仅预测精度高,而且还具有较强的泛化性能,特别适用于海浪高度的预测,极具应用前景。

附图说明

图1为本发明的基于深度学习的海浪高度预测方法的处理流程图。

具体实施方式

下面结合附图,对本发明的具体实施方式做进一步阐述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

以下实施例中所用到的海浪数据信息具体为墨西哥湾站点42002浮标的海浪数据信息,所测数据均在国家浮标中心规定的可接受误差范围内,同时符合国家有关规范的规定世界气象组织(WMO),其原始海浪数据信息中包含风速、风向等变量和浪高值,墨西哥湾站点42002的简介如下表所示:

其中海浪高度数据是每隔一个小时记录一次,时间是2015年月1日到2015年10月13日,共6884条数据。

实施例1

一种基于深度学习的海浪高度预测方法,应用于电子设备,其步骤如下(具体如图1所示):

(1)对包括风速、风向等变量和浪高值在内的海浪数据信息进行数据预处理,具体为:对海浪数据信息进行分析确认异常值后,算得该异常值左右值的平均值并以所述平均值替换该异常值,最后对数据进行归一化处理;

(2)将数据预处理后的海浪数据信息分别输入AM-LSTM模型和CatBoost模型获取输出P1和P2;

(3)按照以下公式对P1和P2进行重构得到预测序列P;

P=q2*P1+q1*P2,

其中,w1是指经AM-LSTM模型输出的MAE、RMSE及MAPE的均值,w2是指经CatBoost模型输出的MAE、RMSE及MAPE的均值。

本发明还单独选用SVR、ANN、LSTM、AM-LSTM、CatBoost五种算法模型(相比于实施例1,不同在于无步骤(3),步骤(2)改为将数据预处理后的海浪数据信息输入SVR、ANN、LSTM、AM-LSTM或CatBoost算法模型获取输出)对同一数据进行预测以验证本发明的预测精度,本发明通过MAE、RMSE和MAPE这三种指标考察本发明的方法和各模型的预测性能,具体如下表所示;

由上表的结果可以看出,在采用注意力机制的方法,进一步改进了LSTM后,AM-LSTM的预测性能普遍高于LSTM神经网络。此外,本发明的方法相比于AM-LSTM模型能够更为准确地预测海浪高度,同时也远远优于CatBoost模型的预测精度,这说明采用重构方法,使得其预测性能高于没有使用重构方法的模型,也证明了重构的方式是有意义的。

在本发明提出的方法中,首先独立训练AM-LSTM模型和CatBoost模型;接着使用训练好的AM-LSTM模型和CatBoost模型独立地进行预测;最后,将它们的预测结果重构后作为最终预测。

通过验证,我们发现本发明的方法更能有效的预测和拟合海浪高度数据,产生了单一模型不可比的性能。即与其它模型相比,本发明的方法具有明显的优越性,更深入地挖掘特征之间的关系,更好地拟合预测目标,特别适用于海浪高度的预测。

经验证,本发明的基于深度学习的海浪高度预测方法,兼顾了深度学习中的LSTM在处理长期数据预测方面的优势以及注意力机制本身的特点和CatBoost的参数少、训练快和不易过拟合的特点,对预测后的数据进行重构,预测精度高,泛化性能强,特别适用于海浪高度的预测,极具应用前景。

实施例2

一种电子设备,包括一个或多个处理器、一个或多个存储器、一个或多个程序及获取海浪数据信息的参数获取设备;

一个或多个程序被存储在存储器中,当一个或多个程序被处理器执行时,使得电子设备执行如实施例1所述的海浪高度预测方法。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应该理解,这些仅是举例说明,在不违背本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改。

相关技术
  • 一种基于深度学习的海浪高度预测方法及其应用
  • 一种基于层级化高度异构分布式系统的深度学习应用优化框架
技术分类

06120113007639