掌桥专利:专业的专利平台
掌桥专利
首页

基于海气动力场数据的赤潮预测方法、系统及介质

文献发布时间:2024-04-18 19:58:21


基于海气动力场数据的赤潮预测方法、系统及介质

技术领域

本申请属于赤潮预测技术领域,特别是涉及一种基于海气动力场数据的赤潮预测方法。

背景技术

随着科学技术的发展,越来越多的学者将机器学习方法应用于赤潮的研究与预测中,该类方法基于观测数据,实现了自动化的赤潮预警。但现有的基于机器学习的赤潮预测方法通常需要基于海气动力场数据以及生物和化学等多源因子,实现高准确度的赤潮预测,不仅涉及的数据量庞大,且多源因子的获取难度高,如氨态氮、硝态氮等生化因子,需要预先在目标海域设置生化观测装置,并基于观测数据分析获取,于实际应用时,难以满足常态化的赤潮预测需求。因此,如何仅基于易获取的海气动力场数据,实现准确度高且常态化的赤潮预测是目前亟需解决的重要问题。

发明内容

鉴于上述现有技术的缺点,本申请的目的在于提供一种基于海气动力场数据的赤潮预测方法,用于解决目前赤潮预测方法对多源因子依赖性强,难以实现常态化且准确度高的赤潮预测的问题。

为实现上述目的及其他相关目的,本发明提供一种基于海气动力场数据的赤潮预测方法,用于获取目标海域内的叶绿素浓度分布,包括以下步骤:

基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子,和基于所述相关特征因子,构建衍生特征因子;

将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;

基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;

基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。

于本发明的一实施例中,所述相关特征因子的获取方式包括:获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子。

于本发明的一实施例中,所述衍生特征因子的获取方式包括:

基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。

于本发明的一实施例中,所述训练数据集的构建方式包括:

将t时刻的叶绿素浓度作为标签,将与t时刻对应的目标时间段内的所述目标特征因子作为特征,组合所述标签与对应的所述特征,获得构建的训练数据;采用所述训练数据的构建方式,依次对各时刻的所述叶绿素浓度,和对应目标时间段内的所述目标特征因子进行所述训练数据的构建,获得训练数据集。

于本发明的一实施例中,所述与t时刻对应的目标时间段为所述t时刻前的时间子段,和所述t时刻后的时间子段。

于本发明的一实施例中,所述t时刻前的时间子段为7天,所述t时刻后的时间子段为3天。

于本发明的一实施例中,所述预测数据集的构建方式与所述训练数据集的构建方式相同。

对应地,本发明提供一种基于海气动力场数据的赤潮预测系统,用于获取目标海域内的叶绿素浓度分布,其特征在于,包括:

目标特征因子获取模块,用于基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子;和基于所述相关特征因子,构建衍生特征因子;

训练数据集构建模块,用于将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;

赤潮预测模型获取模块,用于基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;

赤潮预测结果获取模块,用于基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。

于本发明的一实施例中,所述目标特征因子获取模块包括:

相关特征因子获取子模块,用于获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子;

衍生特征因子获取子模块,用于基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。

对应地,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述赤潮预测方法。

如上所述,本申请所述的一种基于海气动力场数据的赤潮预测方法、系统及介质,具有以下有益效果:

通过在时间维度和/或空间维度上,分析海气动力场数据中的各初始特征因子的特征分布与叶绿素浓度分布的关联性,获取各所述初始特征因子中与赤潮发生高度相关的相关特征因子;其次,通过构建所述相关特征因子于时间维度和/或空间维度上的衍生因子,在深入挖掘了所述特征因子与所述叶绿素浓度的关联性的同时,提升了目标特征因子的数量,以满足模型训练的需求;以及,通过建立所述目标特征因子与赤潮发生在时间尺度上的联系,进一步提升仅基于所述海气动力场数据,预测赤潮发生的准确度,从而实现仅基于海气动力场数据的高准确度的赤潮发生预测。

附图说明

图1显示为本申请一实施例示出的一种基于海气动力场数据的赤潮预测方法的流程示意图。

图2显示为本申请一实施例示出的基于所述赤潮预测方法获取的2023年4月至5月外海海域的赤潮预测结果图。

图3显示为本申请一实施例示出的基于所述赤潮预测方法获取的2016年至2019年温州海域的预测叶绿素浓度与观测叶绿素浓度对比图。

图4显示为本申请一实施例示出的一种基于海气动力场数据的赤潮预测系统的模块示意图。

图5显示为本申请一实施例示出的目标特征因子获取模块的子模块示意图。

附图标记说明

S1~S4 步骤;300 赤潮预测系统;301 目标特征因子获取模块;3011 相关特征因子获取子模块;3012 衍生特征因子获取子模块;302 训练数据构建模块;303 赤潮预测模型获取模块;304 赤潮预测结果获取模块。

具体实施方式

以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。

需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

术语的解释:

赤潮:又称藻华,是在特定的环境条件下,海水中的某些浮游植物爆发性增殖或高度聚集而引起水体变色的一种有害生态现象。

ERA5数据:是欧洲中期天气预报中心对1950年1月至今,全球气候的第五代大气再分析数据集,提供了大量大气、陆地和海洋气候变量的每小时估计值,其中,ERA5 DAILY提供每天7个ERA5气候再分析参数的汇总值,包括:2m空气温度、2m露点温度、总降水量、平均海平面气压、表面气压、10m的u风分量和10m的v风分量。

GFS数据:是来源于美国国家环境预报中心的全球预报系统,该系统每天发布四次全球范围的气象数据,包含温度、湿度、风场、降水量、辐射、云量、绝对涡度、海角对流有效势能等数据。

本申请以下实施例提供了一种基于海气动力场数据的赤潮预测方法,用于获取目标海域内的叶绿素浓度分布,所述海气动力场数据包括若干个不同的海气动力场特征因子(以下简称“特征因子”)所对应的数据;本申请通过在时间维度和/或空间维度上,分析海气动力场数据中的各初始特征因子(初始的海气动力场特征因子)的特征分布与叶绿素浓度分布的关联性,获取各所述初始特征因子中与赤潮发生高度相关的相关特征因子(与所述叶绿素浓度相关的海气动力场特征因子);其次,通过构建所述相关特征因子于时间维度和/或空间维度上的衍生因子,在深入挖掘了所述特征因子与所述叶绿素浓度的关联性的同时,提升了所述目标特征因子的数量,以满足模型训练的需求;以及,通过建立所述目标特征因子与赤潮发生在时间尺度上的联系,进一步提升仅基于所述海气动力场数据,预测赤潮发生的准确度,从而实现仅基于海气动力场数据的高准确度的赤潮发生预测。

如图1所示,于本实施例中,本发明的一种基于海气动力场数据的赤潮预测方法包括以下步骤:

步骤S1、基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子,和基于所述相关特征因子,构建衍生特征因子;

其中,所述初始特征因子为表征海洋物理环境特征的特征参数;示例性的,所述海洋物理环境特征包括:2m空气温度、2m露点温度、总降水量、平均海平面气压、表面气压、云量、绝对涡度、海角对流有效势能等。

于一种实施方式中,所述步骤S1于执行时,包括:

步骤S11、获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子。

于一种实施方式中,所述相关特征因子的获取方式,包括:

步骤S111、基于各年度的叶绿素浓度,获取赤潮发生时间段;

其中,所述赤潮发生时间段包括赤潮发生前的第一时间子段、赤潮发生时的第二时间子段和赤潮发生后的第三时间子段;所述赤潮发生是指所述叶绿素浓度大于预设叶绿素浓度阈值;示例性的,所述预设叶绿素浓度阈值为10mg/m

步骤S112、提取所述赤潮发生时间段内,各所述初始特征因子对应的时序分布和空间分布;基于所述初始特征因子的时序分布,获取所述初始特征因子的时序变化趋势;以及,基于所述初始特征因子的空间分布,获取所述初始特征因子的空间变化趋势;分别检测各年度的所述初始特征因子对应的所述时序变化趋势是否相同,或检测各年度的所述初始特征因子对应的所述空间变化趋势是否相同,若是,则将所述初始特征因子作为与所述叶绿素浓度变化相关的相关特征因子;

或者,获取所述初始特征因子在所述赤潮发生时间段内的变化量;检测各年度的所述初始特征因子在所述赤潮发生时间段内的变化量是否大于预设阈值,若是,则将所述初始特征因子作为与所述叶绿素浓度时序变化相关的相关特征因子;

其中,所述变化趋势相同是指各年度的所述初始特征因子在所述赤潮发生时间段内保持同样的上行、下降和/或震荡趋势;所述同样的上行趋势是指各年度的所述初始特征因子在所述赤潮发生时间段内,所述初始特征因子的起始变化的数值,大于所述初始特征因子的结束变化的数值,且所述起始变化的数值与所述结束变化的数值的差值大于预设变化阈值;所述同样的下降趋势是指各年度的所述初始特征因子在所述赤潮发生相关时间段内,所述初始特征因子的结束变化的数值,大于所述初始特征因子的起始变化的数值,且所述起始变化的数值与所述结束变化的数值的差值大于预设变化阈值;所述同样的震荡趋势是指各年度的所述初始特征因子在所述赤潮发生时间段内,所述初始特征因子的起始变化的数值与结束变化的数值的差值小于预设变化阈值。

于一具体实施例中,所述相关特征因子包括:海表面温度、风场沿岸分量、风场离岸分量和风速。

可选的,所述海气动力场数据基于ERA5数据和/或GFS数据获取。

可选的,所述叶绿素浓度基于生态浮标记录的观测数据获取。

步骤S12、基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。

于一种实施方式中,所述衍生特征因子的获取方式,包括:

步骤S121、计算所述相关特征因子,于时间维度上的变量和累积量;以及,计算所述相关特征因子与相关特征因子之间,于时间维度上的变量和累积量,以获得所述相关特征因子于时间维度的衍生因子;提取所述相关特征因子在目标海域的空间分布特征,以获得所述相关特征因子于空间维度的衍生因子;

其中,所述相关特征因子于时间维度的衍生因子包括:海表面温度变率、风场沿岸分量累积、风场离岸分量累积和风速累积等;所述海表面温度变率包括不同时间单位获取的目标海域海表面温度的变化量。

所述相关特征因子与相关特征因子之间于时间维度的衍生因子包括:温度与风速的乘积量、风速与风场沿岸分量的乘积量和风场沿岸分量与风场离岸分量累加和等。

所述相关特征因子于空间维度的衍生因子包括:等温线与目标海域的距离;所述等温线与目标海域的距离包括各温度等温线与目标海域的距离。

步骤S122、将所述衍生因子作为自变量,将所述叶绿素浓度作为因变量,采用相关性分析方法,计算各所述衍生因子与所述叶绿素浓度的相关系数,将所述衍生因子中与所述叶绿素浓度的相关系数大于预设相关性阈值的衍生因子,设为衍生特征因子。

于一具体实施例中,所述相关性分析方法为皮尔逊相关系数分析方法。

于一具体实施例中,所述衍生特征因子包括:海表面温度变率、临界温度等温线与目标海域的距离、风速累积和风场沿岸分量累积;于一优选例中,所述临界温度等温线为与目标海域的距离为17℃等温线与目标海域的距离。

其中,所述海表面温度变率为目标海域海表面温度以小时为单位的变化量;

所述临界温度为基于各年度赤潮发生时间段内,获取的各海表面温度的平均值;

所述风速累积为目标海域风速以小时为单位的累加和;

所述风场沿岸分量累积为目标海域外海风场在沿岸方向上,以小时为单位的分量的累加和,表征风场对海水的长期影响。

需要说明的是,考虑到海气动力场的各特征因子是在时间维度和空间维度的的协同作用下,对赤潮发生产生的影响,本申请中分别基于时间维度和空间维度,构建所述相关特征因子,和/或所述相关特征因子和相关特征因子之间的衍生因子,以深入挖掘海气动力场与赤潮发生的相关性。

步骤S2、将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;

具体的,将t时刻的叶绿素浓度作为标签,将与t时刻对应的目标时间段内的所述目标特征因子作为特征,组合所述标签与对应的所述特征,获得构建的训练数据;采用所述训练数据的构建方式,依次对各时刻的所述叶绿素浓度,和对应目标时间段内的所述目标特征因子进行所述训练数据的构建,获得训练数据集;

其中,所述与t时刻对应的目标时间段为所述t时刻前的第四时间子段,和所述t时刻后的第五时间子段;所述第四时间子段大于所述第五时间子段;

于一具体实施例中,所述第四时间子段为7天,所述第五时间子段为3天。

需要说明的是,赤潮的发生,是浮游植物在一段时间内,以及特定环境下发生的爆发式增殖的过程,且海气动力场是在一段时间内,在各因子的协同作用下使得海域环境发生改变,因此,t时刻浮游植物的生长,受t时刻过去一段时间,和t时刻未来一段时间的海气动力场的影响,基于此,本申请构建赤潮预测数据集时,将t时刻前后时间段内的所述目标特征因子,与所述t时刻的叶绿素浓度组合,作为一个训练数据,有利于所述赤潮预测模型,建立所述目标特征因子与赤潮发生在时间尺度上的关联性,以提高所述赤潮预测模型对赤潮发生预测的准确度;同时,考虑到所述目标特征因子在时间维度上的累积效应、各因子间的反应速度,以及浮游植物的生长周期,于一具体实施例中,将所述t时刻前的第四时间子段设置为7天;以及考虑到预报数据的误差会随时间的增加而变大,于一具体实施例中,将所述t时刻后的第五时间子段设置为3天。

步骤S3、基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;

具体的,将所述训练数据集,以8:2的比例划分为训练集与测试集,基于所述训练集和所述测试集,获得训练后的所述赤潮预测模型。

于一具体实施例中,所述赤潮预测模型为LSTM机器学习模型。

步骤S4、基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。

其中,所述预测数据集的构建方式与所述训练数据集的构建方式相同,在此不再赘述。

为验证本申请所述赤潮预测方法于赤潮预测问题中的性能,进行了如下实验:

其中,所述赤潮预测模型为LSTM机器学习模型;所述赤潮预测模型设置为包含10个隐含层,采用Adam梯度下降算法作为所述赤潮预测模型的激活函数,迭代次数为1000次,初始学习率为0.005,学习下降因子为0.1。

采用R

表1

上表中,R

请参阅图2,显示为基于所述方法获取的2023年4月至5月外海海域的赤潮预测结果图,其中,设定5mg/m

请参阅图3,显示为基于所述方法获取的2016年至2019年温州海域的预测叶绿素浓度与观测叶绿素浓度对比图,其中,设定10mg/m

上述实施例中提供的一种基于海气动力场数据的赤潮预测方法,通过在时间维度和/或空间维度上,分析海气动力场数据中的各初始特征因子的特征分布与叶绿素浓度分布的关联性,获取各所述初始特征因子中与赤潮发生高度相关的相关特征因子;其次,通过构建所述相关特征因子于时间维度和/或空间维度上的衍生因子,在深入挖掘了所述特征因子与所述叶绿素浓度的关联性的同时,提升了目标特征因子的数量,以满足模型训练的需求的;以及,通过建立所述目标特征因子与赤潮发生在时间尺度上的联系,进一步提升仅基于所述海气动力场数据,预测赤潮发生的准确度,从而实现仅基于海气动力场数据的高准确度的赤潮发生预测。

如图4所示,于本实施例中,本发明提供一种基于海气动力场数据的赤潮预测系统,用于获取目标海域内的叶绿素浓度分布,包括:

目标特征因子获取模块301,基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子;和基于所述相关特征因子,构建衍生特征因子;

训练数据集构建模块302,将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;

赤潮预测模型获取模块303,用于基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;

赤潮预测结果获取模块304,用于基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。

如图5所示,于本实施例中,所述目标特征因子获取模块包括:

相关特征因子获取子模块3011,用于获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子;

衍生特征因子获取子模块3012,用于基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。

本申请实施例还提供了一种计算机可读存储介质。本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(magnetic tape),软盘(floppy disk),光盘(optical disc)及其任意组合。上述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。

本申请实施例还可以提供一种计算机程序产品,所述计算机程序产品包括一个或多个计算机指令。在计算设备上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。

所述计算机程序产品被计算机执行时,所述计算机执行前述方法实施例所述的方法。该计算机程序产品可以为一个软件安装包,在需要使用前述方法的情况下,可以下载该计算机程序产品并在计算机上执行该计算机程序产品。

上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,可以参见其他流程或结构的相关描述。

上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。

相关技术
  • 一种基于神经网络的经营数据预测方法、可读存储介质和预测系统
  • 电子装置、基于XGBoost的电力数据异常预测方法及存储介质
  • 基于事件的数据预测方法、装置、计算机设备和存储介质
  • 基于多变量海气耦合器的ENSO预测方法、装置、设备及介质
  • 基于陆海气耦合模式的生态流量预测方法和系统
技术分类

06120116484749