掌桥专利:专业的专利平台
掌桥专利
首页

一种高分辨率的气象要素二维插值方法及系统

文献发布时间:2024-04-18 19:59:31


一种高分辨率的气象要素二维插值方法及系统

技术领域

本发明涉及气象要素插值领域,具体涉及一种高分辨率的气象要素二维插值方法及系统。

背景技术

常规气象资料观测主要基于离散且不规则的站点获取,而传统数值天气预报的结果往往输出为地理分布规则的格点资料,利用观测站点对数值预报格点产品的预报效果进行验证,往往存在空间的不一致性,因此需要进一步利用预报的格点产品进行二维空间插值至对应的观测站点,但插值算法的准确性长期以来都是气象界的研究热点。同时,对于数值天气预报输出产品预报性能的科学准确评估也极大推动气象预测事业的快速发展。

常用的气象插值方法包括双线性插值、克里金(Kriging)插值等。这些方法多基于线性特征插值,但随着站点资料的时空分辨率提升,局部相邻站点容易受到下垫面变化以及地形梯度的影响,同时对于单时次的差值也无法有效提取相邻时间的连续变化信息,因此插值性能受到限制。

发明内容

为解决上述背景中的技术问题,本发明将深度学习中较为先进的图神经网络预测模型与克里金插值算法相结合,通过引入图神经网络,能够考虑时间上的动态变化,并将空间和时间信息结合在一起,进而提出了一种基于混合深度学习方法的高分辨率气象要素二维插值算法,促进对传统数值天气预报格点输出产品的有效验证和性能提升。

为实现上述目的,本发明提供了一种高分辨率的气象要素二维插值方法,步骤包括:

下载目标站点区域内的格点数据、观测数据和经纬度信息;

基于所述格点数据、所述观测数据和所述经纬度信息,得到数据集;

基于所述数据集,构建插值模型;

利用所述插值模型,完成气象要素插值。

优选的,得到所述数据集的方法包括:将获取的所述格点数据、所述观测数据和所述经纬度信息进行整合处理,得到所述数据集。

优选的,构建所述插值模型的方法包括:

构建模型框架;

将所述数据集输入所述模型框架中,完成所述插值模型的构建。

优选的,构建所述模型框架的方法包括:在每次训练时使用随机采样程序来生成一组用于训练的子图;同时随机采样节点的子集并构建相应的邻接矩阵,通过创建掩码矩阵以保持格点数据,并将未被掩码矩阵覆盖的格点数据设置为“缺测”;同时,通过构建邻接矩阵来捕捉节点之间的空间关系并且计算节点在不同时间步之间的特征差异,完成所述模型框架的构建。

优选的,构建所述插值模型的方法包括:将所述数据集输入所述模型框架中进行训练;分别进行插值,将历史时间步的观测数据作为输入,预测将来时间步的数值;并利用图神经网络的机制,对未观测的动态数据集进行插值预测。

优选的,在所述插值模型构建完成之后,采用计算均方根误差RMSE,对所述插值模型进行效果验证:

其中,i为对应的时间;N

本发明还提供了一种高分辨率的气象要素二维插值系统,所述系统用于实现上述方法,包括:采集模块、整合模块、构建模块和插值模块;

所述采集模块用于下载目标站点区域内的格点数据,并采集目标站点观测数据及其经纬度信息;

所述整合模块用于基于所述格点数据、观测数据和经纬度信息得到数据集;

所述构建模块用于基于所述数据集,构建插值模型;

所述插值模块用于利用所述插值模型,完成气象要素插值。

优选的,所述构建模块包括:框架构建单元和训练单元;

所述框架构建单元用于构建模型框架;

所述训练单元用于将所述数据集输入所述模型框架中,完成所述插值模型的构建。

与现有技术相比,本发明的有益效果如下:

本发明结合数据的时空特性,改良了从规则网格输出资料对常规不规则分布站点插值的效果,为改善数值天气预报输出产品性能提供可靠依据。同时,本发明可以进一步提升温度数据插值结果大小与分布的准确性;对于降水大值区的插值效果,本发明展现出更为明显的精细化与准确化,能够提供更为接近实况数据大小与落区的插值结果。

附图说明

为了更清楚地说明本发明的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的方法流程示意图;

图2为本发明实施例与普通Kriging插值对2020年11月21日以及12月07日ERA5再分析格点数据2m温度插值效果对比图,第一行为普通Kriging插值数据,第二行为本发明实施例得到的插值数据,第三行为站点实况数据;

图3为本发明实施例与普通Kriging插值对2020年11月21日以及12月07日ERA5再分析格点数据日降水量插值效果对比图,第一行为普通Kriging插值数据,第二行为本发明实施例得到的插值数据,第三行为站点实况数据;

图4为本发明实施例与普通Kriging插值2020年11月20日后31天ERA5再分析格点数据2m温度插值结果与同时段实况数据RMSE对比图;

图5为本发明实施例与普通Kriging插值2020年11月20日后31天ERA5再分析格点数据日降水量插值结果与同时段实况数据RMSE对比图。

图6为本发明实施例与普通Kriging插值对2021年11月20日以及12月07日站点实测数据2m温度插值效果对比图,第一行为普通Kriging插值数据,第二行为本发明实施例得到的插值数据,第三行为站点实况数据;

图7为本发明实施例与普通Kriging插值对2020年11月20日以及12月07日站点实测数据日降水量插值效果对比图,第一行为普通Kriging插值数据,第二行为本发明实施例得到的插值数据,第三行为站点实况数据;

图8为本发明实施例与普通Kriging插值对2021年11月20日后31天站点实测数据2m温度插值结果与同时段实况数据RMSE对比图;

图9为本发明实施例与普通Kriging插值对2020年11月20日后31天站点实测数据日降水量插值结果与同时段实况数据RMSE对比图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

如图1所示,为本实施例的方法流程示意图,步骤包括:

S1.下载目标站点区域内的格点数据、观测数据和经纬度信息。

首先从ECWMF官网下载2020年所有时次的再分析格点数据(2m温度,降水量),分辨率为0.25*0.25,并从中选取30-35°N,115-120°E区域内数据,共计441个格点;之后下载2020年此区域内已有站点的观测数据(2m温度,降水量)和经纬度信息,共计158个站点。

S2.基于格点数据、观测数据和经纬度信息得到数据集。

将上述步骤中收集到的格点数据、观测数据和经纬度信息进行整合处理,的到数据集。具体步骤包括:

整理下载的格点数据,将2020年每日的气象要素信息(2m温度,降水量),即观测数据按441个格点的顺序进行整理在表格中,将每日的数据整理到一行。同时将目标站点全时段观测数据设置为缺测值,按顺序加在格点数据之后,使得2020年每日有599个数据。同时将所有格点及站点的经纬度信息,严格按照前面格点和站点的次序整理在表格中,第一列为纬度,第二列为经度,共计599行。

S3.基于数据集,构建插值模型。

首先,构建模型框架,本实施例中采用CNN模型。为了增强模型的适用性,本实施例在每次训练时使用随机采样程序来生成一组用于训练的子图。每次随机选择一个站点或格点,对该点取固定大小的领域,本实施例中采用了k=30的设置,即每个点的邻居数量被限制为30。具体来说,每个点的邻居包括其本身和距离该点最近的k-1个点,这些点会被用来形成该点的邻域。

通过遍历所有点的经纬度,找出目标点领域内的所有站点和格点,与目标点共同构成一个邻接矩阵。这个中心点用0表示,其他邻居点用1表示,-1表示该点不在邻域中。如此构建的邻接矩阵可以用于将大小或形状可变的输入区域转化为固定大小的矩阵。

之后在邻接矩阵中创建一个掩码矩阵以保持一些格点数据,本实施例中在邻接矩阵中随机挑选五分之四的数据进行掩码覆盖,并将未被掩码矩阵覆盖的格点数据设置为“缺测”,被覆盖的数据中如果有缺测值也同时保留缺测值。如此,便能够在缺失数据的情况下执行空间插值。

在本模型中,主要利用变程函数来建立模型中的空间相关性,变程函数定义为:

γ(h)=σ2*(1-exp(-h/ρ))

其中,γ(h)是变程函数的值;σ2是样本值的方差;h是样本间的距离;ρ是变程参数。

根据站点之间的距离来量化空间相关性,从而计算两个点之间的相似性程度,然后将相似性程度作为输入特征传递给图神经网络模型。通过学习空间上的相似性,模型可以对未知地点进行准确的预测和插值。在训练阶段,使用已有的格点数据进行模型的训练,学习各点之间的空间相关性和属性特征的关系,从而进行空间插值。

由于模型使用了时空图数据结构,其中每个节点表示一个空间位置,并包含多个时间步的特征。针对每个时间步,模型通过邻接矩阵来捕捉节点之间的空间关系。对于每个节点,模型还会计算节点在不同时间步之间的特征差异,以获取时序依赖性。具体的,对于节点Vi,假设其特征在时间步长t和t+1时,分别为Xi,t和Xi,t+1,则可以计算每个节点特征的差分量:

ΔXi,t=Xi,t+1-Xi,t

将ΔXi,t用于表示时序特征。

差分量不仅反映了节点特征在不同时刻的变化情况,而且可以捕捉节点之间的相对变化量,并提高模型对于时间依赖性的建模能力。用节点的差分量除以其相应的时间间隔,得到其特征变化的平均速率。从而有效地获取节点在不同时间步之间的特征差异和时序依赖性,更准确地为时空数据进行预测和分析。

之后,将数据集输入GNN模型中,设置合适的模型参数,完成对模型的训练,将数据采样空间维度为350,最大隐藏维度设为350,被随机遮盖的节点的数量为150,在训练中设置被删除的站点为150,epoch数750。同时为数据集选择h=6(即6天,h是时间步数),对于每个时间段[t,t+h),[t+h,t+2h),[t+2h,t+3h)等,我们分别进行插值,将过去几个时间步的观测数据作为输入,预测下一个时间步的数值,使其可以在数据集不完整的情况下也可以重建子图上的完整矩阵;并利用图神经网络的机制,对未观测的动态数据集进行插值预测。本实施例将前90%的时间点的数据作为训练集,并在接下来的10%的时间点上测试模型的性能。

S4.利用插值模型,完成气象要素插值。

利用上述构建的差值模型,插值连续1-31天的温度与降水要素信息,得到高分辨率的气象要素结果。

实施例二

为验证本发明的先进性,在本实施例特意设置对比实验,将本发明的结果与普通克里金(Kriging)插值结果进行比对(比对结果如图2-9所示),通过计算插值结果与站点实况数据的均方根误差(RMSE):

其中,i为对应的时间;N

可知,本发明分别在日平均温度与日降水量上较普通克里金(Kriging)方法下降了28%和1%,在一定程度上提升了准确度。同时,对于站点观测过程中存在缺测情况,也可利用本发明进行缺测插补。通过与普通克里金(Kriging)插值算法对比,发现随机挑选的20%缺测点进行插值,本发明对于日平均温度与降水量的插值RMSE下降了32%和25%,性能提升明显。

实施例三

本实施例还提供了一种高分辨率的气象要素二维插值系统,包括:采集模块、整合模块、构建模块和插值模块;采集模块用于下载目标站点区域内的格点数据、观测数据和经纬度信息;整合模块用于基于格点数据、观测数据和经纬度信息得到数据集;构建模块用于基于数据集,构建插值模型;插值模块用于利用插值模型,完成气象要素插值。

其中,构建模块包括:框架构建单元和训练单元;框架构建单元用于构建模型框架;训练单元用于将数据集输入模型框架中,完成插值模型的构建。

首先,利用采集模块下载目标站点区域内的格点数据、观测数据和经纬度信息。

在本实施例中,采集模块从ECWMF官网下载2020年所有时次的再分析格点数据(2m温度,降水量),分辨率为0.25*0.25,并从中选取30-35°N,115-120°E区域内数据,共计441个格点;之后下载2020年此区域内已有站点的观测数据(2m温度,降水量)和经纬度信息,共计158个站点。

之后,整合模块基于格点数据、观测数据和经纬度信息得到数据集。

将上述流程中收集到的格点数据、观测数据和经纬度信息进行整合处理,的到数据集。具体流程包括:

整理下载的格点数据,将2020年每日的气象要素信息(2m温度,降水量),即观测数据按441个格点的顺序进行整理在表格中,将每日的数据整理到一行。同时将目标站点全时段观测数据设置为缺测值,按顺序加在格点数据之后,使得2020年每日有599个数据。同时将所有格点及站点的经纬度信息,严格按照前面格点和站点的次序整理在表格中,第一列为纬度,第二列为经度,共计599行。

构建模块基于数据集,构建插值模型。

首先,利用框架构建单元来构建模型框架,本实施例中采用CNN模型。为了增强模型的适用性,本实施例在每次训练时使用随机采样程序来生成一组用于训练的子图。每次随机选择一个站点或格点,对该点取固定大小的领域,本实施例中采用了k=30的设置,即每个点的邻居数量被限制为30。具体来说,每个点的邻居包括其本身和距离该点最近的k-1个点,这些点会被用来形成该点的邻域。

通过遍历所有点的经纬度,找出目标点领域内的所有站点和格点,与目标点共同构成一个邻接矩阵。这个中心点用0表示,其他邻居点用1表示,-1表示该点不在邻域中。如此构建的邻接矩阵可以用于将大小或形状可变的输入区域转化为固定大小的矩阵。

之后在邻接矩阵中创建一个掩码矩阵以保持一些格点数据,本实施例中在邻接矩阵中随机挑选五分之四的数据进行掩码覆盖,并将未被掩码矩阵覆盖的格点数据设置为“缺测”,被覆盖的数据中如果有缺测值也同时保留缺测值。如此,便能够在缺失数据的情况下执行空间插值。

在本模型中,主要利用变程函数来建立模型中的空间相关性,变程函数定义为:

γ(h)=σ2*(1-exp(-h/ρ))

其中,γ(h)是变程函数的值;σ2是样本值的方差;h是样本间的距离;ρ是变程参数。

根据站点之间的距离来量化空间相关性,从而计算两个点之间的相似性程度,然后将相似性程度作为输入特征传递给图神经网络模型。通过学习空间上的相似性,模型可以对未知地点进行准确的预测和插值。在训练阶段,使用已有的格点数据进行模型的训练,学习各点之间的空间相关性和属性特征的关系,从而进行空间插值。

由于模型使用了时空图数据结构,其中每个节点表示一个空间位置,并包含多个时间步的特征。针对每个时间步,模型通过邻接矩阵来捕捉节点之间的空间关系。对于每个节点,模型还会计算节点在不同时间步之间的特征差异,以获取时序依赖性。具体的,对于节点Vi,假设其特征在时间步长t和t+1时,分别为Xi,t和Xi,t+1,则可以计算每个节点特征的差分量:

ΔXi,t=Xi,t+1-Xi,t

将ΔXi,t用于表示时序特征。

差分量不仅反映了节点特征在不同时刻的变化情况,而且可以捕捉节点之间的相对变化量,并提高模型对于时间依赖性的建模能力。用节点的差分量除以其相应的时间间隔,得到其特征变化的平均速率。从而有效地获取节点在不同时间步之间的特征差异和时序依赖性,更准确地为时空数据进行预测和分析。

之后,训练单元将数据集输入GNN模型中,设置合适的模型参数,完成对模型的训练,将数据采样空间维度为350,最大隐藏维度设为350,被随机遮盖的节点的数量为150,在训练中设置被删除的站点为150,epoch数750。同时为数据集选择h=6(即6天,h是时间步数),对于每个时间段[t,t+h),[t+h,t+2h),[t+2h,t+3h)等,我们分别进行插值,将过去几个时间步的观测数据作为输入,预测下一个时间步的数值,使其可以在数据集不完整的情况下也可以重建子图上的完整矩阵;并利用图神经网络的机制,对未观测的动态数据集进行插值预测。本实施例将前90%的时间点的数据作为训练集,并在接下来的10%的时间点上测试模型的性能。

最后,差值单元利用插值模型,完成气象要素插值。

利用上述构建的差值模型,插值连续1-31天的温度与降水要素信息,得到高分辨率的气象要素结果。

以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

技术分类

06120116516270