掌桥专利:专业的专利平台
掌桥专利
首页

一种多源气象数据融合处理方法、系统、终端及介质

文献发布时间:2023-06-19 09:57:26


一种多源气象数据融合处理方法、系统、终端及介质

技术领域

本发明涉及气象数据处理技术领域,更具体地说,它涉及一种多源气象数据融合处理方法、系统、终端及介质。

背景技术

20世纪80年以后,随着地球系统科学的发展,研究范围从区域尺度扩大到全球尺度,跨区域全球视角的研究方向方兴未艾,因此也对数据提出了更高的要求。目前国际上使用较多的格点数据包括ERA5和NCEP2再分析数据集,其中ERA5数据由ECMWF面向全球用户公开的再分析数据,是迄今为止最强大的全球气候监测数据集,与之前的ERA-Interim产品相比,ERA5具有更高的时空分辨率,时间分辨率为逐小时,空间分辨率高达0.125°。

目前,获取降水观测信息的途径主要有三种:地面雨量计、地基雷达和卫星遥感探测信息。一方面,地面雨量计和地基雷达的降水资料相对准确,但其空间分布不均匀,在地面雨量站网稀疏地区,如果仅用雨量网观测降水估计流域面降水量将会产生很大的不确定性,所以地面雨量计仅适合观测局地区域性的降水,很难获得较准确的大区域或全球的降水信息。另一方面,卫星遥感可进行大范围空间连续的探测,对某些特定目标区的观测时间分辨率也很高,但是由于卫星反演降水的物理原理和算法的局限性,其反演降水的精度相对较低。由于缺乏时空连续覆盖广泛的综合观测系统,要得到长期的精准的高分辨率的全球降水分布非常困难,数值模式输出的降水产品可以弥补观测系统时空不连续造成的问题,但模式降水本身亦存在严重的系统偏差。

为此,基于单一来源的降水资料都各有利弊,如何有效结合不同来源降水资料的优势,发展多源降水融合技术,成为近年来国际上在高质量降水产品研发中的主流趋势。因此,如何研究设计一种多源气象数据融合处理方法、系统、终端及介质是我们目前急需解决的问题。

发明内容

为解决现有技术中的不足,本发明的目的是提供一种多源气象数据融合处理方法、系统、终端及介质。

本发明的上述技术目的是通过以下技术方案得以实现的:

第一方面,提供了一种多源气象数据融合处理方法,包括以下步骤:

S101:获取第一空间分辨率的日降水量待校正G源数据以及日降水量观测S源数据;

S102:将所述第一空间分辨率的日降水量待校正G源数据通过空间插值法处理后得到日降水量待校正S源数据,以及通过三次样条插值法处理后得到第二空间分辨率的日降水量待校正G源数据;

S103:将所述日降水量观测S源数据与所述日降水量待校正S源数据计算差值后得到校正S源参数;

S104:将所述校正S源参数通过三次样条插值法处理后得到第二空间分辨率的校正G源参数;

S105:将所述第二空间分辨率的日降水量待校正G源数据与所述第二空间分辨率的校正G源参数计算和值后得到第二空间分辨率的日降水量G源数据;

S106:通过反距离权重法对第二空间分辨率的日降水量G源数据进行边界修正,并依据初始数据对边界修正后的第二空间分辨率的日降水量G源数据进行校正,得到校正融合数据。

进一步的,所述第一空间分辨率的日降水量待校正G源数据以及所述日降水量观测S源数据的获取过程具体为:

获取原始站点数据和ERA5再分析数据;

将所述原始站点数据、所述ERA5再分析数据融合处理后得到所述第一空间分辨率的日降水量待校正G源数据;

以及,对所述原始站点数据进行时间序列划分后得到所述日降水量观测S源数据。

进一步的,所述第一空间分辨率大于所述第二空间分辨率。

进一步的,所述第一空间分辨率为0.25°,所述第二空间分辨率为0.1°。

进一步的,所述第一空间分辨率的日降水量待校正G源数据通过三次样条插值法处理后得到所述第二空间分辨率的日降水量待校正G源数据的具体过程为:

从所述第一空间分辨率的日降水量待校正G源数据选取插值区间[a,b],并在插值区间[a,b]中等间距的输入n个插值节点

将n个插值节点输入三次样条插值函数后计算得到对应的三次样条插值,三次样条插值函数为三次多项式,且插值节点的左右两个子区域的数值、一阶导、二阶导分别相等。

进一步的,通过所述反距离权重法对第二空间分辨率的日降水量G源数据进行边界修正的具体计算公式如下:

其中,Z表示所要估计点的气象要素,Z

进一步的,所述初始数据包括原始站点数据、TRMM数据和地理信息数据。

第二方面,提供了一种多源气象数据融合处理系统,包括:

数据采集模块,用于获取第一空间分辨率的日降水量待校正G源数据以及日降水量观测S源数据;

第一数据处理模块,用于将所述第一空间分辨率的日降水量待校正G源数据通过空间插值法处理后得到日降水量待校正S源数据,以及通过三次样条插值法处理后得到第二空间分辨率的日降水量待校正G源数据;

差值计算模块,用于将所述日降水量观测S源数据与所述日降水量待校正S源数据计算差值后得到校正S源参数;

第二数据处理模块,用于将所述校正S源参数通过三次样条插值法处理后得到第二空间分辨率的校正G源参数;

和值计算模块,用于将所述第二空间分辨率的日降水量待校正G源数据与所述第二空间分辨率的校正G源参数计算和值后得到第二空间分辨率的日降水量G源数据;

数据融合模块,用于通过反距离权重法对第二空间分辨率的日降水量G源数据进行边界修正,并依据初始数据对边界修正后的第二空间分辨率的日降水量G源数据进行校正,得到校正融合数据。

第三方面,提供了一种计算机终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面中任意一项所述的一种多源气象数据融合处理方法。

第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现如第一方面中任意一项所述的一种多源气象数据融合处理方法。

与现有技术相比,本发明具有以下有益效果:

1、本发明通过将原始站点完全融合到ERA5再分析数据中得到一套新的完整降水数据,无论是空间分辨率,还是数据精确性方面都将得到极大提高,对站点分布较为稀疏的复杂地形区域的降水数据融合的适用性较好,能真实的反应出复杂地形流域的降水特征,如大渡河流域区域,对该地区的水利、电力等方面的应用提供更好的参考;

2、本发明通过改进的三次样条插值法处理数据,通过构造多项式来形成一条把所有主干点连接起来的平滑曲线,具有高收敛性、稳定性,且插值函数具有较好的光滑度。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例中的整体流程图;

图2是本发明实施例中原始站点、Grid、ERA5、NCEP2数据的日降水量空间分布图;

图3是本发明实施例中原始站点、Grid、ERA5、NCEP2数据插值到站点上的日均降水量示意图;

图4是本发明实施例中原始站点、Grid、ERA5、NCEP2数据的1-4区日均面雨量示意图;

图5是本发明实施例中Grid、ERA5、NCEP2三套格点数据插值到站点资料的RMSE空间分布图;

图6是本发明实施例中Grid、ERA5、NCEP2三套格点数据的1-4区RMSE区域平均示意图;

图7是本发明实施例中原始站点、Grid、ERA5、NCEP2数据的标准差空间分布图;

图8是本发明实施例中原始站点、Grid、ERA5、NCEP2数据到站点上的日降水标准差示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图1-8及实施例1-2,对本发明进行进一步详细说明。

实施例1:一种多源气象数据融合处理方法,如图1所示,具体由以下步骤实现。需要说明的是,本发明将原始站点和ERA5再分析数据融合后的数据统称为GRID数据;此外,本发明以各数据、参数后接STATION表示其数据源类型为由原站点直接获取的或通过对获取的原站点数据进行处理后得到;并且,GRID可以用G表示,STATION以S表示,以G源数据、G源参数、S源数据、S源参数表示其数据、参数类型。

步骤一:获取空间分辨率为0.25°的日降水量待校正G源数据以及日降水量观测S源数据。

空间分辨率为0.25°的日降水量待校正G源数据以及日降水量观测S源数据的获取过程具体为:获取原始站点数据和ERA5再分析数据;将原始站点数据、ERA5再分析数据融合处理后得到空间分辨率为0.25°的日降水量待校正G源数据;以及,对原始站点数据进行时间序列划分后得到日降水量观测S源数据。

步骤二:将空间分辨率为0.25°的日降水量待校正G源数据通过空间插值法处理后得到日降水量待校正S源数据,以及通过三次样条插值法处理后得到空间分辨率为0.1°的日降水量待校正G源数据。

空间分辨率为0.25°的日降水量待校正G源数据通过三次样条插值法处理后得到空间分辨率为0.1°的日降水量待校正G源数据的具体过程为:

从空间分辨率为0.25°的日降水量待校正G源数据选取插值区间[a,b],并在插值区间[a,b]中等间距的输入n个插值节点

将n个插值节点输入三次样条插值函数

且插值节点的左右两个子区域的数值、一阶导、二阶导分别相等,如:

此外,还满足:

这样解三次多项式所需的参数都可以通过解一系列的线性方程来求得。在本实施例中,i表示空间格点数,P表示气象要素。

步骤三:将日降水量观测S源数据与日降水量待校正S源数据计算差值后得到校正S源参数。

步骤四:将校正S源参数通过三次样条插值法处理后得到空间分辨率为0.1°的校正G源参数。

步骤五:将空间分辨率为0.1°的日降水量待校正G源数据与空间分辨率为0.1°的校正G源参数计算和值后得到空间分辨率为0.1°的日降水量G源数据。

步骤六:通过反距离权重法对空间分辨率为0.1°的日降水量G源数据进行边界修正,并依据原始站点数据、TRMM数据和地理信息数据对边界修正后的空间分辨率为0.1°的日降水量G源数据进行校正,得到校正融合数据。TRMM卫星是由美国NASA和日本NASDA共同研制的试验卫星,于1997年11月27日发射成功。

通过反距离权重法对空间分辨率为0.1°的日降水量G源数据进行边界修正的具体计算公式如下:

其中,Z表示所要估计点的气象要素,Z

实施例2:现以大渡河流域为例进行说明。大渡河流域内地形复杂,主要经过川西北高原、横断山地东北部和四川盆地西缘山地。

本实施例将分别对原始站点、Grid、ERA5和NCEP2数据的日均降水空间分布进行分析,通过对比评估四套数据在大渡河流域的适用性。Grid为本发明提供的数据,ERA5是由欧盟资助、ECMWF运营的哥白尼气候变化服务开发的最新一代再分析资料。美国国家环境预报中心(NCEP)和国家大气中心(NCAR)20世纪90年代相继发起了“NCEP/NCAR(N/NReanalysis,简称NCEP1)”和“NCEP/DOE AMIP-II Reanalysis (Reanalysis-2,简称NECP2)”两大计划。在当今有关气候变化的研究中,NCEP2再分析资料被作为诊断资料进行一系列分析和研究。尤其在一些全球,区域气候变化的模拟和预测中,常以NCEP2再分析资料作为气候模式的初始场和驱动场资料。

本实施例中采用以下评估方法:

(1)流域面雨量

式中,

由于降水观测站的离散性,不可能获得完全连续的点雨量场

(2)标准差

标准差在降水数据的评估中是最常使用的指标,可作为表征变量变化程度的统计量。标准差定义是各样本距平的算数平方根。它反映样本的平均变化程度,在本发明中用作能够反应降水变化程度的统计量。标准差公式如下:

式中,

(3)均方根误差

均方根误差(Root Mean Square Error,简称RMSE)是用来衡量观测值同真值之间的偏差。均方根误差公式如下:

式中,

(4)趋势计算方法

考虑到降水不同于气温等变量,可能会在部分区域变化幅度较大,因此本研究采用无参趋势估计方法(Theil-Sen趋势估计方法),趋势计算方法公式如下:

其中,Median表示中位数,∀表示穷举所有情况,

(5)皮尔逊相关系数

采用了皮尔逊相关系数来描述两个变量的线性相关,用

评价结果如下:

如图2所示,大渡河流域四套降水资料日均降水量的空间分布状况,从原始站点数据上可以发现大渡河流域日均降水在南部区域即3区和4区相对偏多,日均最大值可以达到7.1mm以上,而在中北部区域即1区和2区相对偏少,日均降水量最小值在2.9mm以下,整体上大渡河流域降水呈现出自北向南逐渐增加的趋势。ERA5降水资料在大渡河流域虽也能总体上表现出“北低南高”的降水趋势,但由于该套资料的分辨率仅为0.25°,因此在每个区域内的并不能完全展示实际降水的分布状况,尤其在1区、2区和4区内的降水量明显偏小,在3区内降水量比原始站点值又偏高;NCEP2数据同样由于空间分辨率(仅为2.5°)过低,不能完全展现出大渡河流域的降水实况,甚至不能完全覆盖流域范围。经过订正后的Grid数据,分辨率达到了0.1°,基本能完整的展示出大渡河流域的降水分布,总体上的降水分布和原始站点基本一致,同样呈现出北部多、南部少的分布状况,在每个区域内的降水分布和原始站点展示出的降水量基本吻合。

如图3所示,为进一步评估Grid、ERA5和NCEP2三套降水资料与原始站点数据具体差异情况,Grid、ERA5和NCEP2数据分别插值到原始站点后的日均降水量,并与原始站点数据进行对比。从各个分区来看,ERA5数据插值到站点后的降水量在3区和4区明显比原始站点数据偏小,而NCEP2数据插值到站点后的降水量在3区和4区明显比原始站点偏大;Grid数据与原始站点相比在3区和4区相较于ERA5和NCEP2数据明显更好。在1区内,Grid和ERA5插值后的降水量与原始站点数据比较接近,但ERA5数据在2区整体上偏高。此外,NCEP2插值后的数据在1区和2区均明显比原始数据偏高,多数站点日均降水都在5.18mm以上。综上,对于Grid数据而言,其插值到站点后的数据优于ERA5和NECP2数据,降水量量级与原始数据差距小,且整个区域内的降水量变化趋势与原始数据基本一致,在每个分区内的最大降水量和最小降水量与原始站点值相对接近。

如图4所示,为了进一步定量化站点数据与另外三套格点数据在各分区的接近程度,图4为大渡河流域全流域及不同区域的日均面雨量直方图。由图可知,Grid数据和原始站点数据最为接近。在四个区域内Grid数据的日均面雨量均比原始站点偏高,这可能是由于站点分布较为稀疏,导致Grid数据中包含相对多的ERA5数据信息。同时,ERA5数据则在1区—3区内日均面雨量同样比原始站点偏高,但是在南4区表现相反,明显比原始站点低;NCEP2数据在各个区域都比原始站点偏高。从单独每个区域内来看,在1区内,Grid、ERA5、NCEP2面雨量呈逐渐增大,其中Grid数据与原始站点数据最接近,NCEP2数据则差距最大。2区内与原始站点差距最大的为ERA5,但由于融合数据加入了站点信息,Grid数据与站点相比比ERA5更为接近。在3区内,ERA5数据得出的日均面雨量数值最低,且与站点最为接近,但从面雨量空间分布来看,ERA5面雨量在3区为“西少东多”,而实际站点为“西多东少”,因此Grid站点在3区与原始站点更为接近。在4区内,从图可知Grid数据与原始数据更接近。

如图5所示,以原始站点降水数据为基准,评估Grid、ERA5和NCEP2三套数据对大渡河流域降水的误差情况,三套数据日降水量的均方根误差(RMSE)结果显示:Grid数据与站点数据的误差最小。从各个分区来看,在1区和2区内,Grid数据绝大部分RMSE值很小,误差值在2.6以下;ERA5和NCEP2数据误差约在8.9—12.5之间,部分站点误差更高。在3区和4区内,Grid数据依然表现最好,很多站点的误差值都在2.6以下,ERA5和NCEP2数据的表现远弱于Grid数据,其绝大部分站点数据的误差值都在8.9—12.5之间,甚至部分站点误差值超过22以上。综上,从三套数据的RMSE来看,Grid数据的误差要明显小于ERA5和NCEP2数据,因此从误差角度来看Grid数据能更好的反应大渡河流域的实际降水情况。

如图6所示,若从1-4区的RMSE区域平均来看,Grid的优势更加明显。1区、2区和4区内Grid数据误差远低于其余两套数据。在3区内,Grid数据的误差虽有所增加,但相对于ERA5和NCEP2数据误差而言依然较小。因此在大渡河流域Grid降水资料的准确性更高。

如图7所示,标准差能够反映变量的平均变化程度。一个较大的标准差,代表变量变化幅度较大;一个较小的标准差,代表变化幅度较小。四套降水数据在大渡河流域的标准差空间分布情况的计算结果显示:首先从原始站点数据来看,位于北部区域的1区和2区绝大部分站点标准差在4.5以下,而位于南部区域的3区和4区标准差相对较高,部分站点标准差在10以上。这说明3区—4区降水的变化程度比1区—2区的变化程度大。将Grid、ERA5和NCEP2降水数据的标准差与原始站点数据进行对比,可以发现,Grid数据的标准差空间分布特征明显与原始站点数据更为接近,即在1区和2区内,Grid数据在标准差也基本均在4.5以下,在3区和4区内,标准差也较为接近,这说明各分区标准差与原始站点数据在不同分区内的标准差分布状况基本一致。ERA5数据在3区和4区内的标准差明显低于Grid数据,大部分在7.5以下,但部分区域标准差又较大。对于NCEP2数据而言,由于分辨率较低,并不能完全展示不同分区内的降水标准差,其中更多的降水细节被忽略。综上,从各套数据的标准差来看,Grid数据与原始站点数据最为接近,因此Grid数据优于ERA5和NCEP2数据。

如图8所示,若将Grid、ERA5和NCEP2数据的标准差插值到各站点上,计算结果显示,Grid数据在各站点上的标准差与原始站点数据的标准差基本一致,即“北部低、南部高”,北部的降水量变化较小,南部的降水量变化较大。从ERA5和NCEP2数据在各站点上的标准差来看,两者在整个大渡河流域的标准差均比较低,与原始站点数据的标准差存在较大差距,EAR5和NCEP2数据对大渡河流域的降水表现不如高分辨率的Grid数据。这也进一步说明了Grid数据与原始站点数据最为接近,Grid数据优于ERA5和NCEP2数据。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种多源气象数据融合处理方法、系统、终端及介质
  • 一种基于多源数据融合的燃气泄漏检测方法、系统、终端及计算机存储介质
技术分类

06120112363804