掌桥专利:专业的专利平台
掌桥专利
首页

一种积雪深度融合方法

文献发布时间:2023-06-19 16:11:11



技术领域

本发明涉及航空航天领域,特别涉及一种积雪深度融合方法。

背景技术

积雪作为重要的地球表层要素,在全球陆地生态系统、气候变化、水循环和能量循环中起着重要作用。积雪存储着丰富的淡水资源,雪融水成为干旱-半干旱地区地表径流和地下水的重要补给水源。积雪的异常变化也会引发雪崩、融雪洪水、风吹雪等自然灾害,对区域生态、经济和社会的可持续发展产生重要的影响。积雪深度(雪深)数据提供积雪覆盖的空间分布信息及物质能量信息,是表征积雪特征的重要参数之一,也是研究积雪气候效应、流域水量平衡和融雪径流模拟以及监测和评估雪灾等级的重要参数。

现有技术正文(重点)

当前,大多数的研究是通过对多个积雪深度数据进行精度评估,然后经过误差统计分析,掌握各数据在不同地理环境因素下的表现,选择其中一个或几个积雪深度数据进行加权平均,最终获得时空连续的积雪深度数据。具体过程如下:

(1)通过爬虫技术获得目前已公开的积雪深度数据,然后对搜集到的积雪深度数据进行预处理,获得时空一致的积雪深度数据集;

(2)依据地面观测站点的经纬度,获取各积雪深度数据的像元值;

(3)评估各数据在不同地理位置的观测精度

(4)建立不同地理环境下积雪深度数据加权平均融合模型,然后基于此模型对研究区范围内的不同空间位置进行计算。

发明内容

本发明的目的是解决现有技术中存在的上述问题。

为实现上述目的,本发明提供了一种积雪深度融合方法,包括:获取第一区域的多源数据,所述多源数据包括:积雪深度的初始数据和影响积雪深度的影响数据;基于所述多源数据,提取所述第一区域的目标区域的目标初始数据和目标影响数据;获取所述目标区域的空间地理位置数据,将所述目标区域的所述目标初始数据、所述目标影响数据和所述空间地理位置数据组合合为目标初始数据集;获取融合模型,将所述目标初始数据集输入所述融合模型中以获得时空连续的目标积雪深度估计值,其中,所述融合模型为通过所述目标初始数据集的训练和精度验证得到的。

本发明方法不仅可以随着积雪深度数据的增加而拓展,而且还可以准确对现有的积雪深度数据进行有效融合,成为了一种减少开销又便捷高效提高积雪深度估算精度的方法,此外,在融合估算过程中无需人工参与,完全实现了自动化估算。

附图说明

图1为现有技术的基于加权平均的积雪深度融合技术流程图;

图2为本发明实施例的积雪深度融合方法的流程图;

图3为本发明实施例的积雪深度融合方法的评估结果。

具体实施方式

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

现有技术的方式如图1所示,大多数的研究是通过对多个积雪深度数据进行精度评估,然后经过误差统计分析,掌握各数据在不同地理环境因素下的表现,选择其中一个或几个积雪深度数据进行加权平均,最终获得时空连续的积雪深度数据。具体过程如下:

(1)通过爬虫技术获得目前已公开的积雪深度数据,然后对搜集到的积雪深度数据进行预处理,获得时空一致的积雪深度数据集;

(2)依据地面观测站点的经纬度,获取各积雪深度数据的像元值;

(3)评估各数据在不同地理位置的观测精度

(4)建立不同地理环境下积雪深度数据加权平均融合模型,然后基于此模型对研究区范围内的不同空间位置进行计算。

而现有技术的方式是具有一定的技术缺陷的:

(1)基于加权平均的积雪深度融合技术以积雪深度的评估结果为基础,并基于此评估结果建立决策树,然后针对每颗决策树建立选取准则或分配不同积雪深度数据所对应的融合权重值,通过对研究区的地理环境特征进行决策分类,最后获得一个时空连续的积雪深度数据。该方法的结果取决于二叉树构建的精细程度,然而在实际应用中,很难全面地考虑影响因素,而且各影响因素之间也是相互关联的,因此决策树很难精确地建立。

(2)该方法的可拓展性不高,如果有新的积雪深度数据或模型,需要重新对添加的积雪深度数据进行精度评估和构建新的决策树。

(3)该方法对每颗决策树的处理仅是简单的加权平均,往往不能准确的构建出输入的积雪深度数据与目标输出积雪深度的关系模型,如非线性模型。

图2为本发明实施例的积雪深度融合方法的流程图。根据本发明实施一种积雪深度融合方法,包括:

S100:获取第一区域的多源数据,多源数据包括:积雪深度的初始数据和影响积雪深度的影响数据。

在该步骤中,获取的第一区域的积雪深度的初始数据,第一区域可以全球各地的位置,即为获取目前国内外主流公开的积雪深度数据,主要包括 WESTDC、MERRA2、ERA-Interm和CMC数据。而对于获取的对积雪深度具有干扰的影响数据,可以为土地覆盖类型数据、积雪类型、森林覆盖度数据和地表粗糙度数据。

在本发明的一些实施例中,对于积雪深度的获取,可以通过Python程序全自动获取,从而可以无需人工参与,自动对信息获取,方便快捷,提升效率。

进一步地,在将目标区域的目标初始数据、目标影响数据和空间地理位置数据融合为目标初始数据集之前,还需要将目标初始数据进行重投影变换以获得变换初始数据,并将目标影响数据与变换初始数据进行时空匹配。

具体地,将收集到的积雪深度的初始数据进行重投影变换,统一变换为 WGS84投影,并采用最近临近法将收集到积雪数据的初始数据进行重采样为 0.25°×0.25°。此外,将收集到地形+环境因子数据等影响数据采用临近差值法将数据与已有的积雪深度数据进行时空匹配,空间分辨率为0.25°×0.25°,投影坐标系为WGS84。

可以理解的是,待融合的积雪深度数据和影响数据大多数为栅格数据,而收集到的积雪深度数据和影响数据的初始分辨率不一致,为了便于后续的数据融合,所以将所有数据的分辨率统一为0.25°×0.25°,以保证栅格的统一,防止后续的融合过程中数据无法准确匹配。

进一步地,在对所有获取的初始数据和影响数据进行重投影和重采样后,还需要将目标区域的目标初始数据与目标影响数据的缺省值剔除。

在全球各地对积雪深度的数据进行获取的时候,会由于某些原因而无法获取到相应的观测值,因此在数据记录中,会采用唯一值对其进行标识,这部分数据统称为缺省值。

由此,在本发明实施例的方法实际实施过程中,需要对该部分数据进行剔除,以保证后续计算的正确性。

S200:基于多源数据,提取第一区域的目标区域的目标初始数据和目标影响数据;

具体的,由上文可知,通过自动获取方法已经获取了世界全球的公开的积雪深度的初始数据和影响数据,也就是第一区域的全部数据。而作为本发明的实施例的积雪深度融合方法需要对目标区域的位置的积雪深度数据进行计算,因此可以从多源数据中提取出关于目标区域的积雪深度的目标初始数据和目标影响数据。

提取的积雪深度的目标初始数据为WESTDC、MERRA2、ERA-Interm和 CMC数据,目标影响数据为土地覆盖类型、积雪类型数据、DEM高程数据和地表粗糙度数据。

S300:获取目标区域的空间地理位置数据,将目标区域的目标初始数据、目标影响数据和空间地理位置数据组合为目标初始数据集。

在该步骤中,目标区域即为所要进行积雪深度计算的区域,获取到对应的位置信息,即空间地理位置数据,进而与该位置对应的目标初始数据和目标影响数据结合,可以获得该位置的数据的目标初始数据集。

其中,对目标初始数据、目标影响数据和空间地理位置数据组合为目标初始数据集的具体步骤为:

先分别获取目标区域的目标初始数据和目标影响数据的第一像元值和第二像元值,也就是说,分别获取目标初始数据的像元值,即第一像元值,获取目标影响数据的像元值,即第二像元值。

换言之,上文的积雪深度的初始数据来自世界各地,而不同位置获取的初始数据是不同的,因此,空间地理位置数据即为获取到的积雪深度的初始数据的对应位置信息。

例如,所有的初始数据可以来自全球的气象站,气象站点的空间位置的经纬度即为空间地理位置数据。经过时空匹配,提取对应位置的积雪深度的目标初始数据的像元值。如前文所说,积雪深度的初始数据可以为WESTDC、 MERRA2、ERA-Interm和CMC数据。同时,还可以通过时空匹配获取与空间地理位置数据对应的位置的地形和环境数据,也就是前文所说的目标影响数据,具体可以包括:土地覆盖类型、积雪类型数据、DEM高程数据和地表粗糙度数据的像元值。

进一步地,将获取的空间地理位置数据与空间地理位置数据对应的目标区域所匹配的积雪深度的目标初始数据和目标影响数据的像元值合成为一个数据集。

S400:获取融合模型,将目标初始数据集输入融合模型中以获得时空连续的目标积雪深度估计值,其中,融合模型为通过目标初始数据集的训练和精度验证得到的。

将第一像元值、第二像元值和空间地理位置数据融合为目标初始数据集,由此可以形成一个数据集,作为原始数据输入模型之中,以获取到目标区域的时空连续的积雪深度估计值。

进一步地,在本发明实施例的方法中,所使用的融合模型为随机森林模型,随机森林模型包括多个随机树模型,将目标初始数据集的数据分别输入多个随机树模型以获得多个积雪深度估计值。

本领域技术人员可以理解的是,随机森林模型由多个随机树模型组成,因此,将上述目标初始数据集中的数据分别输入多个随机树模型中,可以获取多个积雪深度估计值。

而使用的随机森林模型属于集成学习的一种组合分类算法,抗过拟合能力比较强,此外,随机森林模型采用多个决策树分别拟合出不同地理环境下的回归模型,这能够自适应地解决不同地理环境下回归模型不一致的问题。如需增添新的输入参量,只需将该参量整理为相应的输入格式,导入到已训练好的随机森林模型中即可,它将自动更新,无需人工干预和选择。

同时,为了降低误差,将多个积雪深度估计值取平均数作为目标积雪深度估计值。由此可以保证通过使用随机森力模型可以获得较为准确的积雪深度估计值,即目标积雪深度估计值。其中,随机树模型计算积雪深度估计值的公式如下:

SD=f(SD

其中,SD为积雪深度估计值,f()为随机树模型的相应函数表达,SD

在本发明实施例的积雪深度融合方法中,所使用的随机树模型在使用时,直接使用可能会出现误差,从而通过将目标初始数据集输入随机森林模型中,以使最终得到的更加完善,同时,可以保证最终获取的模型更加稳健、精确,因此对于随机森林模型需要进行训练和验证。

可以通过将获取的目标初始数据集的数据进行划分为两部分,一部分作为训练和构建数据集,一部分作为验证数据集来验证模型的精度。

具体的,可以通过“十折”交叉验证的方法将目标初始数据集的数据划分,例如:可以利用随机抽样方法从目标初始数据集中随机抽取70%的数据作为训练数据集,从目标初始数据集中随机抽取30%的数据为验证数据集。

例如,将训练数据集输入随机森林模型中,以更新随机森林模型的参数并获得学习后的随机森林模型,而学习的方式,是将训练数据集按照上述公式进行计算,从而可以是随机森林模型进行学习和自动更新。

在本发明的一个实施例中,在对随机森林模型的随机树模型的建立,可以根据网格搜索法对随机树的数量进行寻优,得到随机森林模型的预测精度与随机树的个数变化曲线。其次,可以发现随机森林模型的预测误差随着所构建的随机树的数量增加而降低,当树的数量在50时趋于平稳,说明构建50颗树足以达到较高的预测精度,同比200颗树的模型在一定程度上减少了计算量,因此将树的数量设置为50。

进而,将验证数据集输入学习后的随机森林模型中,可以通过采用定量精度评价指标,包括相关系数(Correlation coefficient,R)和均方根误差(Root Mean SquareError,RMSE)对本方法所估算的积雪深度的精度进行定量化。

其中,对于相关系数的计算通过如下公式实现:

其中,SD

对于均方根误差的计算,通过如下公式实现,公式如下:

其中,SD

由此,获得了训练和验证后精度较高的随机森林模型,从而可以将该模型应用到目标区域的积雪深度的计算,从而获得时空连续的目标积雪深度估计值。

如图3所示,可以看出,图3中几个附图,Num表示样本数,R表示样本系数,RMSE表示相关系数,坐标系的横坐标表示地面观测值,纵坐标表示估算值。

图3中的图(a)表示随机森林融合之后的计算结果,可以看出,所有数据都在1:1的线附近分散,说明误差较小,而图3中的图(b)-图(f)可以看出,所有的点都是无规则的分散,相对来说,误差较大。

本发明并不限于此,本发明的输入参数,例如:积雪深度的初始数据和影响数据,可以随着公开的积雪深度的初始数据的种类的增加可以添加,此外影响数据的种类可以随着研究的深入,可以引入更多的辅助因子参数。

随着空天地立体观测技术的迅速发展,越来越多的卫星传感器发射升空,遥感反演算法以及模型模拟技术也都不断改进和完善,也将催生更多的积雪深度数据不断涌现,数据发布平台会接收到来自不同科研机构采用不同算法、模型或传感器所生产的海量时空数据。但与此同时也伴随着诸多问题,如数据量大、来源广以及质量良秀不齐等问题。

本发明通过将目前现有的积雪深度数据进行融合,综合不同来源观测资料的优势,实现各种资料源的优势互补,进而提高数据质量,是目前提高现有数据利用率和高效地改进目前积雪深度估算精度的方法,弥补气候模型、灾害监测中所缺乏的高精度积雪深度数据,为水资源评估和管理、灾害监测和预报以及气候研究等方面提供可靠的基础数据源。

总而言之,如图2所示,本发明实施例的积雪深度融合方法,首先将收集到的多源数据进行预处理。预处理主要包括投影转换、空间重采样、图像裁剪、时空匹配及缺省值剔除,转换为统一时空尺度的数据集,形成样本数据集,然后将样本数据集随机地划分为训练数据集和测试数据集两部分,即第一数据组和第二数据组。并将训练数据集、时间、地理空间信息以及其他辅助信息对随机森林模型进行训练学习,最后将构建的随机森林融合模型对积雪深度进行估算。

换言之,本发明实施例的积雪深度融合方法,以现有的随机森林机器学习算法为基础模型,采用目前主流的积雪深度数据(WESTDC、MERRA2、ERA- Interm和CMC数据),结合中国气象站观测的逐日的积雪深度,以及引入了美国航空航天局SRTM数字高程模型(DEM)数据、土地覆盖类型数据、积雪类型数据和森林覆盖率数据,进行数据预处理及时空匹配处理,构建样本数据集,通过建立回归关系模型,估算逐日积雪深度,将卫星反演积雪深度、模型模拟积雪深度、加拿大再分析积雪深度数据与中国气象站点插值积雪深度进行数据融合,实现高精度长时间序列积雪深度估算模型的建立。

本发明实施例的积雪深度融合方法,本方法基于随机森林模型通过对已有的积雪深度数据进行学习和训练,可以自动化建立不同地理环境下的积雪深度融合决策树,借助随机森林机器学习模型,将目前已有的主流积雪深度数据有效地集成一起,成为了一种减少开销又便捷高效的方法,通过继承各数据的优点进而提高数据质量。

以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120114738904