掌桥专利:专业的专利平台
掌桥专利
首页

一种降水预报后处理校正方法

文献发布时间:2024-04-18 19:58:30


一种降水预报后处理校正方法

技术领域

本发明属于水文预报技术领域,具体涉及一种降水预报后处理校正方法。

背景技术

降水是全球水循环的重要组成部分,并且是地表水文过程的基本驱动因素,如洪水和干旱。特别是洪水作为影响我国乃至全世界最主要、破坏性最严重的自然灾害,严重威胁着社会经济和社会安全。因此,准确可靠的降水预报对于洪水灾害预警和水资源管理至关重要。作为主要的降水预报方式,数值天气预报(NWP)可以提供2周内的预报降水,且预测技能不断提高。

然而,由于数值天气预报模型的缺陷和不准确的初始条件,原始降水预报存在系统偏差和欠离散/过度离散问题,不能直接用于水文预报等应用。统计后处理可用于消除原始预测中的系统偏差并量化不确定性。传统的统计后处理方法基于统计模型,包括参数方法和非参数方法。参数方法包括贝叶斯模型平均(BMA)、集成模型输出统计(EMOS)和贝叶斯联合概率(BJP)。非参数方法包含分位数回归、Ensemble copula coupling(ECC)和Schaakeshuffle(SSH)等。除上述方法外,机器学习算法因其强大的自学能力和处理非线性问题的优越性而被应用于预报降水后处理中。常用的机器学习模型包含k最近邻方法、多元自回归样条方法、支持向量机、多项对数线性模型和人工神经网络、卷积神经网络等。

降水不仅受到大尺度环流系统的影响(例如,西太平洋副热带高压和南亚高压),也受到当地地形和气象因素(例如,海拔、比湿度和风速风向)的影响,他们的相互作用共同决定了降水的位置、强度和持续时间。例如,2021年郑州极端暴雨(7·21)发生在异常强烈的西北太平洋副热带高压和伏牛山和太行山的地形阻塞作用下。此外,几天前的气象信息也会对当天降水产生影响。然而,上述后处理方法(例如BMA,EMOS和BJP)通常不能有效地将大尺度环流模式与局部时空信息相结合,在校正精度上有所欠缺。

发明内容

本发明的目的在于,提出一种降水预报后处理校正方法,以解决上述技术问题。

本发明是通过以下技术方案实现的:

本发明提出一种降水预报后处理校正方法,所述方法包括以下步骤:

步骤1、获取目标流域数据:获取目标流域内实测降水数据、预报降水数据和辅助变量数据,所述辅助变量数据包括500hPa位势高度、500hPa/850hPa/1000hPa的比湿、500hPa/850hPa/1000hPa的U向风和V向风、地面的U向风和V向风、大气压和高程数据;

步骤2、对数据进行预处理:采用双线性插值方法分别对预报降水数据、辅助变量数据的空间分辨率进行重采样使其与实测降水数据的空间分辨率一致;对预报降水数据、除高程数据外的其他辅助变量数据的时间分辨率分别进行整合使其与实测降水数据的时间分辨率一致;

步骤3、对目标流域进行大尺度环流模式分型:选择500hPa位势高度对目标流域每日的天气系统进行大尺度环流分型,构建SOM模型并设置模型参数,确定目标流域的最佳环流分型数目;

步骤4、对目标流域的预报降水数据进行后处理:构建CNN-LSTM模型对目标流域每种环流模式的预报降水数据分别进行偏差校正,并对校正结果进行精度评价。

进一步的是,步骤1所述实测降水数据选择CN05.1降水格点数据集,空间分辨率为25km,时间分辨率为1d;所述预报降水数据来自欧洲中期天气预报中心的未来15天预报降水,空间分辨率为50km,时间分辨率为6h;所述高程数据来自地理空间数据云,空间分辨率为30m;其他辅助变量数据来自欧洲中期天气预报中心,空间分辨率为50km,时间分辨率为6h。

进一步的是,步骤3所述对目标流域进行大尺度环流模式分型具体包括以下步骤:

步骤31、位势高度归一化:选择500hPa位势高度对目标流域每日的天气系统进行大尺度环流分型,考虑纬度差异造成的格点面积差异,对500hPa位势高度按纬度余弦的平方根加权并进行归一化,公式如下:

式中,为归一化位势高度;Z为500hPa位势高度;Z

步骤32、构建SOM模型并设置模型参数:选择Python miniSOM库构建SOM模型,模型输入为步骤31得到的归一化位势高度,模型输出为环流分型数目,并对SOM模型参数进行设置,模型参数包括Sigma、Learning_rate、Neighborhood_function、Random_seed、Train_batch;

步骤33、确定最佳环流分型数目:根据模型输出的环流分型数目结果,通过判断指标确定目标流域的最佳环流分型数目。

进一步的是,步骤33所述判断指标为量化误差和拓扑误差,所述量化误差为每个输入节点与其获胜节点之间的平均欧氏距离,所述拓扑误差为最佳匹配节点和次优匹配节点在节点映射中不相邻的所有数据样本的比例,两种判断指标值越小,表明分型效果越好。

进一步的是,步骤4所述对目标流域的预报降水数据进行后处理具体包括以下步骤:

步骤41、构建数据库:将目标流域的预报降水数据和辅助变量数据作为预报因子数据,对预报因子数据和实测降水数据分别进行归一化处理并进行拼合形成拼合数据,根据确定的目标流域的最佳环流分型数目对拼合数据进行分类,分别构建对应于每种环流模式的数据库,以对每种环流模式的预报降水进行偏差校正;

步骤42、构建CNN模型:构建的CNN模型包括一个输入层、两个卷积层、一个池化层和一个展平层,输入层考虑空间信息,对于目标流域内的每个格网,提取以它为中心的5×5子格网数据作为输入层的输入;卷积层是CNN模型的核心层,其作用是提取图像信息,其中卷积核大小根据实际情况来确定;池化层之后是展平层,其作用是将池化层数据转换为单个向量以作为LSTM模型的输入;

步骤43、构建LSTM模型:LSTM模型与传统RNN模型相比,增加了四种结构:单元状态、遗忘门、输入门和输出门,所述单元状态用于存储过去信息,所述遗忘门用于确定前一时刻的单元状态保留到当前时间的程度,所述输入门决定单元状态中需要更新的信息,所述输出门决定需要输出的信息;相应公式如下:

f

i

o

h

c

c

式中,f

LSTM模型包括一个输入层,一个双向LSTM层,一个全连接层以及一个输出层,输入数据来自CNN模型的输出,考虑先前气象信息对降水的影响,LSTM模型的输入不仅包括当天的数据,还包括2d前的数据;双向LSTM层用于处理序列数据;全连接层用于将LSTM的输出映射到所需的输出空间;输出层则为预报降水校正结果;

步骤44、模型训练与验证:将步骤41构建好的数据库随机分为四组,并选择一组数据作为验证集,而其他数据则作为训练集来训练CNN-LSTM模型,并将验证集用于验证训练后的模型,采用四折交叉验证法,即将此步骤重复四次,直到所有数据组都用于验证,以避免模型对某一训练集过拟合;

步骤45、模型优化:选择Python PyTorch库作为CNN-LSTM的框架,并选择NVIDIAA5000 GPU来加速模型训练;模型超参数通过训练集由试错法确定,并使用Adam算法进行优化;

步骤46、结果评价:选择均方根误差RMSE,相关系数CC以及相对偏差RB三项指标来对目标流域的预报降水的校正效果进行精度评价,各指标计算公式如下:

(1)均方根误差RMSE:

(2)相关系数CC:

(3)相对偏差RB:

式中,P

进一步的是,步骤45所述模型超参数包括学习率、模型一次训练所选取的样本数、模型针对完整训练集重复训练的次数。

本发明的有益效果是:本发明所述的降水预报后处理校正方法,通过将大尺度环流分型与时空深度模型相结合,对降水预报进行后处理校正。本发明所述方法同时考虑了环流分型以及时间、空间信息对降水的影响,不仅可以有效捕捉西太平洋副热带高压的西移与北扩,而且显著提高了降水预报的准确性,为延长水文预报遇见期的同时保证预报精度提供技术支撑。

下面结合附图和实施例对本发明作进一步详细说明。

附图说明

图1为实施例一所述方法流程示意图;

图2为太湖流域的不同预报降水后处理方法的精度评价结果示意图。

具体实施方式

实施例一

本实施例提出一种降水预报后处理校正方法,如图1所示,所述方法包括以下步骤:

步骤1、获取目标流域数据:以太湖流域为目标流域,获取太湖流域内实测降水数据、预报降水数据和辅助变量数据。

实测降水数据选择CN05.1降水格点数据集,该数据集使用中国境内2400多个台站的观测资料,并由气候场和距平场分别插值后叠加得到,空间分辨率为25km,时间分辨率为1d。预报降水数据来自欧洲中期天气预报中心的未来15天预报降水,空间分辨率为50km,时间分辨率为6h。辅助变量数据包括500hPa位势高度、500hPa/850hPa/1000hPa的比湿、500hPa/850hPa/1000hPa的U向风和V向风、地面(10m处)的U向风和V向风、大气压和高程数据,其中高程数据来自地理空间数据云,空间分辨率为30m;其他辅助变量数据来自欧洲中期天气预报中心,空间分辨率为50km,时间分辨率为6h;其中,500hPa位势高度用于环流分型,不同位势高度的比湿能够反映水汽的可用性,大气压和风向能够反映水汽的传输,高程能够反映地形的变化。

步骤2、对数据进行预处理:考虑到目标流域的实测降水数据与预报降水数据、辅助变量数据的空间分辨率和时间分辨率不一致,因此采用双线性插值方法分别对预报降水数据、辅助变量数据的空间分辨率进行重采样使其与实测降水数据的空间分辨率一致,均为25km;对预报降水数据、除高程数据外的其他辅助变量数据的时间分辨率分别进行累计叠加整合成日尺度,使其与实测降水数据的时间分辨率一致,均为1d。

步骤3、对目标流域进行大尺度环流模式分型:选择500hPa位势高度对目标流域每日的天气系统进行大尺度环流分型,构建SOM(自组织图)模型并设置模型参数,确定目标流域的最佳环流分型数目。

具体包括以下步骤:

步骤31、位势高度归一化:选择500hPa位势高度对太湖流域每日的天气系统进行大尺度环流分型,选择500hPa位势高度进行环流分型是因为它为诊断低层大气中的天气状况提供了有价值的信息,同时它在控制天气动态方面发挥着核心作用。此外,考虑纬度差异造成的格点面积差异,对500hPa位势高度按纬度余弦的平方根加权并进行归一化,公式如下:

式中,为归一化位势高度;Z为500hPa位势高度;Z

步骤32、构建SOM模型并设置模型参数:选择Python miniSOM库构建SOM模型,模型输入为步骤31得到的归一化位势高度,模型输出为环流分型数目。为更好捕捉大尺度环流对降水的影响,500hPa位势高度数据不仅要覆盖太湖流域,也须向该流域四周扩展,即以太湖流域为中心的3×3的500hPa位势高度数据作为SOM模型的输入。另外,需要对SOM模型参数进行设置,模型参数包括Sigma、Learning_rate、Neighborhood_function、Random_seed、Train_batch,在本实施例中,其值分别设置为0.5、0.05、Gaussian、5、10000。

步骤33、确定最佳环流分型数目:模型输出为环流分型数目,根据模型输出结果,通过判断指标,进一步确定太湖流域的最佳环流分型数目。分型数目选择主要与天气模态数目有关,即与当地的天气类型及其复杂程度有关,分型数量少,则不能完全反映区域所有的天气状态,分型数量太大,则会使天气分型结果的差异很小,而不具有代表性。确定最佳环流分型数目的判断指标主要为量化误差和拓扑误差,其中量化误差为每个输入节点与其获胜节点之间的平均欧氏距离,表示映射的变异性;拓扑误差为最佳匹配节点和次优匹配节点在节点映射中不相邻的所有数据样本的比例;两种判断指标值越小,表明分型效果越好。本实施例中,SOM模型输出的环流分型数目为4、6、8、10、12、14、16,经对比分析,当环流分型数目为6时,量化误差和拓扑误差最小,因此太湖流域的最佳环流分型数目为6,即6种环流系统对太湖流域是最佳的。

步骤4、对目标流域的预报降水数据进行后处理:构建CNN-LSTM(时空深度)模型对目标流域每种环流模式的预报降水数据分别进行偏差校正,并对校正结果进行精度评价。

具体包括以下步骤:

步骤41、构建数据库:将太湖流域的预报降水数据和辅助变量数据作为预报因子数据,对预报因子数据和实测降水数据分别进行归一化处理以降低不同维度的影响,并将归一化处理后的预报因子数据和实测降水数据进行拼合形成拼合数据,根据步骤3确定的太湖流域的最佳环流分型数目对拼合数据进行分类,分别构建对应于每种环流模式的数据库,以对每种环流模式的预报降水进行偏差校正。

步骤42、构建CNN(卷积神经网络)模型:构建的CNN模型包括一个输入层、两个卷积层、一个池化层和一个展平层,输入层需要考虑空间信息,因此对于太湖流域内的每个格网,提取以它为中心的5×5子格网数据作为输入层的输入;卷积层是CNN模型的核心,其作用是提取图像信息,需要根据实际情况确定卷积核大小;池化层之后是展平层,其作用是将这些池化层数据转换为单个向量以作为LSTM模型的输入。

步骤43、构建LSTM(长短期记忆神经网络)模型:与传统的RNN(循环神经网络)模型相比,LSTM模型增加了四种结构:单元状态、遗忘门、输入门和输出门,单元状态用于存储过去信息,遗忘门用于确定前一时刻的单元状态保留到当前时间的程度,输入门决定单元状态中需要更新的信息,输出门决定需要输出的信息;相应公式如下:

f

i

o

h

c

c

式中,f

LSTM模型包括一个输入层,一个双向LSTM层,一个全连接层以及一个输出层,输入数据来自CNN模型的输出,考虑到先前气象信息对降水的影响,LSTM模型的输入不仅包括当天的数据,还包括2d前的数据;双向LSTM层用于处理序列数据;全连接层用于将LSTM的输出映射到所需的输出空间;输出层则为预报降水校正结果。

步骤44、模型训练与验证:与传统方法将80%数据作为训练集,20%作为验证集不同,本实施例所述方法将步骤41构建好的数据库随机分为四组,并选择一组数据作为验证集,而其他数据则作为训练集来训练CNN-LSTM模型,并将验证集用于验证训练后的模型。采用四折交叉验证法,即将此步骤重复四次,直到所有数据组都用于验证,以避免模型对某一训练集过拟合。

步骤45、模型优化:选择Python PyTorch库作为CNN-LSTM的框架,并选择NVIDIAA5000 GPU(图形处理单元)来加速模型训练。模型超参数,例如学习率、模型一次训练所选取的样本数、模型针对完整训练集重复训练的次数等,通过训练集由试错法确定,并使用Adam算法进行优化。

步骤46、结果评价:选择均方根误差RMSE,相关系数CC以及相对偏差RB三项指标来对太湖流域的预报降水的校正效果进行精度评价,各指标计算公式如下:

(1)均方根误差RMSE:

(2)相关系数CC:

(3)相对偏差RB:

式中,P

为说明上述方法的有效性,本实施例还采用了另外三种后处理方法与本实施例所述方法进行对比分析。第一种方法是单独采用CNN模型,该方法仅考虑空间信息对降水的影响,即模型输入不包含2d前的数据。第二种方法是单独采用LSTM模型,该方法仅考虑时间信息对降水的影响,即太湖流域内的每个格网,不再提取以它为中心的5×5子格网数据作为LSTM模型的输入。第三种方法是采用CNN-LSTM模型,但是该方法没有考虑环流分型对降水的影响,即所有预报因子统一构建CNN-LSTM模型。第四种方法是采用本实施例所述方法,即采用SOM-CNN-LSTM模型。太湖流域的预报降水后处理结果精度评价结果如图2所示。可以看出,和原始预报降水(Raw)相比,四种后处理方法均能有效提升预报精度。而采用本实施例所述的预报降水后处理校正方法的校正效果最好(相关系数CC最高,均方根误差RMSE和相对误差RB均最小),说明本实施例所述方法能够有效提高降水预报精度。

最后应说明的是,以上所述仅用以说明本发明的技术方案而非限制,尽管参照较佳布置方案对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

相关技术
  • 一种水文集合预报后处理方法
  • 基于集合预报的降水预报偏差校正方法
  • 基于空间多尺度卷积神经网络的中期降水预报后处理订正方法
技术分类

06120116502048