掌桥专利:专业的专利平台
掌桥专利
首页

一种考虑极端径流的径流预报模型及其构建方法和系统

文献发布时间:2024-04-18 20:01:30


一种考虑极端径流的径流预报模型及其构建方法和系统

技术领域

本发明属于水文预报技术领域,更具体地,涉及一种考虑极端径流的径流预报模型及其构建方法和系统。

背景技术

水资源是人类生存、发展中必不可缺的重要资源之一,高精度的径流预报对于水资源的规划管理、集约利用具有重要的参考价值。然而,准确的长期径流预报一直以来是本领域的科研高地,一方面是由于径流的变化为诸多因素共同耦合作用下的结果,其机理极其复杂;另一方面是目前所掌握的技术与预报手段还存在一定的局限性,不能清晰刻画各要素与径流的数学物理关系。因此,集成挖掘径流驱动机制并对其进行长期预报的深度学习模型显得尤为重要。

径流是全球水循环中最为关键的过程之一。目前,气候和人类活动被认为是影响径流变化的主要因素。人类活动量化较为复杂,且并没有统一的认知,所以,当前绝大多数径流预报的研究中多选取气候要素作为径流预报系统中的自变量。对于被选取的气候变量,以流域实测气象资料为主。该类变量虽然被广泛使用,但也存在着各区域资料长度不一、无资料地区无法使用等问题,遥相关气候因子指数可以很好地解决该问题,并且长期径流的产生和变化往往与这类全球气候指数的关系更为密切。从成因上分析,遥相关气候因子更适合径流的长期预报。

长期径流的形成机理复杂,难以直接使用数学物理关系对其进行描述。深度学习模型是一种可以无需考虑作用过程,直接生成结果的黑箱模型,近年来,该技术被广泛应用于径流预报领域;但其也存在着对长期径流预测模型精度不高,对极端径流预报偏差较大等问题。

发明内容

针对现有技术的以上缺陷或改进需求,本发明提供了一种考虑极端径流的径流预报模型及其构建方法和系统,其目的在于,有效兼顾长期径流预报和未来极端洪水预报,提高预报准确性和可靠性。

为实现上述目的,按照本发明的第一方面,提出了一种考虑极端径流的径流预报模型构建方法,包括如下步骤:

S1、采集并预处理研究区域的历史水文气象数据和遥相关气候因子数据,得到多个预报因子,形成预报因子集;

S2、确定各预报因子的贡献度,并初筛得到贡献度最高的N个预报因子;将该N个预报因子按贡献度从高到低排序,得到关键预报因子集;

S3、将所述关键预报因子集中的前N个、前N-1个、…、前1个预报因子分别输入初步预报模型进行训练和测试,从而得到N个预报方案,每个预报方案包括输入的预报因子和对应训练好的初步预报模型;

对于N个预报方案,分别计算其测试时的纳什效率系数,并选取纳什效率系数最高的一组预报方案作为常规模型;

同时,对于N个预报方案,在超过径流极端阈值的范围内,分别对测试时初步预报模型输出的预报径流和实际径流进行拟合,选取拟合最佳的一组预报方案作为极端值模型;

S4、将常规模型和极端值模型耦合,得到综合的径流预报模型。

作为进一步优选的,通过特征初筛模型确定各预报因子的贡献度;所述特征初筛模型包括XGBoost模型和SHAP模型,其中,XGBoost模型用于根据预报因子预测径流,该XGBoost模型通过所述预报因子集训练而成;SHAP模型用于根据XGBoost模型输出的径流预测结果计算各预报因子对径流预测结果的贡献度。

作为进一步优选的,所述初步预报模型基于BO-BiLSTM模型构建而成。

作为进一步优选的,所述BO-BiLSTM模型内的优化参数包括L2正则项。

作为进一步优选的,所述径流极端阈值的确定方法为:计算历史径流数据的均值和标准差,根据3σ原则,取均值与3倍标准差之和为径流极端阈值。

作为进一步优选的,所述历史水文气象数据包括月降水量、月蒸散量、月径流量;所述遥相关气候因子数据包括大气环流因子、海温指数和其他相关指数。

作为进一步优选的,所述预处理包括:根据历史水文气象数据和遥相关气候因子数据得到的初始预报因子,根据时间上的缺失情况,对预报因子进行删除和插补;然后对预报因子进行时滞处理,形成预报因子集。

按照本发明的第二方面,提供了一种考虑极端径流的径流预报模型构建系统,包括处理器,所述处理器用于执行上述考虑极端径流的径流预报模型构建方法。

按照本发明的第三方面,提供了一种径流预报模型,其特征在于,采用上述考虑极端径流的径流预报模型构建方法构建而成。

按照本发明的第四方面,提供了一种基于上述径流预报模型的径流预报方法,其特征在于,包括如下步骤:实时获取研究区域的各预报因子,将对应的预报因子分别输入常规模型和极端值模型,得到常规径流数据和极端径流数据。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要具备以下的技术优点:

1.本发明按贡献度对预报因子进行初筛,进而采用不同标准构建常规模型和极端值模型,得到综合的径流预报模型,可有效兼顾实时的长期径流预报和未来极端洪水预报,提高预报准确性和可靠性,适用范围广。

2.本发明通过将XGBoost模型和SHAP模型结合,以获取各预报因子对径流预报结果的贡献度,从而筛选出贡献度较高的预报因子进行后续分析,可提高模型构建效率和最终预报模型的准确性。

3.本发明模型是基于历史流域实测资料与遥相关气候因子进行径流预报,完全不涉及未来信息,可用于实际长期月预报。

附图说明

图1为本发明实施例考虑极端径流的径流预报模型构建方法流程图;

图2为本发明实施例预报因子驱动图;

图3为本发明实施例实测-预报流量过程线。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明实施例提供的一种考虑极端径流的径流预报模型构建方法,如图1所示,包括如下步骤:

S1、采集并预处理研究区域的历史水文气象数据、遥相关气候因子数据,得到多个预报因子,形成预报因子集;预报因子集根据历史水文气象数据的时间序列长度划分为训练期与测试期。

进一步的,预处理过程包括删除缺失较多的预报因子、插补缺失较少的预报因子,并对预报因子进行时滞处理,形成预报因子集。

进一步的,历史水文气象数据包括月降水量、月蒸散量、月径流量;遥相关气候因子数据包括大气环流因子、海温指数和其他相关指数。

进一步的,时滞处理后的预报因子集包括1~3个月时滞的月降水量、月蒸散量、月径流量,1~12个月时滞的遥相关气候因子集,输出为当月径流量。

S2、通过特征初筛模型确定各预报因子的贡献度,并初筛得到贡献度最高的N个预报因子(优选N≥20);将该N个预报因子按贡献度从高到低排序,得到关键预报因子集。

进一步的,特征初筛模型基于XGBoost-SHAP模型构建,其中,XGBoost模型用于根据预报因子预测径流,SHAP模型用于计算各预报因子对径流预测结果的贡献度。

XGBoost模型主要原理如下:

式中:

SHAP模型主要原理如下:

式中:F为样本x

进一步的,XGBoost模型通过预报因子集进行预训练,并采用十折交叉验证对模型进行参数优选。

S3、将关键预报因子集中的前N个、前N-1个、…、前1个预报因子分别输入初步预报模型进行训练和测试;可以理解为,通过S2筛选出的预报因子分别进行N次训练和测试,每次按照贡献度由小到大的顺序对预报因子进行逐一剔除;即第一次为输入全部N个预报因子,第二次剔除贡献度最小的预报因子,输入剩下的N-1个预报因子,以此类推,第N次仅输入前1个,即贡献度最大的预报因子;从而得到N组训练和测试结果(预报方案),每组有选定输入的预报因子和对应的训练好的初步预报模型。

对于上述N组训练和测试结果,分别进行两种判断:

(1)以测试期纳什效率系数NSE为标准,选出测试期NSE最高的一组预报方案作为常规模型。

(2)在超过径流极端阈值的范围内,对初步预报模型输出的预报径流和实际径流进行拟合,选取拟合最佳的一组预报方案作为极端值模型。

进一步的,径流极端阈值的确定方法为:基于历史径流数据,根据3σ原则,取均值与3倍标准差之和为径流极端阈值。

进一步的,初步预报模型基于BO-BiLSTM模型构建,该BO-BiLSTM模型通过贝叶斯优化算法(BO)优化BiLSTM模型超参数。

进一步的,对BO-BiLSTM模型进行改进,改进方式为在BiLSTM模型的待优化超参数中增加L2正则项。在本实施例中,BO-BiLSTM模型的各超参数名称及取值范围如表1。

表1待优化参数取值范围

S4、将常规模型和极端值模型耦合,得到综合的径流预报模型。

S5、利用所形成的径流预报模型及方案进行预报,并进行模型精度评价;引入高流量值评价指标KGE,各评价指标计算方法如下:

式中:Q

通过上述方法得到的径流预报模型进行径流预报时,包括:实时获取研究区域的各预报因子,将对应的预报因子分别输入常规模型和极端值模型,得到常规径流数据和极端径流数据。当得到的极端径流数据小于径流极端阈值时,以常规径流数据作为径流预报结果;当得到的极端径流数据不小于径流极端阈值时,以该极端径流数据作为径流预报结果。

本发明模型有理论基础坚实、物理作用过程机制明确、可预报极端洪水等特点,适宜大范围推广使用,为水资源规划和合理配置提供技术支撑。

以下为具体实施例:

针对汉江上游流域,构建径流预报模型,构建方法包括以下步骤:

S1、数据收集和预处理;

采集该流域1987年1月-2020年12月间的水文气象数据,包括月降水数据、月蒸发皿观测值和月径流数据,以月蒸发皿观测值作为月蒸散发数据,并收集1986年1月-2020年12月遥相关气候因子数据,包括大气环流因子88项,海温指数26项,其他指数16项。

对遥相关气候因子数据集中的缺失数据进行处理,包括删除与插补缺失值,处理后生成大气环流因子79项,海温指数26项,其他指数9项。此外,根据3σ原则确定历史径流序列极端径流阈值4050m

S2、构建XGBoost-SHAP模型,并进行预报因子初筛;

基于python3.7平台编写XGBoost-SHAP模型算法程序;

用于特征筛选的机器学习算法其训练集与测试集的划分比例均采用近似8:2,即1987年2月到2014年2月为训练期,累积325个月,2014年3月-2020年12月为测试期,累积82个月,将预报因子集输入XGBoost-SHAP模型进行特征初筛并选出贡献度排序前20的预报因子,初筛结果见表2。SHAP模型计算后生成图2,根据图2可分析预报因子对径流的驱动机制。

表2初筛后预报因子信息

S3、构建BO-BiLSTM模型,进而确定常规模型和极端值模型;

编写BO-BiLSTM模型算法程序,模型中训练期与测试期划分比例同上。

常规模型:对初筛后因子进行逐一剔除,当预报因子为9时,模型测试期NSE最高,选择该预报因子组合下的模型为常规模型。

极端值模型:重复对初筛后因子进行逐一剔除,当预报因子为19时,模型虽然整体测试期NSE较低,但对极端值拟合情况较好,选择该预报因子组合下的模型为极端值模型。

S4、综合预报模型;

同时运行常规模型与极端值模型,结合极端值流量阈值4050m

S5、模型精度评价:利用测试期数据进行模型评价,计算本发明相关精度指标KGE与NSE,比较模拟与实测的流量过程线,并进行精度评价。模拟结果如图3所示,与常规模型对比结果如表3所示:

表3模型模拟结果精度对比

本发明模型测试期KGE与NSE分别为0.84和0.76,均高于常规模型且KGE超过常规模型较多。该模拟精度较高,参照《水文情报预报规范》规定,NSE大于0.75性能率为优,说明本发明模型整体性能优秀。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术分类

06120116564821