掌桥专利:专业的专利平台
掌桥专利
首页

基于机器学习的深泓摆动预测方法及装置

文献发布时间:2024-01-17 01:27:33


基于机器学习的深泓摆动预测方法及装置

技术领域

本发明属于水利水电工程技术领域,具体涉及基于机器学习的深泓摆动预测方法及装置。

背景技术

深泓摆动是主槽内最低点的摆动,是冲积河流河床横向摆动的重要组成部分。一般认为深泓位置处水流流速与断面最大流速基本相当,深泓点距离滩岸越近,则近岸土体受到水流冲刷的作用也越大。特别地,深泓向滩岸方向发生大尺度摆动,可能造成局部河段的河势剧烈调整,易引发滩岸的崩退,破坏河道整治工程,威胁河道防洪安全,进而危及滩区人民的生命财产安全。如黄河下游游荡段在小浪底水库运行前河床宽浅,河势变化剧烈,1989年该河段上的八堡断面汛期深泓摆动宽度达到3.5km,两岸发生不同程度的崩退。因此,深泓频繁和剧烈的摆动不仅会破坏河岸横向稳定性,而且会影响河势变化及河床演变进程。

冲积河流深泓的摆动规律较为复杂,国内外相关研究较少,且止步于定性分析深泓摆动的特点及其影响因素,在此基础上,建立深泓摆动宽度与单一或两种影响因子之间的经验关系,而无法进一步预测深泓摆动情况。但对深泓摆动的方向和幅度进行预测,对研究局部河段的不利河势、识别易出险位置,从而指导河道两岸工程建设、减小洪水对大堤的直接威胁具有重要意义,因此亟需提出科学有效地对深泓摆动的方向和幅度进行预测的方法。

发明内容

为了解决上述技术问题,本发明提供了基于机器学习的深泓摆动预测方法及装置,能够有效对冲积河流固定断面汛期深泓摆动的方向和幅度进行预测。

本发明提供的基于机器学习的深泓摆动预测方法,其特征在于,包括以下步骤:

步骤1:收集河段各固定断面的历史地形资料、河段沿程水文站的历史日均水文资料;历史地形资料为各固定断面历年汛前及汛后的地形资料,地形资料包括固定断面测点的起点距和高程;日均水文资料包括流量、含沙量和输沙率数据;

步骤2:套绘各固定断面相邻年份汛前及汛后的地形图,确定各固定断面汛前和汛后的主槽范围;

步骤3:计算各固定断面历年汛期深泓摆动的方向、幅度及强度;

步骤4:计算各水文站历年汛期水沙条件,包括:汛期平均的流量、含沙量及输沙率,并进一步考虑水沙组合,包括:各水文站历年的汛期来沙系数及前若干年汛期平均水流冲刷强度;

步骤5:计算各固定断面历年汛前河床边界条件;包括如下子步骤:

步骤5.1,计算各固定断面历年汛前主槽形态特征变量,包括:深泓点左右两侧主槽面积、深泓点与主槽左右两岸的距离、深泓点左右两侧滩槽高差、深泓点的贴岸程度;

步骤5.2,计算各固定断面历年汛前次低点与深泓点的相对距离及次低点的贴岸程度;

步骤5.3,计算各固定断面历年汛前工程位置与深泓点的相对距离;

步骤6:计算各固定断面前期非汛期深泓摆动的方向及幅度;

步骤7:将所有断面于步骤3、4、5、6计算的数据汇总在一起,并添加上相应的断面名字和年份;

步骤8:将步骤7所有断面历年汛期深泓摆动方向作为标签,将步骤7所有断面历年汛期水沙条件、汛前河床边界条件及前期深泓摆动情况作为各特征变量,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据,分为训练集与测试集输入机器学习模型进行训练及预测,预测得到汛期深泓摆动方向;

步骤9:将步骤7所有断面历年汛期深泓摆动幅度作为标签,各特征变量同步骤8,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据,分为训练集与测试集输入机器学习模型进行训练及预测,预测得到汛期深泓摆动幅度。

优选地,本发明提供的基于机器学习的深泓摆动预测方法,在步骤5.1中,各固定断面地形图中,过深泓点的垂线将主槽一分为二,首先计算深泓点左、右两侧主槽面积AL

优选地,本发明提供的基于机器学习的深泓摆动预测方法,在步骤5.2中,若主槽内部存在突起的浅滩,使得断面呈现多槽形态,深泓点所在之槽为深槽,则其他槽中的最低点为次低点,该位置处水深仅次于深泓点水深,流速较大,则判断为很有可能发展成为深泓点;若断面呈单槽形态,则认为次低点与深泓点位置相当;确定各固定断面汛前次低点的起点距C

优选地,本发明提供的基于机器学习的深泓摆动预测方法,在步骤5.3中,若两岸均有工程控制,则选择距离深泓点较近的一岸工程,确定各固定断面汛前工程位置的起点距T

优选地,本发明提供的基于机器学习的深泓摆动预测方法,在步骤6中,根据各固定断面当年汛前和上一年汛后的主槽范围,确定各固定断面当年汛前和上一年汛后主槽范围内最低点对应的起点距B

优选地,本发明提供的基于机器学习的深泓摆动预测方法,在步骤7中,每条数据包括:①断面名字及年份;②汛期深泓摆动方向、幅度及强度;③水沙特征,包含:汛期平均的流量、含沙量及输沙率、汛期来沙系数、前若干年汛期平均水流冲刷强度;④河床边界特征,包含:汛前深泓点左右两侧主槽面积、汛前深泓点与主槽左右两岸的距离、汛前深泓点左右两侧滩槽高差、汛前深泓点的贴岸程度、汛前次低点与深泓点的相对距离、汛前次低点的贴岸程度、汛前工程与深泓点的相对距离;⑤前期非汛期深泓摆动的方向及幅度。

优选地,本发明提供的基于机器学习的深泓摆动预测方法,在步骤8中,运用随机森林分类模型进行训练及预测,筛选深泓强度M

<装置>

进一步,本发明还提供了一种自动实现上述<方法>的基于机器学习的深泓摆动预测装置,包括:

历史数据获取部,获取河段各固定断面的历史地形资料、河段沿程水文站的历史日均水文资料;历史地形资料为各固定断面历年汛前及汛后的地形资料,地形资料包括固定断面测点的起点距和高程;日均水文资料包括流量、含沙量和输沙率数据;

范围确定部,套绘各固定断面相邻年份汛前及汛后的地形图,确定各固定断面汛前和汛后的主槽范围;

断面摆动计算部,计算各固定断面历年汛期深泓摆动的方向、幅度及强度;

水沙计算部,计算各水文站历年汛期水沙条件,包括:汛期平均的流量、含沙量及输沙率,并进一步考虑水沙组合,包括:各水文站历年的汛期来沙系数及前若干年汛期平均水流冲刷强度;

汛前河床边界计算部,计算各固定断面历年汛前河床边界条件;包括:步骤5.1,计算各固定断面历年汛前主槽形态特征变量,包括:深泓点左右两侧主槽面积、深泓点与主槽左右两岸的距离、深泓点左右两侧滩槽高差、深泓点的贴岸程度;步骤5.2,计算各固定断面历年汛前次低点与深泓点的相对距离及次低点的贴岸程度;步骤5.3,计算各固定断面历年汛前工程位置与深泓点的相对距离;

非汛期摆动计算部,计算各固定断面前期非汛期深泓摆动的方向及幅度;

数据汇总部,将所有断面于断面摆动计算部、水沙计算部、汛前河床边界计算部、非汛期摆动计算部计算的数据汇总在一起,并添加上相应的断面名字和年份;

方向预测部,将数据汇总部所有断面历年汛期深泓摆动方向作为标签,将数据汇总部所有断面历年汛期水沙条件、汛前河床边界条件及前期深泓摆动情况作为各特征变量,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据,分为训练集与测试集输入机器学习模型进行训练及预测,预测得到各断面汛期深泓摆动方向;

幅度预测部,将数据汇总部所有断面历年汛期深泓摆动幅度作为标签,各特征变量同方向预测部,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据,分为训练集与测试集输入机器学习模型进行训练及预测,预测得到各断面汛期深泓摆动幅度;

控制部,与历史数据获取部、范围确定部、断面摆动计算部、水沙计算部、汛前河床边界计算部、非汛期摆动计算部、数据汇总部、方向预测部、幅度预测部均通信相连,控制它们的运行。

优选地,本发明提供的基于机器学习的深泓摆动预测装置,还可以包括:输入显示部,与历史数据获取部、范围确定部、断面摆动计算部、水沙计算部、汛前河床边界计算部、非汛期摆动计算部、数据汇总部、方向预测部、幅度预测部以及控制部均通信相连,用于让用户输入操作指令,并根据操作指令对相应部的数据和文件以文字、表格、或图形方式进行显示。

优选地,本发明提供的基于机器学习的深泓摆动预测装置,在步骤5.1中,各固定断面地形图中,过深泓点的垂线将主槽一分为二,首先计算深泓点左、右两侧主槽面积AL

发明的作用与效果

本发明考虑了汛期水沙条件、汛前河床边界条件、前期深泓摆动情况等多种特征,仅利用固定断面的地形资料和河段沿程水文站的水沙数据,而不涉及其他不易获取的数据资料(例如,断面的流速资料),并提出了汛前河床边界条件中的次低点位置、主槽左右两侧形态特征变量等特征和前期深泓摆动情况的计算和确定方法,将这些特征输入模型中预测得到各断面的深泓摆动方向和幅度,经验证预测结果与实际情况相符性较好,能够全面、有效地预测深泓摆动的情况,进一步把握河势的调整趋势。本发明对深泓摆动的方向和幅度进行预测,对于研究局部河段的不利河势、识别易出险位置,从而指导河道两岸工程建设、减小洪水对大堤的直接威胁具有重要意义。

附图说明

图1为本发明实施例涉及的基于机器学习的深泓摆动预测方法的流程图;

图2为本发明实施例涉及的游荡段沿程134个断面汛期平均深泓摆动宽度与距坝距离关系图;

图3为本发明实施例涉及的1986年游荡段辛寨断面汛前和汛后的地形图;

图4为本发明实施例涉及的游荡段深泓摆动方向的预测效果图;

图5为本发明实施例涉及的游荡段沿程134个断面深泓摆动方向预测准确率;

图6为本发明实施例涉及的游荡段深泓摆动幅度的预测效果图;

图7为本发明实施例涉及的游荡段沿程134个断面深泓预测摆动幅度与实际摆动幅度的关系图。

图8为本发明实施例涉及的游荡段典型断面深泓预测摆动幅度与实际摆动幅度的关系图。

具体实施方式

以下结合附图对本发明涉及的基于机器学习的深泓摆动预测方法及装置进行详细地说明。

<实施例一>

如图1所示,本实施例所提供的基于机器学习的深泓摆动预测方法包括以下步骤:

S1收集河段各固定断面的历史地形资料、河段沿程水文站的历史日均水文资料。其中,历史地形资料为各固定断面历年汛前及汛后的地形资料,地形资料包括固定断面测点的起点距和高程;日均水文资料包括流量、含沙量和输沙率数据。以黄河下游游荡段为研究河段,起于铁谢断面,终于高村断面,收集该河段134个固定断面历史汛前和汛后的地形资料。由于游荡段历史断面地形资料存在缺失情况:①134个断面中28个断面的地形资料比较详尽,自1970年开始;②11个断面的地形资料自1998年开始;③14个断面的地形资料自1999年开始;④40个断面的地形资料自2002年开始;⑤其余断面的地形资料自2004年开始。同时,收集沿程花园口、夹河滩、高村三个水文站的历史日均水文资料。

S2套绘游荡段各固定断面相邻年份汛前及汛后的地形图,根据滩槽的区分原则,综合确定各固定断面汛前和汛后的主槽范围。

确定主槽范围,首先需要确定主槽两侧滩唇的位置,各固定断面滩槽的区分原则为:若两岸滩唇位置较为明显,两滩唇之间即为主槽范围;若滩唇不明显或出现二级以上滩地时,则需要考虑相邻测次的滩唇位置,根据经验综合确定滩唇位置及主槽范围。

S3基于各固定断面历年汛前和汛后的主槽范围,计算各固定断面历年汛期深泓摆动的方向、幅度及强度。

确定各固定断面历年汛前和汛后主槽范围内最低点对应的起点距B

S4基于河段沿程水文站日均流量、日均含沙量及日均输沙率,计算各水文站历年汛期平均的流量、含沙量及输沙率,并进一步考虑水沙组合,计算各水文站历年的汛期来沙系数及前5年汛期平均水流冲刷强度。汛期来沙系数定义为汛期平均含沙量与汛期平均流量之比,即

式中:

考虑河床形态调整对水沙条件的响应存在滞后性,包括当年在内的前5年汛期平均水流冲刷强度

由于游荡段水文站仅3个,远不及布设的固定断面的数量,因此,铁谢至花园口河段之间各固定断面的水沙条件选取花园口水文站的水沙条件;夹河滩至高村河段之间各固定断面的水沙条件选取夹河滩水文站的水沙条件;花园口以下、夹河滩以上河段之间各固定断面的水沙条件选取花园口水文站的水沙条件。

S5基于各固定断面历年汛前的主槽范围,计算各固定断面历年汛前河床边界条件,包括如下子步骤:

5.1计算各固定断面历年汛前主槽形态特征变量。

在各固定断面地形图中,过深泓点的垂线将主槽一分为二。对于游荡段134个断面,首先计算深泓点左、右两侧主槽面积AL

深泓点贴岸程度TB

5.2计算各固定断面历年汛前次低点与深泓点的相对距离及次低点的贴岸程度。

若主槽内部存在突起的浅滩,使得断面呈现多槽形态,深泓点所在之槽为深槽,则其他槽中的最低点为次低点,该位置处水深仅次于深泓点水深,流速较大,很有可能发展成为深泓点。若断面呈单槽形态,则认为次低点与深泓点位置相当。

确定各固定断面汛前次低点的起点距C

5.3计算各固定断面历年汛前工程与深泓点的相对距离。

若两岸均有工程控制,则选择距离深泓点较近的一岸工程。确定各固定断面汛前工程位置的起点距T

S6基于各固定断面当年汛前和上一年汛后的主槽范围,计算各固定断面前期非汛期深泓摆动的方向及幅度。

确定各固定断面当年汛前和上一年汛后主槽范围内最低点对应的起点距B

S7将游荡段134个断面于S3、S4、S5、S6计算所得数据汇总在一起,并添加上相应的断面名字和年份。

每条数据包括:①断面名字及年份;②汛期深泓摆动方向、幅度及强度;③水沙特征(汛期平均的流量、含沙量及输沙率、汛期来沙系数、前5年汛期平均水流冲刷强度);

④河床边界特征(汛前深泓点左右两侧主槽面积、汛前深泓点与主槽左右两岸的距离、汛前深泓点左右两侧滩槽高差、汛前深泓点的贴岸程度、汛前次低点与深泓点的相对距离、汛前次低点的贴岸程度、汛前工程与深泓点的相对距离);⑤前期非汛期深泓摆动的方向及幅度。

S8将游荡段134个断面历年汛期深泓摆动方向作为标签,深泓向左摆动为标签“1”,深泓向右摆动为标签“-1”,运用随机森林分类模型进行训练及预测。将相应断面历年汛期水沙条件、汛前河床边界条件及前期深泓摆动情况作为各特征变量,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据。

本发明主要关注深泓向滩岸方向有可能造成崩岸和工程毁坏的明显摆动,这是因为发生在主槽内部深泓点基本不变的小幅摆动影响较小,且摆动的随机性较大,可不予考虑。对于窄深型和宽浅型断面,小幅摆动的范围不一,因此根据深泓摆动强度筛选样本数据,筛选深泓强度M

本发明的随机森林建模在Python平台上实现,主要使用的库是scikit-learn库。随机森林分类模型各参数设置如下:n_estimators=300,max_depth=50,其余参数采用默认值。本发明不涉及调参过程。

对上述两种情况的预测结果进行检验和评估:

①由于每次均以8:2随机划分训练集与测试集,即每次输入不同的数据集,训练得到的模型也不同,预测效果有所波动,因此,计算各次预测准确率accuracy及交叉验证得分,其中,score_roc_auc为以ROC曲线下的面积大小(roc_auc)为评估指标的交叉验证得分、score_accuracy为以准确率(accuracy)为评估指标的交叉验证得分。深泓摆动方向的预测结果如图4。预测准确率在77%~84%之间,平均准确率为80%;score_roc_auc在0.84~0.86之间,平均值为0.85;score_accuracy在0.78~0.80,平均值为0.79。

②游荡段各固定断面深泓摆动方向预测准确率如图5所示。134个断面的平均预测准确率达82.4%,不存在预测准确率为0的断面,99%的断面预测准确率在50%及以上,66%的断面预测准确率在75%及以上,54.5%的断面预测准确率为100%。就交叉验证得分而言,以ROC曲线下的面积大小(roc_auc)为评估指标的交叉验证得分(score_roc_auc)为0.85、以准确率(accuracy)为评估指标的交叉验证得分(score_accuracy)为0.78。

S9将游荡段134个断面历年汛期深泓摆动幅度作为标签,将相应断面历年汛期水沙条件、汛前河床边界条件及前期深泓摆动情况作为各特征变量,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据。

深泓摆动的幅度为连续的变量,运用随机森林回归模型进行训练及预测;由于输入的是考虑摆动方向的摆动幅度,即深泓向左摆动,摆动幅度为正,反之为负,因此,通过比较深泓摆动幅度预测值与实际值的符号,即可判断深泓摆动方向是否预测为真。

筛选深泓强度M

对上述两种情况的预测结果进行检验和评估:

①由于每次均以8:2随机划分训练集与测试集,即每次输入不同的数据集,训练得到的模型也不同,预测效果有所波动,因此,计算方向预测准确率accuracy、皮尔逊相关系数p、平均绝对误差MAE及均方根误差RMSE,如图6,深泓摆动方向预测的准确率accuracy在76%~83%之间,平均准确率为79%;实际摆动幅度与预测摆动幅度的皮尔逊相关系数p在0.66~0.82之间、平均绝对误差MAE在357~424之间、均方根误差RMSE在497~649之间。其中一次的预测效果如图7所示,预测摆动幅度与实际摆动幅度的线性相关系数为0.68,摆动方向预测准确率为81%,深泓汛期平均摆动宽度为590m,平均绝对误差MAE为357m。

②就摆动方向的预测情况而言,79%的测试集深泓摆动方向预测为真;134个断面中95%的断面深泓摆动方向预测准确率在50%以上,62%的断面预测准确率在75%及以上,一半以上的断面预测准确率为100%。就摆动幅度的预测情况而言,游荡段134个固定断面实际摆动幅度与预测摆动幅度的皮尔逊相关系数p为0.74;平均绝对误差MAE及均方根误差RMSE分别为397、596。裴峪、罗村坡、八堡、韦城断面深泓预测摆动幅度与实际摆动幅度的线性相关关系如图8所示,可以看出,各断面的预测效果较好。

<实施例二>

本实施例二提供能够自动实现上述本发明方法的基于机器学习的深泓摆动预测装置,该装置包括历史数据获取部、范围确定部、断面摆动计算部、水沙计算部、汛前河床边界计算部、非汛期摆动计算部、数据汇总部、方向预测部、幅度预测部、输入显示部以及控制部。

历史数据获取部执行上文步骤1所描述的内容,获取河段各固定断面的历史地形资料、河段沿程水文站的历史日均水文资料。

范围确定部执行上文步骤2所描述的内容,套绘各固定断面相邻年份汛前及汛后的地形图,确定各固定断面汛前和汛后的主槽范围。

断面摆动计算部执行上文步骤3所描述的内容,计算各固定断面历年汛期深泓摆动的方向、幅度及强度。

水沙计算部执行上文步骤4所描述的内容,计算各水文站历年汛期水沙条件,并进一步考虑水沙组合情况。

汛前河床边界计算部执行上文步骤5所描述的内容,计算各固定断面历年汛前河床边界条件。

非汛期摆动计算部执行上文步骤6所描述的内容,计算各固定断面前期非汛期深泓摆动的方向及幅度。

数据汇总部执行上文步骤7所描述的内容,将所有断面于断面摆动计算部、水沙计算部、汛前河床边界计算部、非汛期摆动计算部计算的数据汇总在一起,并添加上相应的断面名字和年份。

方向预测部执行上文步骤8所描述的内容,将数据汇总部所有断面历年汛期深泓摆动方向作为标签,将数据汇总部所有断面历年汛期水沙条件、汛前河床边界条件及前期深泓摆动情况作为各特征变量,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据,分为训练集与测试集输入机器学习模型进行训练及预测,预测得到汛期深泓摆动方向。

幅度预测部执行上文步骤9所描述的内容,将数据汇总部所有断面历年汛期深泓摆动幅度作为标签,各特征变量同方向预测部,标签与各特征变量组成样本数据,根据深泓摆动强度进一步筛选样本数据,分为训练集与测试集输入机器学习模型进行训练及预测,预测得到汛期深泓摆动幅度。

输入显示部用于让用户输入操作指令,并根据操作指令对相应部的数据和文件以文字、表格、或图形方式进行显示。

控制部与历史数据获取部、范围确定部、断面摆动计算部、水沙计算部、汛前河床边界计算部、非汛期摆动计算部、数据汇总部、方向预测部、幅度预测部、输入显示部均通信相连,控制它们的运行。

以上实施例仅仅是对本发明技术方案所做的举例说明。本发明所涉及的基于机器学习的深泓摆动预测方法及装置并不仅仅限定于在以上实施例中所描述的内容,而是以权利要求所限定的范围为准。本发明所属领域技术人员在该实施例的基础上所做的任何修改或补充或等效替换,都在本发明的权利要求所要求保护的范围内。

相关技术
  • 一种基于机器学习的扫视路径预测方法和装置
  • 知识表示、机器学习模型训练、预测方法、装置以及电子设备
  • 一种冲积河流深泓横向迁移预测模型的构建方法
  • 一种基于RTK测量流速和水位并绘制深泓线的浮标及方法
技术分类

06120116227253