导航：首页> 电通信技术>一种基于集成策略的地质灾害易发性评价方法及系统

一种基于集成策略的地质灾害易发性评价方法及系统

文献发布时间：2023-06-19 09:33:52

技术领域

本发明涉及灾害预测领域，尤其涉及一种基于集成策略的地质灾害易发性评价方法及系统。

背景技术

地质灾害作为一种破坏性的地质事件，对人类的生命财产和生存环境构成严重的威胁。寻找一种精度较高，适合在研究区进行地质灾害易发性分区的方法尤为重要，但是目前常用的地质灾害易发性模型预测准确率较低。

发明内容

为了解决上述技术问题，本发明的目的是提供一种基于集成策略的地质灾害易发性评价方法及系统，通过提高机器学习模型的性能从而提高灾害预测的准确率。

本发明所采用的第一技术方案是：一种基于集成策略的地质灾害易发性评价方法，包括以下步骤：

获取地质灾害隐患点位置并绘制地质灾害位置图；

根据地质灾害位置图构建Tin模型并转化为数字高程模型，得到栅格和对应的栅格数据；

提取栅格数据中的相关特征并对栅格赋予ID号；

根据预训练的集成模型对提取出的相关特征进行计算预测，得到预测数据；

将预测数据与对应的栅格ID号连接，得到对应区域的灾害易发概率。

进一步，所述预训练的集成模型的训练步骤包括：

根据地质灾害隐患点位置生成地质灾害隐患点和非隐患点；

以地质灾害隐患点为正例、随机选取相同数量的非隐患点作为负例并采用分层抽样以 70/30的比例划分为训练集和测试集；

以训练集对集成模型进行训练并通过验证集验证训练后的集成模型，验证通过得到预训练的集成模型。

进一步，所述集成模型具体为基于Stacking集成框架的模型，包括基学习器和元学习器。

进一步，所述根据地质灾害位置图构建Tin模型并转化为数字高程模型，得到栅格这一步骤，其具体包括：

根据地质灾害位置图获得1:10000比例尺等值线图；

将1:10000比例尺等值线图输入到三维地质建模工具并通过等高线构建Tin模型；

将Tin模型转换为数字高程模型并根据数字高程模型得到栅格和对应的栅格数据。

进一步，所述栅格数据包括地质灾害影响因子数据，具体包括坡度、坡向、高程、平面曲率、剖面曲率、断裂密度、河流密度、路网密度、断裂距离、河流距离、路网距离、地貌、岩土体和土地利用类型。

进一步，还包括通过信息价值量法对影响因子数据进行计算排序，得到每个影响因子对地质灾害发生的重要程度，并根据重要程度对影响因子进行筛选降低冗余。

进一步，所述提取栅格数据中的相关特征并对栅格赋予ID号这一步骤，其具体包括：

获取区域的灾害数据并根据栅格数据、灾害数据和三维地质建模工具得到栅格对应的相关特征；

通过三维地质建模工具对区域的每个栅格赋予ID号。

进一步，所述根据预训练的集成模型对提取出的相关特征进行计算预测，得到预测数据这一步骤，其具体还包括：

根据训练好的集成模型对提取出的区域栅格相关特征进行计算预测，将计算好的概率值写入CSV文件中，得到预测数据；

使用ROC曲线和相关辅助验证的统计指标对预训练的集成模型总体性能进行评估。

本发明所采用的第二技术方案是：一种基于集成策略的地质灾害易发性评价系统，包括以下模块：

图模块，用于获取地质灾害隐患点位置并绘制地质灾害位置图；

模型模块，用于根据地质灾害位置图构建Tin模型并转化为数字高程模型，得到栅格和对应的栅格数据。

栅格模块，用于对栅格赋予ID号并提取栅格数据中的相关特征；

预测模块，用于根据预训练的集成模型对提取出的相关特征进行计算预测，得到预测数据；

匹配结果模块，用于将预测数据与对应的栅格ID号连接，得到对应区域的灾害易发概率。

本发明方法及系统的有益效果是：通过数字高程模型获取栅格数据，通过集成模型预测灾害发生，集成模型相对于单体模型而言具有更好的预测能力，对地质灾害易发性评价有较高的预测价值，可以为地质灾害风险评估和管理提供依据。

附图说明

图1是本发明一种基于集成策略的地质灾害易发性评价方法的步骤流程图；

图2是本发明一种基于集成策略的地质灾害易发性评价系统的结构框图；

图3是本发明具体实施例

具体实施方式

下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

如图1所示，本发明提供了一种基于集成策略的地质灾害易发性评价方法，该方法包括以下步骤：

S1、获取地质灾害隐患点位置并绘制地质灾害位置图；

具体地，通过地质环境监测院的1:5万地质灾害详查资料，确定了研究区的地质灾害隐患点位置，并根据地质灾害隐患点位置绘制地质灾害位置图。

S2、根据地质灾害位置图构建Tin模型并转化为数字高程模型，得到栅格和对应的栅格数据；

S3、提取栅格数据中的相关特征并对栅格赋予ID号；

S4、根据预训练的集成模型对提取出的相关特征进行计算预测，得到预测数据；

S5、将预测数据与对应的栅格ID号连接，得到对应区域的灾害易发概率。

具体地，在模型训练完成后，计算每个栅格分配唯一的概率值，指示地质灾害发生的可能性，值域介于0和1之间，值越高代表该位置越容易发生地质灾害。采用自然断点法将研究区划分为五个易发性区间：低、较低、中等、较高和高。

另外，用Arcgis将区域栅格数据的CSV文件导入Arcgis中，将表和渔网数据中ID号相同的连接并将表中的易发概率不为空的栅格数据选择出来。

进一步作为本方法的优选实施例，所述预训练的集成模型的训练步骤包括：

根据地质灾害隐患点位置生成地质灾害隐患点和非隐患点；

以地质灾害隐患点为正例、随机选取相同数量的非隐患点作为负例并采用分层抽样以 70/30的比例划分为训练集和测试集；

以训练集对集成模型进行训练并通过验证集验证训练后的集成模型，验证通过得到预训练的集成模型。

具体地，一部分用来训练基学习器，而另外一部分用来验证。训练集上的预测值被当做新的特征输入到元学习器，作为新的训练集。而测试集的平均值将作为下一层新的测试集。元学习器可以学习到前一层学习器的预测以及误差，有效从中学习正确的分类信息，提高泛化能力。

进一步作为本方法的优选实施例，所述机器学习模型具体为基于Stacking集成框架的机器学习模型，包括基学习器和元学习器。

具体地，如图3所示，Stacking集成的学习过程一般由两级框架组成，本文第一层的基学习器使用了决策树、K-近邻算法和支持向量机三种分类器。第二层的元学习器采用了逻辑回归(LogicalRegression)

K-近邻算法计算公式如下：

其表达意思为如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别，则该样本也属于这个类别(k通常为整数且不大于20)。

另外，决策树是一种常见的类似于树结构的机器学习算法。决策树模型是运用于分类和回归的一种树型结构，一般一棵决策树包含一个根节点、若干内部节点和若干叶节点。决策树的决策过程需要从决策树的根节点开始，待测数据与决策树中的特征节点进行比较，并按照比较结果选择选择下一比较分支，直到叶子节点作为最终的决策结果。

决策树的具体步骤如下：

(1)从根节点开始，对节点计算现有特征基尼指数，对每一个特征，例如X，再对其每个可能的取值如x,根据样本点对X＝x的结果的“是”与“否”划分为两个部分，计算公式如下：

(2)在所有的特征X及该特征所有可能取值x中，选择基尼系数最小的的特征及其对应的取值作为最优特征和最优切分点，并根据上述两个指标二分数据点，生成了两个子节点。

(3)对两个字节点递归地调用上述步骤，直至节点中的样本个数小于阈值，或者样本集的基尼指数小于阈值，或者没有更多特征后停止。

(4)最后，生成CART决策树。

另外，支持向量机作为二进制分类器，旨在找到一种将两个类最佳地分开的超平面。

进一步作为本方法的优选实施例，所述根据地质灾害位置图构建Tin模型并转化为数字高程模型，得到栅格这一步骤，其具体包括：

根据地质灾害位置图获得1:10000比例尺等值线图；

将1:10000比例尺等值线图输入到三维地质建模工具并通过等高线构建Tin模型；

将Tin模型转换为数字高程模型并根据数字高程模型得到栅格和对应的栅格数据。

进一步作为本方法的优选实施例，所述栅格数据包括地质灾害影响因子数据，具体包括坡度、坡向、高程、平面曲率、剖面曲率、断裂密度、河流密度、路网密度、断裂距离、河流距离、路网距离、地貌、岩土体和土地利用类型。

进一步作为本方法的优选实施例，还包括通过信息价值量法对影响因子数据进行计算排序，得到每个影响因子对地质灾害发生的重要程度，并根据重要程度对影响因子进行筛选降低冗余，更有利于模型的预测计算。

进一步作为本方法的优选实施例，所述提取栅格数据中的相关特征并对栅格赋予ID号这一步骤，其具体包括：

获取区域的灾害数据并根据栅格数据、灾害数据和三维地质建模工具得到栅格对应的相关特征；

通过三维地质建模工具对区域的每个栅格赋予ID号。

具体地，道路距离、道路密度、河流距离、河流密度、地貌类型和土地利用类型等是根据廓第二次详细土地调查数据提取的。从二调数据中获取道路线、河流线以及初步的土地利用类型。再Arcgis10.2分析工具/领域分析功能中提取每个栅格点到最近道路、河流的距离，将计算的距离储存在相关特征的属性字段里。利用空间分析/密度分析功能提取每个栅格周围的道路、河流密度，将计算的密度储存在相关特征的属性字段里。初步的土地利用分类包括了很多细节，不利于统计，根据相关资料合并为水域、居民区、森林、草地、农地、裸地、工程用地。

进一步作为本方法的优选实施例，所述根据预训练的集成模型对提取出的相关特征进行计算预测，得到预测数据这一步骤，其具体还包括：

根据训练好的集成模型对提取出的区域栅格相关特征进行计算预测，将计算好的概率值写入CSV文件中，得到预测数据；

使用ROC曲线和相关辅助验证的统计指标对预训练的集成模型总体性能进行评估。

具体地，为了评价研究区地质灾害的易发性，首先准备了14个影响因子。然而，复杂的自然环境使得地质灾害与各种因素有关，高维特征会造成数据冗余，既会增加模型的计算难度，也不利于评价的精度。此外根据研究区的具体自然环境不同，各因素对地质灾害产生的贡献可能不相等。因此本文通过信息价值法评估影响因子并对其进行筛选。计算公式为：

其中，n

具体地，在14个影响因素中，只有9个超过了标准值(IV＞0.3)，分别是坡向(0.5028)、土地利用(0.8661)、岩土体(0.7853)、高程(3.8713)、河流密度(0.5822)、路网密度 (3.1718)、断裂距离(1.2604)、河流距离(0.3823)、路网距离(3.7618)。这些因子与地质灾害关系密切，在易发性评价中发挥着更为重要的作用。

如图2所示，本发明还提供了一种基于集成策略的地质灾害易发性评价系统，其特征在于，包括以下模块：

图模块，用于获取地质灾害隐患点位置并绘制地质灾害位置图；

模型模块，用于根据地质灾害位置图构建Tin模型并转化为数字高程模型，得到栅格和对应的栅格数据。

栅格模块，用于对栅格赋予ID号并提取栅格数据中的相关特征；

预测模块，用于根据预训练的集成模型对提取出的相关特征进行计算预测，得到预测数据；

匹配结果模块，用于将预测数据与对应的栅格ID号连接，得到对应区域的灾害易发概率。

进一步作为本系统的优选实施例，所述模型模块还包括：

等值线图子模块，用于根据地质灾害位置图获得1:10000比例尺等值线图；

Tin模型子模块，用于将1:10000比例尺等值线图输入到三维地质建模工具并通过等高线构建Tin模型；

数字高程模型子模块，用于将Tin模型转换为数字高程模型并根据数字高程模型得到栅格和对应的栅格数据。

进一步作为本系统个优选实施例，所述栅格模块还包括：

特征子模块，用于获取区域的灾害数据并根据栅格数据、灾害数据和三维地质建模工具得到栅格对应的相关特征；

ID子模块，用于通过三维地质建模工具对区域的每个栅格赋予ID号。

进一步作为本系统的优选实施例，所述预测模块还包括：

计算子模块，用于根据训练好的集成模型对提取出的区域栅格相关特征进行计算预测，将计算好的概率值写入CSV文件中，得到预测数据；

评估子模块，用于使用ROC曲线和相关辅助验证的统计指标对预训练的集成模型总体性能进行评估。

上述方法实施例中的内容均适用于本系统实施例中，本系统实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：周永章;吉俊杰;
专利申请人：中山大学;

上一篇：基于物联网的电动汽车充电方法及装置
下一篇：一种基于深度迁移学习的网络流量识别方法及装置