掌桥专利:专业的专利平台
掌桥专利
首页

基于深度学习的土地利用变化模拟方法

文献发布时间:2023-06-19 12:19:35


基于深度学习的土地利用变化模拟方法

技术领域

本发明属于地理信息科学领域,具体涉及一种基于深度学习的土地利用变化模拟方法。

背景技术

如今随着经济社会的高速发展,水土流失、耕地占用等一系列问题应运而生。深入挖掘土地利用演化的机制,精准模拟土地利用演化有重大意义。因此许多学者针对土地利用演化模拟展开了一系列的研究,其中元胞自动机(Cellular Automata,CA)由于能够捕捉非线性规律和容易扩展而被广泛应用。CA模型主要由元胞、元胞空间、元胞状态、邻域、转换规则和元胞时间这六部分组成,其中,转换规则是CA模型的核心部分,现有学者对于元胞自动机的改进也多基于转换规则进行建模。

根据研究学者对转换规则的建模视角可以分为:线性规则建模和非线性规则提取。其中线性转换规则是指基于权重参数构造驱动因子之间的相互作用,具有计算简单、收敛较快的特点。而实际上各驱动因子间的相互作用更多服从非线性规律,线性转换规则难以进行精确模拟。遗传算法、粒子群优化算法等常用来被建模非线性规则,但该类方法存在算法复杂度高,收敛慢,容易陷入局部最优解等问题。随着这些年计算机技术发飞速发展,机器学习技术在捕获非线性规则上表现出了突出的优势,因此也被广泛应用于土地利用转换非线性规则的建模。例如,将卷积神经网络用于元胞空间邻域特征的构建表达,然后通过支持向量机、随机森林、神经网络等方法对转换规则进行建模,然而这类方法严重依赖于研究者对于相关特征的构建与模型本身的适用性,模拟过程不够精确,可信度不高。

发明内容

本发明的目的在于提供一种基于深度学习的土地利用变化模拟方法,该方法预测效果具有较高的可信度。

本发明提供的这种基于深度学习的土地利用变化模拟方法,包括如下步骤

S1.获取历史土地利用数据,并进行预处理;

S2.将历史土地利用数据输入卷积神经网络,获取空间邻域特征;

S3.利用图卷积神经网络进行区位遥相关特征构建;

S4.融合空间邻域特征和区位遥相关特征,对样本特征进行欠采样处理;

S5.进行模型构建,对城市土地利用进行模拟演化,训练土地利用模拟演化模型;

S6.利用训练生成的土地利用模拟演化模型对土地利用变化进行预测。

所述的步骤S1具体为,获取等间隔年份的历史土地利用数据,并对历史土地利用数据进行投影校正统一、矢量裁剪和重采样栅格对齐校正;基于历史土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,重编码用于特征提取,同时保存解码规则。

所述的步骤S2具体为,构建CNN卷积神经网络,将历史土地利用数据输入CNN卷积神经网络,获取元胞的空间邻域特征;CNN卷积神经网络包括一个普通卷积层、一个空洞卷积层、两个最大池化层、一个全连接层和一个softmax层,其中卷积层某一单元接收信号后输出值的表达为:

其中,

所述的步骤S3具体为,对预设特征数据进行预处理构造区位条件特征,进而构造相似图,通过GCN卷积神经网络获取区位遥相关特征,具体包括如下步骤:

A1.选取预设特征数据;具体为选取高程和坡度为自然环境特征,表示区域地形;选取人口密度、到主干道距离、到次干道距离和到居民道路距离为社会经济特征,表示区域的经济发展水平;

A2.将预设特征融合为区位条件特征;

A3.以每一个元胞为单位,计算每个元胞的区位条件特征的余弦相似度;

A4.基于元胞间的相似度构建相似矩阵,通过假设和若干次调参设置相似度阈值和距离阈值,对于达到双重阈值约束的元胞建立联系,建立关联权重矩阵,进而构造区位条件相似图;

A5.提取区位条件相似结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个卷积层,通过反向传播求梯度更新参数,进而通过样本的训练集、测试集和验证集进行训练,获得区位遥相关特征。

所述的步骤A1,具体为从路网和DEM(Digital Elevation Model,数字高程模型)中提取预设特征数据;对预设特征数据通过Arcgis和Python进行投影转换,粗重采样,矢量裁剪,精重采样,并构造为高程特征、坡度特征、人口密度特征、到主干道距离特征、到次干道距离特征和到居民道路距离特征;对预设特征进行标准化处理,采用如下公式:

其中,x(l)为预设特征;max(x)为预设特征的最大值;min(x)为预设特征的最小值。

所述的步骤A2,融合区位条件特征具体为计算特征向量:

x

其中,x

所述的步骤A3,每个元胞的区位条件特征的余弦相似度的计算方式具体为:

其中,sim

步骤A4,关联权重矩阵表达为:

其中,W

步骤A5,图卷积层的更新参数过程具体表达为信号x’与滤波器g

g

其中,U为拉普拉斯矩阵

所述的步骤S4具体为,对特征进行TomeLinks欠采样处理;TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)

所述的步骤S5具体为,基于LightGBM算法对有效样本特征进行训练获取元胞自动机的转换规则,构建LightGBM_CA模型,并利用LightGBM_CA模型对城市土地利用进行模拟演化,具体步骤如下:随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行若干次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,得到土地利用模拟演化结果。

所述的步骤S6还包括验证模型,对评价指标进行分析;具体为对LightGBM_CA模型演化结果进行验证分析,基于OA系数、kappa系数和FoM系数实现评估;

OA系数表示预测正确的元胞数量占元胞总数的比例,Kappa系数为衡量模型预测结果与实际土地利用的一致性检验指标,FOM系数为比较整体模拟结果的空间格局与实际的空间格局的符合程度的指标;其中OA系数、Kappa系数和FoM系数的计算公式如下所示:

其中,sum为元胞总数;

本发明提供的这种基于深度学习的土地利用变化模拟方法,在卷积神经网络中引入空洞卷积层,在扩大元胞感受野的同时兼顾局部特征,减少冗余特征的累积,进而实现对元胞空间邻域特征的构建;以地理学第三定律为依据,基于图卷积神经网络感知地理场景遥相关,实现对地理区位条件相似的元胞关系的挖掘,处理精度更高。

附图说明

图1为本发明方法的流程示意图。

图2为本发明实施例的流程示意图。

图3为本发明实施例的研究区域土地利用示意图。

图4为本发明实施例的区位特征示意图。

图5为本发明实施例的土地利用模拟演化结果对比示意图。

具体实施方式

如图1为本发明方法的流程示意图:本发明提供的这种基于深度学习的土地利用变化模拟方法,包括如下步骤

S1.获取历史土地利用数据,并进行预处理;

S2.将历史土地利用数据输入卷积神经网络,获取空间邻域特征;

S3.利用图卷积神经网络进行区位遥相关特征构建;

S4.融合空间邻域特征和区位遥相关特征,对样本特征进行欠采样处理;

S5.进行模型构建,对城市土地利用进行模拟演化,训练土地利用模拟演化模型;

S6.利用训练生成的土地利用模拟演化模型对土地利用变化进行预测。

步骤S1具体为,获取等间隔年份的历史土地利用数据,并对历史土地利用数据进行投影校正统一、矢量裁剪和重采样栅格对齐校正;基于历史土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,用于特征提取,同时保存解码规则。

步骤S2具体为,构建CNN卷积神经网络,将历史土地利用数据输入CNN卷积神经网络,获取元胞的空间邻域特征:构建CNN卷积神经网络,CNN卷积神经网络一共包括六层,其中包括一个普通卷积层、一个空洞卷积层、两个最大池化(maxpooling)层、一个全连接层和一个softmax层,其中卷积层某一单元接收信号后输出值的表达为:

其中,

步骤S3具体为,对预设特征数据进行预处理构造区位条件特征,进而构造相似图,通过GCN卷积神经网络获取区位遥相关特征,具体包括如下步骤:

A1.选取预设特征数据,具体为选取高程和坡度为自然环境特征,表示区域地形;选取人口密度、到主干道距离、到次干道距离和到居民道路距离为社会经济特征,表示区域的经济发展水平。从路网和DEM等数据中提取预设特征数据;对预设特征数据通过Arcgis和Python进行投影转换,粗重采样,矢量裁剪,精重采样,并构造为高程特征、坡度特征、人口密度特征、到主干道距离特征、到次干道距离特征和到居民道路距离特征;对预设特征进行标准化处理,采用如下公式:

其中,x(l)为预设特征;max(x)为预设特征的最大值;min(x)为预设特征的最小值。

A2.将预设特征融合为区位条件特征,具体为:

x

其中,x

A3.以每一个元胞为单位,计算每个元胞的区位条件特征的余弦相似度,具体为:

其中,sim

A4.基于元胞间的相似度构建相似矩阵,通过假设和若干次调参设置相似度阈值和距离阈值,对于达到双重阈值约束的元胞建立联系,建立关联权重矩阵,进而构造区位条件相似图,其中关联权重矩阵表达为:

其中,W

A5.提取区位条件相似结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个卷积层,通过反向传播求梯度更新参数,进而通过样本的训练集、测试集和验证集进行训练,获得区位遥相关特征,其中信号x与滤波器g

g

其中,U为拉普拉斯矩阵

步骤S4具体为,对特征进行TomeLinks欠采样处理;对样本数据进行分析,了解数据不平衡的程度;基于主流解决数据不平衡的问题的方法(如过采样、欠采样以及二者融合的方法)进行多组对比实验,最终确定TomeLinks欠采样为解决当前数据不平衡的最佳方法,进而得到用于训练模型的样本数据集;TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)

步骤S5具体为,基于LightGBM算法对有效样本特征进行训练获取元胞自动机的转换规则,构建LightGBM_CA模型,并利用LightGBM_CA模型对城市土地利用进行模拟演化,具体步骤如下:随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行十次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,即得到土地利用模拟演化模型。

步骤S6还包括验证模型,对评价指标进行分析,输出并保存土地利用模拟演化结果;具体为对LightGBM_CA模型演化结果进行验证分析,基于OA系数(总体精度Overallaccurancy)、kappa系数和FoM(Figure of Merit)系数实现评估,输出并保存演化结果,具体步骤如下:

基于土地利用标准数据,对模型模拟演化结果进行分析评价,采用OA系数、Kappa系数、FOM系数作为评价指标。OA系数表示预测正确的元胞数量占元胞总数的比例,Kappa系数为衡量模型预测结果与实际土地利用的一致性检验指标,FOM系数为比较整体模拟结果的空间格局与实际的空间格局的符合程度的指标。其中OA系数、Kappa系数和FoM系数的计算公式如下所示:

其中,sum为元胞总数;

结合区域标准土地利用图,对评价指标进行分析,输出并保存土地利用模拟演化模型。

在具体实施方式中:

如图2为本发明实施例的流程示意图。以2000、2010、2020年长沙市芙蓉区土地利用为案例,如图3为本发明实施例的研究区域土地利用示意图。为验证本发明提出的方法在土地利用模拟这的有效性,案例将以本发明提出的方法为基础进行土地利用模拟演化,对本发明的模拟演化结果与其他主流模型(包括人工神经网络ANN_CA,逻辑回归LR_CA,随机森林RF_CA,梯度提升树GBT_CA)进行对比实验。下面对本发明的具体实施过程进行说明:

步骤一、获取湖南省长沙市2000、2010、2020年土地利用分布图和人口密度数据,以及路网数据、DEM数据,作为本案例特征集的基础数据来源。

步骤二、对土地利用数据进行投影校正统一、矢量裁剪、重采样栅格对齐校正,并基于土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,同时保存解码规则。

步骤三、构建CNN卷积神经网络,CNN卷积神经网络一共有六层,其中包括一个普通卷积层,一个空洞卷积层,两个最大池化(maxpooling)层,一个全连接层和一个softmax层,其中卷积层某一单元接收信号后输出值的表达为:

式中:

随机选取初始数据的30%样本量作为CNN卷积神经网络提取邻域空间特征的基础,其次再将选取样本中的70%作为训练集,30%作为测试集。选取土地利用类型地图的每个像素作为中心像素,将中心像素与其相邻像素进行裁剪,形成一个25×25网格。CNN卷积神经网络采用的是5×5卷积核,膨胀率为2的空洞卷积层,2×2池化层,最后通过softmax回归的4个神经元的全连接层生成输出邻域空间特征。

步骤四、通过DEM数据获取高程和坡度作为自然环境特征,选取人口密度、到主干道距离、到次干道距离和到居民道路的距离作为社会经济要素,后三者可基于路网数据生成欧式距离场获得,对这些要素数据通过Arcgis和Python进行投影转换,粗重采样,矢量裁剪,精重采样将其构造为六大特征,如图4为本发明实施例的区位特征示意图;图4a为本发明实施例的高程特征示意图,图4b为本发明实施例的坡度特征示意图,图4c为本发明实施例的2000年人口特征示意图,图4d为本发明实施例的距主干道距离特征示意图,图4e为本发明实施例的距次干道距离特征示意图,图4f为本发明实施例的距居民道距离特征示意图。对特征进行标准化处理,使用公式表示如下:

其中,x(l)为预设特征;max(x)为预设特征的最大值;min(x)为预设特征的最小值。

进而融合为区位条件特征,其表达为:

x

其中,x

步骤五、以每一个元胞为单位,计算其区位条件特征的余弦相似度,得到元胞之间的相似矩阵,其中余弦相似度表达为:

其中,sim

步骤六、通过合理假设和多次调参设置相似度阈值和距离阈值为0.995和1000m,对于达到双重阈值约束的元胞建立联系,进而构造区位条件相似图,其中关联权重矩阵表达为:

其中,W

步骤七、提取区位条件相似图中结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似图为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个图卷积层,通过反向传播求梯度更新参数,进而通过上述样本数据集进行训练,获得区位遥相关特征,其中信号x与滤波器g

g

其中,U为拉普拉斯矩阵

步骤八、考虑到数据中的多数类和少数类数量差距较大,基于TomeLinks欠采样解决当前数据不平衡的问题,进而得到用于训练模型的样本数据集,其中TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)

步骤九、以2000年、2010年的特征数据集训练模型,2020年的特征数据集作为验证和精度评价。随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行十次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,即得到土地利用模拟演化结果;网格就是结果。

步骤十、将模拟预测结果与2020年真实土地利用进行对比,由表1和图5所示,如图5为本发明实施例的土地利用模拟演化结果对比示意图;图5a为本发明实施例的模拟结果示意图,图5b为本发明实施例的真实土地利用示意图。

表1本发明土地利用模拟演化结果

模型对于人造地表、水体预测效果较好,对于草地、林地预测效果一般,整体模拟效果较好。同时分析其总体精度(OA系数)、Kappa系数和FOM系数,并与其他主流模型进行对比,由表2所示,

表2本发明方法与其他主流模型的对比

相对于其他模型中表现最好的RF_CA模型,本发明的总体精度提高1.0%,kappa系数提高了7.8%,FoM系数提高了3.9%。综上,本发明能够以较高的精度模拟演化各土地利用,预测效果具有较高的可信度;输出并保存土地利用模拟演化结果,将训练生成土地模拟演化模型对土地利用变化进行预测。

相关技术
  • 基于深度学习的土地利用变化模拟方法
  • 基于CA和SAR的海岸带土地利用变化模拟方法
技术分类

06120113255825