掌桥专利:专业的专利平台
掌桥专利
首页

一种土地利用分类方法及系统

文献发布时间:2023-06-19 16:11:11



技术领域

本发明涉及土地利用分类技术领域,特别是涉及一种基于注意力机制卷积神经网络和条件随机场的土地利用分类方法及系统。

背景技术

目前,对遥感影像进行高精度的土地利用分类是一个巨大的挑战,传统的机器学习方法和图像语义分割模型分类效果难以满足高精度要求。经典土地分类的图像语义分割模型存在着无法充分利用图像的空间和上下文信息的问题,导致其不能达到高精度的土地利用分类。

发明内容

本发明的目的是提供一种土地利用分类方法及系统,引入通道注意力模块和空间位置注意力模块、空间金字塔池化模块对目标土地影像进行分类,充分利用图像的空间和上下文信息,以提高土地利用的分类精度,采用条件随机场对土地利用分类模型的分类结果进行优化,以进一步提高土地利用的分类精度。

为实现上述目的,本发明提供了如下方案:

本发明提出了一种土地利用分类方法,所述方法包括:

获取目标土地影像;

将所述目标土地影像输入至训练好的土地利用分类模型,对所述目标土地影像中各像素进行土地利用类型分类,得到第一土地分类图像;

所述土地利用分类模型包括编码器、双路注意力模块、空间金字塔池化模块和解码器;所述双路注意力模块包括第一通道注意力模块和第一空间位置注意力模块;所述第一通道注意力模块用于对所述编码器提取的各局部特征进行有效特征的提取,得到通道注意力加权特征;所述第一空间位置注意力模块用于对所述编码器提取的局部特征进行加强,得到空间注意力加权特征;所述空间金字塔池化模块,用于对所述通道注意力加权特征和所述空间注意力加权特征进行融合,得到融合特征;

将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行土地利用类型分类,得到第二土地分类图像。

可选地,所述编码器,包括密集连接块、过渡层和第二通道注意力模块,用于对输入的所述目标土地影像进行特征提取。

可选地,所述解码器,包括转置卷积模块、密集连接块、深度可分离卷积模块和第二空间位置注意力模块,用于根据所述融合特征,解码得到所述第一土地分类图像。

可选地,所述将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行分类,具体包括:

根据所述条件随机场确定所述第一土地分类图像中的相似像素,将所述相似像素分配为相同的土地利用类型。

可选地,在所述将所述目标土地影像输入至训练好的土地利用分类模型之前,还包括:

根据样本土地影像以及样本土地影像中各像素对应的土地利用类型标签对所述土地利用分类模型进行训练,得到训练好的土地利用分类模型。

可选地,在所述根据样本土地影像以及样本土地影像中各像素对应的土地利用类型标签对所述土地利用分类模型进行训练之前,还包括:

获取样本土地原始影像;

采用旋转、平移和缩放方法对所述样本土地原始影像进行图像增强处理,得到所述样本土地影像;

对所述样本土地影像中各像素的土地利用类型进行标注。

可选地,采用梯度递减方法对所述土地利用分类模型进行训练。

本发明还提出了一种土地利用分类系统,该系统包括:

目标土地影像获取模块,用于获取目标土地影像;

第一土地分类图像确定模块,用于将所述目标土地影像输入至训练好的土地利用分类模型,对所述目标土地影像中各像素进行土地利用类型分类,得到第一土地分类图像;

所述土地利用分类模型包括编码器、双路注意力模块、空间金字塔池化模块和解码器;所述双路注意力模块包括第一通道注意力模块和第一空间位置注意力模块;所述第一通道注意力模块用于对所述编码器提取的各局部特征进行有效特征的提取,得到通道注意力加权特征;所述第一空间位置注意力模块用于对所述编码器提取的局部特征进行加强,得到空间注意力加权特征;所述空间金字塔池化模块,用于对所述通道注意力加权和所述空间注意力加权特征进行融合,得到融合特征;

第二土地分类图像确定模块,用于将将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行土地利用类型分类,得到第二土地分类图像。

可选地,还包括:

相似像素确定单元,用于根据所述条件随机场确定所述第一土地分类图像中的相似像素,将所述相似像素分配为相同的土地利用类型。

可选地,还包括:

训练模块,用于根据样本土地影像以及样本土地影像中各像素对应的土地利用类型标签对所述土地利用分类模型进行训练,得到训练好的土地利用分类模型。

根据本发明提供的具体实施例,公开了以下技术效果:本发明提供的土地利用分类方法及系统,包括:获取目标土地影像;将所述目标土地影像输入至训练好的土地利用分类模型,对所述目标土地影像中各像素进行土地利用类型分类,得到第一土地分类图像;所述土地利用分类模型包括编码器、双路注意力模块、空间金字塔池化模块和解码器;所述双路注意力模块包括第一通道注意力模块和第一空间位置注意力模块;所述第一通道注意力模块用于对所述编码器提取的各局部特征进行有效特征的提取,得到通道注意力加权特征;所述第一空间位置注意力模块用于对所述编码器提取的局部特征进行加强,得到空间注意力加权特征;所述空间金字塔池化模块,用于对所述通道注意力加权特征和所述空间注意力加权特征进行融合,得到融合特征;将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行土地利用类型分类,得到第二土地分类图像。本发明在土地利用分类模型中引入通道注意力模块和空间位置注意力模块、空间金字塔池化模块对目标土地影像进行分类,充分利用了图像的空间和上下文信息,提高了土地利用的分类精度,采用条件随机场对土地利用分类模型的分类结果进行优化,进一步提高了土地利用的分类精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1提供的土地利用分类方法流程示意图;

图2为本发明实施例1中的土地利用分类模型结构图;

图3为本发明实施例1中的DenseNet网络结构图;

图4为本发明实施例1中的密集连接块的组合函数结构图;

图5为本发明实施例1中的通道注意力模块结构图;

图6为本发明实施例1中的空间位置注意力模块结构图;

图7为本发明实施例1中的空间金字塔池化模块结构图;

图8为本发明实施例2提供的土地利用分类系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种土地利用分类方法及系统,引入通道注意力模块和空间位置注意力模块、空间金字塔池化模块对目标土地影像进行分类,充分利用图像的空间和上下文信息,以提高土地利用的分类精度,采用条件随机场对土地利用分类模型的分类结果进行优化,以进一步提高土地利用的分类精度。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

本发明提供了一种土地利用分类方法,参见图1,该方法包括:

步骤S1:获取目标土地影像。

步骤S2:将所述目标土地影像输入至训练好的土地利用分类模型,对所述目标土地影像中各像素进行土地利用类型分类,得到第一土地分类图像。

所述土地利用分类模型包括编码器、双路注意力模块、空间金字塔池化模块和解码器;所述双路注意力模块包括第一通道注意力模块和第一空间位置注意力模块;所述第一通道注意力模块用于对所述编码器提取的各局部特征进行有效特征的提取,得到通道注意力加权特征;所述第一空间位置注意力模块用于对所述编码器提取的局部特征进行加强,得到空间注意力加权特征;所述空间金字塔池化模块,用于对所述通道注意力加权特征和所述空间注意力加权特征进行融合,得到融合特征。

所述编码器,包括密集连接块、过渡层和第二通道注意力模块,用于对输入的所述目标土地影像进行特征提取。所述解码器,包括转置卷积模块、密集连接块、深度可分离卷积模块和第二空间位置注意力模块,用于根据所述融合特征,解码得到所述第一土地分类图像。

步骤S3:将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行土地利用类型分类,得到第二土地分类图像。

在本实施例中,步骤S2所述土地利用分类模型(即DADNet模型)基于DenseNet和通道与空间位置注意力机制搭建的卷积神经网络,前者的特征是重复利用,减少参数量,提高运算效率;后者是可以解决不同尺度下物体语义分割,以及相似特征融合,DADNet模型(土地利用分类模型)结构如图2所示,编码器与解码器中加入DenseNet,下采样结束后加入双路注意力模块。

DADNet模型的所述编码器包括DenseNet的密集连接块与过渡层和第二通道注意力模块(ChannelAttentionModule,CAM),其中的卷积核大小依次为32*32、64*64、128*128、256*256和512*512。

经过一系列下采样后的特征图,分别输入双路注意力模块中的SAM和CAM,模块前后特征图大小保持一致,再通过空间金字塔池化模块对二者特征(通道注意力加权特征和空间注意力加权特征)相加融合。所述解码器中包括转置卷积和第二空间位置注意力模块,解码器对融合后的特征图采用转置卷积(Transpose Convolution)进行上采样,跳跃连接串联前后,结合来自解码器的高级语义特征和来自编码器中对应尺寸特征图的高级语义特征。最后,在深度可分离卷积模块(Separable Convolution,Separable Conv)中添加softmax激活函数输出分割结果,即得到所述第一土地分类图像。

DenseNet是在ResNet上改进后的密集连接网络。假设组合函数是H

x

ResNet增加了跳跃连接,将第l层与前面2至3层短路连接起来,连接方式是元素级相加,输出如公式(2)。这样在一定程度上解决了梯度爆炸,实现特征共享。但是相加的方式连接,可能会导致网络信息流的损失。

x

DenseNet为了提高信息流在网络中的利用率,采用密集连接的方式,通过前向反馈第l层的输入是前面所有层的输出特征图,直接使用串联的方式连接,输出如下,实现了特征复用,提升了利用效率。

x

DenseNet网络结构主要由密集连接块和过渡层组成,如图3所示。密集连接块每层的特征图大小一致,可以在通道上串联起来,其组合函数结构是3*3的深度可分离卷积层(Separable Conv)+批量归一化层(Batch Normal,BN)+ReLu(修正线性)激活函数层,如图4所示。过渡层用于连接相邻两个密集连接块,并用来降低特征图大小。在DADNet中编码器过渡层结构是1*1的Separable Conv+2*2的最大池化(MaxPooling)层,解码器中是1*1的Separable Conv+3*3的Transpose Convolution层。

本发明通过引入通道注意力模块(CAM)和空间位置注意力模块(SAM),来解决全局依赖问题,在一定程度上融合不同尺寸物体的相似特征和避免大物体特征影响不明显小物体的标签。如图5所示的CAM结构图,CAM用于对所述编码器提取的各局部特征进行有效特征的提取,并将其进行融合,得到通道注意力加权特征;整个模块没有卷积层,将输入特征图A经过reshape、相乘、转置、softmax、相加和相乘等运算操作完成输出特征图E。具体见公式(4)、公式(5)。A和E分别代表输入与输出特征图,i、j为行列数,β是可自学习参数,初始值为0,x是通过每行做softmax运算得到的。

SAM用于对所述编码器提取的局部特征进行加强,得到空间注意力加权特征。SAM可以使局部特征联系上下文语义来达到增强特征目的,相似特征经过模块计算后进行融合,有利于进行语义上的分割,如图6、式(6)和式(7)所示。与通道注意力模块不同的是,输入特征图首先进行卷积操作得到B、C和D三个特征图,再进行reshape、transpose和相乘等一系列计算输出特征图E,与A形状保持一致。另外,参数S

最后,特征图E通过与D线性组合进行输出,α也是自学习参数,初始值为0。公式如下。

在高分辨率影像中,不同尺度地物具有明显边界,为了增加土地利用分类模型对多尺度地物的识别能力,采用空间金字塔池化模块(ASPP)融合多尺度信息,其通过一组不同采样率的空洞卷积来学习不同尺度地物特征,从而来提高多尺度地物分割精度。ASPP结构如图7所示,具体计算过程如下:

Y=Concat(H

Concat(·)表示对不同尺度的特征结果进行拼接操作,H

步骤S3中,将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行分类,具体包括:

根据所述条件随机场确定所述第一土地分类图像中的相似像素,将所述相似像素分配为相同的土地利用类型。

Lafferty等人在2001年提出条件随机场(CRFs)是一种鉴别式概率模型,融合了最大熵模型和马尔可夫模型的特点,主要用于序列标注任务,近年来常用在语义分割上,也取得很好效果。如Krahenbuhl等人利用改进后的全连接CRFs进行有效的图像分割,肖春娇等人通过深度融合网络CRFs对遥感图像进行语义分割,对边缘轮廓进行精确识别。

CRFs在图像语义分割领域中,常用于同时对比原始图像和预测标签图像的上下文信息,根据像素之间的关系,再对类验证概率进行建模。依据Hammersley-Clifford定理证明,公式(9)中I表示给定的高分辨率遥感影像,X是相应的标签图像的后验概率,其服从吉布斯分布:

其中,Z(I)是归一化因子,

E(x)=∑

其中,Φ

公式(11)中,若x

一种高斯核函数同时依赖于位置和光谱信息,另一种只依赖于位置信息。通过线性组合形成CRFs模型,进一步学习空间上下文关系,从而细化边缘轮廓和提高分割精度。

在本实施例中,在所述将所述目标土地影像输入至训练好的土地利用分类模型之前,还包括:

根据样本土地影像以及样本土地影像中各像素对应的土地利用类型标签对所述土地利用分类模型进行训练,得到训练好的土地利用分类模型。在所述根据样本土地影像以及样本土地影像中各像素对应的土地利用类型标签对所述土地利用分类模型进行训练之前,还包括:

获取样本土地原始影像;

采用旋转、平移和缩放方法对所述样本土地原始影像进行图像增强处理,得到所述样本土地影像;

对所述样本土地影像中各像素的土地利用类型进行标注。

采用梯度递减方法对所述土地利用分类模型进行训练。

在本实施例中,武汉大学官网下载获取GaofenImage Dataset的large-scaledataset作为样本土地原始影像以及样本土地原始影像中各像素对应的土地利用类型标签的来源。

对样本土地原始影像进行预处理:首先按照一定尺寸大小进行数据裁剪,删除标注错误的地物样本(例如,forest地物被错误标注为meadow地物等。),清洗数据。在此基础上采用旋转、平移和缩放方法对样本土地原始影像进行图像增强得到所述样本土地影像,完成对现有数据集进行扩充。根据8:1:1的比例将土地利用数据集划分为训练集、验证集和测试集。

将土地利用数据集的训练集和验证集输入土地利用分类模型中,按照梯度递减方法进行深度学习,直到训练集和验证集拟合后,训练结束,得到训练好的土地利用分类模型。将土地利用数据集的测试集输入DADNet模型,预测得到分割后的第一样本土地分类图像。将所述第一样本土地分类图像输入条件随机场中,进一步优化,其中,根据Overallaccuracy和MIoU精度,选择最优迭代次数,从而得到条件随机场优化后的第二样本土地分类图像。选择Recall、Precision、F1-score、OverallAccuracy和MIoU精度对第二样本土地分类图像进行多方位测试评定验证。若验证通过,则得到最终土地利用分类结果图。

本发明提出的一种土地利用分类方法,无论是目视效果,还是评价指标,都要比FCN-8s、BiSeNet模型的分类效果更好。与FCN-8s、BiSeNet模型相比总体精度分别提高7.36%和1.61%。同时,发现CRFs对FCN-8s、BiSeNet和DADNet等模型均能起到提升分类结果精度的作用。通过随机选取单幅测试集影像进行结果测试,发现与未结合CRFs之前相比分别提升了0.70%、1.23%和0.42%。而在三种已结合的模型中,本发明的总体分类精度最高,达到93.04%。可见,本发明能够有效提升土地利用分类结果的精度,改善分类效果。

本发明的土地利用分类模型采用了两种注意力机制,其中空间位置注意力模块将像素融合其他每个像素的位置信息,把其中相似的空间特征互相关联起来,从而防止出现地物分类错误;而通道注意力模块是在构建通道特征图之间的相互依赖性,通过这种通道特征图之间的相互关系,可以得到通道的权重大小,抑制不重要的语义特征,关注重要语义特征,以提高特定语义的特征表示。因此,对这两个注意力模块进行特征融合,不仅充分利用空间长程的上下文信息,也有效增强了语义特征表示。另外,CRFs可以对分类结果进一步优化,通过描述像素点之间的关系,鼓励相似像素分配相同的标签,而相差较大的像素分配不同标签,从而可以综合其中的全局信息与局部信息,增加空间上下文关系,融入不同尺度的细节信息,使边缘轮廓更加精确细化,降低噪声的影响,减少空洞的问题,分类效果整体性更加连续。

实施例2

本发明还提供了一种土地利用分类系统,参见图8,该系统包括:

目标土地影像获取模块T1,用于获取目标土地影像;

第一土地分类图像确定模块T2,用于将所述目标土地影像输入至训练好的土地利用分类模型,对所述目标土地影像中各像素进行土地利用类型分类,得到第一土地分类图像;

所述土地利用分类模型包括编码器、双路注意力模块、空间金字塔池化模块和解码器;所述双路注意力模块包括第一通道注意力模块和第一空间位置注意力模块;所述第一通道注意力模块用于对所述编码器提取的各局部特征进行有效特征的提取,得到通道注意力加权特征;所述第一空间位置注意力模块用于对所述编码器提取的局部特征进行加强,得到空间注意力加权特征;所述空间金字塔池化模块,用于对所述通道注意力加权和所述空间注意力加权特征进行融合,得到融合特征;

第二土地分类图像确定模块T3,用于将将所述第一土地分类图像输入至条件随机场中,对所述第一土地分类图像中各像素进行土地利用类型分类,得到第二土地分类图像。

所述系统还包括:

相似像素确定单元,用于根据所述条件随机场确定所述第一土地分类图像中的相似像素,将所述相似像素分配为相同的土地利用类型。

所述系统还包括:

训练模块,用于根据样本土地影像以及样本土地影像中各像素对应的土地利用类型标签对所述土地利用分类模型进行训练,得到训练好的土地利用分类模型。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术分类

06120114729388