掌桥专利:专业的专利平台
掌桥专利
首页

一种高光谱图像分类方法、装置以及计算设备

文献发布时间:2023-06-19 10:24:22


一种高光谱图像分类方法、装置以及计算设备

技术领域

本申请涉及高光谱图像分类领域,特别是涉及训练样本的扩展技术。

背景技术

高光谱传感器可以捕获具有高光谱分辨率的数百个光谱带。高光谱图像(HSI)可应用于很多领域,例如土地覆盖检测、环境监测、医学诊断和军事侦察等。高光谱分类是一个重要的研究课题,它为高光谱图像中的每个像素分配标签。传统的经典算法,例如K近邻(KNN)、最大似然分类(MLC)、支持向量机(SVM)和人工神经网络(ANN)已成功地以可接受的精度应用于高光谱分类。

包含在高光谱图像中的详细而丰富的光谱信息可以在不同类别之间进行更精确的区分。由于某些实际限制,HSI高光谱分辨率的代价是其有限的空间分辨率,这导致混合像素的广泛存在。每个混合像素中都包含一个以上的类别,其光谱响应实际上是传感器瞬时视场(IFOV)中呈现的各种材料的响应的混合,因此,传统的像素级硬分类不适用于混合像素分类。

亚像素映射是一种解决该问题的公知技术。每个混合像素分为几个子像素,不同的子像素可能属于同一类。子像素映射将混合像素内每个类别的丰度作为输入,并预测其中的子像素空间分布。即,亚像素映射输出的是具有更高空间分辨率的硬分类图。

另一方面,HSI维度的诅咒需要大量的训练样本才能确保HSI监督分类的准确性。而实际上,可用的训练样本通常非常有限。

深度神经网络能够通过深度学习来学习高级功能。堆栈自动编码器(SAE)、深度置信网络(DBN)和卷积神经网络(CNN)作为典型的深度神经网络体系结构都能够用于基于视觉的问题,尤其是CNN具有独特的局部感受野特征,在图像分类中起着主要作用。CNN是一种典型的监督模型,需要大量的训练数据集来触发其功能,但是,高光谱图像仅能提供一定数量的标记样本。尽管如此,在高光谱图像分类的不同实现中,CNN仍被广泛用于提供比SVM更好的性能。所有前述算法都取决于具有平衡分布的训练集。

通常,在大多数情况下,传统的高光谱分类算法在大型分类上往往比小型分类具有更好的性能,这意味着这些算法仅专注于提高整体准确性,而忽略了特定于类别的准确性。人们对高光谱图像分类的普遍共识是,为了提高整体准确性,对大尺寸数据的正确分类比小尺寸数据的贡献更大。而实际上,小类别的正确分类比大类别的分类更重要,因为它们通常是感兴趣的前景类。但是,小型班级的人数远远超过大型班级的人数。因此,最近的研究集中在不平衡的数据问题上,特别关注小型样本集或类别。

综上所述,高光谱分类存在以下问题:

1、高光谱图像仅能提供一定数量的标记样本,无法满足CNN和HSI维度诅咒的需求;

2、高光谱图像训练样本有限的问题极大影响了亚像素映射的准确性。

发明内容

本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。

根据本申请的一个方面,提供了一种高光谱图像分类方法,包括:

采用半监督学习策略对原始训练集进行扩充,得到第一训练集D;

采用OCSP算法对所述第一训练集进行扩充,得到第二训练集D′;

利用FD对单卷积层神经网络进行训练,得到训练后的单卷积层神经网络,FD={D,D′};

利用所述训练后的单卷积层神经网络对待分类的高光谱图像进行分类。

可选地,所述的采用半监督学习策略对原始训练集进行扩充,得到第一训练集D包括:

将集合

将当前训练集

其中,v表示所述训练样本X

λ为全局正则化参数,m为

根据所述系数

利用样本

如果所述增广训练集中没有像素被包围所述增广训练集的训练样本数量满足要求,则将所述增广训练集作为第一训练集D;否则,进入第k+1个循环。

可选地,所述的采用OCSP算法对所述第一训练集D进行扩充,得到第二训练集D′包括:

根据所述第一训练集D中训练样本的光谱范围生成人工样本集R;

对所述人工样本集R施加梯度约束,以对所述人工样本集R中的样本进行过滤,得到合成样本R

通过

可选地,所述的单卷积层神经网络依次包括输入层、卷积层、最大池化层、全连接层和输出层。

可选地,所述卷积层使用tanh作为激活函数,所述最大池化层使用maxpooling作为激活函数,所述全连接层使用tanh作为激活函数,所述输出层使用softmax作为激活函数。

本申请的高光谱图像分类方法,由于采用迭代循环的半监督学习策略来扩充当前的训练集,采用OCSP进行样本扩展,因此能够获得足够数量的训练样本,提高卷积神经网络的高光谱分类精度,增强了所述高光谱图像分类装置的高光谱图像分类性能。

根据本申请的另一个方面,提供了一种高光谱图像分类装置,包括:

第一数据扩充模块,其配置成采用半监督学习策略对原始训练集进行扩充,得到第一训练集D;

第二数据扩充模块,其配置成采用OCSP算法对所述第一训练集进行扩充,得到第二训练集D′;

训练模块,其配置成利用FD对单卷积层神经网络进行训练,得到训练后的单卷积层神经网络,FD={D,D′};和

分类模块,其配置成利用所述训练后的单卷积层神经网络对待分类的高光谱图像进行分类。

可选地,所述的第一数据扩充模块包括:

初始化子模块,其配置成将集合

系数计算子模块,其配置成将当前训练集

其中,i=1,2,…,n,

λ为全局正则化参数,m为

分数丰度计算子模块,其配置根据所述系数

更新子模块,其配置成利用样本

判断子模块,其配置成如果所述增广训练集中没有像素被包围所述增广训练集的训练样本数量满足要求,则将所述增广训练集作为第一训练集D;否则,进入第k+1个循环。

可选地,所述的第二数据扩充模块包括:

人工样本集生成子模块,其配置成根据所述第一训练集D中训练样本的光谱范围生成人工样本集R;

过滤子模块,其配置成对所述人工样本集R施加梯度约束,以对所述人工样本集R中的样本进行过滤,得到合成样本R

样本选择子模块,其配置成通过

可选地,所述的单卷积层神经网络依次包括输入层、卷积层、最大池化层、全连接层和输出层,所述卷积层使用tanh作为激活函数,所述最大池化层使用maxpooling作为激活函数,所述全连接层使用tanh作为激活函数,所述输出层使用softmax作为激活函数。

本申请的高光谱图像分类装置,由于采用迭代循环的半监督学习策略来扩充当前的训练集,采用OCSP进行样本扩展,因此能够获得足够数量的训练样本,提高卷积神经网络的高光谱分类精度,增强了所述高光谱图像分类装置的高光谱图像分类性能。

根据本申请的第三个方面,提供了一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现本申请所述的方法。

根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:

图1是根据本申请一个实施例的一种高光谱图像分类方法的示意性流程图;

图2是图1中步骤S1的示意性流程图;

图3是本申请一个实施例的半监督学习策略单个循环中训练数据集增强情况的示意图;

图4是图1中步骤S2的示意性流程图;

图5是根据本申请一个实施例的一种高光谱图像分类装置的结构示意图;

图6是图5中第一数据扩充模块的结构示意图;

图7是图5中第二数据扩充模块的结构示意图;

图8是根据本申请一个实施例的一种计算设备的结构示意图;

图9是根据本申请一个实施例的一种计算机可读存储介质的结构示意图。

具体实施方式

图1是根据本申请一个实施例的一种高光谱图像分类方法的示意性流程图。所述方法一般性地可包括:

步骤S1、采用半监督学习策略对原始训练集进行扩充,得到第一训练集D;

步骤S2、采用OCSP算法对所述第一训练集进行扩充,得到第二训练集D′;

步骤S3、利用FD对单卷积层神经网络进行训练,得到训练后的单卷积层神经网络,FD={D,D′};

步骤S4、利用所述训练后的单卷积层神经网络对待分类的高光谱图像进行分类。

原始训练集一共有C个分类,c代表类的标签,c=1,2,...,C。原始训练集

如图2所示,所述步骤S1包括:

步骤S11、在第k次迭代中,将集合

步骤S12、对于将当前训练集

系数

其中,

λ为全局正则化参数,m为

步骤S13、根据所述系数

由于样本空间小,采因从原始训练样本集中通过暴力选择得到一个扩充的训练样本集,为了整合空间上的信息,从该扩充的训练样本集中选择最靠近

样本

其中,α

式(4)中的

步骤S14、利用样本

如果

采用同样的方式,利用

步骤S15、如果所述增广训练集中没有像素被包围所述增广训练集的训练样本数量满足要求,则将所述增广训练集作为第一训练集D;否则,进入第k+1个循环。

图3描绘了单个循环中的训练集扩充过程。其中的

如图4所示,所述步骤S2包括:

步骤S21、根据小类原始训练数据集(即所述第一训练集D,D={d

R={d

其中允许p≠q。d

步骤S22、施加梯度约束以过滤R中那些严重偏离实际训练样本的合成样本,得到合成样本R

这里

指示性表示式可以写成:

r=[r

其中,

根据上述步骤,可以进一步从R中选择实例,以形成新的样本集R

生成样本集R

步骤S23、通过

从全局角度来看,表现出相似光谱特征的样本很可能属于同一类别,从局部角度来看,空间上相邻的像素更有可能共享相同的类别标签,因此,步骤S2的训练集扩充策略是可行的。

所述步骤S3中,输入单层神经网络的数据集FD={D,D′},卷积神经网络由输入层、卷积层、最大池化层、全连接层和输出层组成,卷积层使用tanh作为激活函数,最大池化层使用maxpooling作为激活函数,全连接层使用tanh作为激活函数,输出层使用softmax作为激活函数,每个样本像素都被用作输入层的输入。

输入层的大小为(n

在单卷积层神经网络中,卷积层和最大池化层可以作为输入高光谱数据集的特征提取器。完全连接的层可以识别为可训练的分类器。

本实施例给出了一组神经网中不同参数的取值,但实际的任务中图像的大小可能会有不同,导致神经网络的参数会有变化,且本申请并不局限于给定的这组参数。神经网中各种参数的取值要根据输入的数据来决定,并在训练结束后选择一组最优解。这组参数为:

n

图5是根据本申请一个实施例的一种高光谱图像分类装置的结构示意图。如图5所示,所述的一种高光谱图像分类装置包括:

第一数据扩充模块1,其配置成采用半监督学习策略对原始训练集进行扩充,得到第一训练集D;

第二数据扩充模块2,其配置成采用OCSP算法对所述第一训练集进行扩充,得到第二训练集D′;

训练模块3,其配置成利用FD对单卷积层神经网络进行训练,得到训练后的单卷积层神经网络,FD={D,D′};和

分类模块4,其配置成利用所述训练后的单卷积层神经网络对待分类的高光谱图像进行分类。

如图6所示,所述的第一数据扩充模块1包括:

初始化子模块11,其配置成将集合

系数计算子模块12,其配置成将当前训练集

其中,i=1,2,…,n,

λ为全局正则化参数,m为

分数丰度计算子模块13,其配置根据所述系数

更新子模块14,其配置成利用样本

判断子模块15,其配置成如果所述增广训练集中没有像素被包围所述增广训练集的训练样本数量满足要求,则将所述增广训练集作为第一训练集D;否则,进入第k+1个循环。

如图7所示,所述的第二数据扩充模块2包括:

人工样本集生成子模块21,其配置成根据所述第一训练集D中训练样本的光谱范围生成人工样本集R;

过滤子模块22,其配置成对所述人工样本集R施加梯度约束,以对所述人工样本集R中的样本进行过滤,得到合成样本R

样本选择子模块23,其配置成通过

所述的单卷积层神经网络依次包括输入层、卷积层、最大池化层、全连接层和输出层,所述卷积层使用tanh作为激活函数,所述最大池化层使用maxpooling作为激活函数,所述全连接层使用tanh作为激活函数,所述输出层使用softmax作为激活函数。

本申请实施例的一种高光谱图像分类装置的工作原理及效果与本申请实施例的一种高光谱图像分类方法的原理及效果相同,在此不再赘述。

本申请实施例还提供了一种计算设备,参照图8,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。

本申请实施例还提供了一种计算机可读存储介质。参照图9,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。

本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。

以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

相关技术
  • 一种高光谱图像分类方法、装置以及计算设备
  • 一种基于形态学的高光谱图像分类方法及装置
技术分类

06120112531865