掌桥专利:专业的专利平台
掌桥专利
首页

基于混合空谱信息的无监督高光谱图像分类方法

文献发布时间:2023-06-19 19:28:50


基于混合空谱信息的无监督高光谱图像分类方法

技术领域

本发明涉及高光谱遥感图像技术领域,特别涉及一种基于混合空谱信息的无监督高光谱图像分类方法。

背景技术

高光谱图像分类已成功应用于如军事监视、森林预警和精准农业等多个领域场景,随着便携式高光谱图像采集设备的快速发展,无人机平台和实验室高光谱图像分析取得了很多技术突破,然而采集到的图像数据缺乏足够多的标记数据用于训练分类模型,导致这一技术在实际场景中的应用存在很大的局限性。

目前大多数高光谱图像分类方法都基于有监督分类框架,并在公开标准数据集上得到了很好的分类结果(总体精度OA可达到95%-99%)。在实际应用的过程中,采集到的数据往往来不及标记真值就要求做出分析,并且实际采集图像数据相对于标准数据集像素分布更复杂,存在很多不必要的子类、阴影及噪声,这都对无法依赖任何先验知识和标记信息的无监督高光谱图像分类算法提出了更大的挑战。

在高光谱图像分类方面,无监督的方法主要通过数据聚类的手段实现,然而,高光谱图像数据维度较高、信息量较大不可避免的存在很多冗余的信息数据,因此可能不能完全精准的对所有种类地物类型进行分类,另外,对实际采集的高光谱图像需要在很短的时间内生成分析结果,大多数无监督分类算法计算复杂度较高。因此,发明一种无需参考先验数据标签、耗时较短、仅对高光谱图像数据中主要信息进行处理的分类方法是非常必要的。

发明内容

本发明的目的是为了克服已有技术的缺陷,提出一种基于混合空谱信息的无监督高光谱图像分类方法。

为实现上述目的,本发明采用以下具体技术方案:

一种基于混合空谱信息的无监督高光谱图像分类方法,包括如下步骤:

S1、主成分图像通过熵率超像素分割方法获得二值分割图;将二值分割图应用在原始高光谱图像上以获得分割超像素块,基于分割超像素块生成多个同质区域,去除冗余信息引导数据提纯;

S2、使用超像素的主成分分析方法来对光谱数据进行降维得到主成分分量,利用二维奇异谱分析方法将得到的主成分分量增强空间光谱特性并去除噪声;

S3、基于增强空间光谱特性的主成分分量,使用锚点图谱聚类无监督分类框方法,实现大尺度高光谱图像的无监督分类。

优选的,步骤S1包括如下子步骤:

S11、通过熵率超像素分割算法构建一个图结构G=(V,E),顶点V是要待分割图像的像素,边E为成对像素间的相似性权重组成,通过选择边的子集

其中Tr表示矩阵的迹,H(A)是所构建子图结构G′中基于随机游走得到的熵率项,作为获得紧凑和均匀聚类的标准;B(A)是平衡项,定义为簇分布上具有相似大小的单调递增和次模函数,用以减少不平衡超像素的数量,α≥0是平衡项的权重,argmax表示取最大值,s.t表示在约束条件下;

S12、设原始高光谱图像数据I

其中s

S13、二维奇异谱分析方法包括将I

s′

I

优选的,步骤S2包括如下子步骤:

S21、在主成分域内进行主成分分析之后,谱段数从B减少到B′,其中B′<<B,B′设置为15,B为一百以上,通过将降维的超像素块组合在一起,获得新的图像I′如下:

S22、对于I′内的每个谱段,应用二维奇异谱分析方法来进一步增强特征并去除噪声,特征增强后的高光谱图像I

I

S23、对于单个谱段大小为h×w的图像,设嵌入窗口的大小为u×v(其中1≤u≤h和1≤v≤w),从图像的左上角移动到右下角以构建轨迹矩阵G,窗口中的像素被展开并连接为矩阵轨迹的列向量X∈R

G=(X

GG

/>

其中U

优选的,步骤S3包括如下子步骤:

S31、将图像I

锚点图结构谱聚类方法将输入的高光谱图像表示为无向图,其中每个像素被视为锚点图结构的顶点,顶点间成对的相似性被视为锚点图结构的边,锚点图结构谱聚类方法通过最小化以下目标函数实现高光谱图像分类:

公式(9)为非光滑目标函数,其中

S32、为锚结构样本的子集设置标签预测函数,其中锚结构样本为通过一定的采样间隔s获得,子集

其中,Z是所有样本和所选锚结构样本之间的相似度矩阵,通过放松离散条件并考虑非负和正交约束,用Z带入P=2λY+ZΔ

LY+2λYY

其中Q=Y+2λYY

其中

本发明通过熵率超像素分割方法获取同质区域;基于超像素的主成分分析去除同质区域中的空间冗余信息;再通过二维奇异谱分析方法优化主成分域内冗余信息,增强光谱特征,最后通过锚点图谱聚类无监督分类方法,实现大尺度高光谱图像的无监督分类。本发明相对于已有的有监督分类方法更贴近实际工程应用,相对于已有无监督分类方法可处理图像尺度更大,具有无需先验信息参考、分类精度高、分类速度快等优点。

附图说明

图1是根据本发明实施例提供的基于混合空谱信息的无监督高光谱图像分类方法系统框图。

图2是根据本发明实施例提供的基于混合空谱信息的无监督高光谱图像分类方法的数据集测试结果。

图3是根据本发明实施例提供的基于混合空谱信息的无监督高光谱图像分类方法的数据集测试结果。

图4是根据本发明实施例提供的不同超像素方法的分割结果。

图5是根据本发明实施例提供的三个公共数据集上的聚类结果。

图6是根据本发明实施例提供的五个自收集数据集的聚类结果。

具体实施方式

在下文中,将参考附图描述本发明的实施例。在下面的描述中,相同的模块使用相同的附图标记表示。在相同的附图标记的情况下,它们的名称和功能也相同。因此,将不重复其详细描述。

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,而不构成对本发明的限制。

图1示出了根据本发明实施例提供的基于混合空谱信息的无监督高光谱图像分类方法系统框图。

如图1所示,本发明实施例提供的系统框图主要包括如下步骤:

超像素分割之前,获得所有维度图像的平均值以提取高光谱图像的主要信息。

S1、基于主成分图像通过熵率超像素分割的算法获得二值分割图;将二值分割图应用在原始高光谱图像上以获得分割超像素块,基于超像素分割将输入的高光谱图像转换为多个同质区域,去除冗余信息,引导数据提纯。

步骤S1中数据提纯方法包括基于熵率超像素分割法的超像素分割将输入的高光谱图像转换为多个同质区域,熵率超像素分割法不仅能去除冗余信息,而且有助于将碎片化图像信息合并为同质区域,以有利于后续的分类。步骤S1具体包括如下步骤:

S11、熵率超像素分割方法提取均匀区域,通过比较各种超像素分割方法的性能结果,熵率超像素分割方法被选为最适合我们提取均匀区域的方法,熵率超像素分割的算法构建一个图结构G=(V,E),顶点V是要分割图像的像素,边E边为成对像素间的相似性权重组成;通过选择边的子集

其中Tr表示矩阵的迹,H(A)是子图结构中基于随机游走得到的熵率项,作为获得紧凑和均匀聚类的标准;B(A)是平衡项,定义为簇分布上具有相似大小的单调递增和次模函数,以减少不平衡超像素的数量,α≥0是平衡项的权重,argmax表示取最大值,s.t表示在约束条件下。

S12、设原始高光谱图像数据I

其中s

S13、通过下面公式将输入的高光谱图像I

s′

I

S2、使用基于超像素的主成分分析法来对光谱数据进行降维得到主成分分量,同时抑制噪声和类内不一致性,得到的主成分分量用二维奇异谱分析方法增强空间光谱特性并去除噪声;针对图像I

为进一步增强高光谱图像的可分性和无监督分类方法对不同数据的可适应性,将二维奇异谱分析方法策略引入无监督高光谱分类问题中;在生成同质区域的过程中,每个超像素块中的所有像素值被同时置为该块的平均像素值;为节省计算时间,并不对每个单独的像素进行操作,而是使用基于超像素的主成分分析法来对光谱数据进行降维。

针对主成分分析法提取得到的主成分分量,本发明在主成分域内应用二维奇异谱分析方法用于空间光谱特征增强。步骤S2具体包括如下步骤:

S21、在主成分域内进行主成分分析之后,谱段数从B减少到B′,其中B′<<B(B′设置为15,B为一百以上),通过将降维的超像素块组合在一起,获得新的图像I′如下:

S22、对于I′内的每个谱段,应用主成分域二维奇异谱分析方法来进一步增强特征并去除噪声,特征增强后的高光谱图像I

I

S23、二维奇异谱分析方法通过去除噪声、提高信噪比用以提高分类准确性:对于单个谱段大小为h×w的图像,设嵌入窗口的大小为u×v(其中1≤u≤h和1≤v≤w),从图像的左上角移动到右下角以构建轨迹矩阵G,窗口中的像素被展开并连接为矩阵轨迹的列向量X∈R

G=(X

GG

根据公式(5-8)针对图像I

S3、基于锚点图结构谱聚类算法,实现大尺度高光谱图像的无监督分类。

步骤S3具体包括如下步骤:

S31、对于输入的高光谱图像数据I

基于锚点图结构谱聚类方法首先将输入的高光谱图像I

公式(9)为非光滑目标函数,引入了锚点图结构,其中

S32、为锚结构样本的子集设置标签预测函数,其中锚结构样本为通过一定的采样间隔s获得;子集

其中Z是所有样本和所选锚样本之间的相似度矩阵,通过放松离散条件并考虑非负和正交约束,公式(10)改写为

LY+2λYY

其中Q=Y+2λYY

其中

图2-图3示出了根据本发明实施例提供的基于混合空谱信息的无监督高光谱图像分类方法的数据集测试结果。

如图2-图3所示,本发明实施例提供的三个公测数据集和五个自采数据集上进行的算法测试,通过逐步添加提出的策略即基线(B)、基线和数据优化(B+DO)、基线与数据确定(B+DD)以及所提议方法的完整版本的程序结果。

为了进行全面比较,分别在高光谱图像数据集的标记像素和未标记像素上测试,图2的最上面为Salinas原始图像、中间为Salinas A原始图像,最下面为Indian Pines原始图像、地面真相和分类结果。

图3为自收集数据集SC-1至SC-5的原始图像、它们的地面真值以及不同策略下的分类结果,除最后一列结果外,所有结果仅针对标记像素。

图4示出了根据本发明实施例提供的不同超像素方法的分割结果。

如图4所示,本发明实施例提供的不同超像素方法的分割结果从上到下为SalinasA、Salinas和Indian Pines数据集。

数据优化策略不仅可以应用在高光谱图像分类问题当中,还可以应用于普通RGB图像的分类当中,不仅可以应用于无监督框架下的高光谱图像分类,也可以应用于有监督框架下的高光谱图像分类。

图5示出了根据本发明实施例提供的三个公共数据集上的聚类结果,如图5所示,其中“NaN”表示由于内存不足而没有生成的分类结果,“-”表示没有可参考的结果,粗体表示所有方法中的最佳结果,下划线表示无监督方法的最佳结果。

图6示出了根据本发明实施例提供的五个自收集数据集的聚类结果,如图6所示,其中“NaN”表示由于内存不足而没有分类结果,“-”表示没有可参考的结果,粗体表示所有方法的最佳结果,下划线表示无监督方法的最佳效果。

本发明能够在更大尺寸的高光谱图像上进行分类:

图5-图6展示的为公测数据集和自采数据集上各类指标的量化结果,其中在大于500*500大小的数据集(Salinas,SC-1~SC-5)上,其他同类方法会内存溢出或得不到较好的分类结果,而本发明算法能够得到相对最好的分类结果。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

以上本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所作出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。

技术分类

06120115924987