掌桥专利:专业的专利平台
掌桥专利
首页

一种基于快速嵌入式谱分析的高光谱图像稀疏特征选择方法

文献发布时间:2023-06-19 13:29:16


一种基于快速嵌入式谱分析的高光谱图像稀疏特征选择方法

技术领域

本发明属于模式识别领域,特别涉及一种基于快速嵌入式谱分析的高光谱图像稀疏特征选择方法。

背景技术

特征选择技术是模式识别领域的一个重要的研究课题,已经被广泛应用于高光谱图像波段选择、人脸识别等实际应用场景中。随着高光谱技术的发展,高光谱成像已经广泛应用于地物分类,如何对高维度的高光谱图像进行特征选择,保留数据的物理意义的同时减少数据冗余、提取数据的关键特征,具有重大的实际意义。特征选择旨在从高维特征中获得满足实际的任务需求的、信息最丰富、最具代表性特征的特征子集。此外,它不仅减少数据冗余,消除噪声,同时还保留了原始数据的物理意义。特征选择方法作为减少数据存储空间、提高模型泛化能力的有效手段。

陈彤,陈秀宏(《特征自表达和图正则化的鲁棒无监督特征选择》,智能系统学报:1-8[2021-09-03].http://kns.cnki.net/kcms/detail/23.1538.TP.20210622.0900.002.html.)中基于图学习和谱分析进行嵌入式特征选择,并采用投影矩阵的l

发明内容

本发明解决的技术问题是:针对已经提出的嵌入式特征选择方法的模型稀疏性不强并且对参数敏感问题,本发明提出了一种基于快速嵌入式谱分析的高光谱图像稀疏特征选择方法。

本发明的技术方案是:一种基于快速嵌入式谱分析的高光谱图像稀疏特征选择方法,其特征在于,包括以下步骤:

步骤1:获取光谱特征维度均为d的高光谱图像,像素点样本总数为n,

步骤2:基于步骤1中建立的像素点样本表示和像素点样本的标签向量,采用二分K均值算法获取锚点矩阵;

步骤3:基于步骤2中获得的锚点矩阵构造自适应K近邻图;

步骤4:基于步骤2中得到的K近邻图构建最优化模型并进行求解,最终得到被选择特征的序号。

本发明进一步的技术方案是:所述步骤2中包括以下子步骤:

步骤2.1:首先定义一个聚类中心矩阵

步骤2.2:计算

计算Δe=e

步骤2.3:设置锚点数为p,计算指示向量g指示的两类的所有样本的均值作为锚点;如果锚点数达到p(收敛条件替换掉)停止,否则对于所有子类重复步骤2.1-2.3,直到锚点数达到p,即满足要求,得到锚点矩阵

本发明进一步的技术方案是:所述步骤3中包括以下子步骤:

步骤3.1:构建距离矩阵

步骤3.2:对于每一个样本点x

其中

步骤3.3:获得自适应图的拉普拉斯矩阵:相似度矩阵

本发明进一步的技术方案是:所述步骤4中,包括以下步骤:

步骤4.1:基于l

其中α是正则项参数,

步骤4.2:对最优模型进行求解,包括以下子步骤:

步骤4.2.1:F没有约束直接求导可得:

步骤4.2.2:已知F的表达式,目标函数可以转化为

其中,

步骤4.2.3:判断

步骤4.2.4:计算||ω

本发明进一步的技术方案是:所述步骤4.2.3中,

(1)将矩阵

(2)由索引向量计算行提取矩阵

(3)由行提取矩阵计算

(4)得到

(1)初始化W

(2)计算

(3)由大到小的顺序提取矩阵Γ

(4)由索引向量计算行提取矩阵

(5)由行提取矩阵计算

(6)更新内循环

发明效果

本发明的技术效果在于:本方法首先采用二分K-均值方法快速选择锚点,基于锚点构建自适应近邻图加快构图速度减少时间复杂度。其次,采用谱分析对数据结构进行快速分析,并引入F范数正则项以保持数据的流形结构,尽可能保持子空间的类信息。最后引入l

具体来说,采用本发明的方法有益效果主要包括:建立了基于快速嵌入谱分析的高光谱稀疏特征选择方法模型,采用谱分析对数据结构进行快速分析,可以得到原始高光谱数据特征对提取特征的贡献分布。

(1)引入F范数正则化使原始高光谱像素点样本对子空间特征的贡献分布逼近使类信息损失最小的F,保持数据的流形结构,尽可能保持子空间特征。避免了现有高光谱特征选择算法对于光谱波段特征信息的判别能力不强。

(2)引入l

附图说明

图1是算法流程图。

图2是实际高光谱图像场景的灰度图像,

图3是地物分类精度结果图

具体实施方式

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

为下面结合附图对本发明的技术方案进行详细说明。

本发明基于快速谱分析的稀疏特征选择方法基本流程如图1所示,下面结合对实际场景的高光谱图像的地物分类实例说明本发明的具体实施方式,但本发明的技术内容不限于所述的范围。

本发明是通过以下技术方案实现的,基于快速谱分析的稀疏特征选择方法,其具体步骤如下:

(1)构建数据矩阵、标签向量。

获得特征维度为d的n个样本,

x

(2)采用二分K均值算法获取锚点矩阵。

二分K均值是采用二叉树的形式执行K均值算法。对于二分类问题的可以理解为解决如下问题

①初始化:聚类中心矩阵

②计算

③计算指示向量g指示的两类的所有样本的均值作为锚点。如果锚点数达到收敛条件停止,否则对于所有子类重复步骤①-③,直到锚点数,即子类数满足要求,得到锚点矩阵

(3)基于锚点进行自适应K近邻图的构建。

①构建距离矩阵

②对于每一个样本点x

其中

③获得自适应图的拉普拉斯矩阵

相似度矩阵

(4)构建基于l

基于l

其中α是正则项参数,

①由于F没有约束直接求导可得。

②已知F的表达式,目标函数可以转化为

其中,

A.若

i.由大到小的顺序提取矩阵

ii.由索引向量计算行提取矩阵

iii.由行提取矩阵计算

iv.得到

B.若

i.初始化W

ii.计算

iii.由大到小的顺序提取矩阵Γ

iv.由索引向量计算行提取矩阵

v.由行提取矩阵计算

vi.更新内循环

③获取提取的特征的索引

计算||ω

下面根据列举具体实例来对本方法进行进一步解释说明。

步骤一、获取一组特征维度均为d的高光谱图像(即高光谱波段总数为d),采用的实际地物数据集中特征维度d为103。特征的值为每个波段对应像素的灰度值。其单一波段的像素总数为n=10370个,并且获得所有像素的地物类别标签共10类,进而构造数据矩阵、标签向量、锚点矩阵以及图拉普拉斯矩阵。主要分为如下三个过程:

(1)一组特征维度均为d的高光谱图像(特征值取单一波段的灰度化之后的灰度值),其单一波段的像素总数为n个,第i个像素的所有特征表示为

(2)采用二分K均值算法构建锚点矩阵。

①初始化:聚类中心矩阵

②计算

③计算指示向量g指示的两类的所有样本的均值作为锚点。设置锚点数为p,如果锚点数达到p停止,否则对于所有子类重复步骤①-③,直到锚点数达到p,即子类数满足要求,得到锚点矩阵

(3)基于锚点构建自适应K近邻图。

①计算距离矩阵

②对于每一个样本点x

③计算图的拉普拉斯矩阵

步骤二、建立最优化问题,并求解最优投影矩阵,主要分为如下两个过程:

(1)建立基于l

其中α是正则项参数,

其中,

(2)求解投影矩阵W,判断

①若

vii.由大到小的顺序提取矩阵

viii.由索引向量计算行提取矩阵

ix.由行提取矩阵计算

x.得到

②若

xi.初始化W

xii.计算

xiii.由大到小的顺序提取矩阵Γ

xiv.由索引向量计算行提取矩阵

xv.由行提取矩阵计算

xvi.更新内循环

②计算||ω

步骤三、对所有未知标签的高光谱图像像素,即构建样本矩阵的所有样本,共10370个103维的像素进行分类,主要分为以下两个过程:

(1)利用步骤二得到的特征索引选择所有像素的对应波段的灰度值组成新的数据矩阵,

(2)将Z的每一列作为新的地物对应的像素样本的所有特征序列进行分类。将投影后的新的像素样本中已知标签的样本采用的分类算法(例如K近邻)进行分类。

图2是本发明提供的地物分类实验采用的真实场景下高光谱数据在某一波段的图像灰度化之后的可视化结果。图3是地物分类精度结果图。Baseline是采用原始的已知标签数据训练的K近邻分类器分类未知标签数据10次的平均结果,Our Method是采用特征选择后的已知标签数据训练的K近邻分类器分类特征选择后未知标签数据10次的平均结果。图3假设有20%的已知标签的样本训练K近邻分类器,从分类结果可以看出,Baseline是采用原始数据计算的结果,Our Method是本发明对原始数据进行特征选择后,采用所有像素被选择的特征计算的结果。当被选择特征数从1取到60时,本发明的特征选择方法结合分类方法能够得到较高的精确度。

相关技术
  • 一种基于快速嵌入式谱分析的高光谱图像稀疏特征选择方法
  • 一种基于自适应核稀疏表示及多特征的高光谱图像分类方法
技术分类

06120113692378