掌桥专利:专业的专利平台
掌桥专利
首页

基于非对称自编码器的高光谱异常目标检测方法

文献发布时间:2023-06-19 18:37:28


基于非对称自编码器的高光谱异常目标检测方法

技术领域

本发明涉及一种遥感图像处理技术,尤其涉及一种基于非对称自编码器的高光谱异常目标检测方法。

背景技术

高光谱图像是一种三维立方体数据。其中两个维度表示空间位置;另一个维度表示不同波段下地物的反射率。与多光谱图像相比,高光谱图像具有数百个连续光谱波段,可以提供丰富的光谱信息。基于光谱特征的变化,利用高光谱图像能够更可靠地识别地面物体。因此,高光谱图像适用于多种遥感图像的处理应用,例如光谱解混、分类、变化检测和目标检测。

其中,目标检测的目的是根据光谱特征区分目标像元和背景像元。目标像元具有两个特征:第一,与周围背景像元相比,存在明显的光谱差异;第二,目标体积小,出现概率低。根据是否存在目标像元的先验光谱信息,目标检测可分为目标匹配和异常检测。由于不需要异常目标像元的先验光谱信息,异常检测在应用中更具有实用性。因此,高光谱异常检测被广泛应用于环境监测、搜救、军事侦察等领域。

同时,在近几年,伴随着深度学习理论的飞速发展,基于深度学习的高光谱异常检测方法的研究得到了广泛关注。基于深度学习的高光谱异常检测方法大多以自编码器作为模型主干(自编码器是一种无监督的神经网络模型,由编码器和解码器组成。编码器将输入数据映射到较低维空间,并生成包含重要特征的隐层编码。解码器利用隐层编码输出重建数据。自编码器能够学习到多数样本的特征。)。其原理为:在图像场景中,背景样本占主导数量,背景样本可以被较好地重建,而异常则不能。因此,可以利用重建误差(例如,光谱角距离,欧氏距离等方法)作为检测手段,判定重建误差较大的是异常。然而,自编码器具有强大的非线性拟合能力。在实际应用中,异常也能被很好地重建,导致异常和背景不能被分离开。

基于此背景,本发明提出一种基于非对称自编码器的高光谱异常目标检测方法。

发明内容

本发明的目的是提供一种基于非对称自编码器的高光谱异常目标检测方法,与现有技术相比,能够更好地增大背景和异常的差异性,提高检测率。

为实现上述目的,本发明提供了基于非对称自编码器的高光谱异常目标检测方法,包括以下步骤:

S1、将获取的3-D高光谱图像转换为2-D矩阵,每一个像元作为一个训练样本,得到的全局训练样本;

S2、将步骤S1得到的全局训练样本顺序打乱,设置训练阶段的batch size;

S3、将步骤S2获得的每一个batch的训练样本输入到基于残差自注意力模块机制的非对称自编码器,输出相对应的重建像元和隐层编码;

S4、计算步骤S3得到的重建像元和输入像元的Smooth-l

S5、将步骤S4计算得到的两种损失值加权求和,作为模型的总损失函数,利用反向传播的方式优化模型;

S6、将未打乱顺序的2-D高光谱图像输入步骤S5已训练好的模型中,输出重建图像,并计算原始2-D图像和重建图像的欧氏距离,作为像元的异常得分,输出最终检测图。

优选的,步骤S1中设定3-D的高光谱图像Y∈R

3-D的高光谱图像展开变成2-D图像Y=[y

优选的,步骤S2中所述的batchsize设置为2的幂指数。

优选的,步骤S3中所述的基于残差自注意力模块机制的非对称自编码器包括编码器和解码器;

其中,编码过程如下:

Z=encoder(Y) (1)

解码过程如下:

其中,encoder(·)和decoder(·)分别表示编码过程和解码过程。

优选的,所述编码器包括残差自注意力模块和全连接层,解码器由全连接层组成;

残差自注意力模块计算方式如下:

其中,Q,K和V通过线性变换获得,计算公式如下:

Q=W

K=W

V=W

其中,W

全连接层中利用Sigmoid函数作为激活函数,Sigmoid函数如下所示:

优选的,步骤S4中所述的重建损失函数为:

式中,Y和

优选的,步骤S4中所述的低秩损失函数为:

式中,Z是隐层编码,||Z||

优选的,步骤S5中所述的总损失函数为:

式中,

优选的,λ取值为2。

优选的,步骤S6中所述每个像元的异常得分由以下公式计算:

式中,y

因此,本发明采用上述基于非对称自编码器的高光谱异常目标检测方法,与现有技术相比,能够更好地增大背景和异常的差异性,提高检测率。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的方法流程图;

图2为本发明的残差自注意力模块的原理图;

图3为本发明的基于残差自注意力机制的非对称自编码器的原理图

图4为圣地亚哥机场数据集的高光谱图像伪彩图;

图5为实验例的参考图;

图6为经RX处理圣地亚哥机场数据集结果图;

图7为经LRX处理圣地亚哥机场数据集结果图;

图8为经CRD处理圣地亚哥机场数据集结果图;

图9为经本实施例处理圣地亚哥机场数据集结果图;

图10为本发明的实验例的所提方法和三种基准方法的2-D ROC曲线对比图。

具体实施方式

以下将结合附图对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。

如图1-图3所示,本发明包括以下步骤:

S1、将获取的3-D高光谱图像转换为2-D矩阵,每一个像元作为一个训练样本,得到的全局训练样本;

优选的,步骤S1中设定3-D的高光谱图像Y∈R

S2、将步骤S1得到的全局训练样本顺序打乱,设置训练阶段的batch size;

优选的,步骤S2中所述的batchsize设置为2的幂指数,在本实施例中batchsize设置为256。

S3、将步骤S2获得的每一个batch的训练样本输入到基于残差自注意力模块机制的非对称自编码器,输出相对应的重建像元和隐层编码;

优选的,步骤S3中所述的基于残差自注意力模块机制的非对称自编码器包括编码器和解码器;

其中,本实施例中的编码器包含9个残差自注意力模块和3个全连接层。这3个全连接层的大小分别为(D,1000),(1000,1000)和(1000,7),编码过程如下:

Z=encoder(Y) (1)

解码器与编码器不同,仅由3层全连接层构成,结构大小分别为(7,1000),(1000,1000)和(1000,D),解码过程如下:

其中,encoder(·)和decoder(·)分别表示编码过程和解码过程。

优选的,所述编码器包括残差自注意力模块和全连接层,解码器由全连接层组成;

残差自注意力模块计算方式如下:

其中,Q,K和V通过线性变换获得,计算公式如下:

Q=W

K=W

V=W

其中,W

全连接层中利用Sigmoid函数作为激活函数,Sigmoid函数如下所示:

S4、计算步骤S3得到的重建像元和输入像元的Smooth-l

优选的,步骤S4中所述的重建损失函数为:

式中,Y和

优选的,为了保持背景部分的低秩性,本实施例利用约束隐层空间的低秩性的损失函数。由于矩阵的秩是非凸的,在优化问题里面很难求解,一般利用它的凸近似核范数(核范数是指矩阵奇异值之和)解决这一问题。在实际操作中,为了避免核范数与模型的重建损失函数的数量级相差较大,故利用核范数的对数作为低秩损失函数,步骤S4中所述的低秩损失函数为:

式中,Z是隐层编码,||Z||

S5、将步骤S4计算得到的两种损失值加权求和,作为模型的总损失函数,利用反向传播的方式优化模型;

优选的,步骤S5中所述的总损失函数为:

式中,

优选的,λ取值为2。

S6、将未打乱顺序的2-D高光谱图像输入步骤S5已训练好的模型中,输出重建图像,并计算原始2-D图像和重建图像的欧氏距离,作为像元的异常得分,输出最终检测图。

优选的,步骤S6中所述每个像元的异常得分由以下公式计算:

式中,y

为了说明本实施例的有效性,公开如下实验例:

首先,实验中使用到的高光谱数据集为:圣地亚哥机场数据。该数据集由AirborneVisible/Infrared Imaging Spectrometer于加利福尼亚州圣地亚哥机场获取,图像尺寸为100×100×189,空间分辨率为3.5米,异常目标是三架飞机,异常比例为1.34%。

而后,利用RX(Reed-Xiaoli),LRX(Local RX)和CRD(collaborativerepresentation-based detector)作为基准方法,与本发明所述的基于非对称自编码器的高光谱异常目标检测方法对比。由图4-图9可知,本发明提出的方法能够清晰地检测出三架异常飞机的所在位置。

为了进一步量化几种异常检测方法的检测精度,利用ROC(Receiver OperatingCharacteristic)曲线和AUC(Area Under Curve)值作为检测指标。ROC(FPR,TPR)描述了不同阈值下虚警率(False Positive Rate,FPR)和检测率(Ture Positive Rate,TPR)之间的关系。曲线越靠近坐标轴的左上角,检测率越高。

需要说明的是,在一定阈值下,计算FPR和TPR的公式如下:

其中,TP(Ture Positive)和TN(Ture Negative)分别表示检测到的真实异常和背景像元的数量;FP(False Positive)和FT(False Negative)分别表示误检为异常和背景的像元数。AUC值是ROC曲线下的面积。

表1所提方法和三种基准方法的AUC值对比表

由图10和表1可知,本发明提出的异常检测方法能够得到较高的检测精度,相较于RX,LRX和CRD分别提高了0.0535,0.0521和0.0274。

因此,本发明采用上述基于非对称自编码器的高光谱异常目标检测方法,属于一种端对端的异常检测方法,其构建了新的高光谱异常检测模型,并提出了残差注意力模块,同时提出了用于隐层空间的低秩损失函数,该方法减弱了模型对异常的重构能力,增大了背景与异常的分离度,无需构造潜在背景训练样本。

最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

技术分类

06120115636090