掌桥专利:专业的专利平台
掌桥专利
首页

基于PCANet及多分类器融合的图像溢油检测方法

文献发布时间:2023-06-19 19:30:30



技术领域

本发明涉及合成孔径雷达图像溢油分割领域,具体地说,是一种基于PCANet及多分类器融合的图像溢油检测方法。

背景技术

近年来,海上溢油事故频繁发生,对经济和生态环境都造成了重大损失,采取有效的方法检测溢油成为国内外研究热点。合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天时、全天候、大范围、高精度等特点,为溢油检测提供了有效手段;深度学习是近年来发展迅速的一种机器学习方法,能够通过学习样本的特征从而建立模型进行溢油检测,而卷积神经网络(Convolutional Neural Network,CNN)是深度学习中应用较为广泛的模型,在目标检测等方面取得了较为成功的应用。

在卷积神经网络中,PCANet网络——一种基于CNN的简化深度学习模型,仅包含非常基本的数据处理组件:级联主成分分析卷积层、二值化和直方图操作。PCANet采用主成分分析法来学习多级滤波器组,随后通过简单的二进制哈希值和块直方图操作建立索引和合并。该网络可以非常轻松有效地进行设计和学习。PCANet网络虽然是在其他更高级的深度学习网络的基础上设计出的一个简单的轻量级深度网络,但是,在之后大量的对比实验中,PCANet带来许多惊喜,在大部分的纹理图像分类任务中,PCANet的分类效果都达到与当下许多深度学习方法相当的分类结果,在部分数据集上甚至优于当下更复杂的网络。

现有关于SAR目标自动识别的文献重点在特征提取及分类器设计两方面开展研究工作:

特征提取是SAR目标自动识别算法的重要步骤,其目的是从SAR图像中提取反映目标自身类别特性的信息并排除与目标类别无关信息的干扰,从而降低后续步骤中分类器有效分类识别的难度。在SAR目标特征提取方面,目前溢油检测的研究多集中于影像的分析、分割与分类等方面,并未从溢油的特征和散射机理进行深入研究,加之SAR影像中'暗"特征区域的复杂性和不确定性,使得溢油与类溢油的区分的精度较低、难度加大。因此,如何将溢油信息快速准确的提取仍然是今后的一个难攻课题。

由于溢油图像样本数量偏少、训练集存在不平衡问题以及分类器自身缺陷,导致模型学习过程中分类器出现偏向性问题。

发明内容

本发明的目的是为了解决上述技术问题,提供一种基于PCANet及多分类器融合的图像溢油检测方法。

本发明采用了体系结构简单、适应不同环境能力较强的PCANet替代传统的深度学习模型来提取SAR图像特征,极大地减小了模型复杂度。采用新的加权算法进行决策级融合,有效改善了分类器偏向性,提高了分类精度。

为达到上述目的,本发明提供如下技术方案予以实现:

基于PCANet及多分类器融合的图像溢油检测方法,包括以下步骤:

S1、选择SAR溢油图像数据集作为训练样本输入主成分分析神经网络,对图像矩阵进行预处理;

S2、根据步骤S1处理过的图像数据生成相应滤波器,将滤波器作为卷积核与图像进行卷积运算,进一步丰富图像数据的浅层特征;

S3、利用哈希函数对步骤S2输出的图像数据进行处理,降低图像数据的整体复杂度。随后使用直方图统计,生成扩展直方图特征向量;

S4、基于SVM、K近邻和SoftMax算法搭建多种分类器,对步骤S3输出的特征向量进行分类;

S5、采用加权投票表决的方式对不同分类器的输出分类向量进行求和得到最终的预测分类向量,与实际样本比对,得出模型误差率。

进一步的,所述步骤S1具体过程如下:

S11、对每一张图片进行预处理,根据图片的像素,以k1×k2为大小对矩阵进行分块,将每个分片矩阵按列优先原则展开为列向量,将这些列向量从左向右重新组合成一个矩阵;

S12、图片像素为m×n,分块时以行步长为b

行:r=k

列:c=((m-k

进一步的,所述步骤S2具体过程如下:

S21、主成分分析分为两个阶段,第一个阶段对矩阵每一列减去列平均,得到矩阵

S22、第二阶段先对第一阶段输出的N幅图像I

进一步的,所述步骤S3具体过程如下:

S31、对第二阶段每一张图像

随后对矩阵进行直方图矩阵统计,直方图的范围为

进一步的,所述步骤S4具体过程如下:

S41、SVM分类器基于样本数据建立一个超平面使要分类的数据间隔尽量最大,然后对样本数据进行分割,从而变成一个凸二次问题求解,其超平面的方程为:

g(x)=w·x+b

w是判别函数中的权向量,w=(w

S42、K近邻分类器,通过已知数据与给定的类别,计算未知样本与已知数据间的距离大小,然后判别未知样本属于的类别,距离计算表达式为:

S43、SoftMax分类器能够使用假设函数将输出值映射为预测结果的概率,具体假设函数如下:

其中,k是种类标签序号,也是最终输出概率向量的维度;w是分类器模型的参数矩阵,也可以表示为w=(w

进一步的,所述步骤S5具体过程如下:

S51、由于在模型中引入了多个分类器,故此采用加权投票表决的方式进行多分类器融合,对不同分类器的输出进行加权求和得到最终的预测向量,加权投票公式如下:

其中P

本发明的有益效果:本发明将SVM、SOFTMAX、PCA、CNN等多种方法引入溢油检测领域,并对CNN模型进行了改进,通过PCANet特征提取网络增加数据特征值的特点,可以在数据特征值少,不易区分的时候使用该算法;用已构建好的多分类器进行决策级融合,这个过程虽然延长了实验时间,但也改善了分类器偏向性,提高了分类准确率。

附图说明

图1为本发明方法实现流程图。

图2为决策级融合实现流程图。

图3为不同分类器对样本集的实验结果,检测精度为分类器所提取的油斑面积与专家解译的油斑面积的空间重叠度统计图。

图4为SAR溢油图像检测结果对比图,左图为专家解译的溢油油斑(图像暗域),右图为神经网络所提取的溢油油斑(图像暗域)。

具体实施方式

为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。

实施例:如图1所示,一种基于PCANet及多分类器融合的图像溢油检测方法,包括以下步骤:

S1、选择SAR溢油图像数据集作为训练样本输入主成分分析神经网络,对图像矩阵进行预处理;

S2、根据步骤S1处理过的图像数据生成相应滤波器,将滤波器作为卷积核与图像进行卷积运算,进一步丰富图像数据的浅层特征;

S3、利用哈希函数对步骤S2输出的图像数据进行处理,降低图像数据的整体复杂度。随后使用直方图统计,生成扩展直方图特征向量;

S4、如图2所示,基于SVM、K近邻和SoftMax算法搭建多种分类器,对步骤S3输出的特征向量进行分类;

S5、采用加权投票表决的方式对不同分类器的输出分类向量进行求和得到最终的预测分类向量,与实际样本比对,得出模型误差率及语义分割结果。检测精度如图3所示,为分类器所提取的油斑面积与专家解译的油斑面积的空间重叠度统计,语义分割结果如图4所示,左侧为专家解译的溢油油斑(图像暗域),右侧为神经网络所提取的溢油油斑(图像暗域)。

在本实施例中,步骤S1选择由中国地质大学HPSCIL团队和武汉大学RS-IDEA团队生成并共享的墨西哥漏油区与波斯湾漏油区的海洋溢油SAR图像数据集作为训练样本输入主成分分析神经网络,对图像矩阵进行预处理及相应特征提取。具体实施方法如下:

初始阶段,对每一张图片进行预处理,根据图片的像素,以k1×k2为大小对矩阵进行分块,将每个分片矩阵按列优先原则展开为列向量,将这些列向量从左向右重新组合成一个矩阵。图片像素为m×n,分块时以行步长为b

行:r=k

列:c=((m-k

进一步的,所述步骤S2具体过程如下:

第一阶段主成分分析,以第i张图片为例,分块后得到x

公式中

第二阶段主成分分析与第一阶段主成分分析构成级联主成分分析,先对第一阶段输出的N幅图像I

然后将分块的结果合成一个矩阵去列均值,得到

l=1,2,...,L

步骤S3:利用哈希函数对步骤S2输出的图像数据进行处理,降低图像数据的整体复杂度,随后使用直方图统计,生成扩展直方图特征向量,具体实施方法如下:

对图像

对得到的矩阵

步骤S4:基于SVM、K近邻和SoftMax算法搭建多种分类器,对步骤S3输出的特征向量进行分类。具体实施方法如下:

SVM分类器基于样本数据建立一个超平面使要分类的数据间隔尽量最大,然后对样本数据进行分割,从而变成一个凸二次问题求解,其超平面的方程为:

g(x)=w·x+b

其中,w是判别函数中的权向量,w=(w

f(x)=sgn(w·x+b)

其中,sgn表示的构造函数代表的是如果输入值大于0则值为1,小于0的值输出为-1,得到的样本标签为“+1”和“-1”。

为了更好的对失真类型进行分类,采用高斯和函数作为SVM分类器的核函数。高斯核函数适用于多分类问题,并且对计算过程中的收敛速度块。在高斯核函数中有两个参数,分别是可调参数y以及归一化系数c,其中可调参数y影响SVM中模型的平滑度,y值越小,其SVM分类器的模型也就越平缓,c是SVM中梯度下降过程中损失函数的一个重要参数,主要用于平衡SVM中分类复杂度与误分类率的关系,防止SVM分类器的过拟合和欠拟合现象发生。其中SVM分类模型会随着参数c的不断增大,导致过拟合现象的产生,影响了超平面模型的复杂性和高偏差;相反的是,如果参数c过于小,这也会导致SVM分类器发生欠拟合现象。

K近邻分类器,通过已知数据与给定的类别,计算未知样本与已知数据间的距离大小,然后判别未知样本属于的类别。距离计算表达式为:

SoftMax分类器能够使用假设函数将输出值映射为预测结果的概率,最终各项输出概率值相加等于1。对于样本数据特征x

其中,k是种类标签序号,也是最终输出概率向量的维度;w是分类器模型的参数矩阵,也可以表示为w=(w

步骤S5:采用加权投票表决的方式对不同分类器的输出分类向量进行求和得到最终的预测分类向量,与实际样本比对,得出模型误差率。具体实施方法如下:

由于在模型中引入了多个分类器,且因为分类器性能不尽相同,不能够使用简单的投票表决得到最终结果。故此采用加权投票表决的方式进行多分类器融合。对不同分类器的输出进行加权求和得到最终的预测向量。加权投票公式如下:

其中,P

综上,当下现行的深度学习网络中,PCANet使用最基本的PCA滤波器作为卷积层滤波器,在非线性层使用二值化哈希编码处理,在重采样层使用分块扩展直方图并辅以二值哈希编码,将重采样层的输出作为整个PCANet网络最终的特征提取结果能够有效降低网络训练所需资源,提高网络训练效率。

以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何标记视为限制所涉及的权利要求。

技术分类

06120115935261