掌桥专利:专业的专利平台
掌桥专利
首页

一种偏振图像识别及像素级分类方法

文献发布时间:2023-06-19 19:27:02


一种偏振图像识别及像素级分类方法

技术领域

本发明属于偏振成像、图像分类、像素级分类和深度学习技术领域,尤其涉及一种偏振图像识别及像素级分类方法。

背景技术

偏振是光的基本特性之一,偏振成像技术是基于偏振特征信息的观测手段,自然光照射到不同物质的表面,物体反射会产生不同状态的偏振光,反射光偏振特性的不同反映了物体的表面材质、粗糙度、形状等物理信息。利用这一偏振特性,能够区分肉眼难以分辨的物质。因此,利用偏振特征信息,可以更好地从复杂背景中提取目标物,能够提升目标识别及提取的准确率。偏振成像技术在目标检测、材料识别、医疗影像等领域中有着较为广泛的应用。

偏振成像采集系统会采集到多张不同偏振角度的强度图像,一般为0°、45°、90°、135°四张图像。利用斯托克斯公式进行解算,可以得到具有偏振信息的I、Q、U三张偏振图像,其中I代表光强,Q代表水平和垂直偏振方向的强度差,U代表两斜对角线偏振方向的强度差,进一步计算又可以得到偏振度(DOP)和偏振角(AOP)图像,以上五张偏振图像广泛应用在偏振特征提取、偏振图像融合和偏振图像目标检测等领域。然而,目前偏振图像应用较为局限,其图像和普通灰度图像不同,且Q和U偏振图像的偏振特征相似,需要具备一定的偏振知识才能区分I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像,进而解读图像中的偏振信息,导致应用范围大大受限。

图像分类是目前计算机视觉领域的基础任务,也是目标检测、图像分割和目标追踪等深层视觉任务的基础,以图像信息中所反映的不同特征为依据,实现对不同类型图像的区分。近年来,深度学习卷积神经网络在图像分类领域得到了广泛应用,通过对训练样本进行大量学习,并对网络模型的权重参数进行迭代优化,可以得到具有特定分类功能的网络模型,该模型能够有效地提取图像特征,并以此为依据进行图像类别的判断。

像素级分类是根据图像某一像素点及其相邻像素点的特征信息,对该像素点对应物体进行识别并分类,进而对整张图像进行逐点分类,最终得到每个像素的分类结果。像素级分类主要应用于目标检测、信息提取等领域,研究者能够从采集到的图像中识别并提取目标物,广泛应用于工业制造、军事探测、智能感知等领域。随着识别精度要求的提升以及应用场景中背景复杂度的增加,普通相机拍摄的图像在某些情况下不能很好的支撑目标的提取和识别,需要获取更多的特征信息,以提升复杂的自然环境背景中目标识别及提取的准确率。

发明内容

本发明的技术解决问题是:克服现有技术的不足,提出一种偏振图像识别及像素级分类方法,首先该方法能够识别并区分I、Q、U、DOP、AOP五类偏振图像和非偏振图像,之后利用偏振特征实现偏振图像的像素级分类,能够得到较好的分类精度。

本发明的技术解决方案是:

一种偏振图像识别及像素级分类方法,包括如下步骤:

S1:将目标场景未知类别的偏振图像和非偏振图像输入到偏振图像六分类网络模型中进行六分类,得到目标场景的六分类图像,六分类图像分别为I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像;

S2:将步骤S1得到的六分类图像中的I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像堆叠到一起,构成目标场景五通道偏振图像;

S3:将步骤S2中堆叠得到的目标场景五通道偏振图像输入到像素级分类网络模型中对目标场景五通道偏振图像的每一点进行类别判断,完成目标场景五通道偏振图像的像素级分类。

所述的步骤S1中,六分类方法具体步骤为:

S101:通过足够数量且已知类别的I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像和非偏振图像建立偏振图像分类任务的数据集,其中,I偏振图像、Q偏振图像、U偏振图像的计算公式为:

其中,I

计算偏振度DOP图像和偏振角AOP图像:

S102:训练偏振图像五分类ResNet50残差网络模型,将步骤S101计算得到的Q偏振图像和U偏振图像归为一类QU偏振图像,建立I偏振图像、QU偏振图像、DOP偏振图像、AOP偏振图像和非偏振图像五分类任务数据集,五分类任务数据集的真值标签集合为

S103:根据真值集合Y

其中,N

S104:按照设定规则更新偏振图像五分类ResNet50残差网络模型中的参数权重,重新执行步骤S102-S103,更新五分类任务数据集的预测值集合

S105:将QU偏振图像进行边缘锐化处理;

S106:训练偏振图像二分类ResNet50残差网络模型,步骤S105边缘锐化后的QU偏振图像作为Q和U偏振图像二分类任务的数据集,二分类任务数据集的真值标签集合为

S107:根据Q和U偏振图像真值集合Y

其中,N

S108:按照设定规则更新偏振图像二分类ResNet50残差网络模型中的参数权重,重新执行步骤S106-S107,更新二分类任务数据集的预测值集合

S109:将目标场景未知类别的偏振图像和非偏振图像首先输入进训练好的I、QU、DOP、AOP和非偏振图像五分类ResNet50残差网络模型,进行五分类预测,将预测结果为QU的偏振图像进行图像边缘锐化处理,之后输入进训练好的Q和U偏振图像二分类ResNet50残差网络模型,进行Q和U图像的分类预测,最终得到目标场景所有图像的类别,实现目标场景I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像的识别。

所述的步骤S102中,ResNet50残差分类网络模型包含49个卷积层和1个全连接层,首先对输入图像进行卷积操作,之后通过4个残差块,最后进行全连接操作输出分类结果。

所述的ResNet50残差网络模型的训练共迭代了260次,前200次迭代的学习率为0.0001,后60次迭代的学习率为0.00001,Batch Size为8。

步骤S102中,先将Q偏振图像和U偏振图像合并为QU偏振图像一类进行五分类训练,之后对QU偏振图像进行边缘锐化处理,增强二者偏振特性差异,再进行Q偏振图像和U偏振图像的分类。

所述的S105中,将QU偏振图像进行边缘锐化处理的方法为:采用Sobel算子边缘锐化算法来增强Q偏振图像和U偏振图像的偏振特征差异。

所述的步骤S106中,ResNet50残差分类网络模型网络包含49个卷积层和1个全连接层,首先对输入图像进行卷积操作,之后通过4个残差块,最后进行全连接操作输出分类结果,ResNet50残差网络模型的训练共迭代了260次,为获得更好的训练效果,前200次迭代的学习率为0.0001,后60次迭代的学习率为0.00001,Batch Size为8。

所述的步骤S3中,五通道偏振图像的像素级分类方法具体为:

S301:准备多个已知场景的偏振图像,将同一场景的I、Q、U、DOP、AOP五张偏振图像叠到一起,构成五通道偏振图像像素级分类任务数据集,根据偏振图像手动对偏振图像数据集中所有物体进行标注,构成像素级分类任务数据集的真值标签,像素级分类任务数据集真值标签的大小与五通道偏振图像的空间大小一致,不同的强度值代表不同的物体;

S302:训练五通道偏振图像像素级分类ResNet18残差网络模型,将步骤S301堆叠得到的五通道偏振图像像素级分类任务数据集输入进像素级分类ResNet18残差网络模型进行训练,每次将以目标像素点为中心的15×15个像素点的五通道图像输入进像素级分类ResNet18残差网络模型中,输出得到目标像素点的标签预测值,最终得到与五通道偏振图像空间大小一致的像素级分类任务数据集预测值集合;

S303:根据像素级分类数据集的真值标签集合和预测值集合构造损失函数,判断像素级分类任务数据集的真值集合与预测值集合之间的损失函数值是否满足预设定要求,若满足,则当前像素级分类网络模型为最终的像素级分类ResNet18残差网络模型,完成五通道偏振图像像素级分类ResNet18残差网络模型的训练,进入步骤S305,若不满足,则进入步骤S304;

S304:按照设定规则更新像素级分类ResNet18残差网络模型中的参数权重,重新执行步骤S302-S303,更新像素级分类任务数据集的预测值集合,并重新计算像素级分类任务数据集真值集合和预测值集合之间的损失函数值,直至满足预设定要求;

S305:将目标场景五通道偏振图像先进行图像分割预处理,图像分割预处理根据五个通道的偏振特征将一张图像分割成若干区域将五通道偏振图像中每个通道的图像分别按照该分割区域进行求和平均操作,之后将得到的平均值填充回对应的分割区域中,覆盖原始数据,构成分割预处理后的目标场景五通道偏振图像;

S306:将分割预处理后的目标场景五通道偏振图像输入进训练好的五通道偏振图像像素级分类ResNet18残差网络模型,逐点输入网络浪费运算资源,所以每个分割区域只输入以中心像素点为中心的15×15个像素点的五通道图像,输出得到中心像素点的预测值结果,该预测值结果作为整个分割区域的标签,将每个分割区域中到边界距离小于7的像素点单独送入网络进行计算,最终得到目标场景五通道偏振图像整张图像的像素级分类结果。

所述的步骤S302中,ResNet18残差网络由多个残差单元组成,包括17个卷积层和1个全连接层,最终输出的结果是整张图像每个像素点对应的目标类别信息。

所述的步骤S305中,图像分割预处理根据强度值、空间纹理特征把图像划分成若干个互不相交的区域,利用图像分割算法对原始偏振图像进行初步的分割。

有益效果

1、本发明提供了一种基于ResNet50残差网络深度学习模型的偏振图像分类与识别方法,该方法能够区分偏振图像与非偏振图像,以及进一步识别具有不同偏振特征的I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像。首先,由于Q偏振图像和U偏振图像特征相似,本发明先将Q和U两类偏振图像归为一类QU偏振图像,利用偏振图像五分类ResNet50残差网络模型进行I、QU、DOP、AOP和无偏图像五分类训练。其次,将QU偏振图像进行了图像锐化处理,增强了两类图像的偏振特性差异,再利用偏振图像二分类ResNet50残差网络模型进行Q偏振图像和U偏振图像二分类训练,提升了分类精度。

2、本发明提供了一种基于五通道偏振图像像素级分类ResNet18残差网络模型的偏振图像像素级分类方法,该方法利用深度学习网络对已知场景目标物的偏振信息进行学习,依靠不同物体具有的不同偏振特征信息,同时结合图像分割算法,识别出目标场景偏振图像每个像素点的物体类别,实现偏振图像的像素级分类。

3、本发明提供一种偏振图像识别及像素级分类方法,利用深度学习网络识别偏振图像与非偏振图像,以及进一步区分具有不同偏振特征的I、Q、U、DOP、AOP五类偏振图像。考虑了Q偏振图像和U偏振图像的偏振特征相似,先将Q、U两类图像合并为一类,进行I、QU、DOP、AOP和非偏振图像五分类,再通过边缘锐化方法增强Q和U两类偏振图像的偏振特征差异,进行QU偏振图像二分类,能够有效提升偏振图像的分类精度。之后再利用识别好的偏振图像,将同一场景的五类偏振图像堆叠到一起,进行下一步的偏振图像像素级分类工作,利用深度学习网络对已知场景目标物的偏振信息进行学习,依靠不同物体具有的不同偏振特征信息,同时结合图像分割算法,识别出目标场景偏振图像每个像素点的物体类别,实现偏振图像的像素级分类。

4、本发明旨在通过深度学习的方法识别偏振图像与非偏振图像,以及进一步区分具有不同偏振特征的偏振图像,让研究者更好地使用和识别偏振图像,再利用识别好的偏振图像,进行下一步的像素级分类工作,根据偏振特征识别出图像中每一像素点对应物体所属类别。

附图说明

图1为本发明实施例提供的一种偏振图像识别及像素级分类方法流程图;

图2为ResNet50残差网络模型结构图;

图3为相同场景下偏振特征相似的Q和U偏振图像对比图;

图4为图像分割预处理结果图;

图5为ResNet残差网络中一个残差单元结构模型示意图。

具体实施方式

下面结合附图并举实施例,对本发明进行详细描述。

一种偏振图像识别及像素级分类方法,具体包括如下步骤:

S1:将目标场景未知类别的偏振图像和非偏振图像输入进偏振图像六分类网络模型,偏振图像六分类网络模型进行六分类,即根据偏振特性识别并区分出目标场景的I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像;

S2:将步骤S1区分出的目标场景I、Q、U、DOP、AOP五类偏振图像堆叠到一起,构成目标场景五通道偏振图像,该目标场景五通道偏振图像作为像素级分类的输入数据;

S3:将步骤S2中堆叠得到的目标场景五通道偏振图像输入进像素级分类网络模型,像素级分类网络模型对五通道偏振图像的每一点进行类别判断,完成对目标场景五通道偏振图像的像素级分类,完成偏振图像识别及像素级分类;

所述的步骤S1中,偏振图像六分类网络模型考虑了Q偏振图像和U偏振图像的偏振特征相似,先将Q偏振图像、U偏振图像合并为一类得到QU偏振图像,然后进行I、QU、DOP、AOP和非偏振图像五分类,再通过边缘锐化处理方法增强Q和U两类偏振图像的偏振特征差异,进行QU偏振图像二分类;

偏振图像六分类方法具体步骤为:

S101:准备足够数量且已知类别的I、Q、U、DOP、AOP和非偏振图像,用来建立偏振图像分类任务的数据集,其中,I、Q、U三类偏振图像的计算方式为:

其中,I

S102:训练偏振图像五分类ResNet50残差网络模型,将步骤S101计算得到的Q和U两类特征相似的偏振图像归为一类QU偏振图像,建立I、QU、DOP、AOP和非偏振图像五分类任务数据集,五分类任务数据集的真值标签集合为

S103:根据真值集合Y

/>

其中,N

S104:按照设定规则更新偏振图像五分类ResNet50残差网络模型中的参数权重,重新执行步骤S102-S103,更新五分类任务数据集的预测值集合

S105:将QU偏振图像进行边缘锐化处理,考虑到Q和U两类偏振图像偏振特征相似,采用边缘锐化操作增强Q和U两类偏振图像的偏振特征差异,边缘锐化处理方法多样,采用Sobel算子边缘锐化算法来增强Q偏振图像和U偏振图像的偏振特征差异;

S106:训练偏振图像二分类ResNet50残差网络模型,步骤S105边缘锐化后的QU偏振图像作为Q和U偏振图像二分类任务的数据集,二分类任务数据集的真值标签集合为

S107:根据Q和U偏振图像真值集合Y

其中,N

S108:按照设定规则更新偏振图像二分类ResNet50残差网络模型中的参数权重,重新执行步骤S106-S107,更新二分类任务数据集的预测值集合

S109:将目标场景未知类别的偏振图像和非偏振图像首先输入进训练好的I、QU、DOP、AOP和非偏振图像五分类ResNet50残差网络模型,进行五分类预测,将预测结果为QU的偏振图像进行图像边缘锐化处理,之后输入进训练好的Q和U偏振图像二分类ResNet50残差网络模型,进行Q和U图像的分类预测,最终得到目标场景所有图像的类别,实现目标场景I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像的识别;

所述的步骤S102和S106中,ResNet50残差分类网络模型如图2所示,该网络包含49个卷积层和1个全连接层,首先对输入图像进行卷积操作,之后通过4个残差块(ResidualBlock),每个残差块包含多个残差单元,最后进行全连接操作输出分类结果,相较于其他网络,ResNet50残差网络层数较深,能够较好的获取图像的特征信息并按照特征信息进行分类,且不存在局部最优解和梯度消失等问题,在很多图像分类数据集上都有较为出色的表现,ResNet50残差网络模型的训练共迭代了260次,为获得更好的训练效果,前200次迭代的学习率为0.0001,后60次迭代的学习率为0.00001,Batch Size为8。

进一步地,步骤S102中,所述Q和U两类偏振图像的偏振特征相似,由步骤S101中的公式可知Q偏振图像是0°偏振图与90°偏振图强度之差,U偏振图像是45°偏振图与135°偏振图强度之差,当拍摄场景中偏振信息不明显时,Q偏振图像和U偏振图像中的偏振特征相似,如图3所示,区分二者较为困难,所以先将Q偏振图像和U偏振图像合并为QU偏振图像一类进行五分类训练,之后对QU偏振图像进行边缘锐化处理,增强二者偏振特性差异,再进行Q偏振图像和U偏振图像的分类。

进一步地,步骤S3中五通道偏振图像的像素级分类方法具体为:

S301:准备多个已知场景的偏振图像,将同一场景的I、Q、U、DOP、AOP五张偏振图像叠到一起,构成五通道偏振图像像素级分类任务数据集,根据偏振图像手动对偏振图像数据集中所有物体进行标注,构成像素级分类任务数据集的真值标签,像素级分类任务数据集真值标签的大小与五通道偏振图像的空间大小一致,不同的强度值代表不同的物体;

S302:训练五通道偏振图像像素级分类ResNet18残差网络模型,将步骤S301堆叠得到的五通道偏振图像像素级分类任务数据集输入进像素级分类ResNet18残差网络模型进行训练,考虑每个像素点及其周围像素点包含的信息,每次将以目标像素点为中心的15×15个像素点的五通道图像输入进像素级分类ResNet18残差网络模型中,输出得到目标像素点的标签预测值,最终得到与五通道偏振图像空间大小一致的像素级分类任务数据集预测值集合;

S303:根据像素级分类数据集的真值标签集合和预测值集合构造损失函数,判断像素级分类任务数据集的真值集合与预测值集合之间的损失函数值是否满足预设定要求,若满足,则当前像素级分类网络模型为最终的像素级分类ResNet18残差网络模型,完成五通道偏振图像像素级分类ResNet18残差网络模型的训练,进入步骤S305,若不满足,则进入步骤S304;

S304:按照设定规则更新像素级分类ResNet18残差网络模型中的参数权重,重新执行步骤S302-S303,更新像素级分类任务数据集的预测值集合,并重新计算像素级分类任务数据集真值集合和预测值集合之间的损失函数值,直至满足预设定要求;

S305:将目标场景五通道偏振图像先进行图像分割预处理,图像分割预处理根据五个通道的偏振特征将一张图像分割成若干区域,如图4所示。将五通道偏振图像中每个通道的图像分别按照该分割区域进行求和平均操作,之后将得到的平均值填充回对应的分割区域中,覆盖原始数据,构成分割预处理后的目标场景五通道偏振图像;

S306:将分割预处理后的目标场景五通道偏振图像输入进训练好的五通道偏振图像像素级分类ResNet18残差网络模型,考虑到分割预处理后的图像每个分割区域的值相同,逐点输入网络浪费运算资源,所以每个分割区域只输入以中心像素点为中心的15×15个像素点的五通道图像,输出得到中心像素点的预测值结果,该预测值结果作为整个分割区域的标签。也考虑到图像分割预处理对某些物体的边缘提取不准确,所以将每个分割区域中到边界距离小于7的像素点单独送入网络进行计算,以获取更准确的边缘信息。最终得到目标场景五通道偏振图像整张图像的像素级分类结果。

进一步地,步骤S302所述的ResNet18残差网络由多个残差单元组成,包括17个卷积层和1个全连接层。相较于层数较深的ResNet50残差网络,ResNet18残差网络具有较少的层数,适用于输入数据较少的像素级分类网络。需要注意的是,ResNet18偏振图像像素级分类网络与ResNet50偏振图像六分类网络的输出不同,偏振图像六分类网络输出的结果是每张图像的类别信息,而偏振图像像素级分类网络最终输出的结果是整张图像每个像素点对应的目标类别信息。

进一步地,步骤S305所述的图像分割预处理是根据强度值、空间纹理等特征把图像划分成若干个互不相交的区域,在同一区域内的图像具有相似的特征,而在不同区域内的图像具有较为明显的特征差异。利用图像分割算法可以对原始偏振图像进行初步的分割,该分割结果主要依据边缘信息以及不同物体之间的空间特征差异,图像分割预处理弥补了像素级分类网络对空间信息学习不足的问题。

实施例

请参考图1,图1展示出了本发明实施例提供的一种偏振图像识别及像素级分类方法,该方法的具体技术方案为:

S1:将目标场景未知类别的偏振图像和非偏振图像输入进偏振图像六分类网络模型,偏振图像六分类网络模型进行六分类,即根据偏振特性识别并区分出目标场景的I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像;

S2:将步骤S1区分出的目标场景I、Q、U、DOP、AOP五类偏振图像堆叠到一起,构成目标场景五通道偏振图像,该目标场景五通道偏振图像作为像素级分类的输入数据;

S3:将步骤S2中堆叠得到的目标场景五通道偏振图像输入进像素级分类网络模型,像素级分类网络模型对五通道偏振图像的每一点进行类别判断,完成对目标场景五通道偏振图像的像素级分类,完成偏振图像识别及像素级分类;

所述的步骤S1中,偏振图像六分类网络模型考虑了Q偏振图像和U偏振图像的偏振特征相似,先将Q偏振图像、U偏振图像合并为一类得到QU偏振图像,然后进行I、QU、DOP、AOP和非偏振图像五分类,再通过边缘锐化处理方法增强Q和U两类偏振图像的偏振特征差异,进行QU偏振图像二分类;

偏振图像六分类方法具体步骤为:

S101:准备足够数量且已知类别的I、Q、U、DOP、AOP和非偏振图像,用来建立偏振图像分类任务的数据集,其中,I、Q、U三类偏振图像的计算方式为:

其中,I

S102:训练偏振图像五分类ResNet50残差网络模型,将步骤S101计算得到的Q和U两类特征相似的偏振图像归为一类QU偏振图像,建立I、QU、DOP、AOP和非偏振图像五分类任务数据集,五分类任务数据集的真值标签集合为

S103:根据真值集合Y

其中,N

S104:按照设定规则更新偏振图像五分类ResNet50残差网络模型中的参数权重,重新执行步骤S102-S103,更新五分类任务数据集的预测值集合

S105:将QU偏振图像进行边缘锐化处理,考虑到Q和U两类偏振图像偏振特征相似,采用边缘锐化操作增强Q和U两类偏振图像的偏振特征差异,边缘锐化处理方法多样,采用Sobel算子边缘锐化算法来增强Q偏振图像和U偏振图像的偏振特征差异;

S106:训练偏振图像二分类ResNet50残差网络模型,步骤S105边缘锐化后的QU偏振图像作为Q和U偏振图像二分类任务的数据集,二分类任务数据集的真值标签集合为

S107:根据Q和U偏振图像真值集合Y

其中,N

S108:按照设定规则更新偏振图像二分类ResNet50残差网络模型中的参数权重,重新执行步骤S106-S107,更新二分类任务数据集的预测值集合

S109:将目标场景未知类别的偏振图像和非偏振图像首先输入进训练好的I、QU、DOP、AOP和非偏振图像五分类ResNet50残差网络模型,进行五分类预测,将预测结果为QU的偏振图像进行图像边缘锐化处理,之后输入进训练好的Q和U偏振图像二分类ResNet50残差网络模型,进行Q和U图像的分类预测,最终得到目标场景所有图像的类别,实现目标场景I偏振图像、Q偏振图像、U偏振图像、DOP偏振图像、AOP偏振图像五类偏振图像和非偏振图像的识别;

所述的步骤S102和S106中,ResNet50残差分类网络模型如图2所示,该网络包含49个卷积层和1个全连接层,首先对输入图像进行卷积操作,之后通过4个残差块(ResidualBlock),每个残差块包含多个残差单元,最后进行全连接操作输出分类结果,相较于其他网络,ResNet50残差网络层数较深,能够较好的获取图像的特征信息并按照特征信息进行分类,且不存在局部最优解和梯度消失等问题,在很多图像分类数据集上都有较为出色的表现,ResNet50残差网络模型的训练共迭代了260次,为获得更好的训练效果,前200次迭代的学习率为0.0001,后60次迭代的学习率为0.00001,Batch Size为8。

进一步地,步骤S102中,所述Q和U两类偏振图像的偏振特征相似,由步骤S101中的公式可知Q偏振图像是0°偏振图与90°偏振图强度之差,U偏振图像是45°偏振图与135°偏振图强度之差,当拍摄场景中偏振信息不明显时,Q偏振图像和U偏振图像中的偏振特征相似,如图3所示,区分二者较为困难,所以先将Q偏振图像和U偏振图像合并为QU偏振图像一类进行五分类训练,之后对QU偏振图像进行边缘锐化处理,增强二者偏振特性差异,再进行Q偏振图像和U偏振图像的分类。

进一步地,步骤S105中采用的边缘锐化处理方法多样,本发明采用Sobel算子边缘锐化算法来增强Q和U图像的偏振特征差异。为了验证边缘锐化对提升Q和U图像分类精度的有效性,本发明做了对照实验:用残差网络分别在Sobel锐化处理的QU数据集和无锐化处理的QU数据集做训练,保证其他参数相同,比较二者的分类准确率。实验结果如下:在Sobel锐化处理的数据集上训练,测试集的Q和U图像分类准确率为76.92%;而在无锐化处理的数据集上训练,测试集的Q和U图像分类准确率仅为38.46%。可以看出锐化处理能够增加Q和U偏振图像的特征差异,有效提升Q和U偏振图像的分类精度。

进一步地,步骤S3中五通道偏振图像的像素级分类方法具体为:

S301:准备多个已知场景的偏振图像,将同一场景的I、Q、U、DOP、AOP五张偏振图像叠到一起,构成五通道偏振图像像素级分类任务数据集,根据偏振图像手动对偏振图像数据集中所有物体进行标注,构成像素级分类任务数据集的真值标签,像素级分类任务数据集真值标签的大小与五通道偏振图像的空间大小一致,不同的强度值代表不同的物体;

S302:训练五通道偏振图像像素级分类ResNet18残差网络模型,将步骤S301堆叠得到的五通道偏振图像像素级分类任务数据集输入进像素级分类ResNet18残差网络模型进行训练,考虑每个像素点及其周围像素点包含的信息,每次将以目标像素点为中心的15×15个像素点的五通道图像输入进像素级分类ResNet18残差网络模型中,输出得到目标像素点的标签预测值,最终得到与五通道偏振图像空间大小一致的像素级分类任务数据集预测值集合;

S303:根据像素级分类数据集的真值标签集合和预测值集合构造损失函数,判断像素级分类任务数据集的真值集合与预测值集合之间的损失函数值是否满足预设定要求,若满足,则当前像素级分类网络模型为最终的像素级分类ResNet18残差网络模型,完成五通道偏振图像像素级分类ResNet18残差网络模型的训练,进入步骤S305,若不满足,则进入步骤S304;

S304:按照设定规则更新像素级分类ResNet18残差网络模型中的参数权重,重新执行步骤S302-S303,更新像素级分类任务数据集的预测值集合,并重新计算像素级分类任务数据集真值集合和预测值集合之间的损失函数值,直至满足预设定要求;

S305:将目标场景五通道偏振图像先进行图像分割预处理,图像分割预处理根据五个通道的偏振特征将一张图像分割成若干区域,如图4所示。将五通道偏振图像中每个通道的图像分别按照该分割区域进行求和平均操作,之后将得到的平均值填充回对应的分割区域中,覆盖原始数据,构成分割预处理后的目标场景五通道偏振图像;

S306:将分割预处理后的目标场景五通道偏振图像输入进训练好的五通道偏振图像像素级分类ResNet18残差网络模型,考虑到分割预处理后的图像每个分割区域的值相同,逐点输入网络浪费运算资源,所以每个分割区域只输入以中心像素点为中心的15×15个像素点的五通道图像,输出得到中心像素点的预测值结果,该预测值结果作为整个分割区域的标签。也考虑到图像分割预处理对某些物体的边缘提取不准确,所以将每个分割区域中到边界距离小于7的像素点单独送入网络进行计算,以获取更准确的边缘信息。最终得到目标场景五通道偏振图像整张图像的像素级分类结果。

进一步地,步骤S305所述的图像分割预处理是根据强度值、空间纹理等特征把图像划分成若干个互不相交的区域,在同一区域内的图像具有相似的特征,而在不同区域内的图像具有较为明显的特征差异。利用图像分割算法可以对原始偏振图像进行初步的分割,该分割结果主要依据边缘信息以及不同物体之间的空间特征差异,图像分割预处理弥补了像素级分类网络对空间信息学习不足的问题。

进一步地,步骤S302所述的ResNet18残差网络由多个残差单元组成,包括17个卷积层和1个全连接层。相较于层数较深的ResNet50残差网络,ResNet18残差网络具有较少的层数,适用于输入数据较少的像素级分类网络。需要注意的是,ResNet18偏振图像像素级分类网络与ResNet50偏振图像六分类网络的输出不同,偏振图像六分类网络输出的结果是每张图像的类别信息,而偏振图像像素级分类网络最终输出的结果是整张图像每个像素点对应的目标类别信息。

进一步地,目前常用于图像分类的网络模型有LeNet、AlexNet、VggNet、GoogLeNet、ResNet等,都在很多公开的数据集上有较好的分类结果。但随着人类对分类精度要求的提升,研究者们更专注于图像中一些细节特征的提取,为了得到更好的分类结果,不断增加训练权重参数,目前神经网络模型正向着越来越深的方向发展。但随着网络层数的加深,目标函数越来越容易陷入局部最优解,同时,随着层数增加,梯度消失问题也更加严重,使得网络参数得不到有效的学习。而上文提到的ResNet残差网络(ResidualNetwork)可以很好地解决这些问题,残差网络是一种非常有效的缓解梯度消失问题的网络,极大的提高了可以有效训练的网络的深度。

进一步地,本发明使用的ResNet残差网络由很多个残差单元构成,残差单元可以以跳层连接的形式实现,如图5所示,即将单元的输入直接与单元输出加在一起,然后再激活。

残差网络将靠前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分,意味着后面的特征层的内容会有一部分由其前面的某一层线性贡献,用公式可表示为:

H(x)=F(x)+x

其中,x为残差单元的输入,F(x)为残差,H(x)为二者之和,然后通过激活函数:

x

其中,f()为激活函数ReLU,x

当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当然可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

技术分类

06120115918307