掌桥专利:专业的专利平台
掌桥专利
首页

一种基于边沿检测的伪装目标检测方法

文献发布时间:2023-06-19 11:54:11


一种基于边沿检测的伪装目标检测方法

技术领域

本发明涉及伪装目标检测技术领域,具体涉及一种基于边沿检测的伪装目标检测方法。

背景技术

“伪装者”通过伪装自己捕食或者伪装掩藏自身、保护自己。由于伪装者与周边的背景环境极为相似,因此一般的目标检测算法以及显著性目标检测算法,都无法检测出伪装的目标。原因如下:1、目标检测算法在通常情况下使用COCO数据集对算法模型进行训练,由于训练集中的样本越多,算法的鲁棒性越好,检测和识别的功能越强。而COCO数据集中只有极少部分的目标与周边环境极为相似,因此算法模型缺少了标签信息的指导,目标检测算法基本不具备检测伪装目标的功能。2、通用的显著性目标检测算法是用于检测的图像中一个或多个吸引人注意的目标,而伪装目标检测算法是用于检测经过伪装后的目标,只有通过仔细辨别才能够检测到目标,因此显著性目标检测算法从设计目的、以及原理就与伪装目标检测算法不一致。3、在卷积神经网络中池化、下采样等操作在对图像进行缩小时会丢失一部分的像素点,而这些像素点会包含一部分的边沿特征,而边沿特征的丢失会导致目标与背景衔接,算法无法将目标从背景环境中分离。综上所述,现有算法检测伪装目标的能力有待提高。

发明内容

本发明的目的是为了克服以上现有技术存在的不足,提供了一种提高伪装目标检测的能力的基于边沿检测的伪装目标检测方法。

本发明的目的通过以下的技术方案实现:

一种基于边沿检测的伪装目标检测方法,包括:将待检测伪装图像进行分层标注,将分层标注后的待检测伪装图像输入构建并已训练好的伪装目标检测网络模型,伪装目标检测网络模型完成伪装目标的检测;其中伪装目标检测网络模型包括主干网络、RF模块、EF模块、SA模块以及PDC模块;主干网络提取待检测的伪装图像的多尺度特征图,并对多尺度特征图采用稠密连接策略来保存不同特征层的信息;稠密连接的多尺度特征输入RF模块,利用RF模块扩大感受野;EF模块提取待检测的伪装图像的边沿特征和检测特征,并将边沿特征E以及检测特征S融合、输出;SA模块消除检测特征的无关特征干扰,增强主干网络的中间特征层L3;最后PDC聚合不同层的特征,完成伪装目标的检测。

优选地,将待检测伪装图像进行分层标注包括:根据待检测伪装目标图像的类别、包围盒、属性对各类别伪装目标图像进行分层标注。

优选地,构建并训练伪装目标检测网络模型包括:

S11,将预先采集的各类别伪装目标图像进行分层标注,得到伪装图像数据集;将伪装图像数据集划分为训练集和测试集;

S12,构建伪装目标检测网络模型;

S13,使用训练集对已构建的伪装目标检测网络模型进行训练;

S14,使用测试集对已训练的伪装目标检测网络模型进行测试。

优选地,主干网络包括L1,L2,L3,L4-1,L4-2,L5-1,L5-2,其中,L4-1和L4-2、L5-1和L5-2均为并行结构。

优选地,RF模块包括五条并行的分支结构,每条分支结构在操作之前都经过尺寸为(1,1)的卷积,前三条并行分支分别经过膨胀系数为Dk=k的膨胀卷积之后与第四条并行分支拼接,拼接后的结果经过尺寸为(1,1)的卷积与第五条并行分支相加,得到最后的输出,k=3,5,7。

优选地,EF模块,用于将主干网络中的四层特征分为边沿特征E以及检测特征S,并将边沿特征E以及检测特征S融合、输出,同时将检测特征S与检测标签值构建损失,将边沿特征E与边沿标签值一起构建损失,将检测特征S输入SA模块;

其中,边沿特征E包括E1,E2,E3,E4;检测特征S包括S1,S2,S3,S4;

优选地,将边沿特征E以及检测特征S融合的公式为:

E

其中,

优选地,SA模块,用于将检测特征S

优选地,使用训练集对已构建的伪装目标检测网络模型进行训练的损失函数为交叉熵损失函数L

L=λ

Loss-E=L

Loss-EF=L

Loss-S=L

其中,Loss-E用于监督伪装目标的边沿,Loss-EF和Loss-S用于直接监督伪装目标,λ

本发明相对于现有技术具有如下优点:

本发明利用深度学习的技术实现了伪装目标的检测。由于额外增强边沿特征的思想,能够进一步突出伪装的显著性目标并且细化边沿特征,这有利于提高伪装目标检测的能力,拓展了本发明的使用场景。并且本发明是在大规模的数据集上训练得到的检测模型,具有较好的鲁棒性和通用性。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明的基于边沿检测的提高伪装目标检测精度的原理分析图。

图2为本发明的伪装目标检测网络模型的结构图。

图3为本发明的RF模块的结构图。

图4为本发明的EF模块的结构图。

图5为本发明的SA模块的结构图。

图6为本发明的PDC模块的结构图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

图1的(a)为清晰二值图像,图1的(b)为清晰二值图像边缘,图1的(c)为模糊二值图像,图1的(d)为模糊二值图像边缘,图1的(e)为边缘补充图像。目标(蝴蝶)的颜色与图像中的背景颜色相似,而目标的纹理(蝴蝶翅膀)与背景(树叶)纹理相似,因此可以认为是“伪装”目标。图1的(c)是用显著性目标检测算法检测之后的图像。从图中可以分析得出,显著性目标检测算法检测伪装目标的能力有待提高。而在经过边沿图像(图1的(b))的补充之后,可以得到图1的(e),此时基本上可以将伪装目标(蝴蝶)检测出来。这种增强目标边沿的思想不仅可以细化边沿特征还可以有效地实现目标的进一步突出。因此,本发明提出一种基于边沿检测的伪装目标检测方法,它能够提高目标检测的整体能力以及检测精度,这样可以在伪装相关实际应用场景(军事领域、生物领域等)中得到更多的应用,从而提高相关工作人员的工作效率。本发明主要应用深度学习技术,在神经网络中添加边沿检测模块,它结合边沿特征与检测特征,有效的利用边沿信息,将伪装目标从背景环境中分离。

参见图2-6、一种基于边沿检测的伪装目标检测方法,包括:将待检测伪装图像进行分层标注,将分层标注后的待检测伪装图像输入构建并已训练好的伪装目标检测网络模型,伪装目标检测网络模型完成伪装目标的检测;其中伪装目标检测网络模型包括主干网络、RF模块、EF模块、SA模块以及PDC模块;主干网络提取待检测的伪装图像的多尺度特征图,并对多尺度特征图采用稠密连接策略来保存不同特征层的信息;稠密连接的多尺度特征输入RF模块,利用RF模块扩大感受野;EF模块提取待检测的伪装图像的边沿特征和检测特征,并将边沿特征E以及检测特征S融合、输出;SA模块消除检测特征的无关特征干扰,增强主干网络的中间特征层L3;最后PDC聚合不同层的特征,完成伪装目标的检测。

在本实施例,将待检测伪装图像进行分层标注:根据待检测伪装目标图像的类别、包围盒、属性对各类别伪装目标图像进行分层标注。

在本实施例,构建并训练伪装目标检测网络模型包括:

S11,将预先采集的各类别伪装目标图像进行分层标注,得到伪装图像数据集;将伪装图像数据集划分为训练集和测试集,比例为7:3;将所有的预先采集的各类别伪装目标图像根据图像的类别->包围盒->属性进行标注进行分层标注。

S12,构建伪装目标检测网络模型;

S13,使用训练集对已构建的伪装目标检测网络模型进行训练;在本实施例,使用训练集对已构建的伪装目标检测网络模型进行训练的损失函数为交叉熵损失函数L

L=λ

Loss-E=L

Loss-EF=L

Loss-S=L

其中,Loss-E用于监督伪装目标的边沿,Loss-EF和Loss-S用于直接监督伪装目标,λ

S14,使用测试集对已训练的伪装目标检测网络模型进行测试。

在本实施例,主干网络包括L1,L2,L3,L4-1,L4-2,L5-1,L5-2,其中,L4-1和L4-2、L5-1和L5-2均为并行结构,网络结构一致,但是没有共享权值。主干网络一般情况下经过了ImageNet数据集的训练已经具备了检测和分割的能力,可以采用最为常见的VGG、ResNet等网络,在此不做具体限定。

在本实施例,RF模块结构如图3所示,RF模块包括五条并行的分支结构,每条分支结构在操作之前都经过尺寸为(1,1)的卷积,前三条并行分支分别经过膨胀系数为Dk=k的膨胀卷积之后与第四条并行分支拼接,拼接后的结果经过尺寸为(1,1)的卷积与第五条并行分支相加,得到最后的输出,k=3,5,7。RF模块将稠密连接的特征作为模块的输入,RF模块模拟了人类视觉感官中的感受野,使模型更具有鲁棒性(模型的迁移能力更好),还可以扩大神经网络的搜索范围,有利于获得全局信息。

在本实施例,如图4所示,EF模块首先将经过RF模块的四层特征分为边沿特征E(包括E1,E2,E3,E4),以及检测特征S(S1,S2,S3,S4),S1的边沿特征为E1,S2的边沿特征为E2,其他的与此类似。随后为了提高检测结果中检测目标边界的清晰度,EF模块将边沿特征和检测特征的融合,在本实施例,将边沿特征E以及检测特征S融合的公式为:

E

其中,

经过EF模块优化后的检测特征S与检测标签值构建损失,边沿特征E将与边沿标签值一起构建损失。标签值均为真实值,在数据集制作过程中与数据集一起制作。同时EF模块优化后的检测特征S将输入到SA模块,作为输入参数(即Attention parameter)。Conv(·)函数表示卷积操作,f(·)表示调整特征通道、尺寸的函数,便于特征相乘。

在本实施例,如图5所示,SA模块,用于将检测特征S

在本实施例,PDC模块,用于聚合不同层的特征,提取每一张特征图的信息。PDC模块,结构如图6所示,PDC有三个输入Input1、Input2、Input3,其中Input1拥有3条并行分支结构,Input2拥有2条并行分支结构。输入Input1的第一条分支经过卷积之后,直接与输入Input2的第一条分支相乘;输入Input1的第二条分支与前一个结果(输入Input1的第一条分支与输入Input2的第一条分支相乘的结果)拼接;输入Input1的第三条分支经过卷积之后与输入Input2的第一条分支、输入Input3相乘。最后,分支通过拼接汇总特征,汇总特征通过卷积得到最后的输出。分支结构的连接,有利用三层特征的聚合,能够进一步对图像进行检索。由于每一张特征图携带不同的特征,因此拼接的聚合方式有利于提取每一张特征图的信息,此外,通过采用相乘的方式减少特征之间的差距。

上述具体实施方式为本发明的优选实施例,并不能对本发明进行限定,其他的任何未背离本发明的技术方案而所做的改变或其它等效的置换方式,都包含在本发明的保护范围之内。

相关技术
  • 一种基于边沿检测的伪装目标检测方法
  • 一种基于改进YOLO算法的伪装目标检测方法
技术分类

06120113098250