掌桥专利:专业的专利平台
掌桥专利
首页

基于注意力机制的SAR图像多尺度舰船目标检测方法和装置

文献发布时间:2023-06-19 19:30:30


基于注意力机制的SAR图像多尺度舰船目标检测方法和装置

技术领域

本发明涉及图像检测技术领域,尤其涉及一种基于注意力机制的SAR图像多尺度舰船目标检测方法和装置。

背景技术

合成孔径雷达(SAR:Synthetic aperture radar)遥感具有全天时、全天候并且能够穿云透雾的优势,已成为海洋目标监测的重要手段。现有的舰船目标检测方法主要有基于传统的舰船目标检测方法和基于深度学习的舰船目标检测方法。恒虚警率检测算法是目前主流的传统SAR舰船目标检测方法,在保持虚警率恒定的前提条件下,自适应调整阈值,主要通过舰船目标与海杂波背景之间的对比度关系来实现多尺度舰船目标的检测。随着计算机视觉技术突飞猛进的发展,基于深度学习的SAR舰船目标检测算法可以从海量的高分辨率SAR图像中提取更加丰富的细节信息和深度信息,其中包括空间信息、语义信息和上下文信息,学习图像的历史信息和规律,从而提高多尺度舰船目标的检测精度。

基于传统的舰船目标检测方法主要问题是场景单一,无法提取高维特征,不适用于复杂场景下的高分辨率遥感图像。对于复杂海面场景,基于深度学习的SAR多尺度舰船目标检测算法容易出现严重的漏检和虚警,检测精度比较低。

发明内容

本发明提供一种基于注意力机制的SAR图像多尺度舰船目标检测方法和装置,用以解决现有技术中基于传统的舰船目标检测方法不适用于复杂场景下的高分辨率遥感图像,基于深度学习的SAR多尺度舰船目标检测算法容易出现严重的漏检和虚警,检测精度比较低的缺陷。

本发明提供一种基于注意力机制的SAR图像多尺度舰船目标检测方法,包括:

获取待检测的SAR图像;

将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

根据本发明提供的一种基于注意力机制的SAR图像多尺度舰船目标检测方法,所述多尺度舰船检测模型包括特征提取层、特征融合层和预测层;

所述特征提取层包括所述空间和通道注意力模块,用于提取所述SAR图像中多尺度的舰船图像特征,基于所述空间和通道注意力模块对所述舰船图像特征进行加权,提取抑制复杂背景干扰的上下文信息,得到舰船图像主要特征;

所述特征融合层包括所述空间和通道注意力模块,用于根据所述空间和通道注意力模块对所述舰船图像主要特征进行特征提取,提取多尺度舰船的空间信息和语义信息,对提取后的图像特征进行融合;

所述预测层,用于根据融合后的图像特征确定舰船目标的位置和类别。

根据本发明提供的一种基于注意力机制的SAR图像多尺度舰船目标检测方法,所述特征提取层还包括采样分层模块、卷积激活模块、第一特征提取增强模块、第二特征提取增强模块和空间金字塔池化模块;

所述采样分层模块设在所述特征提取层的输入端,用于对所述SAR图像进行行间采样,将采样得到的多个图像特征层进行拼接;

所述卷积激活模块用于对图像特征层进行卷积、批归一化和激活函数处理;

所述空间和通道注意力模块用于对卷积激活处理后的图像特征层进行加权处理,提取抑制复杂背景干扰的上下文信息;

所述第一特征提取增强模块用于对加权处理后的图像特征层进行特征融合处理,输出设定尺度的舰船图像特征;

所述空间金字塔池化模块用于对加权处理后的图像特征层进行最大池化处理;

所述第二特征提取增强模块用于对池化处理后的图像特征层进行特征融合处理,输出设定尺度的舰船图像特征。

根据本发明提供的一种基于注意力机制的SAR图像多尺度舰船目标检测方法,所述特征提取层包括依次设置的所述采样分层模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述空间金字塔池化模块和所述第二特征提取增强模块。

根据本发明提供的一种基于注意力机制的SAR图像多尺度舰船目标检测方法,所述特征融合层还包括上采样模块和下采样模块,所述上采样模块和所述下采样模块的输入端均设有所述空间和通道注意力模块,用于提取多尺度舰船的空间信息和语义信息。

根据本发明提供的一种基于注意力机制的SAR图像多尺度舰船目标检测方法,所述预测层包括多个解耦头模块,每个所述解耦头模块包括分类输出分支、检测输出分支和回归输出分支,所述分类输出分支用于预测图像类别,所述检测输出分支用于确定图像中是否包含目标,所述回归输出分支用于预测目标坐标信息。

根据本发明提供的一种基于注意力机制的SAR图像多尺度舰船目标检测方法,所述多尺度舰船检测模型的损失函数基于位置损失、置信损失和分类损失确定。

本发明还提供一种基于注意力机制的SAR图像多尺度舰船目标检测装置,包括:

SAR图像获取模块,用于获取待检测的SAR图像;

舰船目标检测模块,用于将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于注意力机制的SAR图像多尺度舰船目标检测方法。

本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于注意力机制的SAR图像多尺度舰船目标检测方法。

本发明提供的基于注意力机制的SAR图像多尺度舰船目标检测方法和装置,空间注意力模块和通道注意力模块按照先后顺序得到空间和通道注意力模块,能够在复杂环境下同时提取多尺度舰船的空间信息、语义信息和抑制复杂背景干扰的上下文信息,降低漏检率和虚警率,提高多尺度舰船目标的检测精度。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的基于注意力机制的SAR图像多尺度舰船目标检测方法的流程示意图;

图2a是本发明提供的空间和通道注意力模块的结构示意图,图2b是空间注意力模块的结构示意图,图2c是通道注意力模块的结构示意图;

图3是本发明提供的多尺度舰船检测模型的结构示意图;

图4是本发明提供的预测层的结构示意图;

图5a-图5d是本发明提供的目标检测对比效果示意图,其中,图5a和图5c为YOLOX-L模型在SSDD上的检测结果示意图,图5b和图5d为本发明提供的YOLO-MSD模型在SSDD上的检测结果示意图;

图6是本发明提供的基于注意力机制的SAR图像多尺度舰船目标检测装置的结构示意图;

图7是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本申请实施例的描述中,需要说明的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请实施例的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本申请实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请实施例中的具体含义。

在本申请实施例中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

图1是本发明提供的基于注意力机制的SAR图像多尺度舰船目标检测方法的流程示意图,如图1所示,本发明提供一种基于注意力机制的SAR图像多尺度舰船目标检测方法,包括:

S110,获取待检测的SAR图像;

S120,将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型的核心部分包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

可选的,步骤S110中的SAR图像为复杂环境下的SAR图像,包括大、中、小多种尺寸的舰船。其中,复杂环境是指近岸、远海、港口密集分布和强海杂波条件下等复杂多变的检测场景,由于SAR图像背景多样,散斑噪声较强,存在陆地、岛屿和海杂波等多种背景干扰。

可选的,步骤S120中的空间和通道注意力模块定义为SCAM:spatial and channelattention module,结合了空间和通道维度的注意力,允许网络选择性地聚焦于目标的显著部分,以更好地提取多尺度舰船目标的有效特征并抑制复杂背景的干扰,在复杂环境下可以帮助网络聚焦重要特征。

图2a是本发明提供的空间和通道注意力模块的结构示意图,图2b是空间注意力模块的结构示意图,图2c是通道注意力模块的结构示意图。

如图2a-图2c所示,空间和通道注意力模块包括空间注意力和通道注意力机制,分别学习了空间的重要性和通道的重要性。具体计算公式如下:

Ms(F1)=σ(f

Mc(Fs)=σ(MLP(MaxPool(Fs)+AvgPool(Fs)))(4)

其中F1、F2分别表示输入和输出特征图;Fs和Fc分别表示通过空间和通道注意力得到的特征图;

可以理解的是,空间注意力模块和通道注意力模块按照先后顺序得到空间和通道注意力模块,能够在复杂环境下同时提取多尺度舰船的空间信息、语义信息和抑制复杂背景干扰的上下文信息,降低漏检率和虚警率,提高多尺度舰船目标的检测精度。

图3是本发明提供的多尺度舰船检测模型的结构示意图,如图3所示,在上述实施例的基础上,作为一个可选的实施例,所述多尺度舰船检测模型包括特征提取层、特征融合层和预测层;

所述特征提取层的核心部分包括所述空间和通道注意力模块,用于提取所述SAR图像中多尺度的舰船图像特征,基于所述空间和通道注意力模块对所述舰船图像特征进行加权,提取抑制复杂背景干扰的上下文信息,得到舰船图像主要特征;

所述特征融合层的核心部分包括所述空间和通道注意力模块,用于根据所述空间和通道注意力模块对所述舰船图像主要特征进行特征提取,提取多尺度舰船的空间信息和语义信息,对提取后的图像特征进行融合;

所述预测层,用于根据融合后的图像特征确定舰船目标的位置和类别。

可选的,本发明提供的多尺度舰船检测模型是对YOLOX-L模型改进得到的多尺度舰船目标检测模型,定义为YOLO-MSD(Multiscale Ship Detection),可以提高多尺度舰船目标的检测精度。

可以理解的是,本发明在特征提取阶段,通过使用空间和通道注意力模块对特征进行加权,聚焦不同尺度的舰船目标的主要特征,提取更丰富的上下文信息,抑制复杂背景的干扰。空间和通道注意力模块被嵌入特征融合阶段,通过多层次特征图的大量空间和通道聚合信息来突出特定尺度上的显著特征,自适应地细化多尺度特征图,提取多尺度舰船的空间信息和语义信息,降低漏检率和虚警率,提高多尺度舰船目标的检测精度。

在上述实施例的基础上,作为一个可选的实施例,所述特征提取层还包括采样分层模块、卷积激活模块、第一特征提取增强模块、第二特征提取增强模块和空间金字塔池化模块。

可选的,本发明中的YOLO-MSD以CSPDarknet作为主干网络的基础,添加SCAM模块来提取舰船图像的特征。其中,CSPDarknet是YOLO神经网络中使用的主干网络。

其中,采样分层模块为图3中的Focus模块,卷积激活模块为图3中的CBS(Convolution and Batch Normalization and SILU)模块,第一特征提取增强模块为图3中的CSP1(BottleneckCSP1)模块,第二特征提取增强模块为图3中的CSP2(BottleneckCSP2)模块,空间金字塔池化模块为图3中的SPP(Spatial Pyramid Pooling)模块。

所述采样分层模块设在所述特征提取层的输入端,即设在位于舰船图像输入层之后,用于对所述SAR图像进行行间采样,将采样得到的多个图像特征层进行拼接。

可选的,Focus模块使用行间采样,然后拼接。舰船图像中每隔一个像素采样一个值,将舰船图像转换为四个独立的特征层。然后堆叠四个特征层,以便将舰船图像的宽度和高度平面中的信息转换为通道维度,从而减少信息损失。

所述卷积激活模块用于对图像特征层进行卷积、批归一化和激活函数处理。

可选的,CBS模块是特征提取模块中最基本的卷积块,由1个卷积层(Convolutionlayer)、1个BN层(Batch Normalization layer)和激活函数SILU组成。卷积为3*3或1*1,用于卷积计算和通道积分;BN层使输出归一化并防止过拟合;SiLU是Sigmoid和ReLU的结合。SiLU具有无上界、无下界、光滑和非单调的性质。SiLU在深度模型上优于ReLU,可以看作是一个平滑的ReLU激活函数。

所述空间和通道注意力模块用于对卷积处理后的图像特征层进行加权处理,提取抑制复杂背景干扰的上下文信息。

所述第一特征提取增强模块用于对加权处理后的图像特征层进行特征融合处理,输出设定尺度的舰船图像特征。

可选的,CSP1模块一个分支是CBS模块,另一个分支由CBS和Resunit两个部分组成。Resuit由两个CBS模块和残差边缘组成。

所述空间金字塔池化模块用于对加权处理后的图像特征层进行最大池化处理。

可选的,SPP模块位于特征提取层的底部,最大池化使用四种不同规模的池化内核执行,最大池化内核大小为13x13、9x9、5x5和1x1(1x1表示不处理),然后堆叠合并的四个舰船图像特征层,这种方法可以大大增加感受视野,提取更加丰富的上下文信息,抑制复杂背景的干扰。

所述第二特征提取增强模块用于对池化处理后的图像特征层进行特征融合处理,输出设定尺度的舰船图像特征。

可选的,CSP2的一个分支是单个CBS模块,另一个分支则是两个CBS模块。CSP1模块和CSP2模块可以增强网络的特征提取能力,并在轻量级的基础上保持模型的准确性。

可选的,所述特征提取层包括依次设置的所述采样分层模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述空间金字塔池化模块和所述第二特征提取增强模块。

可以理解的是,本发明提出了一种特征提取层的构成方案,在特征提取阶段,随着网络的深入,冗余信息增加,通过使用SCAM对特征进行加权,可以快速聚焦不同尺度的舰船目标的主要特征,提取更为丰富的上下文信息,抑制复杂背景的干扰。

在上述实施例的基础上,作为一个可选的实施例,所述特征融合层还包括上采样模块和下采样模块,所述上采样模块和所述下采样模块的输入端均设有所述空间和通道注意力模块,用于提取多尺度舰船的空间信息和语义信息。

可选的,舰船目标的长度和宽度范围较大,导致特征图上舰船目标的空间信息存在较大差异。为了获得不同尺度的舰船目标信息,特征融合层包括拼接和CSP2模块、上采样模块、SCAM模块、拼接和CSP2模块和CBS模块、CBS模块、下采样模块、拼接和CSP2模块,融合了由网络提取的不同尺度的舰船图像的特征信息。

首先使用CBS模块将特征层的尺寸缩小一倍。在上采样之前增加SCAM模块,使用两次上采样后叠加,堆叠后,CSP2模块用于特征提取。在下采样之前增加SCAM模块,使用两个下采样后叠加,堆叠后,使用CSP2模块进行特征提取。

可以理解的是,本发明提供了一种特征融合层的结构,特征融合层不仅对主干网络中的三个舰船特征层进行上采样以实现特征融合,还继续对舰船特征进行下采样以实现特征融合,可以更全面地融合不同尺度的舰船特征,有利于提取多尺度舰船目标的图像特征,自适应地细化多尺度特征图,提取多尺度舰船的空间信息和语义信息。通过在特征提取和融合阶段嵌入SCAM,有利于减少漏检和虚警,提高多尺度舰船目标的检测精度。

图4是本发明提供的预测层的结构示意图,如图4所示,在上述实施例的基础上,作为一个可选的实施例,所述预测层包括多个解耦头模块,每个所述解耦头模块包括分类输出分支、检测输出分支和回归输出分支,所述分类输出分支用于预测图像类别,所述检测输出分支用于确定图像中是否包含目标,所述回归输出分支用于预测目标坐标信息。

预测层用于确定特征地图中舰船目标的位置和类别,相当于多尺度舰船目标检测模型的分类器和回归器。

可选的,在YOLO-MSD中,解耦头模块首先使用1×1卷积层将特征通道数减半,然后添加两个并行分支以使用3×3卷积提取舰船特征。在分类输出分支中,使用1×1卷积来预测目标帧类别;检测输出分支为用于确定特征点是否包含对象;回归输出分支用于预测目标帧的坐标信息。最后,三个分支被堆叠,最终确定舰船图像的特征信息。解耦头2和3特征信息确定过程类似。

可以理解的是,与其他有锚框的头部网络相比,YOLO-MSD将每个位置的预测数量从3组减少到1组,大大提高了模型的收敛速度。YOLO-MSD以YOLOX-L模型为基础,可以直接预测网格左上角的两个偏移,以及预测框的高度和宽度。与此同时,YOLO-MSD将中心每个对象的位置指定为具有预定比例范围的正样本,降低了头部网络的参数和复杂性,从而产生了更快、性能更好的模型。

在上述实施例的基础上,作为一个可选的实施例,所述多尺度舰船检测模型的损失函数基于位置损失、置信损失和分类损失确定。

损失函数用来评价模型的预测值和真实值不一样的程度。

YOLO-MSD首先在预测中将图像划分为S*S网格,A表示真值的区域,B表示预测的区域。如果舰船目标的中心在网格中,则该网格中的边界框将预测该舰船目标。置信阈值用于在预测期间减少边界框的冗余。通过公式(5)计算边界框的置信度分数。

表示预测帧和真实帧的交集比率。/>

在YOLO-MSD中,损失函数可由公式(7)表示。

LOSS=loss

loss

下面基于实验的硬件和软件环境、实验的数据集、实验设置、实验评价指标以及在官方的SAR舰船检测数据集(SSDD)上的实验结果,对本发明的优点进行详细说明。

(1)实验环境

所有实验都使用相同的环境运行,环境配置的详细信息如表1所示。

表1实验环境配置

(2)实验数据集

在实验中,使用SAR数据集来评估提出的方法,官方的SAR舰船检测数据集SSDD包括1160幅500×500像素的SAR图像,分辨率从1到15米不等,数据集有不同的场景,包含2456艘不同尺寸大小的舰船目标,SAR专家标记的SAR舰船数据集可用于开发多尺度舰船目标检测器,表2显示了SSDD的详细信息。为了消除不同数据集划分对实验结果的影响,实验使用了与原始数据集相同的数据集划分方式。SSDD的训练集包含928个图像,测试集包含232个图像。

表2SSDD数据集信息

(3)实验设置

所有实验的参数设置均相同,训练次数epoch=300、批量大小batch size=64、学习率lr=0.01、动量m=0.937和权重衰减=0.0005的随机梯度下降(SGD)作为优化算法。SSDD中的输入尺寸大小为640×640。在实验中,使用Mosaic和MixUp数据增强方法来提高模型性能,Mosaic数据增强用于丰富多尺度舰船目标的背景,MixUp用于增加数据集中多尺度舰船目标的数量。所有实验都是基于MMdetection构建的,未提及的参数是MMdetection的默认参数。

(4)实验评价指标

所有实验使用COCO评价指标进行YOLO-MSD多尺度舰船目标检测网络的评估,AP(Average Presion),AP-0.5,AP-0.75,AP-s,AP-m和AP-l指标的具体含义如表3所示,AP表示平均精度,IoU(Intersection over Union)表示交并比,预测框与真实框之间的重叠度。

表3评价指标含义

精度是正确目标与所有识别目标的比率,通过公式(8)计算。TP表示预测为阳性的阳性样本的数量,FP表示测为阳性的阴性样本数。

召回率表示正确识别的阳性样本数量与测试集中所有阳性样本数量的比率,通过公式(9)计算。FN表示预测为阴性的阳性样本数。

平均精度是目标检测任务中最重要的性能指标。它表示舰船的AP平均值,即P-R(精确召回率)曲线下的面积,通过公式(10)计算。

TP、FP、FN和TN如表4所示。

表4混淆矩阵

(5)实验结果

根据实验设置和评估标准,对SSDD数据集进行了实验。基于YOLOX-L作为基线,在特征提取模块和特征融合模块同时嵌入SCAM,得到YOLO-MSD的SAR多尺度舰船目标检测性能与最新方法进行了比较,实验结果如表5所示,证明本发明提出的方法YOLO-MSD在六个评价指标中性能优异,在多尺度舰船目标的检测精度上有了较大的提升,AP50达到了98.6%。

表5实验结果

图5a-图5d是本发明提供的目标检测对比效果示意图,其中,图5a和图5c为YOLOX-L模型在SSDD上的检测结果示意图,图5b和图5d为本发明提供的YOLO-MSD模型在SSDD上的检测结果示意图;通过对比,可以看出,YOLOX-L模型存在漏检的情况,本发明提供的YOLO-MSD模型能够检测出遗漏的舰船。综上所述,可知本发明大大降低了在复杂环境下的漏检率和虚警率,提高了多尺度舰船目标的检测精度。

下面对本发明提供的基于注意力机制的SAR图像多尺度舰船目标检测装置进行描述,下文描述的基于注意力机制的SAR图像多尺度舰船目标检测装置与上文描述的基于注意力机制的SAR图像多尺度舰船目标检测方法可相互对应参照。

图6是本发明提供的基于注意力机制的SAR图像多尺度舰船目标检测装置的结构示意图,如图6所示,本发明还提供一种基于注意力机制的SAR图像多尺度舰船目标检测装置,包括:

SAR图像获取模块610,用于获取待检测的SAR图像;

舰船目标检测模块620,用于将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型的核心部分包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

作为一个实施例,所述多尺度舰船检测模型包括特征提取层、特征融合层和预测层;

所述特征提取层的核心部分包括所述空间和通道注意力模块,用于提取所述SAR图像中多尺度的舰船图像特征,基于所述空间和通道注意力模块对所述舰船图像特征进行加权,提取抑制复杂背景干扰的上下文信息,得到舰船图像主要特征;

所述特征融合层的核心部分包括所述空间和通道注意力模块,用于根据所述空间和通道注意力模块对所述舰船图像主要特征进行特征提取,提取多尺度舰船的空间信息和语义信息,对提取后的图像特征进行融合;

所述预测层,用于根据融合后的图像特征确定舰船目标的位置和类别。

作为一个实施例,所述特征提取层还包括采样分层模块、卷积激活模块、第一特征提取增强模块、第二特征提取增强模块和空间金字塔池化模块;

所述采样分层模块设在所述特征提取层的输入端,用于对所述SAR图像进行行间采样,将采样得到的多个图像特征层进行拼接;

所述卷积激活模块用于对图像特征层进行卷积、批归一化和激活函数处理;

所述空间和通道注意力模块用于对卷积处理后的图像特征层进行加权处理,提取抑制复杂背景干扰的上下文信息;

所述第一特征提取增强模块用于对加权处理后的图像特征层进行特征融合处理,输出设定尺度的舰船图像特征;

所述空间金字塔池化模块用于对加权处理后的图像特征层进行最大池化处理;

所述第二特征提取增强模块用于对池化处理后的图像特征层进行特征融合处理,输出设定尺度的舰船图像特征。

作为一个实施例,所述特征提取层包括依次设置的所述采样分层模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述第一特征提取增强模块、所述卷积激活模块、所述空间和通道注意力模块、所述空间金字塔池化模块和所述第二特征提取增强模块。

作为一个实施例,所述特征融合层还包括上采样模块和下采样模块,所述上采样模块和所述下采样模块的输入端均设有所述空间和通道注意力模块,用于提取多尺度舰船的空间信息和语义信息。

作为一个实施例,所述预测层包括多个解耦头模块,每个所述解耦头模块包括分类输出分支、检测输出分支和回归输出分支,所述分类输出分支用于预测图像类别,所述检测输出分支用于确定图像中是否包含目标,所述回归输出分支用于预测目标坐标信息。

作为一个实施例,所述多尺度舰船检测模型的损失函数基于位置损失、置信损失和分类损失确定。

图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行基于注意力机制的SAR图像多尺度舰船目标检测方法,该方法包括:

获取待检测的SAR图像;

将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型的核心部分包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行基于注意力机制的SAR图像多尺度舰船目标检测方法,该方法包括:

获取待检测的SAR图像;

将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型的核心部分包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行基于注意力机制的SAR图像多尺度舰船目标检测方法,该方法包括:

获取待检测的SAR图像;

将所述SAR图像输入到多尺度舰船检测模型中,得到所述多尺度舰船检测模型输出的目标检测结果;

其中,所述多尺度舰船检测模型的核心部分包括空间和通道注意力模块,所述空间和通道注意力模块包括空间注意力模块和通道注意力模块,所述通道注意力模块用于对所述空间注意力模块输出的特征图进行处理。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 基于注意力机制的多尺度SAR图像识别方法及装置
  • 基于注意力机制的多尺度SAR图像识别方法及装置
技术分类

06120115936991