掌桥专利:专业的专利平台
掌桥专利
首页

一种复杂背景下无人机运动目标检测方法

文献发布时间:2023-06-19 19:28:50


一种复杂背景下无人机运动目标检测方法

技术领域

本发明涉及运动目标检测技术领域,具体涉及一种复杂背景下无人机运动目标检测方法。

背景技术

各种商用和民用无人机的大量涌现,给人类带来便捷的同时,也出现了许多安全问题,需要对无人机进行管理控制,因此无人机目标检测技术逐渐成为研究的热点。

随着计算机和人工智能技术的快速发展,利用计算机实现人类的视觉功能成为目前计算机领域中最热门的课题之一。计算机视觉研究的一个重要方面就是运动目标的检测,它在智能视频监控、人机交互、虚拟现实、机器人导航、交通检测等许多领域有着广泛的应用。

但由于受户外复杂背景环境的影响,目标无人机往往与目标周围的背景存在相似性的特点(颜色、纹理、角点、边)等,这通常会导致目标特征表达不准确,检测不到目标物体或检测困难等问题。

发明内容

本发明的目的在于提供一种复杂背景下无人机运动目标检测方法,旨在解决现有的无人机运动目标检测方法在复杂背景下无人机目标特征表达不准确,难以检测问题技术问题。

为实现上述目的,本发明提供了一种复杂背景下无人机运动目标检测方法,包括下列步骤:

获取图像数据集并进行标注,得到带标注的数据集;

基于YOLOv5模型改进,在Backbone骨干网络中增加改进的SCAM注意力机制模块;

在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;

获得改进后的YOLOv5模型;

将所述带标注的数据集送入改进后的YOLOv5模型进行训练,获得检测模型;

将待测复杂背景无人机视频输入至所述检测模型进行检测,得到检测结果。

其中,所述改进的SCAM注意力机制模块通过结合空间注意模块和通道注意模块并改变所述空间注意模块和所述通道注意模块之间的连接结构后获得。

其中,所述通道注意模块使用平均池化来聚合空间信息,使用最大池化来在特征图F的空间维数上收集更详细的目标特征,输入大小为C×H×W。

其中,所述空间注意模块关注特征的位置信息,重点关注特征图中特征更有效的区域。

其中,所述改进的SCAM注意力机制模块的关键思想是从输入特征图Y中分别得到沿空间和通道的注意权值矩阵Z

其中,在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法,具体为在Neck网络部分引入自适应空间特征融合模块,采用FPN结合PAN结构的多尺度特征融合方法。

其中,所述自适应空间特征融合模块利用空间过滤冲突信息以抑制不一致的方法,从而提高了特征的尺度不变性。

本发明提供了一种复杂背景下无人机运动目标检测方法,通过将空间注意模块和通道注意模块结合,再改变空间注意模块和通道注意模块之间的连接结构,提出了一种改进的SCAM注意力机制模块,并将该结构插入YOLOv5的网络模型中,来提高模型对特征图中运动目标与背景聚焦区域的注意,同时将原始YOLOv5的Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;强化原模型在复杂场景下的特征提取能力和特征融合效率,从而提高复杂背景干扰下目标的检测精度,最后使用训练后的检测模型进行检测,实现复杂背景干扰下的无人机目标检测。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的一种复杂背景下无人机运动目标检测方法的流程示意图。

图2是本发明的一种复杂背景下无人机运动目标检测方法的SCAM模块结构示意图。

图3是本发明的一种复杂背景下无人机运动目标检测方法的自适应特征融合模块的结构示意图。

图4是本发明的具体实施例的整个复杂背景下无人机检测过程示意图。

图5是本发明的具体实施例的数据集图片实例。

图6是本发明的具体实施例的图像标注实例。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

请参阅图1,本发明提供了一种复杂背景下无人机运动目标检测方法,包括下列步骤:

S1:获取图像数据集并进行标注,得到带标注的数据集;

S2:基于YOLOv5模型改进,在Backbone骨干网络中增加改进的SCAM注意力机制模块;

S3:在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;

S4:获得改进后的YOLOv5模型;

S5:将所述带标注的数据集送入改进后的YOLOv5模型进行训练,获得检测模型;

S6:将待测复杂背景无人机视频输入至所述检测模型进行检测,得到检测结果。

以下结合实施步骤,通过对相应术语的解释对本发明作进一步说明(为方便描述,部分术语会混用英文简写):

(一)SCAM空间通道注意模块;

具体请参阅图2,通道注意模块(CAM)使用平均池化(AvgPool)来聚合空间信息,使用最大池化(MaxPool)来在特征图F的空间维数上收集更详细的目标特征,输入大小为C×H×W。同时使用这两种池化操作可以减少特征图的大小和计算量,提高网络的表达能力。合并后的两个一维向量被发送到整个连接层进行操作。这里使用1x1的卷积核来实现特征向量之间的权值共享(MLP)。

最后,通过Sigmoid激活函数得到通道注意的输出结果Z

空间注意模块(SAM)更加关注特征的位置信息,重点关注特征图中特征更有效的区域。利用平均池化(AvgPool)和最大池化(MaxPool)对信道维数上的特征图Y

Z

SCAM的关键思想是从输入特征图Y中分别得到沿空间(SAM)和通道(CAM)的注意权值矩阵Z

首先,利用CAM得到信道注意权重Z

Y

其中,它是通过SAM获得的,并且已经包含了某一通道的注意机制的先验知识。因此,权重Z

(二)自适应空间特征融合的方法;

从输入图像中不断卷积和提取特征的过程中,主干网络的图像分辨率不断降低,导致分辨率较小的受背景干扰的目标的特征信息丢失。通过简单的网络结构改变,FPN采用多尺度特征融合,大大提高了目标的检测性能。YOLOv5的Neck部分采用了FPN结合PAN结构的多尺度特征融合方法。与FPN相比,它增加了一个自下而上的特征融合层。同时,考虑浅层高分辨率表示信息和深层语义信息,获得具有高分辨率和强语义特征的特征信息。这种多尺度特征融合方法有利于提取受到背景干扰的目标的特征。然而,特征融合会结合不同层或分支的特征,通常忽略了不同比例特征图之间的差异。与浅层大尺度特征图相比,深度小尺度特征图的分辨率较低,受背景干扰的目标的特征信息效率较差,且更容易被模型识别为背景噪声。因此,在受复杂背景干扰的无人机运动目标检测任务中,为了解决多尺度特征融合时存在的不一致性问题,本发明采用一种自适应特征空间融合模块。该模块主要原理是利用空间过滤冲突信息以抑制不一致的方法,从而提高了特征的尺度不变性,模块具体结构如图3所示。

图中ASFF-3流程描绘了融合特征的步骤,框中X1~X3各自来源于level1-level 3特征,再与不同特征层的权重参数进行乘加运算,进一步得到新型融合特征ASFF-3,如下式:

其中,

ASFF-1和ASFF-2的特征融合步骤与ASFF-3流程类似。

具体的修改步骤为修改YOLOv5的代码:

1.models/common.py:加入添加的类ASFV5以及相关代码;

2.models/yolo.py:parse_model函数里添加类ASFF_Detect;

3.models/yolo5s-asff.yaml:在models文件夹下新建对应的yolov5s-asff.yaml文件。将Detect换成ASFF_Detect。

进一步地,本发明还提出了一个具体实施例辅助说明:

图4为基于改进YOLOv5网络的一种复杂背景下无人机运动目标检测过程具体实施例示意图。该复杂背景下无人机目标检测方法包括以下步骤:

A构建数据集:

S1:获取复杂背景下无人机运动目标的图像数据,如图5所示,本实例共采集到2503张单目标无人机图像,其中80%用于训练,20%用于测试。所有图像均为1920×1080分辨率,采集设备为GoPro Hero 7Black,速度为每秒30帧,无人机距离采集设备距离为100~500米。

S2:选择LabelImg作为标注工具,如图6所示,用矩形边界框标注图像数据中无人机区域,获得相应的label文件并存储为Yolo格式,label文件与原始图像共同构成图像数据集。

B搭建基于改进的YOLOv5网络模型:

S1:在YOLOv5网络主干特征提取网络中的卷积层后添加改进的SCAM模块,改进模型对受复杂背景干扰的目标的特征图的关注,使网络聚焦图像的目标区域,改进的SCAM模块如图2所示,改进后的网络模型检测结果如图4所示。

S2:将YOLOv5网络的Neck部分引入了自适应空间特征融合模块,以此加强模型在多尺度特征方面的融合,如图3所示,改进后的网络模型检测结果如图4所示。

C将所述带标注的数据集输入融合改进后的YOLOv5网络模型进行训练,并检测模型的性能。

D将待测的复杂背景无人机视频输出所述改进的检测模型进行检测,融合改进后的网络模型检测结果如图4所示。

相较于大多数检测器的网络结构采取FPN直接添加连接的方式输出目标信息多层特征,加入自适应空间特征融合模块可以达到充分利用不同尺度特征的效果。本发明在YOLOv5算法中Neck部分引入了自适应空间特征融合模块,以此加强模型在多尺度特征方面的融合。

以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

相关技术
  • 一种复杂背景下运动目标检测与跟踪方法
  • 一种下视复杂背景弱小运动目标检测方法
技术分类

06120115921093