掌桥专利:专业的专利平台
掌桥专利
首页

一种基于改进YOLOv5的相似性背景下无人机检测方法

文献发布时间:2024-04-18 19:58:21


一种基于改进YOLOv5的相似性背景下无人机检测方法

技术领域

本发明涉及目标检测技术领域,具体涉及一种基于改进YOLOv5的相似性背景下无人机检测方法。

背景技术

随着民用或商用无人机的数量的大量增加,人们收获无人机带来的便利的同时,也出现了许多安全问题,解决这些安全问题就需要建立可靠的反无人机系统。反无人机的首要目标是检测与识别无人机。

无人机探测技术通常分为三类:声学、视觉和雷达。从性价比的角度看,使用视觉的无人机检测技术具有极强的应用前景。该技术使用来自摄像机捕获的可见光图像来检测区域中的无人机。

然而,受到复杂背景的干扰,无人机可能与背景之间存在相似特征,视觉检测方法难以区分。其次,无人机可能与天空中的其他飞行物体具有高度相似性,且无人机体积较小,难以获取精确的特征进行区分,阻碍了无人机与其他物体的正确识别。

发明内容

本发明的目的在于提供一种基于改进YOLOv5的相似性背景下无人机检测方法,旨在解决现有的无人机与背景相似带来的干扰特征,以及无人机小目标带来的误检、漏检问题。

为实现上述目的,本发明提供了一种基于改进YOLOv5的相似性背景下无人机检测方法,包括下列步骤:

采集无人机图像,进行预处理与标注;

将SimAM注意力机制嵌入原始YOLOv5网络的特征提取模块中,再将原始YOLOv5网络的特征融合模块改进为BiFPN结构,得到改进后的YOLOv5网络;

使用标注好的数据集对改进后的YOLOv5模型进行训练,获得检测模型;

将待测无人机视频输入至检测模型,得到检测结果。

可选的,采集无人机图像,进行预处理与标注的过程,具体为采集不同相似性背景下无人机飞行图像,经过图像统一处理后,使用LabelImg软件进行标注,将无人机标注出来,接着将图像与标注好的坐标文件分成训练集、验证集。

可选的,所述SimAM注意力机制为无参数的注意力模块,将SimAM注意力机制嵌入原始YOLOv5网络的特征提取模块的过程,具体为将SimAM注意力机制引入YOLOv5的backbone部分的C3结构中结合形成C3SimAM模块代替原本的C3模块。

可选的,所述SimAM注意力机制使用sigmoid函数来对注意力进行缩放并抑制其中的相对过大值,得到SimAM注意力模块的输出为:

其中,

可选的,所述BiFPN结构在PANet的基础上通过删除跨尺度融合中贡献小的节点,同时对同一特整层的信息,新增一条从原始输入节点到输出节点的融合路径。

可选的,所述BiFPN结构引入带权重的特征融合机制,为每条融合路径分配一个可学习的权重,使用快速归一化融合为加权特征融合方法,表达式为:

其中,w

本发明提供了一种基于改进YOLOv5的相似性背景下无人机检测方法,通过将SimAM注意力机制模块嵌入到YOLOv5的特征提取模块,SimAM注意力机制可以在不引入额外参数量的情况下,为神经元分配3D注意力权值,增强重要的神经元输出,抑制非重要的神经元输出;同时通过将YOLOv5原Neck层替换为BiFPN结构,使得预测层可以利用不同特征层的特征,这样可以大大提升网络的预测精度;再使用预处理与标注过的无人机图像数据集对改进后的YOLOv5模型进行训练,获得检测模型,最后使用检测模型对待测无人机视频进行检测得到检测结果。经验证,本发明增加了无人机目标的特征提取能力,有效减少相似性背景下目标检测的误检率、漏检率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的一种基于改进YOLOv5的相似性背景下无人机检测方法的步骤流程示意图。

图2是本发明的改进后的YOLOv5网络的C3SimAM模块的结构图示意图。

图3是FPN、PAN和BiFPN的结构示意图。

图4是本发明的具体实施例的示例数据集部分图片示意图。

图5是本发明的具体实施例的LabelImg标注示意图。

图6是本发明的具体实施例的检测结果示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

请参阅图1,本发明提供了一种基于改进YOLOv5的相似性背景下无人机检测方法,包括下列步骤:

S1:采集无人机图像,进行预处理与标注;

S2:将SimAM注意力机制嵌入原始YOLOv5网络的特征提取模块中,再将原始YOLOv5网络的特征融合模块改进为BiFPN结构,得到改进后的YOLOv5网络;

S3:使用标注好的数据集对改进后的YOLOv5模型进行训练,获得检测模型;

S4:将待测无人机视频输入至检测模型,得到检测结果。

具体的,在步骤S1中,采集不同相似性背景下无人机飞行图像,经过图像统一处理后,使用LabelImg软件进行标注,将无人机标注出来,接着将图像与标注好的坐标文件分成训练集、验证集。分别用于无人机识别网络的训练与算法效果的验证。

在步骤S2中,通过将SimAM注意力机制插入YOLOv5的backbone以及将YOLOv5的Neck换成BiFPN得到改进后的YOLOv5模型,以下从相应的原理机制进行说明:

1、SimAM注意力机制

SimAM注意力机制是一种无参数的注意力模块。其从神经科学理论出发,通过衡量神经元的线性可分性构建了一种能量函数来挖掘神经元的重要性,使不同重要性的神经元赋予不同的权重,达到加强重要特征提取,抑制非重要特征干扰的效果。定义能量函数为

其中,

使用二值化标签简化计算并赋予正则项后有:

公式(1)的解析解为:

其中

能量值越低,目标神经元与其他神经元的线性可分性越大,即神经元的重要性与能量函数成反比。使用sigmoid函数来对注意力进行缩并抑制其中的相对过大值。得到SimAM注意力模块的输出为:

将SimAM注意力机制引入YOLOv5的backbone部分的C3结构中结合形成C3SimAM模块代替原本的C3模块,C3SimAM的结构如图2所示。

2、BiFPN结构

YOLOv5的Neck层采用FPN结合PAN的结构。通过一个自上而下的特征融合结构来同时考虑浅层特征与深层信息,使得网络多尺度综合考虑浅层特征和深层特征。引入BiFPN结构改进YOLOv5的Neck网络部分,通过构建增加学习权重来进一步增加网络特征融合能力。FPN与PAN以及BiFPN的结构如图3所示。

BiFPN结构在PANet的基础上通过删除跨尺度融合中贡献较小的节点,简化网络的同时保留了重要信息。同时,对同一特整层的信息,新增一条从原始输入节点到输出节点的融合路径,减轻层级过多导致的特征信息丢失。最关键的是,BiFPN引入带权重的特征融合机制,为每条融合路径分配一个可学习的权重,通过学习迭代数据特征的融合权重,以为增益更重要的信息,抑制噪声信息。

使用的快速归一化融合为加权特征融合方法,这种方法类似于Softmax法对权重缩放到[0,1]之间,训练速度快效率高,其表达式如式(5)所示:

其中,w

在步骤S3中,使用训练集的数据对改进后的YOLOv5网络进行训练。通过反向传播优化神经网络中的权重参数,多次迭代降低分类损失函数与IOU损失函数。得到高性能的网络权重参数。

步骤S4、将待检测的视频经过处理之后输入训练好的网络中,对视频中的无人机特征信息进行提取,与背景特征信息进行区分。然后进行特征融合得到可能为无人机的坐标位置,判断无人机的置信度是否大于设定的置信度阈值。若大于设定阈值,则输出视频中的无人机目标框并在视频中标注出无人机的标签,完成对无人机目标的检测。

进一步的,本发明提出了一个具体的实施例,使用本发明与原YOLOv5网络进行对比验证,分别对示例数据集进行训练及测试比较,具体过程如下:

1、示例训练数据集以及制作过程

使用示例数据集共包含6489张相似性背景下无人机图片,部分图片如图4所示。所有图像的分辨率均为1920×1080,采集设备为GoPro Hero 7Balck。所有数据使用LabelImg标注成YOLO格式,图5为LabelImg标注示例图。数据集与标注文件的80%构成训练集,剩余20%构成测试集。

2、实验环境

实施例的实验环境由PC机搭建而成,PC配置为Intel Core i7-9700 CPU与NVIDIAQuadro RTX 4000GPU并装配Windows 10操作系统,使用Pytorch深度学习框架与CUDA10.1进行实验。将原YOLOv5网络文件替换成改进后的YOLOv5网络文件,其余超参数与原YOLOv5相同,进行300次训练迭代参数。最终训练得到的权重文件在测试集中验证,平均精确度为71.4%,相较于原算法提升5.5%使用改进后的网络模型检测结果示意图如图6所示。

以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

相关技术
  • 一种基于改进YOLOv5的无人机航拍目标检测方法
  • 一种基于改进yolov5的无人机目标检测方法
技术分类

06120116484319