掌桥专利:专业的专利平台
掌桥专利
首页

基于YOLOv5神经网络的无人机检测方法

文献发布时间:2023-06-19 13:46:35


基于YOLOv5神经网络的无人机检测方法

技术领域

本发明属于无人机检测技术领域,尤其是涉及一种基于YOLOv5神经网络的无人机检测方法及系统。

背景技术

目前已有的无人机检测技术主要包括以下几类:无线电检测、声学检测、雷达检测、光电检测手段等,每种技术均存在相应的优缺点:

无线电检测设备通过检测传输数据的无线电信号进行无人机的识别和定位,属于无源检测手段,对合作式无人机的检测距离远。但无线电检测设备易受外界其他无线电信号的干扰,由于民航机场电磁环境复杂,无法识别非合作式无人机或以5G信号通讯的遥控无人机。

声学检测基于不同型号的无人机声音不同,可以使用声音检测设备识别无人机的类型,通过多方向的麦克风阵列,捕捉无人机在运作时独特的高频电机声音,对声波进行处理和过滤,分析并确定特定频率,从而确定附近无人机的存在。声学检测易受环境噪声的干扰,因而适用于较安静的环境,在城市地区或嘈杂环境中由于较高的噪音而容易失效,并且声学检测有效检测距离太近,例如美国的DroneShield公司产品的有效检测距离仅200m,日本Alsok公司的产品有效测距仅有150m。

基于雷达检测设备的目标检测手段,其受云雾、雨、雪等天气因素的影响小,具有较强的穿透能力,具备全天候、全天时的特点,适用于远距离目标检测,对小目标的检测距离可达5-7km。但其在机场近距离范围内可能会与机场现有的电子设备相互干扰;机场复杂环境下的大目标回波会和无人机或飞鸟的小目标回波混叠,从而影响对小目标的检测性能;另外,当使用雷达设备检测到无人机或飞鸟之后,无法直观的获取目标的精确画面,监管人员难以从获得的数据中辨识目标是否是无人机;距离较近的多个目标同时出现时,雷达技术无法正确判断目标的数量,这无疑给机场留下了安全隐患。

光电技术检测距离能够达2km,其最大的优点是可以获得目标的可见光图像。在雨、雾、雪等恶劣条件的影响较大,光电可见光图像质量不好,会在一定程度上影响无人机的检测及识别,但在良好的天气下,光电可以获得高质量的可见光图像。

可结合雷达设备和光电设备的优点,利用雷达检测设备检测目标的位置,将位置信息发送给光电设备,引导光电设备转向目标所在方向,并利用光电设备获取可见光图像,此种方式,可快速、准确的获得无人机的图像信息,本申请是基于获取的图像信息,实现对图像中无人机的检测识别,用于提高对无人机检测的精度和响应速度。

发明内容

有鉴于此,本发明旨在提出一种基于YOLOv5神经网络的无人机检测方法及系统,用于在获取的图像信息上,实现对图像中无人机的快速识别。

为达到上述目的,本发明的技术方案是这样实现的:

第一方面,本发明提供了一种基于YOLOv5神经网络的无人机检测方法,包括以下步骤:

1)、获取无人机相关图片,进行图像预处理,得到无人机数据集;

2)、将无人机数据集输入到带有Focus层的BottleneckCSP主干网络,得到多个不同尺寸的特征图;

3)、多个不同尺寸的特征图,先经过池化处理,并利用FPN和PAN 结构将不同尺寸的特征图的特征信息进行融合处理;

4)、将融合处理得到的特征图输入到预测网络中,输出目标类型和位置信息。

进一步的,步骤1中,图像预处理的方法如下:

将获取的无人机相关图片采用数据扩增的方法增加图片数量,再对图片进行标注,得到无人机数据集。

进一步的,数据扩增的方法如下:

通过图像拼接、旋转、加入噪声的方法,扩充图片样本数量。

进一步的,步骤2中,无人机数据集在Focus层中的处理方法为:

将输入复制四份,然后通过切片操作切成四个3×320×320的切片,使用张量拼接从深度上连接这四个切片,再通过卷积核数为32的卷积层,生成32×320×320的输出,将结果输入到下一个卷积层。

进一步的,步骤2中,BottleneckCSP主干网络包括若干个1×1和3×3 的卷积层,每个卷积层后跟一层BN层和一层Mish层。

进一步的,步骤3中,利用SPP结构对不同尺寸的特征图进行池化处理,具体为:利用大小为5,9,13的池化核进行池化并堆叠。

进一步的,步骤2中,得到的不同尺寸的特征图的数量为3个;

步骤3中,利用FPN和PAN结构将不同尺寸的特征图的特征信息进行融合处理的具体方法如下:

最小尺度20×20的特征图在FPN结构中通过一次上采样与之前网络输出的40×40的特征图进行张量拼接,之后再进行一次上采样与之前网络输出的80×80的特征图进行张量拼接,输出最大尺度为80×80预测的特征图;之后在PAN结构中80×80的特征图进行一次下采样,并与之前网络的40 ×40的特征图进行张量拼接,输出中尺度为40×40预测的特征图;最后由 40×40的特征图继续进行一次下采样,并与之前网络的20×20的特征图进行张量拼接,输出最小尺度为20×20的特征图。

进一步的,步骤4中,预测网络的回归损失函数为:

其中,A、B为两个任意矩形框,C为A和B的最小外接矩形。

第二方面,本发明提供了一种电子设备,包括处理器,以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,其特征在于:所述处理器执行所述指令时实现上述第一方面所述的基于YOLOv5神经网络的无人机检测方法的步骤。

第三方面,本发明提供了一种服务器,包括至少一个处理器,以及与所述处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,其特征在于:所述指令被所述处理器执行,以使所述至少一个处理器执行如上述第一方面所述的基于YOLOv5神经网络的无人机检测方法的步骤。

相对于现有技术,本发明所述的基于YOLOv5神经网络的无人机检测方法及系统具有以下有益效果:

(1)本发明所述的基于YOLOv5神经网络的无人机检测方法,通过多尺度特征融合,能提高对小目标检测的准确率,不仅有效提高了无人机的检测速度,也大幅提高了检测的准确率。

(2)本发明所述的基于YOLOv5神经网络的无人机检测方法,训练简单,易于上手,避免了复杂繁琐的操作,可用性强。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明实施例所述的基于YOLOv5神经网络的无人机检测方法的网络结构图;

图2为本发明实施例所述的CSP结构示意图;

图3为本发明实施例所述的SPP模块示意图;

图4为本发明实施例所述的FPN和PAN结构示意图;

图5为本发明实施例所述的损失函数GIOU计算过程示意图;

图6为本发明实施例所述的基于YOLOv5神经网络的无人机检测方法的检测结果图。

具体实施方式

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面将参考附图并结合实施例来详细说明本发明。

实施例一:

本实施例提供了一种基于YOLOv5神经网络的无人机检测方法,如图1 所示,包括以下步骤:

1)、获取无人机相关图片,进行图像预处理,得到无人机数据集;

2)、将无人机数据集输入到带有Focus层的BottleneckCSP主干网络,得到多个不同尺寸的特征图,其中Focus层为一种神经网络结构;

3)、多个不同尺寸的特征图,先经过池化处理,并利用FPN和PAN 结构将不同尺寸的特征图的特征信息进行融合处理;

4)、将融合处理得到的特征图输入到预测网络中,输出目标类型和位置信息。

步骤1中,图像预处理的方法如下:

将获取的无人机相关图片采用数据扩增的方法增加图片数量,再对图片进行标注,得到无人机数据集。

数据扩增的方法如下:

通过图像拼接、旋转、加入噪声的方法,扩充图片样本数量。

步骤2中,无人机数据集在Focus层中的处理方法为:

将输入复制四份,然后通过切片操作切成四个3×320×320的切片,使用张量拼接从深度上连接这四个切片,再通过卷积核数为32的卷积层,生成32×320×320的输出,将结果输入到下一个卷积层。

步骤2中,BottleneckCSP主干网络结构如下,如图2所示,图2为CSP 结构示意图,CSP可以增强神经网络的学习能力,能够在轻量化的同时保持准确性、降低计算瓶颈、降低内存成本。BottleneckCSP是在Darknet53的基础上,在每个大残差块上加上CSP结构,BottleneckCSP网络由一系列的1 ×1和3×3的卷积层组成,没个卷积层后跟一层BN层和一层Mish层。

步骤3中,利用SPP结构对不同尺寸的特征图进行池化处理,方法为:利用大小为5,9,13的池化核进行池化并堆叠,具体方法如下:

如图3所示,SPP结构可以用来解决输入图像尺寸不统一的问题,SPP 中不同大小特征的融合,有利于待检测图像中目标大小差异较大的情况,尤其是对于复杂的多目标图像。图中首先直接对整个区域池化,每层得到一个点,共256个点,构成一个1×256的向量;其次将区域划分成2×2共4个格子,每个格子池化得到4个1×256的向量;最后将区域划分成4×4共16个格子,每个格子池化得到16个1×256的向量,将三种划分方式池化得到的结果最终进行拼接。由图中可以看出,整个过程对于输入的尺寸大小完全无关,因此可以处理任意尺寸的候选框。本发明实施例特征图输入SPP结构后,利用大小为5,9,13的池化核进行池化并堆叠。

步骤2中,得到的不同尺寸的特征图的数量为3个;

步骤3中,如图4所示,图4为FPN和PAN结构示意图,不同尺度的特征图通过FPN和PAN结构进行特征融合,并输出三个不同尺度的特征图,其中,FPN和PAN结构均为神经网络。

利用FPN和PAN结构将不同尺寸的特征图的特征信息进行融合处理的具体方法如下:

最小尺度20×20的特征图在FPN结构中通过一次上采样与之前网络输出的40×40的特征图进行张量拼接,之后再进行一次上采样与之前网络输出的80×80的特征图进行张量拼接,输出最大尺度为80×80预测的特征图;之后在PAN结构中80×80的特征图进行一次下采样,并与之前网络的40 ×40的特征图进行张量拼接,输出中尺度为40×40预测的特征图;最后由 40×40的特征图继续进行一次下采样,并与之前网络的20×20的特征图进行张量拼接,输出最小尺度为20×20的特征图。

步骤4中,如图5所示,预测网络的回归损失函数为:

其中,A、B为两个任意矩形框,C为A和B的最小外接矩形。

图6为本发明实施例所述的基于YOLOv5神经网络的无人机检测方法的检测结果图;

表1为本发明实施例与YOLOv4神经网络的性能比较。

表1

表1中Precision为精确率,即在预测为正类的数据中,预测正确的比率; Recall为召回率,即在所有正类的数据中,预测正确的比率。其计算公式如下:

其中,TP(True Positive)表示预测为正类的正确率;FP(False Positive)表示将负类预测为正类的误报率;FN(False Positive)表示将正类预测为负类的漏报率。

AP(Average Precision)为平均精度,其计算方法为Precision-Recall曲线所围成的面积。

第二方面,本发明提供了一种电子设备,包括处理器,以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,其特征在于:所述处理器执行所述指令时实现上述实施例所述的基于YOLOv5神经网络的无人机检测方法的步骤,至于电子设备的硬件结构,能够利用现有技术实现,这里不再赘述。

第三方面,本发明提供了一种服务器,包括至少一个处理器,以及与所述处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,其特征在于:所述指令被所述处理器执行,以使所述至少一个处理器执行如上述实施例所述的基于YOLOv5神经网络的无人机检测方法的步骤,至于服务器的硬件结构,能够利用现有技术实现,这里不再赘述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的系统及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 基于YOLOv5神经网络的无人机检测方法
  • 基于FoveaBox无锚神经网络的无人机检测方法
技术分类

06120113807067