掌桥专利:专业的专利平台
掌桥专利
首页

一种基于YOLOv5优化器改进的违禁物品检测方法

文献发布时间:2023-06-19 10:54:12


一种基于YOLOv5优化器改进的违禁物品检测方法

技术领域

本发明涉及一种基于YOLOv5优化器改进的违禁物品检测方法,属于光学工程与人工智能领域。

背景技术

随着经济社会的快速发展,技术水平不断更新,轨道交通得到了快速的发展,地铁逐渐成为了城市出行必不可少的一部分。然而,地铁公交系统存在环境封闭、人流量大、疏散困难等特点。为保障民众出行安全,北京率先于2008年启动与机场安检模式相同的地铁安检模式,随后全国各地陆续开展。

目前,地铁与机场的安检流程相同,主要由“人检”和“物检”两部分组成。其中,“人检”由金属探测门和安检员组成,“物检”由X光安检机完成。安检流程一般为:乘客将随身携带物品及行李放入X光安检机,由X光安检机对物品及行李进行检测,乘客则通过金属探测门。

针对“物检”的检测系统目前仍然会存在一些漏检的现象,提高在“物检”中行李违禁品检测的准确率,以及及时识别出违禁品类型对于维护公共安全,改善安检效果,保障民众的出行安全意义深远。

发明内容

本发明所要解决的技术问题是,提出一种基于YOLOv5优化器改进的违禁物品检测方法,用来解决当前公共交通安检过程中“物检”不够精确的问题。

本发明为了解决上述技术问题采用以下技术方案:本发明提出了一种基于YOLOv5优化器改进的违禁物品检测方法,基于样本行李X光图像集,应用如下步骤A至步骤C,训练并获取用于识别行李X光图像中违禁品类别的基于YOLOv5优化器改进的目标神经网络模型;然后,针对待检测的行李X光目标图像,应用目标神经网络模型,获取行李中所包含违禁品的分类结果;

步骤A.将样本行李X光图像集分为用于训练构建目标神经网络模型的训练集合和用于测试目标神经网络模型的测试集合;

步骤B.基于训练集合中的样本行李X光图像,构建以样本行李X光图像为输入,以对应的样本行李X光图像中违禁品类别为输出的待训练神经网络模型,在训练过程中使用预设改进的YOLOv5优化器算法,对待训练神经网络模型按照预设的迭代次数进行迭代训练,从而获得用于识别行李X光图像中违禁品类别的待验证神经网络模型;

步骤C.使用测试集合中的样本行李X光图像对待验证神经网络模型进行测试并验证待验证神经网络模型的性能,如果不满足预设的性能指标,则增加待训练神经网络模型的迭代训练次数,重复执行步骤B;如果满足预设的性能指标,则步骤B获得的待验证神经网络模型即为目标神经网络模型。

作为本发明的一种优选技术方案,样本行李X光图像集既包括包含违禁品的样本行李X光图像,也包括不包含违禁品的样本行李X光图像。

作为本发明的一种优选技术方案,步骤A中将样本行李X光图像集中80%的图像集作为用于训练目标神经网络模型的训练集合,另外20%的图像集用于测试目标神经网络模型的测试集合。

作为本发明的一种优选技术方案,所述样本行李X光图像集包含10种类别的违禁品,包括刀、剪刀、打火机、油、压力容器、弹弓、手铐、指甲油、充电宝和烟花。

作为本发明的一种优选技术方案,在步骤B执行之前,首先将样本行李X光图像集中的各个样本行李X光图像按照预设的算法归一化为大小为预设的尺寸。

作为本发明的一种优选技术方案,所述的待训练神经网络模型结构为PANet网络结构。

作为本发明的一种优选技术方案,所述的改进的YOLOv5优化器为RMSProp优化器。

本发明所述一种基于YOLOv5优化器改进的违禁物品检测方法,采用以上技术方案与现有技术相比,具有以下技术效果:

(1)由PANet网络对数据集进行训练,得到一个高效的训练结果,由此可以对行李包裹违禁品的快速定位,比起以往的方法更高效,节省了大量的时间和人工成本;

(2)改进优化器RMSProp,用来更新、计算影响模型训练和模型输出的网络参数,更能使参数逼近或达到最优值,达到最小化损失函数,从而模型稳定,有利于快速、准确的达到预期的检测效果;

(3)改进优化器RMSProp,使得输出不同层的特征图更精确,优化了输出数据,提高定位和分类的准确性。

附图说明

图1为本发明一种基于YOLOv5优化器改进的违禁物品检测方法的系统流程图;

图2为本发明中用于提取图像特征的PANet网络结构简图;

图3(a)、图3(c)为本发明实施例中使用SGD优化器检测效果图;

图3(b)、图3(d)为本发明实施例中使用RMSProp优化器的检测效果图;

图4(a)为本发明实施例中使用SGD优化器的实验数据分析图;

图4(b)为本发明实施例中使用RMSProp优化器的实验数据分析图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。

本实施例在Ubuntu18.04.4LTS环境下工作,以PyTorch为框架进行,主要参数有:初始学习率为0.001,动量参数为0.937,权重系数为0.0005,训练阈值为0.5,imagesize为896×896,epoch为200等,此外,为了提高数据的多样性,对图片进行数据增强,提高模型的泛化能力;数据扩增使用颜色扩增、随机扩展以及随机剪裁,每个步骤均以0.5的概率选择是否使用。

本实施例一种基于YOLOv5优化器改进的违禁物品检测方法,使用识别训练步骤如图1所示:

构建样本X光图像集,样本X光图像集中的图像既包括包含违禁品的样本行李X光图像,也包括不包含违禁品的样本行李X光图像,其中包含10种类别的违禁品,包括刀、剪刀、打火机、油、压力容器、弹弓、手铐、指甲油、充电宝和烟花;基于样本行李X光图像集应用如下步骤A至步骤C,训练并获取用于识别行李X光图像中违禁品类别的基于YOLOv5优化器改进的目标神经网络模型;然后,针对待检测的行李X光目标图像,应用目标神经网络模型,获取行李中所包含违禁品的分类结果;

步骤A.采用随机抽样法将样本行李X光图像集中80%的图像集作为用于训练目标神经网络模型的训练集合,另外20%的图像集用于测试目标神经网络模型的测试集合,样本行李X光图像集来源于现实生活中的场景,首先利用目标检测标注工具将图片格式化为896×896的尺寸;

步骤B.基于训练集合中的样本行李X光图像,构建以样本行李X光图像为输入,以对应的样本行李X光图像中违禁品类别为输出的待训练神经网络模型,神经网络模型采用如图2所示的PANet网络模型,该网络模型主要包括四个部分:(1)FPN特征金字塔,主要作用是通过融合高低层特征提升目标检测的效果,尤其是可以提高小尺寸目标的检测,例如在违禁品中有一种指甲油类别,尺寸较小,选择FPN可以显著提升效果;(2)自底向上路径扩充,主要考虑到网络浅层特征信息对于实例分割非常重要,浅层特征多是边缘形状等特征,而实例分割是像素级别的分类;(3)自适应池化特征层,主要目的是特征融合,将单层特征换成多层特征,使得提取到的ROI特征更加丰富;(4)全连接层是针对原有的分割支路引入一个前背景二分类的全连接支路,通过融合这两条支路的输出得到更加精确。

深度学习难以在大数据领域发挥最大效果的原因之一,是在巨大的数据集基础上进行训练速度很慢。而优化算法能够帮助我们快速训练模型,取得最优值,提高计算效率。对于模型的构建,选择一个合适的优化算法是必要的,优化算法主要解决梯度消失和局部最优的问题。优化算法大致可以分为两大类:一类是基于Momentum的优化算法,另一类是基于自适应的优化算法。其中,SGD优化器属于前者,SGD是通过每个样本来迭代更新一次,在样本量很大的情况下,可能只使用其中一部分的样本,就已经迭代达到最优解了。SGD的数学表达形式为:θ'=θ-η·Δ

其中,r

本实施例在训练过程中分别使用PANet网络中原有的SGD优化器算法和使用RMSProp优化器算法,分别对待训练神经网络模型进行迭代训练,鉴于计算机硬件的限制,本实施例只分别使用两种算法做200次的训练;

步骤C.使用测试集合中的样本行李X光图像分别对两种待验证神经网络模型进行测试并验证待验证神经网络模型的性能;

图3展示了使用测试集合进行测试后的效果图,挑出了两组进行对比。图3(a)、图3(c)组是使用优化器SGD测试效果图,图3(b)、图3(d)组是使用优化器RMSProp测试效果图。由图3(a)、图3(b)可以看出改进前,精度低且存在漏检的项目,改进后的模型可以缓解漏检的缺陷,同时也能提高检测精度;由图3(c)、图3(d)可以看出,使用改进后的RMSProp优化器,可以在一定程度上可以提高检测的精度;总的来说,此项目使用优化器RMSProp对检测准确性能起到了一定的提升作用。

图4(a)和图4(b)分别展示了使用优化器SGD和使用优化器RMSProp,各项指标随着迭代训练次数的变化所展示出的变化趋势,该结果是在epoch为200,batchsize为16,imagesize为896×896情况下训练得到的;GIoU(Generalized Intersection over Union)表示任意两个边框的度量,ValGIoU含义相同,此发明中的GIoU作为一种损失度量,其中GIoU和IoU计算公式如下:

其中,A、B代表任意的两个框,C代表能够包住它们的最小方框。

Objectness可以具象化理解为“置信度”,Objectness对应的是训练时布尔值类型的二分类标签,理解成对应的真实和错误的逻辑值,ValObjectness对应的是测试时二分类标签的值;Classification指的是训练时分类的结果,对应的ValClassification指的是测试时分类的结果;mAP@=0.5是指IoU=0.5时测得模型的精度,mAP@=0.5:0.95是指IoU=0.5:0.95时测得模型的精度。其中,精准率Pr ecision和召回率Re call的计算公式为:

其中,TP为真正例,指模型将正类别样本正确预测为正类别;TN为真负例,指模型将负类别样本正确预测为负类别;FP为假正例,指将负类别样本错误的预测为正类别;FN为真负例,将负类别样本错误的预测为负类别。

取epoch第一次和最后一次时的执行结果,可得出测试结果如下表1所示:

表1训练阶段epoch为0和epoch为199时的对比

由表1可以看出,在epoch为0时,基于优化器SGD和基于优化器RMSProp的变化微乎其微,但在经过199次迭代训练之后,基于优化器RMSProp的效果好于基于优化器SGD的效果;重点分析epoch为199时的几个常见参数,基于优化器SGD的回归率为0.748,基于优化器RMSProp的回归率为0.77,提高了0.022;基于优化器SGD的精准率为0.325,基于优化器RMSProp的精准率为0.327,提高了0.002;基于优化器SGD的mAP@0.5为0.615,基于优化器RMSProp的mAP@0.5为0.62,提高了0.005;基于优化器SGD的mAP@0.5:0.95为0.3,基于优化器RMSProp的mAP@0.5:0.95为0.301,提高了0.001;在随着训练次数的不断叠加,GIoU的损失不断减小;精准率和回归率之间往往是一种博弈关系,好的模型在回归率增长的同时也会保持较高的精准率;mAP随着IoU值的不同也显示出了较高的精度;实验数据证明了改进的模型是一个较好的模型,鉴于计算机硬件的限制,本发明只训练了epoch为200,虽然涨幅较小,却也证明了RMSProp优于SGD。

表2测试epoch训练200次后的模型参数表

由表2知:在原有的优化器SGD基础上,选择改进优化器RMSProp,分别对训练完的两个模型进行测试,NMS(Non-Maximum Suppression)测试的阈值设置为0.65,其中在原有的基础上,精准率为0.277,改进后的精准率为0.278,提高了0.001;在原有的基础上,召回率为0.683,改进后的召回率为0.7,提高了0.017;在原有的基础上,mAP@0.5为0.534,改进后的mAP@0.5为0.546,提高了0.012;在原有的基础上,mAP@0.5:0.95为0.256,改进后的mAP@0.5:0.95为0.263,提高了0.007;由测试得到的数据可以说明,在该情况下,优化器RMSProp更适用于本应用场景,也证明了改进的有效性。此外,本发明只涉及优化器RMSProp,其他优化器是否有效,本发明未涉及,这也是后续工作需要更进一步深入探究的。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

相关技术
  • 一种基于YOLOv5优化器改进的违禁物品检测方法
  • 一种基于改进YOLOv5的串型番茄实时检测方法
技术分类

06120112721567