掌桥专利:专业的专利平台
掌桥专利
首页

一种基于yolov5的车辆种类检测与质量预估方法

文献发布时间:2023-06-19 11:05:16


一种基于yolov5的车辆种类检测与质量预估方法

技术领域

本发明涉及图像识别领域,具体为一种基于yolov5的车辆种类检测与质量 预估方法。

背景技术

现今,人类的技术突破和人口的增长导致了路上行驶的车辆数量和种类呈 现井喷式增长。例如,轿车、货车、公交车、消防车、急救车、洒水车、摩托 车、皮卡、吊车等等。它们的种类繁多,同一类型的车辆也会有不同的样子。 一张高清的街景图片或者一些高清摄像头拍摄的照片中,会记录下数量较多的 汽车。如果上述图片都依靠人眼去识别判断的话,将会耗费大量的时间和人力 资源,提升了成本。

现有的检测和识别方法主要是人工辨别,通过人眼接受信息、在脑中对比 已知车辆种类以达到识别的目的,不但人员成本高,需要较多人力识别,会导 致研究工作进度缓慢,而且容易出错,当具有大量图片数据时,人眼经过高压 处理后易疲惫,会导致出错,从而导致遗漏和错误,无法批量识别,效率低。

发明内容

本发明目的在于提供一种基于yolov5的车辆种类检测与质量预估方法,通 过该方法可以批量识别,同时也提升了识别的准确性,避免人为识别过程中发 生错误,且还预测不同车辆的质量,提高相关产业的整体效率。

为达成上述目的,本发明提出如下技术方案:一种基于yolov5的车辆种类 检测与质量预估方法,包括:

获取含有车辆类的若干图片,将获取的若干图片按预定比例分为训练集和 验证集;

标注训练集中的图片,利用标注工具用矩形框框出图片中的车辆,并输入 车辆种类名称;

传输标记后的图片,所述标记后的图片经过数据增强后传入主干网络,并 生成标记后的图片的三个第一特征层,再将三个第一特征层分别输入neck部分, 产生三个第二特征层并输入给输出端,所述第二特征层用于显示预测框,输出 端根据生成的三个第二特征层给出边界框和置信度;

采用非极大值抑制方法,筛选掉重复的边界框,得出预测框,将预测框与 标注工具产生框进行对比,并采用GloU损失函数计算损失,再利用损失函数做 反向传播,从而调整yolov5的权重,其中GIoU损失公式如下:

A:标注框矩形;

B:预测框矩形;

C:两个框形成的图像的最小外接矩形,即同时包含了预测框和真实框的最 小框的面积;

重复上述过程使yolov5逐渐收敛,并通过验证集的测试不断调整参数,以 使其具有泛化能力和精度提升。

进一步的,在本发明中,所述数据增强是通过添加、略微修改的现有数据 副本或从现有数据中新建的合成数据来增加数据量。

进一步的,在本发明中,将所述标记后的图片自适应缩放,以适合yolov5 需要的大小。

进一步的,在本发明中,所述标记后的图片自适应缩放后数据不足,采用 Mosaic方法将四张图片以随机缩放、随机裁剪、随机排布的方式进行拼接,成 为一张图片,以使yolov5接收一张图片时,等于同时接受了原来4张图片的目 标,进而丰富了数据集。

有益效果,本申请的技术方案具备如下技术效果:

本方法利用yolov5的检测方法即直接给出物体的类别概率和位置,识别速 度更快,可以处理大批量车辆图片,提供了较为清晰的路况信息和车辆信息, 使其后续工作能够更好地进行,当经过训练后,yolov5可以达到较高精度,使 用者只需要将含有车辆的图片输入网络即可输出分类,可以部署到不同的拥有 摄像头的电子设备上,来作为检测工具。

应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只 要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部 分。

结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方 面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有 益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践 中得知。

附图说明

附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相 同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个 组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的 实施例,其中:

图1为本发明的方法步骤示意图。

图2是本方法的预测实例图。

图3是训练流程图。

图4是测试流程图。

具体实施方式

为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。 在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。 本公开的实施例不必定意在包括本发明的所有方面。应当理解,上面介绍的多 种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多 方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何 实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的 其他方面的任何适当组合来使用。

如图1-4所示的一种基于yolov5的车辆种类检测与质量预估方法,整个方 法主体分为训练和使用两大部分。

训练:

收集数量大于等于5000张关于不同种类车辆的图片和街景,且不同种类的 车辆的图片数量差距小于200张,再查询不同种类车辆的质量,并计算出每个 种类的平均值和中位数,并计算他们的差值。训练集和验证集将按照比例从得 到的图片中随机划分。

利用标注工具,框出训练集中的车辆,并记录下类别,生成所标记框的相 关文件。

将标注好的图片送入模型的输入端,因为所有图片的大小是不同的,而 yolov5是需要统一规格的图片才能生成特征层,所以,需要将图片自适应缩放, 即先将图片按照yolov5所需要的输入尺寸缩小,之后对于较短边添加的黑色条 成为正方形,以满足608像素x 608像素的输入规格,如果数据不足时,则需 要数据增强方法,使用Mosaic方法为将四张图片以随机缩放、随机裁剪、随机 排布的方式进行拼接,成为一张图片。这种方法下,yolov5接收一张图片时, 意味着同时接受了原来4张图片的目标,丰富了数据集。

将经过预处理的图像输入主干网络。生成由focus结构,图像切片和一系 列处理后的三个大小不同的特征层。再将三个特征层分别输入neck部分,经过 一系列处理后,产生新的三个特征层并输入给输出端。

输出端根据新生成的三个特征层,给出边界框(模型初始的预测,一个种 类会有多个边界框)和置信度(表示边界框里确实有物体的自信程度和边界框 是否将整个物体的所有特征都包括进来的自信程度)。之后,采用非极大值抑制 方法,筛选掉重复的边界框,非极大值抑制的步骤是,先根据置信度得分进行 排序,选择置信度最高的边界框添加到最终输出列表中,将其从边界框列表中 删除,计算所有边界框的面积,计算置信度最高的边界框与其它候选框的交并 比loU(是指两个框的交集面积与两个框的并集面积之比,表示了两个框的相交 程度)。删除loU大于一定值的边界框,重复上述过程直到边界框列表为空。剩 下的边界框便是预测框,再将其与之前手动标注的框进行对比,并采用GloU损 失函数(损失函数映射了预测框与真实框的差距,而通过损失函数可以不断调 整权重,缩小差距)计算损失。再利用损失函数做反向传播,从而调整yolov5 的权重。

GIoU损失公式:

A:标注框矩形;

B:预测框矩形;

C:两个框形成的图像的最小外接矩形,即同时包含了预测框和真实框的最 小框的面积。

重复上述过程使yolov5逐渐收敛,并通过验证集的测试不断调整参数,以 使其具有泛化能力和精度提升。

使用:将没有标注过的图片输入,以获得带有预测的图像,从而实现检测 和识别出不同种类的车辆。在种类标签后,还有次种类车辆的平均值和一个括 号,括号内为正负此种类车辆平均值和中位数差值的绝对值,表示了该车辆质 量可能存在的上下浮动值。

本方法利用yolov5这种one-stage检测方法即直接给出物体的类别概率和 位置,识别速度更快,可以处理大批量车辆图片,提供了较为清晰的路况信息 和车辆信息,使其后续工作能够更好地进行。当经过训练后,yolov5可以达到 较高精度,届时使用者只需要将含有车辆的图片输入网络即可输出分类。可以 部署到不同的拥有摄像头的电子设备上,来作为检测工具。

虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明 所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各 种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

相关技术
  • 一种基于yolov5的车辆种类检测与质量预估方法
  • 一种基于优化的YOLOv5模型的车辆分类检测方法
技术分类

06120112792286