掌桥专利:专业的专利平台
掌桥专利
首页

一种交通目标检测方法及电子设备

文献发布时间:2023-06-19 18:34:06


一种交通目标检测方法及电子设备

技术领域

本发明涉及交通监控技术领域,尤其是涉及一种交通目标检测方法及电子设备。

背景技术

随着人工智能技术的发展和进步,目标检测已在诸多领域应用。在交通领域,不可避免的是对车辆、行人、非机动车的检测分离,然后分别进行监控,进行违法事件的预警与记录,可以说是交通监控技术领域的核心,对于车辆检测,比较成熟的是基于车牌的车辆检测,准确度可以高达99%,但是对于一些无牌车辆以及一些工程车,无法通过车牌识别有效定位抓拍车辆,这样造成一些事后取证工作的难度;行人和非机动车检测,由于目标相对较小,并且姿态特征复杂度远高于车辆检测,到目前为止,也仍旧处于不断探索优化中。

行人和非机动车,同样作为交通中的主体对象,进行有效地检测成分为必不可少的部分,对于交通领域的进步有着重要作用,但现有技术存在对车辆、行人和非机动车的检测效率较低的问题。

发明内容

本发明的目的在于提供一种交通目标检测方法及电子设备,缓解了现有技术存在的对车辆、行人和非机动车的检测效率较低的问题。

第一方面,本发明提供一种交通目标检测方法,包括:

生成训练数据集,其中包括每个样本的目标类别以及位置信息,所述目标类别包括非机动二轮车、行人、小汽车、货车、公交车、三轮车、工程车中的至少两种;

准备神经网络模型,所述神经网络模型包括至少五组卷积模块,每组卷积模块包括至少两个卷积层;

利用所述训练数据集对所述神经网络模型进行训练,获得交通目标检测模型。

进一步的,生成训练数据集的步骤之后,还包括:

通过改变亮度、改变饱和度、旋转、镜像或图像裁剪的方式,对样本进行数据增强处理。

进一步的,所述神经网络模型包括八组卷积模块。

进一步的,第五组至第八组卷积模块均为两个卷积层,且第二卷积层的通道数是第一卷积层的通道数的2倍。

进一步的,第一组至第三组卷积模块均为两个卷积层,第四组卷积模块为三个卷积层。

进一步的,利用所述训练数据集对所述神经网络模型进行训练的步骤,包括:

对第四组至第八组卷积模块的第二卷积层输出的特征图,进行位置回归计算和分类概率计算,获得位置误差和置信度误差;

基于位置误差和置信度误差建立损失函数,通过损失函数对所述神经网络模型进行训练。

进一步的,该方法还包括:

利用交通目标检测模型对待检测图像进行检测。

进一步的,利用交通目标检测模型对待检测图像进行检测的步骤,包括:

将待检测图像转换为BGR格式;

将BGR格式的待检测图像输入交通目标检测模型,得到的目标类别、目标位置以及目标置信度;

通过限制目标置信度,滤除误检的目标类别;

通过交并比限定,对目标类别的检测结果进行过滤;

通过非极大值抑制,对目标位置的检测结果进行过滤。

第二方面,本发明还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

第三方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述方法。

本发明提供的交通目标检测方法中,训练数据集包括非机动二轮车、行人、小汽车、货车、公交车、三轮车、工程车中的多种类别,且每个样本标注了目标类别和位置信息。神经网络模型包括至少五组卷积模块,每组卷积模块包括至少两个卷积层,即采用多个小尺寸过滤器和间隔代替一个大尺寸过滤器和间隔,并且去掉了池化层减少了降维导致的信息丢失,训练获得的交通目标检测模型检测率高,对于一些难以用车牌检测识别的车辆,抓拍能达到很好的识别效果;对于行人和非机动车的识别监控,也有准确的识别效果,能够实现各种监控取证,缓解了现有技术存在的对车辆、行人和非机动车的检测效率较低的问题。

相应地,本发明提供的电子设备及计算机可读存储介质,也同样具有上述技术效果。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的交通目标检测方法的流程图;

图2为本发明实施例中神经网络模型的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明提供一种交通目标检测方法,应用于车辆、行人、非机动车等多种类别的检测。如图1所示,该方法包括以下步骤:

S1:生成训练数据集。

训练数据集包括每个样本的目标类别以及位置信息,目标类别包括Bicycle(非机动二轮车)、Pedestrain(行人)、Car(小汽车)、Truck(货车)、Bus(公交车)、Tricycle(三轮车)、Engineering_Truck(工程车),每类目标至少在1万个以上。具体实施中可根据实际需求选取样本类别,应包括上述各类别中的至少两种。

标注过程以目标的外接矩形为边界,标签为非机动二轮车、行人、小汽车、货车、公交车、三轮车、工程车,将描述文件(包括该图片中的每个目标的类别以及位置信息)写入对应的xml文件中。

训练图片集和测试图片集的生成:按照图片数目4:1的比例,随机生成训练图片集与测试图片集,共同构成训练数据集。训练图片集的作用是训练神经网络模型的权重,测试集的作用是测试已训练模型的准确度,防止训练过拟合。

S2:准备神经网络模型。

神经网络模型可以包括至少五组卷积模块,每组卷积模块包括至少两个卷积层。如图2所示,本发明实施例中,神经网络模型包括八组卷积模块,各个卷积层都是3*3的卷积。在卷积层用多个小尺寸的过滤器(filter)和间隔,代替一次性使用一个大尺寸过滤器和间隔,这样不改变输入数据的视野,综合设计出改进的卷积网络用于人车物训练。两个3*3的卷积可以与一个5*5的卷积感受野一致,三个3*3的卷积可以与一个7*7的卷积感受野一致。

本实施例中,在VGG网络的基础上,去掉了原有的池化层,减少了降维导致的信息丢失。

卷积层配置方面,第一组至第三组卷积模块Conv1_x、Conv2_x、Conv3_x,均为两个卷积层,Conv1_x的每个卷积层的通道数均为64,Conv2_x的每个卷积层的通道数均为128,Conv3_x的每个卷积层的通道数均为256。第四组卷积模块为Conv4_x三个卷积层,每个卷积层的通道数均为256。

第五组至第八组卷积模块Conv5_x、Conv6_x、Conv7_x、Conv8_x均为两个卷积层。Conv5_x、Conv6_x、Conv7_x、Conv8_x四组卷积模块加深卷积网络,通道数(channel)的不同配置。通过图2可以看出,Conv5_x、Conv6_x、Conv7_x、Conv8_x四组卷积模块中,第二卷积层的通道数是第一卷积层的通道数的2倍,Conv5_1、Conv6_1、Conv7_1、Conv8_1的通道数都为256,Conv5_2、Conv6_2、Conv7_2、Conv8_2的通道数都为512,这样可以获取到更加深入细致的目标特征。

S3:利用训练数据集对神经网络模型进行训练,获得交通目标检测模型。

(1)由于深度学习需要数量庞大的样本数目,在训练过程中,可以对训练数据集中的样本,通过改变亮度、改变饱和度、旋转、镜像或图像裁剪等方式,对样本进行数据增强处理。

(2)为了使得模型具有多尺度特征,对第四组至第八组卷积模块的第二卷积层Conv4_2、Conv5_2、Conv6_2、Conv7_2、Conv8_2输出的特征图(feature map),进行位置回归计算和分类概率计算,获得位置误差mbox_loc和置信度误差mbox_conf。这样,即使是行人、非机动车等较小目标,在较大的特征图上也有比较显著的位置特征,因此能够兼容同时较好的检测大目标和小目标。

基于位置误差和置信度误差建立损失函数,通过损失函数对神经网络模型进行训练。

损失函数Loss为位置误差mbox_loc与置信度误差mbox_conf的加权:

Loss(x,c,l,g)=1/N(mbox_conf(x,c)+α*mbox_loc(x,l,g))

其中,权重比例α取值范围为0~1,N为目标真实框(Ground Truth)正样本数量,c为类别置信度预测值,l为预测框的位置预测值,g为目标真实框的位置参数。

位置误差mbox_loc采用Smooth

其中,k表示目标真实框所属类别,

置信度误差mbox_conf通过softmaxloss方法得到:

其中,p表示预测的类别,

S4:利用交通目标检测模型对待检测图像进行检测。

(1)图像颜色变换:由于监控相机获取到的图像为YUV格式,而网络输入为BGR格式,因此通过以下算法将图像进行颜色转换,将待检测图像转换为BGR格式。

B=Y+1.779*(U-128)

G=Y-0.3455*(U-128)-0.7169*(V-128)

R=Y+1.4075*(v-128)

(2)将BGR格式的待检测图像输入训练好的交通目标检测模型,交通目标检测模型输出检测结果output,得到的目标类别、目标位置(x,y,w,h)以及目标置信度。

(3)结果过滤:

通过限制目标置信度,滤除误检的目标类别。

通过交并比(Intersection-over-Union,简称IOU)限定,对目标类别的检测结果进行过滤,得到最准确的目标类型信息。

通过非极大值抑制(Non-Maximum Suppression,简称NMS),对目标位置的检测结果进行过滤,得到最准确的目标位置信息(x,y,w,h)。

本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

对应于上述方法,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述方法的步骤。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种动目标检测方法、装置、电子设备及存储介质
  • 一种交通监控方法及装置、电子设备和存储介质
  • 目标检测方法和装置、电子设备、存储介质、程序产品
  • 提高动目标检测精度的方法、装置、电子设备及存储介质
  • 一种交通目标检测方法、装置、电子设备及检测系统
  • 交通雷达及其目标检测方法、装置、电子设备及存储介质
技术分类

06120115617226