掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及计算机技术领域,尤其涉及一种目标的检测方法、装置、电子设备及存储介质。

背景技术

目前,图像中的目标检测通常是使用整幅图像作为输入,采用固定尺寸大小的矩形检测窗口依次扫描整幅图像的每一个区域,并且使用深度学习的方式提取检测窗口内的特征,确定是否有待检测的目标特征存在。如果检测到当前区域中有待检测目标的全部特征存在,则认为是检测到了待检测目标,检测过程结束。如果检测到当前区域中有待检测目标的局部特征存在,则认为当前检测区域附近有待检测目标,则需要在当前区域附近扩大范围继续检测,对相邻的检测窗口区域存在待检测目标特征的区域进行拼接,从而得到完整的待检测目标,检测过程结束。存在以下缺点:存在因检测窗口大小设置固化,从而不可避免的在检测过程中需要对相邻的存在待检测目标特征的区域进行特征拼接,拼接需要耗费大量的计算,因此,导致目标识别计算量大、效率低。

发明内容

本发明提供一种目标的检测方法、装置、电子设备及存储介质,可以有效降低图像中目标检测的计算量,具有目标检测效率高的优点。

本发明提供一种目标的检测方法,包括:

根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口;

基于所述检测窗口,进行目标检测。

进一步地,所述根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口,包括:

利用所述初始检测窗口对待检测的图像进行目标检测,确定所述初始检测窗口识别出所述目标所进行的检测次数和拼接次数;

基于深度学习模型,以检测次数和拼接次数达到最小值为目标,对所述初始检测窗口进行迭代,得到检测次数和拼接次数达到最小值时的检测窗口尺寸参数;

按照所述尺寸参数设置调整所述初始检测窗口,得到针对所述目标的检测窗口。

进一步地,在利用所述初始检测窗口对待检测的图像进行目标检测之前,还包括:

以所述图像的几何中心点为几何坐标系的原点,将所述图像映射到所述几何坐标系中;

所述利用所述初始检测窗口对待检测的图像进行目标检测,包括:

以所述几何坐标系的原点为检测窗口的一个顶点,以初始检测窗口尺寸参数和预设的检测窗口移动步长对图像进行目标检测,并对每个检测窗口检测到的图像区域输入至所述深度学习模型中进行目标识别。

进一步地,所述检测窗口尺寸参数包括检测窗口的对角线长度和检测方向。

进一步地,基于以下评价函数确定所述检测窗口尺寸参数,其中,所述评价函数为:

F

其中,所述F

进一步地,所述基于深度学习模型,以检测次数和拼接次数达到最小值为目标,对所述初始检测窗口进行迭代,得到检测次数和拼接次数达到最小值时的检测窗口尺寸参数,包括:

如果所述目标为一个,则根据所述目标的大小和所述目标在所述图像中的位置,调整所述初始检测窗口的对角线长度和所述检测方向,得到所述检测窗口尺寸参数。

进一步地,所述基于深度学习模型,以检测次数和拼接次数达到最小值为目标,对所述初始检测窗口进行迭代,得到检测次数和拼接次数达到最小值时的检测窗口尺寸参数,包括:

如果所述目标为多个,则分别获取所述多个目标的对角线长度以及在所述图像中的位置;

以所述多个目标的对角线长度的出现次数和所述多个目标在所述图像中的位置分布,调整所述初始检测窗口的对角线长度和所述检测方向,得到所述检测窗口尺寸参数。

本发明还提供一种目标的检测装置,包括:

调整模块,用于根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口;

识别模块,用于基于所述检测窗口,进行目标检测。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述目标的检测方法的步骤。

本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述目标的检测方法的步骤。

本发明提供的目标的检测方法、装置、电子设备及存储介质,在图像中的目标的检测过程中,使用自适应的检测窗口,从而可以快速的,完整的检测到目标,达到用检测次数相对更少、检测的目标尽可能完整,避免拼接或者减少拼接次数,进而,具有目标检测的计算量低的优点。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的目标的检测方法的流程示意图;

图2是本发明提供的目标的检测方法中图像坐标化的示意图;

图3是本发明提供的目标的检测方法的图像识别的深度学习模型的卷积神经网络模型示意图;

图4是本发明提供的目标的检测装置的结构示意图;

图5是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

以下结合附图描述本发明实施例的目标的检测方法、装置、电子设备及存储介质。

图1是根据本发明一个实施例的目标的检测方法的流程图。如图1所示,根据本发明实施例的目标的检测方法,包括如下步骤:

S101:根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口。

S102:基于所述检测窗口,进行目标检测。

具体来说,对于S101而言,利用所述初始检测窗口对待检测的图像进行目标检测,确定所述初始检测窗口识别出所述目标所进行的检测次数和拼接次数;基于深度学习模型,以检测次数和拼接次数达到最小值为目标,对所述初始检测窗口进行迭代,得到检测次数和拼接次数达到最小值时的检测窗口尺寸参数;按照所述尺寸参数设置调整所述初始检测窗口,得到针对所述目标的检测窗口。

在具体示例中,首先以初始检测窗口参数对图像进行目标检测,并对每个检测窗口检测到的图像区域进行目标识别。

在本发明的一个实施例中,在利用所述初始检测窗口对待检测的图像进行目标检测之前,还包括:以所述图像的几何中心点为几何坐标系的原点,将所述图像映射到所述几何坐标系中。此外,为了保证图像中目标检测更加准确,在将图像映射到几何坐标系之前,该方法还可以包括对图像进行预处理,图像预处理可以消除图像中的无关信息。通常是使用高通、低通或带通滤波器过滤图像中的噪声信息,进而,可以最大化的提取得到有利于目标检测的图像信息。

在图像进行几何坐标系的坐标化时,可以建立一个以(0,0)为原点的几何坐标系,将图像的几何中心点定位在几何坐标系的坐标原点,同时,图像中的每个像素点在几何坐标系中建立对应的几何坐标(x,y),该示例中,建立的几何坐标系为二维坐标系。

在具体示例中,利用所述初始检测窗口对待检测的图像进行目标检测,包括:以所述几何坐标系的原点为检测窗口的一个顶点,以初始检测窗口尺寸参数和预设的检测窗口移动步长对图像进行目标检测,并对每个检测窗口检测到的图像区域输入至所述深度学习模型中进行目标识别。即:将每个检测窗口的图像输入到深度学习模型中,深度学习模型选取VGG16卷积神经网络模型。模型如图3所示,VGG16卷积神经网络输入一个M*N维的特征图,依次经过卷积层,池化层,全连接层,softmax分类器,最终得到目标识别结果。卷积层共有13个卷积层,使用3*3的卷积核,步长为1。池化层共有4个,池化层夹在卷积层中间,用于简化卷积层输出的图像特征参数。全连接层在卷积层和池化层后,此时图像中信息已经被抽象成了信息含量更高的特征,用于分类识别。Softmax分类器用于分类识别目标,得到最终的目标识别结果。

具体来说,设定初始检测窗口,检测方向,对整幅图像进行目标检测。通常来说,在拍摄一幅图像的时候,通常会选取中心位置来拍摄目标,因此一幅图像中的若存在待检测的目标,该示例中,称之为第一目标,那么第一目标在整幅图像中出现的位置将有很大概率会出现在中心位置,也就是整幅图像建立的坐标系的原点位置。

在(x,y)的坐标系中,O为坐标原点,矩形G

在图像中的目标识别完成后,根据目标的大小和目标在所述图像中的位置,调整检测窗口参数,并根据调整后的检测窗口参数在下一图像中进行迭代检测,直至基于检测窗口参数预先得到的评价函数达到最小值。也就是说,使用多张图像,迭代一定的次数后,自适应调整检测窗口,从而可达到最优的目标检测效果。

本发明的示例中,可以基于以下评价函数确定所述检测窗口尺寸参数,其中,评价函数为:

F

其中,所述F

基于深度学习模型,以检测次数和拼接次数达到最小值为目标,对所述初始检测窗口进行迭代,得到检测次数和拼接次数达到最小值时的检测窗口尺寸参数,包括:如果所述目标为一个,则根据所述目标的大小和所述目标在所述图像中的位置,调整所述初始检测窗口的对角线长度和所述检测方向,得到所述检测窗口尺寸参数。

此外,如果所述目标为多个,则分别获取所述多个目标的对角线长度以及在所述图像中的位置;以所述多个目标的对角线长度的出现次数和所述多个目标在所述图像中的位置分布,调整所述初始检测窗口的对角线长度和所述检测方向,得到所述检测窗口尺寸参数。

具体来说,调整所述检测窗口的对角线长度和所述检测方向的最终目的是使评价函数具有最小值,从上述的评价函数可以看到,合理设置检测窗口的大小,评价函数F

理想情况下,检测到目标所需的最小拼接次数为0,所需的最小扫描次数为1,因而评价函数的最小值为1。

检测窗口的对角线长度l主要影响检测过程中的拼接次数,而检测初始方向θ主要影响检测过程中的扫描次数。

当图像中含有多个待检测目标时,检测窗口的对角线长度l的合理取值应该为多个待检测目标中,对角线长度最为集中的。例如:图像中含有5个待检测目标,其对角线长度分别为1,10,10,10,30,则对角线长度的合理取值应为10,这样使得评价函数的取值变小。

当图像中含有多个待检测目标时,检测初始方向θ的合理取值应为多个待检测目标分布最为密集的方向,这样可以在最少的扫描次数下,完成尽可能多的待检测目标的检测,使得评价函数的取值变小。

因此,在每次迭代检测目标的过程中,不断自适应调整检测窗口参数l,θ的取值,使得评价函数F

根据本发明实施例的目标的检测方法,在图像中的目标的检测过程中,使用自适应的检测窗口,从而可以快速的,完整的检测到目标,达到用检测次数相对更少、检测的目标尽可能完整,避免拼接或者减少拼接次数,进而,具有目标检测的计算量低的优点。

下面对本发明提供的目标的检测装置进行描述,下文描述的目标的检测装置与上文描述的目标的检测方法可相互对应参照。

如图4所示,根据本发明一个实施例的目标的检测装置,包括:调整模块410和识别模块420,其中:

调整模块410,用于根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口;

识别模块420,用于基于所述检测窗口,进行目标检测。

根据本发明实施例的目标的检测装置,在图像中的目标的检测过程中,使用自适应的检测窗口,从而可以快速的,完整的检测到目标,达到用检测次数相对更少、检测的目标尽可能完整,避免拼接或者减少拼接次数,进而,具有目标检测的计算量低的优点。

图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(CommunicationsInterface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行目标的检测方法,该方法包括:根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口;基于所述检测窗口,进行目标检测。

此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的目标的检测方法,该方法包括:根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口;基于所述检测窗口,进行目标检测。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的目标的检测方法,该方法包括:根据待检测的目标的尺寸,对初始检测窗口进行调整,得到针对所述目标的检测窗口;基于所述检测窗口,进行目标检测。

以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例的方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 目标检测方法、存储介质、电子设备及目标检测装置
  • 图像目标检测方法、装置、电子设备及存储介质
技术分类

06120112922557