掌桥专利:专业的专利平台
掌桥专利
首页

目标检测方法、装置、计算机设备及存储介质

文献发布时间:2023-06-19 11:19:16


目标检测方法、装置、计算机设备及存储介质

技术领域

本公开涉及图像识别技术领域,具体而言,涉及一种目标检测方法、装置、计算机设备及存储介质。

背景技术

目前,目标检测在例如自动驾驶、图像匹配等领域应用广泛。以自动驾驶为例,利用图像识别技术,可以识别出自动驾驶车辆周围障碍物的具体位置,并基于障碍物的具体位置对自动驾驶车辆的行进路线做出规划,以使自动驾驶车辆安全行驶。

当前的目标检测方法存在检测结果不准确的问题。

发明内容

本公开实施例至少提供一种目标检测方法、装置、计算机设备及存储介质。

第一方面,本公开实施例提供了一种目标检测方法,包括:获取对目标场景进行图像采集得到的待检测图像;基于所述待检测图像,确定所述待检测图像中的目标对象的二维检测框;根据待检测图像以及所述二维检测框确定所述目标对象的朝向和类型;基于所述目标对象的朝向和类型以及所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息。

这样,对待检测图像进行处理可以得到较为准确的二维检测框、朝向、以及目标对象的类型对应的尺寸信息,并将此尺寸信息作为先验信息,利用此先验信息可以以更高的精度确定目标对象在目标场景中的三维位置信息。

一种可选的实施方式中,确定所述目标对象的朝向和类型,包括:基于所述二维检测框,从所述待检测图像中截取所述目标对象的子图像;基于所述子图像,确定所述目标对象的朝向和类型。

这样,在确定目标对象的朝向和类型时,由于目标对象的二维检测框较为准确,因此利用二维检测框从待检测图像中截取得到的目标对象的子图像,可以较大程度的减少目标对象以外的背景对检测结果的干扰,使得后续对子图像进行处理时,可以专注于目标对象,提升朝向的检测精度和类型检测的准确度。

一种可选的实施方式中,所述基于所述目标对象的朝向和类型以及所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息,包括:基于所述目标对象的朝向,确定将所述目标对象由所述目标场景的第一位置,映射至待检测图像中的第二位置时的旋转矩阵;基于所述目标对象的类型确定所述目标对象的尺寸信息;基于所述旋转矩阵、所述目标对象的尺寸信息、所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息。

这样,能够利用相机成像原理,利用朝向、以及类型所对应的尺寸信息,以更高的精度确定目标对象在目标场景中的三维位置信息。

一种可选的实施方式中,所述基于所述旋转矩阵、所述目标对象的尺寸信息、所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息,包括:确定采集所述待检测图像的图像采集设备的投影矩阵以及内参矩阵;基于所述旋转矩阵、所述目标对象的尺寸信息、所述二维检测框、所述投影矩阵、以及所述内参矩阵,确定所述目标对象在所述目标场景中的多个候选三维位置信息;利用所述旋转矩阵、所述内参矩阵、以及所述二维检测框,从所述多个候选三维位置信息中,确定所述目标对象在所述目标场景中的三维位置信息。

一种可选的实施方式中,所述利用所述旋转矩阵、所述内参矩阵、以及所述二维检测框,从所述多个候选三维位置信息中,确定所述目标对象在所述目标场景中的三维位置信息,包括:针对所述多个候选三维位置信息中的每个候选三维位置信息,基于所述旋转矩阵、所述内参矩阵、以及该候选三维位置信息,确定该三维位置信息在所述图像采集设备坐标系中的投影位置信息;基于每个候选三维位置信息的投影位置信息、以及所述二维检测框,确定所述每个候选三维位置信息与所述二维检测框的重合度信息;基于每个候选三维位置信息的重合度信息,从所述多个候选三维位置信息中,确定所述目标对象在所述目标场景中的三维位置信息。

这样,通过确定多个候选三维位置信息,可以提高从候选三维位置信息中得到较为准确的三维位置信息的概率;同时,利用重合度信息从多个候选三维位置信息中,确定目标对象在目标场景中的三维位置信息,可以较为容易的从多个候选的三维位置信息中筛选出与目标对象在目标场景中的实际三维位置信息最接近的三维位置信息,使得得到的三维位置信息有较高的准确性。

一种可选的实施方式中,所述目标场景为智能行驶装置行驶过程中所处的场景,在确定所述目标对象在所述目标场景中的三维位置信息之后,所述方法还包括:基于所述目标对象在所述目标场景中的三维位置信息,确定在三维空间中所述目标对象相对于所述智能行驶装置的相对位置;基于所述相对位置控制所述智能行驶装置。

这样,由于在对目标场景中的目标对象进行检测时,得到的目标对象在目标场景中的三维位置信息的准确性较高,因此得到的目标对象相对于智能行驶装置的相对位置的准确性更高,从而使得控制智能行驶装置行驶时的避障能力更强,且安全性更高。

一种可选的实施方式中,所述目标场景为智能行驶装置行驶过程中所处的场景,在确定所述目标对象在所述目标场景中的三维位置信息之后,所述方法还包括:基于所述目标对象在所述目标场景中的三维位置信息,确定在三维空间中所述目标对象相对于所述智能行驶装置的相对位置;基于所述相对位置发出提示信息。

这样,由于目标对象相对于智能行驶装置的相对位置的准确性更高,因此可以依据相对位置发出提示信息,在帮助驾驶员在操控行驶装置完成更安全、更高效的行驶的同时,也可以在目标对象为其他智能行驶装置的情况下,发出例如安全距离警示等不同的提示信息,保障目标对象的安全。

第二方面,本公开实施例还提供一种目标检测装置,包括:

获取模块,用于获取对目标场景进行图像采集得到的待检测图像;

第一确定模块,用于基于所述待检测图像,确定所述待检测图像中的目标对象的二维检测框;

第二确定模块,用于根据待检测图像以及所述二维检测框确定所述目标对象的朝向和类型;

第三确定模块,用于基于所述目标对象的朝向和类型以及所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息。

第三方面,本公开可选实现方式还提供一种计算机设备,处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可能的实施方式中的步骤。

第四方面,本公开可选实现方式还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被运行时执行上述第一方面中任一种可能的实施方式中的步骤。

关于上述目标检测装置、计算机设备、及计算机可读存储介质的效果描述参见上述目标检测方法的说明,这里不再赘述。

为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种目标检测方法的流程图;

图2示出了本公开实施例所提供一种待检测图像中二维检测框的示意图;

图3示出了本公开实施例所提供的从待检测图像截取出的两张子图像A和B的示意图;

图4示出了本公开实施例所提供的一种确定目标对象在目标场景中的三维位置信息的具体方法的流程图;

图5示出了本公开实施例所提供了一种从多个候选三维位置信息中确定目标对象在目标场景中的三维位置信息的具体方法的流程图;

图6示出了本公开实施例所提供的一种目标检测装置的示意图;

图7示出了本公开实施例所提供的一种计算机设备结构的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

经研究发现,在利用目标检测方法处理图像以规划行驶路线时,通常利用包含标注信息的样本点云数据对神经网络进行训练,并利用训练好的神经网络对目标场景进行图像采集得到的点云数据进行目标检测,以确定障碍物的具体位置。由于点云数据的构成较为复杂,在对点云数据进行标注生成样本点云数据时较为困难,因此得到的样本数量不足以训练得到准确的神经网络,导致神经网络在训练时在少量的样本数据上容易出现过拟合,使得神经网络在实际使用时精度较低,对目标对象检测的结果不准确,进而可能导致自动行驶的安全性降低。

基于上述研究,本公开提供了目标检测方法、装置、计算机设备及存储介质,通过确定目标对象的类型和朝向,并将类型对应的尺寸信息和朝向作为目标对象的先验信息,结合从待检测图像中确定的目标对象的二维检测框,以更高的准确性确定目标对象在目标场景中的三维位置信息。

针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本实施例进行理解,首先对本公开实施例所公开的一种目标检测方法进行详细介绍,本公开实施例所提供的目标检测方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该目标检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

参见图1所示,为本公开实施例提供的目标检测方法的流程图,所述方法包括步骤S101~S104,其中:

S101:获取对目标场景进行图像采集得到的待检测图像;

S102:基于待检测图像,确定待检测图像中的目标对象的二维检测框;

S103:根据待检测图像以及二维检测框确定目标对象的朝向和类型;

S104:基于目标对象的朝向和类型以及二维检测框,确定目标对象在目标场景中的三维位置信息。

本公开实施例基于对目标场景进行图像采集得到的待检测图像,确定目标对象在待检测图像中的二维检测框、朝向、以及目标对象的类型,并基于朝向、类型对应的尺寸信息、以及二维检测框,确定目标对象在所述目标场景中的三维位置信息;在该过程中,由于能够以较高的精度确定待检测图像的二维检测框和类型,且可以针对类型的对象进行实际测量,获取类型对应的精确尺寸信息,从而能够利用相机成像原理,利用朝向、尺寸信息以及二维检测框,以更高的精度确定目标对象在目标场景中的三维位置信息。

另外,本公开实施例是直接以二维的待检测图像作为目标检测过程的处理对象,待检测图像的数据量较之三维点云数据的数据量更少,处理更简单,因此对硬件资源的依赖度更低,更适用于部署在嵌入式设备中。

下面对上述S101~S104加以详细说明。

针对上述S101,目标检测方法例如可以应用于自动驾驶领域或者智能仓储等领域;在目标检测方法应用于不同领域时,对应的目标场景也有所区别。

示例性的,当目标检测方法应用于自动驾驶领域中时,对应的目标场景例如可以包括车辆行驶的道路等;目标场景中例如可以包括多个并行或者交叉的行驶车道,并且,在行驶车道上,例如可以有多个车辆相向行驶、对向行驶或者交叉行驶;此时,可以将在车道上行驶的其他车辆作为目标对象。当目标检测方法应用于智能仓储领域中时,对应的目标场景例如可以为包括用于进行仓储的仓库;此时,目标场景中例如可以运行有智能机器人;智能机器人可以基于本公开实施例提供的目标检测方法进行目标检测,并基于目标检测结果实现在仓库中避障、运输物品等;此时,可以将在仓库内运行的其他机器人、货架、其他会对机器人运行造成障碍的物品作为目标对象。

本公开实施例以将目标检测方法应用于自动驾驶领域为例,在获取目标场景的待检测图像时,例如可以在自动驾驶车辆上安装图像获取设备;该图像获取设备能够实时对目标场景进行图像采集,得到目标场景的待检测图像。

另外,在本公开示例中,还可以在自动驾驶车辆上安装雷达、深度相机、距离传感器等其他设备,自动驾驶车辆也可以基于其他设备获取的数据进行目标检测,并利用基于本公开实施例提供的目标检测方法确定的目标检测结果、和利用其他设备获取的检测数据确定的目标检测结果结合,得到更为准确的目标检测结果。

针对上述S102,在获取待检测图像后,即可以利用待检测图像,确定待检测图像中包括的目标对象在待检测图像中的二维检测框、朝向、以及目标对象的类型。

示例性的,在基于待检测图像确定目标对象在待检测图像中的二维检测框时,例如可以采用下述方法:

利用预先训练的目标检测网络对待检测图像进行目标检测处理,得到待检测图像中至少一个目标对象对应的二维检测框;此时,预先训练的目标检测网络例如可以包括下述至少一种:卷积神经网络(Convolutional Neural Networks,CNN)、区域卷积神经网络(Regions Region-based Convolutional Network,R-CNN)、快速区域卷积神经网络(FastRegion-based Convolutional Network,Fast R-CNN)、更快速区域卷积神经网络(FasterRegion-based Convolutional Network,Faster R-CNN)。

在训练目标检测网络时,例如可以预先确定多张样本图像、以及每张样本图像的标注信息;其中标注信息用于表征目标对象在样本图像中的位置;然后利用多张样本图像以及对应的标注信息,对神经网络进行训练,得到训练好的目标检测神经网络。

在得到训练好的目标检测网络后,即可以利用训练好的目标检测神经网络对待检测图像进行目标检测处理,以识别出待检测图像中的至少一个目标对象,并确定目标对象对应的二维检测框。其中,二维检测框例如可以为在待检测图像中将目标对象包围在内的最小包围框。

示例性的,在待检测图像中的目标对象例如包括一个小轿车和一个货运车,利用目标检测网络,可以分别确定小轿车和货运车在图像中的具体位置,并利用二维检测框在待检测图像中分别对小轿车和货运车进行标注。参见图2所示,示出了一种待检测图像中二维检测框的示意图,其中,21表示小轿车,22表示小轿车对应的二维检测框,23表示货运车,24表示货运车对应的二维检测框。

在具体实施中,在确定了二维检测框的情况下,还可以根据确定的二维检测框确定目标对象在待检测图像中的二维位置信息,并利用二维位置信息表征二维检测框。

示例性的,在确定二维检测框对应的二维位置信息时,可以确定二维检测框中的至少一个检测点,然后确定该检测点在待检测图像中的二维位置信息,以表征二维检测框。

此处,可以将二维检测框中的顶点和/或二维检测框边线上的部分点作为检测点,并获取检测点在待检测图像中的坐标,将检测点在待检测图像中的坐标,确定为目标对象在待检测图像中的二维位置信息,其中,检测点在待检测图像中的坐标可以表示为(x

在本公开另一实施例中,也可以利用语义分割网络对待检测图像进行语义分割处理,得到待检测图像中的各个像素点所属的具体分类;然后利用各个像素点所属的具体分类、以及各个像素点在待检测图像中的位置,确定目标对象在待检测图像中的二维位置信息。

示例性的,可以基于像素点所属的具体分类,对待检测图像中的像素点进行聚类处理,确定属于不同目标对象的目标像素点;然后基于目标对象的目标像素点,为目标像素点所在的区域确定最小包围框,以得到目标对象的二维位置信息。

针对上述S103,在确定了待检测图像的二维检测框的情况下,即可以根据确定的二维检测框从待检测中截取目标对象对应的子图像,并根据子图像,确定目标对象的朝向和类型。

在本公开实施例中,提供了一种确定目标对象在待检测图像中朝向的具体方法:基于二维位置信息,从待检测图像中截取目标对象的子图像;基于子图像,确定目标对象的朝向。

示例性的,针对目标对象中的一个小轿车,可以获取小轿车对应的二维检测框的四个顶点O

示例性的,图3示出了对应于图2的待检测图像截取出的两张子图像A和B的示意图;其中,子图像A为小轿车对应的子图像,子图像B为货运车对应的子图像。

在确定目标对象对应的子图像的情况下,可以利用预先训练的朝向检测网络,对目标对象对应的子图像进行朝向检测处理,得到目标对象的朝向。

其中,预先训练的朝向检测网络例如可以包括下述至少一种:双线性卷积神经网络(Bilinear Convolutional Neural Networks,B-CNNs)、基于区域的全卷积网络(Region-based Fully Convolutional Networks,R-FCN)、以及单发多盒探测器(SingleShot multibox Detector,SSD)。

利用确定的朝向检测网络对目标对象对应的子图像进行朝向检测处理,可以确定目标对象的朝向,该朝向例如可以表示为θ。

在一种可能的实施方式中,在确定目标对象的朝向时,例如可以以自动驾驶车辆的行进方向为标准方向,将目标对象相对于标准方向的偏角,作为目标对象的朝向。此时,例如还可以将与自动驾驶车辆相向行驶的目标对象的朝向的值设置为正值,与自动驾驶车辆反向行驶的目标对象的朝向的值设置为负值。

示例性的,在目标对象和自动驾驶车辆的行驶方向相同的情况下,由于目标对象和自动驾驶车辆在行驶时有沿着行进方向左右小幅度偏移的情况,基于该偏移的角度,确定的目标对象的朝向θ例如可以为θ=10°、θ=15°、θ=20°等。朝向的具体值,基于目标对象的实际偏移情况而确定。

利用这种方式确定的朝向表示为较为精确的具体朝向角度,可以更清楚的表征目标对象的行驶方向。

在本公开另一实施例中,还提供一种确定目标对象的类型的具体方法,包括:利用预先训练的类型检测网络对所述目标对象对应的子图像进行类型检测处理,得到所述目标对象的类型。

此处,确定目标对象对应的子图像的方式,与上述确定目标对象的朝向中,确定目标对象对应的子图像的方式类似,在此不再赘述。

预先训练的类型检测网络例如可以包括下述至少一种:反向传播神经网络(BackPropagation Networks,BP)以及卷积神经网络(Convolutional Neural Networks,CNN)。

利用确定的类型检测网络对目标对象对应的子图像进行类型检测处理,可以确定目标对象的类型。

其中,目标对象的类型可以有多种,例如可以为不同类型的车辆,例如包括轿车、越野车、货运车、公交车等车辆。不同类型的车辆的尺寸会有所区别。

此处,在对目标对象进行具体分类时,可以基于多个维度进行划分,例如基于车辆的种类、同种类车辆的大小等,从而将目标对象以较细的粒度划分至多个分类中,每个分类对应的目标对象的尺寸在一定的尺寸范围内,从而使得为目标对象划分的类型的准确度更高;并且,由于划分的类型较为细致,因此可以根据不同的类型进一步确定出不同的目标对象之间较小的尺寸差异。

此时,即可以得到目标对象的朝向θ、类型、以及目标对象的二维检测框。

针对上述S104,在确定了目标对象的朝向和类型以及二维检测框后,即可以确定目标对象在目标场景中的三维位置信息。

具体地,参见图4所示,本公开实施例提供了一种基于朝向、类型、以及二维检测框,确定目标对象在目标场景中的三维位置信息的具体方法,包括:

S401:基于目标对象的朝向,确定将目标对象由目标场景的第一位置,映射至待检测图像中的第二位置时的旋转矩阵;

S402:基于目标对象的类型确定目标对象的尺寸信息;

S403:基于旋转矩阵、目标对象的尺寸信息、二维检测框,确定目标对象在目标场景中的三维位置信息。

其中,由于目标对象的第一位置为在实际行驶场景中相对于三维的相机坐标系占据的位置,第二位置为在待检测图像中相对于二维的图像坐标系占据的位置,因此利用目标对象的朝向θ、以及预设的相机坐标系与图像坐标系之间的映射关系,即可以确定将目标对象由第一位置映射至第二位置时的旋转矩阵R。

在基于目标对象的类型确定目标对象的尺寸信息时,尺寸信息例如可以表示为X以及Y。

示例性的,可以预先确定小轿车的尺寸信息(单位为米)为长度3.8以及宽度1.6;大轿车的尺寸信息为长度4.3以及宽度1.8;货运车的尺寸信息为长度17.5以及宽度2.4。在确定目标对象包含一个小轿车时,即可以目标对象对应的尺寸信息为X=3.8以及Y=1.6。

在确定了旋转矩阵R、以及目标对象的尺寸信息X以及Y的情况下,可以采用下述方法确定目标对象在目标场景中的三维位置信息:确定采集待检测图像的图像采集设备的投影矩阵以及内参矩阵;基于旋转矩阵、目标对象的尺寸信息、二维检测框、投影矩阵、以及内参矩阵,确定目标对象在目标场景中的多个候选三维位置信息;利用旋转矩阵、内参矩阵、以及二维检测框,从多个候选三维位置信息中,确定目标对象在目标场景中的三维位置信息。

具体地,可以利用尺寸信息X以及Y、以及目标对象在待检测图像中的二维检测框,确定将目标对象投影至图像坐标系中的相机投影矩阵T。

然后,可以利用最小二乘法,基于目标对象的旋转矩阵R、检测点在待检测图像中的坐标(x

在利用最小二乘法可以求解目标对象的三维位置信息时,能够得到多个候选三维位置信息,多个候选三维位置信息构成候选三维位置信息集合S。然后,从候选三维位置信息集合S中,确定目标对象的三维位置信息。

其中,在确定多个候选三维位置信息中的第i个(i∈(1,n))候选三维位置信息(x

其中,γ表示归一化因子,用于统一量纲。

在确定候选三维位置信息集合S的情况下,可以利用旋转矩阵R、相机内参矩阵K、以及表征二维检测框的二维位置信息(x

参见图5所示,本公开实施例提供了一种从多个候选三维位置信息中确定目标对象在目标场景中的三维位置信息的具体方法,包括:

S501:针对多个候选三维位置信息中的每个候选三维位置信息,基于旋转矩阵、内参矩阵、以及该候选三维位置信息,确定该三维位置信息在图像采集设备坐标系中的投影位置信息;

S502:基于每个候选三维位置信息的投影位置信息、以及二维检测框,确定每个候选三维位置信息与二维检测框的重合度信息;

S503:基于每个候选三维位置信息的重合度信息,从多个候选三维位置信息中,确定目标对象在目标场景中的三维位置信息。

在具体实施中,以候选三维位置信息集合S中第i个候选三维位置信息(x

Rec'

在确定每个三维位置信息在相机坐标系中的投影位置信息的情况下,利用候选三维位置信息对应的投影位置信息、以及二维检测框,可以确定候选三维位置信息的准确性。其中,重合度信息中的重合度数值越高,表征候选三维位置信息较为准确;重合度信息中的重合度数值越低,表征候选三维位置信息越不准确。

在基于投影位置信息、以及二维检测框确定第i个候选三维位置信息与二维检测框对应的重合度信息IoU

确定候选三维位置信息集合S中其他候选三维位置信息对应的重合度信息的方法与上述确定第i个候选三维位置信息对应的重合度信息的方法相似,在此不再赘述。

在得到候选三维位置信息集合S中各个候选三维位置信息分别对应的重合度信息时,例如可以对多个重合度信息进行筛选,确定多个重合度信息中重合度数值最高的重合度信息对应的重合度信息,作为目标对象在目标场景中的三维位置信息。

当目标场景为智能行驶装置在行驶过程中所处的场景时,在确定了目标对象在目标场景中的三维位置信息后,还可以在不同的目标场景中利用三维位置信息,实现对智能行驶装置的控制、以及发出提示信息等不同的功能。

在具体实施中,当利用目标对象的三维位置信息对智能行驶装置进行控制时,例如可以基于目标对象在目标场景中的三维位置信息,确定在三维空间中目标对象相对于智能行驶装置的相对位置;基于相对位置控制智能行驶装置。

其中,智能行驶装置例如但不限于下述任一种:自动驾驶车辆、装有高级驾驶辅助系统(Advanced Driving Assistance System,ADAS)的车辆、或者机器人等。控制智能行驶装置,例如包括控制智能行驶装置加速、减速、转向、制动等。

此时,由于得到的目标对象相对于智能行驶装置的三维位置信息的准确性更高,从而在确定目标空间中障碍物的具体位置时有更准确的检测结果,使得在控制智能行驶装置行驶时避障的能力更强,安全性更高。

此外,当利用目标对象的三维位置信息发出提示信息时,例如可以基于目标对象在目标场景中的三维位置信息,确定在三维空间中目标对象相对于智能行驶装置的相对位置;基于相对位置发出提示信息。

提示信息例如可以包括播放语音提示信息或者警告声,以提示驾驶员控制智能行驶装置加速、减速、转向、制动等。

示例性的,在提示信息包括对控制智能行驶装置的驾驶员的提示信息时,例如可以设置提示信息为“前方有障碍物”的语音提示信息,或者设置包含具体距离信息的提示信息,例如包括“前方500米有障碍物”的提示信息,或者设置不同频率的“嘟嘟”告警声,以提示障碍物距离的远近。利用这样的提示信息可以向驾驶员提供当前驾驶环境中的例如障碍物或者其他行驶车辆的位置信息,辅助驾驶员做出进一步的行驶规划;同时,在目标对象为其他智能行驶装置的情况下,例如还可以外放“距离过近,请保持车距”的安全距离警示信息,以使与智能行驶装置临近的其他智能行驶装置注意避让,保证当前驾驶环境中的智能行驶装置安全行驶。

本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一发明构思,本公开实施例中还提供了与目标检测方法对应的目标检测装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述目标检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

参照图6所示,为本公开实施例提供的一种目标检测装置的示意图,所述装置包括:获取模块61、第一确定模块62、第二确定模块63、以及第三确定模块64;其中,

获取模块61,用于获取对目标场景进行图像采集得到的待检测图像;

第一确定模块62,用于基于所述待检测图像,确定所述待检测图像中的目标对象的二维检测框;

第二确定模块63,用于根据待检测图像以及所述二维检测框确定所述目标对象的朝向和类型;

第三确定模块64,用于基于所述目标对象的朝向和类型以及所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息。

一种可选的实施方式中,所述第二确定模块63,在确定所述目标对象的朝向和类型时,用于:基于所述二维检测框,从所述待检测图像中截取所述目标对象的子图像;基于所述子图像,确定所述目标对象的朝向和类型。

一种可选的实施方式中,所述第三确定模块64在基于所述目标对象的朝向和类型以及所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息时,用于:基于所述目标对象的朝向,确定将所述目标对象由所述目标场景的第一位置,映射至待检测图像中的第二位置时的旋转矩阵;基于所述目标对象的类型确定所述目标对象的尺寸信息;基于所述旋转矩阵、所述目标对象的尺寸信息、所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息。

一种可选的实施方式中,所述第三确定模块64在基于所述旋转矩阵、所述目标对象的尺寸信息、所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息时,用于:确定采集所述待检测图像的图像采集设备的投影矩阵以及内参矩阵;基于所述旋转矩阵、所述目标对象的尺寸信息、所述二维检测框、所述投影矩阵、以及所述内参矩阵,确定所述目标对象在所述目标场景中的多个候选三维位置信息;利用所述旋转矩阵、所述内参矩阵、以及所述二维检测框,从所述多个候选三维位置信息中,确定所述目标对象在所述目标场景中的三维位置信息。

一种可选的实施方式中,所述第三确定模块64在利用所述旋转矩阵、所述内参矩阵、以及所述二维检测框,从所述多个候选三维位置信息中,确定所述目标对象在所述目标场景中的三维位置信息时,用于:针对所述多个候选三维位置信息中的每个候选三维位置信息,基于所述旋转矩阵、所述内参矩阵、以及该候选三维位置信息,确定该三维位置信息在所述图像采集设备坐标系中的投影位置信息;基于每个候选三维位置信息的投影位置信息、以及所述二维检测框,确定所述每个候选三维位置信息与所述二维检测框的重合度信息;基于每个候选三维位置信息的重合度信息,从所述多个候选三维位置信息中,确定所述目标对象在所述目标场景中的三维位置信息。

一种可选的实施方式中,所述目标场景为智能行驶装置行驶过程中所处的场景,在确定所述目标对象在所述目标场景中的三维位置信息之后,还包括控制模块65,用于:基于所述目标对象在所述目标场景中的三维位置信息,确定在三维空间中所述目标对象相对于所述智能行驶装置的相对位置;基于所述相对位置控制所述智能行驶装置。

一种可选的实施方式中,所述目标场景为智能行驶装置行驶过程中所处的场景,在确定所述目标对象在所述目标场景中的三维位置信息之后,还包括提示模块66,用于:基于所述目标对象在所述目标场景中的三维位置信息,确定在三维空间中所述目标对象相对于所述智能行驶装置的相对位置;基于所述相对位置发出提示信息。

关于目标检测装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述目标检测方法实施例中的相关说明,这里不再详述。

本公开实施例还提供了一种计算机设备,如图7所示,为本公开实施例提供的计算机设备结构示意图,包括:

处理器71和存储器72;所述存储器72存储有处理器71可执行的机器可读指令,处理器71用于执行存储器72中存储的机器可读指令,所述机器可读指令被处理器71执行时,处理器71执行下述步骤:

获取对目标场景进行图像采集得到的待检测图像;基于所述待检测图像,确定所述待检测图像中的目标对象的二维检测框;根据待检测图像以及所述二维检测框确定所述目标对象的朝向和类型;基于所述目标对象的朝向和类型以及所述二维检测框,确定所述目标对象在所述目标场景中的三维位置信息。

上述存储器72包括内存721和外部存储器722;这里的内存721也称内存储器,用于暂时存放处理器71中的运算数据,以及与硬盘等外部存储器722交换的数据,处理器71通过内存721与外部存储器722进行数据交换。

上述指令的具体执行过程可以参考本公开实施例中所述的目标检测方法或者智能行驶装置的行驶控制方法的步骤,此处不再赘述。

本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的目标检测方法或者智能行驶装置的行驶控制方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的目标检测方法或者智能行驶装置的行驶控制方法的步骤,具体可参见上述方法实施例,在此不再赘述。

其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

相关技术
  • 目标检测方法、装置、计算机设备和计算机可读存储介质
  • 目标检测方法、装置、计算机可读存储介质和计算机设备
技术分类

06120112880275