掌桥专利:专业的专利平台
掌桥专利
首页

对象检测方法、装置、存储介质以及电子装置

文献发布时间:2023-06-19 19:21:53


对象检测方法、装置、存储介质以及电子装置

技术领域

本发明实施例涉及人形侦测技术领域,具体而言,涉及一种对象检测方法、装置、存储介质以及电子装置。

背景技术

近年来,人形侦测是对设备探测范围内出现的人形目标闯入事件进行侦测并上报,常用于无人值守监控录像和自动报警。当前人体侦测大部分都是通过红外传感器进行红外移动侦测。然而,红外传感器容易受各种热源和光源的干扰,以及当环境温度与人体温度接近时,探测的灵敏度会下降,容易产生误报现象。因此,相关技术中存在对象检测的准确率不高的问题。

针对相关技术中存在的对象检测的准确率不高的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种对象检测方法、装置、存储介质以及电子装置,以至少解决相关技术中存在对象检测的准确率不高的问题。

根据本发明的一个实施例,提供了一种对象检测方法,包括:在目标传感器检测到目标区域中出现目标类型的对象的情况下,获取目标拍摄设备对所述目标区域拍摄得到的实时视频流;在所述实时视频流中确定所述目标区域中是否出现移动的目标对象,其中,所述目标对象的类型为所述目标类型;在确定出所述目标区域中出现所述移动的所述目标对象的情况下,发送目标信号,其中,所述目标信号用于提示所述目标区域中出现了移动的所述目标对象。

根据本发明的又一个实施例,还提供了一种对象检测装置,包括:获取模块,用于在目标传感器检测到目标区域中出现目标类型的对象的情况下,获取目标拍摄设备对所述目标区域拍摄得到的实时视频流;

确定模块,用于在所述实时视频流中确定所述目标区域中是否出现移动的目标对象,其中,所述目标对象的类型为所述目标类型;

发送模块,用于在确定出所述目标区域中出现所述移动的所述目标对象的情况下,发送目标信号,其中,所述目标信号用于提示所述目标区域中出现了移动的所述目标对象。

根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明,在目标传感器检测到目标区域中出现了目标类型的对象的情况下,不是直接向工作人员或用户发出提示信号,而是进一步的根据实时视频流进一步的判断目标区域中是否出现移动的目标对象,对目标传感器的判断结果进行筛选,减少了由于目标传感器受到干扰引起的误报,解决了相关技术中存在的对象检测的准确率不高的问题,达到了提高对象检测的准确率的效果。

附图说明

图1是本发明实施例的对象检测方法的移动终端硬件结构框图;

图2是根据本发明实施例的对象检测方法的流程图;

图3是根据本发明实施例的二值图像示意图;

图4是根据本发明实施例的目标框映射到二值图像中的示意图;

图5是根据本发明具体实施例RTOS系统结构的示意图;

图6是根据本发明具体实施例的对象检测的整体流程示意图;

图7是根据本发明实施例的对象检测装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明的实施例。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的对象检测方法的移动终端硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的对象检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种对象检测方法,图2是根据本发明实施例的对象检测方法的流程图,如图2所示,该流程包括如下步骤:

步骤S202,在目标传感器检测到目标区域中出现目标类型的对象的情况下,获取目标拍摄设备对所述目标区域拍摄得到的实时视频流;

步骤S204,在所述实时视频流中确定所述目标区域中是否出现移动的目标对象,其中,所述目标对象的类型为所述目标类型;

步骤S206,在确定出所述目标区域中出现所述移动的所述目标对象的情况下,发送目标信号,其中,所述目标信号用于提示所述目标区域中出现了移动的所述目标对象。

在本实施中,目标传感器是红外传感器,人的体温一般是36-37度,会发出10um左右特定波长的红外线,通过红外传感器对特定范围波长进行实时捕捉,检测人发射的红外线并转换成电信号输出,当有人进入感应范围(即目标区域)时,红外传感器探测到人体红外并发出提示信号。目标传感器检测待在目标区域中出现目标类型的对象指的是检测到有人进入到目标区域。

通过目标传感器对目标区域是否出现人形进行初步检测,在目标传感器检测到目标区域中出现目标类型的对象的情况下,通过目标拍摄设备对目标区域进行拍摄的视频流进一步确定目标区域中是否出现目标类型的目标对象,且只有在目标对象是移动的情况下,发出目标信号,用于提示工作人员或用户目标区域中出现了移动的目标对象。

通过上述步骤,在目标传感器检测到目标区域中出现了目标类型的对象的情况下,不是直接向工作人员或用户发出提示信号,而是进一步的根据实时视频流进一步的判断目标区域中是否出现移动的目标对象,对目标传感器的判断结果进行筛选,有效过滤掉由于目标传感器受到干扰引起的误报,解决了相关技术中存在的对象检测的准确率不高的问题,达到了提高对象检测的准确率的效果。

其中,执行上述步骤S202至S206的执行主体可以是RTOS系统((Real-TimeOperating System,实时操作系统),系统能快速响应并处理数据,调度一切可利用的资源,完成实时任务的同时控制所有实时任务协调一致运行。目标传感器检测在目标区域检测到目标区域中出现目标类型的对象时,会发出提示信号,RTOS系统接收到该提示信息后能快速启动,并开始获取实时数据流,并确定目标区域中是否出现移动的目标对象,在目标区域中出现目标对象的情况下,发送目标信号。

由于目标传感器功耗较低,可以长时间持续运行,RTOS系统启动快、效率高、低功耗的优点,目标传感器和RTOS的结合实现了提高对象检测准确率的同时降低了设备的功耗。

在一个可选的实施例中,所述在所述实时视频流中确定所述目标区域中是否出现移动的目标对象,包括:在所述实时视频流中获取多帧图片,并在所述多帧图片中识别所述目标类型的对象;在所述多帧图片的连续K帧图片中识别出所述目标类型的同一对象的情况下,确定所述识别出的同一对象确定为所述目标对象;在所述目标对象的运动状态为移动的情况下,确定所述目标区域中出现所述移动的所述目标对象。

在本实施例中,获取目标拍摄设备拍摄到的实时视频流,实时视频流是目标拍摄设备边进行拍摄边将获取到的视频数据发送给RTOS系统中的视频流,即获取实时视频流时,是一帧一帧图片获取的或者每次获取预设帧数的图片,或者每隔预定时间获取一次实时视频流,为了保证实时性,预定时间要尽可能的小。

在实时视频流中获取的多帧图片中,逐帧的在图片中识别出目标类型的对象,并对出现在图片中的目标对象在图片中添加目标框,目标框用于标识对象。

为了过滤掉由于单帧图像中误检造成的误报,提高对象检测上报的准确率,在同一对象在连续K帧图片中均被识别到的对象才会被认定为在目标区域中出现了目标对象,即在目标对象中出现了人形目标,在确定目标区域中出现了目标对象的情况下,判断目标对象的运动状态,在目标对象的运动为移动的情况下,发送目标信号。

可选的,在获取实时视频流的同时对已获取的图片帧进行缓存,缓存的图片帧用于在发送目标信号时生成录像并进行保存,从获取的第1帧图片开始缓存,在确定目标区域中出现移动的目标对象时,将所有已缓存的图片帧进行保存,并在确定目标区域中出现移动的目标对象之后获取的新视频帧也进行保存,直至录像的时长达到预设时长阈值或者保存的图片帧达到预设帧数阈值。

在一个可选的实施例中,在所述多帧图片的连续K帧图片中识别出所述目标类型的同一对象的情况下,确定所述识别出的同一对象确定为所述目标对象,包括:在所述多帧图片中的第i帧图片中第一次识别出所述目标类型的第一对象的情况下,重复执行以下步骤,直到所述第i帧图片之后的连续K-1帧图片中都识别出所述第一对象,或者,所述第i帧图片之后的一帧图片中未识别出所述第一对象,其中,j的初始值为1,i为大于或等于1的正整数:判断第j个对象集合中是否存在与所述第一对象匹配的对象,其中,所述第j个对象集合包括在第i+j帧图片中识别到的所述目标类型的对象;在所述j个对象集合中存在与所述第一对象匹配的对象的情况下,确定在所述第i+j帧图片中识别出所述第一对象;将j更新为j+1;在所述j个对象集合中不存在与所述第一对象匹配的对象的情况下,确定在所述第i+j帧图片中未识别出所述第一对象。

在本实施例中,在确定连续K帧图片中是否识别出同一对象时,首先在第i帧图像中第一次识别出目标类型的第一对象时,判断在第i帧图片之后的连续K-1帧是否均识别出了第一对象,在均识别出了第一对象的情况下,确定连续K帧图片中识别出了同一对象。

判断在第i帧图片之后的连续K-1帧是否均识别出了第一对象,对第i帧图片之后的连续K-1帧重复执行以下操作:在第i+j帧图片中识别出第i+j帧图片中所有的目标类型的图像,得到第j个对象集合,在第j个对象集合中查找是否存在与第一对象匹配的对象,如果在j个对象集合中存在与第一对象匹配,则确定第i+j帧图片中识别出了第一对象,并记录第一对象在第i+j帧图片中的位置信息,包括目标框的位置和目标框的大小等信息。

在确定同一对象是否在连续多帧中出现时时,都是将该帧图片中识别出的对象与上一帧识别的对象进行匹配,匹配成功的对象说明在两帧图片中都识别出了,在该帧图片中识别出的对象且未匹配成功,则说明该对象在该帧图片中首次出现,在上一帧识别出的对象且未匹配成功的情况下,确定该对象未在该帧图片中出现。

在一个可选的实施例中,所述判断第j个对象集合中是否存在与所述第一对象匹配的对象,包括:获取第i+j-1帧图片中用于标识所述第一对象的第一目标框以及第一目标框集合,其中,所述第一目标框集合包括所述第i+j帧图片中用于标识所述第一对象集合中的各个对象的目标框;确定所述第一目标框与所述第一目标框集合中的各个目标框的交并比;在所述第一目标框集合中存在与所述第一目标框的交并比大于预设阈值的目标框的情况下,确定所述第j个对象集合中存在与所述第一对象匹配的对象。

在本实施例中,在判断第j个对象集合中是否存在与第一对象匹配的对象时,根据目标框确定是否与第一对象匹配,第一对象在第i+j-1帧图片中的目标框为第一目标框,在第i+j帧图片中识别的所有目标类型的对象的目标框,组成了目标框集合,目标框集合包含一个或多个目标框,将第一目标框分别于目标框集合中的目标框计算交并比,在存在有交并比大于预设阈值的情况下,确定第j个对象集合中存在与第一对象匹配的对象,且将该交并比对应的对象确定为第一对象,对应的目标框确定为第i+j帧图片中用于标识第一对象的目标框。

需要说明的是,交并比反应了两个目标框之间的重合度,交并比越大,说明两个目标框之间的重合面积越大。

在一个可选的实施例中,在所述目标对象的运动状态为移动的情况下,确定所述目标区域中出现移动的所述目标对象,包括:获取目标图片集合,其中,所述目标图片集合中的各个图片中识别出了所述目标对象,所述目标图片集合包括所述多帧图片中的第i帧图片,所述第i帧图片是所述多帧图片中第一次识别出所述目标对象的图片,i为大于或等于1的正整数;确定在所述目标图片集合中各个图片中的所述目标对象的位移,并确定在所述目标图片集合中各个图片中的所述目标对象的运动方向;在所述目标图片集合中存在所述目标对象的位移大于预设位移的图片,且在所述目标图片集合中所述目标对象的运动方向相同的图片的数量大于预设数量阈值的情况下,确定所述目标区域中出现移动的所述目标对象。

在本实施例中,在确定目标区域中存在目标对象的情况下,进一步的判断目标对象的运动状态,在运动状态为移动的情况下,才发送目标信号,反之,在运动状态为静止的情况下,不发送目标信号。

其中,判断目标对象的运动状态时,确定目标对象的位移是否大于阈值以及目标对象是否存在主运动方向。

获取目标图片集合,目标集合中的图片包括识别出了目标对象的所有或部分图像,目标图片集合的第一帧图片为第1图片,是上述第i帧图片。目标集合中每个图片中的目标对象的位移指的是每个图片中的目标对象对应的目标框上目标点与第一图片中的目标对象对应的目标框上目标点的距离,其中目标点可以是目标框中相同的点,例如,目标框的中心点或左上角等。

判断目标对象是否存在主运动方向时先确定每个图片中目标对象的运动方向,通过每个图片中的目标对象的目标框与上一个图片中的目标对象的目标框之间的相对位置方向确定每个图片中的目标对象的运动方向。

判断各个图片中的目标对象的运动方向是否相同,在运动方向相同的图片的数量大于预设数量阈值的情况下,确定目标对象存在主运动方向,例如,在确定在有查过预设数量阈值的图片中目标对象的运动方向为向右运动的情况下,确定目标对象存在主运动方向,主运动方向为向右运动。

在一个可选的实施例中,所述确定在所述目标图片集合中各个图片中的所述目标对象的位移,包括:获取所述目标图片集合中的第m图片中所述目标对象的第m个位置,以及所述目标图片集合中的第1图片中所述目标对象的第1个位置,其中,所述第1图片为所述第i帧图片,m为大于或等于1的正整数;将所述第m个位置和第1个位置之间的距离确定所述第m图片中所述目标对象的位移。

在本实施例中,第m个位置是在第m图片中目标对象对应的目标框上目标点的位置,例如,选取目标框的中心点作为第m个位置。将第m个位置和第1个位置之间的距离确定第m图片中目标对象的位移。

在一个可选的实施例中,所述确定在所述目标图片集合中各个图片中的所述目标对象的运动方向,包括:获取所述目标图片集合中的第m图片中用于标识所述目标对象的第m个目标框,以及第m+1图片中用于标识所述目标对象的第m+1个目标框,其中,m为大于或等于1的正整数;根据所述第m个目标框和所述第m+1个目标框,确定所述第m+1图片中所述目标对象的运动方向。

在本实施例中,运动方向可以沿水平与垂直方向分解后的方向,即上、下、左、右四个方向,通过考察目标对象的第m个目标框和第m+1个目标框,得到第m+1图片中的目标对象的运动方向。

可选的,通过第m个目标框和第m+1个目标框左上角、右下角、中心点的坐标的差值得到目标对象是向右运动还是向左运动,通过以下方式确定:

△X_m+1_left_up=X_m+1_left_up–X_m_left_up;

△X_m+1_center=X_m+1_center–X_m_center;

△X_m+1_right_low=X_m+1_right_low–X_m_right_low;

其中,X表示横坐标,left_up表示左上角,right_low表示右下角,center表示中心点,X_m+1_left_up表示第m+1图片中目标对象的第m+1个目标框的左上角坐标的横坐标,X_m+1_left_up表示第m图片中目标对象的第m个目标框的左上角坐标的横坐标,X_m+1_center表示第m+1图片中目标对象的第m+1个目标框的中心点坐标的横坐标,X_m_center表示第m图片中目标对象的第m个目标框的中心点坐标的横坐标,X_m+1_right_low表示第m+1图片中目标对象的第m+1个目标框的中心点坐标的横坐标,X_m_right_low表示第m图片中目标对象的第m个目标框的中心点坐标的横坐标。

在△X_m+1_left_up、△X_m+1_center、△X_m+1_right_low三者中有两个及以上大于0,则判断目标对象向右运动;若三者中有两个及以上小于0,则判断目标对象向左运动,否则认为运动方向无法判断。

同理,通过考察纵坐标Y,可以判断目标对象向上或者向下的运动状态。

可选的,还可以通过计算目标框中的前景点像素占比来判断目标对象的运动状态,具体为,对每一个像素点进行二分类,通过对同一位置的像素在连续帧间像素值变化进行分析,将每一个像素划分为前景点与背景点,前景点即为目标对象上的像素点。

即将第m图片中每个像素点和第m+1图片中对应的像素点进行对比,确定两个像素点之间像素值的差值,在差值大于预设像素阈值的情况下,将第m+1图片中该像素点确定为前景点,否则,确定为背景点,图3是根据本发明实施例的二值图像示意图,如图3所示,最后输出一张与原图大小相同的二值图像。

图4是根据本发明实施例的目标框映射到二值图像中的示意图,如图4所示将第m图片中目标对象的第m个目标框映射到上述二值图像中,用第m个目标框内的前景点像素个数除以目标框包围的所有像素点个数,得到第m个目标框前景点像素占比,在第m个目标框前景点像素占比大于预设占比阈值的情况下,确定目标对象是运动的。

显然,上述所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。

下面结合实施例对本发明进行具体说明:

图5是根据本发明具体实施例RTOS系统结构的示意图,如图5所示,RTOS系统包括:目标检测模块、背景建模模块、目标跟踪模块、目标信号判定模块组成。

其中,目标检测模块主要是对目标区域中的目标类型的对象进行识别与定位,得到目标类型的对象位置信息。本实施例中采用基于神经网络的YOLO目标检测算法,对监控场景中较为常见的行人、动物、车辆等目标类别进行检测。其他目标检测算法例如RCNN系列、SSD等也可实现类似效果。得益于数据驱动的深度学习算法,可以对动物、光源、热源等有可能造成PIR误报的目标进行有效过滤。

背景建模模块主要功能是进行运动目标检测。本提案采用的背景建模算法为vibe,但并不局限于vibe,其他背景建模算法如高斯混合模型(GMM)、vibeplus等均可实现类似效果。背景建模可以认为是一个对像素二分类的过程,通过对同一位置像素在连续帧间像素值变化进行分析,将每一个像素划分为前景点与背景点,前景点即为运动目标。背景建模模块输出结果为前景图,是一张与原图尺寸相同的二值图像。

目标跟踪模块主要是将在不同图片中检测得到的目标框进行帧间关联,确定相邻帧中的同一目标并维护目标状态与历史轨迹信息等。。

目标对象的目标状态可分为init、create、update、lost、delete 5种,首次出现的目标为init状态,init状态的目标连续k帧匹配成功则进入create状态,create状态的目标在后续帧中如果仍然匹配成功,则更改为update状态,否则为lost状态。lost状态的目标仍可以参与后续帧匹配,直到连续n帧匹配失败达到delete状态。在本实施例中只有update状态的目标才有可能触发报警,可以有效过滤单帧图像误检漏检造成误报的情况。对于同一目标对象,若匹配成功则记录其位置信息,如此即可得到目标的运动轨迹用于后续模块分析。

目标信号判定模块基于基于目标跟踪与背景建模的输出结果进行是否发出目标信号的判定。

发出目标信号需要同时满足3个条件:条件1:是目标类型的对象(过滤动物、热源、光源等造成的误报)。条件2:处于update状态的目标对象(过滤单帧图像误检漏检造成的误报漏报)。条件3:处于运动状态的对象(过滤静止目标造成的误报)。

其中,判定对象处于运动状态的条件:条件1:目标位移大于设定阈值;条件2:目标有主运动方向;条件3:目标框前景点像素占比大于设定阈值。述3个条件中有两个满足,则判定目标处于运动状态。

图6是根据本发明具体实施例的对象检测的整体流程示意图,如图6所示,包括:

步骤601:通过红外传感器对特定范围波长进行实时捕捉,对目标类型的对象进行初步检测;

步骤602:判断红外传感器是否检测到目标类型的对象,如果是,执行步骤603,如果不是,执行步骤601;

步骤603:唤醒RTOS系统;

步骤604:开启视频流推送,获取拍摄到的实时视频流并进行图像帧缓存;

步骤605:智能视频分析,以确定目标区域中是否出现移动的目标对象;

步骤605:判断目标区域中是否出现移动的目标对象,如果是,执行步骤606,如果不是,执行步骤607;

步骤606:发送目标信号;

步骤607:休眠RTOS系统,当发送目标信号之后,结束视频算法运行;或当录像保存完毕后,或者未触发发送目标信号时,结束视频流推送,之后休眠RTOS系统,然后执行步骤601,等待下一次红外传感器检测到目标类型的对象。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中还提供了一种对象检测装置,图7是根据本发明实施例的对象检测装置的结构框图,如图7所示,该装置包括:

获取模块702,用于在目标传感器检测到目标区域中出现目标类型的对象的情况下,获取目标拍摄设备对所述目标区域拍摄得到的实时视频流;

确定模块704,用于在所述实时视频流中确定所述目标区域中是否出现移动的目标对象,其中,所述目标对象的类型为所述目标类型;

发送模块706,用于在确定出所述目标区域中出现所述移动的所述目标对象的情况下,发送目标信号,其中,所述目标信号用于提示所述目标区域中出现了移动的所述目标对象。

在一个可选的实施例中,所述装置还用于,在所述实时视频流中获取多帧图片,并在所述多帧图片中识别所述目标类型的对象;在所述多帧图片的连续K帧图片中识别出所述目标类型的同一对象的情况下,确定所述识别出的同一对象确定为所述目标对象;在所述目标对象的运动状态为移动的情况下,确定所述目标区域中出现所述移动的所述目标对象。

在一个可选的实施例中,所述装置还用于,在所述多帧图片中的第i帧图片中第一次识别出所述目标类型的第一对象的情况下,重复执行以下步骤,直到所述第i帧图片之后的连续K-1帧图片中都识别出所述第一对象,或者,所述第i帧图片之后的一帧图片中未识别出所述第一对象,其中,j的初始值为1,i为大于或等于1的正整数:判断第j个对象集合中是否存在与所述第一对象匹配的对象,其中,所述第j个对象集合包括在第i+j帧图片中识别到的所述目标类型的对象;在所述j个对象集合中存在与所述第一对象匹配的对象的情况下,确定在所述第i+j帧图片中识别出所述第一对象;将j更新为j+1;在所述j个对象集合中不存在与所述第一对象匹配的对象的情况下,确定在所述第i+j帧图片中未识别出所述第一对象。

在一个可选的实施例中,所述装置还用于,获取第i+j-1帧图片中用于标识所述第一对象的第一目标框以及第一目标框集合,其中,所述第一目标框集合包括所述第i+j帧图片中用于标识所述第一对象集合中的各个对象的目标框;确定所述第一目标框与所述第一目标框集合中的各个目标框的交并比;在所述第一目标框集合中存在与所述第一目标框的交并比大于预设阈值的目标框的情况下,确定所述第j个对象集合中存在与所述第一对象匹配的对象。

在一个可选的实施例中,所述装置还用于,获取目标图片集合,其中,所述目标图片集合中的各个图片中识别出了所述目标对象,所述目标图片集合包括所述多帧图片中的第i帧图片,所述第i帧图片是所述多帧图片中第一次识别出所述目标对象的图片,i为大于或等于1的正整数;确定在所述目标图片集合中各个图片中的所述目标对象的位移,并确定在所述目标图片集合中各个图片中的所述目标对象的运动方向;在所述目标图片集合中存在所述目标对象的位移大于预设位移的图片,且在所述目标图片集合中所述目标对象的运动方向相同的图片的数量大于预设数量阈值的情况下,确定所述目标区域中出现移动的所述目标对象。

在一个可选的实施例中,所述装置还用于,获取所述目标图片集合中的第m图片中所述目标对象的第m个位置,以及所述目标图片集合中的第1图片中所述目标对象的第1个位置,其中,所述第1图片为所述第i帧图片,m为大于或等于1的正整数;将所述第m个位置和第1个位置之间的距离确定所述第m图片中所述目标对象的位移。

在一个可选的实施例中,所述装置还用于,获取所述目标图片集合中的第m图片中用于标识所述目标对象的第m个目标框,以及第m+1图片中用于标识所述目标对象的第m+1个目标框,其中,m为大于或等于1的正整数;根据所述第m个目标框和所述第m+1个目标框,确定所述第m+1图片中所述目标对象的运动方向。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 对象检测方法及装置、电子设备和存储介质
  • 对象关系识别方法和装置、存储介质及电子装置
  • 目标对象的识别方法和装置、存储介质、电子装置
  • 对象显示方法和装置、存储介质及电子装置
  • 一种问卷调查对象确定方法、装置、电子设备和存储介质
  • 检测用信息登录装置、对象物体检测装置、电子设备、检测用信息登录装置的控制方法、对象物体检测装置的控制方法、检测用信息登录装置控制程序、对象物体检测装置控制程序
  • 检测用信息登录装置、对象物体检测装置、电子设备、检测用信息登录装置的控制方法、对象物体检测装置的控制方法、检测用信息登录装置控制程序、对象物体检测装置控制程序
技术分类

06120115884640