掌桥专利:专业的专利平台
掌桥专利
首页

行为检测方法、装置、设备、介质及计算机程序产品

文献发布时间:2023-06-19 16:04:54



技术领域

本申请属于计算机视觉领域,尤其涉及一种行为检测方法、装置、设备、介质及计算机程序产品。

背景技术

吸烟对社会的危害性不仅体现在吸烟有害健康,而且,由于吸烟者的不文明行为,极易引起火灾。因此,越来越多的场所开始设置禁烟区。

目前,对禁烟区是否存在吸烟行为进行监控,常采用的方式例如:设置烟雾传感器或者烟卷行为检测等,但由于传感器灵敏度较低,以及烟卷图像不易识别等问题,导致吸烟行为的检测结果存在漏检或者误检的情况。

发明内容

本申请实施例提供一种行为检测方法、装置、设备、介质及计算机程序产品,能够快速识别吸烟行为,提高吸烟行为检测结果的准确率。

第一方面,本申请实施例提供一种行为检测方法,包括:

获取第一预设时长内的N帧图像,其中,每帧图像包括至少一个面部检测区域,N为正整数;

基于面部检测模型,获取每帧图像中每个面部检测区域对应的面部图像信息;

对应每帧图像,将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果;

根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果;

当N帧图像的N个第二吸烟识别结果中包括目标吸烟识别结果的数量在第二阈值范围内时,确定第一预设时长内包括吸烟行为。

在第一方面的一些可实现方式中,面部图像信息包括每个面部检测区域对应的子图像和每个面部检测区域对应的面部标识;对应每帧图像,将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果,包括:

将每帧图像中的面部检测区域对应的子图像输入吸烟识别模型,得到对每个子图像的吸烟行为检测信息;

对应每个面部标识,从N帧图像中分别获取面部检测区域对应的子图像的吸烟行为检测信息,得到每个面部标识对应M个吸烟行为检测信息,M为小于或等于N的正整数;

确定每个面部标识对应M个吸烟行为检测信息包括吸烟行为信息的数量;

根据每个面部标识对应吸烟行为信息的数量和第三阈值范围,确定每帧图像中每个面部图像信息的第一吸烟识别结果。

在第一方面的一些可实现方式中,当吸烟行为信息的数量在第三阈值范围内时,确定面部标识对应吸烟行为信息,并将对应吸烟行为信息对应的面部标识为目标标识;

对应每帧图像,确定目标标识对应面部图像信息的第一吸烟识别结果包括目标吸烟识别结果。

在第一方面的一些可实现方式中,基于面部检测模型,获取每帧图像中每个面部检测区域对应的面部图像信息,包括:

根据面部检测模型识别每帧图像中包括的面部检测区域,确定每个面部检测区域对应的初始子图像和每个面部检测区域对应的面部标识;

将每帧图像中面部检测区域对应的初始子图像的分辨率调整为目标分辨率,得到面部检测区域对应的子图像。

在第一方面的一些可实现方式中,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果,包括:

对应每帧图像,当第一吸烟识别结果为目标吸烟识别结果的数量在第一阈值范围内时,确定图像的第二吸烟识别结果包括目标吸烟识别结果。

在第一方面的一些可实现方式中,在当N帧图像的N个第二吸烟识别结果中包括目标吸烟识别结果的数量在第二阈值范围内时,确定第一预设时长内包括吸烟行为之后,方法还包括:

在获取第一预设时长的N帧图像与下一次获取第一预设时长的N帧图像之间的时间间隔为第二预设时长。

第二方面,本申请实施例提供一种行为检测装置,包括:

获取模块,用于获取第一预设时长内的N帧图像,其中,每帧图像包括至少一个面部检测区域,N为正整数;

获取模块,还用于基于面部检测模型,获取每帧图像中每个面部检测区域对应的面部图像信息;

识别模块,用于对应每帧图像,将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果;

处理模块,用于根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果;

处理模块,还用于当N帧图像的N个第二吸烟识别结果中包括目标吸烟识别结果的数量在第二阈值范围内时,确定第一预设时长内包括吸烟行为。

第三方面,本申请提供一种行为检测设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面或者第一方面任一可实现方式中所述的行为检测方法。

第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或者第一方面任一可实现方式中所述的行为检测方法。

第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如第一方面或者第一方面任一可实现方式中所述的行为检测方法。

本申请实施例的行为检测方法、装置、设备、介质及计算机程序产品。采集到的图像中包括面部检测区域,接下来,获取每帧图像中每个面部检测区域对应的面部图像信息,并将每个面部检测区域对应的面部图像信息输入的吸烟识别模型,确定每帧图像的吸烟识别结果,其中,由于面部检测区域对应的图像大小明显小于完整图像的大小,从而可以提高吸烟识别模型对吸烟行为的识别速度,之后,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果,最后,将N帧图像的N个吸烟识别结果为目标识别结果的数量与第二阈值范围进行比较,来确定所述第一预设时长内是否包括吸烟行为,可有效提高识别吸烟行为的准确率。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种行为检测方法的流程示意图;

图2是本申请实施例提供的一种确定第一吸烟识别结果的流程示意图;

图3是本申请实施例提供的一种行为检测装置的结构示意图;

图4是本申请实施例提供的一种行为检测设备的结构示意图。

具体实施方式

下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。

吸烟对社会的危害性不仅体现在吸烟有害健康,而且,由于吸烟者的不文明行为,极易引起火灾。因此,越来越多的场所开始设置禁烟区。

目前,对禁烟区是否存在吸烟行为进行监控,常采用的方式例如:设置烟雾传感器或者烟卷行为检测等,但由于传感器灵敏度较低,以及烟卷图像不易识别等问题,导致吸烟行为的检测结果存在漏检或者误检的情况。例如,检测模型所用的图像距离摄像头太近,虽然容易获得明显的烟卷特征,但是没有实现对大范围人群是否存在吸烟行为进行有效的检测,因此,目前使用模型进行吸烟行为检测的场景应用性不高。又例如,检测模型直接在大分辨率图像中检测小分辨率的烟卷,导致了检测吸烟行为的准确率不高。

针对于此,本申请实施例提供了一种行为检测方法、装置、设备、介质及计算机程序产品,能够在采集到的图像中包括面部检测,获取每帧图像中每个面部检测区域对应的面部图像信息,并将每个面部检测区域对应的面部图像信息输入的吸烟识别模型,确定每帧图像的吸烟识别结果,之后,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果,最后,将N帧图像的N个吸烟识别结果为目标识别结果的数量与第二阈值范围进行比较,来确定第一预设时长内是否包括吸烟行为,可有效提高识别吸烟行为的准确率。

下面结合附图对本申请实施例所提供的行为检测方法进行介绍。图1示出了本申请一个实施例提供的行为检测方法的流程示意图。如图1所示,该方法可以包括以下步骤:

步骤110,获取第一预设时长内的N帧图像。

其中,每帧图像包括至少一个面部检测区域,N为正整数。

步骤120,基于面部检测模型,获取每帧图像中每个面部检测区域对应的面部图像信息。

步骤130,对应每帧图像,将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果。

步骤140,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果。

步骤150,当N帧图像的N个第二吸烟识别结果中包括目标吸烟识别结果的数量在第二阈值范围内时,确定第一预设时长内包括吸烟行为。

上述各个步骤的具体实现方式将在下文中进行详细描述。

本申请实施例的行为检测方法,在采集到的图像中包括面部检测,接下来,获取每帧图像中每个面部检测区域对应的面部图像信息,并将每个面部检测区域对应的面部图像信息输入的吸烟识别模型,确定每帧图像的吸烟识别结果,其中,由于面部检测区域对应的图像大小明显小于完整图像的大小,从而可以提高吸烟识别模型对吸烟行为的识别速度,之后,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果,最后,将N帧图像的N个吸烟识别结果为目标识别结果的数量与第二阈值范围进行比较,来确定所述第一预设时长内是否包括吸烟行为,可有效提高识别吸烟行为的准确率。

下面介绍上述各个步骤的具体实现方式。

具体地,涉及步骤110,获取第一预设时长内的N帧图像。

在一些需要对是否存在吸烟行为检测的场景中,可以通过图像采集设备进行图像采集,其中,图像采集设备例如可以是摄像头、视觉传感器的等能够进行图像采集的设备。图像采集设备可以实时获取行为检测场景中的图像。

示例性的,以图像采集设备是摄像头为例,为了避免摄像头的安置点影响被检测用户的正常活动,以及使采集到图像中包括尽可能多的面部特征信息,摄像头可以根据实际采集场景安置。作为一个具体的示例,将摄像头与有效区域边界的俯仰角大于45度小于85度,并摄像头视野距离在15米至20米之间。

在一些实施例中,通过图像采集设备可以实时采集获得视频数据,可选地,对采集到的视频数据可以保存至预设存储器中,以便于在需要进行吸烟行为检测时,随时提取视频数据;可选地,还可以对实时采集到的视频数据进行实时吸烟行为检测,以提高行为检测结果的时效性。可选地,可以根据图像采集设备的实际拍摄能力调整采集到的视频数据的分辨率,示例性的,可以将采集视频的分辨率设置为1920×1080,在此不作具体限制。

在一些实施例中,第一预设时长的时间长的可以根据行为检测需求进行设定,在此不对第一预设时长做具体限定。其中,N个图像可以从视频中提取。为了提高检测速度,减少对冗余数据的处理,可以先获取第一预设时长的视频数据,对于视频数据每预设帧数的图像中提取一帧图像,从而可以得到第一预设时长内的N帧图像。例如,预设帧数可以为5,对于5帧连续的图像可以从中提取一张图像。如此,可以有效减少数据处理量,提高获取行为检测结果的速度。

涉及步骤120,基于面部检测模型,获取每帧图像中每个面部检测区域对应的面部图像信息。

可选地,为了提高面部检测速度,在将每帧图像输入预设面部检测模型之前,还可以对每帧图像进行预处理,以提高面部检测区域的识别效率,以及识别的准确性。示例性的,对每帧图像的预处理,例如可以包括先将每帧图像的像素缩放至目标大小,例如,640*480。其中,目标大小也可以根据具体地面部检测模型的输入需求进行设置,在此不作具体限定。

对每帧图像的预处理例如还可以是将三通道彩色图像转换为单通道灰度图像,在保证识别精度的情况下,减少预设面部检测模型的数据处理量,提高获取面部检测区域的识别效率。

在一些实施例中,面部检测模型例如可以选用训练完成的超轻量级通用面部检测模型(Ultra-Light-Fast-Generic-Face-Detector),由于该模型体积小,能够适用于边缘计算设备、移动端设备或个人电脑等电子设备。通过预设识别模型可以快速检测到每帧图像中的面部检测区域,从而提高行为检测方法的场景适应性。

为了便于接下来对吸烟行为进行检测,接下来,可以对检测到的每帧图像中的面部检测区域进行图像提取,从而得到每个面部检测区域对应的面部图像信息。可选地,为了提高检测精度,对于提取得到每个面部检测区域对应的面部图像信息,可以根据预设筛选条件进行筛选,例如,筛选条件可以包括以下一个或多个:面部图像的高度不小于80个像素,宽不小于50个像素,图像中面部距离摄像头视野的距离小于5米等。可以理解的是,面部检测模型可以根据检测需求进行训练得到,例如,正面面部,侧面面部等从不同角度拍摄得到的面部均可以在预设面部检测模型的识别范围内,基于预设面部识别模型可以识别得到图像中面部的图像、位置、数量等信息。

在一些实施例中,步骤120具体还可以包括以下步骤:根据面部检测模型识别每帧图像中包括的面部检测区域,确定每个面部检测区域对应的初始子图像和每个面部检测区域对应的面部标识;将每帧图像中面部检测区域对应的初始子图像的分辨率调整为目标分辨率,得到面部检测区域对应的子图像。

对每帧图像,将每个面部检测区域对应的初始子图像的分辨率调整为目标分辨率,得到面部检测区域对应的子图像,如此,便于能够更精准的识别出面部检测区域中的烟卷,提高检测吸烟行为的准确性。示例性的,目标分辨率可以是640×640,以实现更精细的像素级边缘分割,以尽可能的识别出面部图像信息中包括的烟卷。

涉及步骤130,对应每帧图像,将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果。

根据本申请实施例的上述步骤,对应每帧图像可以得到至少一个面部图像信息。将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果,示例性的,第一吸烟识别结果可以是面部图像信息中包括吸烟行为或面部图像信息中不包括吸烟行为。

可选地,吸烟识别模型可以是基于yolov5检测模型训练得到的。训练后得到的吸烟识别模型可以识别出每个图像中的烟卷的图像、位置、数量等信息。

在一些实施例中,面部图像信息包括每个面部检测区域对应的子图像和每个面部检测区域对应的面部标识。

图2是本申请实施例提供的一种确定第一吸烟识别结果的流程示意图。本申请实施例步骤130具体还可以包括步骤131至步骤134,结合图2所示。

步骤131,将每帧图像中的面部检测区域对应的子图像输入吸烟识别模型,得到对每个子图像的吸烟行为检测信息。

吸烟识别模型可以识别出每个子图像中是否包括烟卷。

步骤132,对应每个面部标识,从N帧图像中分别获取面部检测区域对应的子图像的吸烟行为检测信息,得到每个面部标识对应M个吸烟行为检测信息,M为小于或等于N的正整数。

由于面部图像信息包括每个面部检测区域对应的子图像和每个面部检测区域对应的面部标识。由于面部标识用于区别不同的面部信息,也就是说,在N帧图像中,对于来自同一个识别对象的面部信息,可以与一个面部标识关联,从而得到一个识别对象在多帧图像中的子图像。示例性的,识别对象可以是采集图像中的人脸。

在识别出每个子图像中是否包括烟卷后,可以对应每个面部标识,从N帧图像中分别获取面部检测区域对应的子图像的吸烟行为检测信息,得到每个面部标识对应M个吸烟行为检测信息。

步骤133,确定每个面部标识对应M个吸烟行为检测信息包括吸烟行为信息的数量。

步骤134,根据每个面部标识对应吸烟行为信息的数量和第三阈值范围,确定每帧图像中每个面部图像信息的第一吸烟识别结果。

示例性的,第三阈值范围例如可以是大于一个固定阈值,也可以是一个动态阈值。动态阈值例如,吸烟行为信息的数量与M的比例关系。

在一些实施例中,当吸烟行为信息的数量在第三阈值范围内时,确定面部标识对应吸烟行为信息,并将对应吸烟行为信息对应的面部标识为目标标识;对应每帧图像,确定目标标识对应面部图像信息的第一吸烟识别结果包括目标吸烟识别结果。示例性的,目标吸烟识别结果为面部图像信息中包括吸烟行为。

如此,通过检测同一面部标识对应的面部检测区域是否存在吸烟行为,来确定每帧图像中每个面部图像信息的第一吸烟识别结果,可以有效提高检测吸烟行为的准确率。

步骤140,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果。

在一些实施例中,由于对应每帧图像可以得到至少一个面部图像信息,因此,可以根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果。可选地,第一阈值范围可以根据检测需求进行设定。

具体地,对应每帧图像,当第一吸烟识别结果为目标吸烟识别结果的数量在第一阈值范围内时,确定图像的第二吸烟识别结果包括目标吸烟识别结果。其中,目标吸烟识别结果为面部图像信息中包括吸烟行为。

在一个示例中,第一阈值范围可为具体数值范围,例如,第一预设范围例如可以是当至少有一个面部图像信息的第一次吸烟识别结果为目标吸烟识别结果,就可以确定每帧图像的第二吸烟识别结果,即,图像中包括吸烟行为。

在又一示例中,第一阈值范围可以根据每帧图像对应面部图像信息的数量确定。具体地,例如,一帧图像对应X个面部图像信息,对应有X个第一识别结果,当X个第一识别结果包括目标识别结果的数量超过第一识别结果的30%时,确定每帧图像的第二吸烟识别结果,即,图像中包括吸烟行为。

根据本申请实施例,可以快速确定每帧图像是否包括吸烟行为。

涉及步骤150,当N帧图像的N个第二吸烟识别结果中包括目标吸烟识别结果的数量在第二阈值范围内时,确定第一预设时长内包括吸烟行为。

在第一预设时长内的N帧图像可以得到N个第二吸烟识别结果。具体地,对于第一预设时长内的N帧图像,可以在N帧图像的第二吸烟识别结果为目标吸烟识别结果的数量在第二阈值范围时,确定第一预设时长内包括吸烟行为。示例性的,第二阈值范围例如为大于3,当N个吸烟识别结果中包括大于3个目标吸烟识别结果时,可以判断第一预设时长内包括隔吸烟行为。

在一些实施例中,预设数量阈值可以根据实际检测需求进行设定,例如,可以根据N的大小对数量阈值的大小进行调整。

作为一个具体地示例,在确定第一预设时长内是否包括吸烟行为时,还可以采用滑动窗口进行判定,具体为,根据图像对应的采集时间的先后顺序,确定N个第二吸烟识别结果的先后顺序;可选地,预设滑动窗口的宽度可以大于1小于N,预设滑动窗口根据时间的先后顺序,由远及近依次滑动,其中滑动步长可以为1,在此不对滑动步长进行具体限定。当存在一个滑动窗口中所有的第二吸烟识别结果为目标吸烟识别结果时,确定第一预设时长内包括吸烟行为。

根据本申请实施例,可以快速、准确的确定第一预设时长内包括吸烟行为。如此一来,能够对不同场景中的吸烟行为进行更好的判别,从而能够更好地适应于不同的检测场景。

在一些实施例中,在检测第一预设时长内包括吸烟行为之后,可以生成吸烟行为提示信息。

在确定第一预设时长内包括吸烟行为之后,具体地行为检测方法还可以包括以下步骤:在获取第一预设时长的N帧图像与下一次获取第一预设时长的N帧图像之间的时间间隔为第二预设时长。

具体地,第二预设时长可以根据检测场景中行人的流动速度确定,示例性的,当行人的流动速度越慢,第二预设时长就越长。对于图像采集设备采集到的图像数据,通过每隔第二预设时长进行一次行为检测,可以避免对同样的对象进行重复检测,以避免浪费计算资源。

基于相同的发明构思,本申请还提供了与上述行为检测方法对应的行为检测装置300。具体结合图3进行详细说明。

图3是本申请实施例提供的一种行为检测装置的结构示意图,如图3所示,该行为检测装置300可以包括:

获取模块310,用于获取第一预设时长内的N帧图像,其中,每帧图像包括至少一个面部检测区域,N为正整数;

获取模块310,还用于基于面部检测模型,获取每帧图像中每个面部检测区域对应的面部图像信息;

识别模块320,用于对应每帧图像,将图像中每个面部检测区域对应的面部图像信息输入吸烟识别模型,得到每帧图像中每个面部图像信息的第一吸烟识别结果;

处理模块330,用于根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果;

处理模块330,还用于当N帧图像的N个第二吸烟识别结果中包括目标吸烟识别结果的数量在第二阈值范围内时,确定第一预设时长内包括吸烟行为。

在一些实施例中,面部图像信息包括每个面部检测区域对应的子图像和每个面部检测区域对应的面部标识;

识别模块320,还用于将每帧图像中的面部检测区域对应的子图像输入吸烟识别模型,得到对每个子图像的吸烟行为检测信息;

处理模块330,还用于对应每个面部标识,从N帧图像中分别获取面部检测区域对应的子图像的吸烟行为检测信息,得到每个面部标识对应M个吸烟行为检测信息,M为小于或等于N的正整数;

处理模块330,还用于确定每个面部标识对应M个吸烟行为检测信息包括吸烟行为信息的数量;

处理模块330,还用于根据每个面部标识对应吸烟行为信息的数量和第三阈值范围,确定每帧图像中每个面部图像信息的第一吸烟识别结果。

在一些实施例中,处理模块330,还用于当吸烟行为信息的数量在第三阈值范围内时,确定面部标识对应吸烟行为信息,并将对应吸烟行为信息对应的面部标识为目标标识;

处理模块330,还用于对应每帧图像,确定目标标识对应面部图像信息的第一吸烟识别结果包括目标吸烟识别结果。

在一些实施例中,处理模块330,还用于根据面部检测模型识别每帧图像中包括的面部检测区域,确定每个面部检测区域对应的初始子图像和每个面部检测区域对应的面部标识;

处理模块330,还用于将每帧图像中面部检测区域对应的初始子图像的分辨率调整为目标分辨率,得到面部检测区域对应的子图像。

在一些实施例中,处理模块330,还用于对应每帧图像,当第一吸烟识别结果为目标吸烟识别结果的数量在第一阈值范围内时,确定图像的第二吸烟识别结果包括目标吸烟识别结果。

在一些实施例中,处理模块330,还用于在获取第一预设时长的N帧图像与下一次获取第一预设时长的N帧图像之间的时间间隔为第二预设时长。

可以理解的是,本申请实施例的行为检测装置200,可以对应于本申请实施例提供的行为检测方法的执行主体,行为检测装置200的各个模块/单元的操作和/或功能的具体细节可以参见上述本申请实施例图1的行为检测方法中的相应部分的描述,为了简洁,在此不再赘述。

本申请实施例的行为检测装置,能够采集到的图像中包括面部检测,接下来,获取每帧图像中每个面部检测区域对应的面部图像信息,并将每个面部检测区域对应的面部图像信息输入的吸烟识别模型,确定每帧图像的吸烟识别结果,其中,由于面部检测区域对应的图像大小明显小于完整图像的大小,从而可以提高吸烟识别模型对吸烟行为的识别速度,之后,根据每帧图像中每个面部图像信息的第一吸烟识别结果的数量和第一阈值范围,确定每帧图像的第二吸烟识别结果,最后,将N帧图像的N个吸烟识别结果为目标识别结果的数量与第二阈值范围进行比较,来确定所述第一预设时长内是否包括吸烟行为,可有效提高识别吸烟行为的准确率。

基于相同的发明构思,本申请还提供了与上述行为检测方法对应的行为检测设备400。具体结合图3进行详细说明。

图4示出了本申请一个实施例提供的行为检测设备的结构示意图。如图4所示,该设备可以包括处理器401以及存储有计算机程序指令的存储器402。

具体地,上述处理器401可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。

存储器402可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器402可以包括可移除或不可移除(或固定)的介质,或者存储器402是非易失性固态存储器。存储器402可在行为检测设备的内部或外部。

存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。

处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现本申请实施例所描述的方法,并达到本申请实施例执行其方法达到的相应技术效果,为简洁描述在此不再赘述。

在一个示例中,该行为检测设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。

通信接口403,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。

总线410包括硬件、软件或两者,将在线信息流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。

该行为检测设备可以执行本申请实施例中的行为检测方法,从而实现本申请实施例描述的行为检测方法的相应技术效果。

另外,结合上述实施例中的行为检测方法,本申请实施例可提供一种可读存储介质来实现。该可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种行为检测方法。可读存储介质的示例可以是非暂态机器可读介质,如电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、软盘、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光盘、硬盘等。

需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。

以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除只读存储器(Erasable ReadOnly Memory,EROM)、软盘、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。

另外,结合上述实施例中的行为检测方法、装置,以及可读存储介质,本申请实施例可提供一种计算机程序产品来实现。所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行上述实施例中的任意一种行为检测方法。

上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。

以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

技术分类

06120114694674