掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及安全监控领域,尤指一种人工智能识别危险行为方法、装置、电子设备和存储介质。

背景技术

目前的安监环境所部署的系统,无法针对现场人员的行为进行管控。特别是在安监环境下部署的监控系统没有人员行为的检测功能,但是一些危险行为,如:抽烟、打电话,非常容易引发安全事故。然而,针对现场人员的行为,尤其是抽烟、打电话等危险行为如何进行分辨,缺乏有效的技术手段和方法。

发明内容

本发明的目的是提供一种人工智能识别危险行为方法、装置、电子设备和存储介质,解决上述问题。

本发明提供的技术方案如下:

一方面,提供一种人工智能识别危险行为方法,包括:

对实时获取的待检测图片进行人脸检测,得到每个所述待检测图片的人脸位置框;

通过对所述人脸位置框进行区域放大的预处理操作,获得放大后的人脸位置框;

同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片;

其中,所述危险行为包括吸烟行为和/或打电话行为。

进一步优选地,所述对实时获取的待检测图片进行人脸检测,得到每个所述待检测图片的人脸位置框,包括:

通过人脸检测器对所述待检测图片进行人脸检测,提取所述待检测图片中至少一个人脸位置框。

进一步优选地,所述通过对所述人脸位置框进行区域放大的预处理操作,获得放大后的人脸位置框,包括:

从所述人脸位置框的中心位置向外扩展预设比例,以获得反放大后的人脸位置框。

进一步优选地,所述同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片,包括:

通过MobileNetV2识别器同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片。

进一步优选地,在所述通过MobileNetV2识别器同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片之前,包括:

将样本图片进行预处理,得到样本危险行为特征图;

利用样本危险行为特征图和损失函数,训练所述MobileNetV2识别器;

其中,所述损失函数为交叉熵损失函数,公式为:

其中,C为当前分类任务的类别个数;p

一种人工智能识别危险行为装置,包括:

人脸检测模块,用于对实时获取的待检测图片进行人脸检测,得到每个所述待检测图片的人脸位置框;

图片预处理模块,用于通过对所述人脸位置框进行区域放大的预处理操作,获得放大后的人脸位置框;

识别模块,用于同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片;

其中,所述危险行为包括吸烟行为和/或打电话行为。

进一步优选地,所述人脸检测模块,还用于:

通过人脸检测器对所述待检测图片进行人脸检测,提取所述待检测图片中至少一个人脸位置框。

进一步优选地,所述图片预处理模块,还用于:

从所述人脸位置框的中心位置向外扩展预设比例,以获得反放大后的人脸位置框。

进一步优选地,所述识别模块,还用于:

通过MobileNetV2识别器同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片。

进一步优选地,还包括训练模块,用于:

将样本图片进行预处理,得到样本危险行为特征图;

利用样本危险行为特征图和损失函数,训练所述MobileNetV2识别器;

其中,所述损失函数为交叉熵损失函数,公式为:

其中,C为当前分类任务的类别个数;p

另一方面,还提供一种电子设备,所述电子设备包括:

处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述人工智能识别危险行为方法。

另一方面,还提供一种存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现所述人工智能识别危险行为方法所执行的操作。

本发明提供的一种人工智能识别危险行为方法、装置、电子设备和存储介质至少具有以下技术效果:

通过本发明能够针对已经检测到的现场人员,进行是否在抽烟、是否在打电话这两种危险行为的分辨,帮助安监环境的系统更好的对于现场人员的这两种危险行为进行检测,并记录在案。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细说明:

图1是本发明的一种人工智能识别危险行为方法的实施例一的示意图;

图2是本发明的一种人工智能识别危险行为方法的实施例二的示意图;

图3是本发明的一种人工智能识别危险行为装置的结构示意图;

图4是本发明的电子设备的结构示意图。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。

还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。

实施例一

本实施例提供一种人工智能识别危险行为方法,如图1所示,包括:

S100对实时获取的待检测图片进行人脸检测,得到每个所述待检测图片的人脸位置框。

具体的,在监控场景下实时获取被监控人员的待检测图片,其中,待检测图片中包含了被监控人员的脸部图像。通过对待检测图片进行人脸检测,获取在待检测图片中被监控人员的人脸位置,即待检测图片中的人脸区域。

S200通过对所述人脸位置框进行区域放大的预处理操作,获得放大后的人脸位置框。

具体的,根据输入的人脸位置,对其区域进行放大,使得检测的效率更高以及检测的精度更高。

示例性的,具体方法为从检测框的中心位置向外扩展2w*2h,将这个放大后的人脸区域从原始图片中抠取出来。

其中,w和h代表原始的人脸框的宽和高,既最终的区域为原始检测出的人脸区域(检测框)的2倍。

S300同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片。

其中,所述危险行为包括吸烟行为和/或打电话行为。

在本实施例中,为了实时监控安监环境下的被监控人员的行为是否会引发安全事故,特别对抽烟行为和打电话行为进行识别。为了避免识别出现错误,本实施例仅针对烟和电话在人脸附近的时候,将此认定为危险行为。

需要说明的是,如果被监控人员出现吸烟行为和/或打电话行为时,就要进行及时的预警以及通知进行被监控人员的管理。

在本实施例中,通过卷积神经网络的图片分类功能,以达到并行的分辨被监控人员是否在抽烟与打电话。

实施例二

基于上述实施例,在本实施例中与上述实施例相同的部分就不一一赘述了,本实施例提供一种人工智能识别危险行为方法,如图2所示,具体包括:

优选地,步骤S100所述对实时获取的待检测图片进行人脸检测,得到每个所述待检测图片的人脸位置框,包括:

通过人脸检测器对所述待检测图片进行人脸检测,提取所述待检测图片中至少一个人脸位置框。

具体的,在系统中包括人脸检测模块:使用人脸检测器(RetinaNet)对于输入的图片进行人脸检测,提取出图片中所有人脸的位置框,输送给图片预处理模块。

优选地,步骤S200所述通过对所述人脸位置框进行区域放大的预处理操作,获得放大后的人脸位置框,包括:

从所述人脸位置框的中心位置向外扩展预设比例,以获得反放大后的人脸位置框。

具体的,在系统中包括图片预处理模块:根据输入的人脸位置,对其区域进行放大,具体方法为:从检测框的中心位置向外扩展2w*2h(w和h代表原始的人脸框的宽和高),既最终的区域为原始检测出的人脸区域(检测框)的2倍,最后将这个放大后的人脸区域从原始图片中扣取出来。

优选地,所述同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片,包括:

通过MobileNetV2识别器同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片。

具体的,打电话分辨模块:使用打电话识别器(MobileNetV2),对完成预处理后的人脸进行识别。识别器会输出两个结果:输入的人脸在打电话的概率与输入的人脸没有在打电话的概率。当在打电话的概率高于没有在打电话的概率时,模块输出人脸在打电话;反之则人脸没有在打电话。

抽烟分辨模块:使用抽烟识别器(MobileNetV2),对完成预处理后的人脸进行识别。识别器会输出两个结果:输入的人脸在抽烟的概率与输入的人脸没有在抽烟的概率。当在抽烟的概率高于没在抽烟的概率,模块输出人脸在抽烟;反之则人脸没有在抽烟。

其中,抽烟与打电话的识别器均使用了MobileNetV2,只是在训练是使用了不同的数据。

具体的,MobileNetv2架构是基于倒置残差结构(inverted residualstructure),原本的残差结构的主分支是有三个卷积,两个逐点卷积通道数较多,而倒置的残差结构刚好相反,中间的卷积通道数(依旧使用深度分离卷积结构)较多,旁边的较小。此外,去除主分支中的非线性变换是有效的,这可以保持模型表现力。

在本实施例中,通过使用MobileNetv2架构保留了该模型的简单性,显著的提高了其准确性,达到了针对移动应用的分类和检测应用的先进水平。

优选地,在所述通过MobileNetV2识别器同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片之前,包括:

将样本图片进行预处理,得到样本危险行为特征图;

利用样本危险行为特征图和损失函数,训练所述MobileNetV2识别器;

其中,所述损失函数为交叉熵损失函数,公式为:

其中,C为当前分类任务的类别个数;p

示例性的,训练数据先使用数据预处理模块进行处理,随后将图片输入网络进行训练。

训练使用的损失函数为交叉熵损失函数,公式为:

其中C为当前分类任务的类别个数。p

在本实施例中,本发明提出一种利用人工智能的物体识别技术进行是否在抽烟和打电话的方法。这种方法能够针对已经检测到的现场人员进行是否在抽烟、是否在打电话这两种危险行为进行分辨。

本实施例也可以帮助安监环境的系统更好的对于现场人员的这两种危险行为进行检测,并记录在案。

实施例三

基于上述实施例,在本实施例中与上述实施例相同的部分就不一一赘述了,本实施例提供一种人工智能识别危险行为装置,如图3所示,包括:

人脸检测模块301,用于对实时获取的待检测图片进行人脸检测,得到每个所述待检测图片的人脸位置框。

图片预处理模块302,用于通过对所述人脸位置框进行区域放大的预处理操作,获得放大后的人脸位置框。

识别模块303,用于同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片。

其中,所述危险行为包括吸烟行为和/或打电话行为。

示例性的,本发明的目的是为了提供一种通过卷积神经网络的图片分类功能,以达到分辨被监控人员是否在抽烟与打电话。

本发明的目的是通过以下技术方案实现的:

人脸检测模块、图片预处理模块、打电话分辨模块、抽烟分辨模块。

具体的,人脸检测模块:使用人脸检测器(RetinaNet)对于输入的图片进行人脸检测,提取出图片中所有人脸的位置框,输送给图片预处理模块。

示例性的,图片预处理模块:根据输入的人脸位置,对其区域进行放大:方法为从检测框的中心位置向外扩展2w*2h(w和h代表原始的人脸框的宽和高),既最终的区域为原始检测出的人脸区域(检测框)的2倍。将这个放大后的人脸区域从原始图片中扣取出来。

其中,识别模块包括打电话分辨模块和抽烟分辨模块。

打电话分辨模块:使用打电话识别器(MobileNetV2),对完成预处理后的人脸进行识别。识别器会输出两个结果:输入的人脸在打电话的概率与输入的人脸没有在打电话的概率。当在打电话的概率高于没有在打电话的概率时,模块输出人脸在打电话;反之则人脸没有在打电话。

抽烟分辨模块:使用抽烟识别器(MobileNetV2),对完成预处理后的人脸进行识别。识别器会输出两个结果:输入的人脸在抽烟的概率与输入的人脸没有在抽烟的概率。当在抽烟的概率高于没在抽烟的概率,模块输出人脸在抽烟;反之则人脸没有在抽烟。

抽烟与打电话的识别器均使用了MobileNetV2,只是在训练是使用了不同的数据。

示例性的,训练数据先使用数据预处理模块进行处理,随后将图片输入网络进行训练。

训练使用的损失函数为交叉熵损失函数,公式为:

其中C为当前分类任务的类别个数。p

优选地,所述人脸检测模块,还用于:

通过人脸检测器对所述待检测图片进行人脸检测,提取所述待检测图片中至少一个人脸位置框。

优选地,所述图片预处理模块,还用于:

从所述人脸位置框的中心位置向外扩展预设比例,以获得反放大后的人脸位置框。

优选地,所述识别模块,还用于:

通过MobileNetV2识别器同步识别所述放大后的人脸位置框中包含危险行为特征的待检测图片。

优选地,还包括训练模块,用于:

将样本图片进行预处理,得到样本危险行为特征图。

利用样本危险行为特征图和损失函数,训练所述MobileNetV2识别器。

其中,所述损失函数为交叉熵损失函数,公式为:

其中,C为当前分类任务的类别个数;p

在本实施例中,本发明提出一种利用人工智能的物体识别技术进行是否在抽烟和打电话的装置。这种装置能够针对已经检测到的现场人员进行是否在抽烟、是否在打电话这两种危险行为进行分辨。

本实施例也可以帮助安监环境的系统更好的对于现场人员的这两种危险行为进行检测,并记录在案。

另一方面,如图4所示,本发明提供一种电子设备100,包括处理器110、存储器120,其中,存储器120,用于存放计算机程序121;处理器110,用于执行存储器120上所存放的计算机程序121,实现上述所对应方法实施例中的方法。

所述电子设备100可以为桌上型计算机、笔记本、掌上电脑、平板型计算机、手机、人机交互屏等设备。所述电子设备100可包括,但不仅限于处理器110、存储器120。本领域技术人员可以理解,图4仅仅是电子设备100的示例,并不构成对电子设备100的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,示例性的:电子设备100还可以包括输入/输出接口、显示设备、网络接入设备、通信总线、通信接口等。通信接口和通信总线,还可以包括输入/输出接口,其中,处理器110、存储器120、输入/输出接口和通信接口通过通信总线完成相互间的通信。该存储器120存储有计算机程序121,该处理器110用于执行存储器120上所存放的计算机程序121,实现上述所对应方法实施例中的方法。

所述处理器110可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器120可以是所述电子设备100的内部存储单元,示例性的:电子设备的硬盘或内存。所述存储器也可以是所述电子设备的外部存储设备,示例性的:所述电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器120还可以既包括所述电子设备100的内部存储单元也包括外部存储设备。所述存储器120用于存储所述计算机程序121以及所述电子设备100所需要的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。

通信总线是连接所描述的元素的电路并且在这些元素之间实现传输。示例性的,处理器110通过通信总线从其它元素接收到命令,解密接收到的命令,根据解密的命令执行计算或数据处理。存储器120可以包括程序模块,示例性的,内核(kernel),中间件(middleware),应用程序编程接口(Application Programming Interface,API)和应用。该程序模块可以是有软件、固件或硬件、或其中的至少两种组成。输入/输出接口转发用户通过输入/输出接口(示例性的,感应器、键盘、触摸屏)输入的命令或数据。通信接口将所述电子设备100与其它网络设备、用户设备、网络进行连接。示例性的,通信接口可以通过有线或无线连接到网络以连接到外部其它的网络设备或用户设备。无线通信可以包括以下至少一种:无线保真(WiFi),蓝牙(BT),近距离无线通信技术(NFC),全球卫星定位系统(GPS)和蜂窝通信等等。有线通信可以包括以下至少一种:通用串行总线(USB),高清晰度多媒体接口(HDMI),异步传输标准接口(RS-232)等等。网络可以是电信网络和通信网络。通信网络可以为计算机网络、因特网、物联网、电话网络。电子设备100可以通过通信接口连接网络,电子设备100和其它网络设备通信所用的协议可以被应用、应用程序编程接口(API)、中间件、内核和通信接口至少一个支持。

另一方面,本发明提供一种存储介质,所述存储介质中存储有至少一条指令,指令由处理器加载并执行以实现上述方法对应实施例所执行的操作。示例性的,存储介质可以是只读内存(ROM)、随机存取存储器(RAM)、只读光盘(CD-ROM)、磁带、软盘和光数据存储设备等。

它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述或记载的部分,可以参见其他实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其他的方式实现。示例性的,以上所描述的装置/电子设备实施例仅仅是示意性的,示例性的,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,示例性的,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性、机械或其他的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可能集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序121发送指令给相关的硬件完成,所述的计算机程序121可存储于一存储介质中,该计算机程序121在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序121可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述存储介质可以包括:能够携带所述计算机程序121的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,示例性的,在某些司法管辖区,根据立法和专利实践,计算机可读的存储介质不包括电载波信号和电信信号。

应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 人工智能识别危险行为方法、装置、电子设备和存储介质
  • 基于人工智能的目标识别方法、装置、电子设备及介质
技术分类

06120112985355