掌桥专利:专业的专利平台
掌桥专利
首页

活体检测模型的训练方法、活体检测方法及相关设备

文献发布时间:2024-04-18 19:59:31


活体检测模型的训练方法、活体检测方法及相关设备

技术领域

本申请涉及图像处理领域,尤其涉及一种活体检测模型的训练方法、活体检测方法及相关设备。

背景技术

静默活体检测是指在人脸核验系统的活体检测环节中,无需用户配合,人脸核验系统通过拍摄用户的图像或视频,基于单帧或多帧图像来判定图像中的人脸是否来自真人,亦或是假体人脸(包括打印的纸质人脸图像、电子屏中展示的人脸图像或视频、各类材质的3D人脸面具、头模、头套等)。

目前的活体检测方案,通常先利用样本人脸图像的图像特征进行模型训练,再利用训练出的活体检测模型对待检测的人脸图像进行活体检测。然而,对于拍摄条件受限的应用场景,用户只能使用手机进行身份核验,活体检测环节只能通过手机摄像头拍摄用户的人脸图像或视频,且图像通常是RGB图像,无法通过近红外、3D结构光等相机获取安全性校验能力更高的近红外或3D人脸图像,所以难以从样本人脸图像中提取能够用于活体/非活体人脸判别的有效特征,使得模型训练过程中无法充分学习活体/非活体人脸图像间的差异,导致训练出的活体检测模型的检测能力较弱,进而影响活体检测准确性。

发明内容

本申请实施例的目的提供一种活体检测模型的训练方法、活体检测方法及相关设备,用于解决目前的活体检测模型的检测能力弱而影响活体检测结准确性的问题。

为了实现上述目的,本申请实施例采用下述技术方案:

第一方面,本申请实施例提供一种活体检测模型的训练方法,包括:

获取训练数据,所述训练数据包括样本人脸图像、所述样本人脸图像对应的活体标签、所述样本人脸图像经过频域变换所得的第一频谱图像以及基于所述第一频谱图像重构出的第一重构人脸图像;

通过活体检测模型对所述样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像;

基于所述第二频谱图像进行时域重构,得到所述样本人脸图像对应的第二重构人脸图像;

基于所述训练数据、所述样本人脸图像对应的活体检测结果和第二重构人脸图像对所述活体检测模型进行训练。

本申请实施例提供的活体检测模型的训练方法,采用具有活体检测和频域重构能力的活体检测模型,利用活体检测模型对样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像,并对第二频谱图像进行时域重构,得到第二重构人脸图像;由于活体/非活体人脸图像之间无论是在频谱上还是在基于频谱重构后的时域上均存在明显差异,且这种差异无论是在RGB图像还是近红外图像、3D图像上均较为明显,基于训练数据、样本人脸对应的活体检测结果和第二重构人脸图像对活体检测模型进行训练,相当于在活体/非活体人脸在时域上的图像特征基础上,引入了频域和重构时域上的信号来辅助监督活体检测模型的训练,更加有效的迫使活体检测模型间接、充分学习到在频域上针对活体/非活体人脸图像间的可区分特征,使得活体检测模型的特征表达能力得到增强,提高活体检测模型的泛化能力,从而提高活体检测模型的活体检测能力。

第二方面,本申请实施例提供一种活体检测方法,包括:

获取待检测的目标人脸图像;

通过目标活体检测模型对所述目标人脸图像进行活体检测,得到活体检测结果,其中,所述目标活体检测模型为基于第一方面所述的活体检测模型的训练方法对活体检测模型进行训练得到。

本申请实施例提供的活体检测方法,由于上述训练方法训练得到的目标活体检测模型具有很强的活体检测能力,通过目标活体模型对待检测的目标人脸图像进行活体检测,可以提高活体检测准确性。

第三方面,本申请实施例提供一种活体检测模型的训练装置,包括:

获取单元,用于获取训练数据,所述训练数据包括样本人脸图像、所述样本人脸图像对应的活体标签、所述样本人脸图像经过频域变换所得的第一频谱图像以及基于所述第一频谱图像时域重构出的第一重构人脸图像;

处理单元,用于通过活体检测模型对所述样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像;

重构单元,用于基于所述第二频谱图像进行时域重构,得到所述样本人脸图像对应的第二重构人脸图像;

训练单元,用于基于所述训练数据、所述样本人脸图像对应的活体检测结果和第二重构人脸图像对所述活体检测模型进行训练。

第四方面,本申请实施例提供一种活体检测装置,包括:

获取单元,用于获取待检测的目标人脸图像;

检测单元,用于通过目标活体检测模型对所述目标人脸图像进行活体检测,得到活体检测结果,其中,所述目标活体检测模型为基于第一方面所述的活体检测模型的训练方法对活体检测模型进行训练得到。

第五方面,本申请实施例提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面或第二方面所述的方法。

第六方面,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面或第二方面所述的方法。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请的一个实施例提供的一种活体检测模型的训练方法的流程示意图;

图2为本申请的另一个实施例提供的一种活体检测模型的训练方法的流程示意图;

图3为本申请的一个实施例提供的一种活体检测方法的流程示意图;

图4为本申请的另一个实施例提供的一种活体检测方法的流程示意图;

图5A为本申请的一个实施例提供的一种应用场景下的活体检测方法的流程示意图;

图5B为本申请的另一个实施例提供的一种应用场景下的活体检测方法的流程示意图;

图6为本申请的一个实施例提供的一种活体检测模型的训练装置的结构示意图;

图7为本申请的一个实施例提供的一种活体检测装置的结构示意图;

图8为本申请的一个实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应理解,这样使用的数据在适当情况下可以互换,以便本申请实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本说明书和权利要求书中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。

本申请实施例旨在提出一种活体检测模型的训练方法,由于活体/非活体人脸图像之间无论是在频谱上还是在基于频谱重构后的时域上均存在明显差异,且这种差异无论是在RGB图像还是近红外图像、3D图像上均较为明显,因而在利用活体/非活体人脸在时域上的图像特征进行模型训练的基础上,还引入频域和重构时域上的信号来辅助监督活体检测模型的训练,以更加有效的迫使活体检测模型间接、充分学习到在频域上针对活体/非活体人脸图像间的可区分特征,增强活体检测模型的特征表达能力,提高活体检测模型的泛化能力,从而提高活体检测模型的活体检测能力。

基于上述训练出的目标活体检测模型,本申请实施例还提出一种活体检测方法,由于目标活体检测模型具有很强的活体检测能力,通过目标活体模型对待检测的目标人脸图像进行活体检测,可以提高活体检测准确性。

应理解,本申请实施例提供的活体检测模型的训练方法和活体检测方法均可以由电子设备或安装在电子设备中的软件执行。此处所谓的电子设备可以包括终端设备,比如智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端、飞行器等;或者,电子设备还可以包括服务器,比如独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。

以下结合附图,详细说明本申请各实施例提供的技术方案。

请参见图1,为本申请的一个实施例提供的一种活体检测模型的训练方法的流程示意图,该方法可以包括如下步骤:

S102,获取训练数据。

其中,训练数据包括样本人脸图像、样本人脸图像对应的活体标签、样本人脸图像经过频域变换所得的第一频谱图像以及基于第一频谱图像时域重构出的第一重构人脸图像。样本人脸图像对应的活体标签用于表示样本人脸图像中的人脸是否为活体人脸。

对样本人脸图像进行频域变换是指将样本人脸图像从时域变换到频域。对样本人脸图像进行频域变换,可通过本领域常用的各种频域变换方法实现,比如傅里叶变换(Fourier Transform,FFT)等,由此得到第一频谱图像。第一频谱图像可以反映样本人脸图像的频率分布情况。对第一频谱图像进行时域重构,是指将第一频谱图像从频域变换到时域。对第一频谱图像进行时域重构可通过各种适当的方式实现,本申请实施例对此不作限定。可选地,结合图2,可将预设窗函数与第一频谱图像进行点积运算,以对第一频谱图像进行截断,得到截断后的频谱图像;然后,对阶段后的频谱图像进行逆傅里叶变换(InverseFourier transform,IFFT),得到第一重构人脸图像。

更为具体地,考虑到活体/非活体人脸图像间在低频信号上呈现出的差异较为明显,因而低频信号是用于区分活体/非活体人脸的有效频域特征,但经过频域变换后得到的第一频谱图像中,高频信号位于中心位置,而低频信号位于边缘位置,不利于后续的截断处理和逆傅里叶变换。基于此,在基于第一频谱图像进行时域重构的过程中,可先对第一频谱图像进行频谱居中处理,使得有用的低频信号位于中心位置,而无用的高频信号位于边缘位置,得到低频信号集中的中心化频谱图像;然后,通过对该中心化频谱图像进行低通滤波,可以阻隔和减弱高频信号,仅保留有用的低频信号;在此基础上,将预设窗函数与经过低通滤波后的中心化频谱图像进行点积运算,即可实现对频谱图像中有效低频信号的截断,有利于准确重构出具有有用特征的第一重构人脸图像。

实际应用中,在低通滤波过程中,可通过调节用于低通滤波的滤波器的参数来实现第一重构人脸图像的平滑度,进而控制模型训练过程中监督信号的强弱。第一重构人脸图像越平滑,在模型训练过程中提供的监督信号越弱,活体检测模型越容易拟合,活体检测模型的特征提取能力也相对较弱。因此,可根据实际训练过程,为滤波器选择合适的参数。

预设窗函数可以根据实际需要进行设置,比如矩形窗函数或者高斯窗函数。其中,矩形窗函数的宽度决定了边缘截断间距d的大小,矩形窗函数通过调节边缘截断间距d来控制滤波带宽,d越大,保留的低频信号越少,经IFFT后的第一重构人脸图像越模糊,反之越清晰。因此,可基于第一重构人脸图像所需满足的目标图像清晰度,为矩形窗函数设置合适的宽度。

类似地,高斯窗函数的宽度影响均方差(Standard Deviation,STD)的大小,高斯窗函数通过调节均方差来控制滤波带宽,均方差越小,保留的低频信号越少,经过IFFT后的第一重构人脸图像越模糊,反之越清晰。因此,可基于第一重构人脸图像所需满足的目标图像清晰度,为高斯窗函数设置合适的宽度。

可以理解的是,在时域重构过程中,通过预设窗函数对经过第一频谱图像进行截断,一方面可以减少信号处理开销,提高信号处理效率;另一方面可以减少频谱能量泄露,在此基础上进行逆傅里叶变换,可以提高时域重构精确度,且使得第一重构人脸图像具有有效的可区分特征。

值的说明的是,为了提高活体检测模型的训练效果,在对训练数据执行后续训练步骤之前,还可对样本人脸图像进行预处理,具体可以例如包括但不限于人脸检测、人脸对齐、人脸裁剪、图像归一化等。

S104,通过活体检测模型对样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像。

本申请实施例中的活体检测模型具备了活体检测能力和频域重构能力,其既能够对样本人脸图像进行活体检测以得到活体检测结果,又能够对样本人脸图像进行频域重构以得到第二频谱图像,其中,对样本人脸图像进行频域重构是指将样本人脸图像从时域变换到频域。样本人脸图像的活体检测结果用于表示样本人脸图像中的人脸是否为活体人脸,实际应用中,在样本人脸图像中的人脸为非活体人脸的情况下,还可将活体检测结果细分为不同攻击类型的人脸,比如纸质打印人脸、电子屏呈现人脸、3D打印面具、3D打印头模、3D打印头套等。若要对实现非活体人脸的细分,样本人脸图像对应的活体标签可采用二级标签,第一级标签用于表示样本人脸图像中的人脸是否为活体,第二级标签用于表示非活体人脸对应的攻击类型。第二频谱图像用于表示样本人脸图像的频谱分布情况。

具体地,上述S104可以包括如下步骤:对样本人脸图像的图像特征进行编码,得到样本人脸图像的特征向量;基于样本人脸图像的特征向量对样本人脸图像中的人脸进行分类,得到活体检测结果;基于样本人脸图像的特征向量进行频域重构,得到第二频谱图像。

本申请实施例中的活体检测模型可以具有任意适当的结构,具体可根据实际需要进行设置,本申请实施例对此不作限定。可选地,如图2所示,为了在简化活体检测模型的结构的前提下实现活体检测和频域重构,活体检测模型可以包括编码网络、解码网络和分类网络。其中,编码网络具有编码能力,能够提取出图像的图像特征并映射为一个低维向量,该低维向量即为对图像的压缩特征的表达,也称为特征向量;解码网络具有频域重构能力,能够基于编码网络输出的低维向量重构一个频谱图像;分类网络具有分类能力,能够基于编码网络输出的低维向量对图像中的人脸进行分类,实现对图像的活体检测。

相应地,在上述S104中,如图2所示,通过编码网络对样本人脸图像的图像特征进行编码,得到样本人脸图像的特征向量;通过分类网络基于样本人脸图像的特征向量对样本人脸图像中的人脸进行分类,得到活体检测结果;解码网络基于样本人脸图像的特征向量进行频域重构,得到第二频谱图像。

实际应用中,编码网络、解码网络以及分类网络的具体结构均可根据实际需要进行设置,本申请实施例对此不作限定。示例地,编码网络可以为卷积神经网络(Convolutional Neural Network,CNN)或VIT(vision transformer),解码网络可以为反卷积神经网络,分类网络可以包括若干个依次相连的全连接层。

另外,为了使编码网络具有更加的特征提取能力,避免让解码网络记住数据本身,从而提高活体检测模型的检测能力,解码网络相比编码网络,结构更简单。

S106,基于第二频谱图像进行时域重构,得到样本人脸图像对应的第二重构人脸图像。

对第二频谱图像进行时域重构,是指将第二频谱图像从频域变换到时域。对第二频谱图像进行时域重构可采用各种适当的方式实现,具体可根据实际需要进行选择,本申请实施例对此不作限定。

在一种可选的实现方式中,结合图2,上述S106可以包括:将预设窗函数与第二频谱图像进行点积运算,得到第三频谱图像,以及对第三频谱图像进行逆傅里叶变换,得到第二重构人脸图像。

更为具体地,考虑到活体/非活体人脸图像间在低频信号上呈现出的差异较为明显,因而低频信号是用于区分活体/非活体人脸的有效频域特征,但经过频域变换后得到的第二频谱图像中,高频信号位于中心位置,而低频信号位于边缘位置,不利于后续的截断处理和逆傅里叶变换。基于此,在基于第二频谱图像进行时域重构的过程中,可先对第二频谱图像进行频谱居中处理,使得有用的低频信号位于中心位置,而无用的高频信号位于边缘位置,得到低频信号集中的中心化频谱图像;然后,通过对该中心化频谱图像进行然后,通过对该中心化频谱图像进行低通滤波,可以阻隔和减弱高频信号,仅保留有用的低频信号,得到第三频谱图像;在此基础上,将预设窗函数与第三频谱图像进行点积运算,即可实现对频谱图像中有效低频信号的截断,有利于准确重构出具有有用特征的第二重构人脸图像。

实际应用中,在低通滤波过程中,可通过调节用于低通滤波的滤波器的参数来实现第二重构人脸图像的平滑度,进而控制模型训练过程中监督信号的强弱。第二重构人脸图像越平滑,在模型训练过程中提供的监督信号越弱,活体检测模型越容易拟合,活体检测模型的特征提取能力也相对较弱。因此,可根据实际训练过程,为滤波器选择合适的参数。

预设窗函数可以根据实际需要进行设置,比如矩形窗函数或者高斯窗函数。预设窗函数的宽度为基于第二重构人脸图像所需满足的目标图像清晰度确定。具体地,矩形窗函数的宽度决定了边缘截断间距d的大小,矩形窗函数通过调节边缘截断间距d来控制滤波带宽,d越大,保留的低频信号越少,经IFFT后的第二重构人脸图像越模糊,反之越清晰。因此,可基于第二重构人脸图像所需满足的目标图像清晰度,为矩形窗函数设置合适的宽度。

类似地,高斯窗函数的宽度影响均方差的大小,高斯窗函数通过调节均方差来控制滤波带宽,均方差越小,保留的低频信号越少,经过IFFT后的第二重构人脸图像越模糊,反之越清晰。因此,可基于第二重构人脸图像所需满足的目标图像清晰度,为高斯窗函数设置合适的宽度。

可以理解的是,在时域重构过程中,通过预设窗函数对第二频谱图像进行截断,一方面可以减少信号处理开销,提高信号处理效率;另一方面可以减少频谱能量泄露,在此基础上进行逆傅里叶变换,可以提高时域重构精确度,且使得第二重构人脸图像具有有效的可区分特征。

S108,基于训练数据、样本人脸图像对应的活体检测结果和第二重构人脸图像对活体检测模型进行训练。

具体地,可基于训练数据、样本人脸图像对应的活体检测结果和第二重构人脸图像,确定活体检测模型的预测损失;然后,基于活体检测模型的预测损失,调整活体检测模型的模型参数。

其中,活体检测模型的预测损失用于反映活体检测模型针对样本人脸图像输出的结果与预期结果之间的差异,其可以反映活体检测模型的训练效果。活体检测模型的模型参数可以包括编码网络的网络参数、解码网络的网络参数以及分类网络的网络参数,各网络的网络参数用于表示各网络的结构,比如各网络中的网络层数量、各网络层中的节点数量以及不同节点之间的连接关系等。

由于活体/非活体人脸图像无论是在原时域上的特征,还是在频域上的频谱特征以及重构时域上的特征均存在差异,因而可在确定活体检测模型的预测损失时,引入原时域、频域以及重构时域这三个维度上的损失,从而使得了使活体检测模型能够充分学习活体/非活体人脸图像间在多个维度的可区分特征,进一步增强活体检测模型的特征表达能力,提高活体检测模型的泛化能力,从而提高活体检测模型的活体检测能力。

具体地,结合图2,上述S108可以包括如下步骤:基于样本人脸图像对应的活体标签和活体检测结果,确定活体检测模型的分类损失;基于第一频谱图像和第二频谱图像,确定活体检测模型的频域重构损失;基于第一重构人脸图像和第二重构人脸图像,确定活体检测模型的时域重构损失;基于分类损失、频域重构损失以及时域重构损失,调整活体检测模型的模型参数。

其中,活体检测模型的分类损失用于表示样本人脸图像对应的活体标签与活体检测结果之间的差异,其可以反映活体检测模型执行活体检测的效果。示例地,可计算样本人脸图像对应的活体标签与活体检测结果之间的均方误差(Mean Square Error,MSE),作为活体检测模型的分类损失。

活体检测模型的频域重构损失用于表示第一频谱图像和第二频谱图像之间的差异,其可以反映活体检测模型执行频域重构的效果。示例地,可计算第一频谱图像与第二频谱图像之间的均方误差,作为活体检测模型的频域重构损失。

活体检测模型的时域重构损失用于表示第一重构人脸图像与第二重构人脸图像之间的差异,其可以反映基于活体检测模型的频域重构结果执行时域重构的效果。示例地,可采用交叉熵损失函数,计算第一重构人脸图像与第二重构人脸图像之间的交叉熵损失,作为活体检测模型的时域重构损失。

对分类损失、频域重构损失以及时域重构损失进行加权求和,即可得到活体检测模型的预测损失。进一步,可采用本领域常用的参数调整方式,比如反向传播算法、梯度下降算法等,分别对分类网络的网络参数、编码网络的网络参数以及分类网络的网络参数进行调整。

值的说明的是,上述S104~S108仅为活体检测模型的一次训练过程。实际应用中,需要对活体检测模型执行多次训练,因而可重复上述S104~S108多次,直至满足预设训练停止条件。此时,最后一次训练得到的活体检测模型即可作为用于对任一人脸图像进行活体检测的目标活体检测模型。其中,预设训练停止条件可以根据实际需要进行设置,比如训练次数达到预设次数阈值或者活体检测模型的预测损失收敛等,本申请实施例对此不作限定。

本申请的一个或多个实施例提供的活体检测模型的训练方法,采用具有活体检测和频域重构能力的活体检测模型,利用活体检测模型对样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像,并对第二频谱图像进行时域重构,得到第二重构人脸图像;由于活体/非活体人脸图像之间无论是在频谱上还是在基于频谱重构后的时域上均存在明显差异,且这种差异无论是在RGB图像还是近红外图像、3D图像上均较为明显,基于训练数据、样本人脸对应的活体检测结果和第二重构人脸图像对活体检测模型进行训练,相当于在活体/非活体人脸在时域上的图像特征基础上,引入了频域和重构时域上的信号来辅助监督活体检测模型的训练,更加有效的迫使活体检测模型间接、充分学习到在频域上针对活体/非活体人脸图像间的可区分特征,使得活体检测模型的特征表达能力得到增强,提高活体检测模型的泛化能力,从而提高活体检测模型的活体检测能力。

本申请实施例还提供一种活体检测方法,能够基于上述活体检测模型的训练方法训练得到的目标活体检测模型,基于任一人脸图像进行静默活体检测。请参见图3,为本申请的一个实施例提供的一种活体检测方法的流程示意图,该方法可以包括如下步骤:

S302,获取待检测的目标人脸图像。

其中,待检测的目标人脸图像可以是单张人脸图像,也可以是采集的视频流中的一帧人脸图像。

S304,通过目标活体检测模型对所述目标人脸图像进行活体检测,得到活体检测结果。

在一种可选的实现方式中,对目标人脸图像的图像特征进行编码,得到目标人脸图像的特征向量,以及基于目标人脸图像的特征向量对目标人脸图像中的人脸进行分类,得到活体检测结果。其中,活体检测结果用于表示目标人脸图像中的人脸是否为活体人脸。可选地,在目标人脸图像中的人脸为非活体人脸的情况下,活体检测结果还可以表示目标人脸图像中的人脸对应的攻击类型,比如纸质打印人脸、电子屏呈现人脸、3D打印面具、3D打印头模、3D打印头套等。

可以理解的是,在上述实现方式中,不需要对目标人脸图像进行频域重构和时域重构等处理,因而不会带来额外的计算开销,也不会增加额外的检测耗时,可以在确保检测准确性的前提下提高检测效率,适用于在移动终端部署。

更为具体地,如图4所示,在上述S304中,可通过编码网络对目标人脸图像的图像特征进行编码,得到目标人脸图像的特征向量,以及通过分类网络基于目标人脸图像的特征向量对目标人脸图像中的人脸进行分类,得到活体检测结果。由此,并不需要使用解码网络对目标人脸图像进行频域重构和时域重构等处理,因而不会带来额外的计算开销,也不会增加额外的检测耗时,可以在确保检测准确性的前提下提高检测效率,适用于在移动终端部署。

在此仅示出了上述S304的一种实现方式。当然,应理解,上述S304还可通过其他方式实现,比如通过解码网络对编码网络输出的特征向量进行频域重构,以及将重构所得的频谱图像与样本活体人脸图像对应的频谱图像进行比对,得到相应的活体检测结果;然后,综合该活体检测结果和分类网络输出的活体检测结果,判断目标人脸图像中的人脸是否为活体人脸。

本申请的一个或多个实施例提供的活体检测方法,由于上述训练方法训练得到的目标活体检测模型具有很强的活体检测能力,通过目标活体模型对待检测的目标人脸图像进行活体检测,可以提高活体检测准确性。

本申请实施例提供的活体检测方法可应用于各种需要活体检测的场景。

一种可选地的应用场景下,上述目标活体检测模型可部署于云端服务器,提供软件即服务(Software-as-a-Service,SaaS)。在该部署方式下,使用方可将采集的目标人脸图像发送至云端服务器,由云端服务器基于已部署的目标活体检测模型对目标人脸图像进行活体检测,得到活体检测结果并返回给使用方。

示例地,如图5A所示,目标活体检测模型、预处理模块以及接收模块可以集成在一个活体检测算法模块中并部署于云端服务器。使用方在需要进行活体检测时,将采集的目标人脸图像以文件流或base64字符串的方式,通过云端服务器提供的应用程序编程接口(Application Programming Interface,API)接口传输至云端服务器;云端服务器通过已部署的活体检测算法模块中的接收子模块,接收目标人脸图像,再通过预处理子模块对目标人脸图像进行预处理,之后通过目标活体检测模型对经过预处理的目标人脸图像进行活体检测,得到活体检测结果并返回给使用方。

在另一种可选的应用场景下,上述目标活体检测模型可封装在移动终端的指定软件开发工具包(Software Development Kit,SDK)中,供移动终端的应用程序(Application,APP)调用。在该部署方式下,可向指定SDK的接口发送目标人脸图像,以请求指定软件开发工具包基于目标活体检测模型对目标人脸图像进行活体检测,得到活体检测结果;相应地,通过指定SDK的接口接收活体检测结果。

示例地,如图5B所示,目标活体检测模型、预处理模块以及接收模块可以集成在一个活体检测算法模块集成在指定SDK中。活体检测APP在采集到目标人脸图像之后,将采集的目标人脸图像以文件流或图像编码数据的方式传递给指定SDK的接口,以请求指定SDK进行活体检测。指定SDK通过接收子模块接收目标人脸图像,再通过预处理子模块对目标人脸图像进行预处理,之后通过目标活体检测模型对经过预处理的目标人脸图像进行活体检测,得到活体检测结果并推送到指定SDK的接口;而后,活体检测APP可通过指定SDK的接口接收活体检测结果。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本申请实施例还提供一种活体检测模型的训练装置。请参见图6,为本申请的一个实施例提供的一种业务推荐模型的训练装置600的结构示意图,该装置600可以包括:

获取单元610,用于获取训练数据,所述训练数据包括样本人脸图像、所述样本人脸图像对应的活体标签、所述样本人脸图像经过频域变换所得的第一频谱图像以及基于所述第一频谱图像时域重构出的第一重构人脸图像;

处理单元620,用于通过活体检测模型对所述样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像;

重构单元630,用于基于所述第二频谱图像进行时域重构,得到所述样本人脸图像对应的第二重构人脸图像;

训练单元640,用于基于所述训练数据、所述样本人脸图像对应的活体检测结果和第二重构人脸图像对所述活体检测模型进行训练。

可选地,所述训练单元640具体用于:

基于所述样本人脸图像对应的活体标签和活体检测结果,确定所述活体检测模型的分类损失;

基于所述第一频谱图像和所述第二频谱图像,确定所述活体检测模型的频域重构损失;

基于所述第一重构人脸图像和所述第二重构人脸图像,确定所述活体检测模型的时域重构损失;

基于所述分类损失、所述频域重构损失以及所述时域重构损失,调整所述活体检测模型的模型参数。

可选地,所述重构单元630具体用于:

将预设窗函数与所述第二频谱图像进行点积运算,得到第三频谱图像;

对所述第三频谱图像进行逆傅里叶变换,得到所述第二重构人脸图像。

可选地,所述重构单元630将预设窗函数与所述第二频谱图像进行点积运算,得到第三频谱图像,包括:

对所述第二频谱图像进行频谱居中处理,得到中心化频谱图像;

对所述中心化频谱图像进行低通滤波;

将预设窗函数与经过低通滤波后的中心化频谱图像进行点积运算,得到第三频谱图像。

可选地,所述预设窗函数包括矩形窗函数或高斯窗函数,所述预设窗函数的宽度为基于所述第二重构人脸图像所需满足的目标图像清晰度确定。

可选地,所述处理单元620具体用于:

对所述样本人脸图像的图像特征进行编码,得到所述样本人脸图像的特征向量;

基于所述特征向量对所述样本人脸图像中的人脸进行分类,得到所述活体检测结果;

基于所述样本人脸图像的特征向量进行频域重构,得到所述第二频谱图像。

显然,本申请实施例提供的活体检测模型的训练装置能够作为图1所示的活体检测模型的训练方法的执行主体,例如图1所示的活体检测模型的训练方法中,步骤S102可由图6所示的活体检测模型的训练装置中的获取单元610执行,步骤S104可由图6所示的活体检测模型的训练装置中的处理单元620执行,步骤S106可由图6所示的活体检测模型的训练装置中的重构单元630执行,步骤S108可由图6所示活体检测模型的训练装置中的训练单元640执行。

本申请实施例还提供一种活体检测装置。请参见图7,为本申请的一个实施例提供的一种活体检测装置700的结构示意图,该装置700可以包括:

获取单元710,用于获取待检测的目标人脸图像;

检测单元720,用于通过目标活体检测模型对所述目标人脸图像进行活体检测,得到活体检测结果,其中,所述目标活体检测模型为基于权利要求1至6中任一项所述的活体检测模型的训练方法对活体检测模型进行训练得到。

可选地,所述检测单元720具体用于:

对所述目标人脸图像的图像特征进行编码,得到所述目标人脸图像的特征向量;

基于所述目标人脸图像的特征向量对所述目标人脸图像中的人脸进行分类,得到活体检测结果。

显然,本申请实施例提供的活体检测装置能够作为图3所示的活体检测方法的执行主体,例如图3所示的活体检测方法中,步骤S302可由图7所示的活体检测装置中的获取单元710执行,步骤S304可由图7所示的活体检测装置中的检测单元720执行。

图8是本申请的一个实施例电子设备的结构示意图。请参考图8,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成活体检测模型的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:

获取训练数据,所述训练数据包括样本人脸图像、所述样本人脸图像对应的活体标签、所述样本人脸图像经过频域变换所得的第一频谱图像以及基于所述第一频谱图像重构出的第一重构人脸图像;

通过活体检测模型对所述样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像;

基于所述第二频谱图像进行时域重构,得到所述样本人脸图像对应的第二重构人脸图像;

基于所述训练数据、所述样本人脸图像对应的活体检测结果和第二重构人脸图像对所述活体检测模型进行训练。

或者,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成活体检测装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:

获取待检测的目标人脸图像;

通过目标活体检测模型对所述目标人脸图像进行活体检测,得到活体检测结果,其中,所述目标活体检测模型为基于本申请实施例提供的活体检测模型的训练方法对活体检测模型进行训练得到。

上述如本申请图1所示实施例揭示的活体检测模型的训练装置执行的方法或者上述如本申请图3所示实施例揭示的活体检测装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。

该电子设备还可执行图1的方法,并实现活体检测模型的训练装置在图1、图2所示实施例的功能,或者,该电子设备还可执行图3的方法,并实现活体检测装置在图3、图4所示实施例的功能,本申请实施例在此不再赘述。

当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:

获取训练数据,所述训练数据包括样本人脸图像、所述样本人脸图像对应的活体标签、所述样本人脸图像经过频域变换所得的第一频谱图像以及基于所述第一频谱图像重构出的第一重构人脸图像;

通过活体检测模型对所述样本人脸图像进行活体检测和频域重构,得到活体检测结果和第二频谱图像;

基于所述第二频谱图像进行时域重构,得到所述样本人脸图像对应的第二重构人脸图像;

基于所述训练数据、所述样本人脸图像对应的活体检测结果和第二重构人脸图像对所述活体检测模型进行训练。

或者,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图3所示实施例的方法,并具体用于执行以下操作:

获取待检测的目标人脸图像;

通过目标活体检测模型对所述目标人脸图像进行活体检测,得到活体检测结果,其中,所述目标活体检测模型为基于本申请实施例提供的活体检测模型的训练方法对活体检测模型进行训练得到。

总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

相关技术
  • 热流道模具的螺旋型混料进浇机构
  • 热流道点浇口进浇的塑料桶模具斜向抽芯机构
技术分类

06120116518343