掌桥专利:专业的专利平台
掌桥专利
首页

模型的训练方法、人脸活体识别方法、系统、设备及介质

文献发布时间:2023-06-19 10:08:35


模型的训练方法、人脸活体识别方法、系统、设备及介质

技术领域

本发明涉及计算机视觉技术领域,具体涉及一种人脸活体识别模型的训练方法、人脸活体的识别方法、系统、设备及介质。

背景技术

目前,人脸照片、人脸视频以及三维面具等假体人脸攻击方式层出不穷,人脸活体检测越来越受到人们的关注。活体检测是指计算机判别检测的人脸是真实人脸还是假体人脸,只有在判别为真实人脸的情况下,才能进入后续的人脸识别流程。现有的人脸活体检测主要依靠获取用户的人脸图像,通过训练活体检测模块判断输入人脸是否为活体。

然而,在训练活体检测模型的过程中,通常将数据增强作为一种扩充数据集的方法,也即,只是通过对样本数量进行扩充从而增加数据的多样性,使得预处理卷积层对RGB图像或者灰度图像的特征提取不够,造成神经网络模型识别的准确性低。

发明内容

本发明要解决的技术问题是为了克服现有技术中只是将数据增强作为一种扩充数据集的方法,预处理卷积层对RGB图像或者灰度图像的特征提取不够,造成模型识别准确性低的缺陷,提供一种人脸活体识别模型的训练方法、人脸活体的识别方法、系统、设备及介质。

本发明是通过下述技术方案来解决上述技术问题:

第一方面,本发明提供一种人脸活体识别模型的训练方法,所述训练方法包括以下步骤:

获取待训练的可见光图像;

对所述可见光图像进行数据增强处理,获取多个不同种类的特征映射图;其中,所述数据增强处理不改变所述可见光图像的活体信息;

将多通道残差卷积神经网络模型的初始卷积层的输入通道的数量进行修改;

将所有所述特征映射图输入所述多通道残差卷积神经网络模型的初始卷积层的输入通道中进行训练,生成人脸活体识别模型;

其中,所述多通道残差卷积神经网络模型中每个输入通道具有相同的网络结构,且每个输入通道对应于一种特征映射图,所述初始卷积层的输入通道的个数值为所述特征映射图的个数值之和。

较佳地,所述将所有所述特征映射图输入所述多通道残差卷积神经网络模型的初始卷积层的输入通道中进行训练的步骤,包括:

沿通道方向以预设的固定顺序来排列所述特征映射图;

将排列后的所述特征映射图一一对应的输入至所述输入通道;

对输入特征映射图后的所述输入通道进行融合处理;其中,所述融合处理包括拼接。

较佳地,所述对所述可见光图像进行数据增强处理的步骤包括:

对所述可见光图像按照预设顺序依次进行12种数据增强处理;其中,所述预设顺序为图像傅里叶变换、图像小波变换、随机通道丢失变换、随机通道混洗变换、下缩放、图像值反转、运动模糊、翻转、网格删除变换、随机混洗网格、随机缩放截取以及平移尺度缩放;

和/或,

较佳地,所述特征映射图中的像素值的范围为[0,1];

和/或,

所述可见光图像为仅包含人脸部分的三通道RGB图像,所述特征映射图的种类包括RGB图像和灰度图像;所述多通道残差卷积神经网络模型为ResNet50,修改后的所述初始卷积层的输入通道的个数值为32,所述多通道残差卷积神经网络模型使用的损失函数为交叉熵损失函数。

第二方面,本发明还提供一种人脸活体识别模型的训练系统,所述训练系统包括:

第一获取模块,用于获取待训练的可见光图像;

数据增强处理模块,用于对所述可见光图像进行数据增强处理,获取多个不同种类的特征映射图;其中,所述数据增强处理不改变所述可见光图像的活体信息;

修改模块,用于将多通道残差卷积神经网络模型的初始卷积层的输入通道的数量进行修改;

训练模块,用于将所有所述特征映射图输入所述多通道残差卷积神经网络模型的初始卷积层的输入通道中进行训练,生成人脸活体识别模型;

其中,所述多通道残差卷积神经网络模型中每个输入通道具有相同的网络结构,且每个输入通道对应于一种特征映射图,所述初始卷积层的输入通道的个数值为所述特征映射图的个数值之和。

较佳地,所述训练模块,包括:

排列单元,用于沿通道方向以预设的固定顺序来排列所述特征映射图;

输入单元,用于将排列后的所述特征映射图一一对应的输入至所述输入通道;

融合单元,用于对输入特征映射图后的所述输入通道进行融合处理,所述融合处理包括拼接。

较佳地,所述数据增强处理模块具体用于:

对所述可见光图像按照预设顺序依次进行12种数据增强处理;其中,所述预设顺序为图像傅里叶变换、图像小波变换、随机通道丢失变换、随机通道混洗变换、下缩放、图像值反转、运动模糊、翻转、网格删除变换、随机混洗网格、随机缩放截取以及平移尺度缩放;

和/或,

所述特征映射图中的像素值的范围为[0,1];

和/或,

所述可见光图像为仅包含人脸部分的三通道RGB图像,所述特征映射图的种类包括RGB图像和灰度图像;所述多通道残差卷积神经网络模型为ResNet50,修改后的所述初始卷积层的输入通道的个数值为32,所述多通道残差卷积神经网络模型使用的损失函数为交叉熵损失函数。

第三方面,本发明还提供一种人脸活体的识别方法,所述识别方法包括以下步骤:

获取待识别图像;其中,所述待识别图像是包括目标人脸的图像;

对所述待识别图像进行预处理,获得多个不同种类的目标待识别图像;

将每个所述目标待识别图像输入如第一方面所述的训练方法训练完成的人脸活体识别模型中进行检验,以判断所述目标待识别图像中的目标人脸是否为攻击类型;其中,所述预处理与所述人脸活体识别模型训练过程中的数据增强处理的方式相同。

第四方面,本发明还提供一种人脸活体的识别系统,所述识别系统包括:

第二获取模块,用于获取待识别图像;其中,所述待识别图像是包括目标人脸的图像;

预处理模块,用于对所述待识别图像进行预处理,获得多个不同种类的目标待识别图像;

判断模块,用于将每个所述目标待识别图像输入如第一方面所述的训练方法训练完成的人脸活体识别模型中进行检验,以判断所述目标待识别图像中的目标人脸是否为攻击类型;其中,所述预处理与所述人脸活体识别模型训练过程中的数据增强处理的方式相同。

本发明还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的人脸活体识别模型的训练方法,或执行第三方面所述的人脸活体的识别方法。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的人脸活体识别模型的训练方法,或者执行第三方面所述的人脸活体的识别方法的步骤。

本发明的积极进步效果在于:提供一种人脸活体识别模型的训练方法、人脸活体的识别方法、系统、设备及介质,通过将数据增强后的特征映射图像输入多通道残差卷积神经网络模型的初始卷积层中进行训练,不改变活体信息,通过使得神经网络模型同时学习增强数据之间的关系,扩增了输入通道的数量,提高了神经网络模型学习的起点,增强了神经网络模型进行活体识别的准确度。

附图说明

图1为本发明实施例1的人脸活体识别模型的训练方法的流程图。

图2为本发明实施例1的人脸活体识别模型的训练方法的数据增强处理的结构示意图。

图3为本发明实施例2的人脸活体识别模型的训练系统的模块示意图。

图4为本发明实施例3的人脸活体的识别方法的应用环境示意图。

图5为本发明实施例3的人脸活体的识别方法的流程图。

图6为本发明实施例4的人脸活体的识别系统的模块示意图。

图7为本发明实施例5的电子设备的硬件结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。

实施例1

本实施例,提供一种人脸活体识别模型的训练方法,参照图1,该方法包括以下步骤:

步骤S11、获取待训练的可见光图像。

每个训练样本可以包括多个活体的人脸图像和多个伪造的人脸图像,每个活体人脸图像对应的活体类型的标签以及每个伪造人脸图像对应的攻击类型的标签。

活体类型的人脸图像由真实现场采集得到,该采集到的图像可以包括普通的彩色图像,伪造人脸图像可以采用平面照片、播放视频或者视频中截取到的视频帧等,但是伪造人脸图像不能体现活体人脸的面部立体图像特征,可见光图像为224*224*3尺寸大小的三通道RGB图像。

步骤S12、对可见光图像进行数据增强处理,获取多个不同种类的特征映射图;其中,数据增强处理不改变可见光图像的活体信息。

其中,对可见光图像进行数据增强处理的步骤包括:

对可见光图像按照预设顺序依次进行12种数据增强处理;其中,预设顺序为图像傅里叶变换、图像小波变换、随机通道丢失变换、随机通道混洗变换、下缩放、图像值反转、运动模糊、翻转、网格删除变换、随机混洗网格、随机缩放截取以及平移尺度缩放。

需要说明的是,特征映射图中的像素值的范围为[0,1]。

对可见光图像进行图像傅里叶变换时,也即,对灰度化后的可见光图像进行傅里叶变换,然后将低频移动到图像中心,最后将可见光图像的各像素归一化到[0,1]。

对可见光图像进行图像小波变换时,也即,对灰度化后的可见光图像进行小波变换,各个可见光图像中的子图像进行归一化,然后拼接生成特征映射图。对可见光图像进行随机通道丢失变换时,随机选择通道进行零值填充,每个通道中分布的可见光图像中的活体信息相同。对可见光图像进行随机通道混洗变换时,随机混洗可见光图像的通道的顺序,保留每个可见光图像上的活体信息。对可见光图像进行下缩放变换时,通过缩小图像后,将图像进行放大后降低图像的质量,已增强对图像缩小后再放大造成质量损失的情况进行适应。

对可见光图像进行图像值反转时,用255或者1减去可见光图像中各像素的像素值,即翻转图像像素值。对可见光图像进行运动模糊处理时,使用随机大小的kernel矩阵,也可以为预设数值,在此不做具体限制。对可见光图像进行网格删除变换时,以网格的方式删除图像的矩形区域,活体信息在整个像素的分布中,不会因为一块区域的丢失而损失。对可见光图像进行随机混洗网格时,混洗操作不会改变图像上的活体信息的整体分布情况,而对可见光图像进行随机缩放截取操作时,随机截取可见光图像的一部分后,缩放至预设大小,其中,可见光图像中的每一块图像区域的活体信息的分布特征相同。在可见光图像上随机的进行反射变换操作时,也即平移、缩放以及旋转操作时,反射变换操作也不会改变可见光中活体信息的分布情况。

具体的,该可见光图像包括伪造的人脸图像,例如,拍摄活体照片的人脸图像,以及可见光图像还包括活体的人脸图像,例如,拍摄活体的图像。对可见光图像中伪造的人脸图像和活体的人脸图像都进行数据增强处理,以获取多个特征映射图。可以理解的是,本实施例中数据增强处理后获得的特征映射图的数量通常与采用的数据增强处理方式的数量是一致的,也即,采用多少种不同的方式对待检测图像进行数据增强处理,就可以获得相应数量的特征映射图。

在机器学习领域,数据增强处理的方式很多,用于扩充训练样本的数量的方式,通过对原始的训练样本进行数据增强处理,生成数量更多的新的训练样本。本实施例中,数据增强处理并非用于扩充待训练集图像,而是为了提高神经网络同时学习数据增强处理后的特征映射图之间的关系。经过数据增强处理后,可见光图像中具有可分性的特征不会改变,也即,不会改变区分活体类型还是攻击类型的特征。

需要说明的是,经过增强处理后生成的特征映射图的像素值归一化至[0,1]范围内,以便适应神经网络模型的输入。

步骤S13、将多通道残差卷积神经网络模型的初始卷积层的输入通道的数量进行修改。

深度学习是机器学习中的一种基于对数据进行表征学习的方法,可以应用于如目标检测、图像识别、图像分类等多种应用中。设计一种多通道残差卷积神经网络模型,该神经网络模型包含卷积层、池化层等,不包含全连接层,该多通道残差卷积神经网络模型原始通道个数为3个,每个通道的网络结构完全相同,分别对应输入待训练的可见光图像对应的多种不同的模态的图像。现将原始通道的个数进行修改后,提高了卷积神经网络模型学习的起点。

步骤S14、将所有特征映射图输入多通道残差卷积神经网络模型的初始卷积层的输入通道中进行训练,生成人脸活体识别模型。其中,多通道残差卷积神经网络模型中每个输入通道具有相同的网络结构,且每个输入通道对应于一种特征映射图,初始卷积层的输入通道的个数值为特征映射图的个数值之和。

其中,可见光图像为仅包含人脸部分的三通道RGB图像,特征映射图的种类包括RGB图像和灰度图像;多通道残差卷积神经网络模型为ResNet50,修改后的初始卷积层的输入通道的个数值为32,多通道残差卷积神经网络模型使用的损失函数为交叉熵损失函数。

在一个具体的示例中,该多通道残差卷积神经网络模型的批处理数据量batchsize为128,待训练的可见光图像来自CelebA-Spoof数据集,优化器使SGD,Ir为1e-1,Weight decay为5e-4,momentum为0.9,训练使用V100的GPU,迭代次数为100。

卷积神经网络模型的初始卷积层的输入通道的个数和每个待训练的可见光图像对应的特征映射图的个数相等,每个输入通道分别对应一种特征映射图,但是各个通道设置的参数值可以不相同,以便更好的适应不同模态的特征提取。将可见光图像进行图像傅里叶变换后生成的特征映射图输入神经网络模型,使得模型可以从频域得角度开始学习;通过小波变换生成得特征映射图输入到神经网络模型,使得模型可以从变换域得角度开始学习;通过随机通道混洗变换生成的特征映射图输入神经网络模型中,使得模型可以学习像素值的整体分布特征;通过图像值反转变换而生成的特征映射图输入神经网络模型中,使得模型可以从逆向的角度开始学习。

具体的,如图2所示,经过FFT(fast Fourier transform,快速傅里叶变换)后生成的特征映射图为灰度图,输入通道的个数值为1;Wavelet transform(图像小波变换)后生成的特征映射图为灰度图,输入通道的个数值为1;ChannelDropout(随机通道丢失)、ChannelShuffle(随机通道混洗变换)、Downscale(下缩放)、InvertImg(图像值反转)、MotionBlur(运动模糊)、Flip(翻转)、GridDropout(网格删除变换)、RandomGridShuffle(随机混洗网格)、RandomResizedCrop(随机缩放截取)以及ShiftScaleRotate(平移尺度缩放变换)后生成的特征映射图都为彩色图,输入通道的个数值为3个。

本实施例中,在步骤S14,包括:

步骤S141、沿通道方向以预设的固定顺序来排列特征映射图。

步骤S142、将排列后的特征映射图一一对应的输入至输入通道。

步骤S143、对输入特征映射图后的输入通道进行融合处理;其中,融合处理包括拼接。

按照预设的12种增强处理的顺序依次生成多个特征映射图,对每个特征映射图进行标记,例如,可以标记为特征映射图1、特征映射图2、特征映射图3-A、特征映射图3-B、特征映射图3-C、特征映射图4-A、特征映射图4-B、特征映射图4-C等。按照从大到小或者从小到大的顺序对标记后的特征映射图进行排列,将排列后的特征映射图分别一一对应的输入到神经网络模型初始卷积层的输入通道后,进行通道融合处理,通常通道融合处理包含加和和拼接两种方式。本申请采用拼接的方式进行融合,也即,可以进一步融合所有特征映射图对应的检测结果后,确定待训练的可见光图像为活体类型还是攻击类型。

提供一种人脸活体识别模型的训练方法,通过将数据增强后的特征映射图像输入多通道残差卷积神经网络模型的初始卷积层中进行训练,不改变活体信息,通过使得神经网络模型同时学习增强数据之间的关系,扩增了输入通道的数量,提高了神经网络模型学习的起点,增强了神经网络模型进行活体识别的准确度。

实施例2

本实施例,提供一种人脸活体识别模型的训练系统,如同3所示,该训练系统包括:第一获取模块21、数据增强处理模块22、修改模块23以及训练模块24,训练模块24包括排列单元241、输入单元242、融合单元243。

其中,第一获取模块21,用于获取待训练的可见光图像。

第一获取模块21获取的每个训练样本可以包括多个活体的人脸图像和多个伪造的人脸图像,每个活体人脸图像对应的活体类型的标签以及每个伪造人脸图像对应的攻击类型的标签,每个可见光图像为224*224*3尺寸大小的三通道RGB图像。

活体类型的人脸图像由真实现场采集得到,该采集到的图像可以包括普通的彩色图像,伪造人脸图像可以采用平面照片、播放视频或者视频中截取到的视频帧等,但是伪造人脸图像不能体现活体人脸的面部立体图像特征。

数据增强处理模块22,用于对可见光图像进行数据增强处理,获取多个不同种类的特征映射图;其中,数据增强处理不改变可见光图像的活体信息。

其中,数据增强处理模块22具体用于:

对可见光图像按照预设顺序依次进行12种数据增强处理;其中,预设顺序为图像傅里叶变换、图像小波变换、随机通道丢失变换、随机通道混洗变换、下缩放、图像值反转、运动模糊、翻转、网格删除变换、随机混洗网格、随机缩放截取以及平移尺度缩放。

需要说明的是,特征映射图中的像素值的范围为[0,1]。

对可见光图像进行图像傅里叶变换时,也即,对灰度化后的可见光图像进行傅里叶变换,然后将低频移动到图像中心,最后将可见光图像的各像素归一化到[0,1]。

对可见光图像进行图像小波变换时,也即,对灰度化后的可见光图像进行小波变换,各个可见光图像中的子图像进行归一化,然后拼接生成特征映射图。对可见光图像进行随机通道丢失变换时,随机选择通道进行零值填充,每个通道中分布的可见光图像中的活体信息相同。对可见光图像进行随机通道混洗变换时,随机混洗可见光图像的通道的顺序,保留每个可见光图像上的活体信息。对可见光图像进行下缩放变换时,通过缩小图像后,将图像进行放大后降低图像的质量,已增强对图像缩小后再放大造成质量损失的情况进行适应。

对可见光图像进行图像值反转时,用255或者1减去可见光图像中各像素的像素值,即翻转图像像素值。对可见光图像进行运动模糊处理时,使用随机大小的kernel矩阵,也可以为预设数值,在此不做具体限制。对可见光图像进行网格删除变换时,以网格的方式删除图像的矩形区域,活体信息在整个像素的分布中,不会因为一块区域的丢失而损失。对可见光图像进行随机混洗网格时,混洗操作不会改变图像上的活体信息的整体分布情况,而对可见光图像进行随机缩放截取操作时,随机截取可见光图像的一部分后,缩放至预设大小,其中,可见光图像中的每一块图像区域的活体信息的分布特征相同。在可见光图像上随机的进行反射变换操作时,也即平移、缩放以及旋转操作时,反射变换操作也不会改变可见光中活体信息的分布情况。

具体的,该可见光图像包括伪造的人脸图像,例如,拍摄活体照片的人脸图像,以及可见光图像还包括活体的人脸图像,例如,拍摄活体的图像。对可见光图像中伪造的人脸图像和活体的人脸图像都进行数据增强处理,以获取多个特征映射图。可以理解的是,本实施例种数据增强处理后获得的特征映射图的数量通常与采用的数据增强处理方式的数量是一致的,也即,采用多少种不同的方式对待检测图像进行数据增强处理,就可以获得相应数量的特征映射图。

在机器学习领域,数据增强处理的方式很多,用于扩充训练样本的数量的方式,通过对原始的训练样本进行数据增强处理,生成数量更多的新的训练样本。本实施例中,数据增强处理并非用于扩充待训练集图像,而是为了提高神经网络同时学习数据增强处理后的特征映射图之间的关系。经过数据增强处理后,可见光图像中具有可分性的特征不会改变,也即,不会改变区分活体类型还是攻击类型的特征。

需要说明的是,经过增强处理后生成的特征映射图的像素值归一化至[0,1]范围内,以便适应神经网络模型的输入。

修改模块23,用于将多通道残差卷积神经网络模型的初始卷积层的输入通道的数量进行修改。

深度学习是机器学习中的一种基于对数据进行表征学习的方法,可以应用于如目标检测、图像识别、图像分类等多种应用中。设计一种多通道残差卷积神经网络模型,该神经网络模型包含卷积层、池化层等,不包含全连接层,该多通道残差卷积神经网络模型原始通道个数为3个,每个通道的网络结构完全相同,分别对应输入待训练的可见光图像对应的多种不同的模态的图像。现将原始通道的个数进行修改后,提高了卷积神经网络模型学习的起点。

训练模块24,用于将所有特征映射图输入多通道残差卷积神经网络模型的初始卷积层的输入通道中进行训练,生成人脸活体识别模型;

其中,多通道残差卷积神经网络模型中每个输入通道具有相同的网络结构,且每个输入通道对应于一种特征映射图,初始卷积层的输入通道的个数值为特征映射图的个数值之和。

其中,可见光图像为仅包含人脸部分的三通道RGB图像,特征映射图的种类包括RGB图像和灰度图像;多通道残差卷积神经网络模型为ResNet50,修改后的初始卷积层的输入通道的个数值为32,多通道残差卷积神经网络模型使用的损失函数为交叉熵损失函数。

在一个具体的示例中,该多通道残差卷积神经网络模型的批处理数据量batchsize为128,待训练的可见光图像来自CelebA-Spoof数据集,优化器使SGD,Ir为1e-1,Weight decay为5e-4,momentum为0.9,训练使用V100的GPU,迭代次数为100。

卷积神经网络模型的初始卷积层的输入通道的个数和每个待训练的可见光图像对应的特征映射图的个数相等,每个输入通道分别对应一种特征映射图,但是各个通道设置的参数值可以不相同,以便更好的适应不同模态的特征提取。将可见光图像进行图像傅里叶变换后生成的特征映射图输入神经网络模型,使得模型可以从频域得角度开始学习;通过小波变换生成得特征映射图输入到神经网络模型,使得模型可以从变换域得角度开始学习;通过随机通道混洗变换生成的特征映射图输入神经网络模型中,使得模型可以学习像素值的整体分布特征;通过图像值反转变换而生成的特征映射图输入神经网络模型中,使得模型可以从逆向的角度开始学习。

具体的,经过图像傅里叶变换后生成的特征映射图为灰度图,输入通道的个数值为1;图像小波变换后生成的特征映射图为灰度图,输入通道的个数值为1;随机通道丢失、随机通道混洗变换、下缩放、图像值反转、运动模糊、翻转、网格删除变换、随机混洗网格、随机缩放截取以及平移尺度缩放变换后生成的特征映射图都为彩色图,输入通道的个数值为3个,则初始卷积层的输入通道的个数值为每个待训练的可见光图像进行所有数据增强后生成的特征图像的个数之和32。

本实施例中,训练模块24还包括:

排列单元241,用于沿通道方向以预设的固定顺序来排列特征映射图。

输入单元242,用于将排列后的特征映射图一一对应的输入至输入通道。

融合单元243,用于对输入特征映射图后的输入通道进行融合处理;其中,融合处理包括拼接。

按照预设的12种增强处理的顺序依次生成多个特征映射图,对每个特征映射图进行标记,例如,可以标记为特征映射图1、特征映射图2、特征映射图3-A、特征映射图3-B、特征映射图3-C、特征映射图4-A、特征映射图4-B、特征映射图4-C等。按照从大到小或者从小到大的顺序对标记后的特征映射图进行排列,将排列后的特征映射图分别一一对应的输入到神经网络模型初始卷积层的输入通道后,进行通道融合处理,通常通道融合处理包含加和和拼接两种方式。本申请采用拼接的方式进行融合,也即,可以进一步融合所有特征映射图对应的检测结果后,确定待训练的可见光图像为活体类型还是攻击类型。

提供一种人脸活体识别模型的训练系统,通过将数据增强后的特征映射图像输入多通道残差卷积神经网络模型的初始卷积层中进行训练,不改变活体信息,通过使得神经网络模型同时学习增强数据之间的关系,扩增了输入通道的数量,提高了神经网络模型学习的起点,增强了神经网络模型进行活体识别的准确度。

实施例3

计算机视觉技术(Computer Vision,CV)通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语音理解、3D技术、虚拟现实、增强现实以及同步定位定技术,还包括人脸识别、指纹识别等生物特征识别技术。可以理解的是,本实施例中,根据图像进行活体识别的处理,就属于使用计算机视觉技术中的生物特征识别技术,实现活体检测。

本实施例中的人脸活体的识别方法,可以应以于如图3所示的应用环境中,其中,终端1通过网络与活体识别服务器2进行通信。具体的,活体识别服务器2可以接收终端1发送的待识别图像;对待识别图像进行处理生产目标待识别图像,对目标待识别图像进行活体识别。

需要说明的是,可以采用以整个人为目标对象进行活体识别,也即,待识别图像中包括整个人,提取待识别图像中人的生物特征以对目标对象进行活体识别。而实施例中,采用待识别图像是只包括目标对象的人脸的图像,通过对人脸部分进行活体识别,得到针对该人脸部分的活体识别结果,从而判断该目标对象为活体类型还是攻击类型,可以理解的是,基于人脸部分特征进行活体识别,而不是基于整个人体进行活体识别。

终端1可以但不限于是各种个人计算机、笔记本电脑、智能手机以及平板电脑,活体识别服务器2可以采用独立服务器或者多个服务器组成的集群来实现。例如,在金融领域中,存在对于人脸活体识别的需求,终端1为智能手机时,需要对用户进行身份鉴定成功后,进行转账支付业务。终端1采集到目标用户的多个待识别图像后,活体识别服务器2获取终端1发送的多个第一目标用户甲对应的多个待识别图像,判定本次操作获取的带识别图像是否由第一目标用户甲本人发起的,并将判定结果反馈给终端1的智能手机,从而完成人脸活体识别。除此之外,在门禁系统中,也存在对于人脸活体识别的需求,此处对于其他的应用场景则不再赘述。

在一个实施例中,如图4所示,提供一种人脸活体的识别方法,本实施例以该方法应用于活体识别服务器2进行说明,可以理解的是,该方法还可以应用于包括终端1和活体识别服务器2的系统,并通过终端1和活体识别服务器2的交互实现。本实施例中,如图5所示,该方法包括以下步骤:

步骤S31、获取待识别图像,其中,该待识别图像是包括目标人脸的图像。

活体识别服务器2可以实时接收终端1通过本地的图像采集系统采集到的待识别图像,也可以接收终端1从本地导出的图像,该图像为事先拍摄完成的照片或者存储的照片。但是需要说明的是。终端1到处的图像一般经过活体识别后判定为攻击类型。

步骤S32、对待识别图像进行预处理,获得多个不同种类的目标待识别图像。

步骤S33、将每个目标待识别图像输入如实施例1的训练方法训练完成的人脸活体识别模型中进行检验,以判断目标待识别图像中的目标人脸是否为攻击类型;其中,预处理与人脸活体识别模型训练过程中的数据增强处理的方式相同。

本实施例中,预处理的方式与实施例1中的数据增强处理的方式相同,若采用实施例1中的12种数据增强的方式进行模型训练,则对待识别图像进行同样的12种数据增强的方式进行预处理。

提供一种人脸活体的识别方法,通过将待识别图像进行预处理后,生成的目标待识别图像输入经过输入通道扩增后训练完成的神经网络模型中进行活体检测,提高了神经网络模型学习的起点,增强了进行活体识别的准确度。

实施例4

本实施例,提供一种人脸活体的识别系统,如图6所示,该识别系统包括:第二获取模块41、预处理模块42以及判断模块43。

其中,第二获取模块41,用于获取待识别图像;其中,该待识别图像是包括目标人脸的图像。

预处理模块42,用于对待识别图像进行预处理,获得多个不同种类的目标待识别图像。

判断模块43,用于将每个目标待识别图像输入实施例1的训练方法训练完成的人脸活体识别模型中进行检验,以判断目标待识别图像中的目标人脸是否为攻击类型;其中,预处理与人脸活体识别模型训练过程中的数据增强处理的方式相同。

本实施例中,预处理的方式与实施例1中的数据增强处理的方式相同,若采用实施例1中的12种数据增强的方式进行模型训练,则对待识别图像进行同样的12种数据增强的方式进行预处理。

提供一种人脸活体的识别系统,通过将待识别图像进行预处理后,生成的目标待识别图像输入经过输入通道扩增后训练完成的神经网络模型中进行活体检测,提高了神经网络模型学习的起点,增强了进行活体识别的准确度。

实施例5

图7为本实施例提供的一种电子设备的结构示意图。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1的人脸活体识别模型的训练方法或实施例3的人脸活体的识别方法,图7显示的电子设备60仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

电子设备60可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备60的组件可以包括但不限于:上述至少一个处理器61、上述至少一个存储器62、连接不同系统组件(包括存储器62和处理器61)的总线63。

总线63包括数据总线、地址总线和控制总线。

存储器62可以包括易失性存储器,例如随机存取存储器(RAM)621和/或高速缓存存储器622,还可以进一步包括只读存储器(ROM)623。

存储器62还可以包括具有一组(至少一个)程序模块624的程序/实用工具625,这样的程序模块624包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器61通过运行存储在存储器62中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1的人脸活体识别模型的训练方法或实施例3的人脸活体的识别方法。

电子设备60也可以与一个或多个外部设备64(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口65进行。并且,模型生成的设备60还可以通过网络适配器66与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器66通过总线63与模型生成的设备60的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备60使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例6

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1的人脸活体识别模型的训练方法或实施例3的人脸活体的识别方法的步骤。

其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1的人脸活体识别模型的训练方法或实施例3的人脸活体的识别方法的步骤。

其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

技术分类

06120112436249