掌桥专利:专业的专利平台
掌桥专利
首页

人脸识别方法、装置、设备及存储介质

文献发布时间:2023-06-19 13:45:04


人脸识别方法、装置、设备及存储介质

技术领域

本申请涉及人工智能技术领域,具体而言,本申请涉及一种人脸识别方法、装置、设备及存储介质。

背景技术

随着图像识别技术的飞速发展,如今人脸识别技术在生活中有着广泛的应用。传统的身份认证比如使用钥匙、使用门卡、使用证件,或者使用口令、密码等认证方式都存在容易丢失、容易忘记,甚至被伪造的问题。而使用人脸识别进行身份认证比如开锁、人脸打卡,在诸多涉及到财产的APP中可以使用人脸识别进行本人的身份认证等等。

但在使用人脸进行身份认证的同时,由于人脸或相机的移动会导致出现了人脸图像的运动模糊,导致人脸识别失败。

发明内容

本申请的主要目的为提供一种人脸识别方法、装置、设备及存储介质,以提高人脸识别的成功率。

为了实现上述发明目的,本申请提供一种人脸识别方法,其包括以下步骤:

响应于用户的人脸识别请求,获取所述用户的人脸图像,将所述人脸图像转换为频率图像,确定所述频率图像的模糊角度及模糊长度;

将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像;其中,所述模糊处理模型为预先训练好的神经网络模型;

提取所述目标人脸图像的所有人脸特征点;

将所述所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,得到每一个人脸特征点对应的匹配结果;

计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例;

若是,则判定人脸识别通过。

优选地,所述确定所述频率图像的模糊角度,包括:

对所述频率图像进行中值滤波,将中值滤波后的所述频率图像进行傅里叶变换,并计算傅里叶变换后的所述频率图像的对数谱;

对所述对数谱进行逆傅里叶变换,得到边缘图;

确定所述边缘图上的最大值与最小值,获取所述最大值的第一坐标点、所述最小值的第二坐标点;

将所述第一坐标点及第二坐标点在预先标定的原点上形成的夹角作为所述模糊角度。

进一步地,所述将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像之后,还包括:

利用所述模糊角度及模糊长度为所述人脸图像的运动模糊预测点扩散函数;

将获得的点扩散函数转换为预设大小的光学传递函数;

提取所述目标人脸图像的估计值,将所述光学传递函数与所述估计值相乘,得到所述目标人脸图像的评估值;

判断所述评估值是否大于预设评估值;

若是,则确定所述目标人脸图像满足识别要求,输出所述目标人脸图像。

优选地,所述将所述人脸图像转换为频率图像,包括:

对所述人脸图像进行二维连续高斯分布采样和量化,得到二维高斯离散模板;

将所述二维高斯离散模板与所述人脸图像进行卷积,得到所述频率图像。

进一步地,所述将所述人脸图像转换为频率图像之前,还包括:

识别所述人脸图像中的人脸区域,计算所述人脸区域的清晰度;

判断所述清晰度是否低于预设清晰度;

若是,将所述人脸图像转换为频率图像;

若否,将所述人脸图像作为目标人脸图像,并跳转至所述提取所述目标人脸图像的所有人脸特征点的步骤。

进一步地,所述将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理之前,还包括:

获取训练样本;其中,所述训练样本包括频率图像样本、模糊角度样本、模糊长度样本及所述频率图像样本对应的目标人脸图像样本;

将所述训练样本输入预先构建的初始模糊处理模型中进行训练;

判断所述初始模糊处理模型的训练结果是否满足要求;

若是,将训练结果满足要求的所述初始模糊处理模型作为所述模糊处理模型。

优选地,所述判断所述初始模糊处理模型的训练结果是否满足要求,包括:

利用预设的损失函数计算每次训练后的所述初始模糊处理模型的损失值;

判断所述损失值是否都低于预设损失值;

若是,则判定所述初始模糊处理模型的训练结果满足要求。

本申请还提供一种人脸识别装置,其包括:

获取模块,用于响应于用户的人脸识别请求,获取所述用户的人脸图像,将所述人脸图像转换为频率图像,确定所述频率图像的模糊角度及模糊长度;

输入模块,用于将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像;其中,所述模糊处理模型为预先训练好的神经网络模型;

提取模块,用于提取所述目标人脸图像的所有人脸特征点;

匹配模块,用于将所述所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,得到每一个人脸特征点对应的匹配结果;

判断模块,用于计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例;

判定模块,用于在所述成功的匹配率大于预设比例时,则判定人脸识别通过。

本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。

本申请所提供的一种人脸识别方法、装置、设备及存储介质,通过响应于用户的人脸识别请求,获取用户的人脸图像,将人脸图像转换为频率图像,确定频率图像的模糊角度及模糊长度,将频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像,提取目标人脸图像的所有人脸特征点,将所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,计算匹配结果为成功的匹配率,并判断成功的匹配率是否大于预设比例,在该成功的匹配率大于预设比例时,则判定人脸识别通过,从而通过人脸图像的模糊角度及模糊长度,利用模糊处理模型对人脸图像进行自动去模糊处理,以利用去模糊处理的目标人脸图像进行人脸匹配,因此即使人脸或相机的移动导致人脸图像的运动模糊,也能进行人脸识别,提高人脸识别的成功率。

附图说明

图1为本申请一实施例的人脸识别方法的流程示意图;

图2为本申请一实施例的人脸识别装置的结构示意框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

参考图1,本申请提出一种人脸识别方法,以服务器为执行主体,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

本申请中,该人脸识别方法用于提高人脸识别的成功率,参照图1,其中一个实施例中,该人脸识别方法包括如下步骤:

S11、响应于用户的人脸识别请求,获取所述用户的人脸图像,将所述人脸图像转换为频率图像,确定所述频率图像的模糊角度及模糊长度;

S12、将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像;其中,所述模糊处理模型为预先训练好的神经网络模型;

S13、提取所述目标人脸图像的所有人脸特征点;

S14、将所述所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,得到每一个人脸特征点对应的匹配结果;

S15、计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例;

S16、若是,则判定人脸识别通过。

在本实施例中,模糊和嘈杂的人脸图像将无法有效识别,因此需要去除人脸图像上的模糊和噪声,以提高人脸图像的识别性能。在运动模糊的情况下(最常见的模糊是由于相机晃动而出现的),人脸图像模糊的发生主要是由于像素长度和像素方向的变化,对应于模糊长度及模糊角度,导致影响人脸识别,因此需要消除所有这些会影响人脸识别结果的因素。

具体的,如上述步骤S11所述,本申请的用户可在终端上发起人脸识别请求,该终端可以是具有摄像功能的电子设备,如手机、电脑、平板、电子密码锁等等,可通过采集位于终端前的用户的人脸图像来得到所需获取的人脸图像,将人脸图像发送给服务器,由服务器进行人脸识别,并返回人脸识别结果。

在一实施例中,获取人脸图像之后,可对模糊的人脸图像进行增强处理。具体的,可通过设定更高频率范围内的新增高频信号分量来实现,这样处理之后,可以根据平滑后的低频分量预测并恢复出平滑前的实际高频分量,当平滑后的人脸图像迭加非线性滤波的高频分量时,就可以实现在去除模糊的人脸图像中的噪声时,仍然会保存原人脸图像中有用的高频信息,以避免失真。

其中,处理的噪声主要是椒盐噪声和高斯噪声,它们会降低人脸图像质量。本申请可以使用中值滤波器来消除人脸图像中的椒盐噪声,从而产生平滑的输出。椒盐噪声又称脉冲噪声,它随机改变一些像素值,在二值图像上表现为使一些像素点变白,一些像素点变黑,是由图像传感器,传输信道,解码处理等产生的黑白相间的亮暗点噪声。椒盐噪声往往由图像切割引起。高斯噪声是一种随机噪声,在任选瞬时中任取n个,其值按n个变数的高斯概率定律分布。

在一实施例中,当噪声仅出现在人脸图像中的边界像素值处时,经过中值滤波器处理可提高人脸图像的质量。如果人脸图像中存在的椒盐噪声包含更多方差,人脸图像通过中值滤波器一次迭代而没有消除噪声,则中值滤波器可通过人脸图像两次以上,以更好地去除人脸图像的椒盐噪声。

在一实施例中,可使用维纳滤波器去除高斯噪声,就均方误差而言,维纳滤波的去除效果较佳,它最大限度地减少了逆滤波和噪声平滑过程中的整体均方误差。其中,维纳滤波是对原始人脸图像的线性估计,该方法是基于随机框架,有两个独立的部分:逆滤波部分和噪声平滑部分,它不仅通过逆滤波执行反卷积,而且还通过压缩操作去除高斯噪声。

此外,去模糊是通过估计模糊参数来执行的,例如模糊角度和模糊长度,因此需要将人脸图像转换到频率,通过转换为频率图像,可以估计傅立叶频谱中的参数,以确定人脸图像的模糊角度和模糊长度。其中,人脸图像可以看做是一个定义为二维平面上的信号,该信号的幅值对应于像素的灰度(对于彩色图像则是RGB三个分量),如果我们仅仅考虑人脸图像上某一行像素,则可以将之视为一个定义在一维空间上信号,这个信号在形式上与传统的信号处理领域的时变信号是相似的。不过是一个是定义在空间域上,而另一个是定义在时间域上。所以人脸图像的频率又称为空间频率,它反映了人脸图像的像素灰度在空间中变化的情况。

其中,在傅立叶光谱中获得的人脸图像由暗线组成,这些暗线之间的距离形成了一个像素的模糊长度,当运动长度增加时,傅立叶光谱中的平行暗线就会彼此靠近。

如上述步骤S12所述,可使用神经卷积用于恢复被已知点扩散函数模糊的潜在人脸图像,将频率图像、模糊角度、模糊长度作为模糊处理模型的输入,并给出去模糊的人脸图像作为输出,得到目标人脸图像。其中,点扩散函数,对光学系统来讲,输入物为一点光源时其输出像的光场分布,称为点扩散函数,也称点扩展函数。在数学上点光源可用δ函数(点脉冲)代表,输出像的光场分布叫做脉冲响应,所以点扩散函数也就是光学系统的脉冲响应函数。

如上述步骤S13所述,在完成人脸图像的去噪声和去模糊之后,使用特征提取的方法对处理的目标人脸图像进行特征提取,对眼睛、耳朵、鼻子、嘴巴、下巴、脸宽、眼角宽度等等人脸上的器官图像做处理。例如,通过人脸检测算法从目标人脸图像中提取N个人脸特征点;所述人脸检测算法为dlib人脸特征点检测算法,所述N个人脸特征点包括脸部轮廓特征点、眉部特征点、鼻翼特征点、鼻孔特征点、眼部特征点和唇部特征点等等。

如上述步骤S14所述,所有标准人脸特征点可以是目标用户的所有人脸特征点,该目标用户可以为终端的机主,可预先通过摄像头拍摄目标用户的人脸,得到标准人脸图像,提取该目标用户的标准人脸图像的所有标准人脸特征点,将所有标准人脸特征点存储在数据库中。

匹配时,将所有人脸特征点与预存的所有标准人脸特征点进行一一匹配。具体的,可以将每个人脸特征点与不同的标准人脸特征点进行匹配,得到每个人脸特征点对应的匹配结果。以任一个人脸特征点为例,若所有标准人脸特征点中存在与该人脸特征点相匹配的标准人脸特征点,则该人脸特征点对应的匹配结果为成功,反之则失败,以此类推,直至完成所有人脸特征点的匹配。此外,还可获取每个人脸特征点及每个标准人脸特征点的类型,将属于相同类型的人脸特征点及标准人脸特征点才进行匹配,以提高匹配效率。例如,当人脸特征点为眉部特征点时,则同时获取为眉部特征点的标准人脸特征点,两者都属于人脸眉部的类型,将两者进行匹配。

如上述步骤S15-S16所述,每一个人脸特征点对应的匹配结果为成功或失败,统计匹配结果为成功的数量及失败的数量,将成功的数量与失败的数量进行相加,得到匹配总数,并计算匹配结果为成功的数量与匹配总数的比例,得到匹配结果为成功的匹配率,并判断成功的匹配率是否大于预设比例,在成功的匹配率大于预设比例时,则判定人脸识别通过,否则人脸识别失败。其中,预设比例可自定义设置,比如98%。

本申请所提供的一种人脸识别方法,通过响应于用户的人脸识别请求,获取用户的人脸图像,将人脸图像转换为频率图像,确定频率图像的模糊角度及模糊长度,将频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像,提取目标人脸图像的所有人脸特征点,将所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,计算匹配结果为成功的匹配率,并判断成功的匹配率是否大于预设比例,在该成功的匹配率大于预设比例时,则判定人脸识别通过,从而通过人脸图像的模糊角度及模糊长度,利用模糊处理模型对人脸图像进行自动去模糊处理,以利用去模糊处理的目标人脸图像进行人脸匹配,因此即使人脸或相机的移动导致人脸图像的运动模糊,也能进行人脸识别,提高人脸识别的成功率。

在一实施例中,在步骤S11中,所述确定所述频率图像的模糊角度,可具体包括:

S111、对所述频率图像进行中值滤波,将中值滤波后的所述频率图像进行傅里叶变换,并计算傅里叶变换后的所述频率图像的对数谱;

S112、对所述对数谱进行逆傅里叶变换,得到边缘图;

S113、确定所述边缘图上的最大值与最小值,获取所述最大值的第一坐标点、所述最小值的第二坐标点;

S114、将所述第一坐标点及第二坐标点在预先标定的原点上形成的夹角作为所述模糊角度。

在本实施例中,为了估计模糊的人脸图像中像素值变化的方向,人脸图像将被转换为频率图像。因此,模糊角度的估计属于傅里叶谱中出现的线条的估计,可使用霍夫变换来查找频率图像中的全局参数,例如频率图像空间中的直线、曲线、椭圆。在霍夫变换中可以检测到线作为傅立叶光谱中点的表示,该谱基于线的极坐标表示。然后计算频率图像的傅立叶变换以及对数谱,计算对数谱的逆傅里叶变换,得到边缘图,从边缘图中确定最小值和最大值,将最大值对应的第一坐标点及最小值对应的第二坐标点在原点上形成的夹角作为模糊角度,以精确地确定运动模糊角。

在一实施例中,所述将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像之后,还可包括:

利用所述模糊角度及模糊长度为所述人脸图像的运动模糊预测点扩散函数;

将获得的点扩散函数转换为预设大小的光学传递函数;

提取所述目标人脸图像的估计值,将所述光学传递函数与所述估计值相乘,得到所述目标人脸图像的评估值;

判断所述评估值是否大于预设评估值;

若是,则确定所述目标人脸图像满足识别要求,输出所述目标人脸图像。

在本实施例中,使用神经卷积用于恢复被已知点扩散函数模糊的潜在人脸图像,将频率图像、模糊角度、模糊长度、迭代次数作为输入,并给出去模糊的目标人脸图像作为输出。

其中,非点源实际上是许多单个点源的总和,观察图像中的像素可以用点扩散函数表示。使用模糊角度和模糊长度为运动模糊估计点扩散函数,将获得的点扩散函数转换为所需大小的光学传递函数。光学传递函数是指以空间频率为变量,表征成像过程中调制度和横向相移的相对变化的函数。光学传递函数是光学系统对空间频谱的滤波变换。一个非相干照明的光学成像系统,像的强度也是线性的,满足叠加原理。

然后估计首先被初始化的目标人脸图像,提取目标人脸图像的估计值,然后将估计值转换到频域,光学传递函数与频域中的估计值相乘,得到目标人脸图像的评估值,该评估值用于表征对人脸图像的去模糊效果,当评估值大于预设评估值时,则确定所述目标人脸图像满足识别要求,进一步对目标人脸图像进行标准人脸图像匹配。

在一实施例中,在步骤S11中,所述将所述人脸图像转换为频率图像,可具体包括:

对所述人脸图像进行二维连续高斯分布采样和量化,得到二维高斯离散模板;

将所述二维高斯离散模板与所述人脸图像进行卷积,得到所述频率图像。

在本实施例中,可使用空间域低通滤波的方法对人脸图像进行去噪,对人脸图像进行二维连续高斯分布经采样、量化后,使得到的二维高斯离散模板可以归一化,使用二维高斯离散模板与人脸图像进行卷积来对人脸图像进行滤波去噪,并将卷积后的人脸图像转换为频率图像。具体包括如下公式:

g(x,y)=f(x,y)*w(i,j);

其中,f(x,y)是指人脸图像在(x,y)点的像素灰度值,g(x,y)为与二维高斯离散模板卷积后(x,y)的灰度值,如果判断像素属于边界像素,则应保持像素原值不变,即g(x,y)=f(x,y)。这样经过处理之后的频率图像便可以变得平滑一些。

在一实施例中,所述将所述人脸图像转换为频率图像之前,还可包括:

识别所述人脸图像中的人脸区域,计算所述人脸区域的清晰度;

判断所述清晰度是否低于预设清晰度;

若是,将所述人脸图像转换为频率图像;

若否,将所述人脸图像作为目标人脸图像,并跳转至所述提取所述目标人脸图像的所有人脸特征点的步骤。

本实施例只将清晰度低于预设清晰度的人脸图像进行频率转换,并对其进行去模糊处理,将清晰度大于预设清晰度的人脸图像则直接进行特征提取及人脸识别,以减少模糊处理的人脸图像,提高人脸识别效率。

具体的,可将人脸图像切割为多个子图像,对每个子图像的图像清晰度进行识别,可以通过训练后的神经网络模型识别每个子图像的图像清晰度,也可以采用Tenengrad梯度方法、Laplacian梯度方法以及方差方法等识别每个子图像的图像清晰度,然后可以对获取的每个子图像的图像清晰度进行加权平均,得到人脸图像的清晰度。

在一实施例中,所述将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理之前,还可包括:

获取训练样本;其中,所述训练样本包括频率图像样本、模糊角度样本、模糊长度样本及所述频率图像样本对应的目标人脸图像样本;

将所述训练样本输入预先构建的初始模糊处理模型中进行训练;

判断所述初始模糊处理模型的训练结果是否满足要求;

若是,将训练结果满足要求的所述初始模糊处理模型作为所述模糊处理模型。

本实施例可使用机器学习算法训练得到模糊处理模型。其中,训练样本可包括频率图像样本、模糊角度样本、模糊长度样本及所述频率图像样本对应的目标人脸图像样本,训练样本的数量越多,则模糊处理模型的训练效果越好。

具体的,将获取的训练样本输入初始模糊处理模型中进行多次训练,并在每次训练之后计算所述初始模糊处理模型的损失值,判断所述损失值是否低于预设损失值,若是,则判定初始模糊处理模型输出的训练结果满足要求。若否,则调整初始模糊处理模型的参数,对其再次训练,直至所述损失值低于预设损失值时为止,从而将当前的初始模糊处理模型作为训练好的模糊处理模型。

在一实施例中,所述判断所述初始模糊处理模型的训练结果是否满足要求,包括:

利用预设的损失函数计算每次训练后的所述初始模糊处理模型的损失值;

判断所述损失值是否都低于预设损失值;

若是,则判定所述初始模糊处理模型的训练结果满足要求。

在本实施例中,在对初始模糊处理模型每次训练后,可利用预设的损失函数计算每次训练完成后的初始模糊处理模型的损失值,并在损失值满足预设阈值或小于预设损失值时,即满足要求,则表明初始模糊处理模型达到训练要求,完成所述初始模糊处理模型的训练,以提高模糊处理模型的去模糊效果。其中,损失函数用来评价初始模糊处理模型的预测值和真实值不一样的程度,损失函数越好,通常初始模糊处理模型的性能越好。

当任一个初始模糊处理模型的损失值不小于预设损失值时,可根据损失值在初始模糊处理模型的神经网络结构中进行前向传递,调整初始模糊处理模型的相关参数,基于重新设置的相关参数对调整后的初始模糊处理模型进行重新训练,直至初始模糊处理模型的损失值小于预设损失值为止,至此所有初始模糊处理模型训练结束。

参照图2,本申请实施例中还提供一种人脸识别装置,包括:

获取模块11,用于响应于用户的人脸识别请求,获取所述用户的人脸图像,将所述人脸图像转换为频率图像,确定所述频率图像的模糊角度及模糊长度;

输入模块12,用于将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像;其中,所述模糊处理模型为预先训练好的神经网络模型;

提取模块13,用于提取所述目标人脸图像的所有人脸特征点;

匹配模块14,用于将所述所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,得到每一个人脸特征点对应的匹配结果;

判断模块15,用于计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例;

判定模块16,用于在所述成功的匹配率大于预设比例时,则判定人脸识别通过。

在本实施例中,模糊和嘈杂的人脸图像将无法有效识别,因此需要去除人脸图像上的模糊和噪声,以提高人脸图像的识别性能。在运动模糊的情况下(最常见的模糊是由于相机晃动而出现的),人脸图像模糊的发生主要是由于像素长度和像素方向的变化,对应于模糊长度及模糊角度,导致影响人脸识别,因此需要消除所有这些会影响人脸识别结果的因素。

具体的,本申请的用户可在终端上发起人脸识别请求,该终端可以是具有摄像功能的电子设备,如手机、电脑、平板、电子密码锁等等,可通过采集位于终端前的用户的人脸图像来得到所需获取的人脸图像,将人脸图像发送给服务器,由服务器进行人脸识别,并返回人脸识别结果。

在一实施例中,获取人脸图像之后,可对模糊的人脸图像进行增强处理。具体的,可通过设定更高频率范围内的新增高频信号分量来实现,这样处理之后,可以根据平滑后的低频分量预测并恢复出平滑前的实际高频分量,当平滑后的人脸图像迭加非线性滤波的高频分量时,就可以实现在去除模糊的人脸图像中的噪声时,仍然会保存原人脸图像中有用的高频信息,以避免失真。

其中,处理的噪声主要是椒盐噪声和高斯噪声,它们会降低人脸图像质量。本申请可以使用中值滤波器来消除人脸图像中的椒盐噪声,从而产生平滑的输出。椒盐噪声又称脉冲噪声,它随机改变一些像素值,在二值图像上表现为使一些像素点变白,一些像素点变黑,是由图像传感器,传输信道,解码处理等产生的黑白相间的亮暗点噪声。椒盐噪声往往由图像切割引起。高斯噪声是一种随机噪声,在任选瞬时中任取n个,其值按n个变数的高斯概率定律分布。

在一实施例中,当噪声仅出现在人脸图像中的边界像素值处时,经过中值滤波器处理可提高人脸图像的质量。如果人脸图像中存在的椒盐噪声包含更多方差,人脸图像通过中值滤波器一次迭代而没有消除噪声,则中值滤波器可通过人脸图像两次以上,以更好地去除人脸图像的椒盐噪声。

在一实施例中,可使用维纳滤波器去除高斯噪声,就均方误差而言,维纳滤波的去除效果较佳,它最大限度地减少了逆滤波和噪声平滑过程中的整体均方误差。其中,维纳滤波是对原始人脸图像的线性估计,该方法是基于随机框架,有两个独立的部分:逆滤波部分和噪声平滑部分,它不仅通过逆滤波执行反卷积,而且还通过压缩操作去除高斯噪声。

此外,去模糊是通过估计模糊参数来执行的,例如模糊角度和模糊长度,因此需要将人脸图像转换到频率,通过转换为频率图像,可以估计傅立叶频谱中的参数,以确定人脸图像的模糊角度和模糊长度。其中,人脸图像可以看做是一个定义为二维平面上的信号,该信号的幅值对应于像素的灰度(对于彩色图像则是RGB三个分量),如果我们仅仅考虑人脸图像上某一行像素,则可以将之视为一个定义在一维空间上信号,这个信号在形式上与传统的信号处理领域的时变信号是相似的。不过是一个是定义在空间域上,而另一个是定义在时间域上。所以人脸图像的频率又称为空间频率,它反映了人脸图像的像素灰度在空间中变化的情况。

其中,在傅立叶光谱中获得的人脸图像由暗线组成,这些暗线之间的距离形成了一个像素的模糊长度,当运动长度增加时,傅立叶光谱中的平行暗线就会彼此靠近。

此外,可使用神经卷积用于恢复被已知点扩散函数模糊的潜在人脸图像,将频率图像、模糊角度、模糊长度作为模糊处理模型的输入,并给出去模糊的人脸图像作为输出,得到目标人脸图像。其中,点扩散函数,对光学系统来讲,输入物为一点光源时其输出像的光场分布,称为点扩散函数,也称点扩展函数。在数学上点光源可用δ函数(点脉冲)代表,输出像的光场分布叫做脉冲响应,所以点扩散函数也就是光学系统的脉冲响应函数。

在完成人脸图像的去噪声和去模糊之后,使用特征提取的方法对处理的目标人脸图像进行特征提取,对眼睛、耳朵、鼻子、嘴巴、下巴、脸宽、眼角宽度等等人脸上的器官图像做处理。例如,通过人脸检测算法从目标人脸图像中提取N个人脸特征点;所述人脸检测算法为dlib人脸特征点检测算法,所述N个人脸特征点包括脸部轮廓特征点、眉部特征点、鼻翼特征点、鼻孔特征点、眼部特征点和唇部特征点等等。

所有标准人脸特征点可以是目标用户的所有人脸特征点,该目标用户可以为终端的机主,可预先通过摄像头拍摄目标用户的人脸,得到标准人脸图像,提取该目标用户的标准人脸图像的所有标准人脸特征点,将所有标准人脸特征点存储在数据库中。

匹配时,将所有人脸特征点与预存的所有标准人脸特征点进行一一匹配。具体的,可以将每个人脸特征点与不同的标准人脸特征点进行匹配,得到每个人脸特征点对应的匹配结果。以任一个人脸特征点为例,若所有标准人脸特征点中存在与该人脸特征点相匹配的标准人脸特征点,则该人脸特征点对应的匹配结果为成功,反之则失败,以此类推,直至完成所有人脸特征点的匹配。此外,还可获取每个人脸特征点及每个标准人脸特征点的类型,将属于相同类型的人脸特征点及标准人脸特征点才进行匹配,以提高匹配效率。例如,当人脸特征点为眉部特征点时,则同时获取为眉部特征点的标准人脸特征点,两者都属于人脸眉部的类型,将两者进行匹配。

每一个人脸特征点对应的匹配结果为成功或失败,统计匹配结果为成功的数量及失败的数量,将成功的数量与失败的数量进行相加,得到匹配总数,并计算匹配结果为成功的数量与匹配总数的比例,得到匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例,在成功的匹配率大于预设比例时,则判定人脸识别通过,否则人脸识别失败。其中,预设比例可自定义设置,比如98%。

如上所述,可以理解地,本申请中提出的所述人脸识别装置的各组成部分可以实现如上所述人脸识别方法任一项的功能,具体结构不再赘述。

参照图3,本申请实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储人脸图像、标准人脸特征点等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种人脸识别方法。

上述处理器执行上述的人脸识别方法,包括:

响应于用户的人脸识别请求,获取所述用户的人脸图像,将所述人脸图像转换为频率图像,确定所述频率图像的模糊角度及模糊长度;

将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像;其中,所述模糊处理模型为预先训练好的神经网络模型;

提取所述目标人脸图像的所有人脸特征点;

将所述所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,得到每一个人脸特征点对应的匹配结果;

计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例;

若是,则判定人脸识别通过。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种人脸识别方法,包括步骤:

响应于用户的人脸识别请求,获取所述用户的人脸图像,将所述人脸图像转换为频率图像,确定所述频率图像的模糊角度及模糊长度;

将所述频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像;其中,所述模糊处理模型为预先训练好的神经网络模型;

提取所述目标人脸图像的所有人脸特征点;

将所述所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,得到每一个人脸特征点对应的匹配结果;

计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例;

若是,则判定人脸识别通过。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

综上所述,本申请的最大有益效果在于:

本申请所提供的一种人脸识别方法、装置、设备及存储介质,通过响应于用户的人脸识别请求,获取用户的人脸图像,将人脸图像转换为频率图像,确定频率图像的模糊角度及模糊长度,将频率图像、模糊角度及模糊长度输入模糊处理模型对所述频率图像进行去模糊处理,得到目标人脸图像,提取目标人脸图像的所有人脸特征点,将所有人脸特征点与预存的所有标准人脸特征点进行一一匹配,计算匹配结果为成功的匹配率,并判断所述成功的匹配率是否大于预设比例,在该成功的匹配率大于预设比例时,则判定人脸识别通过,从而通过人脸图像的模糊角度及模糊长度,利用模糊处理模型对人脸图像进行自动去模糊处理,以利用去模糊处理的目标人脸图像进行人脸匹配,因此即使人脸或相机的移动导致人脸图像的运动模糊,也能进行人脸识别,提高人脸识别的成功率。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

相关技术
  • 人脸识别方法、人脸识别装置、存储介质及电子设备
  • 人脸识别模型的训练方法、人脸识别方法、装置、设备及存储介质
技术分类

06120113791909