掌桥专利:专业的专利平台
掌桥专利
首页

神经网络训练及人脸识别方法、装置、设备及存储介质

文献发布时间:2023-06-19 12:10:19


神经网络训练及人脸识别方法、装置、设备及存储介质

技术领域

本公开涉及深度学习技术领域,具体而言,涉及一种神经网络训练及人脸识别方法、装置、设备及存储介质。

背景技术

人脸识别是目前应用较广泛的生物识别技术之一,人脸识别可以应用于多种场景中,例如人证比对场景、门禁通行场景和监控罪犯搜索场景等。

一般的,人脸识别过程中,图像采集设备可以实时的、连续的采集用户的多帧人脸图像,从多帧人脸图像中选择一帧人脸图像进行检测,确定用户的信息、或者确定用户的人脸图像是否能够与存储的任一图像匹配;由于采集的多帧人脸图像的质量存在差异,故对人脸图像的质量进行检测的方法尤为重要。

发明内容

有鉴于此,本公开至少提供一种神经网络训练及人脸识别方法、装置、设备及存储介质。

第一方面,本公开提供了一种神经网络训练方法,包括:

获取人脸图像集,所述人脸图像集包括多个用户的人脸图像,其中,每个用户的人脸图像对应一个类中心;

对每帧所述人脸图像进行特征提取,得到所述人脸图像对应的脸部特征数据;

基于所述脸部特征数据、以及所述人脸图像集对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值;

利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络。

上述方法中,通过对获取的人脸图像进行特征提取,得到人脸图像对应的脸部特征数据;由于用户对应的类中心特征数据为基于用户对应的多帧人脸图像生成的,故用户的类中心特征数据能够表征用户的较准确、较清晰的脸部特征;再可以基于人脸图像对应的脸部特征数据、与人脸图像集对应的多个用户的类中心特征数据,较准确的确定各人脸图像的图像质量值;进而利用多帧人脸图像和每帧人脸图像的图像质量值,训练目标神经网络,训练后的目标神经网络可以直接检测得到每帧待检测图像的图像质量,提高了图像质量检测的效率。

一种可能的实施方式中,根据下述步骤确定所述人脸图像集对应的多个用户的类中心特征数据:

利用所述人脸图像集对设置的人脸识别网络进行训练,得到训练后的人脸识别网络;

基于所述训练后的人脸识别网络,确定每个用户对应的所述类中心特征数据。

采用上述方法,由于训练后的人脸识别网络中包括的人脸图像集对应多个用户的脸部特征,故可以基于训练后的人脸识别网络,能够较准确、较快速确定每个用户的类中心特征数据,为后续确定每帧人脸图像的图像质量值提供了数据支持。

一种可能的实施方式中,所述基于所述脸部特征数据、以及所述人脸图像集对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值,包括:

针对所述人脸图像集中的每帧人脸图像,确定所述人脸图像对应的所述脸部特征数据、与所述人脸图像对应的所述类中心特征数据之间的余弦距离,将所述余弦距离确定为所述人脸图像的所述图像质量值。

这里,确定人脸图像对应的脸部特征数据与人脸图像对应的类中心特征数据之间的余弦距离,将该余弦距离确定为人脸图像的图像质量值;由于用户对应的类中心特征数据为表征用户的较准确的、较清晰的脸部特征,故在余弦距离较近时,则表征人脸图像对应的脸部特征数据与类中心特征数据之间的差别较小,该人脸图像的图像质量较佳。

一种可能的实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括:

确定每个所述用户对应的多帧人脸图像分别对应的图像质量值中的图像质量极值;

对所述图像质量极值进行调整,生成调整后的图像质量极值;

基于所述调整后的图像质量极值,对每帧所述人脸图像对应的所述图像质量值进行归一化处理,生成归一化处理后的图像质量值。

采用上述方法,对人脸图像的图像质量值进行归一化处理,使得归一化处理后的图像质量值的分布较为均匀,再使用归一化处理后的图像质量值、和人脸图像,训练目标神经网络时,可以使得训练后的目标神经网络的性能较好。

一种可能的实施方式中,所述对所述图像质量极值进行调整,生成调整后的图像质量极值,包括:

基于所述人脸图像集中包括的多帧人脸图像分别对应的图像质量值,确定所述人脸图像集对应的平均质量值;

基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整。

一种可能的实施方式中,所述基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整,包括如下至少一项:

在所述最大图像质量值与所述平均质量值之间的第一差值、大于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的所述平均质量值与所述最大图像质量值之间的差值确定为调整后的最小图像质量值;

在所述最大图像质量值与所述平均质量值之间的第一差值、小于或等于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的平均质量值与所述最小图像质量值之间的差值确定为调整后的最大图像质量值。

一种可能的实施方式中,在所述利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括:

针对所述人脸图像集中的第一人脸图像,基于所述第一人脸图像对应的所述脸部特征数据、和除所述第一人脸图像对应的第一用户之外的其他用户的所述类中心特征数据,确定所述第一用户与所述其他用户之间的脸部相似度;

基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

考虑到针对第一人脸图像,若在除第一人脸图像对应的第一用户之外的其他用户中,存在与第一用户的脸部相似的相似用户时,相似用户的脸部特征数据会对第一人脸图像的脸部特征数据产生影响,比如,会造成确定的第一人脸图像对应的图像质量值下降,为了缓解上述影响,可以确定第一用户与其他用户之间的脸部相似度,基于脸部相似度,对第一人脸图像的图像质量值进行补偿处理,生成补偿处理后的图像质量值;进而再使用补偿处理后的图像质量值、和人脸图像集,训练目标神经网络时,可以使得训练后的目标神经网络的性能较好。

一种可能的实施方式中,在所述脸部相似度的数量为多个的情况下,所述基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值,包括:

按照从大到小的顺序,从多个所述脸部相似度中选择预设数量个脸部相似度;或者从多个所述脸部相似度中选择大于预设相似度的脸部相似度;

基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

一种可能的实施方式中,所述基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值,包括:

确定所述选择的脸部相似度的和值与影响系数的乘积;

将所述乘积与所述第一人脸图像的所述图像质量值求和,得到补偿处理后的图像质量值。

第二方面,本公开提供了一种人脸识别方法,包括:

获取图像采集设备采集的目标用户的多帧待识别图像;

利用第一方面任一所述的神经网络训练方法训练得到的目标神经网络,对所述多帧待识别图像进行检测,确定每帧所述待识别图像的图像质量值;

从所述多帧待识别图像中,选择对应的所述图像质量值最大的目标待识别图像;

对所述目标待识别图像进行识别,得到所述目标用户的信息。

以下装置、电子设备等的效果描述参见上述方法的说明,这里不再赘述。

第三方面,本公开提供了一种神经网络训练装置,包括:

第一获取模块,用于获取人脸图像集,所述人脸图像集包括多个用户的人脸图像,其中,每个用户的人脸图像对应一个类中心;

提取模块,用于对每帧所述人脸图像进行特征提取,得到所述人脸图像对应的脸部特征数据;

第一确定模块,用于基于所述脸部特征数据、以及所述人脸图像集对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值;

训练模块,用于利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络。

一种可能的实施方式中,所述第一确定模块,用于根据下述步骤确定所述人脸图像集对应的多个用户的类中心特征数据:

利用所述人脸图像集对设置的人脸识别网络进行训练,得到训练后的人脸识别网络;

基于所述训练后的人脸识别网络,确定每个用户对应的所述类中心特征数据。

一种可能的实施方式中,所述第一确定模块,在基于所述脸部特征数据、以及所述人脸图像对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值时,用于:

针对所述人脸图像集中的每帧人脸图像,确定所述人脸图像对应的所述脸部特征数据、与所述人脸图像对应的所述类中心特征数据之间的余弦距离,将所述余弦距离确定为所述人脸图像的所述图像质量值。

一种可能的实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括:第一处理模块,用于:

确定每个所述用户对应的多帧人脸图像分别对应的图像质量值中的图像质量极值;

对所述图像质量极值进行调整,生成调整后的图像质量极值;

基于所述调整后的图像质量极值,对每帧所述人脸图像对应的所述图像质量值进行归一化处理,生成归一化处理后的图像质量值。

一种可能的实施方式中,所述第一处理模块,在对所述图像质量极值进行调整,生成调整后的图像质量极值时,用于:

基于所述人脸图像集中包括的多帧人脸图像分别对应的图像质量值,确定所述人脸图像集对应的平均质量值;

基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整。

一种可能的实施方式中,所述第一处理模块,在基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整时,用于:

在所述最大图像质量值与所述平均质量值之间的第一差值、大于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的所述平均质量值与所述最大图像质量值之间的差值确定为调整后的最小图像质量值;

在所述最大图像质量值与所述平均质量值之间的第一差值、小于或等于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的平均质量值与所述最小图像质量值之间的差值确定为调整后的最大图像质量值。

一种可能的实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括:第二处理模块,用于:

针对所述人脸图像集中的第一人脸图像,基于所述第一人脸图像对应的所述脸部特征数据、和除所述第一人脸图像对应的第一用户之外的其他用户的所述类中心特征数据,确定所述第一用户与所述其他用户之间的脸部相似度;

基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

一种可能的实施方式中,在所述脸部相似度的数量为多个的情况下,所述第二处理模块,在基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值时,用于:

按照从大到小的顺序,从多个所述脸部相似度中选择预设数量个脸部相似度;或者从多个所述脸部相似度中选择大于预设相似度的脸部相似度;

基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

一种可能的实施方式中,所述第二处理模块,在基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值时,用于:

确定所述选择的脸部相似度的和值与影响系数的乘积;

将所述乘积与所述第一人脸图像的所述图像质量值求和,得到补偿处理后的图像质量值。

第四方面,本公开提供了一种人脸识别装置,包括:

第二获取模块,用于获取图像采集设备采集的目标用户的多帧待识别图像;

检测模块,用于利用第一方面任一所述的神经网络训练方法训练得到的目标神经网络,对所述多帧待识别图像进行检测,确定每帧所述待识别图像的图像质量值;

选择模块,用于从所述多帧待识别图像中,选择对应的所述图像质量值最大的目标待识别图像;

第二确定模块,用于对所述目标待识别图像进行识别,得到所述目标用户的信息。

第五方面,本公开提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面或任一实施方式所述的神经网络训练方法的步骤;或执行如上述第二方面所述的人脸识别方法的步骤。

第六方面,本公开提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述第一方面或任一实施方式所述的神经网络训练方法的步骤;或执行如上述第二方面所述的人脸识别方法的步骤。

为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种神经网络训练方法的流程示意图;

图2示出了本公开实施例所提供的一种人脸识别方法的流程示意图;

图3示出了本公开实施例所提供的一种神经网络训练装置的架构示意图;

图4示出了本公开实施例所提供的一种人脸识别装置的架构示意图;

图5示出了本公开实施例所提供的一种电子设备的结构示意图;

图6示出了本公开实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

一般的,用于进行图像质量检测的神经网络会将人脸图像的质量分为几个固定维度,例如固定维度包括光照、模糊度、人脸位姿等等,再可以使用图像处理方法确定人脸图像在每个维度下的质量分数,并将人脸图像在各个维度下的质量分数进行处理,得到人脸图像的整体质量分数。以光照维度为例,可以使用像素值统计的方法确定人脸图像的光照强度,判断人脸图像是否存在过暗或过曝的情况。但是,确定人脸图像在各个维度下的质量分数的方法存在一定的局限性,使得得到的整体质量分数的过程较为繁琐、效率较低,例如光照维度下的质量分数的确定过程中,需要根据人脸图像中包括的人脸肤色调整不同的参数、和/或阈值,使得光照维度下的质量分数的确定方法的鲁棒性不高。

为了缓解上述问题,本公开实施例提供了一种神经网络训练及人脸识别方法、装置、设备及存储介质。

针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本公开实施例进行理解,首先对本公开实施例所公开的一种神经网络训练方法、人脸识别方法进行详细介绍。本公开实施例所提供的神经网络训练方法、人脸识别方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该神经网络训练方法、人脸识别方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

参见图1所示,为本公开实施例所提供的神经网络训练方法的流程示意图,该方法包括S101-S104,其中:

S101,获取人脸图像集,所述人脸图像集包括多个用户的人脸图像,其中,每个用户的人脸图像对应一个类中心;

S102,对每帧所述人脸图像进行特征提取,得到所述人脸图像对应的脸部特征数据;

S103,基于所述脸部特征数据、以及所述人脸图像集对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值;

S104,利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络。

上述方法中,通过对获取的人脸图像进行特征提取,得到人脸图像对应的脸部特征数据;由于用户对应的类中心特征数据为基于用户对应的多帧人脸图像生成的,故用户的类中心特征数据能够表征用户的较准确、较清晰的脸部特征;再可以基于人脸图像对应的脸部特征数据、与人脸图像集对应的多个用户的类中心特征数据,较准确的确定各人脸图像的图像质量值;进而利用多帧人脸图像和每帧人脸图像的图像质量值,训练目标神经网络,训练后的目标神经网络可以直接检测得到每帧待检测图像的图像质量,提高了图像质量检测的效率。

针对S101-S104进行具体说明。

针对S101以及S102:

获取人脸图像集,该人脸图像集中包括多个用户的人脸图像,其中,每帧人脸图像对应一个用户,人脸图像集中每个用户存在有多帧人脸图像,每个用户的人脸图像对应一个类中心。

一种可选实施方式中,可以根据下述步骤确定所述人脸图像集对应的多个用户的类中心特征数据:

步骤一,利用所述人脸图像集对设置的人脸识别网络进行训练,得到训练后的人脸识别网络;

步骤二,基于所述训练后的人脸识别网络,确定每个用户对应的所述类中心特征数据。

将多帧人脸图像输入至设置的人脸识别网络中,对人脸识别网络进行训练,得到训练后的人脸识别网络。其中,人脸识别网络的结构可以根据需要进行设置。进而可以将训练后的人脸识别网络中,最后一个全连接层所包含的各个用户分别对应的参数数据,作为每个用户的类中心特征数据。

具体的,人脸识别网络中最后一个全连接层的参数数据的尺寸为[d,N],全连接层的参数数据中包含有N个d维的特征向量,每个d维的特征向量对应一个用户,即全连接层的参数数据中包含有N个用户分别对应的d维类中心特征数据。进而,可以将人脸识别网络中最后一个全连接层所包含的与每个用户对应的参数数据,作为该用户的类中心特征数据。

采用上述方法,由于训练后的人脸识别网络中包括的人脸图像集对应多个用户的脸部特征,故可以基于训练后的人脸识别网络,能够较准确、较快速确定每个用户的类中心特征数据,为后续确定每帧人脸图像的图像质量值提供了数据支持。

再可以使用人脸识别网络对每帧人脸图像进行特征提取,得到人脸图像对应的脸部特征数据,进而可以得到多帧人脸图像分别对应的脸部特征数据。比如,可以将人脸识别网络的特征提取层输出的特征数据,作为人脸图像对应的脸部特征数据。其中,人脸图像对应的脸部特征数据可以为表征脸部特征的向量。

针对S103以及S104:

假设人脸图像集中包括M帧人脸图像,M帧人脸图像属于N个用户,则可以得到N个用户中每个用户对应的类中心特征数据。其中,每个用户的类中心特征数据为通过该用户对应的多帧人脸图像得到的。M和N为正整数,且M≥N。进而可以针对每帧人脸图像,根据该人脸图像对应的脸部特征数据、以及该人脸图像对应的用户的类中心特征数据,确定该人脸图像的图像质量值。

一种可选实施方式中,S103中,基于所述脸部特征数据、以及所述人脸图像对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值,包括:针对所述人脸图像集中的每帧人脸图像,确定所述人脸图像对应的所述脸部特征数据、与所述人脸图像对应的所述类中心特征数据之间的余弦距离,将所述余弦距离确定为所述人脸图像的所述图像质量值。

针对人脸图像集中的每帧人脸图像,通过余弦距离公式,确定该人脸图像对应的脸部特征数据、与人脸图像对应的类中心特征数据之间的余弦距离,将计算得到的余弦距离确定为人脸图像的图像质量值。故得到了人脸图像集中每帧人脸图像对应的图像质量值。其中,该图像质量值可以表征该人脸图像的质量状况。比如,人脸图像的图像质量值越大,则表征人脸图像的图像质量越好。

进而,可以利用人脸图像集和确定的各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络。其中,用于进行图像质量检测的目标神经网络的网络结构可以根据实际情况进行设置,比如,目标神经网络的骨干网络backbone可以使用小规模网络,具体可以是MobileNetV2等轻量级卷积神经网络;再使用sigmoid函数进行图像质量分值的预测,并可以使用L2损失函数确定目标神经网络的损失值等。

或者还可以对每帧人脸图像的图像质量值进行处理,生成处理后的图像质量值;再可以利用人脸图像集、以及确定的各人脸图像分别对应的处理后的图像质量值,训练目标神经网络。其中,可以对每帧人脸图像的图像质量值进行归一化处理和/或补偿处理,对每帧人脸图像的图像质量值进行补偿处理可以消除脸部相似的其他用户的其他人脸图像对当前人脸图像的图像质量值产生的影响。

这里,确定人脸图像对应的脸部特征数据与人脸图像对应的类中心特征数据之间的余弦距离,将该余弦距离确定为人脸图像的图像质量值;由于用户对应的类中心特征数据为表征用户的较准确的、较清晰的脸部特征,故在余弦距离较近时,则表征人脸图像对应的脸部特征数据与类中心特征数据之间的差别较小,该人脸图像的图像质量较佳。

下述对每帧人脸图像的图像质量值进行归一化处理的过程进行示例性说明。

一种可选实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括步骤A1-A3,其中:

步骤A1,确定每个所述用户对应的多帧人脸图像分别对应的图像质量值中的图像质量极值;

步骤A2,对所述图像质量极值进行调整,生成调整后的图像质量极值;

步骤A3,基于所述调整后的图像质量极值,对每帧所述人脸图像对应的所述图像质量值进行归一化处理,生成归一化处理后的图像质量值。

采用上述方法,对人脸图像的图像质量值进行归一化处理,使得归一化处理后的图像质量值的分布较为均匀,再使用归一化处理后的图像质量值、和人脸图像,训练目标神经网络时,可以使得训练后的目标神经网络的性能较好。

在步骤A1中,可以针对人脸图像集中的每个用户,确定该用户对应的多帧人脸图像以及每帧人脸图像对应的图像质量值,再可以从该用户对应的多帧人脸图像分别对应的图像质量值中,确定该用户对应的图像质量极值,即确定最大图像质量值和最小图像质量值;进而可以得到人脸图像集中各个用户分别对应的图像质量极值。

在步骤A2中,可以对图像质量极值进行调整,生成调整后的图像质量极值。一种可选实施方式中,步骤A2,对所述图像质量极值进行调整,生成调整后的图像质量极值,可以包括:

步骤A21,基于所述人脸图像集中包括的多帧人脸图像分别对应的图像质量值,确定所述人脸图像集对应的平均质量值;

步骤A22,基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整。

在步骤A21中,可以将人脸图像集中的多帧人脸图像分别对应的图像质量值求平均,得到人脸图像集对应的平均质量值s

在步骤A22中,可以分别将人脸图像集中的每个用户作为目标用户,使用平均质量值,对目标用户对应的最大图像质量值或者最小图像质量值进行调整,比如,在对最大图像质量值进行调整时,可以生成调整后的最大图像质量值;在对最小图像质量值进行调整时,可以生成调整后的最小图像质量值。

一种可选实施方式中,步骤A22中,基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整,包括如下至少一项:

方式一、在所述最大图像质量值与所述平均质量值之间的第一差值、大于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的所述平均质量值与所述最大图像质量值之间的差值确定为调整后的最小图像质量值;

方式二、在所述最大图像质量值与所述平均质量值之间的第一差值、小于或等于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的平均质量值与所述最小图像质量值之间的差值确定为调整后的最大图像质量值。

针对目标用户i,在目标用户i的最大图像质量值、最小图像质量值和平均质量值之间的关系为:s

s′

其中,s′

进而,在步骤A3中,可以基于目标用户对应的最大图像质量值、和调整后的最小图像质量值,对目标用户对应的每帧人脸图像的图像质量值进行归一化处理,生成归一化处理后的图像质量值。

比如,可以根据下述公式(2)生成归一化处理后的图像质量值:

其中,s′

反之,在目标用户i的最大图像质量值、最小图像质量值和平均质量值之间的关系为:s

s′

其中,s′

进而,在步骤A3中,可以基于目标用户对应的最小图像质量值、和调整后的最大图像质量值,对目标用户对应的每帧人脸图像的图像质量值进行归一化处理,生成归一化处理后的图像质量值。

比如,可以根据下述公式(4)生成归一化处理后的图像质量值:

示例性的,还可以不对图像质量极值进行调整,直接使用调整前的图像质量极值,对目标用户对应的每帧人脸图像的图像质量值进行归一化处理,生成归一化处理后的图像质量值。

通过步骤A1至步骤A3的过程,可以得到每帧人脸图像对应的归一化处理后的图像质量值。

下述对每帧人脸图像的图像质量值进行补偿处理的过程进行示例性说明。

一种可选实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还可以包括步骤B1和步骤B2,其中:

步骤B1,针对所述人脸图像集中的第一人脸图像,基于所述第一人脸图像对应的所述脸部特征数据、和除所述第一人脸图像对应的第一用户之外的其他用户的所述类中心特征数据,确定所述第一用户与所述其他用户之间的脸部相似度;

步骤B2,基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

考虑到针对第一人脸图像,若在除第一人脸图像对应的第一用户之外的其他用户中,存在与第一用户的脸部相似的相似用户时,相似用户的脸部特征数据会对第一人脸图像的脸部特征数据产生影响,比如,会造成确定的第一人脸图像对应的图像质量值下降,为了缓解上述影响,可以确定第一用户与其他用户之间的脸部相似度,基于脸部相似度,对第一人脸图像的图像质量值进行补偿处理,生成补偿处理后的图像质量值;进而再使用补偿处理后的图像质量值、和人脸图像,训练目标神经网络时,可以使得训练后的目标神经网络的性能较好。

在步骤B1中,可以将人脸图像集中的每帧人脸图像,分别作为第一人脸图像,计算第一人脸图像对应的脸部特征数据、和除第一人脸图像对应的第一用户之外的其他用户的类中心特征数据之间的余弦距离,将该余弦距离确定为第一用户与其他用户之间的脸部相似度。

比如,如若多帧人脸图像中包括用户n

在步骤B2中,一种可选实施方式中,在所述脸部相似度的数量为多个的情况下,所述基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值,包括:

步骤B21,按照从大到小的顺序,从多个所述脸部相似度中选择预设数量个脸部相似度;或者从多个所述脸部相似度中选择大于预设相似度的脸部相似度;

步骤B22,基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

在步骤B21中,方式一、可以按照脸部相似度从大到小的顺序,从多个脸部相似度中选择预设数量个脸部相似度,比如,可以从多个脸部相似度中选择5个相似度较高的脸部相似度。

这里,预设数量可以与人脸图像集中包括的用户数量正相关,比如,包括的用户数量越多,则预设数量的值越大,类似的,包括的用户数量越少,则预设数量的值越小。和/或,预设数量可以与人脸图像集中包括的脸部相似的用户数量有关或是与人脸图像集中各用户之间的人脸相似程度有关,通常脸部相似的用户数量越多,和/或脸部相似程度越高,则预设数量的值越大,类似的,脸部相似的用户数量越少,和/或脸部相似程度越低,则预设数量的值越小。

方式二中,可以设置预设相似度,从多个脸部相似度中选择大于预设相似度的脸部相似度。其中,预设相似度的大小,可以根据需要进行设置,比如,预设相似度可以为0.7或0.8等。

在步骤B22中,一种可选实施方式中,基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值,可以包括:

步骤一、确定所述选择的脸部相似度的和值与影响系数的乘积;

步骤二、将所述乘积与所述第一人脸图像的所述图像质量值求和,得到补偿处理后的图像质量值。

可以根据下述公式(5)生成补偿处理后的图像质量值:

其中,x

这里,影响系数λ为选择的脸部相似度对第一人脸图像的图像质量分的影响程度系数,影响系数的值不能取太高,影响系数的值太高易造成图像质量值失真。比如,λ可以为0.03。实施时,可以经过多次试验的方式,得到影响系数的值。

示例性的,在对图像质量值进行处理包括归一化处理和补偿处理时,可以先对图像质量值进行归一化处理,再进行补偿处理;或者也可以先对图像质量值进行补偿处理,再进行归一化处理。

在先对图像质量值进行归一化处理,再进行补偿处理时,公式(5)中的f

参见图2所示,为本公开实施例所提供的人脸识别方法的流程示意图,该方法包括S201-S204,其中:

S201,获取图像采集设备采集的目标用户的多帧待识别图像;

S202,利用上述实施例所述的神经网络训练方法训练得到的目标神经网络,对所述多帧待识别图像进行检测,确定每帧所述待识别图像的图像质量值;

S203,从所述多帧待识别图像中,选择对应的所述图像质量值最大的目标待识别图像;

S204,对所述目标待识别图像进行识别,得到所述目标用户的信息。

在门禁识别场景中,图像采集设备可以为门禁系统上设置的摄像头;在监控场景中,图像采集设备可以为在目标场所内设置的摄像头等。图像采集设备可以实时的采集目标用户的多帧待识别图像。

将采集的多帧待识别图像分别输入至目标神经网络中,对每帧待识别图像的图像质量进行检测,确定待识别图像的图像质量值。再可以从多帧待识别图像中,选择图像质量值最大的待识别图像,作为目标待识别图像。最后,可以对目标待识别图像进行识别,得到目标用户的信息。比如,目标用户的信息可以为目标用户的姓名、年龄、部门、工号、脸部特征等等。

在门禁识别场景中,可以将目标待识别图像与存储的多帧样本图像进行匹配,若匹配成功,则确定目标用户可以通过门禁系统;若匹配不成功,则确定目标用户不可以通过门禁系统。

在人脸图像入库场景中,可以将确定的目标待识别图像与目标待识别图像包含的目标用户的信息关联后进行存储。

本公开中的目标神经网络为利用上述实施例所述的神经网络训练方法训练得到的,该目标神经网络可以较准确的确定每帧待识别图像的图像质量值,进而可以基于每帧待识别图像的图像质量值,从多帧待识别图像中,选择图像质量值最大的目标待识别图像,该目标待识别图像的图像质量较佳,进而基于目标待识别图像,可以较准确的得到目标用户的信息。

本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于相同的构思,本公开实施例还提供了一种神经网络训练装置,参见图3所示,为本公开实施例提供的神经网络训练装置的架构示意图,包括第一获取模块301、提取模块302、第一确定模块303、训练模块304,具体的:

第一获取模块301,用于获取人脸图像集,所述人脸图像集包括多个用户的人脸图像,其中,每个用户的人脸图像对应一个类中心;

提取模块302,用于对每帧所述人脸图像进行特征提取,得到所述人脸图像对应的脸部特征数据;

第一确定模块303,用于基于所述脸部特征数据、以及所述人脸图像集对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值;

训练模块304,用于利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络。

一种可能的实施方式中,所述第一确定模块303,用于根据下述步骤确定所述人脸图像集对应的多个用户的类中心特征数据:

利用所述人脸图像集对设置的人脸识别网络进行训练,得到训练后的人脸识别网络;

基于所述训练后的人脸识别网络,确定每个用户对应的所述类中心特征数据。

一种可能的实施方式中,所述第一确定模块303,在基于所述脸部特征数据、以及所述人脸图像对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值时,用于:

针对所述人脸图像集中的每帧人脸图像,确定所述人脸图像对应的所述脸部特征数据、与所述人脸图像对应的所述类中心特征数据之间的余弦距离,将所述余弦距离确定为所述人脸图像的所述图像质量值。

一种可能的实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括:第一处理模块305,用于:

确定每个所述用户对应的多帧人脸图像分别对应的图像质量值中的图像质量极值;

对所述图像质量极值进行调整,生成调整后的图像质量极值;

基于所述调整后的图像质量极值,对每帧所述人脸图像对应的所述图像质量值进行归一化处理,生成归一化处理后的图像质量值。

一种可能的实施方式中,所述第一处理模块305,在对所述图像质量极值进行调整,生成调整后的图像质量极值时,用于:

基于所述人脸图像集中包括的多帧人脸图像分别对应的图像质量值,确定所述人脸图像集对应的平均质量值;

基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整。

一种可能的实施方式中,所述第一处理模块305,在基于所述平均质量值,对每个用户对应的多帧人脸图像的图像质量极值中的最大图像质量值或者最小图像质量值进行调整时,用于:

在所述最大图像质量值与所述平均质量值之间的第一差值、大于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的所述平均质量值与所述最大图像质量值之间的差值确定为调整后的最小图像质量值;

在所述最大图像质量值与所述平均质量值之间的第一差值、小于或等于所述平均质量值与所述最小图像质量值之间的第二差值的情况下,将预设倍数的平均质量值与所述最小图像质量值之间的差值确定为调整后的最大图像质量值。

一种可能的实施方式中,在利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络之前,还包括:第二处理模块306,用于:

针对所述人脸图像集中的第一人脸图像,基于所述第一人脸图像对应的所述脸部特征数据、和除所述第一人脸图像对应的第一用户之外的其他用户的所述类中心特征数据,确定所述第一用户与所述其他用户之间的脸部相似度;

基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

一种可能的实施方式中,在所述脸部相似度的数量为多个的情况下,所述第二处理模块306,在基于所述脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值时,用于:

按照从大到小的顺序,从多个所述脸部相似度中选择预设数量个脸部相似度;或者从多个所述脸部相似度中选择大于预设相似度的脸部相似度;

基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值。

一种可能的实施方式中,所述第二处理模块306,在基于所述选择的脸部相似度,对所述第一人脸图像的所述图像质量值进行补偿处理,生成补偿处理后的图像质量值时,用于:

确定所述选择的脸部相似度的和值与预设系数的乘积;

将所述乘积与所述第一人脸图像的所述图像质量值求和,得到补偿处理后的图像质量值。

基于相同的构思,本公开实施例还提供了一种人脸识别装置,参见图4所示,为本公开实施例提供的人脸识别装置的架构示意图,包括第二获取模块401、检测模块402、选择模块403、第二确定模块404,具体的:

第二获取模块401,用于获取图像采集设备采集的目标用户的多帧待识别图像;

检测模块402,用于上述实施例所述的神经网络训练方法训练得到的目标神经网络,对所述多帧待识别图像进行检测,确定每帧所述待识别图像的图像质量值;

选择模块403,用于从所述多帧待识别图像中,选择对应的所述图像质量值最大的目标待识别图像;

第二确定模块404,用于对所述目标待识别图像进行识别,得到所述目标用户的信息。

在一些实施例中,本公开实施例提供的装置具有的功能或包含的模板可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。

基于同一技术构思,本公开实施例还提供了一种电子设备。参照图5所示,为本公开实施例提供的电子设备的结构示意图,包括处理器501、存储器502、和总线503。其中,存储器502用于存储执行指令,包括内存5021和外部存储器5022;这里的内存5021也称内存储器,用于暂时存放处理器501中的运算数据,以及与硬盘等外部存储器5022交换的数据,处理器501通过内存5021与外部存储器5022进行数据交换,当电子设备500运行时,处理器501与存储器502之间通过总线503通信,使得处理器501在执行以下指令:

获取人脸图像集,所述人脸图像集包括多个用户的人脸图像,其中,每个用户的人脸图像对应一个类中心;

对每帧所述人脸图像进行特征提取,得到所述人脸图像对应的脸部特征数据;

基于所述脸部特征数据、以及所述人脸图像集对应的多个用户的类中心特征数据,确定所述人脸图像集中各人脸图像的图像质量值;

利用所述人脸图像集以及确定的所述各人脸图像的图像质量值,训练用于进行图像质量检测的目标神经网络。

基于同一技术构思,本公开实施例还提供了一种电子设备。参照图6所示,为本公开实施例提供的电子设备的结构示意图,包括处理器601、存储器602、和总线603。其中,存储器602用于存储执行指令,包括内存6021和外部存储器6022;这里的内存6021也称内存储器,用于暂时存放处理器601中的运算数据,以及与硬盘等外部存储器6022交换的数据,处理器601通过内存6021与外部存储器6022进行数据交换,当电子设备600运行时,处理器601与存储器602之间通过总线603通信,使得处理器601在执行以下指令:

获取图像采集设备采集的目标用户的多帧待识别图像;

利用上述实施例所述的神经网络训练方法训练得到的目标神经网络,对所述多帧待识别图像进行检测,确定每帧所述待识别图像的图像质量值;

从所述多帧待识别图像中,选择对应的所述图像质量值最大的目标待识别图像;

对所述目标待识别图像进行识别,得到所述目标用户的信息。

此外,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的神经网络训练方法、人脸识别方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的神经网络训练方法、人脸识别方法的步骤,具体可参见上述方法实施例,在此不再赘述。

其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

相关技术
  • 神经网络训练及人脸识别方法、装置、设备及存储介质
  • 网络训练及人脸活体检测方法、装置、设备及存储介质
技术分类

06120113194486