掌桥专利:专业的专利平台
掌桥专利
首页

一种基于人群差异的人脸识别方法

文献发布时间:2023-06-19 19:28:50


一种基于人群差异的人脸识别方法

技术领域

本申请属于人脸识别技术领域,更具体地说,是涉及一种基于人群差异的人脸识别方法。

背景技术

因为深度学习的快速发展,人脸识别也得到了快速的发展,精度和速度均得到非常大的提升。现有人脸识别技术主要分为两类,第一类是基于传统的手动设计的人脸特征,得到人脸识别的结果;第二类方法则是基于深度学习自动提取特征,将训练数据中自动提取的特征,训练得到人脸识别模型。这两类方法一般都用于进行通用型的人脸识别。

然而,在人脸识别的应用中,人脸数据起着决定性的作用。因为大量的数据来自公开数据集,数据的分布往往很不平衡,例如大多数公开数据集都是西方人脸,且大多数是中青年。这会导致训练出来的人脸识别模型在分布较少的数据类别,如东方人脸,小孩或老人,人群识别效果较差。无论是早期的传统方法还是最新的深度学习提取人脸特征,由于针对的是大范围人群,其训练数据的分布决定了模型对不同人群的识别效果;例如,因为分布集中在中青年,训练得到的模型在老人和小孩人群中的人脸识别效果并不好;这种人群差异情况不仅体现在年龄中,也体现在地理人种中。

发明内容

本申请实施例的目的在于提供一种基于人群差异的人脸识别方法,以解决现有技术在人脸识别过程中存在的因数据的分布不平衡引起的部分人群的人脸识别准确率低的技术问题。

为实现上述目的,本申请采用的技术方案是:提供一种基于人群差异的人脸识别方法,包括:

步骤S01,根据地理人种与年龄段的分类分别采集若干人脸训练数据集;

步骤S02,分别将每个类别的人脸训练数据集输入至人脸识别模型M

步骤S03,计算每个类别的误报率FPR的标准差σ

步骤S04,当对应类别的标准差σ

步骤S05,在人脸识别模型M

步骤S06,根据新的损失函数loss

优选地,在步骤S01中,根据地理人种可以分为非洲地理人种、亚洲地理人种、欧洲地理人种以及印第安地理人种,按照年龄段可以分为幼年、少年、青年以及老年。

优选地,在步骤S01中,非洲地理人种、亚洲地理人种、欧洲地理人种以及印第安地理人种的人脸训练数据集的数量相同;幼年、少年、青年以及老年的人脸训练数据集的数量相同。

优选地,在步骤S02中,所述误报率FPR是被错误报告为阳性的阴性情况的比例,误报率FPR的计算公式为:

其中,FP是被模型预测为正类的负样本,TN是被模型预测为负类的负样本;

优选地,所述漏报率FNR是被错误地报道为阴性的阳性情况的比例,漏报率FNR的计算公式为:

其中,FN是被模型预测为负类的正样本,TP是被模型预测为正类的正样本。

优选地,在步骤S02中,人脸识别模型M

优选地,在步骤S04中,当对应类别的标准差σ

优选地,在步骤S04中,当对应类别的标准差σ

优选地,所述人脸识别模型M

优选地,在步骤S05中,在人脸识别模型M

定义ArcFace的损失函数loss为:

其中,N为样本的数量,θ是输入的特征x和权重w两个向量之间的夹角,s为超参数代表特征的缩放,m为超参数代表角度的变化;

通过FPR的定义,记录满足误识别的情况cosθ

将FPR引入到ArcFace的损失函数loss中,则:

其中,α为缩放系数,将γ

本申请提供的基于人群差异的人脸识别方法,与现有技术相比,根据地理人种与年龄段的分类,验证每个类别的在不同相似度阈值T

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的基于人群差异的人脸识别方法的流程示意图;

图2为基于图1中的方法根据地理人种分类验证每个地理人种类别的在不同相似度阈值T

图3为基于图1中的方法根据地理人种分类验证每个地理人种类别的在不同相似度阈值T

具体实施方式

为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。

需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

请一并参阅图1,现对本申请实施例提供的基于人群差异的人脸识别方法进行说明。所述基于人群差异的人脸识别方法,包括:

步骤S01,根据地理人种与年龄段的分类分别采集若干人脸训练数据集;

步骤S02,分别将每个类别的人脸训练数据集输入至人脸识别模型M

步骤S03,计算每个类别的误报率FPR的标准差σ

步骤S04,当对应类别的标准差σ

步骤S05,在人脸识别模型M

步骤S06,根据新的损失函数loss

可以理解的是,在步骤S01中,选用了地理人种与年龄段进行分类,这是因为大多数公开数据集都是西方人脸,且大多数是中青年,如东方人脸,小孩或老人,人群识别效果较差。

同时请参阅图2与图3,例如根据地理人种可以分为非洲地理人种、亚洲地理人种、欧洲地理人种以及印第安地理人种,按照年龄段可以分为幼年、少年、青年以及老年。

优选地,非洲地理人种、亚洲地理人种、欧洲地理人种以及印第安地理人种的人脸训练数据集的数量相同。如此,在控制固定参数相似度阈值T

优选地,所述误报率FPR是被错误报告为阳性的阴性情况的比例,误报率FPR的计算公式为:

其中,FP是被模型预测为正类的负样本,TN是被模型预测为负类的负样本。

优选地,漏报率FNR是被错误地报道为阴性的阳性情况的比例,漏报率FNR的计算公式为:

其中,FN是被模型预测为负类的正样本,TP是被模型预测为正类的正样本。

可以理解的是,根据地理人种不同分类的非洲地理人种、亚洲地理人种、欧洲地理人种以及印第安地理人种的样本中,既包含正样本与负样本,并且正样本与负样本的比例相同。同理,按照年龄段的幼年、少年、青年以及老年的样本中,也既包含正样本与负样本,并且正样本与负样本的比例相同。

在步骤S02中,分别将每个类别的人脸训练数据集输入至人脸识别模型M

请继续参阅图2与图3,图中示出了根据地理人种分类验证每个地理人种类别的在不同相似度阈值T

优选地,人脸识别模型M

可以理解的是,由于在验证每个类别的数据分布情况是未知的,所以通常会设置多组相似度阈值T

在步骤S03中,通过计算每个类别的误报率FPR的标准差σ

在步骤S04中,通过判断对应类别的标准差σ

如此,通过步骤S05,在人脸识别模型M

结合步骤S06,根据新的损失函数loss

也即,在针对不同人种和年龄间的人脸识别时,首先考虑需要对因为数据分布原因引起的模型精度下降进行惩罚,这样才能在训练的过程中进行相应的引导,因此重新设计了损失函数,在损失函数中增加了地理人种和年龄对应的损失,使得人脸识别模型在分布较少的数据类别,如东方人脸,小孩或老人的人脸识别的任务上也可以达到很高的精度。

本申请提供的基于人群差异的人脸识别方法,与现有技术相比,根据地理人种与年龄段的分类,验证每个类别的在不同相似度阈值T

在本申请另一个实施例中,当对应类别的标准差σ

可以理解的是,k值的设置,决定了对应类别都判断为数据分布弱势类别group的门槛,通常情况下,当设置k>5时,30%的类别会判断为数据分布弱势类别group,如此,可以确保只筛选出在训练数据中所占比例过少的部分人群,又不会导致训练模型的权重w失衡。

在本申请另一个实施例中,在步骤S04中,当对应类别的标准差σ

可以理解的是,例如,在训练人脸识别模型M

在本申请另一个实施例中,人脸识别模型M

可以理解的是,ResNet50可以解决深层网络中梯度弥散和精度下降(训练集)的问题,使网络能够越来越深,既保证了人脸识别的精度,又控制了速度。ArcFace具有性能高,易于编程实现,复杂性低,训练效率高的优点,同时ArcFace直接优化geodesic distancemargin(弧度),因为归一化超球体中的角和弧度的对应。为了性能的稳定,ArcFace不需要与其他loss函数实现联合监督,可以很容易地收敛于任何训练数据集,有利于在步骤S05中,实现对ArcFace的损失函数loss中加入对数据分布弱势类别group的误报率FPR的惩罚。

进一步地,在步骤S05中,在人脸识别模型M

定义ArcFace的损失函数loss为:

其中,N为样本的数量,θ是输入的特征x和权重w两个向量之间的夹角,s为超参数代表特征的缩放,m为超参数代表角度的变化;

通过FPR的定义,记录满足误识别的情况cosθ

将FPR引入到ArcFace的损失函数loss中,则:

其中,α为缩放系数,将θ

可以理解的是,通过FPR的定义,记录满足误识别的情况cosθ

以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。

技术分类

06120115928453