一种实时更新余弦夹角损失函数参数的人脸识别方法

文献发布时间：2023-06-19 10:27:30

技术领域

本发明属于计算机视觉中的人脸识别领域，尤其涉及到一种基于自适应学习机制实时更新余弦夹角损失函数参数的人脸识别方法。

背景技术

随着计算机视觉技术的发展以及日渐增长的智能安防、电子商务等需求，人脸识别技术成为人工智能应用产品落地最为广泛的一个领域。使用深度学习方法的人脸识别技术核心在于通过卷积神经网络（CNN）抽象化出人脸图像的特征，用于计算人脸图像之间的相似度，进而实现人脸识别的功能。

在人脸识别的实际应用中，往往受到摄像头成像、光照、面部遮挡等因素的影响，造成识别能力下降，从而影响最终识别结果。特别在金融、安防等重要场景，错误的人脸识别结果可能造成不可估量的影响。因而如何训练出一个能精确提取人脸特征的卷积神经网络成为计算机视觉技术中心一个重要的研究课题。在卷积神经网络训练过程中，损失函数的选取对最终的特征提取能力有决定性的影响。为了提升人脸识别模型的判别性能，近年来一系列加入间隔抑制的余弦夹角损失函数，如A-Softmax，CosFace, ArcFace开始成为训练人脸识别模型的主流方法。这些余弦夹角损失函数的共同之处在于均使用了余弦角间隔和对余弦值尺度放大的方式进行模型训练，然而模型的余弦角间隔值和余弦值放大的尺度值需要在训练前预先确定。这两个参数对模型训练的最终结果有决定性的影响，过小的参数值会造成模型的判别能力变弱，而过大的参数值虽然有利于提升模型的最终能力，但在训练初期会导致模型难以收敛。目前主流的做法是在人脸识别模型的训练任务中针对不同的参数选取进行多组对比性实验，依据实验结果选取合适的参数取值。然而这种方式随机性大，而且随着训练数据的迭代变换，之前获取的最佳取值可能会不适用于新的数据与网络。在网络训练的过程中，训练早期模型性能较弱，需要较小的参数值来帮助模型快速收敛，而在训练后期模型性能逐渐增强，这时需要更大的参数值来加强模型的判别能力。

为了解决上述问题，如何设计一种随着网络训练进程自动更新参数的余弦夹角损失函数成为进一步提升人脸识别模型性能的一个重要方向。

发明内容

本发明的目的在于针对现有技术的不足，提出了一种实时更新余弦夹角损失函数参数的人脸识别方法，用于人脸识别模型的训练。摆脱了传统余弦夹角损失函数需要预先确定间隔值和尺度值的限制，该人脸识别方法适用于不同的人脸识别网络和数据集，并且能随着训练进程自适应地调节参数值，加速卷积神经网络的收敛，该方法的人脸识别能力更强。

本发明为实现上述目的，采用了以下技术方案：一种实时更新余弦夹角损失函数参数的人脸识别方法，包括以下步骤：

（1）收集人脸图像，并将人脸图像按个体进行分类，并按照分类的结果对每个人脸图像进行数据标注；

（2）将步骤（1）收集的人脸图像进行水平翻转、去噪、亮度增强和对比度增强处理后，得到人脸图像数据集，将所述人脸图像数据集分批；

（3）初始化余弦夹角损失函数的余弦值放大尺度和余弦夹角间隔，根据初始化的余弦值放大尺度和余弦夹角间隔，得到余弦夹角损失函数；

（4）将第一批人脸图像数据集输入卷积神经网络中进行人脸类别训练，根据所述卷积神经网络中Softmax层的输出的人脸图像的特征向量，计算每个人脸图像的特征向量与目标类别的特征向量的夹角，并获得夹角的中位数，同时更新余弦值放大尺度；随后计算每个人脸图像的特征向量与目标类别的特征向量和非目标类别的特征向量的余弦夹角指数值之和，并获得余弦夹角指数值之和的中位数，更新余弦夹角间隔；将更新的余弦值放大尺度和余弦夹角间隔分别与初始化的余弦值放大尺度和余弦夹角间隔进行比较，选取其中较大者作为更新的结果；

（5）分批将人脸图像数据集输入卷积神经网络中进行人脸类别训练，重复步骤（4），更新余弦值放大尺度和余弦夹角间隔，直至所述余弦夹角损失函数收敛，完成对卷积神经网络的训练；

（6）将需要进行比对判断的人脸图像输入训练好的卷积神经网络中，经卷积神经网络中Softmax层输出人脸图像的特征向量，求出与目标图像经过本网络提取出的特征向量的余弦夹角，所述余弦夹角的相似度超过阈值时，输出人脸识别匹配正确的结果。

进一步地，所述更新余弦值放大尺度的过程为：

其中，s为余弦值放大尺度，C为一批输入的人脸图像的类别数，

进一步地，所述更新余弦夹角间隔的过程为：

其中，m为余弦夹角间隔，

与现有技术相比，本发明的有益效果是：本发明的人脸识别方法中将余弦夹角损失函数的参数值与每一步训练输入的人脸图像直接联系，而与其他步训练所用的人脸图像无关，依据余弦值放大尺度s和余弦夹角间隔m实时更新余弦夹角损失函数，且该余弦夹角损失函数适用于各种人脸识别模型中。在卷积神经网络的训练中，

附图说明

图1为本发明实时更新余弦夹角损失函数参数的人脸识别方法的流程图。

具体实施方式

为使本发明的目的、技术方案更加清楚，下面结合附图对本发明作进一步说明。

如图1所示，本发明提供了一种实时更新余弦夹角损失函数参数的人脸识别方法流程图，所述人脸识别方法包括如下步骤：

（1）收集人脸图像，并将人脸图像按个体进行分类，并按照分类的结果对每个人脸图像进行数据标注；

（2）将步骤（1）收集的人脸图像进行水平翻转、去噪、亮度增强和对比度增强处理后，得到人脸图像数据集，将所述人脸图像数据集分批；

（3）初始化余弦夹角损失函数的余弦值放大尺度s和余弦夹角间隔m，令

其中， n为一批输入卷积神经网络的人脸图像的数量，i为n的索引，为目标类别的特征向量，j为非目标类别的特征向量，

由于在模型训练起始阶段，模型权重为随机初始化的结果，因此尚未拥有人脸识别的能力，随着人脸图像不断输入训练才逐步提升人脸识别的能力，因此需要对训练所用的余弦值放大尺度s和余弦夹角间隔m进行初始化的操作，为模型训练提供一个较强的监督信号。本发明中余弦值放大尺度s和余弦夹角间隔m的初始化数值是以虚线夹角中位数为

（4）将第一批人脸图像数据集输入卷积神经网络中进行人脸类别训练，根据所述卷积神经网络中Softmax层输出的人脸图像的特征向量，计算每个人脸图像的特征向量与

（5）分批将人脸图像数据集输入卷积神经网络中进行人脸类别训练，重复步骤（4），更新余弦值放大尺度s和余弦夹角间隔m，用于余弦夹角损失函数

余弦值放大尺度s和余弦夹角间隔m的更新遵循最大化分类正确的样本的Softmax值以及使每步训练样本的

（6）将需要进行比对判断的人脸图像输入训练好的卷积神经网络中，经卷积神经网络中Softmax层输出人脸图像的特征向量，求出与目标图像经过本网络提取出的的特征向量的与余弦夹角，所述余弦夹角的相似度超过阈值时，输出人脸识别匹配正确的结果。所述阈值依据数据、场景以及误识率要求可以有多种取值，一般推荐取值范围为0.3-0.5之间以达到最佳识别效果。

表1为现有技术与本发明方法人脸识别准确率的比较，Id表示在一百万张干扰集照片下人脸认证Rank-1准确率，Ver表示在10

表1：现有技术与本发明方法人脸识别准确率的比较

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：黎晨阳;陆易;何鹏飞;徐晓刚;王军;
专利申请人：之江实验室;

上一篇：一种多传感器时间空间标定方法及装置
下一篇：基于ReRAM神经网络加速器的可调硬件感知的剪枝和映射框架