掌桥专利:专业的专利平台
掌桥专利
首页

一种基于迁移学习的年龄估计方法

文献发布时间:2024-04-18 19:58:21


一种基于迁移学习的年龄估计方法

技术领域

本发明涉及图像识别技术,尤其涉及一种基于迁移学习的年龄估计方法。

背景技术

人肉眼识别年龄往往是根据与已知年龄的人进行对比,故识别结果往往是一个符合大众的经验值。同时考虑不同表观年龄的人的面部风格是不一样,人肉眼去识别对比的过程类似于把当前人的面部风格向已知人的面部风格进行比较,相对于人类通过比较不同年龄的人来识别年龄,计算机难以获得每个年龄段的代表性图片。

人脸年龄估计在人机交互、人脸属性分析、市场分析等方面都具有重要作用。随着深度学习的兴起,许多深度结构,如VGG、ResNet、MobileNet等,已被用作特征学习方法来解决人脸年龄估计问题。

传统的人脸年龄估计方法大致有以下三种:回归方法、分类方法和排名方法。其中,回归方法将标签视为连续的数值,而分类方法则将不同的年龄或年龄组视为独立的类别标签。分类方法又可以分为单标签学习和标签分布学习两种方法。标签分布学习的目标是学习一个标签分布,以表示描述一个实例时每个标签的相对重要性。排名方法则将年龄值视为排名数据,并使用多个二元分类器来确定面部图像中年龄的排名。

随着深度学习技术的发展,必不可少要引入神经网络的能量“硬train一发”。这些方法主要通过特征提取和建模来预测年龄。这与人类肉眼识别年龄的机制不同,人类通过将当前的经验信息与大多数人进行比较来获得年龄信息。由于获取不同种族代表性的年龄图像很难,计算机任务常常忽略比较学习的思路。但是在风格转换学习中,风格图像的均值和标准差是风格转换的关键。

受此启发,研究人员提出了一种新方法,即使用Delta Age Adaptive InstanceNormalization操作通过迁移学习来获取每个年龄段的代表性结果。

发明内容

本发明的目的是提供一种使用Delta Age Adaptive InstanceNormalization操作通过迁移学习来获取每个年龄段的代表性结果的基于迁移学习的年龄估计方法。

为了实现上述目的,本发明采用了如下技术方案:

一种基于迁移学习的年龄估计方法,步骤如下:

S1:通过特征编码器FaceEncoder模块,负责将面部年龄图像作为输入,并将其编码为一个特征向量,以捕捉面部的关键特征;

S2:通过DAA通过学习将每个内容图转换为100个代表各个年龄的Delta年龄图;

S3:为了获得连续的图像特征信息,将迁移学习的输入设置为二进制编码的格式,通过二进制编码的独特性和连续性特征,通过DAA操作使得融合的特征信息连续;

S4:引入Binary code mapping模块将二进制编码映射模块中学习到的值传输到FaceEncoder模块学习的特征映射中;

S5:将当前图像转换为每个比较年龄的风格图,并学习当前年龄与所有比较年龄之间的特征差异,最终基于比较年龄差异来预测年龄;

S6:通过在面部年龄估计数据集Morph、FG-Net、IMDB-Wiki以及MegaAge-Asian这四个数据集上进行的实验对比和消融实验研究。

根据权利要求1所述的一种基于迁移学习的年龄估计方法,其特征在于,所述步骤S2中,基于年龄迁移的AdaIN操作写成:

DAA操作写成:

优选地,受StyleGAN和SAM的启发,一个通道即可表示一种属性,故加强版的DAA可写为:

则daa运算可以重写为eq

优选地,所述步骤S4中,引入Binary code mapping模块,Binary code mapping模块将年龄对应的自然数的二进制编码作为风格迁移隐变量z的输入,完成对应年龄特征的均值t和标准差s的映射,该过程与图像特征无关,故可以自适应跨种族和生活环境,至此通过以下公式8:

通过AgeDecoder中的引导,完成人脸特征提取模块和二进制mapping模块的学习,实现年龄间特征差异向年龄差异的映射,进而实现具备连续性的对比的年龄估计。

优选地,所述步骤S6中,评价指标采用用于回归任务常用的MAE指标以及用于特定数据集Mega-Age的cumulative accuracy评估指标,其计算方式如下:

K为总的测试图片数量,K代表绝对误差小于n的测试图像的数量。

与现有技术相比,本发明具备以下有益效果:

本发明受风格迁移和face aging的启发,将不同年龄视为不同风格,不同年龄之间的变换本质上是对应年龄特征的均值和标准差的改变,故在此基础上结合AdaIN设计能描述年龄间特征差异的操作Delta Age AdaIN(DAA)。与传统的风格迁移不同的是,不需要显示重建迁移后的年龄图像,只需要在深层特征上计算对应的均值和标准差,并通过DAA操作获得能描述年龄差异的风格特征。同时为了避免种族和生活环境对表观年龄的影响,将年龄自然数的二进制编码作为迁移学习的输入来获取具有代表性的连续的年龄特征的均值和标准差信息,从而获取更加鲁棒的年龄间的特征差异表达,进而通过特征差异向年龄差异的映射完成年龄的估计。

本发明将当前图像转换为每个比较年龄的风格图,并学习当前年龄与所有比较年龄之间的特征差异,最终基于比较年龄差异来预测年龄(本发明的算法通过年龄解码器获取差值年龄后,将所有比较年龄和差值年龄的平均值作为预测年龄,能够用更少的参数在多个面部年龄数据集上表现优异)。为了实现这个方法,研究人员将所有年龄转换为唯一的8位二进制代码,并通过全连接层学习比较年龄的均值和标准差向量。实验结果表明,该方法优于目前的最先进方法,可以很好地解决年龄估计问题。

本发明通过将当前图像与所有年龄段最具代表性的图像进行比较来估计年龄。由于通常很难获得所有年龄段的典型特征信息,在风格迁移学习中,均值和标准差被认为是图像风格最具代表性的特征。DAA操作的核心思想通过迁移学习获得每个年龄段的代表性信息,将输入年龄的特征与迁移年龄的特征进行比较,得到了特征差异。

附图说明

图1为本发明提出的一种基于迁移学习的年龄估计方法的年龄预测系统的架构示意图;

图2为本发明提出的一种基于迁移学习的年龄估计方法的DAA操作方法示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

如图1所示,为本发明提供了一种基于迁移学习的年龄估计方法,步骤如下:

S1:通过特征编码器FaceEncoder模块,负责将面部年龄图像作为输入,并将其编码为一个特征向量,以捕捉面部的关键特征;

S2:通过DAA通过学习将每个内容图转换为100个代表各个年龄的Delta年龄图;

基于年龄迁移的AdaIN操作写成:

DAA操作写成:

S3:为了获得连续的图像特征信息,将迁移学习的输入设置为二进制编码的格式,通过二进制编码的独特性和连续性特征,通过DAA操作使得融合的特征信息连续;

进一步,本发明受StyleGAN和SAM的启发,一个通道即可表示一种属性,故加强版的DAA可写为:

则daa运算可以重写为eq

S4:引入Binary code mapping模块将二进制编码映射模块中学习到的值传输到FaceEncoder模块学习的特征映射中;

Binary code mapping模块将年龄对应的自然数的二进制编码作为风格迁移隐变量z的输入,完成对应年龄特征的均值t和标准差s的映射,该过程与图像特征无关,故可以自适应跨种族和生活环境,至此通过公式8,难点得到解决。

公式2、3和8分别对应图2中的a,b,c过程:

S5:通过AgeDecoder中的引导将当前图像转换为每个比较年龄的风格图,完成人脸特征提取模块和二进制mapping模块并学习当前年龄与所有比较年龄之间的特征差异,最终基于比较年龄差异来预测年龄;实现年龄间特征差异向年龄差异的映射,进而实现具备连续性的对比的年龄估计;

S6:通过在面部年龄估计数据集Morph、FG-Net、IMDB-Wiki以及MegaAge-Asian这四个数据集上进行的实验对比和消融实验研究。

评价指标采用用于回归任务常用的MAE指标以及用于特定数据集Mega-Age的cumulative accuracy评估指标,其计算方式如下:

K为总的测试图片数量,K代表绝对误差小于n的测试图像的数量。

本发明在多种族数据集Morph上不管是使用基础resnet网络还是轻量级网络都有较好表现,体现DAA的有效性和即插即用特点。

Table 1.Comparsion of MAEs and parameters on Morph dataset.(

本发明在复杂场景下的MegaAge-Asian数据集上表现优异:

Table 3.Comparision of CA on MegaAge-Asian dataset.

同时下表对DAA的有效性进行了实验,从上到下分别代表直接回归、公式3的DAA、公式5的DAA和公式8的DAA。

Table 5.Effectiveness of DAA operation.

同时对DAA操作的性能进行评估,体现DAA操作所带来的时间消耗是非常小的,其中S_i,T_i表示在100组s和t中等间隔选i个s和t出来进行对比预测。

Table 6.The total readoning time of DAA operation,Binary codemapping,and AgeDecoder on GPU/CPU.

本发明基于肉眼年龄识别和迁移学习,提出一个非常新颖且有效的DAA操作,通过该操作完成不同年龄间特征差异的表示,并通过特征差异与年龄差异间的映射完成年龄估计。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

相关技术
  • 基于年龄编辑的年龄估计方法
  • 基于自适应年龄分布学习的人脸年龄估计方法
技术分类

06120116484542