掌桥专利:专业的专利平台
掌桥专利
首页

一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法

文献发布时间:2024-04-18 19:58:26


一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法

技术领域

本发明涉及图像分类与识别技术领域,具体涉及一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法。

背景技术

年龄信息作为人脸信息的一个固有属性,是人类的一个重要生物特征。随着科技的不断发展,人机交互得到了广泛的应用,人脸识别技术由此得到了大规模推广和使用。而年龄估计研究可以辅助人脸识别任务,提高人机交互的安全性与便捷度。年龄估计是一项基于现有算法对人脸图像进行分析预测的研究,其预测方法可以大致分为回归类、排序类以及分类类。尽管年龄估计研究已经开展了多年,但如何从图像中精准地定位与提取特征信息以支持后续预测精确度仍然是一个极具挑战性的问题。

年龄估计领域常采用两类方法进行特征信息提取工作,一类是采用手工特征提取的特征信息提取方法,这类方法往往需要信息提取者具有很强的先验知识。另一类则是采用神经网络的深度学习特征提取方法,通过网络学习将特征映射到另一个特征空间中。这类方法常常由于卷积核感受野的局限性不能充分的提取特征。人脸图像中所包含的一下生物细节如:皱纹、斑纹等便因此被忽略,这对于其年龄估计任务的精准度方面提出了挑战。

发明内容

本发明的目的在于针对上述技术的现有不足,提供一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法,应用于人脸图像年龄估计领域,通过新的提取网络与多损失函数约束,共同提高年龄估计准确度。

为实现上述技术目标,本发明所采取的技术方案是:一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法,针对不同图像信息进行首先进行预处理操作,将预处理完毕的图像输入到搭建的特征提取神经网络中,通过动态空洞卷积金字塔注意力提高网络特征提取效率,将所提取特征图输入多任务模块中,通过新设计的回归流任务和标签分布流任务损失函数组合进行共同约束,完成人脸图像年龄估计,提高任务精确性。所述方法主要包括以下几个步骤:

步骤1:图像预处理,统一不同图像中的像素;

步骤2:图像年龄特征提取;对步骤1所得图像传入注意力网络模型,以此得到年龄特征图;

步骤3:对步骤2中得到的两个尺度特征图统一进行多任务学习,通过反向传播利用KL损失函数、MSE损失函数和分位数损失函数相约束,降低年龄估计误差,得出最终结果。

本发明具体通过以下技术措施进一步实现:

进行输入图像预处理操作,方便网络模型统一学习特征;具体包括以下步骤:

步骤1:处理输入目标图像,将图像重塑为224×224的大小规格;

步骤2:对重塑图像进行概率为0.5的随机翻转、随机旋转操作;

步骤3:在图像的R通道上采取概率为0.5,比例范围为0.01:0.15,从横比为0.3:3.3的随机擦除处理,并对图像进行归一化操作。

有益效果:与现有技术相比,本发明具有以下优势:

本发明针对现有人脸图像年龄估计方案中特征提取能力不足的问题,提供了一种基于注意力机制的融合特征信息的人脸图像年龄估计方法。

第一方面,本发明提出了一种新的卷积神经网络结构,在其中引入注意力模块,通过自动学习的方式,利用神经网络传播特征给与每个特征一个重要度权重值,以此提高网络的关键特征信息提取能力。与此同时,本发明还引入分组感知器、通道裁剪等方法,进一步提高对有效特征的保留能力,去除干扰特征信息,提高模型的泛化水平。同时在注意力层中利用动态卷积保留原有网络所学习的通道注意力特征,进一步提高模型性能。

第二方面,本发明设计了一种新型的网络损失函数集合,通过分位数损失与KL散度相结合的方法,可以进一步提高任务的准确率。

所述特征提取神经网络的构建方法为:以卷积层、卷积残差层、注意力层、最大池化层为基础,进行堆叠形成特征提取模块,将特征提取模块进行三次堆叠得到第一级提取网络,再进行卷积块与注意力层的堆叠形成全卷积特征提取模块,接入第一级提取网络之后。在总特征网络提取的最后一层后面增加全局池化层进行任务流的分析,以形成特征提取神经网络模块。

通过将特征图像进行一次通道维度压缩,减少注意力方法参数量,利用不同大小动态空洞卷积核对特征进行池化处理,对处理后的特征利用双线性函数插值还原图像大小,按通道维度特征拼接,将不同感受野的特征信息进行并入考量的同时引入通道信息重要度依赖分析,将处理后的结果传入Coordinate Attention(CA)注意力层,得到最终的注意力特征输出。模块计算公式如下所示:

F′=CA(cat(f(Dynamic Conv

其中和

基于动态空洞卷积金字塔注意力的多任务年龄估计方法,其中上述动态空洞卷积层的动态卷积核方法计算公式如下式所示:

其中

基于动态空洞卷积金字塔注意力的多任务年龄估计方法,其中上述双线性函数插值还原图像大小的方法计算公式如下式所示:

于动态空洞卷积金字塔注意力的多任务年龄估计方法,其中上述CA注意力层,通过并行的两个一维编码的方式将图像原本的空间信息映射进来,将特征从垂直和水平方向进行独立聚合编码,形成空间依赖关系分析。依此将通道维度的依赖关系进行拆分,使得通道维度的注意力依赖关系引入了空间维度的注意力依赖分析,形成交叉注意力感知图。公式如下所示。

f=δ(F

其中

基于动态空洞卷积金字塔注意力的多任务年龄估计方法,上述对最终提取的特征图进行多任务学习方法,通过回归流任务和不对称标签分布任务,进行依据MSE损失、分位数损失以及KL标签分布损失约束的新损失函数组合约束。其总损失函数Loss=λL

其中

附图说明

图1是本发明的人脸图像年龄估计方法的流程图;

图2是本发明的特征提取神经网络的示意图;

图3是本发明的单个卷积残差层的示意图;

图4是本发明的动态空洞卷积金字塔注意力模块的示意图;

图5是本发明的动态空洞卷积示意图;

图6是本发明的Coordinate Attention注意力层示意图。

具体实施措施

下面结合附图和具体实施例对本发明作进一步说明。应当理解的是,本发明可以以各种形式实施,以下在附图中出示并且在下文中描述的一些示例性和非限制性实施例,并不意图将本发明限制于所说明的具体实施例。

本实施例汇中,一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法,针对不同图像信息进行首先进行预处理操作,将预处理完毕的图像输入到搭建的神经网络中,通过动态空洞卷积金字塔注意力提高网络特征提取效率,将所提取特征图输入多任务模块中,通过回归流任务损失和标签分布流损失共同约束,完成人脸图像年龄估计。如图1所示,具体包括以下步骤:

步骤1:图像预处理,统一不同图像中的像素;

步骤2:图像年龄特征提取;对步骤1所得图像传入注意力网络模型,以此得到年龄特征图;

步骤3:对步骤2中得到的两个尺度特征图统一进行多任务学习,通过反向传播利用KL损失函数、MSE损失函数和分位数损失函数相约束,降低年龄估计误差,得出最终结果。

S1、数据预处理。

对公开年龄样本数据集中的每张样本图片进行预处理操作,首先,将图像重塑为224×224的大小规格;接着对重塑图像进行概率为0.5的随机翻转、随机旋转操作;之后在图像的R通道上采取概率为0.5,比例范围为0.01:0.15,从横比为0.3:3.3的随机擦除处理,并对图像进行归一化操作,得到预处理完成图片。

S2、构建基于注意力机制的人脸图像提取网络。

请参考图2,图2使役性的给出了本发明所构建的特征提取网络模型,其主要以卷积层、卷积残差层、注意力层、最大池化层为基础,进行堆叠形成特征提取模块,将特征提取模块进行三次堆叠得到第一级提取网络,再进行卷积块与注意力层的堆叠形成全卷积特征提取模块,接入第一级提取网络之后。在总特征网络提取的最后一层后面增加全局池化层进行任务流的分析,以形成特征提取神经网络模块。

动态空洞卷积金字塔注意力层的作用在于通过动态空洞卷积的方式,对于新学习到的特征图像进行不同尺度的特征学习,将不同尺度的特征学习结果进行合并分析,提取空间重要性依赖,得到图像上每个像素点所应被赋予的重要性权重值。通过这种注意力方式,提高特征提取网络的信息提取能力,增加人脸年龄估计任务整体的模型鲁棒性。

S21、在动态空洞卷积金字塔注意力层中,图像进行一次通道维度压缩,减少注意力方法参数量,利用不同大小动态空洞卷积核对特征进行池化处理,对处理后的特征利用双线性函数插值还原图像大小,按通道维度特征拼接,将不同感受野的特征信息进行并入考量的同时引入通道信息重要度依赖分析,将处理后的结果传入Coordinate Attention(CA)注意力层,得到最终的注意力特征输出。模块计算公式如下所示:

F′=CA(cat(f(Dynamic Conv

其中和

S22、在动态空洞卷积金字塔注意力层中,其中上述动态空洞卷积层的动态卷积核方法计算公式如下式所示:

其中

S23、在动态空洞卷积金字塔注意力层中,其中利用双线性插值还原图像大小,以备后续空间维度注意力学习。所述双线性函数插值的方法计算公式如下式所示:

S24、CA注意力层,通过并行的两个一维编码的方式将图像原本的空间信息映射进来,将特征从垂直和水平方向进行独立聚合编码,形成空间依赖关系分析。依此将通道维度的依赖关系进行拆分,使得通道维度的注意力依赖关系引入了空间维度的注意力依赖分析,形成交叉注意力感知图。公式如下所示。

f=δ(F

其中

S3、多任务学习

本发明通过非对称标签分布与回归流任务对特征提取网络所提取的最终特征信息图进行分析学习,进行依据MSE损失、分位数损失以及KL标签分布损失的新损失函数组合约束。其总损失函数Loss=λL

其中

相关技术
  • 一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法
  • 一种基于混合空洞卷积金字塔的目标检测网络及方法
技术分类

06120116488738