掌桥专利:专业的专利平台
掌桥专利
首页

轻量级人脸识别方法及装置、存储介质

文献发布时间:2024-04-18 19:52:40


轻量级人脸识别方法及装置、存储介质

技术领域

本发明属于轻量级神经网络人脸识别技术领域,具体涉及一种轻量级人脸识别方法及装置、电子设备、存储介质。

背景技术

传统人脸识别模型大多是重量级的网络模型,参数多、结构大、需要依靠强大的计算设备,以非常高的计算成本实现高准确率人脸识别,此类模型无法移植到车载计算机等嵌入式系统,不能运用于车辆上人脸身份识别、人脸解锁、车辆防盗等领域。例如传统卷积网络中识别效果最好的ResNet100,识别准确率为88.26%,但模型参数量高达43.55MB,时间复杂度达到了3.402G,可见其并不适用于车载人脸识别系统等嵌入式系统。

通过设计神经网络模型结构轻量化,用随机数填充模型参数,模型的输入为人脸图片,输入经过多次计算机卷积操作后,变换输入特征的维度和数值大小,输出一组多维特征向量,该向量保存了人脸隐含特征,同一人图像输出的向量对组成的空间夹角弧度应尽可能小,不同人的人脸图像输出向量空间弧度则尽可能大。根据一定规则确定夹角弧度的判断阈值,并随机取两张人脸图片输出特征进行比对,若判断错误,则根据一定规则对上述模型参数微调更新,再取图片比对,循环往复多次,不断更新模型参数,直到比对结果满足准确率要求或者满足最大迭代次数。此类方法训练得到的轻量级神经网络人脸识别模型具有结构轻便、计算简单、可移植性强的优点,能够移植到嵌入式系统,且在确保模型精度不降低的前提下,最大程度地提高运算速度。

轻量化后的轻量级神经网络人脸识别模型虽然能够移植到嵌入式系统,但是识别准确率和识别速度不如传统人脸识别模型,无法满足实际场景需要。典型的轻量级神经网络如MobileFaceNet通过逐通道卷积极大减少了参数量和时间复杂度,分别降低到2.056MB和0.173G,但是识别准确率也降低到86.33%。

因此人脸识别模型轻量化与识别准确率提高这两者之间存在矛盾,限制了卷积神经网络在车载计算机上的应用。为此,如何提高轻量级神经网络人脸识别模型的识别准确率是本领域技术人员亟需解决的问题。

发明内容

本发明的目的在于提供一种轻量级人脸识别方法及装置、电子设备、存储介质,可以提高人脸识别准确率。

本发明实施例第一方面公开一种轻量级人脸识别方法,包括:

确定出待测图像中的人脸区域;

将所述人脸区域输入预建的AGCNet模型进行特征提取,获得特征向量;

计算所述特征向量分别与各个人脸样本的样本特征之间的角度边界值;

若任一角度边界值小于识别阈值,确定该角度边界值对应的人脸样本为目标人脸样本;

其中,所述AGCNet模型包括依次串接的常规卷积层、第一逐通道卷积层、注意力网络、第一缩减通道卷积层、第二缩减通道卷积层、第二逐通道卷积层、通道混洗卷积层;其中,所述注意力网络设有第一注意力模块和第二注意力模块,所述第一注意力模块由第一倒残差块结合第一注意力机制而获得,所述第二注意力模块由第二倒残差块结合第二注意力机制而获得,所述第一注意力机制与所述第二注意力机制不同,所述第一倒残差块的卷积步长为1,所述第二倒残差块的卷积步长为2。

本发明实施例第二方面公开一种轻量级人脸识别装置,包括:

人脸定位单元,用于确定出待测图像中的人脸区域;

特征提取单元,用于将所述人脸区域输入预建的AGCNet模型进行特征提取,获得特征向量;

计算单元,用于计算所述特征向量分别与各个人脸样本的样本特征之间的角度边界值;

确定单元,用于在任一角度边界值小于识别阈值时,确定该角度边界值对应的人脸样本为目标人脸样本;

其中,所述AGCNet模型包括依次串接的常规卷积层、第一逐通道卷积层、注意力网络、第一缩减通道卷积层、第二缩减通道卷积层、第二逐通道卷积层、通道混洗卷积层;其中,所述注意力网络设有第一注意力模块和第二注意力模块,所述第一注意力模块由第一倒残差块结合第一注意力机制而获得,所述第二注意力模块由第二倒残差块结合第二注意力机制而获得,所述第一注意力机制与所述第二注意力机制不同,所述第一倒残差块的卷积步长为1,所述第二倒残差块的卷积步长为2。

本发明实施例第三方面公开一种电子设备,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行第一方面公开的轻量级人脸识别方法。

本发明实施例第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行第一方面公开的轻量级人脸识别方法。

本发明的有益效果在于,所提供的轻量级人脸识别方法及装置、电子设备、存储介质,该方法通过确定出待测图像中的人脸区域,将人脸区域输入预建的AGCNet模型进行特征提取,获得特征向量,计算特征向量分别与各个人脸样本的样本特征之间的角度边界值,若任一角度边界值小于识别阈值,确定该角度边界值对应的人脸样本为目标人脸样本;其中,AGCNet模型包括依次串接的常规卷积层、第一逐通道卷积层、注意力网络、第一缩减通道卷积层、第二缩减通道卷积层、第二逐通道卷积层、通道混洗卷积层;注意力网络设有第一注意力模块和第二注意力模块,第一注意力模块由第一倒残差块结合第一注意力机制而获得,第二注意力模块由第二倒残差块结合第二注意力机制而获得,第一注意力机制与所述第二注意力机制不同,第一倒残差块的卷积步长为1,第二倒残差块的卷积步长为2,从而通过在轻量级人脸识别模型的基础上,引入注意力机制在倒残差块上,可以进一步挖掘深层特征,以很小的容量最大化地增加重点区域的权值,把后续优化集中到最重要的部位,进而提高人脸识别准确率。

此外,针对不同的倒残差块应用不同的注意力机制,相比只采用一种固定结构依次应用于网络中的若干个单层,而导致出现模块单一、表征能力有限的问题,本发明可以直接以不同的注意力机制从整体上作用于不同的倒残差块,对该倒残差块整个实施注意力机制,能够从整体上提高网络的表现能力,以及有目的性地提高识别性能。

附图说明

此处的附图,示出了本发明所述技术方案的具体实例,并与具体实施方式构成说明书的一部分,用于解释本发明的技术方案、原理及效果。

除非特别说明或另有定义,不同附图中,相同的附图标记代表相同或相似的技术特征,对于相同或相似的技术特征,也可能会采用不同的附图标记进行表示。

图1是一种轻量级人脸识别方法的流程图;

图2是第一倒残差块(卷积步长为1)的网络结构示意图;

图3是第二倒残差块(卷积步长为2)的网络结构示意图;

图4是包括第一倒残差块的第一注意力模块的结构示意图;

图5是通过第一注意力模块对特征图进行注意卷积操作的流程图;

图6是包括第二倒残差块的第二注意力模块的结构示意图;

图7是通过第二注意力模块对特征图进行注意卷积操作的流程图;

图8是分组卷积与通道混洗示意图;

图9是一种轻量级人脸识别装置的结构示意图;

图10是一种电子设备的结构示意图。

附图标记说明:

901、人脸定位单元;902、特征提取单元;903、计算单元;904、比对单元;905、确定单元;1001、存储器;1002、处理器。

具体实施方式

为了便于理解本发明,下面将参照说明书附图对本发明的具体实施例进行更详细的描述。

除非特别说明或另有定义,本文所使用的所有技术和科学术语与所属技术领域的技术人员通常理解的含义相同。在结合本发明的技术方案以现实的场景的情况下,本文所使用的所有技术和科学术语也可以具有与实现本发明的技术方案的目的相对应的含义。本文所使用的“第一、第二…”仅仅是用于对名称的区分,不代表具体的数量或顺序。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

需要说明的是,当元件被认为“固定于”另一个元件,它可以是直接固定在另一个元件上,也可以是存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件,也可以是同时存在居中元件;当一个元件被认为是“安装在”另一个元件,它可以是直接安装在另一个元件,也可以是同时存在居中元件。当一个元件被认为是“设在”另一个元件,它可以是直接设在另一个元件,也可以是同时存在居中元件。

除非特别说明或另有定义,本文所使用的“所述”、“该”为相应位置之前所提及或描述的技术特征或技术内容,该技术特征或技术内容与其所提及的技术特征或技术内容可以是相同的,也可以是相似的。

毫无疑义,与本发明的目的相违背,或者明显矛盾的技术内容或技术特征,应被排除在外。

如图1所示,本发明实施例公开一种轻量级人脸识别方法,可应用于车载计算机设备以实现人脸识别。该方法包括以下步骤S10~S40:

S10、确定出待测图像中的人脸区域。

在每次需要进行人脸识别时,需获取待测图像,然后通过人脸检测算法对待测图像进行处理,定位待测图像中的人脸位置,对齐并调整大小,获得人脸区域作为后续人脸识别的输入。

为了保证人脸识别的速度和准确性,采用了基于级联回归模型和决策树的ERT模型进行人脸检测。其中,通过回归函数对待测图像中的人脸进行初步定位。首先分别提取预存的数据集内处理好的人脸样本图像的各特征点,通过回归函数确定人脸样本图像的各特征点的平均位置,根据人脸样本图像的各特征点的平均位置从待测图像中确定出人脸初始形状,从而实现待测图像的人脸初步定位。有了人脸初始形状,系统不断扫描人脸样本图像,并以人脸初始形状为基准,按照模型提取每一个人脸样本图像的各特征点作为输入,这时由于人脸样本图像不同,因此输入也不同。然后,利用多级串联决策二叉树计算回归算法中的残差,并对决策二叉树进行封装。其中采用的决策二叉树算法是梯度提升决策树(Gradient Boosting DecisionTree,GBDT),它是决策树的主流提升算法之一。GBDT是通过正向算法逐步构造的决策树加法模型,该决策树加法模型由多层回归器组成,每一层的回归器由500棵决策二叉树组成,通过训练的阈值将人脸样本图像的各特征点分离到不同的叶节点。通过将各个人脸样本的各特征点与待测图像的人脸初始形状相比较,得到了用于反向传播的残差。在利用该残差对待测图像的人脸初始形状进行返回校正后,确定待测图像中的人脸位置,从而可以提高人脸检测的准确性。

其中,决策二叉树分裂的规则是:首先建立特征池,里面包含了随机选择的特征点坐标。这些特定的点(即各特征点)在不同人脸样本图像代表了不同的像素值。接着计算人脸样本图像之间的像素差并根据随机产生的分裂阈值把人脸样本图像分成两类,大于分裂阈值的分到左子树的子空间,小于分裂阈值则分到右子树的子空间,完成二叉树的分裂。之后的每一次分裂过程一样,直到全部人脸样本图像都分到叶子节点的子空间为止。分裂规则如下式所示:

式中,

完成分裂以后,每一个人脸样本图像都会落入其中一个叶节点。这时系统开始计算每一个人脸样本图像的当前形状与真实形状的差值,再将同一个叶节点的所有差值作平均,即为该叶节点保存的残差。在建立新的树之前,需要对原有的预测形状进行更新,对于决策树加法模型,则是原形状与残差相加,每一步模型更新如下:

式中,

经过反复迭代,每一步模型趋于收敛或者超过规定的迭代次数后输出,将得到的每一步模型作为每一级回归器,则:

其中,

这样,通过把前一棵树的预测形状与残差相加作为后一棵树的输入,经过500次迭代后,预测形状趋于收敛,不断接近真实形状。

下面介绍一下特征池参数的选取过程。

为了训练好每棵树,各级回归器互相独立,故共有K个特征池。每级的特征池参数随机生成,但是为了选择出最优分裂参数组成的特征池,生成的特征池参数要先经过最小平方误差法筛选。已知决策树加法模型的每一步更新决策树目标残差为

其中,E(Q,θ)为左右节点中样本的拟合平方差之和,ε

据上式知,当决策树目标残差等于分裂后预测结果的残差时,分裂参数最小。即分裂后预测结果等于左右子树各叶节点样本集的残差平均值时,分裂结果最优。节点最优分裂参数为:

Q

因此,每次结点分裂,只需计算一边的子树参数,直到生成指定数目的叶结点。最后,将传统的回归模型与决策二叉树相级联,提高了人脸检测的速度和准确性。此时最终输出的是对待测图像中的人脸准确定位后截图作为人脸区域,用于后续进行人脸识别的输入,人脸区域为三通道图像,大小统一放缩为112×96像素。

S20、将人脸区域输入预建的AGCNet模型进行特征提取,获得特征向量。

AGCNet模型是一个轻量化卷积神经网络,包括依次串接的常规卷积层、第一逐通道卷积层、注意力网络、第一缩减通道卷积层、第二缩减通道卷积层、第二逐通道卷积层、通道混洗卷积层;其中,注意力网络设有第一注意力模块和第二注意力模块,第一注意力模块由第一倒残差块结合第一注意力机制而获得,第二注意力模块由第二倒残差块结合第二注意力机制而获得,第一注意力机制与第二注意力机制不同,第一倒残差块与第二倒残差块也不同,第一倒残差块的卷积步长为1,第二倒残差块的卷积步长为2。

其中,注意力网络包括依次串接的第一注意力层AM1、第二注意力层AM2、第三注意力层AM3和第四注意力层AM4;第一注意力层AM1包括依次串接的一个第二注意力模块和三个第一注意力模块,第二注意力层AM2包括一个第二注意力模块;第三注意力层AM3包括依次串接的五个第一注意力模块,第四注意力层AM4包括一个第二注意力模块。

需要说明的是,在本发明中,AGCNet模型的注意力网络中应用有两种不同类型的反向残差结构block(也即倒残差块),分别是第一倒残差块和第二倒残差块,如图2和图3所示,图2示出第一倒残差块(卷积步长为1)的网络结构示意图,图3示出第二倒残差块(卷积步长为2)的网络结构示意图。其中,第一倒残差块使用残差连接,即其输出与其输入叠加作为新的输入。而第二倒残差块不使用残差连接。第一倒残差块和第二倒残差块相同的是,其中通过第一个1×1卷积操作以特定的扩大倍数扩大特征通道数以改善后续3×3卷积效果,第二个1×1卷积进行降维操作,确保后续卷积操作顺利进行。

因此在本发明中,通过针对不同的倒残差块应用不同的注意力机制,形成不同的注意力模块,也即第一注意力模块和第二注意力模块,可以有目的地提高性能。

当倒残差块的卷积步长为1时,采用通道注意机制(Squeeze-and-Excitation,SE)来定位人脸的主要特征,它比较注重通道信息。通过全局池将各个通道的特征压缩到空间维度上的一个像素点,以便将特征集中在同一通道中,然后通过1×1卷积在通道维度上激发,以细化通道维度上的特征。因此,卷积步长为1的第一倒残差块结合SE形成第一注意力模块。

如图4所示,第一注意力模块包括第一输入单元、第一倒残差块、第一通道注意模块、第一乘积单元和第一输出单元,其中第一输入单元分别连接于第一倒残差块和第一通道注意模块,第一倒残差块和第一通道注意模块的输出通过第一乘积单元进行相乘后由第一输出单元输出。其中,第一通道注意模块包括依次串接的全局池化单元、1×1卷积单元、非线性激活单元、1×1卷积单元。

结合卷积神经网络的实现方法,实现第一注意力模块的思路如下:

首先,对输入第一注意力模块的特征图进行压缩和合并,得到多维特征向量;然后,将这些多维特征向量作为注意卷积核;最后,根据注意卷积核对输入的特征图像进行同尺寸填充卷积计算,如图5所示。

如果输入第一注意力模块的特征图为X

Y=f(WX

其中Y是生成的注意卷积核;W和b分别是对应于第一通道注意模块的权重和偏移;X

当倒残差块的卷积步长为2时,考虑到模块中存在一个步长较大的卷积核,容易导致较大的特征丢失。为了解决这个问题,可通过将卷积注意力机制(Convolutional BlockAttention Module,CBAM)应用到步长为2的卷积层,CBAM可分为两部分,先是通道注意模块,和SE类似,然后是空间注意模块,它融合了通道和空间两种注意力机制,可添加在任意网络的卷积层后面,这使得模型更加关注前一层的重要特征,从人脸特征图中充分提取隐藏信息,放大原始特征图中的主要特征,稀释次要特征,使分离出来的和纯化出来的特征能够很好地耦合,以补偿大规模卷积造成的信息损失。因此,卷积步长为2的第二倒残差块结合CBAM形成第二注意力模块。

如图6所示,第二注意力模块包括第二输入单元、第二倒残差块、第二通道注意模块、空间注意模块、第二乘积单元、第三乘积单元和第二输出单元,其中,第二输入单元分别连接于第二倒残差块、第二通道注意模块和空间注意模块,第二倒残差块和第二通道注意模块的输出通过第二乘积单元进行相乘后得到中间特征,空间注意模块的输出与中间特征通过第三乘积单元进行相乘后由第二输出单元输出。其中,第二通道注意模块包括依次串接的全局池化单元、1×1卷积单元、Relue6非线性激活单元、批归一化单元和Sigmoid激活单元,空间注意模块包括依次串接的全局最大池化单元和取均值单元。

具体的,人脸图像生成的高维特征图中包含了大量的信息,大致可以分为通道信息和平面信息。为了更好地表示人脸,在特征映射的通道方向输入的特征设置为h

Y

Y

其中X

在以前的工作中,注意力模块的注意力权重是由向量元素对应的点积逐个叠加而成的,这有点僵硬,而卷积是提取特征的常用方法。以注意权重作为卷积核Y,可以灵活地应用相同填充、有效填充和分割旋转等操作来放大和缩小特征图的大小,避免重要特征的过度压缩,有利于后续注意模块的连续挖掘。因此,第二注意力模块提取特征的过程如下:

h

h

其中,W

第二注意力模块的卷积操作通过valid padding(有效填充)和分组卷积。在这种情况下,特征图会先放大再缩小,这类似于MobileNetV2的反向残差结构。这种主轴结构可以挖掘更多的隐藏特征,防止某些重要特征被过度纯化,从而在后续的多注意特征耦合中充分识别特征映射。

具体的在本发明实施例中,AGCNet模型的网络结构如下表1所示。

表1 AGCNet模型的网络结构

其中Input为输入,Operation为运算层,t是通道升维时,升维比例(文中称为扩大倍数,也即放缩比),c是通道数,n是当前bottleneck倒残差结构重复的次数。s是步长stride,用于下采样特征层尺寸减小。值得注意的是,s=2下采样只在每一个bottleneck层的第一个倒残差结构(此时不使用残差连接)中使用。

如上表1所示,AGCNet模型第一层是卷积核大小为3×3的常规卷积层,其目的是为了尽可能减少计算量同时挖掘图像深层特征,初步对输入图片进行压缩和通道扩增,此时输入的人脸区域尺寸为112×96×3;第二层是卷积核大小为3×3的第一逐通道卷积层,对各通道上的特征作进一步处理,此时输出特征尺寸不变,输入特征尺寸为56×48×64。

接下来是注意力网络,包括依次串接的第一注意力层AM1、第二注意力层AM2、第三注意力层AM3和第四注意力层AM4;

其中,第一注意力层AM1包括4个放缩比为2的倒残差纺锤体结构串接,分别是一个第二注意力模块和三个第一注意力模块,第二注意力模块内部的空间卷积步长为2,因此结构与后续三个步长为1的第一注意力模块结构有所不同,AM1的输入尺寸为56×48×64,输出尺寸变为28×24×64;

接着是第二注意力层AM2,包括一个第二注意力模块串接,输入尺寸为28×24×64,输出尺寸为14×12×128,空间卷积步长为2;

然后是第三注意力层AM3,包括依次串接的五个第一注意力模块,输入尺寸为14×12×128;

接着是第四注意力层AM4,包括一个第二注意力模块,输入尺寸为14×12×128,空间卷积步长为2。

在注意力网络之后,是两个残差注意力层串接,两个残差注意力层分别是第一缩减通道卷积层和第二缩减通道卷积层,输入尺寸为7×6×128,后接7×6的第二逐通道卷积层把特征空间尺寸变为1×1,最后用1×1的通道混洗卷积层,进行卷积操作混合各通道的特征,生成一个多维空间向量。

其中,常规卷积层进行通道扩大和通道混洗卷积层进行通道混洗操作的示意图如图8所示,groups是指分组卷积的分组数。在实验过程中,4和N是每个类别的通道数,因此,每层中矩形的面积表示通道数。分组卷积以较少的参数扩展通道,然后通过通道混洗操作使输入和输出信道完全相关,从而改进了信息表示。当输出通道数为C=g×n时,卷积层被分成g组。同时,卷积层的尺寸变成(N,C,H,W),其中N是最小批号,C,H,W分别是通道数和特征图的高度和宽度。然后该层的通道被分割,卷积层被重塑为(N,g,n,H,W);卷积层的形状被转换成(N,n,g,H,W);展开向量,维度再次变成(N,C,H,W)。此时,根据组数,特征图中的每个通道都已混合。

S30、计算特征向量分别与各个人脸样本的样本特征之间的角度边界值。

在本发明中,可以预先采集若干人脸样本的样本图像,然后将若干样本图像分别输入ERT模型,定位样本图像的人脸,并选择人脸作为输入,输入预先建立的AGCNet模型,提取出大小为512×1×1的一维向量作为样本特征,并进行存储,从而在每次需要进行人脸识别时,只需重新获取待测图像中人脸区域的特征向量,便可计算特征向量分别与各个人脸样本的样本特征之间的角度边界值,然后逐一将计算得的角度边界值与指定的识别阈值进行对比。

S40、若任一角度边界值小于识别阈值,确定该角度边界值对应的人脸样本为目标人脸样本。

在本发明实施例中,将计算得的待测图像的特征向量与各个人脸样本的样本特征之间的角度边界值与识别阈值依次进行比较,如果两个特征的角度边界值小于识别阈值,则将这两个特征看作是同一个人,否则认为这两个特征来自不同的人。因此在判断出任一角度边界值小于识别阈值时,确定该角度边界值对应的人脸样本为目标人脸样本,以获得待测图像的人脸识别结果。

传统采用ArcFace损失函数进行识别阈值的确定,通过每一次根据平均分布概率模型等间隔随机选定的候选阈值,并根据该随机选定的候选阈值验证识别准确率,最后选取表现最好一次试验所用的候选阈值为最终的识别阈值,此通过ArcFace loss损失函数根据识别精度直接微调识别阈值的方法,取样粗糙,偶然性大。

基于此,在本发明实施例中,基于正态分布进行识别阈值确定。将根据正态分布概率模型等间隔初选若干候选阈值后,根据若干候选阈值的t分布反推正态分布概率密度函数图像,将阈值范围限定在置信度为95%的范围内,并取密度函数最大值和右区间的所有候选阈值,按概率密度加权平均,得出最终的识别阈值。

因此在执行步骤S10之前,还可以执行以下步骤S01~S04:

S01、将阈值区间平均分成m个小区间,每个小区间内选取k个候选阈值。

S02、将每个小区间内的k个候选阈值代入AGCNet模型求准确率,再取均值后,获得与m个小区间一一对应的m个准确率均值。

S03、将m个准确率均值作为符合正态分布的样本点,对于给定的置信度1-α,根据m个样本点反推计算获得总体均值μ和总体方差σ。

步骤S03中,对于给定的置信度1-α,根据m个样本点反推计算获得总体均值μ和总体方差σ,包括:计算m个样本点的样本平均值,以及根据样本平均值计算样本方差;将样本方差作为总体方差σ,对于给定的置信度1-α,计算可得总体均值μ的取值范围,并确定取值范围中最大值为总体均值μ。

S04、在k×m个样本中寻找准确率最接近μ+3σ或者μ的指定数量个候选阈值,对指定数量个候选阈值取均值作为最终确定的识别阈值。

在实际问题中,有许多变量可以近似认为是正态分布,从理论上讲,如果x是某随机试验结果的数量指标,实验结果受大量的、微不足道的、相互独立的随机因素共同影响,并且这些因素对实验本身影响效果“均匀的小”,则可以证明x近似服从正态分布。根据林德伯格-莱维的中心极限定理,在同一环境中随机选取多组样本时,这些样本序列必然为独立同分布的随机变量序列,具有有限的数学期望μ和方差,则这些样本序列服从中心极限定理。

根据中心极限定理,当样本容量n很大时,无论独立同分布的随机变量序列服从何种分布,其部分和的分布都可以近似用正态分布来代替,由于部分和除以样本容量n则为随机变量样本的均值,所以中心极限定理可以描述为,对于任意分布,只要随机变量之间相互独立,从这些随机变量中随机抽n个值,然后求均值,并重复足够多的次数后,这些均值服从正态分布。

从中心极限定理可以看出,任意分布的样本均值都服从正态分布,对于本研究的阈值选取问题,该定理可描述为,将阈值区间平均分成m个小区间,每个小区间内选取k个候选阈值点,本研究中k取30,把每个小区间内的30个候选阈值代入模型求准确率,再取均值后,每个小区间都有一个关于准确率的准确率均值,这m个准确率均值服从正态分布。为此,本研究把这m个准确率均值近似看作符合正态分布的样本点,设其总体参数(包括总体均值μ和总体方差σ)未知,需要用m个样本点反推总体参数。

为使该总体参数尽可能贴合实际情况,本研究对全体阈值对应的准确率参数μ和σ进行置信度为0.95的参数区间估计,对求出的区间参数均选择最大值作为总体的正态分布参数,并以此作为总体参数。最后根据3σ原则,数值分布在(μ—3σ,μ+3σ)中的概率为0.9974,把准确率μ+3σ作为人脸特征判定的最高准确率,此值为数据总体性质,具有普适性,在前述步骤中取的k×m个样本中寻找准确率最接近μ+3σ的指定数量个候选阈值,取其均值作为最终确定的识别阈值,其中指定数量可设置为10。

举例来说,设在[0,1]内阈值对应的准确率,服从正态分布,μ和方差σ未知,把[0,1]分成10段小区间,即m取10,根据取出的10个准确率均值,可以确定这10个准确率均值如下表2所示。

表2 10个小区间的准确率均值分布

/>

由于样本平均值

其中,x

把样本代入可得样本平均值为:

样本方差

其中,x

把样本代入可得样本方差

此处用样本方差

对于给定的置信度1-α,有

软件计算可得

已知α为0.05,软件计算得t

对于求总体方差σ,由抽样分布基本定理知:

求出两个分位点

软件计算得

得到方差σ的置信区间(即取值范围)为[0.0000011685,0.0000082330],在本发明实施例中,取方差σ为0.0000082330。

由上述步骤可得该阈值各段小区间对应的准确率均值X~N(μ,σ

可见实施本发明实施例,通过减少网络模块和使用组卷积来减少模型的大小和参数计算量,适合部署在实时应用以及移动和嵌入式设备中。考虑到模型的简化会导致识别精度的下降,为了解决这一问题,使用了特殊的注意力模块的通道混洗操作,该操作随特定块的结构而变化。此外,现有技术中将注意力模块和卷积通道均分成两组分别进行卷积,一定程度上割裂了不同组之间的联系,会影响网络的表现能力,而本发明除了分组卷积,还引入通道混洗操作。

本发明实施例相对现有技术中的注意力模块,减少了注意力模块的应用数量,从而减少了网络的分支结构数量,根据已有结论,网络的分支结构数量越少,运行速度越快。因此本发明可以加快网络运行速度。而且本发明通过引入分组卷积操作,一定程度上把分组处理后的卷积核重新打乱,后续分组处理时各通道之间的卷积核联系较为密切,从而确保网络表现能力不受影响。

本AGCNet模型可以在人脸识别任务中实现高性能。通过大量实验证明了AGCNet模型的有效性。实验表明,该AGCNet模型的识别时间比现有的轻量级卷积网络要短得多,保持了准确率,并且参数、触发器的数目要小得多。得到的模型大小小于1MB,计算复杂度小于300m,在基于图像数据集的测试中取得了最先进的结果,结构的精度相当于甚至优于现有的轻量级CNN结构,证明在车辆解锁过程中具有足够的实用性和可靠性。

如图9所示,本发明实施例公开一种轻量级人脸识别装置,包括人脸定位单元901、特征提取单元902、计算单元903、比对单元904和确定单元905,其中,

人脸定位单元901,用于确定出待测图像中的人脸区域;

特征提取单元902,用于将人脸区域输入预建的AGCNet模型进行特征提取,获得特征向量;

计算单元903,用于计算特征向量分别与各个人脸样本的样本特征之间的角度边界值;

比对单元904,用于将特征向量与各个人脸样本的样本特征之间的角度边界值分别与识别阈值进行对比;

确定单元905,用于在比对单元904比对出任一角度边界值小于识别阈值时,确定该角度边界值对应的人脸样本为目标人脸样本。

其中,AGCNet模型包括依次串接的常规卷积层、第一逐通道卷积层、注意力网络、第一缩减通道卷积层、第二缩减通道卷积层、第二逐通道卷积层、通道混洗卷积层;其中,注意力网络设有第一注意力模块和第二注意力模块,第一注意力模块由第一倒残差块结合第一注意力机制而获得,第二注意力模块由第二倒残差块结合第二注意力机制而获得,第一注意力机制与第二注意力机制不同,第一倒残差块的卷积步长为1,第二倒残差块的卷积步长为2。

进一步可选的,图9所示的轻量级人脸识别装置还可以包括以下未图示的划分单元、均值求取单元、反推计算单元和阈值确定单元,其中,

划分单元,用于在比对单元904将特征向量与各个人脸样本的样本特征之间的角度边界值分别与识别阈值进行对比之前,将阈值区间平均分成m个小区间,每个小区间内选取k个候选阈值;

均值求取单元,用于将每个小区间内的k个候选阈值代入模型求准确率,再取均值后,获得与m个小区间一一对应的m个准确率均值;

反推计算单元,用于将m个准确率均值作为符合正态分布的样本点,对于给定的置信度1-α,根据m个样本点反推计算获得总体均值μ和总体方差σ;

阈值确定单元,用于在k×m个样本中寻找准确率最接近μ+3σ或者μ的指定数量个候选阈值,对指定数量个候选阈值取均值作为最终确定的识别阈值。

其中,反推计算单元用于对于给定的置信度1-α,根据m个样本点反推计算获得总体均值μ和总体方差σ的方式具体为:反推计算单元,用于计算m个样本点的样本平均值,以及根据样本平均值计算样本方差;以及,将样本方差作为总体方差σ,对于给定的置信度1-α,计算可得总体均值μ的取值范围,并确定取值范围中最大值为总体均值μ。

如图10所示,本发明实施例公开一种电子设备,包括存储有可执行程序代码的存储器1001以及与存储器1001耦合的处理器1002;其中,处理器1002调用存储器1001中存储的可执行程序代码,执行上述各实施例中描述的轻量级人脸识别方法。

本发明实施例还公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行上述各实施例中描述的轻量级人脸识别方法。

以上实施例的目的,是对本发明的技术方案进行示例性的再现与推导,并以此完整的描述本发明的技术方案、目的及效果,其目的是使公众对本发明的公开内容的理解更加透彻、全面,并不以此限定本发明的保护范围。

以上实施例也并非是基于本发明的穷尽性列举,在此之外,还可以存在多个未列出的其他实施方式。在不违反本发明构思的基础上所作的任何替换与改进,均属本发明的保护范围。

相关技术
  • 一种pvc复合管道加工用切割设备的除尘机构
  • 一种新型高效的环保领域的管道加工清理设备
  • 一种内衬管道法兰密封面加工设备
  • 一种石油化工管道加工设备
  • 一种石油化工管道加工设备
技术分类

06120116333281