掌桥专利:专业的专利平台
掌桥专利
首页

多模生物特征的优化方法、装置、介质和设备

文献发布时间:2023-06-19 09:51:02


多模生物特征的优化方法、装置、介质和设备

技术领域

本发明示例性实施例涉及技术领域,尤其涉及一种多模生物特征的优化方法、装置、介质和设备。

背景技术

随着社会的进步和科技的发展,人们越来越越重视保护自己的隐私信息。生物特征识别技术作为一种新兴的信息安全保护措施目前得到了广泛的应用。

生物特征识别是利用人类固有且唯一的一些生理或行为特征,由计算机对这些信息进行采集和判断,最终确定身份的过程。常见的生物特征包含人脸、指纹、掌纹、虹膜等生理特征以及签字、步态、唇语等行为特征。单模生物特征识别是利用人类一种生理或行为特征来进行身份鉴别方式。

虽然在实际应用中取得了一些突破,还存在以下的缺点:(i):容易引入干扰噪声。由于光照、声音、实验环境、采集方式的改变,引入干扰噪声。(ii):每种生物特征都有其理论上的识别上限。不同个体的相同生物特征的差别可能非常微小,这会对后续识别造成巨大的困难。(iii):由于某些特殊原因,一些个体无法提供某种特定的生物特征。(iv):某些单模生物特征容易被窃取。例如,人脸长期暴露在开放环境,容易被不法分子窃取利用。

发明内容

有鉴于此,本发明示例性实施例的目的在于提出一种多模生物特征的优化方法、装置、介质和设备,以解决目前的多模识别数据量大、识别率低的问题。

基于上述目的,本发明示例性实施例提供了一种多模生物特征的优化方法,所述方法包括:

基于图片信息的有效区域获取虹膜特征和面部特征,对所述虹膜特征和所述面部特征进行初步融合后得到初步融合特征;

通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征;

根据所述优化融合特征对所述图片信息进行身份识别。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征,包括:

确定所述初步融合特征的训练集和测试集;

通过改进的二进制粒子群对所述训练集和测试集进行粒子变换和空间变换,分别生成对应的特征子空间训练集和特征子空间测试集;

对所述特征子空间训练集和特征子空间测试集进行迭代,得到所述优化融合特征。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述基于图片信息的有效区域获取虹膜特征和面部特征,包括:

确定图片中的虹膜有效区域并经过Curvelet变换后,得到若干个Curvelet系数;

通过各所述Curvelet系数进行图像重构,确定重构图像中特征维度小且有效识别的虹膜特征;以及;

通过2DLog-Gabor方法从图片中的人脸有效区域确定若干特征子图,基于所述若干特征子图中维度系数结合Curvelet变换确定所述面部特征。

结合上述说明,在本发明实施例另一种可能的实施方式中,对所述虹膜特征和所述面部特征进行初步融合后得到初步融合特征,包括:对所述虹膜特征和所述面部特征进行串联得到所述初步融合特征;

所述通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征,包括:

通过二进制粒子对所述初步融合特征进行筛选,并通过适应度函数进行迭代以得到最佳粒子,所述最佳粒子为所述优化融合特征;

其中,所述适应度函数为核极限学习机函数。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述改进的二进制粒子群算法为引入混沌映射的离散二进制粒子群算法。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述混沌映射为:

通过以下Logic映射来产生伪随机序列:

Z:a

其中Z为一个混沌变量序列,a

结合上述说明,在本发明实施例另一种可能的实施方式中,所述通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征,包括:

在二进制粒子群算法中,第i个粒子的速度表示为向量V

v

其中,t表示第t次迭代;ω为惯性权重,取[0,1]之间的随机数;r

第二方面,本发明还提供了一种多模生物特征的优化装置,所述装置包括:

特征确定模块,用于基于图片信息的有效区域获取虹膜特征和面部特征,对所述虹膜特征和所述面部特征进行初步融合后得到初步融合特征;

优化模块,用于通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征;

识别模块,用于根据所述优化融合特征对所述图片信息进行身份识别。

第三方面,本发明示例性实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的多模生物特征的优化方法。

第四方面,本发明示例性实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述的多模生物特征的优化方法。

从上面所述可以看出,本发明示例性实施例提供的多模生物特征的优化方法、装置、介质和设备,采用2DLogGabor+Curvelet变换提取人脸特征,用Curvelet变换提取虹膜特征,在不影响识别率的情况下减少了特征数目,对于融合后的特征,通过改进的二进制粒子群算法来选择特征,算法利用核极限学习机作为适应度函数,采用混沌二进制序列初始化粒子群,在每次迭代产生全局最优值Gbest后,利用混沌二进制序列改变Gbest的位置信息,从而实现混沌局部搜索,避免其陷入局部最优,本发明的方法不仅能够大幅减小融合后的特征数量,还提高了识别率。

附图说明

为了更清楚地说明本发明示例性实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明示例性实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明示例性实施例多模生物特征的优化方法流程示意图;

图2为本发明示例性实施例实施时的系统框架结构示意图;

图3为本发明示例性实施例的虹膜特征预处理流程示意图;

图4为本发明示例性实施例的虹膜曲波变换后的频带示意图;

图5为本发明示例性实施例的人脸特征处理流程示意图;

图6为本发明示例性实施例的人脸特征子图处理流程示意图;

图7为本发明示例性实施例的优化流程示意图;

图8为本发明示例性实施例的优化结果示意图;

图9为本发明示例性实施例优化结果示意图;

图10为本发明示例性实施例对比优化示意图;

图11为本发明示例性实施例对比优化示意图;

图12为本发明示例性实施例的装置结构示意图;

图13为本发明示例性实施例的设备结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。

需要说明的是,除非另外定义,本发明示例性实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本发明示例性实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。

本发明涉及一种多模生物特征的优化方法、装置、介质和设备,其主要运用于生物特征的多模识别场景中,其基本思想是:为避免生物组合的特征中存在一些互斥的冗余特征以及由此带来的对识别效果的不良影响,本发明采用2DLogGabor+Curvelet变换提取人脸特征,用Curvelet变换提取虹膜特征,在不影响识别率的情况下减少了特征数目。对于融合后的特征,通过改进的二进制粒子群算法来选择特征,算法利用核极限学习机作为适应度函数,采用混沌二进制序列初始化粒子群,在每次迭代产生全局最优值Gbest后,利用混沌二进制序列改变Gbest的位置信息,从而实现混沌局部搜索,避免其陷入局部最优,本发明的方法不仅能够大幅减小融合后的特征数量,还提高了识别率。

为了克服单模生物特征易被不法分子利用或窃取等问题,本发明的思想是将多个单模生物特征融合在一起,以此集成为一个多模系统。相比于单模特征识别,多模生物特征识别具有以下优点:①系统可靠性更高:多模技术通过集成多种生物特征,增加了身份鉴定过程中的互补信息,改善了系统的容错能力,降低了噪声对识别结果的影响。②系统适用性更强:针对某种模态特征信息源缺失的情况,多模系统仍能根据其它的生物特征对身份进行鉴定,适用性更强。③系统的防伪性更强:相比于伪造单一模态特征,同时伪造多个模态特征的难度更高,因此多模生物特征识别系统的防伪性更好。

生物特征完成身份识别任务通常需要4个核心步骤,即数据采集、特征提取、特征匹配以及身份决策。根据这4个步骤,多模生物特征识别系统的融合方法可以分为4种:采集层融合(Collection-levelfusion),特征层融合(Feature-levelfusion),匹配层融合(Matching-levelfusion)以及决策层融合(Decision-levelfusion)。特征层融合是在已经分别完成各模态生物特征提取任务的基础上,对各个模态的特征采取某种方式进行组合,得到整合了多源信息的统一特征,进而用于最终的身份属性决策。多模生物信息的特征层融合核心问题是如何构建融合特征空间。否则,一些互斥的冗余特征甚至可能会对识别结果造成影响。

虹膜特征通常与人脸特征进行融合,因为二者都分布于面部,融合它们具有天然的优势:1)可以使用一个采集设备同时釆集到虹膜特征和人脸特征;2)信息互补,虹膜特征有丰富的纹理信息,而人脸的结构和形状信息丰富。通过两个特征的融合能够提升系统身份识别的准确率。基于上述原因,本发明构建了一个虹膜-人脸多模身份识别系统,以对提取的虹膜特征和人脸特征在特征层进行融合。

本发明将对融合特征中的冗余特征进行筛选,并进一步地通过改进的混沌二进制粒子群算法得到能够用于准确识别的最优解,整个过程计算量大幅降低,但在大幅降低计算量的同时识别率得到了进一步的提升,其具体的实现过程包括:

如图1所示,为本发明示例性实施例的方法流程示意图,所述方法具体包括如下步骤:

在步骤110中,基于图片信息的有效区域获取虹膜特征和面部特征,对所述虹膜特征和所述面部特征进行初步融合后得到初步融合特征;

2DLog-Gabor滤波器由于具有极佳的多尺度和多方向特性,可以有效的提取图像纹理信息,经常用于提取人脸、虹膜等图像特征。但是存在提取到的人脸特征维数较高的缺点。本发明基于2DLog-Gabor和Curvelet(曲波变换)的人脸识别方法。首先对人脸区域做2DLog-Gabor变换,生成多张特征子图;其次,对每个特征子图进行Curvelet变换以提取子图特征。然后,对所有子图特征进行融合,采用上述方式产生的特征维度数大幅减少。

在步骤120中,通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征;

在步骤130中,根据所述优化融合特征对所述图片信息进行身份识别。

图2为本发明采用的基于人脸和虹膜的多模生物特征识别系统的框架,结合图2所示,人脸特征与虹膜特征(具体需要区分左、右虹膜)初步串行融合后,利用混沌二进制粒子群进行特征选择,且其中的测试集可用于测试训练集得到的分类结果是否满足终止条件。采用核极限学习机的分类准确率更新粒子群。本发明涉及的人脸+虹膜多模数据集采用的是CASIA-Iris-Distance(一种具有专门功能的虹膜远距离数据集)。

本发明示例性实施例一种可行的实施方式中,在提取虹膜特征之前,必须对图片进行预处理,以便找到有效的虹膜区域提取特征。如图3所示,为本发明示例性实施例的对图片信息进行预处理的过程,结合图3所示,在这一方面,本发明首先采用Harris角点检测的方法定位与分割人的眼部区域,然后采用基于改进微积分算子的虹膜定位算法找到虹膜所在的区域,对此区域分割和归一化后,完成预处理的工作。

具体地,图3中虹膜预处理的过程(a)表示Original Image,原始图像信息(b)定位眼睛(c)眼睛分割(d)虹膜定位及分割(e)虹膜归一化大小64×512(f)虹膜下半圆周大小64×256。图3(d)中可以看出,整个虹膜区域的上半圆周部分受眼睑和眼睫毛影响较大,为了避免其对虹膜纹理的干扰,本发明对虹膜区域的下半圆周部分提取特征。

Curvelet变换曲波变换作为多尺度几何分析工具,它兼顾了尺度、位置和角度信息,使其在表达图像中的曲线时具有很大的优势。由于二代曲波变换表现出的视觉特性在于对边缘、微弱的线性及曲线结构的提取非常有效,本发明采用基于第二代curvelet变换的虹膜纹理特征提取方法,该特征提取方法可以兼顾虹膜图像整体特征的变化规律和细节信息的表达。为了要把curvelet变换应用于图像处理之中,需要使用它的离散形式。离散的curvelet变换可以用如下的形式来表示,

其中,C(j,l,k)表示小曲线系数,上标D表示离散形式。。f[t

一般地可通过两种离散curvelet变换算法进行该步骤,一种是FDCT_USFFT算法;另一种是FDCT_WARP变换算法。这两种算法具有相同的输出结果,但后者运算速度比较快,算法效率较高。因此,本发明中采用后一种算法。通过Curvelet变换对经过预处理的虹膜图像(图3(f))进行变换后得到的结果为多个系数c{j}{l}(k

表1 Curvelet系数

图3(f)在经过Curvelet变换后,我们分别对第一层和第三层的系数进行图像重构,结果如图4所示。在图4中,图(a)为原图,(b)和图(c)分别为第一层和第3层系数重构后的虹膜图像,经过Curvelet变换后的重构虹膜图像图4(a)为原始图像,图4(b)为低频带图像,图4(c)为最高频带图像(图中黑色区域为噪声,且其基本为噪声)。

从图4可以看明显看出,环境噪声引起的虚假信息集中在最高频段图4(c)。图像的主要信息集中在第一层,其能体现出虹膜图像的概貌,可用于虹膜识别。本发明另一些实施方式中也能够表明,采用前N-1层Curvelet系数和仅使用第一层Curvelet系数的虹膜识别方法均能有效识别虹膜,二者的识别率差别不大。

本发明采用或者说仅使用第一层Curvelet系数的方法可以有效地减小特征维数并提高识别速度。本发明中使用第一层Curvelet系数做为图片信息有效区别的虹膜特征。

本发明示例性实施例通过结合2DLog-Gabor和Curvelet的人脸特征识别方法。2DLog-Gabor滤波器具有极佳的多尺度和多方向特性,能够有效的提取图像纹理信息,并且对光照变化不敏感,对外界干扰具有较强的鲁棒性。在极坐标下,频域的2DLog-Gabor滤波器可表达为H(f,θ)=H

式中,f

如图6所示,为本发明示例性实施例的人脸特征提取流程图,其可以进一步提高特征的鉴别能力,同时降低维度,提高识别速度,结合图6,分别对每个特征子图进行Curvelet变换,用Curvelet变换后的第一层中的系数C{1}表示特征子图的特征,最后,将每个特征子图的Curvelet特征进行连接(concatenation,连接),结果得到本发明中用于识别的人脸特征(face feature,人脸特征)。

在提取左右眼虹膜与人脸特征并进行归一化后,通过简单的串联就可以得到原始的串行融合特征。这种串行融合后的特征通常情况下包含较多的冗余信息,这些冗余特征不仅会增加后续的计算复杂度,甚至有可能存在一些互斥信息,进而影响融合识别的结果。因此,本发明示例性实施例提出一种MCBPSO(Modified Chaotic Binary Particle SwarmOptimization),改进的混沌二进制粒子群方法)用来选择特征。

如图7所示,为本发明示例性实施例的特征选择过程的流程示意图,在二进制空间中,粒子群由N维的P个粒子组成,每个粒子的位置由一串二进制位组成,第i个粒子的位置表示为向量X

本发明示例性实施例得到的左右眼虹膜特征与人脸特征通过简单的串联就可以得到原始的串行融合特征,即初步融合特征。通过二进制粒子对初步融合特征进行筛选,1表示选择相应特征,0表示不选择相应特征,就可以得到优化后的特征。粒子的维度N与原始的串行融合特征的维度一致,这一过程可具体为:

在BPSO中,第i个粒子的速度表示为向量V

v

其中t表示第t次迭代;ω为惯性权重,取[0,1]之间的随机数;r

在粒子群算法中,适应度是描述个体性能的主要指标。本发明示例性实施例的实施方式中,采用了核极限学习机(kernel extreme learning machine,ELM)来做适应度函数,ELM算法在学习过程中,无需调整网络的输入层与隐含层之间的权值和隐含层神经元的偏置,只需要设置隐含层节点的合数,就会产生唯一的最优解,与传统的BP神经网络相比,ELM训练速度快且泛化能力强。但是,极限学习机的初始输入权值和隐含层偏置随机化,并且往往需要较多的隐含层节点,且容易过拟合,因此本发明采用了核极限学习机(kernelextreme learning machine,KELM)算法。这一过程包括如下:

给定N个训练样本数据集(x

其中,β

ELM单隐层神经网络学习的目标是令输出的误差最小,即以零误差逼近任意N个样本,即

因此,上述N个方程可以表示为Hβ=T=h(x)β(9)

其中,β=[β

根据Karush-Kuhn-Tucker理论,引入拉格朗日因子,将ELM的训练转化为对偶问题,解得β为:

其中,T为训练样本的类标识向量组成的矩阵。C为正则化系数,在矩阵HHT中加上I/C可以使其特征根偏离零,可以提高结果的稳定性和泛化能力。将式(4)代入式(3),得到ELM分类器输出函数表达式:

定义核函数的计算式如下:

Ω

Ω

核函数的选择有很多种,本文选择RBF核函数,定义如下

所以KELM的输出函数表达式为:

为了简化计算,KELM正则化系数C与核函数的参数γ分别采用程序默认,即C=10^8,γ=1。

传统的二进制粒子群的初始粒子位置随机产生,同时由于传统的BPSO算法容易陷入局部最优,导致过早收敛.将混沌映射引入到BPSO算法,构成一个混沌二进制粒子群优化(CBPSO)算法,使得该算法既克服早熟收敛,保证搜索到全局最优值,又能保证搜索速度,使分类算法的性能更优。

混沌是由确定性方程得到非确定的随机运动状态,具有伪随机性、遍历性和规律性等特点。一般情况下,都会选用公式(16)所示的Logic映射来产生伪随机序列,如:

Z:a

其中Z为一个混沌变量序列,a

步骤一:用混沌二进制序列初始化粒子位置

首先确定粒子群中粒子数目M以及每个粒子的维度N,然后对每个粒子按照公式(16)生成N个在[0,1]范围内混沌实值序列{x

式中,C为混沌实值序列{x

例如,假设粒子的维度是10,随机产生混沌的初值是0.8107,那么根据公式(16)产生的混沌实值序列是:

{0.984,0.063,0.2362,0.7217,0.8035,0.6316,0.9307,0.258,0.7657,0.7175}

再按照公式(17)就可以得到混沌二进制序列为

{1,0,0,1,1,1,1,0,1,1}

步骤二:构建初始特征子空间,获取初始“个体最优”和“全局最优”。根据图7所示的原理,每个N维二进制粒子可以看成是一个用于构建特征子空间的特征掩码。掩模为1的特征维度用于构建特征子空间,掩模为0的特征维度被剔除。根据这些特征子空间获取KELM的训练数据与测试数据。以测试数据在训练完成的KELM模型下的分类准确率作为当前粒子的适应度值,即初始的“个体最优”。所有粒子的最大适应度值,即初始的“全局最优”。

步骤三:迭代更新粒子的位置和速度。在初始化的基础上,粒子群通过跟踪“个体最优”与“全局最优”来不断迭代更新自身的速度和位置。在每次的迭代过程中,每个粒子都要判断当前适应度值是否比之前迭代过程中“个体最优”的适应度值高。如是,则将当前粒子记为“个体最优”,否则,保留之前的“个体最优”。判断当前迭代步骤中粒子群取得的最优适应度值是否比之前迭代过程中“全局最优”的适应度值高。如高,则将当前具有最优适应度值的粒子作为“全局最优”,否则,保留之前的“全局最优”。

步骤四:局部搜索的优化

针对粒子群搜索容易陷入局部最优的问题,利用混沌二进制序列改变每次迭代产生的Gbest的位置信息,以便跳出局部极值的问题。经过多次试验,我们发明了一种新颖便捷算法,取得了非常好的效果。算法如下(通过多次试验,我们采用了下面的算法,这是最有效的选择功能的方法):

步骤五,判断迭代终止条件是否满足。如满足,终止迭代,输出“全局最优”gbest。否则,继续执行下一步骤。

在搜索的早期阶段,粒子群算法需要很高的速度来完成大范围的搜索。随着进化的发展,搜索点越来越接近最优值。在这个时候,我们要降低搜索速度,进行小范围搜索。因此,惯性权重应在前期较大,后期较小。这里我们采取的权重随着迭代的进行而不断递减,从0.95降到0.4.如公式(15)所示

weight=W

式中,W

本发明示例性实施例的一种实施方式中,通过实验对本发明的方法及系统进行验证,这一过程包括:

本次实验涉及的虹膜和人脸多模数据集是中科院的虹膜远距离数据集(CASIA-Iris-Distance)。其采用的先进的生物识别传感器,可以在3米外的视野中主动搜索虹膜、面部图案。它是一个很好的多模数据集。

训练集的个数从1个依次增加到5个,采用核极限学习机作为分类器。表2所示的是人脸的识别率。做为比较,表1中同时列举了传统的2DLog-Gabor+LBP,2DLog-Gabor+Curvelet算法的识别率。

表2 2DLog-Gabor+Curvelet算法的识别率

其CMC(Cumulative match characteristic,累计匹配特征)曲线如图8所示。

图7-图11中的recognition rate为识别率,rank为排名。

从表2中来看,传统的2DLog-Gabor+LBP识别率略高于2DLog-Gabor+Curvelet的。但是其产生的特征维度数却是它的4倍还多。从CMC曲线来看,其识别率达到100%,排名第七,采用2DLog-Gabor+Curvelet算法的FaceSystem性能要好于2DLog-Gabor+LBP。

从400张人脸中用不同的算法提取左眼虹膜特征。采用核极限学习机作为分类器,训练集的个数从1个依次增加到5个。不同特征提取算法的识别率和特征维度记录在表3中。

表3不同算法下左眼虹膜的识别率

选择5个图像进行训练,其CMC曲线如图9所示。

从表3中可以看出,采用Curvelet算法的虹膜识别率虽然没有另外2种算法理想,但是它产生的特征维度却是最少的。从图9可以看出,采用Curvelet算法的虹膜识别整体性能最优。考虑到特征融合的需要,适宜采用Curvelet算法提取虹膜特征。

为了进一步验证Curvelet算法提取虹膜特征的有效性,我们在另外一个单模数据集CASIA-Iris-Lamp上进行了实验。CASIA-Iris-Lamp数据集是中科院制作的另外一种虹膜数据集。其使用OKI的手持式虹膜传感器在眼睛附近收集的。它包含了411个人的16,212张虹膜图像。每张图像的像素为640*480。本次实验CASIA-Iris-Lamp中选取了与上述方式同样科目数的左眼虹膜进行实验,结果如表4所示。

表4 Curvelet在不同虹膜数据集上的识别率

从表4的结果可以看出,在CASIA-Iris-Distance数据集上表现不太理想的Curvelet算法,却在另外一个数据集是取得了令人十分满意的效果。这说明用Curvelet算法提取虹膜特征的是行之有效的。在CASIA-Iris-Distance数据集上识别率较低的主要是因为远距离采集虹膜的原因。换句话说,对于远距离采集的虹膜图片必须融合人脸以提高身份识别率。

从实验中的40个科目的10张人脸用Curvelet算法分别提取左右眼虹膜特征,然后和用2DLog-Gabor+Curvelet提取的人脸特征组成原始特征融合向量。从表1和表2可以算出,其特征总维度是1785×2+5304=8874。每个科目中我们分别选择2、3、4和5张图片做为训练集,剩下的做为测试集。分别通过传统的BPSO和论文提出的改进的二级制粒子群优化后,优化后的特征维度见表5。

表5不同BPSO算法优化后的特征维度数

从表5可以看出,通过改进的CBPSO优化后,特征维度分别降到了388,243,293和294。最少的缩小了36倍。取得了非常好的降维效果。为了验证经过粒子优化后的效果,图10和图11分别显示了通过CBPSO优化前后的CMC曲线的对比效果。

图10和图11中可以看出,在经过CBPSO优化后,只用很少的特征就可以获得比原始特征更高的识别率。尤其是在在训练图片>=4的时候,可以在Rank=1的时候达到100%的识别率了,充分说明了融合算法的有效性。

本发明针对远距离虹膜图片识别率较低的问题,提出了一个性能优良、实现简单的虹膜人脸多模识别系统。虹膜的特征提取采用Curvelet变换,人脸的特征提取采用2DLogGabor+Curvelet算法。实验结果表明,融合后的特征有效地提高识别率。在没有优化的情况下,30%的训练集就可以使识别率达到98.5%。而单独的虹膜和人脸的识别率则分别是83%和95%。

虽然人脸特征和虹膜特征的融合可以提高识别率,但是这种初步融合的特征含有很多冗余的信息。为了减少特征融合后的维度数,缩短系统运行时间,进一步提高识别率,本发明的方法和系统采用改进的混沌二进制粒子群对虹膜人脸融合后的初步特征进行筛选。同时采用核极限学习机的分类准确率作为粒子的适应度值。实验结果表明,通过该优化算法不仅可以特征维度大幅缩小30多倍,还提高了识别率。CMC曲线表明,30%的训练集可以使识别率达到99.3%。40%以上的训练集就能达到100%的识别率。并且随着Rank的增加,优化后的系统可以更快地达到100%识别率。系统的原理易于理解、便于实现,有很强的实际应用价值。实验结果表明,论文提出的改进算法不仅可以大幅降低特征融合的维度数,还可以有效地提高识别率。

可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。

图12为本发明实施例提供的一种多模生物特征的优化装置的结构示意图,该装置可由软件和/或硬件实现,一般地集成于智能终端中,可通过多模生物特征的优化方法来实现。如图所示,本实施例可以以上述实施例为基础,提供了一种多模生物特征的优化装置,其主要包括了特征确定模块1210、优化模块1220以及识别模块1230。

其中的特征确定模块,用于基于图片信息的有效区域获取虹膜特征和面部特征,对所述虹膜特征和所述面部特征进行初步融合后得到初步融合特征;

其中的优化模块,用于通过改进的二进制粒子群算法对所述初步融合特征进行优化,得到优化融合特征;

其中的识别模块,用于根据所述优化融合特征对所述图片信息进行身份识别。

本发明示例性实施例的优化模块,包括:

确定所述初步融合特征的训练集和测试集;

通过改进的二进制粒子群对所述训练集和测试集进行粒子变换和空间变换,分别生成对应的特征子空间训练集和特征子空间测试集;

对所述特征子空间训练集和特征子空间测试集进行迭代,得到所述优化融合特征。

本发明示例性实施例中所述特征确定模块还用于:

确定图片中的虹膜有效区域并经过Curvelet变换后,得到若干个Curvelet系数;

通过各所述Curvelet系数进行图像重构,确定重构图像中特征维度小且有效识别的虹膜特征;以及;

通过2DLog-Gabor方法从图片中的人脸有效区域确定若干特征子图,基于所述若干特征子图中维度系数结合Curvelet变换确定所述面部特征。

本发明示例性实施例的特征融合模块还用于:对所述虹膜特征和所述面部特征进行串联得到所述初步融合特征;

所述优化模块还用于:

通过二进制粒子对所述初步融合特征进行筛选,并通过适应度函数进行迭代以得到最佳粒子,所述最佳粒子为所述优化融合特征;

其中,所述适应度函数为核极限学习机函数。

本发明示例性实施例中所述改进的二进制粒子群算法为引入混沌映射的离散二进制粒子群算法,且所述混沌映射为:

通过以下Logic映射来产生伪随机序列:

Z:a

其中Z为一个混沌变量序列,a

本发明示例性实施例中,所述优化模块还用于:

在二进制粒子群算法中,第i个粒子的速度表示为向量V

v

其中,t表示第t次迭代;ω为惯性权重,取[0,1]之间的随机数;r

上述实施例中提供的多模生物特征的优化装置可执行本发明中任意实施例中所提供的多模生物特征的优化方法,具备执行该方法相应的功能模块和有益效果,未在上述实施例中详细描述的技术细节,可参见本发明任意实施例中所提供的多模生物特征的优化方法。

本说明书实施例中涉及的技术载体,例如可以包括近场通信(Near FieldCommunication,NFC)、WIFI、3G/4G/5G、POS机刷卡技术、二维码扫码技术、条形码扫码技术、蓝牙、红外、短消息(Short Message Service,SMS)、多媒体消息(Multimedia MessageService,MMS)等。

本说明书实施例中所述生物识别所涉及的生物特征,例如可以包括眼部特征、声纹、指纹、掌纹、心跳、脉搏、染色体、DNA、人牙咬痕等。其中眼纹可以包括虹膜、巩膜等生物特征。

需要说明的是,本发明示例性实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本发明示例性实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的多模生物特征的优化方法。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

图13示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行本发明实施例的方法。

输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序及程序本身的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息,以用于执行本发明实施例的上述技术方案。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明示例性实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本发明示例性实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明示例性实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明示例性实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明示例性实施例。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。

本发明示例性实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明示例性实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

相关技术
  • 多模生物特征的优化方法、装置、介质和设备
  • 多模态生物特征融合方法、装置、存储介质及设备
技术分类

06120112325935