掌桥专利:专业的专利平台
掌桥专利
首页

一种基于迁移学习和GAN网络的指静脉身份识别系统

文献发布时间:2023-06-19 09:41:38


一种基于迁移学习和GAN网络的指静脉身份识别系统

技术领域

本发明涉及生物特征识别技术领域,具体提供一种基于迁移学习和GAN网络的的指静脉识别方法及系统。

背景技术

指静脉识别技术是利用近红外线穿透手指后所得的静脉纹路影像来进行个人识别,是具有高精度、高速度的世界上最尖端的生物识别技术。在各种生物识别技术中,因其是利用外部看不到的生物内部特征进行识别的技术,所以作为具有高防伪性的第二代生物识别技术备受瞩目。由于其是利用身体内部特征来识别且必须是活体才可利用,指静脉则必须是活体有流动的血液,且隐藏于手指内部,复制难度极大,比较与指纹之类的识别技术又跨进了一大步。以往传统的方法,如基于指静脉纹路的方法、SIFT、LBP、WLD、HOG等等基于人工设计的特征提取方法,在适应多样性数据上都缺乏鲁棒性,当光学仪器的散射现象,低分辨率,手指过于肥大导致血管不明显等问题出现时,以上传统方法都难以完美解决,产生性能下降的问题。深度学习做为一种可以自动从大量图片集中学习特征提取方法的技术逐渐受到科研界和工业界的重视。但深度学习的一大前提是需要大量的图片集数据,而指静脉这一领域难以采集获得大量数据,当数据量不足时,深度学习将会出现过拟合现象:训练集数据下模型的效果极好,测试集和实际应用时效果不佳。

当某领域数据量不足时,我们可以从另一个相似的、容易获取大量数据的领域中训练一个优质模型,利用一些学习框架,基于已训练好的模型,将模型参数逐渐迁移,最终将模型迁移为目标领域的优质模型,这种学习方法就称为迁移学习。

利用迁移学习的方法对深度网络模型进行优化,既发挥了深度学习的特征提取能力,又有效地避免了小数据量下深度学习由于过拟合能力受限的问题。

发明内容

本发明所述的指静脉精准身份识别系统(Vein Accurate Recognition System,VARS),首次采用迁移学习的方式,利用生成的海量仿真指静脉数据,训练三元网络深度学习模型做为特征提取模块基准模型,再基于CycleGAN网络为基础的迁移学习架构,利用少量真实指静脉数据对基准模型进行迁移学习,得到一个针对真指静脉的精准特征提取模块。通过该特征提取模块构建的指静脉身份识别系统具有鲁棒性好、精度高、运行速度快、简单轻量、新增用户所需时间极短和部署价格低等一系列优点。

VARS系统能够对重要出入口提供高可靠性的安全管理措施,广泛应用于银行、机房、军械库、机要室、监狱、部队、政府、学校、办公室等高安保领域,以及其他身份识别相关的应用领域,如指静脉付款、指静脉签名等。

本发明具有以下优点:

本专利基于迁移学习训练所得的深度卷积网络,继承了卷积网络的特征提取方面的优势,相较于传统的图像处理、模式识别等人工特征提取方法,具有更全面的特征提取能力,针对不同的图片质量和环境影响都有很好的鲁棒性和精度,且在图片预处理上不需要过多操作(仅需感兴趣区域ROI裁剪,尺寸统一,流明度归一化),使得整体识别流程时间大大缩短。且本专利所采用的基于CycleGAN的迁移学习框架,解决了小数据量下深度卷积网络容易过拟合(训练效果好,实际应用效果差)的问题。

由于迁移学习和三元网络的训练方式以及特征提取模块本身的精细网络结构,本专利的特征提取模块仅需要128维就可以很好地表征一个指静脉样本,并且,由于维度低的特点,围绕该模块构建的数据存储模块、欺骗检测模块、身份认证模块,占用系统存储和计算资源很少,因此具有较低的硬件依赖,降低了部署成本。

附图说明

图1 VARS指静脉身份识别系统

图2“新增用户”数据流程图

图3“新增用户”逻辑流程图

图4“身份认证”数据流程图

图5“身份认证”逻辑流程图

图6特征提取模块结构

图7卷积BN层结构图

图8 101浅层特征提取单元结构图

图9 102深层特征提取单元结构图

图10 A型inception残差块结构图

图11 B型inception残差块结构图

图12 C型inception残差块结构图

图13 A型特征蒸馏块结构图

图14 B型特征蒸馏块结构图

图15特征提取模块基准模型的训练方案

图16仿真指静脉

图17三元对损失函数的目标

图18设备采集的真指静脉

图19 ROI裁剪后的真指静脉

图20 CycleGAN网络结构

图21迁移学习网络结构

图22图像采集预处理模块

图23图像采集单元201示意图

图24质量评估模块

图25欺骗检测模块

图26身份认证模块

具体实施方案:

下面结合附图和具体实施方案对本发明作详细介绍。

系统结构:

本发明所述VARS(Vein Accurate Recognition System)指静脉身份识别系统如图1所示,按模块划分可分为:图像采集及预处理模块,样本质量评估模块,欺骗检测模块,特征提取模块,身份认证模块,数据存储模块。各模块功能概述如下:

图像采集预处理模块:负责手指静脉的采集和采集后的图像的预处理。经过指静脉采集设备成像,得到尺寸为长宽为400*200的指静脉图片,根据手指轮廓进行ROI裁剪,然后将尺寸统一为320*128的指静脉区域图片,再对图片进行流明度归一化。

样本质量评估模块:负责评估采集和预处理后的图片的质量。输入为图像采集预处理模块预处理后的指静脉图片(尺寸320*128),经过质量评估,如果图片质量符合标准将输入的指静脉图片输出;如果判定为图片质量不够好,静脉信息不足,在此处终止目前的工作流程,不再向下一模块输出。

欺骗检测模块:负责判断输入图片是伪造假指静脉还是真实指静脉。输入为样本质量评估模块评估后的指静脉图片(尺寸320*128),如果判定图片为真实指静脉,将输入的指静脉图片输出;如果判定为伪造指静脉,否则在此处终止目前的工作流程,系统报警,伪造输入记录和时间戳将作为系统识别记录输出给数据存储模块。

特征提取模块:通过迁移学习训练所得,负责针对图片进行指静脉特征提取。每张图片输出一个128维指静脉特征向量。输入为样本质量评估模块输出的指静脉图片(尺寸320*128),经过该特征提取模型,输出128维指静脉特征向量。该特征提取过程支持批量处理。

身份认证模块:负责对输入的特征向量判断其身份所属。该模块有两个输入:a.由特征提取模块输出的128维指静脉特征(需验证的身份),b.由数据存储模块输出的全部内部人员的身份特征分布信息。基于欧式距离比对a与b之间的覆盖情况,判定需验证的身份所属。输出-1表示未知外来人员,输出对应的身份编号表示已知人员。判定结果和时间戳将作为系统识别记录传输给数据存储模块。

数据存储模块:负责存储和读取指静脉特征信息、加密指静脉样本和系统识别记录。该模块有5个工作内容:1.存储加密图像:接收来自样本质量评估模块输出的指静脉图片,经过图像加密,将加密图像文件存储。2.存储身份特征分布信息:接收来自特征提取模块的新增用户的多个特征向量,经过计算处理,生成该身份的特征分布信息,与用户输入名称打包存储。3.存储系统识别记录:记录来源于欺骗检测模块的伪造输入记录和身份认证模块的准入/拒绝记录,包含时间戳,本模块将原记录逐行存储。4.读取身份特征分布信息:读取全部内部人员的特征分布信息,输出到身份认证模块。5.读取系统识别记录:读取已有的系统识别记录,输出到系统用户界面,供系统管理员查看。

系统工作执行流程:

VARS系统包括两种工作模式:新增用户,身份认证。

“新增用户”:

为系统添加新用户。VARS系统要求使用者成功录入5次同一手指的指静脉,然后用这些样本生成代表该用户(手指)的特征信息并记录进入系统。成为系统的用户后,将被视为系统内部人员。

“新增用户”的数据流程图如图2所示,逻辑流程图如图3所示,工作执行流程如下:

步骤1:数据采集及预处理。用户手指平稳放置于指静脉采集设备上,首先经过数据采集及预处理模块,经过图像采集、ROI裁剪、尺寸统一、流明度归一化,输出320*128的尺寸的指静脉图片。

步骤2:样本质量评估。经过样本质量评估模块,根据评估模块的判定结果:如果判定为质量不合格,则被拒绝录入进入系统数据库,系统会要求使用者重新录入,直至成功录入5张合格质量的指静脉样本,将5张指静脉样本经过加密送入数据存储模块进行样本存储。

步骤3:对5张指静脉样本进行图像增强,进行小范围旋转,放大,位置偏移,将数据量增加10倍至50张样本。将50张样本批量输入特征提取模块得到由50个128维的指静脉特征组成的特征组。将特征组输入到数据存储模块,经过计算处理,生成该身份的特征分布信息,与用户输入的身份名称(用户真实姓名或工号,由实际使用场景决定)打包存储。

“身份认证”:

判断当前系统使用者是否为内部人员。如果判断为内部人员,准许其进入。否则拒绝其进入。“身份认证”的数据流程图如图4所示,逻辑流程图如图5所示,工作执行流程如下:

步骤1:数据采集及预处理。用户手指平稳放置于指静脉采集设备上,首先经过数据采集及预处理模块,经过图像采集、ROI裁剪、尺寸统一、流明度归一化,输出一张320*128的尺寸的指静脉图片。

步骤2:样本质量评估。经过样本质量评估模块,根据评估模块的判定结果:如果判定为质量不合格,系统会要求使用者重新录入。如果判定质量合格,则将模块的输入原图片送入欺骗检测模块。

步骤3:欺骗检测。经过欺骗检测模块,查看是否为真指静脉图片,如果判断为伪造指静脉图片,用户的输入将被拒绝,系统将报警,伪造样本记录和时间戳将作为系统识别记录输出给数据存储模块,“身份认证”流程提前结束。如果判断为真指静脉,则将模块的输入原图片送入特征提取模块。

步骤4:特征提取。经过特征提取模块,对经过预处理的指静脉样本进行特征提取,获得128维指静脉特征,输出给特征提取模块。

步骤5:身份认证。经过身份认证模块,从数据存储模块读入全部内部人员的身份特征分布信息,将特征提取模块提供的128维特征与全部内部人员的身份特征分布信息进行比对,如果身份认证模块判定为某一类别,输出对应的身份编号表示已知人员,表示准许其进入;如果特判定为属于外来人员,输出-1,表示拒绝其进入。判定结果和时间戳将作为系统识别记录送入数据存储模块。

各模块结构和设计方案:

1.特征提取模块:

1.1.特征提取模块结构:

如图6所示为VARS指静脉身份识别系统的特征提取模块,包括101-104:101浅层特征提取单元,102深层特征提取单元,103全连接特征映射单元,104L2正则单元。

网络结构详细介绍:

本发明中用2D卷积BN层替代普通2D卷积层,旨在提高训练收敛速度。如图7所示,2D卷积BN层由2D卷积+BatchNormalization层+RELU组合而成。在后续文档中,将简称为“卷积BN层”。

101浅层特征提取单元:

如图8所示,包括6个卷积BN层和1个3*3最大化池化层,其中第一个和最后一个卷积BN层的步长为2。浅层特征提取单元旨在提取指静脉简单特征,完成后交由深层特征提取单元进一步提取。

102深层特征提取单元:

如图9所示,按从输入到输出顺序,依次由5个A型inception残差块、A型特征蒸馏块、10个B型inception残差块、B型特征蒸馏块、6个C型inception残差块、平均池化层和Dropout层组成。

A型inception残差块的组成如图10所示:第一分支B1由一个1*1卷积核的卷积BN层T1组成,第二分支B2由1*1卷积核的卷积BN层T2和3*3卷积核的卷积BN层T3组成,第三分支B3由1*1的卷积BN层T4和两个3*3的卷积BN层T5和T6组成。融合层T7将T1,T3和T6的输出融合,T7的输出再经过1*1的卷积BN层T8,融合层T9将T8输出和原输入X融合,再经过Relu层后,作为最终输出,最终输出与输入尺寸一致。

B型inception残差块的组成如图11所示:第一分支B1由一个1*1卷积核的卷积BN层T1组成,第二分支B2由1*1的卷积BN层T2、1*7的卷积BN层T3和7*1的卷积BN层T4组成.融合层T5将T1和T4的输出融合,T5的输出再经过1*1的卷积BN层T6,融合层T7将T6输出和原输入X融合,再经过Relu层后,作为最终输出,最终输出与输入尺寸一致。

C型inception残差块的组成如图12所示:第一分支B1由一个1*1卷积核的卷积BN层T1组成,第二分支B2由1*1的卷积BN层T2、1*3的卷积BN层T3和3*1的卷积BN层T4组成.融合层T5将T1和T4的输出融合,T5的输出再经过1*1的卷积BN层T6,融合层T7将T6输出和原输入X融合,再经过Relu层后,作为最终输出,最终输出与输入尺寸一致。

A型特征蒸馏块的组成如图13所示:第一分支B1由一个3*3卷积核、步长为2的卷积BN层T1组成,第二分支B2由1*1卷积核的卷积BN层T2和两个3*3卷积核的卷积BN层T3和T4组成,其中T4步长为2,第三分支B3由3*3池化尺寸、步长为2的最大池化层T5组成。融合层T6将T1,T4和T5的输出融合,作为最终输出。

B型特征蒸馏块的组成如图14所示:第一分支B1由1*1的卷积BN层T1和3*3卷积核、步长为2的卷积BN层T2组成,第二分支B1由1*1的卷积BN层T3和3*3卷积核、步长为2的卷积BN层T4组成,第三分支B2由1*1卷积核的卷积BN层T5和两个3*3卷积核的卷积BN层T6和T7组成,其中T7步长为2,第四分支B3由3*3池化尺寸、步长为2的最大池化层T8组成。融合层T9将T2、T4、T7和T8的输出融合,作为最终输出。

103全连接特征映射单元:

由激活函数为线性函数、128维的全连接层构成,接收102深层特征提取单元的输出并输出128维特征向量。

104L2正则单元:

对103全连接特征映射单元的输出进行L2范数归一化处理,得到128维的L2距离即欧式距离。

1.2.特征提取模块的工作流程:

101浅层特征提取单元:将经过预处理的3D指静脉张量信息(尺寸为320*128*1)输入101浅层特征提取单元,经过T1卷积层处理得到159*64*32的数据,经过T2卷积层处理得到157*62*32的数据,经过T3卷积层处理得到157*62*64的数据,经过T4最大池化层处理得到78*30*64的数据,经过T5卷积层处理得到78*30*80的数据,经过T6卷积层处理得到76*28*192的数据,经过T7卷积层处理得到37*13*256浅层特征提取数据。

102深层特征提取单元:将T7卷积层得到的37*13*256的浅层特征提取数据输入102深层特征提取单元,连续经过5个5个A型inception残差块得到37*13*256的特征数据,经过A型特征蒸馏块得到18*6*896的蒸馏特征数据,再连续经过10个B型inception残差块得到18*6*896的特征数据,经过B型特征蒸馏块得到8*2*1792的蒸馏特征数据,再经过6个C型inception残差块得到8*2*1792数据。经过平均池化层输出1792*1维特征数据,经过Dropout层弃掉20%参数来防止过拟合,输出仍为1792维深层特征数据。

103全连接特征映射单元:将1792维的深层特征数据输入128维的全连接特征映射单元,得到128维指静脉特征向量。

104L2正则单元:对128维指静脉特征向量进行L2范数归一化处理,得到128维的L2距离的指静脉特征,即特征提取模块的最终映射结果。

1.3.特征提取模块基准模型训练方案:

如图15所示,为迁移学习所需要的基准特征提取模型的训练方式。模型采用三元对网络的训练方式,旨在让同类别的映射向量距离近,同时不同类别的映射向量距离远。当基准特征提取模型训练完成后,我们将以它作为基准,从模型参数上向真指静脉数据进行迁移学习,最终得到针对真指静脉的特征提取模型。本公司自研的指静脉生成算法合成的仿真指静脉如图16所示。相较于真指静脉数据,具有更多复杂性和理论上无限数据量的优势。

预处理:输入数据来自我们合成的仿真指静脉数据集,将输入图片统一变为320*128尺寸;后进行图片流明度归一化,采用以下公式对图像进行流明度归一化:

x=(x-u)/σ,

其中x*是归一化后的值。x是原像素点像素值,u为全图像素值均值,σ为全图像素值方差三元对分组:输入为归一化后的样本图片及对应类别标签,根据分组规则,组合成三张样本为一组的输入方式,三张样本的组合规律为:一张指静脉样本,与之同一类别的另一张样本,与之不同类别的一张样本,这三张样本我们简称为锚点(Anchor,缩写为A),正例(Positive,缩写为P),负例(Negative,缩写为N)。模块使用的分组规则的详细描述如下:

从样本集中随机采样,按类别分开,称为Sample集。利用映射模型对全部采样样本进行映射,得到映射集Embedding。

从每个类别开始,两两成对,先组成(A,P)对。

去除映射集中与A和P同类别的样本,对剩余样本针对A计算距离,找到所有符合类间距离–类内距离

特征提取:将平铺的Triplets三元对集输入到特征提取模块中,输出得到128维特征向量组Output。

反向传播训练:将Output重新排列成三元对形式,利用三元对损失函数进行反向传播:

其中,

以此方式进行训练直至收敛,获得基于仿真指静脉的特征提取模型。

1.4.特征提取模块的迁移学习方案:

本专利采用的迁移学习训练框架基于CycleGAN结构。

迁移学习的源域是我们合成的仿真指静脉数据(简称Xs),如图16所示。目标域是我方设备采集的真指静脉(简称Xt),如图18所示。基于已经训练好的针对仿真指静脉的特征提取模型(简称Ms),利用基于CycleGAN改进的迁移学习架构,将模型权重迁移训练至针对真指静脉的特征提取模型(简称Mt)。

GAN网络全称为生成性对抗网络,包含一个生成器和一个判别器,生成器(简称为G)负责伪造更加逼真的数据,判别器(简称为D)负责将伪造数据和真实数据区别开,真数据输出1,假数据输出0。随着训练的进行,生成器的伪造能力和判别器的判别能力都在增强,直至判别器无法判断出伪造数据和真实数据的差别时,训练完成。这时我们将得到一个可以生成非常真实数据的生成器,很好地生成一种数据,说明它可以很好地反映数据本身的规律。

GAN网络的损失函数如以下公式所示:

其中,X表示真实数据,Z表示随机噪声。解读此损失函数时,需要分开来看,当关注判别器D时,生成器G是固定的,根据损失函数,判别器D将尝试让V(G,D)最大,需要D(x)最大而D(G(z))最小,即真数据都判定为1,而伪造数据都被判定为0;当关注生成器G时,判别器D是固定的,生成器将尝试让V(G,D)最小,需要D(G(z))最大,即伪造数据都被判定为1。我们简称上述损失为GAN网络的对抗损失。

CycleGAN是一种经典的图像翻译GAN网络,旨在将一个域的图像特征转移到另一个域。

CycleGAN网络由两个镜像对称的GAN网络组成,构成了一个环形网络。CycleGAN网络结构如图20所示。现有来自两个域的图像,拥有不同的特征。CycleGAN尝试将利用生成器G

第一部分:以上损失为生成器G

第二部分:以上损失为生成器G

第三部分:以上为CycleGAN的cycle consistency损失,包括:将A域样本,转换到B域,再转换回A域,新样本与原样本的距离比对损失,以及另一方向B->A->B的距离比对损失。两个损失之和为cycle consistency损失。

在CycleGAN的基础上,改造出我们的迁移学习模型,结构如图21所示。我们将A域称为源域,命名为S。将B域称为目标域,命名为T。我们分别加入源域和目标域的特征提取模型,源域的特征提取模型为上文描述的“特征提取模块基准模型”。两个特征提取模型结构完全相同,但参数不同,训练时基于同样的损失函数,简称为L

网络输入为:源域数据集X

网络输出为:训练好的针对目标域(真指静脉)的特征提取模型M

步骤1:对X

步骤2:利用联合损失函数公式1对G

联合损失函数公式1

公式第一行:标准的CycleGAN对抗损失,针对目标域转换到源域数据的判别器生成器对抗损失。

第二行:利用源域数据及标签,训练源域特征提取模型的损失。

第三行:利用CycleGAN生成器G

以上所描述的步骤2是联合训练,是基于联合损失函数公式1的损失和为基准进行反向传播训练。

步骤3:利用联合损失函数公式1对G

联合损失函数公式1

公式第一行:标准的CycleGAN对抗损失,针对源域转换到目标域数据的判别器生成器对抗损失。

公式第二行:目标域特征提取模型的损失,利用目标域数据及标签,训练目标域特征提取模型的损失。

公式第三行:利用CycleGAN生成器G

以上所描述的步骤3是联合训练,是基于联合损失函数公式2中的损失和为基准进行反向传播训练。

步骤4:不断重复步骤1、2、3直至目标域特征提取模型收敛。

通过上述迁移学习流程,最终获得目标域(真指静脉)的特征提取模型。

2.图像采集预处理模块:

VARS系统的图像采集预处理模块如图22所示,包括201,202:

图像采集单元201:负责采集指静脉图像。如图23所示,单元主要由近红外光平台和电荷耦合器件(CCD)预处理器摄像头组成。手指平放于近红外光平台后,近红外光照射整个采集区域,手指血管中的血红蛋白会吸收更多的近红外光,而其他组织吸收的较少。近红外成像被CCD摄像头获取,最终成像图片的血管部分将呈现为较暗的线,与其他部分形成明暗对比。最终采集到的成像尺寸为400*200。

预处理单元202:负责裁剪指静脉感兴趣区域(ROI),统一尺寸,流明度归一化。接收到图像采集单元201的图像后,找到手指轮廓的上下边缘,拟合手指方向中心线,旋转手指方向至水平,根据手指边缘内切线进行裁剪。裁剪后的样本尺寸不一,将统一尺寸至320*128,裁剪后效果如图19所示。再利用以下公式对图片进行流明度归一化:

x

其中x

3.样本质量评估模块:

VARS系统的样本质量评估模块如图24所示:

质量评估单元301:基于图片的对比度,信息熵分别进行打分,然后利用两个分数进行综合打分,少于70分的图片被判定为图片质量不佳。

对比度质量分数:我们主要利用图像的灰度均方差来评判对比度分数,

图像的灰度均方差C基于如下公式:

其中,C为图像的灰度均方差,x

基于我方采集的指静脉数据,当图像的灰度均方差大于45时(该阈值可能会随着不同的采集图像库发生变化),指靜脉质量较高,可进行正常的指静脉识别,对比度质量分数的求解方法为:

S

S

信息熵质量分数:

图像的信息熵表征图像灰度分布的聚集特性,图像的信息熵越大,表示图像的信息量越多,越丰富。对于指静脉图像而言,当图像的纹理特征越显著时,图像的信息熵也越大。图像信息熵的求解方法为:

其中,p(i)为每个灰度级在图像中出现的概率,S为图像信息熵。

基于我方采集的指静脉数据,当图像信息熵大于5时(该阈值可能会随着不同的采集图像库发生变化),指静脉图像的质量较高,可进行正常的指静脉识别。因此,信息熵质量分数S_comentropy求解方法为:

S

S

总体评价分数:

在根据以上方法获取到对比度质量分数、信息熵质量分数后,需综合考虑这2个方面的参数得分,并按照一定的加权进行累加求和,得到最终的总体评价分数。

从以上2项指标的求解方法中可以看出,各个指标的分数越低,图像质量越差。在总体评价分数计算时,首先需要考虑单个指标对总分的影响,同时单个指标的权重也应该受到其他一项指标的影响。基于此考虑,本文中的指静脉综合质量分数S_vein求解方法为:

当综合得分少于70分时,质量评估单元301判定为质量不佳的图片。

4.欺骗检测模块:

如图25所示,VARS系统的欺骗检测模块包括401,402:

特征提取单元401:负责提取目标指静脉图片的128维特征,输入为320*128尺寸的经预处理的指静脉图片,输出为128维特征向量。特征提取单元401的网络结构是特征提取模块的101浅层特征提取单元和102深层特征提取单元的串联结构,在此不再赘述。

真假静脉分类单元402:输入为128维特征向量,基于SVM分类器,判定的样本是来自真静脉还是伪造的指静脉,输出判定结果,0代表伪造的指静脉,1代表真指静脉。

欺骗检测模块的训练方案:

准备真指静脉图片:直接使用采集的真指静脉图片,标签为1。

准备伪造指静脉图片:利用真静脉图片扫描件,以2400dpi的分辨率打印在无光铜版纸上再扫描成为电子图片,作为伪造指静脉图片,标签为0。

将真假指静脉集按8:2分割为训练集和测试集。先训练特征提取单元401,损失函数为Softmaxloss,直至loss收敛,得到训练好的特征提取单元401。利用特征提取单元401针对训练集生成对应数量的128维特征向量,利用128维特征向量和对应真假指静脉标签对真假静脉分类单元402进行SVM模型训练,直至SVM的准确率达到最优。最终在测试集进行测试,测试集分类准确率可达到99.993%。固化特征提取单元401和分类单元402的权重参数,欺骗检测模型到此训练完成。

5.身份认证模块:

如图26所示,VARS系统的身份认证模块包括501:

身份比对单元501:从数据存储单元接收已有全部内部人员的身份特征分布信息,每一个身份对应了一个圆的中心点坐标(128维)和圆的半径;从特征提取模型接收一个128维向量,即来自某一指静脉图片的特征提取结果,为一个特征点(128维)。

基于欧式距离,判断该特征点与各圆的覆盖情况,分为以下三种情况:如果该点不被任何圆覆盖,那么该样本被判定为未知身份(外来人员),输出-1。如果该点仅被一个圆覆盖,那么该样本被判定为该圆对应的身份,输出为该身份对应编号及名称。如果该点被多个圆覆盖,那么判定为与该点距离最近的圆心的圆所对应的类别,输出身份对应编号及名称。

6.数据存储模块:

数据存储模块包括601-602:

数据处理单元601:接收来自其他模块的输入和处理数据,并写入存储单元602。

存储单元602:数据存储位置,存储介质为Micro SD卡

数据存储模块的工作流程:

存储加密图像:数据处理单元601接收来自样本质量评估模块输出的指静脉图片,采用自研乱码加密技术对图片进行加密,后写入存储单元602。

存储身份特征分布信息:数据处理单元601接收来自特征提取模块的新增用户的50个128维特征向量,进行kmeans聚类,聚类为两个簇,保留主要的簇。将每个特征向量视为一个128维空间内的点,针对这些点求中心点,然后求得每个点到中心店的距离,取这些距离的中位数乘以半径比率(超参数,可人为调整)为半径,形成一个圆,来近似该新增用户的正态分布。将该圆的中心点和半径作为该身份的特征分布信息,生成身份编号。将特征分布信息、身份编号和用户输入的身份名称一起打包写入存储单元602。

存储系统识别记录:数据处理单元601接收来自欺骗检测模块的伪造输入记录和身份认证模块的准入/拒绝记录,不经处理直接写入存储单元602。

读取身份特征分布信息:数据处理单元601从存储单元602读取全部内部人员的特征分布信息,输出到身份认证模块。

读取系统识别记录:数据处理单元601从存储单元602读取已有的系统识别记录,输出到系统用户界面。

此实例仅仅是对本发明进行举例说明,VARS设备及系统的实施方式并不局限于此实例,对于本领域的研究人员来说,完全可以对本发明所述设备和系统进行修改和优化,这些原理本质和本发明内容相同,而表现形式不同的改动均属于本发明的保护范围之内。

相关技术
  • 一种基于迁移学习和GAN网络的指静脉身份识别系统
  • 一种基于指腹静脉和指背静脉深度融合的指静脉识别方法
技术分类

06120112265538