一种性别分类的方法、设备、终端及计算机存储介质

文献发布时间：2023-06-19 09:58:59

技术领域

本发明涉及神经网络技术领域，特别涉及一种性别分类的方法、设备、终端及计算机存储介质。

背景技术

随着计算机科学技术的迅速发展，网络化与智能化已经成为信息领域的发展方向。由此，生物特征识别技术得到了迅速的发展。所谓生物识别技术是指，通过计算机与各种传感器和生物统计原理相结合，利用人体的生理结构和行为特征，进行个人身份认证，常用的有人脸、虹膜、指纹、语音等。对于特征的提取，卷积神经网络在图像识别领域越来越受到欢迎；现有的针对眼周图像分类的方法是传统的机器学习，通过支持向量机(SVM)等机器学习分类技术进行分类，缺点是步骤复杂，导致效率低，分类准确率低。

由此，目前需要一种更好的方法来解决这种问题。

发明内容

针对现有技术中的缺陷，本发明提出了一种性别分类的方法、设备、终端及计算机存储介质，实现了更快的分类速度以及更高的分类精度。

具体的，本发明提出了以下具体的实施例：

本发明实施例提出了一种性别分类的方法，包括：

获取预先训练好的图像特征提取模型；

将所述图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中进行迁移学习训练；

基于训练完成的所述神经网络模型对待识别的眼周图像进行性别识别。

在一个具体的实施例中，所述图像特征提取模型为在ImageNet上预先训练好的VGG模型和Resnet34模型。

在一个具体的实施例中，所述眼周图像为虹膜图像。

在一个具体的实施例中，所述迁移学习训练，包括：

获取样本数据作为训练数据库，并将所述图像特征提取模型的结构参数作为训练数据源；

基于所述训练数据库和所述训练数据源对所述神经网络模型的全连接层进行训练；

将训练得到的所述全连接层的结构参数作为下一阶段的特征提取输入源，并对所述神经网络模型的结构层数进行调整，以及采用Softmax分类器作为最后的分类输出层。

在一个具体的实施例中，所述样本数据为确定分类结果为男性或女性的眼周图像；

所述“获取样本数据作为训练数据库”，包括：

对所述样本数据中的眼周图像进行扩增，并基于扩增后的眼周图像生成训练数据库。

在一个具体的实施例中，所述扩增包括以下一个或多个的组合：水平翻转、旋转。

本发明实施例还提出了一种性别分类的设备，包括：

获取模块，用于获取预先训练好的图像特征提取模型；

训练模块，用于将所述图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中进行迁移学习训练；

分类模块，用于基于训练完成的所述神经网络模型对待识别的眼周图像进行性别识别。

在一个具体的实施例中，所述图像特征提取模型为在ImageNet上预先训练好的VGG模型和Resnet34模型。

本发明实施例还提出了一种终端，包括存储器以及处理器，所述处理器执行所述存储器中的代码时执行上述的方法。

本发明实施例一种计算机存储介质，所述计算机存储介质中存储有应用程序，所述应用程序用于执行上述的方法。

以此，本发明实施例提出了一种性别分类的方法、设备、终端及计算机存储介质，该方法包括：获取预先训练好的图像特征提取模型；将所述图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中进行迁移学习训练；基于训练完成的所述神经网络模型对待识别的眼周图像进行性别识别。本方案采用迁移学习，利用预先训练好的图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中，并利用迁移学习训练完成的神经网络模型进行性别的识别，不需要重新完全训练多个模型，提升了效率，实现了更快的分类速度以及更高的分类精度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提出的一种性别分类的方法的流程示意图；

图2为本发明实施例提出的一种性别分类的方法中基于VGG16模型提取虹膜特征的示意图；

图3为本发明实施例提出的一种性别分类的方法中残差结构的示意图；

图4为本发明实施例提出的一种性别分类的方法的示意图；

图5为本发明实施例提出的一种性别分类的设备的结构示意图。

具体实施方式

在下文中，将更全面地描述本公开的各种实施例。本公开可具有各种实施例，并且可在其中做出调整和改变。然而，应理解：不存在将本公开的各种实施例限于在此公开的特定实施例的意图，而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。

在本公开的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本公开的各种实施例。如在此所使用，单数形式意在也包括复数形式，除非上下文清楚地另有指示。除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本公开的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本公开的各种实施例中被清楚地限定。

实施例1

本发明实施例1公开了一种性别分类的方法，如图1所示，包括以下步骤：

步骤101、获取预先训练好的图像特征提取模型；

具体的，所述图像特征提取模型为在ImageNet(是一个用于视觉对象识别软件研究的大型可视化数据库)上预先训练好的VGG(Visual Geometry Group Network)模型和Resnet34(残差网络，如图3所示)模型。其中具体的VGG16模型提取虹膜特征如图3所示。

步骤102、将所述图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中进行迁移学习训练；

具体的，所述迁移学习训练，包括：

获取样本数据作为训练数据库，并将所述图像特征提取模型的结构参数作为训练数据源；

基于所述训练数据库和所述训练数据源对所述神经网络模型的全连接层进行训练；

进一步的，所述样本数据为确定分类结果为男性或女性的眼周图像；

所述“获取样本数据作为训练数据库”，包括：

对所述样本数据中的眼周图像进行扩增，并基于扩增后的眼周图像生成训练数据库。

此外，所述扩增包括以下一个或多个的组合：水平翻转、旋转。

以此，例如采集的样本图像为近红外眼周图像，将数据分为男性、女性作为识别对象。两类实验样本图像共采集3300张，为了避免训练过拟合，对原始数据集进行扩增，通过Python脚本语言，将图片进行水平翻转、旋转，对样本量进行扩增5倍，共计16500张，其中男女各8250张。

而图像特征提取模型如ImageNet上预先训练好的VGG模型和Resnet34模型等均为卷积神经网络，卷积神经网络(简称CNN)结构有输入层、卷积层、池化层、全连接层、输出层。卷积神经网络存在几大特点：(1)自动提取特征，无需过多人工干预；(2)多卷积结构层，增强特征提取能力；(3)自动更新、共享权值，不断提高正确率。

而迁移学习属于机器学习的一种方法，是将一个任务训练得到的模型移植到其他任务的训练上来。大数据时代，要想训练深度学习模型，得到理想的结果，需要耗费巨大的资源，深度迁移学习很受欢迎和传统机器学习方法相比，深度迁移学习可以应用于多分类识别中，不需要训练多个模型，只需要直接应用到其他任务中即可。

如图4所示，本方案中利用在ImageNet上预先训练好的VGG模型和Resnet34模型，将具有自动提取图像特征能力的卷积、池化层迁移到本研究的模型中。当输入眼周图像时，对图像进行特征提取，用2048维张量表示，并存入缓存文件。对VGG与Resnet的全连接层重新训练，对参数进行微调，对图像进行分类。

具体的，迁移学习训练过程分为三个阶段：(1)数据集扩充后的数据作为训练数据库，预训练的模型自带的结构参数作为训练数据源；(2)重新训练完整的全连接层，并将最后的全连接层的结构参数作为下一阶段的特征提取输入源；(3)最后对整个模型结构层数进行微调，最后采用Softmax分类器，作为最后的分类输出层。

步骤103、基于训练完成的所述神经网络模型对待识别的眼周图像进行性别识别。具体的，所述眼周图像为虹膜图像。

本方案采用迁移学习，利用预先训练好的图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中，并利用迁移学习训练完成的神经网络模型进行性别的识别，不需要重新完全训练多个模型，提升了效率，实现了更快的分类速度以及更高的分类精度。

实施例2

为了对本发明进行进一步的说明，本发明实施例2还公开了一种性别分类的设备，如图5所示，包括：

获取模块201，用于获取预先训练好的图像特征提取模型；

训练模块202，用于将所述图像特征提取模型中具有自动提取图像特征能力的卷积层和池化层迁移到用于性别分类的神经网络模型中进行迁移学习训练；

分类模块203，用于基于训练完成的所述神经网络模型对待识别的眼周图像进行性别识别。

在一个具体的实施例中，所述图像特征提取模型为在ImageNet上预先训练好的VGG模型和Resnet34模型。

在一个具体的实施例中，所述眼周图像为虹膜图像。

在一个具体的实施例中，所述迁移学习训练，包括：

获取样本数据作为训练数据库，并将所述图像特征提取模型的结构参数作为训练数据源；

基于所述训练数据库和所述训练数据源对所述神经网络模型的全连接层进行训练；

在一个具体的实施例中，所述样本数据为确定分类结果为男性或女性的眼周图像；

所述获取模块201，用于：

对所述样本数据中的眼周图像进行扩增，并基于扩增后的眼周图像生成训练数据库。

在一个具体的实施例中，所述扩增包括以下一个或多个的组合：水平翻转、旋转。

实施例3

本发明实施例3还公开了一种终端，包括存储器以及处理器，所述处理器执行所述存储器中的代码时执行实施例1中所述的方法。

具体的，本终端的运行环境可以为Windows server系统，处理器为

此外，本发明实施例3还公开有其他相关特征，出于简要的目的，其他相关特征请参见实施例1中的记载，在此不再进行赘述。

实施例4

本发明实施例4还公开了一种计算机存储介质，所述计算机存储介质中存储有应用程序，所述应用程序用于执行实施例1中所述的方法。具体的，本发明实施例4还公开有其他相关特征，出于简要的目的，其他相关特征请参见实施例1中的记载，在此不再进行赘述。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本发明序号仅仅为了描述，不代表实施场景的优劣。

以上公开的仅为本发明的几个具体实施场景，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：鲁远甫;于福升;李光元;周志盛;陈巍;焦国华;陈良培;刘鹏;
专利申请人：中国科学院深圳先进技术研究院;

上一篇：一种基于深度学习的穿梭车自动寻货定位方法及系统
下一篇：具有防雨防尘功能的交通用巡检无人机