掌桥专利:专业的专利平台
掌桥专利
首页

特征提取网络的训练方法、分类方法、装置及电子设备

文献发布时间:2024-04-18 19:58:26


特征提取网络的训练方法、分类方法、装置及电子设备

技术领域

本申请涉及人工智能技术领域,更具体地,涉及一种特征提取网络的训练方法、分类方法、装置及电子设备。

背景技术

目前,在利用样本集训练图像特征提取网络时,样本集中通常会包括高质量的正常样本图像,也会包含低质量的困难样本图像,在利用样本集训练图像特征提取网络时,困难样本图像在训练过程中易导致类中心分布偏移从而影响训练效果。

发明内容

有鉴于此,本申请实施例提出了一种特征提取网络的训练方法、分类方法、装置及电子设备,可以有效解决相关技术中因困难样本所导致类中心偏移的问题。

第一方面,本申请实施例提供了一种特征提取网络的训练方法,该方法包括:通过第一特征提取网络对第一样本图像进行图像特征提取,获得第一样本图像的图像特征;根据第一样本图像的图像特征、所述第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵,确定第一损失;根据所述第一损失,调整所述第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵;通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征;根据第二样本图像的图像特征、所述第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩阵,确定第二损失;一类别的主类中心为该类别的多个类中心中的一个;根据所述第二损失,调整所述第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,直至达到训练结束条件,得到目标特征提取网络。

第二方面,本申请实施例提供了一种图像分类方法,该方法包括:获取待分类图像;利用前述的特征提取网络的训练方法获得的目标图像特征提取网络对所述待分类图像进行特征提取,得到目标图像特征;根据所述目标图像特征,确定所述待分类图像的分类结果。

第三方面,本申请实施例提供了一种特征提取网络的训练装置,该装置包括第一特征提取模块、第一损失确定模块、第一调整模块、第二特征提取模块、第二损失确定模块以及第二调整模块,第一特征提取模块用于通过第一特征提取网络对第一样本图像进行图像特征提取,获得第一样本图像的图像特征;第一损失确定模块,用于根据第一样本图像的图像特征、所述第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵,确定第一损失;第一调整模块,用于根据所述第一损失,调整所述第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵;第二特征提取模块,用于通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征;第二损失确定模块,用于根据第二样本图像的图像特征、所述第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩阵,确定第二损失;一类别的主类中心为该类别的多个类中心中的一个;第二调整模块,用于根据所述第二损失,调整所述第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,得到目标特征提取网络。

在一种可实施方式中,第一损失确定模块包括第一计算子模块、矩阵确定子模块、子损失确定子模块以及第一损失确定子模块。第一计算子模块,用于对于各类别,计算第一样本图像的图像特征与多个类中心分别对应的初始类中心矩阵之间的第一相似度;矩阵确定子模块,用于将各个类别的多个初始类中心矩阵中,与所述第一样本图像的图像特征之间的第一相似度最大的初始类中心矩阵,确定为参考类中心矩阵;子损失确定子模块,用于根据所述参考类中心矩阵与该第一样本图像的类别标签,确定第一子损失;第一损失确定子模块,用于基于所述第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度和所述第一子损失,确定第一损失。

在一种可实施方式中,第一损失确定子模块,还用于对于各类别,根据所述第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度,确定在该类别下与所述第一样本图像的图像特征之间的第一相似度最大的第二类中心矩阵;根据多个类别中每个类别下的第二类中心矩阵与所述第一样本图像的图像特征之间的第一相似度,确定第二子损失;基于所述第一子损失和所述第二子损失,确定第一损失。

在一种可实施方式中,所述第一损失确定子模块,还用于基于所述第一样本图像参与的迭代周期对应的第一周期数,确定第一间隔参数和第一缩放系数,所述第一间隔参数和所述第一缩放系数与所述第一周期数呈负相关关系;基于所述第一间隔参数、所述第一缩放系数、所述第一子损失和所述第二子损失计算加性角度间隔损失,得到第一损失。

在一种可实施方式中,第一损失确定子模块,还用于基于所述第一样本图像参与的迭代周期对应的第一周期数,确定第一系数,所述第一系数与所述第一周期数呈负相关关系;根据所述第一系数确定第一间隔调整值,将该第一间隔调整值与第一参考间隔参数相加,得到第一间隔参数;根据所述第一系数确定第一缩放调整值,将第一缩放调整值与第一参考缩放系数相加,得到第一缩放系数。

在一种可实施方式中,所述装置还包括集合确定模块、参考相似度确定模块以及主类中心确定模块。集合确定模块,用于确定各类别对应的参考图像集合,一类别对应的参考图像集合包括类别标签与该类别相同的多张第一样本图像;参考相似度确定模块,用于针对每个类别,根据该类别下的多个类中心中每个类中心的中心矩阵与该类别对应的参考图像集合中各第一样本图像的图像特征之间的相似度,确定该类别下每个类中心对应的参考相似度;主类中心确定模块,用于针对每个类别,将该类别下参考相似度最大的类中心确定为该类别的主类中心。

在一种可实施方式中,所述第二损失确定模块包括第二计算子模块、类别确定子模块以及第二损失确定子模块,第二计算子模块,用于将各所述第二样本图像的图像特征与各所述类别的主类中心对应的第一类中心矩阵进行相似度计算,得到各所述第二样本图像的图像特征与各类别的主类中心之间的第二相似度;预测类别确定模块,用于将在多个类别中与所述第二样本图像的图像特征之间的第三相似度最大的主类中心所属的类别,作为第二样本图像的预测类别;第二损失确定子模块,用于第二基于所述第二样本图像的类别标签和第二样本图像的预测类别,确定第二损失。

在一种可实施方式中,所述第二损失确定子模块,还用于基于所述第二样本图像参与的迭代周期对应的第二周期数,确定第二间隔参数和第二缩放系数,所述第二间隔参数和所述第二缩放系数与所述第二周期数呈相关关系;基于第二间隔参数、第二缩放系数、所述第二样本图像的类别标签和第二样本图像的预测类别计算加性角度间隔损失,得到第二损失。

在一种可实施方式中,第二损失确定子模块,还用于基于所述第二样本图像参与的迭代周期对应的第二周期数,确定第二系数,所述第二系数与所述第二周期数呈负相关关系;基于所述第二系数确定第二间隔调整值,将第二参考间隔参数与该第二间隔调整值与相加,得到第二间隔参数;基于所述第二系数确定第二系数调整值,将第二参考缩放系数与第二系数调整值相加,得到第二缩放系数。

第四方面,本申请实施例提供了一种图像分类装置,该装置包括图像获取模块、第三特征提取模块以及分类结果确定模块,图像获取模块,用于获取待分类图像;第三特征提取模块,用于利用上述的特征提取网络的训练装置获得的目标图像特征提取网络对所述待分类图像进行特征提取,得到目标图像特征;分类结果确定模块,用于根据所述目标图像特征,确定所述待分类图像的分类结果。

在一种可实施方式中,所述待分类图像的分类结果包括认证结果,所述分类结果确定模块包括相似度计算子模块、特征确定子模块以及认证结果确定子模块。相似度计算子模块,用于将目标图像特征与预设数据库中的多个参考图像特征进行相似度计算,得到所述目标图像特征与各参考图像特征之间的相似度;特征确定子模块,用于根据所述目标图像特征与各参考图像特征之间的相似度,确定与所述目标图像特征相似度最高的目标参考图像特征;认证结果确定子模块,用于将所述目标参考图像特征关联的认证信息作为所述待分类图像的认证结果。

在一种可实施方式中,所述图像分类装置还包括支付处理模块,用于基于所述待分类图像的认证结果进行支付处理。

在一种可实施方式中,所述图像获取模块还用于获取手部图像;对所述手部图像进行关键点检测,得到手部图像中的指缝关键点;基于所述手部图像中的指缝关键点,从所述手部图像中截取掌纹像素区域,作为所述掌纹图像。

第五方面,本申请实施例提供了一种电子设备,包括处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现上述的方法。

第六方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行上述的方法。

第七方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质获取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。

本申请实施例提供的一种特征提取网络的训练方法、分类方法、装置及电子设备。通过每个类别设置多个类别中心,并根据第一样本图像的图像特征、所述第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵确定的第一损失调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,可以在提升第一特征提取网络提取特征的准确度的同时,约束各类别的多个类中心各自对应的特征空间。其后,根据第二样本图像的图像特征、所述第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩确定的第二损失调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,从而实现在训练过程中利用第二提取网络提取图像特征逐渐向各分类别的主类中心靠近,即,即使第二样本图像为困难样本,也可以将困难样本的特征向对应类别的主类中心靠近,解决相关技术中因困难样本所导致类中心偏移的问题,可以保障训练得到的目标特征提取网络对样本图像中的正常样本的特征提取性能前提下提升对样本图像中的低质量的困难样本图像的特征提取性能,从而提升了训练得到的目标特征提取网络提取的特征的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本申请实施例提供的一种特征提取网络的训练方法的应用场景图;

图2示出了本申请实施例提出的一种特征提取网络的训练方法的流程示意图;

图3示出了本申请实施例提出的一种截取掌纹像素区域的示意图;

图4示出了本申请实施例提出的一种特征提取网络的网络结构示意图;

图5示出了本申请实施例提出的一种特征提取网络的训练方法的另一流程示意图;

图6示出了本申请实施例提出的一种图像分类方法的流程示意图;

图7示出了本申请实施例提出的一种特征提取网络的应用流程图;

图8示出了本申请实施例提出的一种特征提取网络的训练装置的连接框图;

图9示出了本申请实施例提出的一种图像分类装置的连接框图;

图10示出了用于执行本申请实施例的方法的电子设备的结构框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的参考示例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,并发挥越来越重要的价值。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。以人工智能应用在机器学习上为例进行说明:

其中,机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。本申请的方案主要是利用机器学习进行图像分类。

图1是根据本申请一实施例示出的应用场景的示意图,如图1所示,该应用场景包括终端设备10和通过网络与终端设备10通信连接的服务器20。

终端设备10,终端设备10具体可以是手机、电脑、智能语音交互设备、智能家电、车载终端等,终端设备10可以设有用于展示数据的客户端。网络可以是广域网或者局域网,或者是二者的组合。

服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

若利用如图1中的终端设备10和服务器20进行特征提取网络的训练,终端设备10可以向服务器20上传第一样本图像和第二样本图像,服务器20在获取到第一样本图像和第二样本图像后,通过第一特征提取网络对第一样本图像进行图像特征提取,获得第一样本图像的图像特征;根据第一样本图像的图像特征、第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵,确定第一损失;根据第一损失,调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵;通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征;根据第二样本图像的图像特征、第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩阵,确定第二损失;一类别的主类中心为该类别的多个类中心中的一个;根据第二损失,调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,直至达到训练结束条件,得到目标特征提取网络。

本申请采用上述方法,可以实现针对训练样本非常多且包含较多低质量的困难样本模型训练过程中,通过在特征提取网络的第一训练阶段为每个类别设置多个类别中心,并根据第一样本图像的图像特征、第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵确定的第一损失调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,以实现针对每个类别,属于该类别的样本图像(如,正常样本图像和困难样本图像)的图像特征均可以映射到该类别对应的多个类中心中的一个类中心上。在特征提取网络的第二训练阶段,在确定主类中心后,根据第二样本图像的图像特征、第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩确定的第二损失调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,从而实现在训练过程中利用第二提取网络提取对第二样本图像中的困难样本提取的图像特征逐渐向主类中心靠近,以提升第二特征提取网络对第二样本图像中的正常样本的特征提取性能前提下提升对第二样本图像中的低质量的困难样本图像的特征提取性能,从而提升了训练得到的目标特征提取网络提取的特征的准确度。

在目标特征提取网络的训练完成后,可以在服务器20上部署目标特征提取网络,以便在获取到待分类图像后,利用上述的目标图像特征提取网络对待分类图像进行特征提取,得到目标图像特征;根据目标图像特征,执行后续的图像处理操作,如执行图像分类操作。

下面将结合附图具体描述本申请的各实施例。

请参阅图2,图2所示为本申请还提供一种特征提取网络的训练方法,可以应用于电子设备,该电子设备可以是上述的终端设备10或服务器20,该方法包括:

步骤S110:通过第一特征提取网络对第一样本图像进行图像特征提取,获得第一样本图像的图像特征。

第一样本图像的获取方式可以是对图像集合中的图像进行标注后得到第一样本图像,也可以是从电子设备或与该电子设备关联的其他设备中获取预先存储的多张具有样本类别标签的图像作为第一样本图像,根据实际需求进行设置即可。

第一样本图像为多张,且每张第一样本图像分别标注有类别标签,上述的类别标签可以根据分类任务设定,第一样本图像的类别标签对应的类别属于上述分类任务中的多个类别中的一个。若分类任务是识别图像是否合格,则对应的类别标签为合格或不合格,若分类任务是用于对图像中的对象(如,动植物)进行分类,如用于对猫、狗、猪等动物进行分类,则样本图像的至少类别标签可以是图像中的对象所属的具体类别;若分类任务用于对图像是否为异常图像,则类别标签为正常图像或样本图像为异常图像的类别标签。若分类任务是识别某一图像具体对应的标识信息,则若样本图像的类别标签为某一对象的标识信息。

以分类任务为基于对象的生物特征信息(如,面部图像、指纹图像、掌纹图像或者虹膜图像等)进行标识分类为例,则类别标签为某一对象的标识信息,该标识信息可以是对象名称、对象ID等用于标识对象的唯一性的信息。在该种方式下,第一样本图像可以是对初始图像中的指定区域进行提取得到。具体的,可以对初始图像进行关键点检测,基于关键点检测结果从初始图像中截取指定区域(如,面部像素区域、指纹像素区域、掌纹像素区域或者虹膜像素区域等),作为第一样本图像。

如图3所示,示例性的,在生物特征信息为掌纹信息时,获取第一样本图像的方式可以是,对初始图像进行关键点检测,得到初始图像中的关键点;初始图像的关键点包括食指与中指之间的第一指缝关键点A、中指与无名指之间的第二指缝关键点B以及无名指与小指之间的第三指缝关键点C;基于初始图像中的第一指缝关键点A、第二指缝关键点B以及第三指缝关键点C建立图像坐标系,第一指缝关键点A与第三指缝关键点C之间的连线为图像坐标系的横轴(x轴),经过第二指缝关键点B垂直于横轴的线为图像坐标系的纵轴(y轴),横轴与纵轴之间的交点为图像坐标系的原点;将初始图像中位于图像坐标系的纵轴上且与图像坐标系的原点距离指定距离的点作为初始图像中的掌纹中心点D,指定距离可以根据第一指缝关键点A和第三指缝关键点C之间的距离确定,掌纹中心点D和第二指缝关键点B分别位于横轴的两侧;基于掌纹中心点D、以及第一指缝关键点A与第三指缝关键点B之间的距离从初始图像中截取样本图像。

具体的,在根据第一指缝关键点A、第二指缝关键点B和第三指缝关键点C确如图3所示的图像坐标系后,沿y轴负方向与坐标原点距离为AC长度处找到掌纹中心点D ,DE距离等于五分之六倍的AC距离。将A点到C点的距离乘3/2作为掌纹像素区域的边长d,以D点为中心,d为正方形边长提取掌纹像素区域作为样本图像(也即,第一样本图像)。

应当理解,在对象的生物特征不同时,对应从初始图像截取指定区域的图像的方式不同,在此处不再一一赘述。

其中,图像特征提取网络可以是通过一种或者多种神经网络构建的。具体的,上述的神经网络可以是ResNet残差网络、DenseNet经典网络、VGG卷积神经网络、AlexNet深度卷积神经网络、Swin-Transformer网络、MaxViT网络或者LeNet卷积神经网络等等任意可以进行图像特征提取的神经网络,在本实施例不作具体限定。

步骤S120:根据第一样本图像的图像特征、第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵,确定第一损失。

在本申请中,针对每个类别设置了多个类中心,对于每个类别来说,该类别下的一个类中心,相当于该类别下的一个子类别,即在本申请中,为每个类别设定了多个子类别。其中,一个类中心对应的初始类中心矩阵即为该类中心的特征空间。各类别的多个类中心是预先构建的,每个类中心分别对应的初始类中心矩阵为一个全连接矩阵,不同类别的类中心的数量可以相同,也可以不同。在特征提取网络训练之前,可以为各类别的多个类中心分别对应的初始类中心矩阵设置初始值,不同的类中心对应的初始类中心矩阵的初始值可以相同,也可以不同。

上述步骤S120可以是,基于第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的相似度,确定第一样本图像的类别预测结果,基于第一样本图像的类别预测结果和第一样本图像的类别标签进行损失计算,得到第一损失。

在该种方式下,基于第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的相似度,确定第一样本图像的类别预测结果的方式具体可以是,针对每个类别,将第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的相似度的平均值或最大值,确定第一样本图像的图像特征与该类别之间的参考相似度,基于第一样本图像的图像特征与该类别之间的参考相似度,确定第一样本图像属于各个类别的概率,其中,第一样本图像的图像特征与该类别之间的参考相似度反映第一样本图像对应的图像特征与该类别对应的特征空间之间的差异性,差异性越小,则第一样本图像预测为该类别的可能性越大。其中,第一样本图像预测为各个类别的概率即为第一样本图像的类别预测结果。上述基于第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的相似度确定第一样本图像的图像特征与该类别之间的参考相似度的方式可以是,将第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的相似度中的最大相似度或平均相似度,确定为第一样本图像的图像特征与该类别之间的参考相似度。

上述步骤S120还可以是,基于第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的相似度,从各类别对应的多个类中心中确定至少一个参考类中心,并基于每个参考类中心与第一样本图像的图像特征之间的相似度确定第一样本图像的类别预测结果,基于第一样本图像的类别预测结果和第一样本图像的类别标签进行损失计算,得到第一损失。

其中,第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的相似度反映第一样本图像对应的图像特征与各类别的多个类中心各自的初始类中心矩阵对应的特征空间之间的差异性。某一参考类中心与第一样本图像的图像特征之间的相似度也反应了参考类中心对应的特征空间与图像特之间的差异性,应当理解,差异性越小在,则第一样本图像为的预测类别为该参考类中心对应的类别的可能性越大。

计算各类中心分别对应的初始类中心矩阵与第一样本图像的图像特征之间的相似度的方式可以是,计算各类中心分别对应的初始类中心矩阵与第一样本图像的图像特征之间的余弦相似度或欧式距离等。

第一样本图像的类别预测结果和第一样本图像的类别标签进行损失计算时,可以利用预设损失函数第一样本图像的类别预测结果和第一样本图像的类别标签进行损失计算。其中,预设损失函数可以是交叉熵损失函数、均方误差损失函数或者多分类交叉熵损失函数等,根据实际需求进行设置即可。

步骤S130:根据第一损失,调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵。

本实施例中,可以是当第一特征提取网络的迭代次数达到第一预设次数、迭代周期对应的周期数达到第一预设周期数或者第一损失小于第一预设损失阈值时,则认为对第一特征提取网络的训练达到第一训练结束条件,并在对第一特征提取网络的训练达到训练结束条件时,将最后一次迭代调整后的第一特征提取网络作为第二特征提取网络,以及将最后一次迭代调整后的与各类别的多个类中心分别对应的初始类中心矩阵作为各类别的多个类中心分别对应的第一类中心矩阵。其中,第一预设次数、第一预设周期数和第一预设损失阈值可以根据任务需求进行设置,此处不作具体限定。

需要说明的是,可以设置多个第一训练集来参与如上的步骤S110-步骤S130的训练过程,各第一训练集中包括多张第一样本图像,若一个第一训练集中的全部第一样本图像均参与训练第一特征提取网络一次,视为完成一个迭代周期(epoch)。在一些实施例中,可以对各第一训练集中的第一样本图像分批次输入到第一特征提取网络中,以进行迭代训练,每个批次对应的批数量可根据实际需要设定。

通过迭代调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,可以在提升第一特征提取网络提取特征的准确度的同时,约束各类别的多个类中心各自对应的特征空间。

步骤S140:通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征。

其中,第二样本图像的获取方式应当与第一样本图像的获取方式相同或相类似,且第二样本图像对应的类别也属于第二特征提取网络用作分类任务中时该分类任务对应的多个分类类别中的一个。因此,关于第二样本图像获取、处理等过程可以参阅前文对第一样本图像的相关描述,在此处不再具体限定。

应当理解,第二样本图像为多张,第二样本图像可以与第一样本图像不同,或者上述的第一样本图像还可以作为第二样本图像参与第二特征提取网络的训练。

关于通过第二特征提取网络对第二样本图像进行特征提取的具体描述可以参阅前文对步骤S110的具体描述,在此处不作一一赘述。

步骤S150:根据第二样本图像的图像特征、第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩阵,确定第二损失。

一类别的主类中心为该类别的多个类中心中的一个。

其中,一类别的主类中心是指属于该类别的图像的特征主要分布的特征空间 (类中心矩阵)所对应的类中心。

在一种可实施方式中,一类别的主类中心可以根据该类别的多个类中心中附着的样本图像(如,第一样本图像)的数量确定,例如,将该类别对应的多个类中心中附着第一样本图像为最多的类中心确定为该类别的主类中心。

在另一种可实施方式中,由于第一样本图像为多个,在确定类别的主类中心时,可以确定各类别对应的参考图像集合,一类别对应的参考图像集合包括类别标签与该类别相同的多张第一样本图像;针对每个类别,根据该类别下的多个类中心中每个类中心的初始类中心矩阵与该类别对应的参考图像集合中各第一样本图像的图像特征之间的相似度,确定该类别下每个类中心对应的参考相似度;针对每个类别,将该类别下参考相似度最大的类中心确定为该类别的主类中心。

在该种实施方式中,针对每个类别,可以将该类别下的多个类中心中每个类中心的中心矩阵与该类别对应的参考图像集合中各第一样本图像的图像特征之间的相似度的均值、最大值或者中值等中的一个,确定为该类别下每个类中心对应的参考相似度。

在一种可实施方式中,第二样本图像为多张,上述步骤S150还可以是,将各第二样本图像的图像特征与各类别的主类中心对应的第一类中心矩阵进行相似度计算,得到各第二样本图像的图像特征与各类别的主类中心之间的第二相似度;将在多个类别中与第二样本图像的图像特征之间的第三相似度最大的主类中心所属的类别,作为第二样本图像的预测类别;基于第二样本图像的类别标签和第二样本图像的预测类别,确定第二损失。

其中,计算各第二样本图像的图像特征与各类别的主类中心之间的第二相似度的方式可以与前述计算第一样本图像的图像特征与各类中心对应的初始类中心矩阵之间的相似度的计算过程类似,确定第二损失的过程也可以与前述确定第一损失的过程相类似,此处不作一一赘述。

应当理解,上述获得第二损失的方式仅仅是示意性的,还可以有更多的获得方式,在本实施例不在一一赘述。

步骤S160:根据第二损失,调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,直至达到训练结束条件,得到目标特征提取网络。

本实施例中,可以是当第二特征提取网络的迭代次数达到第二预设次数、第二特征提取网络的迭代周期对应的周期数达到第二预设周期数或者第二损失小于第二预设损失阈值时,则认为对第二特征提取网络的训练达到训练结束条件,并在对第二特征提取网络的训练达到训练结束条件时,将最后一次迭代调整后的第二特征提取网络作为目标特征提取网络。其中,第二预设次数、第二预设周期数和第二预设损失阈值可以根据任务需求进行设置,此处不作具体限定。

在第二特征提取网络的训练过程中,根据第二损失,调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,实现在训练过程中约束第二特征提取网络对各第二样本图像提取的图像特征逐渐向对应类别的主类中心靠近,换言之,即使第二样本图像为困难样本,例如为非正面的样本图像、清晰度较低的样本图像、像素较低的样本图像,也可以约束第二特征提取网络针对作为困难样本的第二样本图像提取的特征向对应类别的主类中心靠近,可以使训练得到的目标特征提取网络不仅能够对正常的图像准确进行特征提取,而且也能够对低质量的图像进行特征提取的准确性,进而保证对低质量的或者困难的图像进行准确分类。

本申请实施例提供的一种特征提取网络的训练方法、分类方法、装置及电子设备。通过每个类别设置多个类别中心,并根据第一样本图像的图像特征、所述第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵确定的第一损失调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,可以在提升第一特征提取网络提取特征的准确度的同时,约束各类别的多个类中心各自对应的特征空间。其后,根据第二样本图像的图像特征、所述第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩确定的第二损失调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,从而实现在训练过程中利用第二提取网络提取图像特征逐渐向各分类别的主类中心靠近,即,即使第二样本图像为困难样本,也可以将困难样本的特征向对应类别的主类中心靠近,解决相关技术中因困难样本所导致类中心偏移的问题,可以保障训练得到的目标特征提取网络对样本图像中的正常样本的特征提取性能前提下提升对样本图像中的低质量的困难样本图像的特征提取性能,从而提升了训练得到的目标特征提取网络提取的特征的准确度。

请参阅图4,本申请实施例提供了一种特征提取网络的训练方法,该方法包括:

步骤S210:通过第一特征提取网络对第一样本图像进行图像特征提取,获得第一样本图像的图像特征。

关于步骤S210的具体描述可以参阅前文对步骤S110的具体描述,此处不再一一赘述。

步骤S220:对于各类别,计算第一样本图像的图像特征与多个类中心分别对应的初始类中心矩阵之间的第一相似度。

其中,关于计算图像特征与类中心矩阵之间的相似度的过程可以参阅前文的具体描述,在此处不再一一赘述。

步骤S230:将各个类别的多个初始类中心矩阵中,与所述第一样本图像的图像特征之间的第一相似度最大的初始类中心矩阵,确定为参考类中心矩阵。

即,参考类中心矩阵是指在多个类别的多个类中心矩阵中,确定与第一样本图像的图像特征之间的第一相似度最大的初始类中心矩阵。

步骤S240:根据参考类中心矩阵与该第一样本图像的类别标签,确定第一子损失。

可以将参考类中心矩阵所对应类中心所属的类别作为该第一样本图像对应的预测类别。第一子损失用于反映第一样本图像对应的预测类别与该第一样本图像的类别标签所指示类别之间的差异。可以理解的是,第一样本图像对应的预测类别与该第一样本图像的类别标签所指示类别之间差异越小,表明第一特征提取网络所提取到的图像特征的准确性越高。

步骤S250:基于第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度和第一子损失,确定第一损失。

其中,第一样本图像的图像特征与某一类中心对应的初始类中心矩阵的第一相似度越高,则表征第一样本图像属于该类中心的概率越高。

在本申请的一种可实施方式中,上述步骤S250包括:

步骤S250a:对于各类别,根据第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度,确定在该类别下与第一样本图像的图像特征之间的第一相似度最大的第二类中心矩阵。

对于一类别来说,该类别下的第二类中心矩阵是指在该类别下与第一样本图像的图像特征之间的第一相似度最大的初始类中心矩阵。

步骤S250b:根据多个类别中每个类别下的第二类中心矩阵与第一样本图像的图像特征之间的第一相似度,确定第二子损失。

具体的,可以根据多个类别中每个类别下的第二类中心矩阵与第一样本图像的图像特征之间的第一相似度的和或者均值确定第二损失。

步骤S250c:基于第一子损失和第二子损失,确定第一损失。

其中,基于第一子损失和第二子损失确定第一损失的方式可以是,对第一子损失和第二子损失进行加权求和得到第一损失,也可以是将第一子损失和第二子损失中损失值为最大的子损失确定为第一损失。根据实际需求进行设置即可。

在一种可实施方式中,上述步骤S256,包括:

步骤S256a:基于第一样本图像参与的迭代周期对应的第一周期数,确定第一间隔参数和第一缩放系数,第一间隔参数和第一缩放系数与第一周期数呈负相关关系。

第一周期数是指第一样本图像参与的迭代周期对应的周期数,即若第一样本图像参与的是第k个迭代周期,则该第一样本图像参与的迭代周期对应的第一周期数为k。可以理解的是,不同的第一样本图像参与的迭代周期可能不同,对应的第一周期数也可能不同。

通过基于第一样本图像参与的迭代周期对应的第一周期数确定第一间隔参数和第一缩放系数,可以自适应的参数设置方式,监督损失相对宽松,保证正常样本的特征分布不受影响,同时避免由于特征提取网络在训练初期梯度不稳定,容易受到困难样本的影响的情况。而且,第一间隔参数和第一缩放系数与第一周期数呈负相关关系,这样,第一周期数越大,第一间隔参数和第一缩放系数越小,随着迭代周期的数量增加,逐渐减小第一间隔参数和第一缩放系数,可以逐步提升损失要求。

步骤S256b:基于第一间隔参数、第一缩放系数、第一子损失和第二子损失计算加性角度间隔损失,得到第一损失。

具体的,可以利用第一加性角度间隔损失计算公式基于第一间隔参数、第一缩放系数、第一子损失和第二子损失计算得到第一损失,第一加性角度间隔损失计算公式如下:

在本申请的一种可实施方式中,第一间隔参数和第一缩放系数的确定过程具体可以是:基于第一样本图像参与的迭代周期对应的第一周期数,确定第一系数,第一系数与第一周期数呈负相关关系;根据第一系数确定第一间隔调整值,将该第一间隔调整值与第一参考间隔参数相加,得到第一间隔参数;根据第一系数确定第一缩放调整值,将第一缩放调整值与第一参考缩放系数相加,得到第一缩放系数。

示例性的,可以将第一预设周期数与第一样本图像参与的迭代周期对应的第一周期数作差,得到第一差值;将第一差值与第一预设周期数的比值作为第一系数;将第一系数与第一参考间隔参数相乘得到第一间隔调整值,将该第一间隔调整值与第一参考间隔参数相加,得到第一间隔参数;将第一系数与指定缩放系数相乘,得到第一缩放系数调整值,将第一参考缩放系数与第一缩放系数调整值相加,得到第一缩放系数。其中,第一预设周期数可以根据需要设定,保证第一预设周期数与第一周期数之间的差值不小于零即可。第一参考间隔参数、指定缩放系数以及第一参考缩放系数的具体取值此处不作具体限定,根据实际需求进行设置即可。

步骤S260:根据第一损失,调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵。

步骤S270:通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征。

其中,第二样本图像为多张。

步骤S280:将各第二样本图像的图像特征与各类别的主类中心对应的第一类中心矩阵进行相似度计算,得到各第二样本图像的图像特征与各类别的主类中心之间的第二相似度。

步骤S290:将在多个类别中与第二样本图像的图像特征之间的第三相似度最大的主类中心所属的类别,作为第二样本图像的预测类别。

步骤S300:基于第二样本图像的类别标签和第二样本图像的预测类别,确定第二损失。

应当理解,若第二样本图像的类别标签和第二样本图像的预测类别一致,则第二损失越小;若第二样本图像的类别标签和第二样本图像的预测类别一致时,第二损失越大。

考虑到特征提取网络的训练后期由于特征提取网络的参数趋于稳定,训练阶段主要目标变为使远离正常样本对应的类中心的困难样本向正常样本的类中心靠近,因此需要使用更紧密的监督参数,在调参过程中,可以设计自适应的参数设置方式,使训练后期逐渐使用更严格监督策略,在保证正常数据识别效果的同时提升模型对困难样本的兼容能力,具体的,在一种可实施方式中,上述步骤S300包括:

步骤S302:基于第二样本图像参与的迭代周期对应的第二周期数,确定第二间隔参数和第二缩放系数,第二间隔参数和第二缩放系数与第二周期数呈相关关系。

第二周期数是指第二样本图像参与的迭代周期对应的周期数,即若第二样本图像参与的是第z个迭代周期,则该第二样本图像参与的迭代周期对应的第二周期数为z。可以理解的是,不同的第二样本图像参与的迭代周期可能不同,对应的第二周期数也可能不同。

其中,第二间隔参数和第二缩放系数可以通过以下方式确定,基于第二样本图像参与的迭代周期对应的第二周期数,确定第二系数,第二系数与第二周期数呈负相关关系;基于第二系数确定第二间隔调整值,将第二参考间隔参数与该第二间隔调整值相加,得到第二间隔参数;基于第二系数确定第二系数调整值,将第二参考缩放系数与第二系数调整值相加,得到第二缩放系数。

示例性的,将第二预设周期数与第二样本图像参与的迭代周期对应的第二周期数作差计算得到第二差值,将第二差值与第二预设周期数相比得到第二系数;将第二系数与设定间隔参数相乘得到第二间隔调整值,将第二参考间隔参数与该第二间隔调整值与相加,得到第二间隔参数;将第二系数与设定缩放系数相乘,得到第二缩放系数调整值,将第二参考缩放系数与第二缩放系数调整值相加,得到第二缩放系数。其中,第二预设周期数可以根据需要设定,保证第二预设周期数与第二周期数之间的差值不小于零即可。第二参考间隔参数、设定缩放系数以及第二参考缩放系数的具体取值此处不作具体限定,根据实际需求进行设置即可。

在一些实施例中,为保证训练效果,可以约束第一特征提取网络训练期间的第一间隔参数小于或等于针对第二特征提取网络训练期间的第二间隔参数,以及约束第一特征提取网络训练期间的第一缩放系数小于或等于针对第二特征提取网络训练期间的第二缩放系数。

步骤S304:基于第二间隔参数、第二缩放系数、第二样本图像的类别标签和第二样本图像的预测类别计算加性角度间隔损失,得到第二损失。

具体的,可以利用第二加性角度间隔损失计算公式基于第二间隔参数、第二缩放系数、第二样本图像的类别标签和第二样本图像的预测类别计算加性角度间隔损失,得到第二损失,其中,第二加性角度间隔损失计算公式如下:

步骤S310:根据第二损失,调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,直至达到训练结束条件,得到目标特征提取网络。

通过采用上述的特征提取网络的训练方法。在多个类别的多个类中心矩阵中,确定与第一样本图像的图像特征之间的第一相似度最大的参考类中心矩阵,以及根据参考类中心矩阵与该第一样本图像的类别标签,确定第一子损失时,以该第一子损失能够反应特征提取网络和类中心矩阵的准确性。在基于第第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度和第一子损失确定的第一损失调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵后,可以在提升第一特征提取网络提取特征的准确度的同时,约束各类别的多个类中心各自对应的特征空间。在特征提取网络的第二训练阶段,在确定主类中心后,由于每个类别的主类中心为对对该类别的多个类中心中对与模型分类准确度影响最大的类中心,因此,根据第二样本图像的图像特征与第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩之间的相似度确定第二损失时,可以有效保证确定的第二损失的准确度,后续根据第二损失调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,从而实现在训练过程中利用第二提取网络提取图像特征逐渐向各分类别的主类中心靠近,即,即使第二样本图像为困难样本,也可以将困难样本的特征向对应类别的主类中心靠近,通过上述两个阶段的训练,可以保障训练得到的目标特征提取网络对样本图像中的正常样本的特征提取性能前提下提升对样本图像中的低质量的困难样本图像的特征提取性能,从而提升了训练得到的目标特征提取网络提取的特征的准确度。

请参阅图5所示,本申请实施例还提供一种图像分类方法的,该方法可应用于上述的电子设备,方法包括:

步骤S410:获取待分类图像。

其中,待分类图像可以是任意需要进行分类的图像,其获取过程可以与前述实施例中获取第一样本图像和第二样本图像的方式类似,在此处不作具体限定。

应当理解,为保证后续对待分类图像进行特征提取得到的特征的准确性,上述步骤S410可以是,获取初始图像,对初始图像进行预处理,如去噪、增强、滤波等预处理,在得到预处理后的初始图像后,对于不同分类任务,还可以根据分类任务执行不同的处理操作。例如,当分类任务为对象识别,则可以对分类任务中的对象所在区域进行截取,还可以对分类任务中的对象进行缩放处理。

在一种可实施方式中,待分类图像为掌纹图像,上述步骤S410包括:

步骤S412:获取手部图像。

步骤S414:对手部图像进行关键点检测,得到手部图像中的指缝关键点。

步骤S416:基于手部图像中的指缝关键点,从手部图像中截取掌纹像素区域,作为掌纹图像。

关于获取掌纹图像的具体过程可以参阅前文的具体描述,在此处不再一一赘述。

步骤S420:利用图像特征提取网络的训练方法获得的目标图像特征提取网络对待分类图像进行特征提取,得到目标图像特征。

步骤S430:根据目标图像特征,确定待分类图像的分类结果。

应当理解,目标特征提取网络对应的应用场景不同时,确定待分类图像的分类结果的方式不同,若,目标特征提取网络对应的应用场景为识别认证场景,则上述的待分类图像的分类结果为认证通过或认证失败;若目标特征提取网络对应的应用场景为多分类场景,则上述待分类图像的分类结果为待分类图像具体属于哪种类别;若目标特征提取网络应用在图像异常识别场景下,则上述待分类图像的分类结果为待分类图像为正常或异常。应当理解,上述目标特征提取网络的应用场景仅仅是示意性的,不同的应用场景确定的分类方式及得到的分类结果各不相同。

若目标特征提取网络应用在识别认证场景下,上述步骤S430可以是,待分类图像的分类结果包括认证结果,上述步骤S430具体可以是,将目标图像特征与预设参考图像特征进行匹配,若存在与目标图像特征匹配的预设参考图像特征,则生成包括认证通过的认证信息,或者将预设参考图像特征关联的认证信息作为待分类图像的认证信息。

在该种实施方式下,上述步骤S430具体可以包括:

步骤S432:将目标图像特征与预设数据库中的多个参考图像特征进行相似度计算,得到目标图像特征与各参考图像特征之间的相似度。

步骤S434:根据目标图像特征与各参考图像特征之间的相似度,确定与目标图像特征相似度最高的目标参考图像特征。

步骤S436:将目标参考图像特征关联的认证信息作为待分类图像的认证结果。

在该种方式下,若认证通过,则可以执行后续的操作,如某些应用解锁数据发送、支付、设备解锁、闸机放行、智能锁打开等。

在一种可实施方式中,在将目标参考图像特征关联的认证信息作为待分类图像的认证结果之后,方法还包括:基于待分类图像的认证结果进行支付处理。

若目标特征提取网络应用在多分类任务场景下,不同的分类类别分别具有一主类中心,该主类中心可以根据前述的特征提取网络的训练方法确定,上述步骤S430可以是,将待分类图像的图像特征与多分类任务中,每个类别对应的主类中心进行相似度计算,以根据图像特征与每个类别的主类中心之间的相似度确定待分类图像的分类结果。

应当理解,上述确定待分类图像的分类结果的方式仅仅是示意性的,还可以有更多的确认方式,在本实施例不再一一赘述。

如图6所示,本申请实施例提供了一种特征提取网络的训练方法,训练得到的特征提取网络用于提取不同用户的掌纹特征,并在训练得到目标特征提取网络后,利用目标特征提取网络对待识别掌纹图像进行识别认证,并在识别认证通过后进行支付的应用场景。具体的训练过程和应用过程如下:

训练阶段:

首先获取多张包括手掌图像的初始图像,每张初始图像分别对应有一标签信息,该标签信息用于表征该手掌图像所属对象。

针对每张初始图像,利用目标检测算法(如,yolov2检测算法)检测初始图像中的关键点,得到食指与中指之间的第一指缝关键点A、中指与无名指之间的第二指缝关键点B以及无名指与小指之间的第三指缝关键点C;之后,基于初始图像中的第一指缝关键点A、第二指缝关键点B以及第三指缝关键点C建立图像坐标系,第一指缝关键点A与第三指缝关键点C之间的连线为图像坐标系的横轴(x轴),经过第二指缝关键点B垂直于横轴的线为图像坐标系的纵轴(y轴),横轴与纵轴之间的交点为图像坐标系的原点;将初始图像中位于图像坐标系的纵轴上且与图像坐标系的原点距离指定距离的点作为初始图像中的掌纹中心点D,指定距离根据第一指缝关键点A和第三指缝关键点C之间的距离确定,掌纹中心点D和第二指缝关键点B分别位于横轴的两侧;基于掌纹中心点D和第一指缝关键点A和第三指缝关键点B之间的距离从初始图像中截取样本图像。

如此,即可得到第一样本图像,以及第二样本图像,其中,第一样本图像和第二样本图像分别为多张,且第一样本图像与第二样本图像可以相同也可以不同。

在获得第一样本图像和第二样本图像之后,可以将第一样本图像和第二样本图像缩放至相同尺寸以参与后续的图像特征提取网络的训练。

在对图像特征提取网络进行训练时,将图像特征提取网络应用在分类任务中,将在分类任务中类别的数量设置为E,各类别的多个类中心的初始类中心矩阵分别设置初始值为零,且每个类别对应的多个类中心的数量相同为F,每个类中心对应的初始类中心矩阵为全连接线性矩阵,且长度相同为N。其中,样本图像的类别标签对应的类别应当属于分类任务中的多个类别中的一个。

在第一阶段的训练过程中,每一次迭代输入的第一样本图像的数量为G,利用第一图像特征提取网络对第一样本图像进行特征提取,得到第一样本图像的图像特征,之后,对于各类别,计算第一样本图像的图像特征与多个类中心分别对应的初始类中心矩阵之间的第一相似度;将各个类别的多个初始类中心矩阵中,与所述第一样本图像的图像特征之间的第一相似度最大的初始类中心矩阵,确定为参考类中心矩阵;根据参考类中心矩阵与该第一样本图像的类别标签,确定第一子损失;之后,针对针对每个类别,根据第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度,确定在该类别下与第一样本图像的图像特征之间的第一相似度最大的第二类中心矩阵;根据多个类别中每个类别下的第二类中心矩阵与第一样本图像的图像特征之间的第一相似度,确定第二子损失;基于第一样本图像参与的迭代周期对应的第一周期数,确定第一间隔参数和第一缩放系数,第一间隔参数和第一缩放系数与第一周期数呈负相关关系;基于第一间隔参数、第一缩放系数、第一子损失和第二子损失计算加性角度间隔损失,得到第一损失。

具体的,上述第一损失可以基于以下公式计算得到,

G表示一次迭代训练过程中输入的第一样本图像的数量,

其中,在第一训练阶段第一样本图像参与的迭代周期为10以内的阶段,由于模型学习的梯度不稳定,容易受到困难样本的影响,可以自适应的参数设置方式,监督损失相对宽松,保证正常样本的特征分布不受影响,

在计算得到第一损失之后,通过梯度返传来调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵,以实现针对每个类别,属于该类别的第一样本图像的图像特征均可以映射到该类别对应的多个类中心中的一个类中心上。

在第二阶段的训练过程中,第二样本图像为多张,通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征,将各第二样本图像的图像特征与各类别的主类中心对应的第一类中心矩阵进行相似度计算,得到各第二样本图像的图像特征与各类别的主类中心之间的第二相似度;将在多个类别中与第二样本图像的图像特征之间的第三相似度最大的主类中心所属的类别,作为第二样本图像的预测类别;基于第二样本图像的类别标签和第二样本图像的预测类别,确定第二损失。

具体的,第二损失可以利用如下损失函数计算得到,

其中,在第二训练阶段是指第二样本图像参与的迭代周期为10以内的阶段,第二训练阶段由于模型参数趋于稳定,主要目标变为原本远离正常样本类中心的困难样本向正常样本的类中心靠近,因此需要使用更紧密的监督参数,同样设计了自适应的参数设置方式,使

通过上述两个阶段的训练,可以保障训练得到的目标特征提取网络对样本图像中的正常样本的特征提取性能前提下提升对样本图像中的低质量的困难样本图像的特征提取性能,从而提升了训练得到的目标特征提取网络提取的特征的准确度。

应用阶段:

请参阅图7,在将上述训练得到的目标特征提取网络用作掌纹识别支付时,可以通过终端支付设备摄像头采集目标对象的手部图片;由检测模型对目标对象的指缝关键点进行检测;根据手部图片和关键点位置提取手掌感兴趣区域;使用前述训练得到的目标特征提取网络提取手掌感兴趣区域对应的掌纹图特征编码向量;计算提取的掌纹图特征编码向量与底库特征之间的余弦相似度,余弦相似度计算公式如下:

通过采用上述掌纹识别进行支付处理,相较于人脸识别技术,掌纹因其隐蔽性,更有利于保护用户隐私,同时不会受到口罩、化妆、墨镜等因素的影响。因此,掌纹识别技术在移动支付,身份核验等商用场景下拥有广泛的使用前景。

为了验证本申请的训练后的目标特征提取网络的有效性,使用1000个身份,每个身份对应50张正常图像和50张困难图像的数据集来验证采用本申请的特征提取网络的训练方法训练得到的目标特征提取网络和相关技术中的训练方法训练得到特征提取网络。验证结果如表1所示,

根据表一可知,现有方法在困难数据集上的误识率要明显高于正常数据集,而利用本申请的训练方法训练得到的目标特征提取网络能够在正常数据集和困难数据集上均有很好的表现,可见采用本申请的特征提取网络的训练方法可以提升对困难掌纹数据识别的有效性。

请参阅图8,本申请另一实施例提供了一种特征提取网络的训练装置500,特征提取网络的训练装置500包括第一特征提取模块510、第一损失确定模块520、第一调整模块530、第二特征提取模块540、第二损失确定模块550以及第二调整模块560,第一特征提取模块510用于通过第一特征提取网络对第一样本图像进行图像特征提取,获得第一样本图像的图像特征;第一损失确定模块520,用于根据第一样本图像的图像特征、第一样本图像的类别标签和各类别的多个类中心分别对应的初始类中心矩阵,确定第一损失;第一调整模块530,用于根据第一损失,调整第一特征提取网络的参数和各类别的多个类中心分别对应的初始类中心矩阵,得到第二特征提取网络和各类别的多个类中心分别对应的第一类中心矩阵;第二特征提取模块540,用于通过第二特征提取网络对第二样本图像进行图像特征提取,得到第二样本图像的图像特征;第二损失确定模块550,用于根据第二样本图像的图像特征、第二样本图像的类别标签和各类别的主类中心对应的第一类中心矩阵,确定第二损失;一类别的主类中心为该类别的多个类中心中的一个;第二调整模块560,用于根据第二损失,调整第二特征提取网络的参数和各类别的主类中心对应的第一类中心矩阵,得到目标特征提取网络。

在一种可实施方式中,第一损失确定模块520包括第一计算子模块、矩阵确定子模块、子损失确定子模块以及第一损失确定子模块。第一计算子模块,用于对于各类别,计算第一样本图像的图像特征与多个类中心分别对应的初始类中心矩阵之间的第一相似度;矩阵确定子模块,用于将各个类别的多个初始类中心矩阵中,与所述第一样本图像的图像特征之间的第一相似度最大的初始类中心矩阵,确定为参考类中心矩阵;子损失确定子模块,用于根据参考类中心矩阵与该第一样本图像的类别标签,确定第一子损失;第一损失确定子模块,用于基于第一样本图像的图像特征与各类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度和第一子损失,确定第一损失。

在一种可实施方式中,第一损失确定子模块,还用于对于各类别,根据第一样本图像的图像特征与该类别的多个类中心分别对应的初始类中心矩阵之间的第一相似度,确定在该类别下与第一样本图像的图像特征之间的第一相似度最大的第二类中心矩阵;根据多个类别中每个类别下的第二类中心矩阵与第一样本图像的图像特征之间的第一相似度,确定第二子损失;基于第一子损失和第二子损失,确定第一损失。

在一种可实施方式中,第一损失确定子模块,还用于基于第一样本图像参与的迭代周期对应的第一周期数,确定第一间隔参数和第一缩放系数,第一间隔参数和第一缩放系数与第一周期数呈负相关关系;基于第一间隔参数、第一缩放系数、第一子损失和第二子损失计算加性角度间隔损失,得到第一损失。

在一种可实施方式中,第一损失确定子模块,还用于基于第一样本图像参与的迭代周期对应的第一周期数,确定第一系数,第一系数与第一周期数呈负相关关系;根据第一系数确定第一间隔调整值,将该第一间隔调整值与第一参考间隔参数相加,得到第一间隔参数;根据第一系数确定第一缩放调整值,将第一缩放调整值与第一参考缩放系数相加,得到第一缩放系数。

在一种可实施方式中,装置还包括集合确定模块、参考相似度确定模块以及主类中心确定模块。集合确定模块,用于确定各类别对应的参考图像集合,一类别对应的参考图像集合包括类别标签与该类别相同的多张第一样本图像;参考相似度确定模块,用于针对每个类别,根据该类别下的多个类中心中每个类中心的中心矩阵与该类别对应的参考图像集合中各第一样本图像的图像特征之间的相似度,确定该类别下每个类中心对应的参考相似度;主类中心确定模块,用于针对每个类别,将该类别下参考相似度最大的类中心确定为该类别的主类中心。

在一种可实施方式中,所述第二样本图像为多张,第二损失确定模块550包括第二计算子模块、类别确定子模块以及第二损失确定子模块,第二计算子模块,用于将各第二样本图像的图像特征与各类别的主类中心对应的第一类中心矩阵进行相似度计算,得到各第二样本图像的图像特征与各类别的主类中心之间的第二相似度;预测类别确定模块,用于将在多个类别中与第二样本图像的图像特征之间的第三相似度最大的主类中心所属的类别,作为第二样本图像的预测类别;第二损失确定子模块,用于第二基于第二样本图像的类别标签和第二样本图像的预测类别,确定第二损失。

在一种可实施方式中,第二损失确定子模块,还用于基于第二样本图像参与的迭代周期对应的第二周期数,确定第二间隔参数和第二缩放系数,第二间隔参数和第二缩放系数与第二周期数呈相关关系;基于第二间隔参数、第二缩放系数、第二样本图像的类别标签和第二样本图像的预测类别计算加性角度间隔损失,得到第二损失。

在一种可实施方式中,第二损失确定子模块,还用于基于第二样本图像参与的迭代周期对应的第二周期数,确定第二系数,第二系数与第二周期数呈负相关关系;基于第二系数确定第二间隔调整值,将第二参考间隔参数与该第二间隔调整值与相加,得到第二间隔参数;基于第二系数确定第二系数调整值,将第二参考缩放系数与第二系数调整值相加,得到第二缩放系数。

请参阅图9所示,本申请实施例提供了一种图像分类装置600,图像分类装置600包括图像获取模块610、第三特征提取模块620以及分类结果确定模块630,图像获取模块610,用于获取待分类图像;第三特征提取模块620,用于利用上述的特征提取网络的训练装置获得的目标图像特征提取网络对待分类图像进行特征提取,得到目标图像特征;分类结果确定模块630,用于根据目标图像特征,确定待分类图像的分类结果。

在一种可实施方式中,待分类图像的分类结果包括认证结果,分类结果确定模块630包括相似度计算子模块、特征确定子模块以及认证结果确定子模块。相似度计算子模块,用于将目标图像特征与预设数据库中的多个参考图像特征进行相似度计算,得到目标图像特征与各参考图像特征之间的相似度;特征确定子模块,用于根据目标图像特征与各参考图像特征之间的相似度,确定与目标图像特征相似度最高的目标参考图像特征;认证结果确定子模块,用于将目标参考图像特征关联的认证信息作为待分类图像的认证结果。

在一种可实施方式中,图像分类装置600还包括支付处理模块,用于基于待分类图像的认证结果进行支付处理。

在一种可实施方式中,图像获取模块610还用于获取手部图像;对手部图像进行关键点检测,得到手部图像中的指缝关键点;基于手部图像中的指缝关键点,从手部图像中截取掌纹像素区域,作为掌纹图像。

上述装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。

下面将结合图10对本申请提供的一种电子设备进行说明。

请参阅图10,基于上述实施例提供的特征提取网络的训练方法,本申请实施例还提供的另一种包括可以执行前述方法的处理器102的电子设备100,该电子设备100可以为服务器或终端设备,终端设备可以是智能手机、平板电脑、计算机或者便携式计算机等设备。

电子设备100还包括存储器104。其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。

其中,处理器102可以包括一个或者多个用于处理数据的核以及消息矩阵单元。处理器102利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器102可以采用数字信号处理(DigitalSignal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(Central Processing Unit,CPU)、图像处理器(GraphicsProcessing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。

存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所获取的数据(如,训练数据或待分类图像)等。

电子设备100还可以包括网络模块以及屏幕,网络模块用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。网络模块可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。网络模块可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。屏幕可以进行界面内容的显示以及进行数据交互,如显示对待识别音频的分子属性预测结果,以及通过屏幕录入音频等。

在一些实施例中,电子设备100还可以包括有:外设接口106和至少一个外围设备。处理器102、存储器104和外设接口106之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外设接口连接。具体地,外围设备包括:射频组件108等。

外设接口106可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器102和存储器104。在一些实施例中,处理器102、存储器104和外设接口106被集成在同一芯片或电路板上;在一些其他实施例中,处理器102、存储器104和外设接口106中的任意一个或两个可以在单独的芯片或电路板上实现,本申请实施例对此不加以限定。

射频组件108用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频组件108通过电磁信号与通信网络以及其他通信设备进行通信。射频组件108将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频组件108包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频组件108可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频组件108还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。

本申请实施例还提供一种计算机可读存储介质的结构框图。该计算机可读介质中存储有程序代码,程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质具有执行上述方法中的任何方法步骤的程序代码的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。

本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中描述的方法。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

相关技术
  • 分类器训练方法、装置、电子设备及计算机可读介质
  • 票据自动分类训练方法、装置及自动分类方法、装置
  • 二分类模型训练方法、数据分类方法及对应装置
  • 一种书法训练方法、装置、电子设备及存储介质
  • 数据加密、机器学习模型训练方法、装置以及电子设备
  • 图像分类方法及装置、特征提取网络训练方法及装置
  • 图像分类方法、特征提取网络的训练方法和装置
技术分类

06120116490488