掌桥专利:专业的专利平台
掌桥专利
首页

一种图像分类方法、装置、设备及存储介质

文献发布时间:2023-06-19 12:10:19


一种图像分类方法、装置、设备及存储介质

技术领域

本申请涉及机器学习领域,尤其涉及一种图像分类方法、装置、设备及存储介质。

背景技术

随着计算机技术的快速发展,机器学习领域也有了很多的技术进步。在机器学习领域主要是训练神经网络模型来预测或处理某些数据,来代替重复的人工操作,例如训练神经网络模型来实现计算机视觉、语音识别、自然语言处理或图像分类。

在训练神经网络进行图像分类时,存在一个很重要的问题:不同图像类别的数据样本不均衡分布。不同图像类别的数据样本不均衡分布会导致在机器学习过程中,分类结果会比较偏向样本数较多的类别,样本数较少的类别分类效果较差。

因此,现在存在由于不同图像类别的数据样本不均衡分布导致分类效果较差的问题。

发明内容

为了解决现有技术中由于不同图像类别的数据样本不均衡分布导致分类效果较差的问题,本申请提出了一种图像分类方法及一种模型训练方法。

本申请实施例提供了一种图像分类方法,所述方法包括:

获取目标图像;

将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到;

根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别。

可选的,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到,包括:

所述类别簇根据所述训练图像的类别标签的聚类结果和所述类别标签对应的样本量对所述类别标签对应的类别划分得到,所述聚类结果为根据所述训练图像的特征对所述类别标签进行聚类得到的结果。

可选的,所述聚类结果包括X个类别标签集合,所述X为大于或等于2的整数;

所述类别簇的个数为X+1个,其中,第X+1个类别簇为所述X个类别标签集合的每个类别标签集合中样本量排在预设位置的类别标签对应的类别,第i个类别簇为第i个类别标签集合中除归属为第X+1个类别簇以外的类别标签对应的类别,所述i大于等于1且小于等于X。

可选的,所述根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别,包括:

将所述目标图像输入到权重确定模型中,得到所述每个图像分类模型分别对应的权重,所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到;

根据所述每个图像分类模型输出的分类结果以及分别对应的权重,确定所述目标图像的类别。

可选的,所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到,包括:

所述权重确定模型根据将用于训练所述图像分类模型的多个类别簇的训练图像输入到所述权重确定模型中输出的权重,以及将所述训练图像输入到对应类别簇的已训练完成的所述图像分类模型输出的分类结果训练得到。

可选的,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,以及所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到,包括:

所述多个图像分类模型和所述权重确定模型通过将每个类别簇的训练图像分别输入到对应的图像分类模型以及所述权重确定模型中,根据所述图像分类模型的对所述训练图像的分类结果和所述权重确定模型输出的权重同时对所述多个图像分类模型和所述权重确定模型训练得到。

可选的,所述类别标签的种类为S种;

所述S种类别标签中,样本量排在前N位的类别标签对应的类别为第一类别簇;

所述S种类别标签中,样本量排在后M位的类别标签对应的类别为第二类别簇;

所述S种类别标签中,样本量排在第N+1位至第S-M-1位的类别标签对应的类别为第三类别簇;

其中,所述S、所述N和所述M均为大于或等于1的整数。

可选的,所述根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别包括:

将所述多个图像分类模型输出的分类结果中概率最大值对应的类别,确定为所述目标图像的类别。

本申请实施例还提供一种图像分类装置,所述装置包括:

获取单元,用于获取目标图像;

输入单元,用于将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到;

确定单元,用于根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别。

可选的,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到,包括:

所述类别簇根据所述训练图像的类别标签的聚类结果和所述类别标签对应的样本量对所述类别标签对应的类别划分得到,所述聚类结果为根据所述训练图像的特征对所述类别标签进行聚类得到的结果。

可选的,所述聚类结果包括X个类别标签集合,所述X为大于或等于2的整数;

所述类别簇的个数为X+1个,其中,第X+1个类别簇为所述X个类别标签集合的每个类别标签集合中样本量排在预设位置的类别标签对应的类别,第i个类别簇为第i个类别标签集合中除归属为第X+1个类别簇以外的类别标签对应的类别,所述i大于等于1且小于等于X。

可选的,所述确定单元根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别,包括:

所述输出单元将所述目标图像输入到权重确定模型中,得到所述每个图像分类模型分别对应的权重,所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到;

所述输出单元根据所述每个图像分类模型输出的分类结果以及分别对应的权重,确定所述目标图像的类别。

可选的,所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到,包括:

所述权重确定模型根据将用于训练所述图像分类模型的多个类别簇的训练图像输入到所述权重确定模型中输出的权重,以及将所述训练图像输入到对应类别簇的已训练完成的所述图像分类模型输出的分类结果训练得到。

可选的,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,以及所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到,包括:

所述多个图像分类模型和所述权重确定模型通过将每个类别簇的训练图像分别输入到对应的图像分类模型以及所述权重确定模型中,根据所述图像分类模型的对所述训练图像的分类结果和所述权重确定模型输出的权重同时对所述多个图像分类模型和所述权重确定模型训练得到。

可选的,所述类别标签的种类为S种;

所述S种类别标签中,样本量排在前N位的类别标签对应的类别为第一类别簇;

所述S种类别标签中,样本量排在后M位的类别标签对应的类别为第二类别簇;

所述S种类别标签中,样本量排在第N+1位至第S-M-1位的类别标签对应的类别为第三类别簇;

其中,所述S、所述N和所述M均为大于或等于1的整数。

可选的,所述确定单元根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别包括:

所述确定单元将所述多个图像分类模型输出的分类结果中概率最大值对应的类别,确定为所述目标图像的类别。

本申请实施例还提供一种图像分类设备,所述设备包括:处理器和存储器;

所述存储器,用于存储指令;

所述处理器,用于执行所述存储器中的所述指令,执行上述实施例所述的方法。

本申请实施例还提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如上述实施例所述的方法。

在本申请的实施例中,多个图像分类模型中的每个图像分类模型分别是由对应类别簇的训练图像训练得到的,类别簇是根据训练图像的类别标签对应的样本量对类别标签对应的类别划分得到的,每个类别簇包括一个或多个类别的训练图像,每个类别簇包括的样本量相对均衡,在进行图像分类模型的训练时,由于每个类别簇的样本量较为均衡,图像分类效果增强。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本申请实施例提供的一种模型训练方法的流程图;

图2为本申请实施例提供的一种神经网络的示意图;

图3为本申请实施例提供的一种图像分类方法的流程图;

图4为本申请实施例提供的一种图像分类装置的结构图;

图5为本申请实施例提供的一种图像分类设备的结构图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

当前,在机器学习领域包括图像或视频的分类问题,例如可以将某一类图像或视频分类为人物、动物、景物等。图像分类可以分为很多类别,每个类别的样本量也不相同,样本量分布也不均衡。在样本量不均衡的情况下,训练得到的神经网络模型往往会偏向样本量大的类别,样本量小的类别分类效果较差。

因此,本申请实施例提供了一种图像分类方法,其中,多个图像分类模型中的每个图像分类模型分别是由对应类别簇的训练图像训练得到的,类别簇是根据训练图像的类别标签对应的样本量对类别标签对应的类别划分得到的,每个类别簇包括一个或多个类别的训练图像,每个类别簇包括的样本量相对均衡,在进行图像分类模型的训练时,由于每个类别簇的样本量较为均衡,图像分类效果增强。

为了更好地理解本申请的技术方案和技术效果,以下将结合附图对具体的实施例进行详细的描述。

参见图1,该图为本申请实施例提供的一种模型训练方法的流程图。为了更好地进行图像分类,首先要对神经网络模型进行训练,因此本申请实施例首先介绍模型训练方法。

本实施例提供的模型训练方法包括如下步骤:

S101,获取训练图像集,所述训练图像集包括多个训练图像,所述多个训练图像中的每个训练图像包括对应的类别标签。

在本申请的实施例中,训练图像可以是图片,也可以是视频中的某一帧。训练图像集是多个训练图像的集合,训练图像集包括多个训练图像,其中,每个训练图像都已经被分好类别,即每个训练图像都包括对应的类别标签,类别标签是根据训练图像的图像特征确定的,通过类别标签可以标识该训练图像的类别。训练图像集可以包括多种类别的训练图像,即训练图像集可以包括多种类别标签。本申请实施例可以利用已经分好类别的训练图像来训练图像分类模型。

S102,根据每种类别标签对应的所述训练图像的样本量,将所述类别标签对应的类别划分为多个类别簇,所述多个类别簇中的每个类别簇分别对应一种或多种类别标签的训练图像。

在本申请的实施例中,每个训练图像都包括对应的类别标签,每种类别标签可能对应多个训练图像,即每种类别标签具有对应的训练图像的样本量,例如类别标签为梅花的训练图像样本量可能为1000。类别簇为一种或多种类别的训练图像的集合,也可以说是一种或多种类别标签的训练图像的集合。

在本申请的实施例中,可以根据每种类别标签对应的训练图像的样本量,将多个类别标签对应的类别划分为多个类别簇,也就是根据类别标签对应的样本量对类别标签对应的类别进行划分,例如可以根据每种类别标签对应的训练图像的样本量的大小对多种类别标签进行排序,也就是根据类别标签对应的样本量对类别进行排序,根据排序结果将多个类别标签对应的类别划分为多个类别簇。分为多个类别簇后,多个类别簇中的每个类别簇可能分别对应一种或多种类别标签的训练图像。在根据样本量进行划分类别簇时,可以均衡划分,均衡划分指的是使得每个类别簇的样本量较为均衡,以便克服因为样本量不均衡导致模型训练效果不好的问题。

作为一种可能的实现方式,可以按照每种类别标签对应的训练图像的样本量的大小对多种类别标签进行排序,得到多种类别标签的数目和排序,多种类别标签的数目可以为S种,将前N种类别标签的训练图像划分为第一类别簇,将后M种类别标签的训练图像划分为第二类别簇,将其余的P种类别标签的训练图像划分为第三类别簇,其中,N、M和P均为大于或等于1的整数,且N、M和P之和等于S。第一类别簇对应的训练图像的样本量、第二类别簇对应的训练图像的样本量和第三类别簇对应的训练图像的样本量较为均衡,即每个类别簇包括的样本量较为均衡。具体的,第一类别簇可以称为头部类别簇,第二类别簇可以称为尾部类别簇,第三类别簇可以称为中部类别簇。本申请实施例不限定类别簇的数量,类别簇的数量可以是A个,A为大于1的整数。

作为一种示例,类别标签的数目可以是20种,训练图像的样本数可以是3000,按照每种类别标签对应的训练图像的样本量的大小对多种类别标签进行排序之后,前3种类别标签的训练图像对应的样本量为1000,将前3种类别标签的训练图像划分为第一类别簇,后10种类别标签的训练图像对应的样本量为1050,将后10种类别标签的训练图像划分为第二类别簇,其余7种类别标签的训练图像对应的样本量为950,将其余7种类别标签的训练图像划分为第三类别簇。

作为另一种实现方式,可以根据每种类别标签对应的训练图像的特征,对多种类别标签进行聚类,根据聚类结果和类别标签对应的训练图像的样本量对类别标签对应的类别进行划分,确定多个类别簇。进行聚类之后得到的多个类别簇,每个类别簇之间可以形成比较明显的图像特征之间的差异,能够使得每个图像分类模型在训练时具有比较明显的图像特征之间的差异。根据每种类别标签对应的训练图像的特征,对多种类别标签进行聚类可以是将训练图像特征相似或相同的多个类别划分为相同的类别簇,以对多个类别簇之间进行区分,使得多个类别簇之间可以形成比较明显的图像特征之间的差异。聚类结果可以包括X个类别标签的集合,即通过聚类得到X个集合,每个集合内包括训练图像特征相同或相似的一个或多个类别标签。其中,X是大于或等于2的整数,例如,X可以是10。

可选的,可以将X个类别标签集合中每一个类别标签集合的类别标签按照对应训练图像的样本量进行排序,从每一个类别标签集合中选出排在预设位置的类别标签的类别确定为第X+1个类别簇,将第i个类别标签集合中除了归属为第X+1个类别簇以外的类别标签的类别确定为第i个类别簇,所述i大于等于1且小于等于X。

在实际应用中,每一个类别标签集合的类别标签可以按照对应训练图像的样本量进行由大到小的排序,并将每一个类别标签集合中排在后10%位置的类别标签的类别确定为第X+1类别簇,将每一个类别标签集合中除了归属为第X+1个类别簇以外的类别标签的类别依旧确定为相应类别簇。

在实际应用中,每一个类别标签集合的类别标签还可以按照对应训练图像的样本量进行由小到大的排序,并将每一个类别标签集合中排在前10%位置的类别标签的类别确定为第X+1类别簇,将每一个类别标签集合中除了归属为第X+1个类别簇以外的类别标签的类别依旧确定为相应类别簇。

作为一种示例,根据每种类别标签对应的训练图像的特征,对多种类别标签进行聚类,得到10个类别标签集合,可以将10个类别标签集合中每一个类别标签集合的类别标签按照对应训练图像的样本量进行由大到小的排序,并将每一个类别标签集合中样本量排在后10%的类别标签对应的类别确定为第11个类别簇,将第1个类别标签集合中除了归属为第11个类别簇以外的类别标签(第1个类别标签集合中样本量排在前90%的类别标签)对应的类别确定为第1个类别簇,将第2个类别标签集合中除了归属为第11个类别簇以外的类别标签(第2个类别标签集合中样本量排在前90%的类别标签)对应的类别确定为第2个类别簇,将第i个类别标签集合中除了归属为第11个类别簇以外的类别标签(第i个类别标签集合中样本量排在前90%的类别标签)对应的类别确定为第i个类别簇,i大于等于1且小于等于10。

S103,将所述每个类别簇的训练图像分别输入到对应的图像分类模型中进行训练,确定所述每个类别簇对应的图像分类模型的模型参数,所述图像分类模型用于对目标图像按照所述类别标签对应的类别进行分类。

在本申请的实施例中,多个类别簇中每个类别簇对应一个图像分类模型,可以将多个类别簇中每个类别簇的训练图像分别输入到对应的图像分类模型中进行训练,训练图像包括对应的类别标签,可以在训练时确定每个类别簇对应的图像分类模型的模型参数,以便之后利用图像分类模型对目标图像进行分类,目标图像可以是待分类的图像。在具体对目标图像进行分类时,是按照本申请实施例提供的类别标签对应的类别进行分类的。

在S103确定每个类别簇对应的图像分类模型的模型参数之后,有以下几种方式确定图像分类模型的输出结果:

作为一种可能的实现方式,图像分类模型输出的分类结果直接可以确定图像的类别。可选的,可以将多个图像分类模型输出的分类结果中概率最大值对应的类别作为图像分类模型的最终输出结果,以最终的输出结果对训练图像的类别进行训练,这种方式对图像分类模型的训练来说计算量较少,训练时长较短。

作为另一种可能的实现方式,可以进行多次带噪声地前向传播,计算每个图像分类模型输出的方差,将方差进行归一化作为权重,与每个图像分类模型的输出结果进行相乘,得到图像分类模型的最终输出结果,以最终的输出结果对训练图像的类别进行训练。例如,每个图像分类模型可以计算携带噪声发生函数后Y次的输出结果,输出结果为Y个向量,利用Y个向量计算得到每个图像分类模型输出的方差,将方差进行归一化后作为权重,与每个图像分类模型输出的向量进行相乘,得到图像分类模型的最终输出结果,以最终的输出结果对训练图像的类别进行训练。通过利用方差得到的权重对图像分类模型的分类结果进行优化,使得图像分类模型更加侧重训练不同类别簇之间的训练图像,使得最终的分类结果更加良好。

作为又一种可能的实现方式,也可以利用其它的神经网络模型对图像分类模型输出的分类结果进行优化,提升图像分类的分类效果。

可选的,可以训练权重确定模型,得到每个图像分类模型分别对应的权重,可以根据每个图像分类模型输出的分类结果以及分别对应的权重,确定图像的类别,其中,权重确定模型也是根据多个图像分类模型对应的类别簇的训练图像训练得到的。

在实际应用中,可以先对图像分类模型进行训练,得到分类结果后,之后对权重确定模型进行训练。具体的,首先将每个类别簇的训练图像分别输入到对应的图像分类模型,确定每个类别簇对应的图像分类模型的模型参数,之后将多个训练图像分别输入到权重确定模型中,根据输出的与每个图像分类模型对应的权重,以及将训练图像输入到对应类别簇的已训练完成的图像分类模型得到的分类结果,对权重确定模型进行训练,确定权重确定模型的模型参数。根据的图像分类模型得到的分类结果对权重确定模型进行训练,使得权重确定模型和图像分类模型更加匹配,使得最终的分类结果更加良好。

在实际应用中,还可以对图像分类模型和权重确定模型同时进行训练。具体的,将每个类别簇的训练图像分别输入到对应的图像分类模型中,以及将多个图像分类模型对应的类别簇的训练图像分别输入到权重确定模型中,根据图像分类模型的对训练图像的分类结果和权重确定模型输出的权重同时对多个图像分类模型和权重确定模型进行训练,确定每个类别簇对应的图像分类模型的模型参数和权重确定模型的模型参数。通过将图像分类模型和权重确定模型同时进行训练,使得图像分类模型和权重确定模型对于不同类别簇之间的训练图像的分类更加清楚,使得最终的分类结果更加良好。

参考图2所示,为本申请实施例提供的神经网络示意图。本申请实施例中的模型主要包括图像分类模型、权重确定模型和骨干网络模型。骨干网络模型用于将多个训练图像编码为向量,即骨干网络模型的输入为多个训练图像,骨干网络模型的输出为与每个训练图像分别对应的向量。将每个类别簇的向量分别输入对应的图像分类模型中进行训练,每个图像分类模型的输出结果为相应的类别簇内包括的多个类别标签对应的类别的概率,即每个图像分类模型的输出结果可能不同,这是由于不同的类别簇包括的类别数目不同。将多个训练图像对应的向量输入到权重确定模型中进行训练,权重确定模型的输出为一个N维概率,即N个权重,其中N为图像分类模型的数目,即图像分类模型的个数决定了权重确定模型的输出维度,每个权重都对应一个图像分类模型。本申请实施例提供的神经网络最终的输出可以通过将每个图像分类模型的输出结果与权重确定模型输出的对应的权重乘积进行比较,确定最终的图像分类结果。

在本申请的实施例中,在利用权重确定模型对图像分类模型输出的分类结果进行优化,提升图像分类的分类效果时,可以采用根据每种类别标签对应的训练图像的特征,对多种类别标签进行聚类,根据聚类结果和类别标签对应的训练图像的样本量确定多个类别簇的方案来进行图像分类模型和权重确定模型的训练。这样根据聚类和样本量得到的多个类别簇,既考虑了训练图像的样本量均衡,又考虑了多个类别的图像特征,这样能够保证图像分类模型在拥有较好图像分类效果的前提下,进一步提高权重确定模型输出权重的效果。

本申请实施例提供了一种模型训练方法,图像分类模型是由多个类别簇的训练图像训练得到的,类别簇是根据训练图像的类别标签对应的样本量对类别标签对应的类别划分得到的,每个类别簇包括一个或多个类别的训练图像,每个类别簇包括的样本量相对均衡,在进行图像分类模型的训练时,由于每个类别簇的样本量较为均衡,图像分类效果增强。

基于上述实施例提供的模型训练方法,本申请实施例还提供了一种图像分类方法,所述图像分类方法中利用的模型主要是经过模型训练方法训练后的模型。

参见图3,该图为本申请实施例提供的一种图像分类方法的流程图。

本实施例提供的图像分类方法包括如下步骤:

S301,获取目标图像。

在本申请的实施例中,目标图像可以是待分类的图像,是没有对应的类别标签的图像。目标图像可以是图片,也可以是视频中的某一帧。

S302,将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到。

在本申请的实施例中,可以将目标图像分别输入到多个图像分类模型进行分类,分别得到每个图像分类模型输出的分类结果。

其中,多个图像分类模型采用本申请实施例提供的模型训练方法进行训练,具体训练方法参考上述实施例,在此不再赘述。

在实际应用中,可以将目标图像输入至骨干网络模型之后,即将目标图像转换为向量之后,再将目标图像对应的向量输入到多个图像分类模型中。

S303,根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别。

在本申请的实施例中,将目标图像输入到多个图像分类模型,得到每个图像分类模型输出的分类结果后,即可确定目标图像的类别。具体的,可以将多个图像分类模型输出的分类结果中概率最大值对应的类别,确定为目标图像的类别。

在实际应用中,若采用权重确定模型对图像分类模型的输出结果进行优化,则可以将目标图像输入到权重确定模型中,得到每个图像分类模型分别对应的权重,根据每个图像分类模型输出的分类结果以及分别对应的权重,确定目标图像的类别。其中,权重确定模型采用本申请实施例提供的模型训练方法进行训练,具体训练方法参考上述实施例,在此不再赘述。

在实际应用中,可以将目标图像输入至骨干网络模型之后,即将目标图像转换为向量之后,再将目标图像对应的向量输入到权重确定模型中。

在本申请的实施例中,多个图像分类模型中的每个图像分类模型分别根据每个图像分类模型对应的类别簇的训练图像训练得到的,每个类别簇是根据训练图像的类别对应的样本量进行类别划分得到的,每个类别簇包括一个或多个类别的训练图像,每个类别簇包括的样本量相对均衡,在进行图像分类模型的训练时,由于每个类别簇的样本量较为均衡,图像分类效果增强。

在本申请的实施例中,多个图像分类模型中的每个图像分类模型分别是由对应类别簇的训练图像训练得到的,类别簇是根据训练图像的类别标签对应的样本量对类别标签对应的类别划分得到的,每个类别簇包括一个或多个类别的训练图像,每个类别簇包括的样本量相对均衡,在进行图像分类模型的训练时,由于每个类别簇的样本量较为均衡,图像分类效果增强。

基于以上实施例提供的一种图像分类方法,本申请实施例还提供了一种图像分类装置,下面结合附图来详细说明其工作原理。

参见图4,该图为本申请实施例提供的一种图像分类装置的结构框图。

本实施例提供的图像分类装置400包括:

获取单元410,用于获取目标图像;

输入单元420,用于将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到;

确定单元430,用于根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别。

可选的,所述类别簇根据所述训练图像的类别标签对应的样本量对所述类别标签对应的类别划分得到,包括:

所述类别簇根据所述训练图像的类别标签的聚类结果和所述类别标签对应的样本量对所述类别标签对应的类别划分得到,所述聚类结果为根据所述训练图像的特征对所述类别标签进行聚类得到的结果。

可选的,所述聚类结果包括X个类别标签集合,所述X为大于或等于2的整数;

所述类别簇的个数为X+1个,其中,第X+1个类别簇为所述X个类别标签集合的每个类别标签集合中样本量排在预设位置的类别标签对应的类别,第i个类别簇为第i个类别标签集合中除归属为第X+1个类别簇以外的类别标签对应的类别,所述i大于等于1且小于等于X。

可选的,所述确定单元根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别,包括:

所述输出单元将所述目标图像输入到权重确定模型中,得到所述每个图像分类模型分别对应的权重,所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到;

所述输出单元根据所述每个图像分类模型输出的分类结果以及分别对应的权重,确定所述目标图像的类别。

可选的,所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到,包括:

所述权重确定模型根据将用于训练所述图像分类模型的多个类别簇的训练图像输入到所述权重确定模型中输出的权重,以及将所述训练图像输入到对应类别簇的已训练完成的所述图像分类模型输出的分类结果训练得到。

可选的,所述多个图像分类模型中的每个图像分类模型分别根据对应类别簇的训练图像训练得到,以及所述权重确定模型根据所述多个图像分类模型对应的类别簇的训练图像训练得到,包括:

所述多个图像分类模型和所述权重确定模型通过将每个类别簇的训练图像分别输入到对应的图像分类模型以及所述权重确定模型中,根据所述图像分类模型的对所述训练图像的分类结果和所述权重确定模型输出的权重同时对所述多个图像分类模型和所述权重确定模型训练得到。

可选的,所述类别标签的种类为S种;

所述S种类别标签中,样本量排在前N位的类别标签对应的类别为第一类别簇;

所述S种类别标签中,样本量排在后M位的类别标签对应的类别为第二类别簇;

所述S种类别标签中,样本量排在第N+1位至第S-M-1位的类别标签对应的类别为第三类别簇;

其中,所述S、所述N和所述M均为大于或等于1的整数。

可选的,所述确定单元根据所述每个图像分类模型输出的分类结果,确定所述目标图像的类别包括:

所述确定单元将所述多个图像分类模型输出的分类结果中概率最大值对应的类别,确定为所述目标图像的类别。

基于以上实施例提供的一种图像分类方法,本申请实施例还提供了一种图像分类设备,图像分类设备500包括:

处理器510和存储器520,处理器的数量可以一个或多个。在本申请的一些实施例中,处理器和存储器可通过总线或其它方式连接。

存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括NVRAM。存储器存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。

处理器控制终端设备的操作,处理器还可以称为CPU。

上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。

本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例的一种翻译方法中的任意一种实施方式。

当介绍本申请的各种实施例的元件时,冠词“一”、“一个”、“这个”和“所述”都意图表示有一个或多个元件。词语“包括”、“包含”和“具有”都是包括性的并意味着除了列出的元件之外,还可以有其它元件。

需要说明的是,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

相关技术
  • 图像分类预处理、图像分类方法、装置、设备及存储介质
  • 医学图像分类方法、装置、设备、计算机设备和存储介质
技术分类

06120113194546