掌桥专利:专业的专利平台
掌桥专利
首页

一种图像分类方法、装置、设备及存储介质

文献发布时间:2024-04-18 19:58:26


一种图像分类方法、装置、设备及存储介质

技术领域

本发明涉及图像分类技术领域,特别涉及一种图像分类方法、装置、设备及存储介质。

背景技术

随着图像采集技术和设备的不断发展,人们获得的图像数据量呈现爆炸性增长,图像数据中蕴含丰富的视觉信息,但是对图像数据进行分类是一项复杂的任务。

在图像分类过程中,如何根据图像之间的相似性和差异性,对相关图像进行准确分类是本领域要解决的问题。

发明内容

有鉴于此,本发明的目的在于提供一种图像分类方法、装置、设备及存储介质,可以通过密度区域的划分以及子簇合并的方式对图像进行分类,提高了图像分类的准确度。其具体方案如下:

第一方面,本申请提供了一种图像分类方法,包括:

通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度;

根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,并利用所述高斯混合模型从所述密度分布中确定出密度变化转折点;

基于所述密度变化转折点将若干个所述待分类图像划分为不同密度区域,得到若干个密度区域;

利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇;

根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果。

可选的,所述通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度,包括:

利用主成分分析法对待分类图像进行降维处理,得到降维后图像;

通过预设密度计算公式对所述降维后图像的像素进行计算,得到所述待分类图像对应的局部密度。

可选的,所述根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,包括:

由预设数量个高斯概率密度叠加生成初始高斯混合模型;

通过期望最大化算法确定所述初始高斯混合模型中的成分参数,得到目标高斯混合模型;

根据所述目标高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布。

可选的,所述利用所述高斯混合模型从所述密度分布中确定出密度变化转折点,包括:

利用所述高斯混合模型,并以滑动窗口的方式从所述密度分布中确定出密度变化转折点。

可选的,所述利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇,包括:

利用密度峰值聚类算法分别确定各个所述密度区域的密度峰值点;

将各个所述密度区域内的非密度峰值点分配至距离最近的所述密度峰值点,以得到各个所述密度区域对应的密度子簇。

可选的,所述根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果,包括:

根据预设簇间相似度计算公式计算若干所述密度子簇的簇间相似度;所述预设簇间相似度计算公式为基于簇间距、簇交集、簇密度均值、簇对应的密度峰值点的局部密度之间的差异构建的公式;

按照所述簇间相似度从大到小的顺序对若干个所述密度子簇进行合并,以得到针对所述待分类图像的图像分类结果。

可选的,所述按照所述簇间相似度从大到小的顺序对若干个所述密度子簇进行合并,以得到针对所述待分类图像的图像分类结果,包括:

当对若干个所述密度子簇进行合并得到的合并后簇的数量等于预设簇数量时,将相应的合并后簇确定为目标簇,以基于所述目标簇得到针对所述待分类图像的图像分类结果;每个所述合并后簇中包含一个或多个所述密度子簇。

第二方面,本申请提供了一种图像分类装置,包括:

局部密度计算模块,用于通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度;

转折点确定模块,用于根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,并利用所述高斯混合模型从所述密度分布中确定出密度变化转折点;

区域划分模块,用于基于所述密度变化转折点将若干个所述待分类图像划分为不同密度区域,得到若干个密度区域;

密度区域聚类模块,用于利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇;

子簇合并模块,用于根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果。

第三方面,本申请提供了一种电子设备,包括:

存储器,用于保存计算机程序;

处理器,用于执行所述计算机程序以实现如上述的图像分类方法。

第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的图像分类方法。

由此可见,本申请可以通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度;然后根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,并利用所述高斯混合模型从所述密度分布中确定出密度变化转折点;再基于所述密度变化转折点将若干个所述待分类图像划分为不同密度区域,得到若干个密度区域;再利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇;然后根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果。这样一来,本申请可以利用高斯混合模型得到待分类图像的密度分布,并基于密度峰值聚类算法对各密度区域进行合并,得到图像分类结果;能够提高图像分类的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种图像分类方法流程图;

图2为本申请公开的一种具体的密度子簇合并方法流程图;

图3为本申请公开的一种图像分类装置结构示意图;

图4为本申请公开的一种电子设备结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1所示,本发明实施例公开了一种图像分类方法,包括:

步骤S11、通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度。

本申请中,当对待分类图像进行分类处理时,首先通过预设密度计算公式对图像中的像素进行计算,以得到相应图像的局部密度。可以理解的是,本申请是以图像中提取的像素信息作为特征,以图像本身作为样本。在一种具体的实施例中,所述通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度,可以包括:利用主成分分析法对待分类图像进行降维处理,得到降维后图像;通过预设密度计算公式对所述降维后图像的像素进行计算,得到所述待分类图像对应的局部密度。具体的,首先利用主成分分析(Principal component analysis,PCA)对图像进行降维处理,具体的,该PCA可以过滤掉累计贡献率(R

式中d

步骤S12、根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,并利用所述高斯混合模型从所述密度分布中确定出密度变化转折点。

进一步的,可以根据高斯混合模型对上述步骤得到的图像对应的局部密度进行拟合处理,可以待分类图像对应的密度分布。在一种具体的实施例中,所述根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,可以包括:由预设数量个高斯概率密度叠加生成初始高斯混合模型;通过期望最大化算法确定所述初始高斯混合模型中的成分参数,得到目标高斯混合模型;根据所述目标高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布。具体的,可以由K个高斯概率密度叠加生成高斯混合模型,其公式可以为:

式中π

M步骤被称为最大化步骤,在此步骤会重新计算参数,更新参数的计算公式为:

其中,N是总样本点的个数,NK是第K个高斯分布分到样本点个数。E步骤和M步骤交替迭代执行,每迭代一次通过公式:

计算对数似然函数,当新计算的对数似然函数

在具体的实施例中,所述利用所述高斯混合模型从所述密度分布中确定出密度变化转折点,可以包括:利用所述高斯混合模型,并以滑动窗口的方式从所述密度分布中确定出密度变化转折点。具体的,高斯混合模型确定后可以通过滑动窗口的方式寻找混合模型的凹点为密度变化的转折点。

步骤S13、基于所述密度变化转折点将若干个所述待分类图像划分为不同密度区域,得到若干个密度区域。

本申请中,通过前述步骤可以在各个待分类图像中确定出若干密度变化转折点,进一步的,根据该密度变化转折点可以将待分类图像划分为不同的密度区域,可以得到若干个密度区域;以便后续在各个密度区域中单独使用密度峰值聚类算法寻找密度峰值点。

步骤S14、利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇。

进一步的,通过密度峰值聚类算法得到与密度区域对应的密度子簇;在具体的实施例中,所述利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇,可以包括:利用密度峰值聚类算法分别确定各个所述密度区域的密度峰值点;将各个所述密度区域内的非密度峰值点分配至距离最近的所述密度峰值点,以得到各个所述密度区域对应的密度子簇。具体的,首先利用密度峰值聚类算法确定各个密度区域的密度峰值点,再将非密度峰值点分配至最近的密度峰值点,这样可以得到与密度区域对应的密度子簇。需要指出的是,为了避免密度峰值点集中在高密度区域中,造成聚类结果偏差,可以通过距离公式计算各个密度区域之间的相对距离,距离公式可以如下:

通过公式

步骤S15、根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果。

本申请中,通过上述步骤得到与待分类图像的密度区域对应的密度子簇后,可以根据密度子簇之间的相似度对各个密度子簇进行合并,最终可以得到与待分类图像对应的图像分类结果。在一种具体的实施例中,所述根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果,可以包括:根据预设簇间相似度计算公式计算若干所述密度子簇的簇间相似度;所述预设簇间相似度计算公式为基于簇间距、簇交集、簇密度均值、簇对应的密度峰值点的局部密度之间的差异构建的公式;按照所述簇间相似度从大到小的顺序对若干个所述密度子簇进行合并,以得到针对所述待分类图像的图像分类结果。具体的,需要指出的是,子簇之间距离越近、交集个数越多、簇密度均值越大、密度峰值点的局部密度差异越小、则子簇间相似度越大,相反表示子簇间相似度越小;因此,本申请中预设簇间相似度计算公式考虑到簇间距、簇交集、簇密度均值、簇对应的密度峰值点的局部密度之间的差异,根据该公式可以得到全面评估的簇间相似度。之后可以根据相似度的大小对密度子簇进行合并,这样可以得到针对待分类图像的图像分类结果。在具体的实施例中,子簇间相似性度量受万有引力公式启发,对于任意子簇C

子簇C

式中d(C

并且λ为调节因子,计算公式为:

其中ρ

式中

式中,d

在另一种具体的实施例中,所述按照所述簇间相似度从大到小的顺序对若干个所述密度子簇进行合并,以得到针对所述待分类图像的图像分类结果,可以包括:当对若干个所述密度子簇进行合并得到的合并后簇的数量等于预设簇数量时,将相应的合并后簇确定为目标簇,以基于所述目标簇得到针对所述待分类图像的图像分类结果;每个所述合并后簇中包含一个或多个所述密度子簇。具体的,在密度子簇的合并过程中,若当前得到的合并后簇的数量等于预设簇数量时,即当前的经过合并的簇以及未合并的簇的总数量等于预设数量时,则不再进行簇合并,将当前的合并后簇确定为目标簇,以便基于该目标簇得到针对待分类图像的图像分类结果。相应的,若当前的合并后簇的数量大于预设簇数量时,说明当前仍有需要进行合并的子簇,则继续按照簇间相似度的大小进行子簇的合并。

进一步的,在具体的实施例中,如图2所示,其中N(W)表示待合并子簇个数(未合并过的密度子簇),N(H)表示子簇合并后生成的簇的个数(经密度子簇合并后得到的簇),N(R)表示预设簇数量。具体的,在计算完所有密度子簇间的簇间相似度后,按照簇间相似度的大小从大到小排序,将当前排序中相似度最大的两个子簇合并,当条件满足剩余的待合并子簇为零并且合并后的簇的个数等于真正簇的个数,或者合并后的簇的个数加上剩余待合并簇的个数等于真正簇的个数时,合并结束。当条件满足合并后的簇的个数加上剩余待合并簇的个数等于真正簇的个数时,说明当前待合并子簇中存在子簇本身就是最后聚类结果的一个簇,不需要与其他任何簇进行合并。

由此可见,本申请可以对待分类图像进行降维处理,过滤冗余数据,然后通过高斯混合模型拟合图像的局部密度变化转折点,根据密度变化转折点将图像划分为若干密度区域,并通过密度聚类算法使得各个密度区域存在密度峰值点,再根据各密度峰值点生成的密度子簇之间的相似度对各个密度子簇进行合并,以根据合并结果得到针对待分类图像的图像分类结果;提高了图像分类的可靠性。

本申请实施例中,为了验证本申请的技术方案在图像分类上的性能,选择公开图像数据集Olivetti Faces、USPS、Coil20和Yale进行图像分类性能验证实验。OlivettiFaces数据集是一个经典的计算机视觉数据集,该数据集包含了40个人的400张灰度人脸图像。每个人有10张不同姿态和表情的图像,以及是否佩戴眼镜、正脸、侧脸等信息,每张图像都被裁剪为64×64像素的大小。USPS(United States Postal Service)数据集是一个常用的手写数字识别数据集。其中,每个图像都是由16×16像素的灰度图像组成,表示了一个手写的数字(0到9之间的数字),共计9,298个图像,在本实施例中选取1000个图像进行实验。Coil20是一个经典的计算机视觉数据集,用于物体识别和图像分类任务。Coil20数据集包含20个不同的物体的图像序列。每个物体围绕垂直轴旋转,每次旋转5度,拍摄了72张图像,每张图像都代表了不同的角度。图像是彩色图像,具有128×128像素的分辨率,共计包含400张图像。Yale数据集包含了15个不同的人的人脸图像,每个人有11张不同的表情和姿态的图像,总共包含了165张图像。这些图像是在不同的光照条件下拍摄的,以增加数据的多样性。每个图像都是灰度图像,大小为320×243像素。

按照本申请的技术方案进行处理,步骤如下:首先对数据进行降维处理,采用主成分分析过滤掉冗余数据,在本实施例的实验中设置4个图像数据集Olivetti Faces、USPS、Yale和Coil20的R

进一步的,根据密度变化的转折点将样本划分到不同的密度区间在每个密度区间,通过公式:

通过该公式可以计算密度区间的相对距离,通过公式

对于生成的子簇集合,可以使用公式:

通过该公式可以计算两两子簇之间的相似度,根据子簇间相似度的大小从大到小排序,将当前排序中相似度最大的两个子簇合并,直到达到子簇合并停止条件时,合并停止输出最后聚类结果,聚类结果中每一个簇代表图像分类的中每一个类。输出的最终结果如下表1所示:

表1

其中,DSSF-DPC (Density Peaks Clustering Algorithm Based on DensityStratification and Subcluster Fusion,基于密度分层和子簇合并的密度峰值聚类算法)为本申请的技术方案;相应的,DPC(Clustering by Fast Search and Find ofDensity Peaks,密度峰值聚类)为目前常用的图像分类方法;ACC(Accuracy,准确率)。

从上表可以看出,本申请的技术方案在各个数据集上聚类的精准度均有提升,在Olivetti Faces数据集上聚类精准度提升超过10%,四个数据集的平均聚类性能提升9.16%。

如图3所示,本申请实施例公开了一种图像分类装置,包括:

局部密度计算模块11,用于通过预设密度计算公式对待分类图像的像素进行计算,得到所述待分类图像对应的局部密度;

转折点确定模块12,用于根据高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布,并利用所述高斯混合模型从所述密度分布中确定出密度变化转折点;

区域划分模块13,用于基于所述密度变化转折点将若干个所述待分类图像划分为不同密度区域,得到若干个密度区域;

密度区域聚类模块14,用于利用密度峰值聚类算法对所述密度区域进行处理,以得到各个所述密度区域对应的密度子簇;

子簇合并模块15,用于根据所述密度子簇之间的相似度进行合并,以得到针对所述待分类图像的图像分类结果。

由此可见,本申请可以利用高斯混合模型得到待分类图像的密度分布,并基于密度峰值聚类算法对各密度区域进行合并,得到图像分类结果;能够提高图像分类的准确度。

在一种具体的实施例中,所述局部密度计算模块11,可以包括:

图像降维单元,用于利用主成分分析法对待分类图像进行降维处理,得到降维后图像;

密度计算单元,用于通过预设密度计算公式对所述降维后图像的像素进行计算,得到所述待分类图像对应的局部密度。

在一种具体的实施例中,所述转折点确定模块12,可以包括:

模型生成单元,用于由预设数量个高斯概率密度叠加生成初始高斯混合模型;

参数确定单元,用于通过期望最大化算法确定所述初始高斯混合模型中的成分参数,得到目标高斯混合模型;

密度拟合单元,用于根据所述目标高斯混合模型对所述局部密度进行拟合处理,得到与所述待分类图像对应的密度分布。

在另一种具体的实施例中,所述转折点确定模块12,可以包括:

转折点确定单元,用于利用所述高斯混合模型,并以滑动窗口的方式从所述密度分布中确定出密度变化转折点。

在一种具体的实施例中,所述密度区域聚类模块14,可以包括:

峰值点确定单元,用于利用密度峰值聚类算法分别确定各个所述密度区域的密度峰值点;

密度子簇确定单元,用于将各个所述密度区域内的非密度峰值点分配至距离最近的所述密度峰值点,以得到各个所述密度区域对应的密度子簇。

在一种具体的实施例中,所述子簇合并模块15,可以包括:

相似度计算单元,用于根据预设簇间相似度计算公式计算若干所述密度子簇的簇间相似度;所述预设簇间相似度计算公式为基于簇间距、簇交集、簇密度均值、簇对应的密度峰值点的局部密度之间的差异构建的公式;

子簇合并子模块,用于按照所述簇间相似度从大到小的顺序对若干个所述密度子簇进行合并,以得到针对所述待分类图像的图像分类结果。

在一种具体的实施例中,所述子簇合并子模块,可以包括:

子簇合并单元,用于当对若干个所述密度子簇进行合并得到的合并后簇的数量等于预设簇数量时,将相应的合并后簇确定为目标簇,以基于所述目标簇得到针对所述分类图像的图像分类结果;每个所述合并后簇中包含一个或多个所述密度子簇。

进一步的,本申请实施例还公开了一种电子设备,图4是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。

图4为本申请实施例提供的一种电子设备20的结构示意图。该电子设备 20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的图像分类方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。

本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。

另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。

其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的图像分类方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的图像分类方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 一种图像分类方法、装置、终端设备及可读存储介质
  • 病例图像分类方法、装置、计算机设备及存储介质
  • 图像分类方法、装置、电子设备及存储介质
  • 图像分类方法及装置、电子设备、计算机程序及存储介质
  • 多标签图像分类方法、装置、设备及存储介质
  • 图像分类方法、图像分类装置、计算机设备、存储介质
  • 图像分类方法、图像分类装置、计算机设备及存储介质
技术分类

06120116488245