掌桥专利:专业的专利平台
掌桥专利
首页

一种基于贝叶斯网络和分类器链的图像自动标注方法

文献发布时间:2023-06-19 10:08:35


一种基于贝叶斯网络和分类器链的图像自动标注方法

技术领域

本发明涉及图像检索技术领域,特别是涉及一种基于贝叶斯网络和分类器链的图像自动标注方法。

背景技术

随着多媒体、图像信息等技术的逐步发展,图像数据库的规模越来越大,这也使得对视觉信息的管理成为重中之重,而图像检索技术则能够起到视觉信息管理的作用。传统的手工图像标注方法不但工作量大,而且不可避免地带来主观性和不精确性,让计算机实现图像自动标注势在必行。图像自动标注是让计算机自动地给图像加上能够反映其内容的语义关键词,自动标注的使用能够有效地改善目前图像检索的困境。贝叶斯网络算法是一种常见的概率图模型,充分考虑了所求标签之间的相关性,分类器链算法是一种充分利用标签之间相关性的模型,因此,如何提供一种基于贝叶斯网络和分类器链的图像自动标注方法是目前亟待解决的技术问题。

发明内容

本发明的目的是提供一种基于贝叶斯网络和分类器链的图像自动标注方法,以解决现有技术中存在的技术问题,能够对所有类型的图像进行标注,通用性和适应性强,且有效提高了图像自动标注的鲁棒性和准确性。

为实现上述目的,本发明提供了如下方案:本发明提供一种基于贝叶斯网络和分类器链的图像自动标注方法,包括如下步骤:

步骤S1、获取样本图像,提取样本图像的特征构成训练集和测试集,并获取样本图像的标签,构建总标签集;

步骤S2、对训练集、测试集中样本图像的特征进行归一化处理;

步骤S3、基于总标签集中的每一个标签、归一化处理后的样本图像的特征,通过改进的贝叶斯信息准则BIC评分函数的评分搜索方法构建贝叶斯网络,通过贝叶斯网络进行特征选择,得到每一个标签对应的特征子集;

步骤S4、基于每一个标签对应的特征子集,采用密度聚类DBSCAN对总标签集中的标签进行聚类,生成标签子集;

步骤S5、基于改进的BIC评分函数的评分搜索方法分别为每个标签子集构建一个贝叶斯网络结构;

步骤S6、对于每个标签子集构建的贝叶斯网络结构,进行拓扑顺序提取,并基于拓扑顺序构建分类器链;通过训练集和测试集分别对分类器链中的各基分类器进行训练和测试,得到训练好的分类器链,通过训练好的分类器链对待测图像进行类别预测,完成图像的自动标注。

优选地,所述步骤S3中,分别为每个标签l

优选地,所述步骤S3中,通过爬山法求解使得

优选地,所述步骤S5具体包括:

根据所述步骤S3中的评分函数,在初始贝叶斯网络中,不断增加代表标签的节点;

随机选取一个标签作为爬山搜索的起点;

通过加边、减边或翻转,进行贝叶斯网络结构的构建。

优选地,所述贝叶斯网络结构的构建过程中,满足评分函数最大化的条件,得到每个标签子集对应的贝叶斯网络结构。

优选地,所述步骤S6中,通过训练集对分类器链中的各基分类器进行训练的过程包括:

基于每个标签子集L

优选地,所述基分类器采用逻辑回归模型。

优选地,所述步骤S6中,通过训练好的分类器链对待测图像进行类别预测的方法包括:

对于每个待测图像,将特征输入到无前驱节点标签对应的基分类器中,得到预测结果;将预测结果输入至分类器链的其他基分类器中,综合所有的输出集为最终的图像预测结果集,完成图像的自动标注。

本发明公开了以下技术效果:

本发明利用改进的BIC评分函数的方法来学习贝叶斯网络结构,通过DBSCAN算法对标签进行聚类,并为每个标签子集学习贝叶斯网络,通过标签和特征之间的贝叶斯网络进行特征选择并且根据贝叶斯网络的拓扑顺序构建分类器链,通过贝叶斯网络和分类器链算法构造图像预测标签集本方法能够对所有类型的图像进行标注,通用性强;同时,能够处理包含连续特征和离散特征的图像,具有良好的适应性,且有效提高了图像标注的鲁棒性和准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于贝叶斯网络和分类器链的图像自动标注方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1所示,本实施例提供一种基于贝叶斯网络和分类器链的图像自动标注方法,具体包括如下步骤:

步骤S1、获取样本图像,提取样本图像的特征构成训练集和测试集,并获取样本图像的标签,构建总标签集;

本实施例中,训练集和测试集分别表示为:

其中,m为训练集中的样本个数,n为测试集中的样本个数,i为图像编号,

步骤S2、对训练集、测试集中样本图像的特征进行归一化处理;

本实施例中,归一化处理如下式所示:

式中,

步骤S3、基于总标签集中的每一个标签l

本实施例中,分别为每个标签l

基于改进的BIC评分函数的评分搜索方法构建贝叶斯网络结构的具体方法包括:

S3-1、定义

S3-2、采用爬山法求得所有贝叶斯网络结构中的最佳结构

步骤S4、基于每一个标签对应的特征子集,采用密度聚类DBSCAN(Density-BasedSpatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)对总标签集中的标签进行聚类,生成标签子集L

步骤S5、基于改进的BIC评分函数的评分搜索方法分别为每个标签子集L

根据步骤S3-1中定义的评分函数,在一个初始网络中,不断增加代表标签的节点,其中,初始网络为相互不连接的空网络;

选取标签l

步骤S6、对于每个标签子集构建的贝叶斯网络结构G

解析步骤S5中每个标签子集Lr(r=1,2,…s)对应的贝叶斯网络结构G

通过训练集对分类器链中的各基分类器进行训练的过程包括:

每个标签子集L

通过训练好的分类器链对待测图像进行类别预测的方法包括:

对于每个待测图像,将特征输入到无前驱节点标签对应的基分类器中,得到预测结果;将预测结果输入至对应的其他基分类器中,综合所有的输出集为最终的图像预测结果集,完成图像的自动标注。

以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

相关技术
  • 一种基于贝叶斯网络和分类器链的图像自动标注方法
  • 一种基于分类器链算法的房屋出租关键词自动标注方法
技术分类

06120112437112