掌桥专利:专业的专利平台
掌桥专利
首页

基于图像处理的图书索书标签脱落检测方法

文献发布时间:2023-06-19 12:22:51


基于图像处理的图书索书标签脱落检测方法

技术领域

本发明属于图书馆管理领域,具体涉及一种基于图像处理的图书索书标签脱落检测方法。

背景技术

由于图书馆的馆藏图书数目众多,大多数图书馆都会采用索书标签来有效降低图书馆藏管理难度。为便于检索,索书标签一般粘贴于图书的外表面,由于图书流通频率较高,长期应用会对索书标签造成比较严重的损伤。随着存取的磨损和时间的推移,索书标签的粘力会下降,也容易出现字迹不清、破损、脱落甚至完全毁坏的情况(见图1),且不干胶易风干和老化加之索书标签纸本身薄,易断裂且易卷边,这些情况都将严重影响索书号的识别,不利于图书的存取,将严重制约图书馆综合管理工作,因此我们需要对索书标签在图书管理中的用途有一个明确的认识,并做到定期维护更新,但一般图书馆的图书数量巨大,通过人工检查方式,人力消耗也相当巨大。

目前针对索书标签的状态检测还较少,还主要停留在索书标签缺陷问题的分析、预防措施的提出以及索书号的检测提取,如方建军等为有效解决相近背景下相邻索书号的分割,提出一种利用索书号颜色特征和书脊边缘信息的图像提取分割方法,并针对不同厚度的书脊进行了分类实验和研究;王圆妹利用投影法对索书号区域进行分割,使用模版匹配的方法识别字符区域,但并没有进行字符OCR识别;高圣辰通过VS结合OpenCV开发了一种图书索书标签轮廓识别算法,能实现对图书索书标签的快速识别,其直接针对索书标签图像,处理范围小,检测难度较低,对倒放或索书标签移动的图书该方法无效。本发明将针对红框索书标签的脱落缺陷进行检测,通过索书标签的颜色特征完成索书标签的分割,并在分割索书标签区域的基础上,计算相邻索书标签的间距,若其值超出平均索书标签区域的宽度,则判定为索书标签脱落,通过相邻索书标签的间距与平均索书标签区域的宽度的比值判断缺失索书标签的数目,帮助图书馆人员后期进行准确的维护。

发明内容

本发明的目的在于提供一种基于图像处理的图书索书标签脱落检测方法,能够更直观准确定位出索书标签脱落位置。

本发明所采用的技术方案是,

步骤1、利用循迹机器人搭载相机进行图书图像采集,通过不断调节相机的拍摄角度、距离来确定最佳拍摄焦距和机器人拍摄路线,保证循迹机器人在图像采集过程中获取的图书图像I

步骤2、对步骤1中采集到的图书图像I

步骤3、对经步骤2处理后得到的索书标签的边框图像I

步骤4、通过获取的图像I

步骤5、根据步骤3中确定的索书标签,计算相邻索书标签之间的距离S

本发明的特征还在于,

步骤2、对步骤1中采集到的图书图像I

根据实际拍摄情况,发现采集到的图书图像通常具备以下特征:

1)在采集到的视频或单幅图像中,图书数目一般在14~29本,以18本居多;

2)图书索书标签由白色背景和黑色文字构成,为索书标签在书脊中的位置更为醒目,索书标签的四周一般有一定宽度其他颜色的边框。对索书标签边框的规格及颜色,目前没有统一的标准,红色边框居多;

3)索书标签的长宽各约为3~4厘米,大于大多数的图书书脊的宽度,一般情况下索书标签的左右两侧边框会被遮挡,而索书标签的上下边框的高度约为0.2~0.4厘米;

4)索书标签的粘贴方式有3种,分别为书跟之上、紧贴书跟以及书脊,三种方式各有利弊,目前没有统一的标准。

根据图索书标签的上述特征,本发明将基于红色边框的索书标签进行脱落缺陷检测。其中,获取索书标签的边框具体步骤如下:

步骤2.1获取图书图像I

步骤2.2根据颜色显色原理可知,若图像要呈现出红色,红色分量数值一般较大,其数值必远大其他两个分量的数值且三个颜色分量之间有一定的关联;经过一系列图像的分析,最终确定红色分量的数值至少达到最大灰度值(255)的一半,即127;

假定图像中某一点像素点显示为红色时,各分量的关系如下:

其中,m

分析各种情形下的索书标签边界颜色,包括完好和不同老化状态,得到m

步骤2.3假定图像I

其中m

步骤2.4通过形态学处理对步骤2.3获得的图像I

步骤2.5由于图书书脊中可能也存在部分红色区域,与索书标签边框的高度稳定不同,其范围一般较大,高度也一般远大于索书标签边框的高度,因此此处以高度为依据进行区域的筛选。不同拍摄距离和拍摄角度,索书标签的边框高度对应的像素点个数H

1)根据八联通准则,对图像I

2)根据排序顺序依次进行联通域的判断,判断步骤如下,首先获取连通域的高度,将连通域与确定好的阈值H

3)所有连通域判断完成后,得到索书标签的边框图像I

步骤3、对经步骤2处理后得到的索书标签的边框图像I

索书标签的获取方法如下:

步骤3.1对索书标签的边框图像I

步骤3.2一个完好的索书标签原则上在步骤2的处理后会保留上下两个边框,每个边框有上下两个边界,而边缘提取过程中仅有边界点处的数值被保留即完好的索书标签区域每列应有四个非零值。依此为依据,进行索书标签的提取,具体步骤如下:

1)首先创建三个一维数组,分别命名为A

2)对边缘图像I

3)再逐列进行判断,以j列为例,若A

4)完成所有列的判断,就可以得到索书标签图像I

步骤4、获取索书标签脱落与否的判据

图书厚度的不同,其选择的索书标签打印和粘贴方式也不同,为了更符合实际情况,考察对比了不同厚度图书的索书标签打印和粘贴方式,结果如下:

少于70页的图书,无形式上的书脊,无法按一般图书粘贴索书标签,此时可将索书标签中的索书号居中打印并平贴于图书背面封皮右侧边;

大于等于70页少于200页时,一般采用单排号打印,用/号分隔分类号和书次号(种次号);

大于等于200页少于300页时,避免索书号长,索书标签以统一规格,一排无法容纳时采用双排号打印;

300页及以上的书多按一般图书打贴索书标签;如有特殊情况,可仍按标准方式打印但横贴在书脊上,或采用双排号打印。

如图4所示,其中展示的是图书索书标签的结构示意图,模拟了正常索书标签与脱落索书标签之间距离。这里模拟的图书属于上述描述的图书中厚度较大的情况,即大于等于70页的情况。其提取索书标签的轮廓近似为一个矩形,计算其图书与图书之间垂直边的距离,将得到两种距离:一种是索书标签的宽度;另一种是索书标签与相邻下一个索书标签之间的距离,相当于间隙的距离。索书标签的宽度和图书的宽度有关,不同图书的宽度没有确定的数值,但图书有其宽度范围;所以,我们选择图书的平均距离S

首先,获取图像I

再进行索书标签的平均宽度的计算,即S

步骤5、根据步骤3中确定的索书标签,计算相邻索书标签之间的距离S

与索书标签的宽度不同,完好的图书,其相邻索书标签之间的距离大小近似相等。当索书标签出现脱落时,脱落处索书标签与相邻的索书标签之间的距离会明显增大,因此间隙的距离,也就是相邻索书标签的距离将是判断索书标签是否出现脱落的关键。

判断索书标签是否脱落已经脱落标签数目的具体步骤如下:

步骤5.1按索书标签的先后顺序,逐个进行相邻索书标的计算,将相邻索书标签的距离记作S

S

W

步骤5.2将S

1)通过相邻索书标签之间的距离S

其中,b

2)逐个判断b

3)同时,通过b

本发明的有益效果是:

附图说明

图1是索书标签各种缺陷的示意图;

图2是本发明基于图像处理的图书索书标签脱落检测方法的流程图;

图3是本发明基于图像处理的图书索书标签脱落检测方法中涉及的各索书标签区域标记图;

图4是本发明基于图像处理的图书索书标签脱落检测方法中涉及的索书标签正常与脱落的结构示意图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明基于图像处理的图书索书标签脱落检测方法,其流程图如图2所示,具体按照以下步骤实施:

步骤1、利用循迹机器人搭载相机进行图书图像采集,通过不断调节相机的拍摄角度、距离来确定最佳拍摄焦距和机器人拍摄路线,保证循迹机器人在图像采集过程中获取的图书图像I

步骤2、对步骤1中采集到的图书图像I

根据实际拍摄情况,发现采集到的图书图像通常具备以下特征:

1)在采集到的视频或单幅图像中,图书数目一般在14~29本,以18本居多;

2)图书索书标签由白色背景和黑色文字构成,为索书标签在书脊中的位置更为醒目,索书标签的四周一般有一定宽度其他颜色的边框。对索书标签边框的规格及颜色,目前没有统一的标准,红色边框居多;

3)索书标签的长宽各约为3~4厘米,大于大多数的图书书脊的宽度,一般情况下索书标签的左右两侧边框会被遮挡,而索书标签的上下边框的高度约为0.2~0.4厘米;

4)索书标签的粘贴方式有3种,分别为书跟之上、紧贴书跟以及书脊,三种方式各有利弊,目前没有统一的标准。

根据图索书标签的上述特征,本发明将基于红色边框的索书标签进行脱落缺陷检测。其中,获取索书标签的边框具体步骤如下:

步骤2.1获取图书图像I

步骤2.2根据颜色显色原理可知,若图像要呈现出红色,红色分量数值一般较大,其数值必远大其他两个分量的数值且三个颜色分量之间有一定的关联;经过一系列图像的分析,最终确定红色分量的数值至少达到最大灰度值(255)的一半,即127;

假定图像中某一点像素点显示为红色时,各分量的关系如下:

其中,m

分析各种情形下的索书标签边界颜色,包括完好和不同老化状态,得到m

步骤2.3假定图像I

其中m

步骤2.4通过形态学处理对步骤2.3获得的图像I

步骤2.5由于图书书脊中可能也存在部分红色区域,与索书标签边框的高度稳定不同,其范围一般较大,高度也一般远大于索书标签边框的高度,因此此处以高度为依据进行区域的筛选。不同拍摄距离和拍摄角度,索书标签的边框高度对应的像素点个数H

1)根据八联通准则,对图像I

2)根据排序顺序依次进行联通域的判断,判断步骤如下,首先获取连通域的高度,将连通域与确定好的阈值H

3)所有连通域判断完成后,得到索书标签的边框图像I

步骤3、对经步骤2处理后得到的索书标签的边框图像I

索书标签的获取方法如下:

步骤3.1对索书标签的边框图像I

步骤3.2一个完好的索书标签原则上在步骤2的处理后会保留上下两个边框,每个边框有上下两个边界,而边缘提取过程中仅有边界点处的数值被保留即完好的索书标签区域每列应有四个非零值。依此为依据,进行索书标签的提取,具体步骤如下:

1)首先创建三个一维数组,分别命名为A

2)对边缘图像I

3)再逐列进行判断,以j列为例,若A

4)完成所有列的判断,就可以得到索书标签图像I

步骤4、获取索书标签脱落与否的判据

图书厚度的不同,其选择的索书标签打印和粘贴方式也不同,为了更符合实际情况,考察对比了不同厚度图书的索书标签打印和粘贴方式,结果如下:

少于70页的图书,无形式上的书脊,无法按一般图书粘贴索书标签,此时可将索书标签中的索书号居中打印并平贴于图书背面封皮右侧边;

大于等于70页少于200页时,一般采用单排号打印,用/号分隔分类号和书次号(种次号);

大于等于200页少于300页时,避免索书号长,索书标签以统一规格,一排无法容纳时采用双排号打印;

300页及以上的书多按一般图书打贴索书标签;如有特殊情况,可仍按标准方式打印但横贴在书脊上,或采用双排号打印。

如图4所示,其中展示的是图书索书标签的结构示意图,模拟了正常索书标签与脱落索书标签之间距离。这里模拟的图书属于上述描述的图书中厚度较大的情况,即大于等于70页的情况。其提取索书标签的轮廓近似为一个矩形,计算其图书与图书之间垂直边的距离,将得到两种距离:一种是索书标签的宽度;另一种是索书标签与相邻下一个索书标签之间的距离,相当于间隙的距离。索书标签的宽度和图书的宽度有关,不同图书的宽度没有确定的数值,但图书有其宽度范围;所以,我们选择图书的平均距离S

首先,获取图像I

再进行索书标签的平均宽度的计算,即S

步骤5、根据步骤3中确定的索书标签,计算相邻索书标签之间的距离S

与索书标签的宽度不同,完好的图书,其相邻索书标签之间的距离大小近似相等。当索书标签出现脱落时,脱落处索书标签与相邻的索书标签之间的距离会明显增大,因此间隙的距离,也就是相邻索书标签的距离将是判断索书标签是否出现脱落的关键。

判断索书标签是否脱落已经脱落标签数目的具体步骤如下:

步骤5.1按索书标签的先后顺序,逐个进行相邻索书标的计算,将相邻索书标签的距离记作S

S

W

步骤5.2将S

1)通过相邻索书标签之间的距离S

其中,b

2)逐个判断b

3)同时,通过b

本发明基于图像处理的图书索书标签脱落检测方法,其原理简单易行,能有效检测索书标签情况,为索书标签脱落检测提供了一种新思路。

相关技术
  • 基于图像处理的图书索书标签脱落检测方法
  • 一种基于3D图像处理的部件松动脱落的检测方法和系统
技术分类

06120113269639