掌桥专利:专业的专利平台
掌桥专利
首页

一种图片文字切割系统

文献发布时间:2023-06-19 10:43:23


一种图片文字切割系统

技术领域

本发明属于图像处理技术领域,具体涉及一种图片文字切割系统。

背景技术

在传统文化思维中,图像与文字渊源深厚,从我国最早的象形文字便可窥见一斑。Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发;OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上,轻量级而且高效-由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法;NumPy(Numerical Python)是Python的一种开源的数值计算扩展,可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

开发语言采用Python,利用opencv2视觉处理算法,NumPy的数值计算扩展,主要技术包含图像形态学变换(腐蚀、膨胀、开运算和闭运算),canny边缘检测,霍夫变换,垂直投影法,轮廓检索,轮廓拟合,二值化;对于印刷体文献资源可以高识别率实现切割,对于损害或者腐蚀比较严重的文献资源,会产生切割误差。

为了最终得到图片中的每一个字和字所在的位置,为此我们提出一种图片文字切割系统。

发明内容

本发明的目的在于提供一种图片文字切割系统,最终得到图片中的每一个字和字所在的位置。

为实现上述目的,本发明提供如下技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:

前处理模块用于定位图像中的非文字部分(即图片),将其剔除;

预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;

分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;

分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;

分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;

接口封装模块用于将程序封装成API接口。

作为本发明的一种优选的技术方案,图片文字分割方法如下:

步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;

步骤二:再将每一块分割成单列(行)文字;

步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。

作为本发明的一种优选的技术方案,还包括矫正模块、且矫正模块用于对文字进行矫正。

作为本发明的一种优选的技术方案,还包括文字切割算法、文字切割算法如下:

步骤一:对图片进行水平投影,找到每一行的上界限和下界限,进行行切割;

步骤二:对切割出来的每一行,进行垂直投影,找到每一个字符的左右边界,进行单个字符的切割。

作为本发明的一种优选的技术方案,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素。

作为本发明的一种优选的技术方案,还包括提取模块、且提取模块用于图片中文字的提取。

作为本发明的一种优选的技术方案,还包括存储模块、且存储模块用于数据的加密存储。

与现有技术相比,本发明的有益效果是:

(1)通过一系列的图像处理可以将图像中的文字按照位置格式分块,再将每一块分割成单列(行)文字,最后逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置;

(2)通过降噪模块减少图片分析中的干扰因素,提高图片文字识别的效率;通过提取模块提高文字识别的准确率和效率。

附图说明

图1为本发明的图片文字分割方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

请参阅图1,本发明提供一种技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:

前处理模块用于定位图像中的非文字部分(即图片),将其剔除;

预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;

分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;

分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;

分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;

接口封装模块用于将程序封装成API接口,方便调用。

本实施例中,优选的,图片文字分割方法如下:

步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;

步骤二:再将每一块分割成单列(行)文字;

步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。

本实施例中,优选的,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素,提高图片文字识别的效率。

本实施例中,优选的,还包括提取模块、且提取模块用于图片中文字的提取,提高文字识别的准确率和效率。

实施例2

请参阅图1,本发明提供一种技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:

前处理模块用于定位图像中的非文字部分(即图片),将其剔除;

预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;

分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;

分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;

分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;

接口封装模块用于将程序封装成API接口,方便调用。

本实施例中,优选的,图片文字分割方法如下:

步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;

步骤二:再将每一块分割成单列(行)文字;

步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。

本实施例中,优选的,还包括矫正模块、且矫正模块用于对文字进行矫正。

本实施例中,优选的,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素,提高图片文字识别的效率。

实施例3

请参阅图1,本发明提供一种技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:

前处理模块用于定位图像中的非文字部分(即图片),将其剔除;

预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;

分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;

分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;

分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;

接口封装模块用于将程序封装成API接口,方便调用。

本实施例中,优选的,图片文字分割方法如下:

步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;

步骤二:再将每一块分割成单列(行)文字;

步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。

本实施例中,优选的,还包括矫正模块、且矫正模块用于对文字进行矫正。

本实施例中,优选的,还包括文字切割算法、文字切割算法如下:

步骤一:对图片进行水平投影,找到每一行的上界限和下界限,进行行切割;

步骤二:对切割出来的每一行,进行垂直投影,找到每一个字符的左右边界,进行单个字符的切割。

本实施例中,优选的,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素,提高图片文字识别的效率。

本实施例中,优选的,还包括提取模块、且提取模块用于图片中文字的提取,提高文字识别的准确率和效率。

本实施例中,优选的,还包括存储模块、且存储模块用于数据的加密存储。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种图片文字切割系统
  • 一种图片文字识别方法和装置
技术分类

06120112656586