掌桥专利:专业的专利平台
掌桥专利
首页

离线手写汉字同名笔画提取方法、系统、装置

文献发布时间:2023-06-19 11:29:13


离线手写汉字同名笔画提取方法、系统、装置

技术领域

本发明属于图像处理技术领域,具体涉及一种离线手写汉字同名笔画提取方法、系统、装置。

背景技术

能够规范美观地书写汉字,对一个人的学习、工作、生活都大有裨益。目前,教导学生规范书写汉字的示范性教学资源较为丰富,但是对于学生书法练习作业的反馈指导主要依赖人工,效率较低,因此需要智能化手段及时有效地对学生的书法作业给出针对性的指导意见,提升学生书法练习的效果。

指导学生正确规范的书写汉字,除了要评判书写汉字的对错外,更重要的是对汉字每一笔画、笔画间架结构等的规整性给出指导意见,这首先就需要准确的辨别出手写汉字的每一个笔画,我们称在手写汉字图像中匹配的连通区为基准汉字笔画的同名笔画。汉字多种多样,是拓扑结构复杂的连通区组合,不同人书写的汉字千差万别更是增加了手写汉字同名笔画提取的难度。基于此,本发明提出了一种离线手写汉字同名笔画提取方法。

发明内容

为了解决现有技术中的上述问题,即为了解决目前缺乏手写汉字同名笔画的提取方法,导致无法精确到笔画层级指导学生规范书写汉字的问题,本发明提出了一种离线手写汉字同名笔画提取方法,该方法包括:

S10,获取手写汉字图像、基准汉字图像;所述手写汉字图像为对拍摄或扫描的硬笔书写汉字图像预处理后的二值化图像;所述基准汉字图像为已知笔画及书写顺序的规范汉字图像;

S20,提取手写汉字图像前景区域的最小外接矩形,作为第一矩形;提取基准汉字图像前景区域的最小外接矩形,作为第二矩形;计算第二矩形保持宽高比、缩放到第一矩形的缩放比例,并根据该缩放比例缩放第二矩形得到第三矩形;构建与第三矩形大小相同的图像,将手写汉字图像的前景区域居中放置在构建的图像中,作为第一图像,将原始的手写汉字图像替换为第一图像;

S30,提取替换后的手写汉字图像中各连通区域外轮廓上的像素点,构建第一点集;结合第一点集,提取替换后的手写汉字图像的骨架点,构建第二点集;从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合;

重新提取后,结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对,进而遍历第二骨架分枝集合,提取骨架分枝上各像素点对应第一点集中的像素点;构建闭合轮廓,作为分割连通区,并计算各分割连通区的最小外接矩形和主方向;

所述骨架端点为八邻域中只有一个邻居或两个邻接邻居为骨架点的骨架点:所述 骨架分枝点为八邻域中0-1或1-0变化次数大于4且为偶数的骨架点;所述骨架拐点为其与 距离其设定索引距离的两个像素点构成的张角小于设定张角阈值的

S40,将基准汉字图像中的汉字笔画矢量轮廓按S20中获取的缩放比例修正,并按照笔画书写顺序依次将修正后的基准汉字图像中汉字的单一笔画绘制在图像上;绘制后,提取各笔画连通区域外轮廓上的像素点,计算各笔画连通区的最小外接矩形、主方向以及与其他笔画的相对位置关系,并判断该笔画是否在其他所有笔画的上方或下方或左方或右方,若是,则作为边界笔画,否则作为内部笔画;

S50,在边界笔画、内部笔画的内部以笔画最小外接矩形的长边从大到小排序;排序后,按顺序遍历笔画,并调整笔画位置;提取调整位置后基准汉字图像中汉字的各笔画连通区的外轮廓点集,作为第三点集;

S60,对手写汉字图像的分割连通区的轮廓点集中的每一个轮廓点,在与所述分割连通区的主方向的距离小于设定主方向距离阈值的第三点集中,将与分割连通区的轮廓点梯度方向距离小于设定梯度方向距离阈值,且像素距离最近的笔画轮廓点作为该分割连通区的轮廓点的对应点,并将与分割连通区轮廓点对应的笔画轮廓点的笔画类别作为分割连通区轮廓点的笔画类别,以轮廓点数目最多的笔画类别作为分割区的笔画类别;分类后,依次标记出笔画类别相同的手写汉字分割连通区,并将相同类别、相互连接的所有分割连通区归并为一个,将归并后面积最大的分割连通区作为基准汉字中该类别笔画在手写汉字图像中的同名笔画连通区域;

S70,提取同名笔画连通区域的图像及其外轮廓对应的点集作为手写汉字图像同名笔画提取结果进行输出。

在一些优选的实施方式中,步骤S30中“从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合”,其方法为:

从第二点集中获取汉字的骨架端点、骨架分枝点;

遍历第二点集中的像素点,若当前像素点不为骨架端点、骨架分枝点,则将该像素点作为预构建的第一骨架分枝集合中一个骨架分枝的第一个点,并获取该像素点的邻域点,判断邻域点是否属于第二点集或不属于骨架端点、骨架分枝点,若是,则将邻域点增入当前骨架分枝,并循环遍历邻域点的邻域点,直至邻域点不属于第二点集或属于骨架端点、骨架分枝点,得到手写汉字图像的一个骨架分枝;继续遍历第二点集的剩余像素点,直至第二点集中的所有像素点遍历完毕,得到手写汉字图像的第一骨架分枝集合;

从第一骨架分枝集合中提取汉字的骨架拐点;

重新遍历第二点集中的像素点,若当前像素点不为骨架端点、骨架分枝点、骨架拐点,则将该像素点作为预构建的第二骨架分枝集合中一个骨架分枝的第一个点,获取该像素点的邻域点,并判断邻域点是否属于第二点集或不属于骨架端点、骨架分枝点、骨架拐点,若是,则将邻域点增入当前骨架分枝,并循环遍历邻域点的邻域点,直至邻域点不属于第二点集或属于骨架端点、骨架分枝点、骨架拐点,得到手写汉字图像的一个骨架分枝;继续遍历第二点集的剩余像素点,直至第二点集中的所有像素点遍历完毕,得到手写汉字图像的第二骨架分枝集合。

在一些优选的实施方式中,步骤S30中“结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对”,其方法为:

对第一点集中的各像素点,若其邻域点集合中包含骨架分枝点、骨架拐点,则取与像素距离最近的一个特征点作为对应点,组成对应点对;若其邻域点集合中不包含骨架分枝点、骨架拐点,则取中与像素距离最近的一个像素点作为的对应点;所述特征点包括骨架端点、骨架分枝点、骨架拐点。

在一些优选的实施方式中,所述分割连通区对应的主方向、次方向、单x方向、单y方向,其判断方法为:

采用PCA主成分分析法对每一个分割连通区外轮廓对应的点集求取协方差矩阵的两个特征值和特征向量;

计算两个特征向量与x轴的夹角,以两个特征值中大的特征值对应的特征向量与x轴的夹角为分割连通区的主方向,另一个特征向量与x轴的夹角为次方向;

若两个特征值中大特征值与小特征值的比例大于设定阈值,则该分割连通区为单向,否则该分割连通区为双向;若分割连通区为单向,若分割连通区的主方向与x轴的角度距离小于与y轴的角度距离,则分割连通区为单x方向,否则分割连通区为单y方向。

在一些优选的实施方式中,步骤S40中“各笔画连通区与其他笔画的相对位置关系”,其计算方法为:

对各笔画连通区

判断

判断

判断

判断

在一些优选的实施方式中,步骤S50中“调整笔画位置”,其方法为:

对笔画

保留在笔画的可行调整区、不在笔画的禁止区且与笔画主方向小于阈值的手写汉字连通区,以保留下来的手下汉字连通区的轮廓点集作为目标点集,以笔画连通区轮廓点集为源点集,根据迭代最近邻方法求解源点集到目标点集的变换矩阵,进而根据获取的变换矩阵调整基准汉字笔画的位置;

其中,笔画

对于

笔画

其中,

在一些优选的实施方式中,两分割连通区的主方向的距离,其计算方法为:

其中,

本发明的第二方面,提出了一种离线手写汉字同名笔画提取系统,该系统包括:图像获取模块、图像对齐模块、区域分割模块、特征要素计算模块、位置调整模块、同名笔画连通区域提取模块、提取结果输出模块;

所述图像获取模块,配置为获取手写汉字图像、基准汉字图像;所述手写汉字图像为对拍摄或扫描的硬笔书写汉字图像预处理后的二值化图像;所述基准汉字图像为已知笔画及书写顺序的规范汉字图像;

所述图像对齐模块,配置为提取手写汉字图像前景区域的最小外接矩形,作为第一矩形;提取基准汉字图像前景区域的最小外接矩形,作为第二矩形;计算第二矩形保持宽高比、缩放到第一矩形的缩放比例,并根据该缩放比例缩放第二矩形得到第三矩形;构建与第三矩形大小相同的图像,将手写汉字图像的前景区域居中放置在构建的图像中,作为第一图像,将原始的手写汉字图像替换为第一图像;

所述区域分割模块,配置为提取替换后的手写汉字图像中各连通区域外轮廓上的像素点,构建第一点集;结合第一点集,提取替换后的手写汉字图像的骨架点,构建第二点集;从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合;

重新提取后,结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对,进而遍历第二骨架分枝集合,提取骨架分枝上各像素点对应第一点集中的像素点;构建闭合轮廓,作为分割连通区,并计算各分割连通区的最小外接矩形和主方向;

所述骨架端点为八邻域中只有一个邻居或两个邻接邻居为骨架点的骨架点:所述 骨架分枝点为八邻域中0-1或1-0变化次数大于4且为偶数的骨架点;所述骨架拐点为其与 距离其设定索引距离的两个像素点构成的张角小于设定张角阈值的

所述特征要素计算模块,配置为将基准汉字图像中的汉字笔画矢量轮廓按图像对齐模块中获取的缩放比例修正,并按照笔画书写顺序依次将修正后的基准汉字图像中汉字的单一笔画绘制在图像上;绘制后,提取各笔画连通区域外轮廓上的像素点,计算各笔画连通区的最小外接矩形、主方向以及与其他笔画的相对位置关系,并判断该笔画是否在其他所有笔画的上方或下方或左方或右方,若是,则作为边界笔画,否则作为内部笔画;

所述位置调整模块,配置为在边界笔画、内部笔画的内部以笔画最小外接矩形的长边从大到小排序;排序后,按顺序遍历笔画,并调整笔画位置;提取调整位置后基准汉字图像中汉字的各笔画连通区的外轮廓点集,作为第三点集;

所述同名笔画连通区域提取模块,配置为对手写汉字图像的分割连通区的轮廓点集中的每一个轮廓点,在与所述分割连通区的主方向的距离小于设定主方向距离阈值的第三点集中,将与分割连通区的轮廓点梯度方向距离小于设定梯度方向距离阈值,且像素距离最近的笔画轮廓点作为该分割连通区的轮廓点的对应点,并将与分割连通区轮廓点对应的笔画轮廓点的笔画类别作为分割连通区轮廓点的笔画类别,以轮廓点数目最多的笔画类别作为分割区的笔画类别;分类后,依次标记出笔画类别相同的手写汉字分割连通区,并将相同类别、相互连接的所有分割连通区归并为一个,将归并后面积最大的分割连通区作为基准汉字中该类别笔画在手写汉字图像中的同名笔画连通区域;

所述提取结果输出模块,配置为提取同名笔画连通区域的图像及其外轮廓对应的点集作为手写汉字图像同名笔画提取结果进行输出。

本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适用于由处理器加载并执行以实现上述的离线手写汉字同名笔画提取方法。

本发明的第四方面,提出了一种处理装置,包括处理器和存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;所述程序适用于由处理器加载并执行以实现上述的离线手写汉字同名笔画提取方法。

本发明的有益效果:

本发明实现手写汉字同名笔画提取,进而可以精确到笔画层级指导学生规范书写汉字。

1)本发明将预处理后的手写汉字图像与基准汉字图像对齐,通过对手写汉字进行区域分割,分别提取手写汉字分割区域的特征要素、基准汉字笔画连通区域的特征要素,采用带约束的迭带最近邻方法调整基准汉字笔画位置,基于特征要素、位置、梯度方向约束,实现离线手写汉字同名笔画提取。

2)本发明对手写汉字图像的区域分割方法可以将手写汉字图像分割为单向性较好的图像基元,有利于对交叉笔画的同名笔画提取;在附加约束条件下调整基准汉字笔画位置、基于多重约束提取同名笔画,实现了在保持笔画间架结构的基础上提升同名笔画提取的正确率。本发明方法的输出结果可以用来对手写汉字的整体结构、笔画排布、笔画形态等进行深入分析,为指导规范书写汉字提供了技术基础。

附图说明

通过阅读参照以下附图所做的对非限制性实施例所做的详细描述,本申请的其他特征、目的和优点将会变得更明显。

图1 是本发明一种实施例的离线手写汉字同名笔画提取方法的流程示意图;

图2为本发明一种实施例的离线手写汉字同名笔画提取系统的框架示意图;

图3是本发明一种实施例的离线手写汉字同名笔画提取方法的简略流程示意图;

图4 是本发明一种实施例的手写汉字图像和基准汉字图像示例图;

图5是本发明一种实施例的手写汉字图像和基准汉字图像对齐结果示例图;

图6是本发明一种实施例的手写汉字图像连通区域分割结果示例图;

图7是本发明一种实施例的手写汉字同名笔画提取结果的示例图;

图8是本发明一种实施例的适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

本发明第一实施例的一种离线手写汉字同名笔画提取方法,如图1所示,该方法包括以下步骤:

S10,获取手写汉字图像、基准汉字图像;所述手写汉字图像为对拍摄或扫描的硬笔书写汉字图像预处理后的二值化图像;所述基准汉字图像为已知笔画及书写顺序的规范汉字图像;

S20,提取手写汉字图像前景区域的最小外接矩形,作为第一矩形;提取基准汉字图像前景区域的最小外接矩形,作为第二矩形;计算第二矩形保持宽高比、缩放到第一矩形的缩放比例,并根据该缩放比例缩放第二矩形得到第三矩形;构建与第三矩形大小相同的图像,将手写汉字图像的前景区域居中放置在构建的图像中,作为第一图像,将原始的手写汉字图像替换为第一图像;

S30,提取替换后的手写汉字图像中各连通区域外轮廓上的像素点,构建第一点集;结合第一点集,提取替换后的手写汉字图像的骨架点,构建第二点集;从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合;

重新提取后,结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对,进而遍历第二骨架分枝集合,提取骨架分枝上各像素点对应第一点集中的像素点;构建闭合轮廓,作为分割连通区,并计算各分割连通区的最小外接矩形和主方向;

所述骨架端点为八邻域中只有一个邻居或两个邻接邻居为骨架点的骨架点:所述 骨架分枝点为八邻域中0-1或1-0变化次数大于4且为偶数的骨架点;所述骨架拐点为其与 距离其设定索引距离的两个像素点构成的张角小于设定张角阈值的

S40,将基准汉字图像中的汉字笔画矢量轮廓按S20中获取的缩放比例修正,并按照笔画书写顺序依次将修正后的基准汉字图像中汉字的单一笔画绘制在图像上;绘制后,提取各笔画连通区域外轮廓上的像素点,计算各笔画连通区的最小外接矩形、主方向以及与其他笔画的相对位置关系,并判断该笔画是否在其他所有笔画的上方或下方或左方或右方,若是,则作为边界笔画,否则作为内部笔画;

S50,在边界笔画、内部笔画的内部以笔画最小外接矩形的长边从大到小排序;排序后,按顺序遍历笔画,并调整笔画位置;提取调整位置后基准汉字图像中汉字的各笔画连通区的外轮廓点集,作为第三点集;

S60,对手写汉字图像的分割连通区的轮廓点集中的每一个轮廓点,在与所述分割连通区的主方向的距离小于设定主方向距离阈值的第三点集中,将与分割连通区的轮廓点梯度方向距离小于设定梯度方向距离阈值,且像素距离最近的笔画轮廓点作为该分割连通区的轮廓点的对应点,并将与分割连通区轮廓点对应的笔画轮廓点的笔画类别作为分割连通区轮廓点的笔画类别,以轮廓点数目最多的笔画类别作为分割区的笔画类别;分类后,依次标记出笔画类别相同的手写汉字分割连通区,并将相同类别、相互连接的所有分割连通区归并为一个,将归并后面积最大的分割连通区作为基准汉字中该类别笔画在手写汉字图像中的同名笔画连通区域;

S70,提取同名笔画连通区域的图像及其外轮廓对应的点集作为手写汉字图像同名笔画提取结果进行输出。

为了更清晰地对本发明离线手写汉字同名笔画提取方法进行说明,下面结合附图1、3,对本发明方法一种实施例中各步骤进行展开详述。

S10,获取手写汉字图像、基准汉字图像;所述手写汉字图像为对拍摄或扫描的硬笔书写汉字图像预处理后的二值化图像;所述基准汉字图像为已知笔画及书写顺序的规范汉字图像;

在本实例中,先获取手写汉字图像,手写汉字图像的原始图像由相机拍摄或扫描得到,对手写汉字图像进行预处理,使汉字区域为白色,其余部分为黑色,预处理(本发明中优选为二值化处理)后的图像作为本发明方法的手写汉字图像;基准汉字与手写汉字为同一汉字,基准汉字数据保存为有序笔画的矢量轮廓,由矢量轮廓可得到笔画轮廓点,将笔画绘制在图像上得到基准汉字图像,其中汉字部分为白色前景,其余部分为黑色背景,如图4所示。

S20,提取手写汉字图像前景区域的最小外接矩形,作为第一矩形;提取基准汉字图像前景区域的最小外接矩形,作为第二矩形;计算第二矩形保持宽高比、缩放到第一矩形的缩放比例,并根据该缩放比例缩放第二矩形得到第三矩形;构建与第三矩形大小相同的图像,将手写汉字图像的前景区域居中放置在构建的图像中,作为第一图像,将原始的手写汉字图像替换为第一图像;

在本实例中,计算第二矩形保持宽高比、缩放到第一矩形的缩放比例的过程,如公式(1)所示:

其中,

根据该缩放比例缩放第二矩形得到第三矩形;构建与第三矩形大小相同的图像,将手写汉字图像的前景区域居中放置在构建的图像中,作为第一图像,将原始的手写汉字图像替换为第一图像。进而实现手写汉字图像、基准汉字图像的对齐,对齐结果如图5所示。

S30,提取替换后的手写汉字图像中各连通区域外轮廓上的像素点,构建第一点集;结合第一点集,提取替换后的手写汉字图像的骨架点,构建第二点集;从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合;

重新提取后,结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对,进而遍历第二骨架分枝集合,提取骨架分枝上各像素点对应第一点集中的像素点;构建闭合轮廓,作为分割连通区,并计算各分割连通区的最小外接矩形和主方向;

所述骨架端点为八邻域中只有一个邻居或两个邻接邻居为骨架点的骨架点:所述 骨架分枝点为八邻域中0-1或1-0变化次数大于4且为偶数的骨架点;所述骨架拐点为其与 距离其设定索引距离的两个像素点构成的张角小于设定张角阈值的

在本实例中,对手写汉字图像进行区域分割及区域特征要素计算,具体为:

S31,提取替换后的手写汉字图像中各连通区域外轮廓上的像素点,构建第一点集;

S32,结合第一点集,提取替换后的手写汉字图像的骨架点,构建第二点集;具体为:

对第一点集中的像素点

S33,从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合。具体如下:

本发明中,先从第二点集中获取汉字的骨架端点、骨架分枝点,其中,骨架端点定义为八邻域中只有一个邻居或两个邻接邻居为骨架点的估计点;骨架分枝点定义为,八邻域中0-1或1-0变化次数大于4且为偶数的骨架点,即对第二点集中的某一像素点,在其八邻域内,若邻居点是第二点集中的像素点,则该邻居点标记为1,否则标记为0;按照下表中从小到大的数字顺序访问八邻域,统计邻域中0-1或1-0变化次数。

表1

表1中1-8的八个数字对应的区域表示八邻域。

遍历第二点集中的每个像素点,若当前像素点不为骨架端点、骨架分枝点,以该像素点为种子像素点进行图像生长,直到遇到某一像素点为骨架端点或骨架分枝点或某一像素点不属于第二点集,则停止生长,提取生长的像素段,作为一个骨架分枝;将该骨架分枝覆盖的像素点中不是骨架分枝点的像素点在第二点集中删除;重复上述步骤,直到第二像素点集中的点全部为骨架分枝点。即遍历第二点集中的像素点,若当前像素点不为骨架端点、骨架分枝点,则将该像素点作为预构建的第一骨架分枝集合中一个骨架分枝的第一个点,并获取该像素点的邻域点,判断邻域点是否属于第二点集或不属于骨架端点、骨架分枝点,若是,则将邻域点增入当前骨架分枝,并循环遍历邻域点的邻域点,直至邻域点不属于第二点集或属于骨架端点、骨架分枝点,得到手写汉字图像的一个骨架分枝;继续遍历第二点集的剩余像素点,直至第二点集中的所有像素点遍历完毕。得到手写汉字图像的第一骨架分枝集合。

从第一骨架分枝集合中提取汉字的骨架拐点,骨架拐点的定义为:对每一个骨架 分枝中的像素点

在本发明的一个实施例中,对齐后的手写汉字图像和基准汉字图像大小为 340x310,

重新遍历第二点集中的像素点,若当前像素点不为骨架端点、骨架分枝点、骨架拐点,则将该像素点作为预构建的第二骨架分枝集合中一个骨架分枝的第一个点,获取该像素点的邻域点,并判断邻域点是否属于第二点集或不属于骨架端点、骨架分枝点、骨架拐点,若是,则将邻域点增入当前骨架分枝,并循环遍历邻域点的邻域点,直至邻域点不属于第二点集或属于骨架端点、骨架分枝点、骨架拐点,得到手写汉字图像的一个骨架分枝;继续遍历第二点集的剩余像素点,直至第二点集中的所有像素点遍历完毕,得到手写汉字图像的第二骨架分枝集合。

S34,重新提取后,结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对;具体为:

对第一点集中的各像素点,若其邻域点集合中包含骨架分枝点、骨架拐点,则取与像素距离最近的一个特征点作为对应点,组成对应点对;若其邻域点集合中不包含骨架分枝点、骨架拐点,则取中与像素距离最近的一个像素点作为的对应点,组成对应点对;所述特征点包括骨架端点、骨架分枝点、骨架拐点。

S35,遍历第二骨架分枝集合,提取骨架分枝上各像素点对应第一点集中的像素点;构建闭合轮廓,作为分割连通区,并计算各分割连通区的最小外接矩形和主方向。具体为:

遍历第二骨架分枝集合,对于每一个骨架分枝上的像素点,提取第一点集中对应 点为该点的像素点集合

计算各分割连通区的最小外接矩形和主方向,作为分割联通区的特征要素,其中各分割连通区对应的主方向、次方向、单x方向、单y方向,其判断方法为:

采用PCA主成分分析法对每一个分割连通区外轮廓对应的点集求取协方差矩阵的两个特征值和特征向量;

计算两个特征向量与x轴的夹角,以两个特征值中大的特征值对应的特征向量与x轴的夹角为分割连通区的主方向,另一个特征向量与x轴的夹角为次方向;

若两个特征值中大特征值与小特征值的比例大于设定阈值,则该分割连通区为单 向,否则该分割连通区为双向;若分割连通区为单向,若分割连通区的主方向与x轴的角度 距离小于与y轴的角度距离,则分割连通区为单x方向,否则分割连通区为单y方向。在本发 明中,

特征向量与x轴的夹角的计算方法,如公式(3)所示:

其中,

S40,将基准汉字图像中的汉字笔画矢量轮廓按S20中获取的缩放比例修正,并按照笔画书写顺序依次将修正后的基准汉字图像中汉字的单一笔画绘制在图像上;绘制后,提取各笔画连通区域外轮廓上的像素点,计算各笔画连通区的最小外接矩形、主方向以及与其他笔画的相对位置关系,并判断该笔画是否在其他所有笔画的上方或下方或左方或右方,若是,则作为边界笔画,否则作为内部笔画;

在本实例中,基准汉字图像中的汉字笔画矢量轮廓按S20中获取的缩放比例修正,其方法如公式(4)所示:

其中,

修正后,按照笔画书写顺序依次将修正后的基准汉字图像中汉字的单一笔画绘制在图像上,并提取各笔画连通区域外轮廓上的像素点,计算各笔画连通区的最小外接矩形、主方向以及与其他笔画的相对位置关系,作为基准汉字图像笔画特征要素。

其中,计算各笔画连通区与其他笔画的相对位置关系,具体为:

对各笔画连通区

判断

判断

判断

判断

最后,判断该笔画是否在其他所有笔画的上方或下方或左方或右方,若是,则作为边界笔画,否则作为内部笔画。

S50,在边界笔画、内部笔画的内部以笔画最小外接矩形的长边从大到小排序;排序后,按顺序遍历笔画,并调整笔画位置;提取调整位置后基准汉字图像中汉字的各笔画连通区的外轮廓点集,作为第三点集;

在本实例中,调整笔画位置的具体过程为:

对笔画

保留在笔画的可行调整区、不在笔画的禁止区且与笔画主方向小于阈值的手写汉字连通区,以保留下来的手下汉字连通区的轮廓点集作为目标点集,以笔画连通区轮廓点集为源点集,根据迭代最近邻方法求解源点集到目标点集的变换矩阵,进而根据获取的变换矩阵调整基准汉字笔画的位置。

其中,笔画

对于

笔画

其中,

S60,对手写汉字图像的分割连通区的轮廓点集中的每一个轮廓点,在与所述分割连通区的主方向的距离小于设定主方向距离阈值的第三点集中,将与分割连通区的轮廓点梯度方向距离小于设定梯度方向距离阈值,且像素距离最近的笔画轮廓点作为该分割连通区的轮廓点的对应点,并将与分割连通区轮廓点对应的笔画轮廓点的笔画类别作为分割连通区轮廓点的笔画类别,以轮廓点数目最多的笔画类别作为分割区的笔画类别;分类后,依次标记出笔画类别相同的手写汉字分割连通区,并将相同类别、相互连接的所有分割连通区归并为一个,将归并后面积最大的分割连通区作为基准汉字中该类别笔画在手写汉字图像中的同名笔画连通区域;提取的结果如图7所示。

在本实例中,两分割连通区的主方向的距离,其计算方法为:

其中,

S70,提取同名笔画连通区域的图像及其外轮廓对应的点集作为手写汉字图像同名笔画提取结果进行输出。

在本实例中,输出手写汉字图像中的同名笔画连通区以及其外轮廓对应的点集,为后续评价手写汉字、指导书写规范提供数据基础。

本发明第二实施例的一种离线手写汉字同名笔画提取系统,如图2所示,包括:图像获取模块100、图像对齐模块200、区域分割模块300、特征要素计算模块400、位置调整模块500、同名笔画连通区域提取模块600、提取结果输出模块700;

所述图像获取模块100,配置为获取手写汉字图像、基准汉字图像;所述手写汉字图像为对拍摄或扫描的硬笔书写汉字图像预处理后的二值化图像;所述基准汉字图像为已知笔画及书写顺序的规范汉字图像;

所述图像对齐模块200,配置为提取手写汉字图像前景区域的最小外接矩形,作为第一矩形;提取基准汉字图像前景区域的最小外接矩形,作为第二矩形;计算第二矩形保持宽高比、缩放到第一矩形的缩放比例,并根据该缩放比例缩放第二矩形得到第三矩形;构建与第三矩形大小相同的图像,将手写汉字图像的前景区域居中放置在构建的图像中,作为第一图像,将原始的手写汉字图像替换为第一图像;

所述区域分割模块300,配置为提取替换后的手写汉字图像中各连通区域外轮廓上的像素点,构建第一点集;结合第一点集,提取替换后的手写汉字图像的骨架点,构建第二点集;从第二点集中提取汉字的骨架端点、骨架分枝点,并结合骨架端点、骨架分枝点提取骨架分枝集合,作为第一骨架分枝集合;从所述第一骨架分枝集合中提取骨架拐点,并结合骨架端点、骨架分枝点、骨架拐点,重新提取骨架分枝集合,作为第二骨架分枝集合;

重新提取后,结合骨架分枝点、骨架拐点,遍历第一点集,计算其与第二点集的对应点对,进而遍历第二骨架分枝集合,提取骨架分枝上各像素点对应第一点集中的像素点;构建闭合轮廓,作为分割连通区,并计算各分割连通区的最小外接矩形和主方向;

所述骨架端点为八邻域中只有一个邻居或两个邻接邻居为骨架点的骨架点:所述 骨架分枝点为八邻域中0-1或1-0变化次数大于4且为偶数的骨架点;所述骨架拐点为其与 距离其设定索引距离的两个像素点构成的张角小于设定张角阈值的

所述特征要素计算模块400,配置为将基准汉字图像中的汉字笔画矢量轮廓按图像对齐模块中获取的缩放比例修正,并按照笔画书写顺序依次将修正后的基准汉字图像中汉字的单一笔画绘制在图像上;绘制后,提取各笔画连通区域外轮廓上的像素点,计算各笔画连通区的最小外接矩形、主方向以及与其他笔画的相对位置关系,并判断该笔画是否在其他所有笔画的上方或下方或左方或右方,若是,则作为边界笔画,否则作为内部笔画;

所述位置调整模块500,配置为在边界笔画、内部笔画的内部以笔画最小外接矩形的长边从大到小排序;排序后,按顺序遍历笔画,并调整笔画位置;提取调整位置后基准汉字图像中汉字的各笔画连通区的外轮廓点集,作为第三点集;

所述同名笔画连通区域提取模块600,配置为对手写汉字图像的分割连通区的轮廓点集中的每一个轮廓点,在与所述分割连通区的主方向的距离小于设定主方向距离阈值的第三点集中,将与分割连通区的轮廓点梯度方向距离小于设定梯度方向距离阈值,且像素距离最近的笔画轮廓点作为该分割连通区的轮廓点的对应点,并将与分割连通区轮廓点对应的笔画轮廓点的笔画类别作为分割连通区轮廓点的笔画类别,以轮廓点数目最多的笔画类别作为分割区的笔画类别;分类后,依次标记出笔画类别相同的手写汉字分割连通区,并将相同类别、相互连接的所有分割连通区归并为一个,将归并后面积最大的分割连通区作为基准汉字中该类别笔画在手写汉字图像中的同名笔画连通区域;

所述提取结果输出模块700,配置为提取同名笔画连通区域的图像及其外轮廓对应的点集作为手写汉字图像同名笔画提取结果进行输出。

所述技术领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的系统的具体的工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。

需要说明的是,上述实施例提供的离线手写汉字同名笔画提取系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。

本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适用于由处理器加载并实现上述的离线手写汉字同名笔画提取方法。

本发明第四实施例的一种处理装置,包括处理器和存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适用于由处理器加载并执行以实现上述的离线手写汉字同名笔画提取方法。

所述技术领域的技术人员可以清楚的了解到,未描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实例中的对应过程,在此不再赘述。

下面参考图8,其示出了适于用来实现本申请系统、方法、设备实施例的服务器的计算机系统的结构示意图。图8示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图8所示,计算机系统包括中央处理单元(CPU,Central Processing Unit)801,其可以根据存储在只读存储器(ROM,Read Only Memory)802中的程序或者从存储部分808加载到随机访问存储器(RAM,Random Access Memory)803中的程序而执行各种适当的动作和处理。在RAM803中,还存储有系统操作所需的各种程序和数据。CPU801、ROM 802以及RAM803通过总线804彼此相连。输入/输出(I/O,Input/Output)接口805也连接至总线804。

以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管、液晶显示器等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如局域网卡、调制解调器等的网络接口卡的通讯部分809。通讯部分809经由诸如因特网的网络执行通讯处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通讯部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被CPU801执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、ROM、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言,如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网或广域网连接到用户计算机,或者可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

相关技术
  • 离线手写汉字同名笔画提取方法、系统、装置
  • 离线手写汉字同名笔画提取方法、系统、装置
技术分类

06120112940366