掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明属于印章识别方法技术领域,具体是指一种基于迁移学习的印章识别方法。

背景技术

随着大数据时代的到来,人们可以更加容易地获得大量数据。此外,由于机器学习领域不断的发展,如何让计算机具有举一反三的能力,如何使大量数据可以更好地发挥作用,这些问题均变得非常实际和有价值。为了解决这些问题,迁移学习被提出并越来越受到人们的重视。

而在对交易票据的识别技术中,对于印章的识别是其中比较关键的一环。对于印章真伪识别,通常采用图形对比的方式,例如将印章图形折叠比对或者电子图形分析比对等方式。

目前银行使用的印章识别方法多是手工操作,将支票上的印章与客户留下的原始印章像进行手工折角比对,这种原始比对方法有人为因素多、准确性差、工作量大等缺点。且传统的将印章图形折叠比对和现在的电子图形分析比对均存在一定比率的失误率,如果图形比对要求严格,则真假印章都无法通过验证,如果比对要求宽松则真假印章都可以通过验证,不方便且不利于对印章进行精确的识别。

发明内容

针对上述情况,为克服现有技术的缺陷,本发明提供了一种通过对带有背景色的印章图像进行颜色模型提取方法以及膨胀腐蚀方法,能够提高原始印章图像识别的准确度,训练集、验证集和测试集的划分可以有效提升深度神经网络训练的效果,提高训练的效率,增加识别的准确性的基于迁移学习的印章识别方法。

本发明采取的技术方案如下:本发明一种基于迁移学习的印章识别方法,包括以下步骤:

S1印章图像收集:收集客户的印章图像,并将印章图像扫描入计算机内;

S2构建原始印章图像数据库:判断所述步骤S1中的印章图像是否包含除原始印章外的背景图像,如果包含背景图像则对印章图像进行预处理,再将预处理后形成的原始印章图像构建入原始印章图像数据库内,如果不包含背景图像则直接将印章图像存入原始印章图像数据库内,原始印章图像数据库内包含原始印章图像数据;

S3训练阶段:获取基于卷积神经网络的预训练模型,将原始印章图像数据库作为预训练模型的输入并对预训练模型进行训练,训练构建出基于卷积神经网络的分类器,使用与所述预训练模型的输出更新所述分类器;

S4识别阶段:用步骤S3选出的分类器进行印章识别,从而获得识别的结果。

进一步地,所述步骤S1中通过相机或扫描仪对印章图像进行拍照或扫描,获得印章图像数据。

进一步地,所述步骤S2中预处理包括RGB颜色模型提取方法和二值化膨胀腐蚀方法,所述RGB颜色模型提取方法用于处理红色印章图像,所述二值化膨胀腐蚀方法用于处理蓝色印章图像。

进一步地,所述步骤S3的具体步骤包括:

(1)首先将原始印章图像数据集划分为训练集、验证集和测试集,将训练集的图片输入到预训练模型中,每张图片经过预训练模型中的各个卷积层和池化层后得到多个特征图,这些特征图再经过各个全连接层得到预测结果;

(2)然后用交叉熵函数评价预测结果和真实值之间的差距,对训练集中的每张图片都重复上述步骤,在这个过程中,每次都用梯度下降法对模型的一个或几个全链接层参数进行优化更新,所有的训练图片样本都输入过该网络为一次网络的更新;

(3)每次网络更新后,用验证集去计算准确率,选出准确率最高的模型得到一个分类器;

(4)多次步骤即可得到多个分类器,再用测试集验证各个分类器的准确率,然后选出准确率最高的分类器。

进一步地,所述RGB颜色模型提取方法以下步骤:

(1)提取印章图像;若印章图像的像素值中Red大于100,且像素值Red与Blue、以及Red与Green之差均大于45,则认为该像素点为有效印章颜色,即红色;若三种分量值之和大于540,则认为该像素点为正常背景色;除上述两种情况之外的像素点为背景干扰色;

(2)采用Hough变化和中值过滤法除去印章图像上的噪声信息,获取原始印章图像。

进一步地,所述二值化膨胀腐蚀方法包括以下步骤:

(1)将印章图像进行二值化处理后,计算印章图像中的背景标识离散点,获取所述背景标识离散点的图像帧,并对所述背景标识离散点的图像帧进行反复膨胀,得到边沿连续的图像;

(2)对经所述反复膨胀后的图像进行多次腐蚀;对经所述腐蚀后的图像进行背景去除,标识出封闭边沿的目标,即可得到原始印章图像。

采用上述方案本发明取得的有益效果如下:本方案一种基于迁移学习的印章识别方法,通过对带有背景色的印章图像进行颜色模型提取方法以及膨胀腐蚀方法,能够提高原始印章图像识别的准确度,可以有效提升深度神经网络训练的效果,提高训练的效率,增加识别的准确性。

附图说明

图1为本发明一种基于迁移学习的印章识别方法的整理流程结构图。

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。

具体实施方式

下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明一种基于迁移学习的印章识别方法,包括以下步骤:

S1印章图像收集:收集客户的印章图像,并将印章图像扫描入计算机内;

S2构建原始印章图像数据库:判断所述步骤S1中的印章图像是否包含除原始印章外的背景图像,如果包含背景图像则对印章图像进行预处理,再将预处理后形成的原始印章图像构建入原始印章图像数据库内,如果不包含背景图像则直接将印章图像存入原始印章图像数据库内,原始印章图像数据库内包含原始印章图像数据;

S3训练阶段:获取基于卷积神经网络的预训练模型,将原始印章图像数据库作为预训练模型的输入并对预训练模型进行训练,训练构建出基于卷积神经网络的分类器,使用与所述预训练模型的输出更新所述分类器;

S4识别阶段:用步骤S3选出的分类器进行印章识别,从而获得识别的结果。

其中,所述步骤S1中通过相机或扫描仪对印章图像进行拍照或扫描,获得印章图像数据。

所述步骤S2中预处理包括RGB颜色模型提取方法和二值化膨胀腐蚀方法,所述RGB颜色模型提取方法用于处理红色印章图像,所述二值化膨胀腐蚀方法用于处理蓝色印章图像。

所述步骤S3的具体步骤包括:

(1)首先将原始印章图像数据集划分为训练集、验证集和测试集,将训练集的图片输入到预训练模型中,每张图片经过预训练模型中的各个卷积层和池化层后得到多个特征图,这些特征图再经过各个全连接层得到预测结果;

(2)然后用交叉熵函数评价预测结果和真实值之间的差距,对训练集中的每张图片都重复上述步骤,在这个过程中,每次都用梯度下降法对模型的一个或几个全链接层参数进行优化更新,所有的训练图片样本都输入过该网络为一次网络的更新;

(3)每次网络更新后,用验证集去计算准确率,选出准确率最高的模型得到一个分类器;

(4)多次步骤即可得到多个分类器,再用测试集验证各个分类器的准确率,然后选出准确率最高的分类器。

所述RGB颜色模型提取方法以下步骤:

(1)提取印章图像;若印章图像的像素值中Red大于100,且像素值Red与Blue、以及Red与Green之差均大于45,则认为该像素点为有效印章颜色,即红色;若三种分量值之和大于540,则认为该像素点为正常背景色;除上述两种情况之外的像素点为背景干扰色;

(2)采用Hough变化和中值过滤法除去印章图像上的噪声信息,获取原始印章图像。

所述二值化膨胀腐蚀方法包括以下步骤:

(1)将印章图像进行二值化处理后,计算印章图像中的背景标识离散点,获取所述背景标识离散点的图像帧,并对所述背景标识离散点的图像帧进行反复膨胀,得到边沿连续的图像;

(2)对经所述反复膨胀后的图像进行多次腐蚀;对经所述腐蚀后的图像进行背景去除,标识出封闭边沿的目标,即可得到原始印章图像。

在训练阶段,训练时间可以大幅缩短,250~300s内即可完成相应的训练,并且分类器在识别中的表现良好,准确率达到了85%以上,通过不同颜色公章表现的图像特征不同,分别使用颜色模型提取的方法与膨胀腐蚀的方法,增加了原始公章识别的准确性。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 一种基于迁移学习的印章识别方法
  • 一种基于主动迁移学习的微表情识别方法
技术分类

06120113115964