掌桥专利:专业的专利平台
掌桥专利
首页

一种印刷品内容检错方法、装置、电子设备及介质

文献发布时间:2023-06-19 15:47:50



技术领域

本发明涉及计算机视觉处理技术领域,特别是涉及一种印刷品内容检错方法、装置、电子设备及介质。

背景技术

产品的各个零部件的标贴及说明书等印刷品种类繁多,主要记录了零部件的关键信息等内容,但上述印刷品在批量印刷的过程中,容易出现漏印、错印等问题,因此需要在印刷品印制完成后对印刷品内容进行校对检错。

目前对标贴和说明书等印刷品进行检错的方法主要是通过配备专职的校对人员,根据印刷品的初始电子文档对印刷内容进行逐行比对。但是,在使用现有技术过程中,发明人发现现有技术中至少存在如下问题:首先,对于校对人员的工作质量难以进行评估和监督;此外,不便于准确统计印刷品的良品率,同时统计难度较大;最后,在印刷品数量较多时,往往需要配备多个专职的校对人员,导致校对的人力成本较高。

发明内容

本发明旨在至少在一定程度上解决上述技术问题,本发明提供了一种印刷品内容检错方法、装置、电子设备及介质。

本发明采用的技术方案是:

第一方面,本发明提供了一种印刷品内容检错方法,包括:

获取待测印刷品对应的初始电子文档,并根据所述初始电子文档得到与所述待测印刷品对应的标准图像;

对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的待测图像;

将所述标准图像与所述待测图像进行对比检测,得到所述待测印刷品的检测结果;

根据与所述待测印刷品同一批次印刷品的所有检测结果,得到与所述待测印刷品同一批次印刷品的良品率。

本发明可实现对印刷品的自动检测,同时检测精度高,可有效节约人力成本。具体地,本发明在实施过程中,可通过获取待测印刷品对应的初始电子文档及与所述待测印刷品对应的标准图像,并通过对待测印刷品进行图像采集处理得到对应的待测图像,然后将所述标准图像与所述待测图像进行对比检测,得到所述待测印刷品的检测结果,最后基于根据与所述待测印刷品同一批次印刷品的所有检测结果,得到与所述待测印刷品同一批次印刷品的良品率。在此过程中,待测印刷品对应的标准图像及待测印刷品对应的待测图像均通过机器执行,然后基于机器实现自动检测,更为高效便捷,避免了人工校对造成的质量难以把控及检测准确度难以把控的问题,同时可有效节约人力成本。

在一个可能的设计中,获取待测印刷品对应的初始电子文档,并根据所述初始电子文档得到与所述待测印刷品对应的标准图像,包括:

获取待测印刷品对应的印刷品编号,并根据所述印刷品编号获取所述待测印刷品对应的初始电子文档;

对所述初始电子文档进行图像转换,得到与所述待测印刷品对应的标准图像。

在一个可能的设计中,对所述初始电子文档进行图像转换,得到与所述待测印刷品对应的标准图像,包括:

获取所述初始电子文档的格式类型,并根据以下步骤对不同类型的所述初始电子文档进行图像转换:

如所述初始电子文档为doc格式或docx格式,则使用pdfboss-word for Python将所述初始电子文档转换为pdf格式的数据,然后使用pdf2image将pdf格式的数据转换为图像格式的数据,得到与所述待测印刷品对应的标准图像;

如所述初始电子文档为pdf格式,则使用pdf2image库将所述初始电子文档转换为图像格式的数据,得到与所述待测印刷品对应的标准图像;

如所述初始电子文档为图像格式,则直接将所述初始电子文档输出为与所述待测印刷品对应的标准图像。

在一个可能的设计中,对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的待测图像,包括:

对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的图像采集信息;

对所述图像采集信息进行均值滤波,以便去除所述图像采集信息中的噪声数据,得到滤波后图像;

对所述滤波后图像进行轮廓提取处理,以便于去除所述滤波后图像中的背景图像数据,并得到与所述待测印刷品对应的目标轮廓图像;

对所述目标轮廓图像进行角度校正处理,得到校正后目标轮廓图像;

在所述图像采集信息中获取与所述校正后目标轮廓图像对应的像素信息,并根据所述校正后目标轮廓图像及与所述校正后目标轮廓图像对应的像素信息,得到待测图像。

在一个可能的设计中,所述目标轮廓图像为矩形图像;对所述目标轮廓图像进行角度校正处理,包括:

获取所述目标轮廓图像的顶点坐标,并根据所述目标轮廓图像的顶点坐标得到旋转角

其中,

根据旋转角

根据所述变换矩阵

其中,[

在一个可能的设计中,将所述标准图像与所述待测图像进行对比检测,包括:

分别计算所述标准图像与所述待测图像中每一像素点的灰度值,并根据所述标准图像与所述待测图像中的所有灰度值,得到与所述标准图像对应的第一灰度图以及与所述待测图像对应的第二灰度图;

分别对所述第一灰度图和所述第二灰度图进行区域划分,得到与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块;

将与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块一一进行对比检测,以便实现所述标准图像与所述待测图像的对比检测。

在一个可能的设计中,将与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块一一进行对比检测,包括:

获取所述第一灰度图指定区域的第一区块及所述第二灰度图指定区域的第二区块,采用归一化积相关灰度匹配的方法计算所述第一灰度图和所述第二灰度图之间的相似度,所述相似度为所述待测印刷品的检测结果;其中,所述相似度为:

其中,

第二方面,本发明提供了一种印刷品内容检错装置,用于实现如上述任一项所述的印刷品内容检错方法;所述印刷品内容检错装置包括:

标准图像获取模块:用于获取待测印刷品对应的初始电子文档,并根据所述初始电子文档得到与所述待测印刷品对应的标准图像;

待测图像获取模块,用于对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的待测图像;

图像检测模块,分别与所述标准图像获取模块和所述待测图像获取模块通信连接,用于将所述标准图像与所述待测图像进行对比检测,得到所述待测印刷品的检测结果;

良品率计算模块,与所述图像检测模块通信连接,用于根据与所述待测印刷品同一批次印刷品的所有检测结果,得到与所述待测印刷品同一批次印刷品的良品率。

第三方面,本发明提供了一种电子设备,包括:

存储器,用于存储计算机程序指令;以及,

处理器,用于执行所述计算机程序指令从而完成如上述任一项所述的印刷品内容检错方法的操作。

第四方面,本发明提供了一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,所述计算机程序指令被配置为运行时执行如上述任一项所述的印刷品内容检错方法的操作。

附图说明

图1是本发明中一种印刷品内容检错方法的流程图;

图2是本发明中一种印刷品内容检错方法的模块框图。

具体实施方式

下面结合附图及具体实施例来对本发明作进一步阐述。

应当理解,尽管本文可能使用术语第一、第二等等来描述各种单元,但是这些单元不应当受到这些术语的限制。这些术语仅用于区分一个单元和另一个单元。

应当理解,对于本文中可能出现的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B三种情况。

应当理解,还应当注意到在一些备选实施例中,所出现的功能/动作可能与附图出现的顺序不同。例如,取决于所涉及的功能/动作,实际上可以实质上并发地执行,或者有时可以以相反的顺序来执行连续示出的两个图。

实施例1:

本实施例第一方面提供了一种印刷品内容检错方法,可以但不限于由具有一定计算资源的计算机设备或虚拟机执行,例如由个人计算机、智能手机、个人数字助理或可穿戴设备等电子设备执行,或者由虚拟机执行,以便实现对印刷品的自动检测,提高检测效率和精度。

如图1所示,一种印刷品内容检错方法,可以但不限于包括有如下步骤:

S1.获取待测印刷品对应的初始电子文档,并根据所述初始电子文档得到与所述待测印刷品对应的标准图像;需要说明的是,本实施例中,所有待测印刷品对应的初始电子文档以及印刷品编号、产品型号等标识信息均预存在产品档案管理系统的服务器内,以作为对待测印刷品进行检错的标准信息。应当理解的是,待测印刷品对应的初始电子文档的格式与待测印刷品的格式保持一致,以便减小检测过程中计算机的运算工作量。

步骤S1中,获取待测印刷品对应的初始电子文档,并根据所述初始电子文档得到与所述待测印刷品对应的标准图像,包括:

S101.获取待测印刷品对应的印刷品编号,并根据所述印刷品编号获取所述待测印刷品对应的初始电子文档;具体地,印刷品编号可以通过用户根据预设的记录有印刷品特征及对应编号的操作手册获取,也可以通过用户从待测印刷品上预先印制的内容读取,此处不予限制,以便于计算机根据印刷品编号快速检索得到产品档案管理系统的服务器中预存的初始电子文档。

S102.对所述初始电子文档进行图像转换,得到与所述待测印刷品对应的标准图像。

步骤S102中,对所述初始电子文档进行图像转换,得到与所述待测印刷品对应的标准图像,包括:

获取所述初始电子文档的格式类型,并根据以下步骤对不同类型的所述初始电子文档进行图像转换:

如所述初始电子文档为doc格式或docx格式,则使用pdfboss-word for Python(一个功能丰富的Python库,用于创建和操作Word文档,还用于将DOCX和DOC文件高保真地转换为PDF格式文件)将所述初始电子文档转换为pdf格式的数据,然后使用pdf2image(为一种Python库,包括一个Python2.7和3.4+模块,其包装了pdftoppm和pdftocairo,可将PDF格式文件转换为图像文件)将pdf格式的数据转换为图像格式的数据,得到与所述待测印刷品对应的标准图像;

如所述初始电子文档为pdf格式,则使用pdf2image库将所述初始电子文档转换为图像格式的数据,得到与所述待测印刷品对应的标准图像;

如所述初始电子文档为图像格式,则直接将所述初始电子文档输出为与所述待测印刷品对应的标准图像。

S2.对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的待测图像。

步骤S2中,对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的待测图像,包括:

S201.对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的图像采集信息。

S202.对所述图像采集信息进行均值滤波,以便去除所述图像采集信息中的噪声数据,得到滤波后图像。具体地,本实施例中,对所述图像采集信息进行均值滤波时,可以但不仅限于通过blur函数(为OpenCV用于进行图像模糊处理的函数)实现,需要说明的是,blur函数可使用归一化的盒装滤波器对相应数据进行均值滤波处理,可以处理任意通道数的图片,适用范围较广。

S203.对所述滤波后图像进行轮廓提取处理,以便于去除所述滤波后图像中的背景图像数据,并得到与所述待测印刷品对应的目标轮廓图像;需要说明的是,本实施例中,目标轮廓图像为所述待测印刷品中,包括印刷内容且面积最小的外接轮廓图像。具体地,本实施例中,对所述滤波后图像进行轮廓提取处理时,可以但不仅限于通过findContours函数(一种可从二进制图像中查找图像轮廓的函数)实现。

S204.对所述目标轮廓图像进行角度校正处理,得到校正后目标轮廓图像;具体地,本实施例中,对所述目标轮廓图像进行角度校正时,可以但不仅限于使用开源计算机视觉算法库OpenCv(是一个基于Apache2.0许可而发行的跨平台计算机视觉和机器学习软件库),此处不予限制。

本实施例中,所述目标轮廓图像为矩形图像;对所述目标轮廓图像进行角度校正处理,包括:

S2041.获取所述目标轮廓图像的顶点坐标,并根据所述目标轮廓图像的顶点坐标得到旋转角

其中,

具体地,本实施例中,获取所述目标轮廓图像的顶点坐标时,可以但不仅限于boundingRect函数(一种用于得到包覆图像轮廓的最小正矩形的函数)实现。

S2042.根据旋转角

S2043.根据所述变换矩阵

其中,[

具体地,本实施例中,对所述目标轮廓图像进行旋转可以但不仅限于采用cvWarpAffine函数(为OpenCV用于对图像进行仿射变换的函数)实现。

S205.在所述图像采集信息中获取与所述校正后目标轮廓图像对应的像素信息,并根据所述校正后目标轮廓图像及与所述校正后目标轮廓图像对应的像素信息,得到待测图像。

具体地,在所述图像采集信息中获取与所述校正后目标轮廓图像对应的像素信息,并根据所述校正后目标轮廓图像及与所述校正后目标轮廓图像对应的像素信息,得到待测图像,包括:

S2051.根据所述校正后目标轮廓图像的顶点坐标,从所述图像采集信息中提取与所述校正后目标轮廓图像对应的像素信息。

S2052.将所述像素信息与所述校正后目标轮廓图像进行图像融合处理,得到待测图像。

需要说明的是,如与所述初始电子文档对应的标准图像中存在冗余的空白图像数据,则可将所述标准图像按照上述得到待测图像中轮廓提取处理及角度校正处理等处理流程,对所述标准图像进行处理,得到最终的标准图像,以便提高所述标准图像与所述待测图像进行对比检测的准确度。

应当理解的是,本实施例中,对步骤S1和步骤S2的执行顺序不予限定,即步骤S1先执行或步骤S2先执行均可,此处不予限制。

S3.将所述标准图像与所述待测图像进行对比检测,得到所述待测印刷品的检测结果。

步骤S3中,将所述标准图像与所述待测图像进行对比检测,包括:

S301.分别计算所述标准图像与所述待测图像中每一像素点的灰度值,并根据所述标准图像与所述待测图像中的所有灰度值,得到与所述标准图像对应的第一灰度图以及与所述待测图像对应的第二灰度图;具体地,所述第一灰度图或第二灰度图中,指定像素点的灰度值为:

其中,

S302.分别对所述第一灰度图和所述第二灰度图进行区域划分,得到与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块。

S303.将与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块一一进行对比检测,以便实现所述标准图像与所述待测图像的对比检测。本实施例中,使用计算机视觉算法将与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块一一进行对比检测。

还需要说明的是,本实施例中,对第一灰度图和第二灰度图进行区域划分后再对对应区块进行对比检测的设置,可便于提高对所述标准图像与所述待测图像进行对比检测的准确率。

具体地,本实施例中,对所述第一灰度图和第二灰度图进行区域划分时,基于所述第一灰度图和第二灰度图的尺寸确定各区域的大小,进而确定多个区块的宽高划分间隔数据,各区域的大小可根据用户需求确定,应保证在提高对比检测准确率的同时,避免计算机运算量无限增加的问题。

具体地,步骤S303中,将与所述第一灰度图对应的多个区块及与所述第二灰度图对应的多个区块一一进行对比检测,包括:

获取所述第一灰度图指定区域的第一区块及所述第二灰度图指定区域的第二区块,采用归一化积相关灰度匹配的方法计算所述第一灰度图和所述第二灰度图之间的相似度,所述相似度为所述待测印刷品的检测结果;其中,所述相似度为:

其中,

具体地,本实施例中,可以根据实际情况设置一相似度阈值,当相似度大于该相似度阈值时,判定待测印刷品检测合格,否则,判定待测印刷品检测不合格。本实施例中,在检测过程中,还可在待测印刷品指定区域与标准图像的相似度小于相似度阈值时,在该区域进行标注,以便用户快速确认待测印刷品中的不合格区域并进行查验。

本实施例中,将所述标准图像与所述待测图像进行对比检测时,所述方法还包括:

判断所述标准图像与所述待测图像的尺寸是否相同,如是,则对所述标准图像与所述待测图像进行对比检测;如否,则使用resize函数将所述标准图像的尺寸与所述待测图像的尺寸转化为相同尺寸,以保证检测区域对齐,然后将转换尺寸后的标准图像与待测图像进行对比检测。

S4.根据与所述待测印刷品同一批次印刷品的所有检测结果,得到与所述待测印刷品同一批次印刷品的良品率。

本实施例中,计算良品率的公式为

本实施例可实现对印刷品的自动检测,同时检测精度高,可有效节约人力成本。具体地,本实施例在实施过程中,可通过获取待测印刷品对应的初始电子文档及与所述待测印刷品对应的标准图像,并通过对待测印刷品进行图像采集处理得到对应的待测图像,然后将所述标准图像与所述待测图像进行对比检测,得到所述待测印刷品的检测结果,最后基于根据与所述待测印刷品同一批次印刷品的所有检测结果,得到与所述待测印刷品同一批次印刷品的良品率。在此过程中,待测印刷品对应的标准图像及待测印刷品对应的待测图像均通过机器执行,然后基于机器实现自动检测,更为高效便捷,避免了人工校对造成的质量难以把控及检测准确度难以把控的问题,同时可有效节约人力成本。

实施例2:

本实施例提供一种印刷品内容检错装置,用于实现实施例1中印刷品内容检错方法;所述印刷品内容检错装置包括:

标准图像获取模块:用于获取待测印刷品对应的初始电子文档,并根据所述初始电子文档得到与所述待测印刷品对应的标准图像;

待测图像获取模块,用于对所述待测印刷品进行图像采集处理,得到与所述待测印刷品对应的待测图像;

图像检测模块,分别与所述标准图像获取模块和所述待测图像获取模块通信连接,用于将所述标准图像与所述待测图像进行对比检测,得到所述待测印刷品的检测结果;

良品率计算模块,与所述图像检测模块通信连接,用于根据与所述待测印刷品同一批次印刷品的所有检测结果,得到与所述待测印刷品同一批次印刷品的良品率。

实施例3:

在实施例1或2的基础上,本实施例公开了一种电子设备,该设备可以是智能手机、平板电脑、笔记本电脑或者台式电脑等。电子设备可能被称为用于终端、便携式终端、台式终端等,电子设备包括:

存储器,用于存储计算机程序指令;以及,

处理器,用于执行所述计算机程序指令从而完成如实施例1中任一所述的印刷品内容检错方法的操作。

实施例4:

在实施例1至3任一项实施例的基础上,本实施例公开了一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,所述计算机程序指令被配置为运行时执行如实施例1所述的印刷品内容检错方法的操作。

需要说明的是,所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是,本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

技术分类

06120114582472