一种字符识别方法、装置及电子设备

文献发布时间：2023-06-19 10:43:23

技术领域

本发明涉及图像识别技术领域，特别是涉及一种字符识别方法、装置及电子设备。

背景技术

图像识别领域中，图像中字符的识别通常是通过人工的方式来进行的。比如，在目前考试所使用的答题卡中，客观题题号的排序方式一般有两种：横向排序和纵向排序；为了适应这两种排序方式，考务人员在制作答题卡客观题答案的模板之前，通常需要以人工的方式来识别客观题的题号，进而确定题号的排序方式，并按照确定好的排序方式来制作答题卡正确答案的模板。

由于人工识别的方式效率不高，因而，图像中字符的识别逐渐成为开发人员所关注的问题。

发明内容

本发明实施例的目的在于提供一种字符识别方法、装置及电子设备，以实现自动识别图像中包含的字符。具体技术方案如下：

本发明实施的一方面，提供了一种字符识别方法，所述方法包括：

获取待识别的字符图像；

将所述字符图像转化为灰度图，并对所述灰度图进行二值化处理得到二值化图像；

根据所述二值化图像包含的各个像素点的像素值，及预设的像素值策略判定得到目标图像；

将所述目标图像与预设的标准字符模型进行匹配比较相似度，确定相似度最高的所述标准字符模型为目标字符模型；

将所述目标字符模型作为所述目标图像中待识别字符的识别结果。

可选的，所述获取待识别的字符图像的步骤，包括：

对答题卡进行扫描得到答题卡图像；

按照预设的图像裁切策略对所述答题卡图像进行图像裁切得到待识别的字符图像。

可选的，所述根据所述二值化图像包含的各个像素点的像素值，及预设的像素值策略判定得到目标图像的步骤，包括：

识别所述二值化图像中不包含用于构成所述字符图像中待识别字符的像素点的目标像素行和目标像素列；

对所述二值化图像中确定的所述目标像素行和目标像素列进行裁切，裁切后剩余的图像区域作为所述目标图像。

可选的，所述将所述目标图像与预设的标准字符模型进行匹配比较相似度，确定相似度最高的所述标准字符模型为目标字符模型的步骤，包括：

按照所述标准字符模型的尺寸调整所述目标图像的尺寸得到调整图像；

计算所述调整图像与各个所述标准字符模型中，对应坐标处像素点的像素值差值，并计算各个所述像素值差值的绝对值的和值；

将得到的所述和值按从小到大的顺序排序，并顺序选择一个所述和值对应的标准字符模型，作为最高相似度的标准字符模型，并确定为目标字符模型。

可选的，还包括：

在所述目标字符模型中的预设位置处绘制校验直线；

统计所述校验直线与字符像素点之间交点的数量，作为所述目标字符模型的校验特征；

在最高相似度的所述标准字符模型中，与所述目标字符模型对应的预设位置处绘制基准直线；

统计所述基准直线与字符像素点之间交点的数量，作为所述标准字符模型的基准特征；

确定所述校验特征与所述基准特征相同时，确认所述目标字符模型。

可选的，所述方法还包括：

根据所述待识别字符在对应字符图像中的位置，拼接回原字符图像中；

根据每一所述待识别字符的识别结果，以及数字字符间的距离，确定所述字符图像的排序。

本发明实施的又一方面，还提供了一种字符识别装置，所述装置包括获取模块、转化模块、识别模块、判定模块及确认模块；其中，

所述获取模块，与所述转化模块相连接，用于获取待识别的字符图像；

所述转化模块，与所述获取模块及识别模块相连接，用于将所述字符图像转化为灰度图，并对所述灰度图进行二值化处理得到二值化图像；

所述识别模块，与所述转化模块及判定模块相连接，用于根据所述二值化图像包含的各个像素点的像素值，及预设的像素值策略判定得到目标图像；

所述判定模块，与所述识别模块及确认模块相连接，用于将所述目标图像与预设的标准字符模型进行匹配比较相似度，确定相似度最高的所述标准字符模型为目标字符模型；

所述确认模块，与所述判定模块相连接，用于将所述目标字符模型作为所述目标图像中待识别字符的识别结果。

可选的，所述获取模块，具体用于

对答题卡进行扫描得到答题卡图像；

按照预设的图像裁切策略对所述答题卡图像进行图像裁切得到待识别的字符图像。

可选的，所述识别模块，具体用于

识别所述二值化图像中不包含用于构成所述字符图像中待识别字符的像素点的目标像素行和目标像素列；

对所述二值化图像中确定的所述目标像素行和目标像素列进行裁切，裁切后剩余的图像区域作为所述目标图像。

可选的，判定模块，还用于

按照所述标准字符模型的尺寸调整所述目标图像的尺寸得到调整图像；

计算所述调整图像与各个所述标准字符模型中，对应坐标处像素点的像素值差值，并计算各个所述像素值差值的绝对值的和值；

将得到的所述和值按从小到大的顺序排序，并顺序选择一个所述和值对应的标准字符模型，作为最高相似度的标准字符模型，并确定为目标字符模型。

可选的，所述装置还包括：

第一绘制模块，用于在所述目标字符模型中的预设位置处绘制校验直线；

第一统计模块，用于统计所述校验直线与字符像素点之间交点的数量，作为所述目标字符模型的校验特征；

第二绘制模块，用于在最高相似度的所述标准字符模型中，与所述目标字符模型对应的预设位置处绘制基准直线；

第二统计模块，统计所述基准直线与字符像素点之间交点的数量，作为所述标准字符模型的基准特征；

所述确认模块，还用于确定所述校验特征与所述基准特征相同时，确认所述目标字符模型。

可选的，所述装置还包括：

排序模块，用于根据所述待识别字符在对应字符图像中的位置，拼接回原字符图像中；

根据每一所述待识别字符的识别结果，以及数字字符间的距离，确定所述字符图像的排序。

本发明实施的又一方面，还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放处理器可执行指令；

处理器，用于执行存储器上所存放的指令时，实现上述任一项所述的字符识别方法。

本发明实施例提供的字符识别方法、装置及电子设备，可以在获取待识别的字符图像之后，将字符图像转化为灰度图，并对灰度图进行二值化处理得到二值化图像，并根据二值化图像包含的各个像素点的像素值，识别字符图像中待识别字符所在的图像区域，作为目标图像；将目标图像与预设字符模型进行匹配，确定目标字符模型；进而将目标字符模型所表征的字符作为针对字符图像中待识别字符的识别结果。应用本发明实施例提供的方案，能够利用预设字符模型来自动识别图像中的待识别字符，而无需人工来识别图像中的待识别字符，提高识别效率，降低人工成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种字符识别方法的流程示意图；

图2为本发明实施例提供的一种字符识别装置的结构示意图；

图3为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，是本发明实施例提供的一种字符识别方法的流程示意图，该方法包括：

S100，获取待识别的字符图像。

其中，每一字符图像中包含一个待识别字符；

在实施中，一张图像中通常会包含多个待识别字符，而为了方便识别则可以将图像中的每一个字符截取出来依次进行识别。

具体的，可以对答题卡进行扫描得到答题卡图像；按照预设的图像裁切策略对所述答题卡图像进行图像裁切得到待识别的字符图像。

以答题卡为例，可以分别获取每一个序号的坐标，然后将每一个序号所处的图像区域截取出来，分别作为一个待识别的字符图像。

S110，将字符图像转化为灰度图，并对灰度图进行二值化处理得到二值化图像。

S120，根据二值化图像包含的各个像素点的像素值，及预设的像素值策略判定得到目标图像。

在实施中，为了进一步精确待识别字符在字符图像中的区域，可以识别二值化图像中不包含用于构成所述字符图像中待识别字符的像素点的目标像素行和目标像素列；由于二值化图像中像素点的像素值只有0和255，那么，目标像素行和目标像素列也就是整行像素点或整列像素点中的所有像素点的像素值均为255。

之后对二值化图像中确定的目标像素行和目标像素列进行裁切，裁切后剩余的图像区域作为所述目标图像。

一种实现方式中，在得到目标图像的过程中，可以通过左右裁切和上下裁切两个过程来实现：

具体的，左右裁切：从二值化图像的左上角第一列开始，从左往右逐列扫描，当遇到整列像素点的像素值为255时，记录该列号sCol1，继续扫描直到遇到整列有像素值为0的像素点时，记录列号eCol1，sCol1与eCol1之间的区间图像裁切掉，完成左侧部分的图像裁切。然后从二值化图像的右上角第一列开始，从右往左逐列扫描，当遇到整列像素点的像素值为255时，记录该列号sCol2，继续扫描直到遇到整列有像素值为0的像素点时，记录列号eCol2，sCol2与eCol2之间的区间图像裁切掉，完成右侧部分的图像裁切。

上下裁切：将左右裁切后，再对图像进行上下裁切，从二值化图像左上角开始向下逐行扫描，当遇到整行像素点的像素值为255时，记录该行号sRow1，继续扫描直到遇到整行有像素值为0的像素点时，记录行号eRow1，sRow1与eRow1之间的区间图像裁切掉，完成上侧部分的图像裁切。然后从图像左下角第一行开始向上逐行扫描，当遇到整行像素点的像素值为255时，记录该行号sRow2，继续扫描直到遇到整行有像素值为0的像素点时，记录行号eRow2，sRow2与eRow2之间的区间图像裁切掉，完成下侧部分的图像裁切。

以上所列举的得到目标图像的实现方式，仅为众多实现方式中的一种，而不难理解的是，从上下左右四个方向中任意一个方向开始扫描并进行裁切均能得到目标图像。此外，还可以直接扫描二值化图像中包含像素点像素值为0的像素行和像素列，裁切出扫描到的像素行和像素列来得到目标图像。

S130，将目标图像与预设的标准字符模型进行匹配比较相似度，确定相似度最高的标准字符模型为目标字符模型。

其中，目标字符模型为预设字符模型中与目标图像中待识别字符之间相似度最高的字符模型；

在实施中，为了方便匹配和提高匹配的准确性，需要按照标准字符模型的尺寸调整目标图像的尺寸得到调整图像；

计算调整图像与各个标准字符模型中，对应坐标处像素点的像素值差值，并计算各个像素值差值的绝对值的和值；

将得到的和值按从小到大的顺序排序，并顺序选择一个和值对应的标准字符模型，作为最高相似度的标准字符模型，并确定为目标字符模型。

S140，将目标字符模型作为目标图像中待识别字符的识别结果。

在实施中，为了增加识别的准确性，在确定识别结果之前，可以在目标字符模型中的预设位置处绘制校验直线；

比如，预设位置可以为水平方向字符图像的1/3处和2/3处，竖直方向字符图像的1/2处。

统计校验直线与字符像素点之间交点的数量，作为目标字符模型的校验特征；字符像素点即是字符中黑色像素点。

比如，字符为“8”时，在上述预设位置做直线得到的交点数量分别为2、2、3，也就是7个交点。

并以相同的统计方式，在最高相似度的所述标准字符模型中，与目标字符模型对应的预设位置处绘制基准直线；

统计基准直线与字符像素点之间交点的数量，作为标准字符模型的基准特征；

确定校验特征与基准特征相同时，则可以认为识别结果是准确的，可以将目标字符模型所表征的字符作为针对目标图像中待识别字符的识别结果。

在实施中，得到了图像中各个待识别字符的识别结果之后，可以待识别字符在对应字符图像中的位置，拼接回原字符图像中；根据每一待识别字符的识别结果，以及数字字符间的距离，确定字符图像的排序。

比如，继续以答题卡为例，当识别出各个客观题的序号之后，根据各个序号在答题卡中的位置还原出各个序号在答题卡中的位置关系，进而确定序号的排序。

应用本发明实施例提供的方案，能够利用预设字符模型来自动识别图像中的待识别字符，而无需人工来识别图像中的待识别字符，提高识别效率，降低人工成本。

参见图2，为本发明实施例提供的一种字符识别装置的结构示意图，该装置包括：获取模块200、转化模块210、识别模块220、判定模块230及确认模块240；其中，

所述获取模块200，与所述转化模块210相连接，用于获取待识别的字符图像；

所述转化模块210，与所述获取模块200及识别模块220相连接，用于将所述字符图像转化为灰度图，并对所述灰度图进行二值化处理得到二值化图像；

所述识别模块220，与所述转化模块210及判定模块230相连接，用于根据所述二值化图像包含的各个像素点的像素值，及预设的像素值策略判定得到目标图像；

所述判定模块230，与所述识别模块220及确认模块240相连接，用于将所述目标图像与预设的标准字符模型进行匹配比较相似度，确定相似度最高的所述标准字符模型为目标字符模型；

所述确认模块240，与所述判定模块230相连接，用于将所述目标字符模型作为所述目标图像中待识别字符的识别结果。

可选的，所述获取模块200，具体用于

对答题卡进行扫描得到答题卡图像；

按照预设的图像裁切策略对所述答题卡图像进行图像裁切得到待识别的字符图像。

可选的，所述识别模块220，具体用于

识别所述二值化图像中不包含用于构成所述字符图像中待识别字符的像素点的目标像素行和目标像素列；

对所述二值化图像中确定的所述目标像素行和目标像素列进行裁切，裁切后剩余的图像区域作为所述目标图像。

可选的，判定模块230，还用于

按照所述标准字符模型的尺寸调整所述目标图像的尺寸得到调整图像；

计算所述调整图像与各个所述标准字符模型中，对应坐标处像素点的像素值差值，并计算各个所述像素值差值的绝对值的和值；

将得到的所述和值按从小到大的顺序排序，并顺序选择一个所述和值对应的标准字符模型，作为最高相似度的标准字符模型，并确定为目标字符模型。

可选的，所述装置还包括：

第一绘制模块，用于在所述目标字符模型中的预设位置处绘制校验直线；

第一统计模块，用于统计所述校验直线与字符像素点之间交点的数量，作为所述目标字符模型的校验特征；

第二绘制模块，用于在最高相似度的所述标准字符模型中，与所述目标字符模型对应的预设位置处绘制基准直线；

第二统计模块，统计所述基准直线与字符像素点之间交点的数量，作为所述标准字符模型的基准特征；

所述确认模块240，还用于确定所述校验特征与所述基准特征相同时，确认所述目标字符模型。

可选的，所述装置还包括：

排序模块，用于根据所述待识别字符在对应字符图像中的位置，拼接回原字符图像中；

根据每一所述待识别字符的识别结果，以及数字字符间的距离，确定所述字符图像的排序。

本发明实施例还提供了一种电子设备，如图3所示，包括处理器001、通信接口002、存储器003和通信总线004，其中，处理器001，通信接口002，存储器003通过通信总线004完成相互间的通信，

存储器003，用于存放处理器可执行指令；

处理器001，用于执行存储器003上所存放的指令时，实现上述任一项所述的字符识别方法，该方法包括：

获取待识别的字符图像；

将所述字符图像转化为灰度图，并对所述灰度图进行二值化处理得到二值化图像；

根据所述二值化图像包含的各个像素点的像素值，及预设的像素值策略判定得到目标图像；

将所述目标图像与预设的标准字符模型进行匹配比较相似度，确定相似度最高的所述标准字符模型为目标字符模型；

将所述目标字符模型作为所述目标图像中待识别字符的识别结果。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置电子设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：陈超鸿;邱伟杰;胡永松;钟胜根;
专利申请人：广东德诚大数据科技有限公司;

上一篇：一种基于大数据的数据访问权限控制的方法
下一篇：零序电流互感器及漏电断路系统