掌桥专利:专业的专利平台
掌桥专利
首页

一种用于题号自动识别的扫描识别方法及装置

文献发布时间:2023-06-19 13:46:35


一种用于题号自动识别的扫描识别方法及装置

技术领域

本发明涉及一种自动化阅卷领域,具体而言,涉及一种题号自动识别的扫描识别方法及装置。

背景技术

目前考试中使用的答题卡上,客观题题号的排序方式一般有两种,横向排序和纵向排序。客观题题号的排序方式并非固定统一的,存在两种不同的排序方式。为了适应这种情况,现在的扫描采集系统中制作扫描模板时,需要通过考务人员用肉眼人工来判断答题卡的客观题题号的排序方向是横向还是纵向。根据客观题题号的排序方向,考务人员制作相应的扫描模板。这种通过肉眼人工判断客观题题号排序方式且制作相应扫描模板的方式,效率不高,依赖于人工判断和检查,容易存在人为失误的现象和问题。

根据上述情况,如何快速准确来确定客观题排序方式,是目前在扫描采集技术上需要解决的问题。

发明内容

本申请提供了一种用于题号自动识别的扫描识别方法,包括:建立数字字符0-9的识别模板库,保存每个数字字符的模板特征分量;扫描空白作答的考生答题卡得到考生答题卡图像,并存储上述该考生答题卡图像;将上述考生答题卡图像进行灰度处理,转化为灰度图,再对灰度图进行二值化处理;在上述考生答题卡图像中用矩形方框框选出连读的客观题信息;裁切上述矩形方框内的图像,并识别上述矩形方框内的图像中的各个元素的类别和位置,识别出所有题号元素的数值;根据上述识别出的题号元素的数值,确定题号的排列方向。

在本申请一实施例中,所述建立数字字符0-9的识别模板库,保存每个数字字符的模板特征分量包括:对数字字符的印刷数字字体字符的图像进行灰度化处理,转换为灰度图,再对灰度图进行二值化处理,对灰度值满足预设条件的像素点,计为数值1,反之则计为数值0;将二值化处理好的数字图像进行分割,在水平和垂直方向上均等值分割,垂直方向等分c份,水平方向等分d份,划分为c*d份同等大小的矩形图像,c和d都为大于等于2的整数;根据分割的数字图像,计算数字图像中像素点数值1在各部分分割的矩形图像中的所占比例,并记为该数字图像的特征分量X=(X1,X2,X3,...,Xn),Xn代表其中一个矩形图像中像素点数值1所占的比例,n等于c*d;对0-9十个数字字符分别进行样品训练,计算每个数字各个样品的平均特征分量,将每个数字的平均特征分量作为每个数字字符的模板特征分量。

在本申请一实施例中,上述客观题信息包括:题号及题号右侧的矩形填涂点。

在本申请一实施例中,上述识别图像中的各个元素的类别和位置,通过数字轮廓和填涂点轮廓来识别出图像中各个元素的类别位置。

在本申请一实施例中,所述上述识别图像中的各个元素的类别和位置,通过题号与题号上下左右相邻的间距或同一个题目内各填涂点相邻间距来确定各个元素的类别、数量和位置。

在本申请一实施例中,所述识别出所有题号元素的数值,通过比较待识别题号元素的矩形图像的特征向量与0-9每个数字的模板特征分量的距离,距离越小近似度越高。

在本申请一实施例中,所述根据识别出的题号数值,确定题号的排列方向包括:定位上述考生答题卡左上角第一个题号,比较上述第一个题号右方数值和第一个题号下方数值的大小,如右方数值较小,则题号呈横向排列,如下方数值小,则题号纵向排列。

在本申请一实施例中,所述扫描识别方法,还包括将上述矩形方框内的图像中的各个元素的类别、数量和位置,上述识别出的所有以题号元素的数值,以及上述识别出的题号的排列方向保存到扫描模板信息中。

本申请揭示了,一种用于题号自动识别的扫描识别装置,包括:高速扫描仪,用于扫描考生答题卡,获取考生答题卡图像;图像处理模块,与上述高速扫描线连接,用于对上述考生答题卡图像进行二值化处理;框选标题模块,与上述图像处理模块连接,用于在上述考生答题卡图像中用矩形方框框选出连续的客观题信息;图像识别模块,与上述框选标题模块连接,用于裁切矩形方框框选出的图像,并识别图像中的各个元素的类别、数量和位置,识别出所有题号元素的数值;数字字符模板库,与上述图像识别模块连接,用于存储数字字符0-9的识别模板库;题号排列模块,与上述图像识别模块连接,用于根据识别出的题号数值,确定题号的排列方向。

在本申请一实施例中,所述客观题信息包括:题号和所述题号右侧的矩形填涂点。

在本申请一实施例中,所述图像识别模块,用于识别图像中的各个元素的类别和位置,可通过数字轮廓和填涂点轮廓来识别出图像中各个元素(题号和填涂点)的类别和位置。

在本申请一实施例中,所述上述识别图像中的各个元素的类别和位置,通过题号与题号上下左右相邻的间距或同一个题目内各填涂点相邻间距来确定各个元素的类别和位置。

在本申请一实施例中,所述用于题号自动识别的扫描识别装置,还包括扫描模板模块,与上述题号排列模块连接,用于存储扫描模板信息。

在本申请一实施例中,所述扫描模板信息包括:各个元素的类别、数量和位置,上述识别出的所以有题号元素的数值,以及上述识别出的题号的排列方向。

本发明专利提供了一种用于题号自动识别的扫描识别方法和装置,通过预先采集考生答题卡,基于数字字符模板库建立和数字符号特征选取,运用印刷体数字符号识别技术,自动识别出各个客观题题号,从而确定客观题的排序方式。无须大量的人工干预,而且能大大提高工作效率和准确率,有效保障了考试的严肃性、权威性、公正性,也保证了扫描工作的顺利进行。

为使本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。

图1是学生答题卡示意图。

图2是本申请实施例提供的一种用于题号自动识别的扫描识别装置示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

本申请揭示了一种题号自动识别的扫描识别方法,本申请一实施例中具体包括如下所述步骤。

步骤S100,建立数字字符0-9的识别模板库,保存每个数字字符的模板特征分量。

本申请一实施例中,建立数字字符0-9的识别模板库,可具体包括若干子步骤:

子步骤S101,数字图形化:对数字字符的印刷数字字体字符的图像进行灰度化处理,转换为灰度图,再对灰度图进行二值化处理,对灰度值满足预设条件的像素点,计为数值1,反之则计为数值0。

在本申请一实施例中,对灰度图进行二值化处理具体可通过im2bw(f,b)函数来实现,f为输入的图像像素点灰度值,b为所设阈值,将图像中的像素按灰度值分为大于等于b和小于b两类,b可例如为128。输出二值化图像为0的像素点,是对应于输入图像灰度值f小于阈值b的像素点。输出二值化图像为1的像素点,是对应于输入图像灰度值f大于等于阈值b的像素点。标题文字区域用数值1(白色区)表示,背景区域用数值0(黑色区)表示。

子步骤S102,数字图像分割:将二值化处理好的数字图像进行分割,在水平和垂直方向上均等值分割,垂直方向等分c份,水平方向等分d份,划分为c*d份同等大小的矩形图像,c和d都为大于等于2的整数。

在本申请一实施例中,c、d参数值可以根据业务情况进行调整,一般c值取2-4,d值取2。c和d的取值越大,正确识别字符的概率越高。假设c=2和d=2,那么数字图像分割成4(2*2)个矩形。

子步骤S103,特征选取:根据分割的数字图像,计算数字图像中像素点数值1在各部分分割的矩形图像中的所占比例,并记为该数字图像的特征分量X=(X1,X2,X3,...,Xn),Xn代表其中一个矩形图像中像素点数值1所占的比例,n等于c*d。

在本申请一实施例中,数字图像被分割成的各个矩形图像中“1”的个数作为该数字图像的特征分量,按照从左到右,从上到下的顺序,对各个矩形图像进行统计,并依次记录数值。

子步骤S104,样本预处理:对0-9十个数字字符分别进行样品训练,计算每个数字各个样品的平均特征分量,将每个数字的平均特征分量作为每个数字字符的模板特征分量。

在本申请一实施例中,对0-9十个数字字符分别进行样品训练,即依据上述子步骤S101、S102、S103,从而计算每个数字各个样品的平均特征分量。

在本申请一实施例中,子步骤S104可具体例如,将0-9十个数字对应的样品分为10个类别:N1,N2,N3,...,N10,分别对每个类别的样品进行训练,每类的样品数量较佳地为30个以上,依照上述子步骤S101-S104,得到每个样品图像的特征向量,计算每个类别各个样品的特征向量的平均值。根据前面若干数字图像样品,大致勾画出各个数字字符在特征空间的规律性,为后面的进一步计算提供参数信息。

步骤S200,扫描空白作答的考生答题卡得到考生答题卡图像,并存储该考生答题卡图像。

步骤S300,将考生答题卡标题图像进行灰度处理,转化为灰度图,再对灰度图进行二值化处理。

本步骤中,灰度处理和二值化处理可参照上述子步骤S201

步骤S400,在考生答题卡图像中用矩形方框框选出连续的客观题信息。

在本申请一实施例中,如图1所示,客观题信息至少包括题号和题号右侧的矩形填涂点。矩形填涂点的数量一般为4个,个别科目个别题目的矩形填涂点数量可能会高达8个。

步骤S500,裁切矩形方框框选出的图像,并识别图像中的各个元素的类别、数量和位置,识别出所有题号元素的数值。

在本申请一实施例中,所述图像中的各个元素包括题号及填涂点。

在本申请一实施例中,可以进一步对图像的上下左右的空白部分进行裁切,裁切方向为水平方向和垂直方向。

在本申请一实施例中,识别图像中的各个元素的类别和位置,可通过数字轮廓和填涂点轮廓来识别出图像中各个元素(题号和填涂点)的类别、数量和位置。另外,通常左上角的第一个元素是题号,题号与题号上下左右相邻的间距是固定值,同一个题目内各填涂点相邻间距是固定值,可通过这些一般特征来快速确定各个元素(题号和填涂点)的类别、数量和位置。

在本申请一实施例中,将识别出的题号元素依照矩形图像裁剪出来,得到待识别数字字符图像,然后对之进行上述子步骤S102和S103的处理,得到的待识别数字字符图像的特征向量表示为Y=(Y1,Y2,Y3,...,Yn),然后计算与数字字符模板库中每个字符类别特征向量X=(X1,X2,X3,...,Xn)的距离,比较待识别Y分别到0-9每个数字的模板特征分量X的距离Z。Zj=|X1-Y1|*|X2-Y2|*|X3-Y3|*...*|Xn-Yn|,j=0,1,2,3,...,9。计算出10个Z值,取其中的最小值,判断出与哪个类别的字符匹配率更高,进而识别出待识别Y的所属数字字符。通过这个方法,可进一步识别出所有题号元素的数值。

步骤S600,根据识别出的题号数值,确定题号的排列方向。

在本申请一实施例中,确定题号的排列方向,可以定位考生答题卡左上角第一个题号m,比较m的右方数值和m的下方数值的大小,如右方数值较小,则题号呈横向排列,如下方数值小,则题号呈纵向排列。

步骤S700,将上述矩形方框内的图像中的各个元素的类别、数量和位置,识别出的所有题号元素的数值,以及识别出的题号的排列方向保存到扫描模板信息中。

在本申请一实施例中,可将上述扫描模板信息存储到数据库服务器中,用于与待识别信息进行对比。

本申请揭示了一种用于题号自动识别的扫描识别装置,参阅图2,图2是本申请所揭示的扫描识别装置一实施例的示意图。

该扫描识别装置,包括高速扫描仪1,用于扫描考生答题卡,获取考生答题卡图像;图像处理模块2,与高速扫描线1连接,用于对考生答题卡图像进行二值化处理;框选标题模块3,与图像处理模块2连接,用于在考生答题卡图像中用矩形方框框选出连续的客观题信息;图像识别模块4,与框选标题模块3连接,用于裁切矩形方框框选出的图像,并识别图像中的各个元素的类别、数量和位置,识别出所有题号元素的数值;数字字符模板库5,与图像识别模块4连接,用于存储数字字符0-9的识别模板库;题号排列模块6,与图像识别模块4连接,用于根据识别出的题号数值,确定题号的排列方向。

在本申请一实施例中,上述扫描识别装置还包括:扫描模板模块7,与上述题号排列模块6连接,用于保存扫描模板信息。扫描模板信息可包括识别出的图像中各个元素的类别、数量和位置,题号数值、题号的排列方向等。扫描模板信息可用于与待识别信息进行对比。

在本申请一实施例中,框选标题模块3,用于在考生答题卡图像中用矩形方框框选出连续的客观题信息,客观题信息至少包括题号和题号右侧的矩形填涂点。矩形填涂点的数量一般为4个,个别科目个别题目的矩形填涂点数量可能会高达8个。

在本申请一实施例中,图像识别模块4用于裁切矩形方框框选出的图像,可以进一步对图像的上下左右的空白部分进行裁切,裁切方向为水平方向和垂直方向。

在本申请一实施例中,图像识别模块4识别图像中的各个元素的类别和位置,可通过数字轮廓和填涂点轮廓来识别出图像中各个元素(题号和填涂点)的类别和位置。另外,通常左上角的第一个元素是题号,题号与题号上下左右相邻的间距是固定值,同一个题目内各填涂点相邻间距是固定值,可通过这些一般特征来快速确定各个元素(题号和填涂点)的类别和位置。

在本申请一实施例中,图像识别模块4识别出所有题号元素的数值,可例如将识别出的题号元素依照矩形图像裁剪出来,得到待识别数字字符图像,然后对之进行上述子步骤S102和S103的处理,得到的待识别数字字符图像的特征向量表示为Y=(Y1,Y2,Y3,...,Yn),然后计算与数字字符模板库中每个字符类别特征向量X=(X1,X2,X3,...,Xn)的距离,比较待识别Y分别到0-9每个数字的模板特征分量X的距离Z。Zj=|X1-Y1|*|X2-Y2|*|X3-Y3|*...*|Xn-Yn|,j=0,1,2,3,...,9。计算出10个Z值,取其中的最小值,判断出与哪个类别的字符匹配率更高,进而识别出待识别Y的所属数字字符。通过这个方法,可进一步识别出所有题号元素的数值。

在本申请一实施例中,数字字符模板库5,用于存储数字字符0-9的识别模板库。存储数字字符0-9的识别模板库建立包括如下方式:

步骤S100,建立数字字符0-9的识别模板库。

本申请一实施例中,建立数字字符0-9的识别模板库,可具体包括若干子步骤:

子步骤S101,数字图形化:对数字字符的印刷数字字体字符的图像进行灰度化处理,转换为灰度图,再对灰度图进行二值化处理,对灰度值满足预设条件的像素点,计为数值1,反之则计为数值0。

在本申请一实施例中,具体可通过im2bw(f,b)函数来实现,f为输入的图像像素点灰度值,b为所设阈值,将图像中的像素按灰度值分为大于等于b和小于b两类。输出二值化图像为0的像素点,是对应于输入图像灰度值f小于阈值b的像素点。输出二值化图像为1的像素点,是对应于输入图像灰度值f大于等于阈值b的像素点。标题文字区域用数值1(白色区)表示,背景区域用数值0(黑色区)表示。

子步骤S102,数字图像分割:将二值化处理好的数字图像进行分割,在水平和垂直方向上均等值分割,垂直方向等分c份,水平方向等分d份,划分为c*d份同等大小的矩形图像,c和d都为大于等于2的整数。

在本申请一实施例中,c、d参数值可以根据业务情况进行调整,一般c值取2-4,d值取2。c和d的取值越大,正确识别字符的概率越高。假设c=2和d=2,那么数字图像分割成4(2*2)个矩形。

子步骤S103,特征选取:根据分割的数字图像,计算数字图像中像素点数值1在各部分分割的矩形图像中的所占比例,并记为该数字图像的特征分量X=(X1,X2,X3,...,Xn),Xn代表其中一个矩形图像中像素点数值1所占的比例,n等于c*d。

在本申请一实施例中,数字图像被分割成的各个矩形图像中“1”的个数作为该数字图像的特征分量,按照从左到右,从上到下的顺序,对各个矩形图像进行统计,并依次记录数值。

子步骤S104,样本预处理:对0-9十个数字字符分别进行样品训练,重复上述子步骤S101、S102、S103,计算每个数字各个样品的平均特征分量,将每个数字的平均特征分量作为每个数字的模板特征分量。

在本申请一实施例中,子步骤S104可具体例如,将0-9十个数字对应的样品分为10个类别:N1,N2,N3,...,N10,分别对每个类别的样品进行训练,每类的样品数量较佳地为30个以上,依照上述子步骤S101-S104,得到每个样品图像的特征向量,计算每个类别各个样品的特征向量的平均值。根据前面若干数字图像样品,大致勾画出各个数字字符在特征空间的规律性,为后面的进一步计算提供参数信息。

本发明专利提供了一种用于题号自动识别的扫描识别方法和装置,通过预先采集考生答题卡,基于数字字符模板库建立和数字符号特征选取,运用印刷体数字符号识别技术,自动识别出各个客观题题号,从而确定客观题的排序方式。无须大量的人工干预,而且能大大提高工作效率和准确率,有效保障了考试的严肃性、权威性、公正性,也保证了扫描工作的顺利进行。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种用于题号自动识别的扫描识别方法及装置
  • 一种激光扫描与自动识别雕刻字符的装置及识别方法
技术分类

06120113807173