掌桥专利:专业的专利平台
掌桥专利
首页

一种英语听写批改方法、装置和电子设备

文献发布时间:2023-06-19 12:05:39


一种英语听写批改方法、装置和电子设备

技术领域

本发明涉及计算机技术领域,具体而言,涉及一种英语听写批改方法、装置和电子设备。

背景技术

目前,英语是当今教育的一门重要学科,单词和词组是英语最基础的知识,对学生的要求都必须达到会读会写会用以及理解中英文意义的程度,所以在单词词组的教学中,听写是必不可少的作业步骤。然而班级学生众多,老师只有一个,造成批改的任务量大而且繁重。

发明内容

为解决上述问题,本发明实施例的目的在于提供一种英语听写批改方法、装置和电子设备。

第一方面,本发明实施例提供了一种英语听写批改方法,包括:

获取学生上传的英语听写文本图像,所述英语听写文本图像,包括:英语听写单词和英语听写词组、以及听写标识;

根据所述听写标识,查询出所述英语听写文本图像的参考答案列表,其中,参考答案列表包括英语听写的各答案;

对所述英语听写文本图像进行文本检测处理和文本识别处理,得到所述英语听写文本图像中的单词和所述单词的位置信息;

分析所述参考答案列表中各答案的单词数量,将单词数量为1的答案确定为单词参考答案,将所述单词参考答案放置到单词答案列表中,并将单词数量大于1的答案确定为词组参考答案,将所述词组参考答案放置到词组答案列表中;

基于所述单词的位置信息,确定出显示方向上所述单词的相邻单词,并建立多个单词与单词的相邻单词的关联关系,并将未建立关联关系的单词作为所述单词参考答案的候选相似单词;其中,一个关联关系中的单词组成一个词组;

获取所述词组答案列表中词组参考答案中的第一个单词,计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度;

将具有所述英语听写文本图像中与所述词组答案列表中各词组参考答案中的第一个单词的文本相似度大于相似度阈值的单词的关联关系对应的词组分别确定为各词组参考答案的相似候选词组;

计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度,并将计算得到最大第一相似度的相似候选词组确定为学生输入的英语听写词组;

计算多个候选相似单词中各候选相似单词与单词参考答案的第二相似度,并将计算得到最大第二相似度的候选相似单词确定为学生输入的英语听写单词;

根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改。

第二方面,本发明实施例还提供了一种英语听写批改装置,包括:

获取模块,用于获取学生上传的英语听写文本图像,所述英语听写文本图像,包括:英语听写单词和英语听写词组、以及听写标识;

查询模块,用于根据所述听写标识,查询出所述英语听写文本图像的参考答案列表,其中,参考答案列表包括英语听写的各答案;

处理模块,用于对所述英语听写文本图像进行文本检测处理和文本识别处理,得到所述英语听写文本图像中的单词和所述单词的位置信息;

分析模块,用于分析所述参考答案列表中各答案的单词数量,将单词数量为1的答案确定为单词参考答案,将所述单词参考答案放置到单词答案列表中,并将单词数量大于1的答案确定为词组参考答案,将所述词组参考答案放置到词组答案列表中;

第一确定模块,用于基于所述单词的位置信息,确定出显示方向上所述单词的相邻单词,并建立多个单词与单词的相邻单词的关联关系,并将未建立关联关系的单词作为所述单词参考答案的候选相似单词;其中,一个关联关系中的单词组成一个词组;

第一计算模块,用于获取所述词组答案列表中词组参考答案中的第一个单词,计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度;

第二确定模块,用于将具有所述英语听写文本图像中与所述词组答案列表中各词组参考答案中的第一个单词的文本相似度大于相似度阈值的单词的关联关系对应的词组分别确定为各词组参考答案的相似候选词组;

第二计算模块,用于计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度,并将计算得到最大第一相似度的相似候选词组确定为学生输入的英语听写词组;

第三计算模块,用于计算多个候选相似单词中各候选相似单词与单词参考答案的第二相似度,并将计算得到最大第二相似度的候选相似单词确定为学生输入的英语听写单词;

批改模块,用于根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改。

第三方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。

第四方面,本发明实施例还提供了一种电子设备,所述电子设备包括有存储器,处理器以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由所述处理器执行上述第一方面所述的方法的步骤。

本发明实施例上述第一方面至第四方面提供的方案中,根据参考答案中的词组参考答案和单词参考答案,对所述英语听写文本图像中的单词进行分析,将位置相邻的单词合并,得到词组参考答案的相似候选词组,然后对词组参考答案的相似候选词组进行处理得到学生输入的英语听写词组,以此对学生的英语听写文本图像进行批改,从而利用将位置相邻的单词合并的方式,得到词组参考答案的相似候选词组,可以在批改英语听写文本时,提高词组的识别率和批改的准确率。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本发明实施例1所提供的一种英语听写批改方法的流程图;

图2示出了本发明实施例2所提供的一种英语听写批改装置的结构示意图;

图3示出了本发明实施例3所提供的一种电子设备的结构示意图。

具体实施方式

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

目前,众所周知,英语是教育的一门重要学科,单词和词组是英语最基础的组成部分,对学生的要求都必须达到会读会写会用以及理解中英文意义的程度,所以在单词和词组的教学中,听写是必不可少的作业步骤。然而班级学生众多,但英语老师数量少,造成批改的任务量大而且繁重。

本申请提出的一种英语听写批改方法、装置和电子设备,主要是解决减少老师的作业批改的大量时间,将这些重复的工作用自动化处理,如:将学生的作业拍照批量上传手机端,到达服务器后经过与答案对比进行批改,返回给学生所做作业的批改效果,简单而高效,且不会出现失误的情况。

基于此,本申请以下各实施例提出一种英语听写批改方法、装置和电子设备,根据参考答案中的词组参考答案和单词参考答案,对所述英语听写文本图像中的单词进行分析,将位置相邻的单词合并,得到词组参考答案的相似候选词组,然后对词组参考答案的相似候选词组进行处理得到学生输入的英语听写词组,以此对学生的英语听写文本图像进行批改,从而利用将位置相邻的单词合并的方式,得到词组参考答案的相似候选词组,可以在批改英语听写文本时,提高词组的识别率和批改的准确率。

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请做进一步详细的说明。

实施例1

本实施例提出一种英语听写批改方法,执行主体是服务器。

所述服务器,与图像采集设备连接。

参见图1所示的一种英语听写批改方法,本实施例提出一种英语听写批改方法,包括以下具体步骤:

步骤100、获取学生上传的英语听写文本图像,所述英语听写文本图像,包括:英语听写单词和英语听写词组、以及听写标识。

在上述步骤100中,学生在完成英语听写作业后,就会得到英语听写文本,然后,利用与所述服务器连接的图像采集设备采集所述英语听写文本的英语听写文本图像。所述图像采集设备在采集到所述英语听写文本图像后,提示学生输入学生姓名和所在班级,并将所述学生输入的学生姓名和所在班级作为听写标识设置在英语听写文本图像中,然后将携带有听写标识的英语听写文本图像上传至所述服务器,使得所述服务器获取到所述学生上传的英语听写文本图像。

步骤102、根据所述听写标识,查询出所述英语听写文本图像的参考答案列表,其中,参考答案列表包括英语听写的各答案。

在上述步骤102中,所述服务器,在教师上传参考答案列表后,会输入进行英语听写的学生姓名和/或者学生所在班级作为听写标识,然后,生成并存储听写标识与参考答案列表的对应关系。

那么,服务器在获取到图像采集设备上传的英语听写文本图像时,就会根据英语听写文本图像中携带的听写标识,对听写标识与参考答案列表的对应关系进行遍历,查询出与所述英语听写文本图像对应的参考答案列表。

步骤104、对所述英语听写文本图像进行文本检测处理和文本识别处理,得到所述英语听写文本图像中的单词和所述单词的位置信息。

在上述步骤104中,对所述英语听写文本图像进行文本检测处理和文本识别处理,得到所述英语听写文本图像中的单词和所述单词的位置信息的过程是现有技术,这里不再赘述。

所述单词的位置信息,包括但不限于:单词左上角的坐标信息和右下角的坐标信息。

所述单词的位置信息,是二维系下的坐标,包括:横坐标和纵坐标。

步骤106、分析所述参考答案列表中各答案的单词数量,将单词数量为1的答案确定为单词参考答案,将所述单词参考答案放置到单词答案列表中,并将单词数量大于1的答案确定为词组参考答案,将所述词组参考答案放置到词组答案列表中。

在上述步骤106中,分析所述参考答案列表中各答案的单词数量的过程是现有技术,这里不再赘述。

步骤108、基于所述单词的位置信息,确定出显示方向上所述单词的相邻单词,并建立多个单词与单词的相邻单词的关联关系,并将未建立关联关系的单词作为所述单词参考答案的候选相似单词;其中,一个关联关系中的单词组成一个词组。

在上述步骤108中,当单词a右下角的坐标信息中的纵坐标与显示方向上另一单词b的坐标信息中左上角的坐标信息中的纵坐标的差值小于第一坐标阈值且单词a右下角的坐标信息中的横坐标与另一单词b的坐标信息中左上角的坐标信息中的横坐标的差值小于第二坐标阈值时,确定所述单词b是单词a在显示方向上的相邻单词。

单词a右下角的坐标信息中的纵坐标与显示方向上另一单词b的坐标信息中左上角的坐标信息中的纵坐标的差值小于第一坐标阈值,说明单词a和单词b在同一水平线上;而,单词a右下角的坐标信息中的横坐标与另一单词b的坐标信息中左上角的坐标信息中的横坐标的差值小于第二坐标阈值时,服务器可以确定所述单词b是单词a在显示方向上的间隔距离就是1个到3个英文字符的宽度,那么说明单词b与单词a的间隔距离较小。综合以上两点,服务器就可以确定出显示方向上单词a的相邻单词b,并确定所述单词a与单词a的相邻单词b是一个词组中的单词,并生成所述单词与所述单词的相邻单词的关联关系,再利用以上方法判断单词b是否具有相邻单词,从而得到组成一个词组的各单词的关联关系。

在一个实施方式中,如果一个词组在显示方向上由单词a、单词b、以及单词c组成。那么服务器可以得到的关联关系是单词a-单词b-单词c。

所述关联关系在服务器中可以以链表的形式进行存储。

步骤110、获取所述词组答案列表中词组参考答案中的第一个单词,计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度。

上述步骤110中,为了计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度,可以先统计得到各词组参考答案的第一个单词中包含的英文字符数量;然后将各词组参考答案中的第一个单词中的英文字符分别与检测得到的所述英语听写文本图像中的单词的英文字符逐一进行比对,确定各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的相同字符数量;最后,通过所述相同字符数量/所述英文字符数量就可以计算得到所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度。

例如:任一词组参考答案是play the piano;那么在该词组参考答案中第一个单词是play;那么,英文字符数量是4;而需要进行比对的所述英语听写文本图像中的单词是plus;那么,经过英文字符逐一比对后,确定该词组参考答案中第一个单词play与英语听写文本图像中的单词plus中相同字符数量是2;那么,play与plus的文本相似度=2/4=50%。

步骤112、将具有所述英语听写文本图像中与所述词组答案列表中各词组参考答案中的第一个单词的文本相似度大于相似度阈值的单词的关联关系对应的词组分别确定为各词组参考答案的相似候选词组。

上述步骤112中,所述相似度阈值,可以设置为0.4。

为了扩大相似候选词组的范围,还可以获取所述词组答案列表中词组参考答案中的显示方向上与第一个单词相邻的第二个单词,然后计算所述词组答案列表中各词组参考答案中的第二个单词分别与检测得到的所述英语听写文本图像中的单词的第二文本相似度,并根据计算得到的第二文本相似度,再次确定出一些相似候选词组。具体过程与上述步骤110至步骤112描述的过程类似,这里不再赘述。

步骤114、计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度,并将计算得到最大第一相似度的相似候选词组确定为学生输入的英语听写词组。

上述步骤114中,计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度的方式,与上述计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度的过程类似,就是先确定词组参考答案中包括的字符数量;然后,将各相似候选词组中的英文字符与词组参考答案中的英文字符进行逐一比对,确定各相似候选词组分别与词组参考答案的英文字符相同数量;最后,通过各相似候选词组分别与词组参考答案的英文字符相同数量/词组参考答案中包括的字符数量,就可以计算得到各相似候选词组与词组参考答案的第一相似度。

步骤116、计算多个候选相似单词中各候选相似单词与单词参考答案的第二相似度,并将计算得到最大第二相似度的候选相似单词确定为学生输入的英语听写单词。

上述步骤116中,计算多个候选相似单词中各候选相似单词与单词参考答案的第二相似度的过程,与上述计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度的过程类似,这里不再赘述。

进一步地,所述参考答案列表,携带有大小写标识。

在一个实施方式中,大小写标识是0,说明不需要将英语听写词组、以及英语听写单词中的大写英文字符转换成小写英文字符;大小写标识是1,说明不需要将英语听写词组、以及英语听写单词中的大写英文字符转换成小写英文字符。

在对听写文本进行批改之前,需要对英语听写词组和英语听写单词进行预处理。

所以,在根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改步骤之前,所述方法还包括以下步骤(1)至步骤(5):

(1)获取所述参考答案列表中携带的大小写标识;

(2)判断所述大小写标识是否指示需要将英语听写词组、以及英语听写单词中的大写英文字符转换成小写英文字符;如果是则执行步骤(3),如果否则执行步骤(4);

(3)将英语听写词组以及英语听写单词中的大写英文字符转换成小写英文字符,并跳转至步骤(5);

(4)保持英语听写词组以及英语听写单词中的大写英文字符不变;

(5)去掉英语听写词组以及英语听写单词中的数字字符和非法字符。

在上述步骤(5)中,去掉英语听写词组以及英语听写单词中的数字字符和非法字符的过程是现有技术,这里不再赘述。

所述非法字符,包括但不限于:“、”、“.”、“#”、“@”、“!”以及作为重复撰写的正确答案的英文单词或者词组。

在对英语听写词组和英语听写单词进行预处理后,继续通过步骤118根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改。

步骤118、根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改。

在上述步骤118中,为了对学生的英语听写文本图像进行批改,可以执行以下步骤(1)至步骤(13):

(1)利用所述英语听写词组对各所述词组参考答案进行遍历,当能够从各所述词组参考答案中查询出与所述英语听写词组相一致的内容时,将所述英语听写词组确定为正确答案,并对与所述英语听写词组相一致的词组参考答案设置批改标识;

(2)当未能从各所述词组参考答案中查询出与所述英语听写词组相一致的内容时,计算所述英语听写词组与各所述词组参考答案的第三相似度;

(3)当有计算得到的所述英语听写词组与词组参考答案的第三相似度小于批改相似度阈值时,将所述英语听写词组确定为无关词组;

(4)当有计算得到的英语听写词组与词组参考答案的第三相似度大于等于批改相似度阈值时,将与词组参考答案的第三相似度大于等于批改相似度阈值的英语听写词组确定为待替换词组,并获取替换字符对应关系;其中,所述替换字符对应关系记录有多个被替换字符与替换所述被替换字符的字符的对应关系;

(5)当所述词组参考答案包含在待替换词组中时,将所述待替换词组确定为正确答案,并对与所述英语听写词组相一致的词组参考答案设置批改标识;

(6)当词组参考答案未包含在待替换词组中时,计算所述待替换词组与词组参考答案的编辑距离,得到所述待替换词组转换到所述词组参考答案的编辑关系列表,其中,所述编辑关系列表中,记录有所述待替换词组通过增加英文字符的方式、删除英文字符的方式和/或者替换英文字符的方式转换到词组参考答案的编辑过程;所述替换英文字符的方式,包括:所述待替换词组中的被替换字符与替换所述被替换字符的字符的对应关系;

(7)当所述编辑关系列表中仅记录有替换英文字符的方式且所述替换英文字符的方式的数量与数量阈值相同时,获取所述编辑关系列表中记录的替换英文字符的方式;

(8)当所述编辑关系列表中记录的替换英文字符的方式中的所述待替换词组中的被替换字符与替换所述被替换字符的字符的对应关系记录在所述替换字符对应关系中时,将所述待替换词组确定为正确答案,并对与所述英语听写词组相一致的词组参考答案设置批改标识;

(9)当所述编辑关系列表中记录有增加英文字符的方式或者删除英文字符的方式,或所述编辑关系列表中记录的替换英文字符的方式数量与数量阈值不相同时,将所述待替换词组确定为错误答案,并将与词组参考答案的第三相似度大于等于批改相似度阈值的英语听写词组对应的词组参考答案设置批改标识;

(10)将与所述单词参考答案相一致的英语听写单词确定为正确答案,并对与所述英语听写单词相一致的单词参考答案设置批改标识;

(11)将与所述单词参考答案不一致的英语听写单词确定为错误答案,并将与所述单词参考答案的第四相似度大于等于批改相似度阈值的英语听写单词对应的单词参考答案设置批改标识;

(12)基于设置有批改标识的单词参考答案,从各单词参考答案中确定出未设置有批改标识的单词参考答案,将未设置有批改标识的单词参考答案确定为学生漏写单词;

(13)基于设置有批改标识的词组参考答案,从各词组参考答案中确定出未设置有批改标识的词组参考答案,将未设置有批改标识的词组参考答案确定为学生漏写词组。

在上述步骤(1)中,能够从各所述词组参考答案中查询出与所述英语听写词组相一致的内容,就是说从各所述词组参考答案中查询出与所述英语听写词组相一致的词组参考答案。

在上述步骤(2)中,计算所述英语听写词组与各所述词组参考答案的第三相似度的过程,与上述步骤114中,计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度类似,这里不再赘述。

在上述步骤(3)中,在一个实施方式中,所述批改相似度阈值,可以设置为0.6。

所述无关词组,用于表示学生书写的英文听写词组与题目无关。

在上述步骤(4)中,所述替换字符对应关系,预先设置在上述服务器中。

所述替换字符对应关系,记录有学生手写英文字符时,易混淆、混写字符之间的对应关系。

在上述步骤(5)中,当所述词组参考答案包含在待替换词组中时,说明在对所述待替换词组的识别过程中由于手写连笔等书写情况出现了识别错误,错误的把正确答案识别为错误答案。步骤(5)就是对误判错的英语听写词组这种情况进行修正的流程。

在上述步骤(7)中,在一个实施方式中,所述数量阈值,可以设置为2。

在上述步骤(6)至步骤(9)中,可以通过以下示例进行说明:

例如:假如有一个词组参考答案是make cake,而英语听写词组是rrake cake。

计算得到的英语听写词组与词组参考答案的第三相似度是0.8,那么英语听写词组rrake cake就被确定为是词组参考答案make cake的待替换词组。

通过SequenceMatcher 的get_opcodes方法可以对待替换词组rrake cake与词组参考答案make cake的编辑距离进行计算,并得到从待替换词组“rrake cake”转换成与词组参考答案“make cake”的编辑关系列表,在该编辑关系列表中,记录有一次字符替换操作(即:将‘rr’ 替换成 ‘m’), 然后在预设的替换字符对应关系中找‘m’与‘rr’的对应关系后,于是可以判定rrake cake是可以通过2次以内的替换字符的方式,成为正确答案的。

如果英语听写词组是make cakes,此时通过上述get_opcodes方法得到的操作是增加用英文字符s, 这个不是替换操作,因此可以判定英语听写词组make cakes是学生写错了,为错误答案。

再比如,正确答案是you have a coming call,英语听写词组是you hove gconing call, 通过上述get_opcodes方法,可以得到的编辑关系列表中,包括以下操作:o替换成a;g替换成a;n替换成m;说明编辑关系列表中记录有3次字符的替换操作,字符替换操作的次数超过了数量阈值2,那么可以判定英语听写词组you have a coming call是学生写错了,为错误答案。

同样的,如果学生书写的英语听写词组you have a coming canl, 此时通过上述get_opcodes方法,可以得到的编辑关系列表中,包括以下操作:字符替换操作“n替换成l”,但是在所述替换字符对应关系中查找时,找不到被替换字符n与替换被替换字符n的字符l的对应关系,那么这种情况也会判断英语听写词组you have a coming canl书写错误,为错误答案。

通过以上步骤(1)至步骤(13)描述的流程可以看出,在对英语听写的批改过程中,不仅可以确定答案的对错,还可以对学生未写(漏写)的单词或者词组、以及书写的与听写内容无关的无关词组标识出来,从而可以对教师的讲解更有多重的针对性,且给学生的分数能够正确展示学生听写的情况。

本实施例提出一种英语听写批改方法,根据参考答案中的词组参考答案和单词参考答案,对所述英语听写文本图像中的单词进行分析,将位置相邻的单词合并,得到词组参考答案的相似候选词组,然后对词组参考答案的相似候选词组进行处理得到学生输入的英语听写词组,以此对学生的英语听写文本图像进行批改,从而利用将位置相邻的单词合并的方式,得到词组参考答案的相似候选词组,可以在批改英语听写文本时,提高词组的识别率和批改的准确率。

实施例2

本实施例提出一种英语听写批改装置,用于执行上述实施例1提出的英语听写批改方法。

参见图2所示的一种英语听写批改装置的结构示意图,本实施例提出的一种英语听写批改装置,包括:

获取模块200,用于获取学生上传的英语听写文本图像,所述英语听写文本图像,包括:英语听写单词和英语听写词组、以及听写标识;

查询模块202,用于根据所述听写标识,查询出所述英语听写文本图像的参考答案列表,其中,参考答案列表包括英语听写的各答案;

处理模块204,用于对所述英语听写文本图像进行文本检测处理和文本识别处理,得到所述英语听写文本图像中的单词和所述单词的位置信息;

分析模块206,用于分析所述参考答案列表中各答案的单词数量,将单词数量为1的答案确定为单词参考答案,将所述单词参考答案放置到单词答案列表中,并将单词数量大于1的答案确定为词组参考答案,将所述词组参考答案放置到词组答案列表中;

第一确定模块208,用于基于所述单词的位置信息,确定出显示方向上所述单词的相邻单词,并建立多个单词与单词的相邻单词的关联关系,并将未建立关联关系的单词作为所述单词参考答案的候选相似单词;其中,一个关联关系中的单词组成一个词组;

第一计算模块210,用于获取所述词组答案列表中词组参考答案中的第一个单词,计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度;

第二确定模块212,用于将具有所述英语听写文本图像中与所述词组答案列表中各词组参考答案中的第一个单词的文本相似度大于相似度阈值的单词的关联关系对应的词组分别确定为各词组参考答案的相似候选词组;

第二计算模块214,用于计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度,并将计算得到最大第一相似度的相似候选词组确定为学生输入的英语听写词组;

第三计算模块216,用于计算多个候选相似单词中各候选相似单词与单词参考答案的第二相似度,并将计算得到最大第二相似度的候选相似单词确定为学生输入的英语听写单词;

批改模块218,用于根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改。

进一步地,所述参考答案列表,携带有大小写标识;所述装置还包括:

获取单元,用于获取所述参考答案列表中携带的大小写标识;

判断单元,用于判断所述大小写标识是否指示需要将英语听写词组、以及英语听写单词中的大写英文字符转换成小写英文字符;如果是则执行转换单元的功能,如果否则执行保持单元的功能;

转换单元,用于将英语听写词组以及英语听写单词中的大写英文字符转换成小写英文字符,并跳转执行预处理单元的功能;

保持单元,用于保持英语听写词组以及英语听写单词中的大写英文字符不变;

预处理单元,用于去掉英语听写词组以及英语听写单词中的数字字符和非法字符。

具体地,所述第一计算模块,具体用于:

统计得到各词组参考答案的第一个单词中包含的英文字符数量;

将各词组参考答案中的第一个单词中的英文字符分别与检测得到的所述英语听写文本图像中的单词的英文字符逐一进行比对,确定各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的相同字符数量;

通过所述相同字符数量/所述英文字符数量计算得到所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度。

本实施例提出一种英语听写批改装置,根据参考答案中的词组参考答案和单词参考答案,对所述英语听写文本图像中的单词进行分析,将位置相邻的单词合并,得到词组参考答案的相似候选词组,然后对词组参考答案的相似候选词组进行处理得到学生输入的英语听写词组,以此对学生的英语听写文本图像进行批改,从而利用将位置相邻的单词合并的方式,得到词组参考答案的相似候选词组,可以在批改英语听写文本时,提高词组的识别率和批改的准确率。

实施例3

本实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例1描述的英语听写批改方法的步骤。具体实现可参见方法实施例1,在此不再赘述。

此外,参见图3所示的一种电子设备的结构示意图,本实施例还提出一种电子设备,上述电子设备包括总线51、处理器52、收发机53、总线接口54、存储器55和用户接口56。上述电子设备包括有存储器55。

本实施例中,上述电子设备还包括:存储在存储器55上并可在处理器52上运行的一个或者一个以上的程序,经配置以由上述处理器执行上述一个或者一个以上程序用于进行以下步骤(1)至步骤(10):

(1)获取学生上传的英语听写文本图像,所述英语听写文本图像,包括:英语听写单词和英语听写词组、以及听写标识;

(2)根据所述听写标识,查询出所述英语听写文本图像的参考答案列表,其中,参考答案列表包括英语听写的各答案;

(3)对所述英语听写文本图像进行文本检测处理和文本识别处理,得到所述英语听写文本图像中的单词和所述单词的位置信息;

(4)分析所述参考答案列表中各答案的单词数量,将单词数量为1的答案确定为单词参考答案,将所述单词参考答案放置到单词答案列表中,并将单词数量大于1的答案确定为词组参考答案,将所述词组参考答案放置到词组答案列表中;

(5)基于所述单词的位置信息,确定出显示方向上所述单词的相邻单词,并建立多个单词与单词的相邻单词的关联关系,并将未建立关联关系的单词作为所述单词参考答案的候选相似单词;其中,一个关联关系中的单词组成一个词组;

(6)获取所述词组答案列表中词组参考答案中的第一个单词,计算所述词组答案列表中各词组参考答案中的第一个单词分别与检测得到的所述英语听写文本图像中的单词的文本相似度;

(7)将具有所述英语听写文本图像中与所述词组答案列表中各词组参考答案中的第一个单词的文本相似度大于相似度阈值的单词的关联关系对应的词组分别确定为各词组参考答案的相似候选词组;

(8)计算多个相似候选词组中各相似候选词组与词组参考答案的第一相似度,并将计算得到最大第一相似度的相似候选词组确定为学生输入的英语听写词组;

(9)计算多个候选相似单词中各候选相似单词与单词参考答案的第二相似度,并将计算得到最大第二相似度的候选相似单词确定为学生输入的英语听写单词;

(10)根据词组参考答案、单词参考答案、英语听写词组、英语听写单词,对学生的英语听写文本图像进行批改。

收发机53,用于在处理器52的控制下接收和发送数据。

其中,总线架构(用总线51来代表),总线51可以包括任意数量的互联的总线和桥,总线51将包括由处理器52代表的一个或多个处理器和存储器55代表的存储器的各种电路链接在一起。总线51还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本实施例不再对其进行进一步描述。总线接口54在总线51和收发机53之间提供接口。收发机53可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发机53从其他设备接收外部数据。收发机53用于将处理器52处理后的数据发送给其他设备。取决于计算系统的性质,还可以提供用户接口56,例如小键盘、显示器、扬声器、麦克风、操纵杆。

处理器52负责管理总线51和通常的处理,如前述上述运行通用操作系统。而存储器55可以被用于存储处理器52在执行操作时所使用的数据。

可选的,处理器52可以是但不限于:中央处理器、单片机、微处理器或者可编程逻辑器件。

可以理解,本发明实施例中的存储器55可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器 (Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器 (Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本实施例描述的系统和方法的存储器55旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中,存储器55存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:操作系统551和应用程序552。

其中,操作系统551,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序552,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序552中。

本实施例提出一种计算机可读存储介质和电子设备,根据参考答案中的词组参考答案和单词参考答案,对所述英语听写文本图像中的单词进行分析,将位置相邻的单词合并,得到词组参考答案的相似候选词组,然后对词组参考答案的相似候选词组进行处理得到学生输入的英语听写词组,以此对学生的英语听写文本图像进行批改,从而利用将位置相邻的单词合并的方式,得到词组参考答案的相似候选词组,可以在批改英语听写文本时,提高词组的识别率和批改的准确率。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种英语听写批改方法、装置和电子设备
  • 一种试卷批改方法、装置、电子设备及存储介质
技术分类

06120113161721