掌桥专利:专业的专利平台
掌桥专利
首页

一种基于错题本的组卷方法、存储介质及设备

文献发布时间:2023-06-19 18:37:28



技术领域

本发明涉及智能教育教育技术领域,具体涉及一种基于错题本的组卷方法、存储介质及设备。

背景技术

当前智慧校园项目发展迅速,错题本作为智能学习的重要一环,受到家长、老师和学生的广泛认可,目前最常用的错题收录方式为拍摄错题图片或包含错题的页面,将错题切割后保存到错题本。但是后续如果要利用错题本进行组卷测试时,由于题目资源全部是图片,因此排版很不方便,且拍摄的错题图片通常包含已经作答的笔迹或画痕,导致错题本利用效率较低。

发明内容

针对现有技术的不足,本发明旨在提供一种基于错题本的组卷方法、存储介质及设备质。

为了实现上述目的,本发明采用如下技术方案:

一种基于错题本的组卷方法,具体过程为:

S1、获取批改页面图像;

S2、在第一数据库中检索出当前的批改页面图像对应的页面信息;所述第一数据库用于存储一本或多本预设书本的书本信息,所述书本信息包括书本名称和每一页的页面信息,所述页面信息包括页码、文本内容以及包含的各题目的题目信息,每道题目的题目信息包括题目文本、答案、解析、知识点和题目在页面中的坐标数据;

S3、根据匹配到的页面信息,获取该页面对应的题目信息,根据题目信息中各题目的坐标数据,对批改页面图像中的各题目进行定位和切割,并识别出其中的错题,得到错题原图;

S4、将步骤S3中识别为错题的对应的题目信息作为错题信息,连同错题原图存入第二数据库;当用户需要利用错题进行组卷中,可从第二数据库中直接调出目标的错题信息中的题目文本进行组卷。

进一步地,步骤S2中,在题目信息中,如果题目存在图片数据,将图片数据转成url链接保存到对应的题目文本。

进一步地,步骤S2中,在第一数据库中检索到当前的批改页面图像对应的书本信息的具体过程为:对批改页面图像整体进行ocr文本识别,将文本识别结果与书本信息中每一页页面的文本内容进行比对,将第一数据库中与批改页面图像的文本识别结果的相似度超过预设的相似度阈值且相似度值最高的文本内容对应的页面信息作为最终匹配得到的页面信息。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。

本发明还提供一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序时,实现上述方法。

本发明的有益效果在于:本发明从错题收集开始着手,通过建立第一数据库,结合文本识别、文本匹配、错题识别等手段,实现建立一个包含错题的文本数据的错题数据库,则用户想要利用自身的错题本进行组卷时,可以直接调用错题的文本进行组卷,避免用错题原图组卷带来的布局不方便或已有作答痕迹的缺点。

具体实施方式

以下将对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。

本实施例提供一种基于错题本的组卷方法,具体过程为:

S1、获取批改页面图像;

S2、在第一数据库中检索出当前的批改页面图像对应的页面信息;所述第一数据库用于存储一本或多本预设书本的书本信息,所述书本信息包括书本名称和每一页的页面信息,所述页面信息包括页码、文本内容以及包含的各题目的题目信息,每道题目的题目信息包括题目文本、答案、解析、知识点和题目在页面中的坐标数据;若题目存在图片数据,将图片数据转成url链接保存到对应的题目文本。

在本实施例中,在第一数据库中检索到当前的批改页面图像对应的书本信息的具体过程为:对批改页面图像整体进行ocr文本识别,将文本识别结果与书本信息中每一页页面的文本内容进行比对,将第一数据库中与批改页面图像的文本识别结果的相似度超过预设的相似度阈值且相似度值最高的文本内容对应的页面信息作为最终匹配得到的页面信息。

需要说明的是,如果第一数据库中仅存储有一本书本的书本信息时,可以直接将批改页面图像和第一数据库中的书本每一页页面信息的文本内容进行比对,如果第一数据库中存储有多本书本的书本信息时,可以在初始时先录入本次针对的书本名称,则在比对时,仅将批改页面图像的文本识别结果与本次针对的书本名称对应的每一页页面信息的文本内容进行比对。

需要说明的是,本实施例中,用整个页面的文本内容进行检索而不直接用题目文本进行检索,这是因为题目可能为计算题或图片题目,这类型的题目文本太少,检索结果准确率会很低,用整个页面的文本结果来匹配,文本字数更多,检索结果置信度高。

S3、根据匹配到的页面信息,获取该页面对应的题目信息,根据题目信息中各题目的坐标数据,对批改页面图像中的各题目进行定位和切割,并识别出其中的错题,得到错题原图。当前识别错题的技术比较成熟,如通过识别手写批改结果以识别错题等,此处不再赘述。

S4、将步骤S3中识别为错题的对应的题目信息作为错题信息,连同错题原图存入第二数据库;当用户需要利用错题进行组卷中,可从第二数据库中直接调出目标的错题信息中的题目文本进行组卷。

在本实施例中,第二数据库是和用户信息关联的,即每个用户对应一个第二数据库,专门用于存储该用户的错题信息,并供各用户后续利用自身的错题信息进行组卷测试使用。

这样,用户可以直接获得错题的题目文本进行组卷,从而避免用错题原图组卷带来的布局不方便或已有作答痕迹的缺点。

对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。

技术分类

06120115636753