掌桥专利:专业的专利平台
掌桥专利
首页

识字量检测方法、阅读书籍确定方法及其相关产品

文献发布时间:2023-06-19 19:28:50


识字量检测方法、阅读书籍确定方法及其相关产品

技术领域

本发明的实施方式涉及计算机技术领域,更具体地,本发明的实施方式涉及识字量检测方法、阅读书籍确定方法、装置、电子设备及存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。

在语文教学中,识字教学是一个很重要的环节。识字是阅读、理解和写作的基础,所以了解学习者的识字量对于语文教学来讲是十分必要的。同时,了解学习者的识字量对于语文教材的编写、教学进度的安排以及课外读物的选择和编写来说也是一个重要依据。

现有的识字量检测方式包括以下两种:一种是使用实体字卡进行识字量检测,该种检测方式所使用的字卡量过于庞大,需要耗费较长检测时间,实施难度大;另一种是通过获取测试者的基本信息,例如年龄,从而选取一定数量的字作为测试字库,但测试者仍需完成整个测试字库的识字测试后方能得到当前测试字库的识字量,而且,由于测试字库仅选取了一定数量的字,这会导致得到的测试结果与实际的识字结果受测试字库的影响较大,可能与实际的识字范围存在较大偏差,导致测试结果的稳定性较差。

发明内容

出于检测效率的考虑,现有技术仅从测试字库选取一定数量的字进行测试,这会导致得到的测试结果与实际的识字结果受测试字库的影响较大,测试结果偏差大。

为此,非常需要一种改进的识字量检测方法,以在提高识字量检测效率的同时,提高识字量检测结果的准确度和稳定性。

在本上下文中,本发明的实施方式期望提供一种识字量检测方法、阅读书籍确定方法、装置、电子设备及存储介质。

在本发明实施方式的第一方面中,提供了一种识字量检测方法,包括:从字表中随机抽取测试字以对检测对象进行识字测试;在字表中,测试字依据字频排序;测试字的识字率与测试字的字频负相关;当达成测试终止条件时,分别获取检测对象识别正确的测试字中字频最低的第一测试字,以及识别错误的测试字中字频最高的第二测试字;根据字表中第一测试字与第二测试字之间的测试字的识字率,计算得到检测对象的识字量。

在本发明的一个实施例中,测试终止条件包括:字表的识字错误结果的最大连续个数达到预设连续个数,且识字测试次数达到预设测试次数。

在本发明的一个实施例中,检测对象的识字量计算步骤包括:根据字表中目标测试字的识字率,计算得到检测对象的识字量;其中,目标测试字位于排序最近的第一测试字和第二测试字之间。

在本发明的一个实施例中,从字表中随机抽取测试字以对检测对象进行识字测试之前,还包括:依据语料库的字频统计结果生成测试字的识字率和语料库的字表;将字表划分为若干个子字表;对应地,识字测试步骤包括:

遍历若干个子字表,从若干个子字表中随机抽取测试字以对检测对象进行识字测试;对应地,检测对象的识字量计算步骤包括:根据字表中第一测试字与第二测试字之间的测试字的子表识字率,计算得到检测对象的当前子字表的识字量;基于检测对象的若干子字表的识字量,计算得到检测对象的识字量。

在本发明的一个实施例中,将字表划分为若干个子字表之后,还包括:依据若干个子字表中每个测试字在其所属子字表中的位置,生成每个测试字的子表识字率。

在本发明的一个实施例中,在字表中,测试字至字表初始位置的距离与测试字的字频负相关;对应地,子表识字率生成步骤包括:确定测试字的在前测试字的字数;在前测试字为测试字所属子字表中,排序位于测试字之前的其他测试字;计算测试字的在前测试字的字数与测试字所属子字表中的总字数的比值,得到测试字的子表识字率。

在本发明的一个实施例中,检测对象的当前子字表的识字量计算步骤包括:计算当前子字表中目标测试字的子表识字率与当前子字表的总字数的乘积,得到检测对象的当前子字表的识字量;目标测试字位于第一测试字和第二测试字之间。

在本发明的一个实施例中,基于检测对象的若干子字表的识字量,计算得到检测对象的识字量,包括:将检测对象的若干子字表的识字量相加,得到检测对象的识字量。

在本发明的一个实施例中,从字表中随机抽取测试字以对检测对象进行识字测试之前,还包括:依据语料库的字频统计结果生成测试字的识字率和语料库的字表;将字表划分为若干个子字表;其中,沿字表的长度方向,子字表的难度级别递增;对应地,识字测试步骤包括:从当前难度级别的子字表中随机抽取测试字以对检测对象进行识字测试;当前难度级别为最小难度级别;若满足难度升级条件,则将当前难度级别增加一级并返回执行识字测试步骤,直至不再满足难度升级条件后,确定测试终止条件是否达成。

在本发明的一个实施例中,难度升级条件包括:当前难度级别的子字表中,识别正确的测试字占总字数的比值达到预设比值,且当前难度级别非最大难度级别。

在本发明的一个实施例中,预设比值的数量为多个,多个预设比值与若干个子字表的难度级别一一对应。

在本发明的一个实施例中,难度升级条件还包括:当前难度级别的子字表中,识别错误的测试字占总字数的比值小于预设错字比值。

在本发明的一个实施例中,检测对象的识字量计算步骤,包括:以目标测试字的识字率与字表总字数的乘积,作为检测对象的识字量。

在本发明实施方式的第二方面中,提供了一种阅读书籍确定方法,包括:执行如第一方面所述的识字量检测方法,以对检测对象进行识字量检测;依据检测对象的识字量生成检测对象的识字库;基于检测对象的识字库生成检测对象的推荐阅读书籍;其中,推荐阅读书籍中,熟字的占比处于预设占比范围内;熟字属于检测对象的识字库。

在本发明的一个实施例中,检测对象的识字库包括:字表中字频高于目标测试字的测试字,以及检测对象识别正确的测试字;目标测试字位于排序最近的第一测试字和第二测试字之间。

在本发明的一个实施例中,识字库包括:当前难度级别的子字表及在前子字表中的测试字;在前子字表为难度级别低于当前难度级别的子字表。

在本发明实施方式的第三方面中,提供了一种识字量检测装置,包括:识字测试模块,用于从字表中随机抽取测试字以对检测对象进行识字测试;识字量计算模块,用于在达成测试终止条件时,分别获取检测对象识别正确的测试字中字频最低的第一测试字,以及识别错误的测试字中字频最高的第二测试字;并根据字表中第一测试字与第二测试字之间的测试字的识字率,计算得到检测对象的识字量;其中,在字表中,测试字依据字频排序;测试字的识字率与测试字的字频负相关。

在本发明实施方式的第四方面中,提供了一种阅读书籍确定装置,包括:识字测试模块,用于从字表中随机抽取测试字以对检测对象进行识字测试;识字量计算模块,用于在达成测试终止条件时,分别获取检测对象识别正确的测试字中字频最低的第一测试字,以及识别错误的测试字中字频最高的第二测试字;根据字表中第一测试字与第二测试字之间的测试字的识字率,计算得到检测对象的识字量;以及依据检测对象的识字量生成检测对象的识字库;书籍确定模块,用于基于检测对象的识字库生成检测对象的推荐阅读书籍;其中,在字表中,测试字依据字频排序;测试字的识字率与测试字的字频负相关;推荐阅读书籍中,熟字的占比处于预设占比范围内;熟字属于检测对象的识字库。

在本发明实施方式的第五方面中,提供了一种电子设备,包括:处理器;以及存储器,其存储有可执行的程序指令,当程序指令由处理器来执行时,使得电子设备实现如第一方面或第二方面的方法。

在本发明实施方式的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令由一个或多个处理器来执行时,使得处理器实现如第一方面或第二方面的方法。

根据本发明实施方式的识字量检测方法,从字表中随机抽取测试字对检测对象进行识字测试,当达成测试终止条件时即可停止检测,而无需将字表中测试字全部测完,能够节省大量检测用时。

并且,由于字表中的测试字依据字频排序,且测试字的识字率与测试字的字频负相关,因此,当字表中某一位置的测试字被检测对象正确识出后,其字频升高一侧的所有测试字则可以被认定为检测对象潜在能够认识的区间,与之对应地,当字表中某一位置的测试字被检测对象错误识别后,其字频降低一侧的所有测试字则可以被认定检测对象潜在无法识出的区间,鉴于字频与识字率之间的关系,可以根据经验数据,即字表,快速定位出字表中处于检测对象识字正确/识字错误的临界区间,进而通过该区间的识字率估算出被检测对象的识字量,由于测试字的抽取是基于整个字表来执行的,且定位得到识字临界区间后,其两侧的测试字也能够基于字表的字频排序进行识字测试结果的评估,因此,测试字的范围并不会局限在某一字频区间,从而避免了测试字库对检测结果造成的影响,从而显著地提高了结果的准确度和稳定性。

附图说明

通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:

图1示意性地示出了适于实现本发明实施方式的示例性计算系统100的框图;

图2示意性地示出了根据本发明实施例的识字量检测方法的流程图;

图3示意性地示出了根据本发明一个实施例的字表示意图;

图4示意性地示出了根据本发明另一实施例的识字量检测方法的流程图;

图5示意性地示出了根据本发明另一实施例的字表示意图;

图6示意性地示出了根据本发明一个实施例的子表识字率的赋值方法的流程图;

图7示意性地示出了根据本发明又一实施例的识字量检测方法的流程图;

图8示意性地示出了根据本发明实施例的阅读书籍确定方法的流程图;

图9示意性地示出了根据本发明实施例的识字量检测装置的结构框图;

图10示意性地示出了本发明实施例的电子设备的示例性结构框图;

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

图1示出了适于实现本发明实施方式的示例性计算系统100的框图。如图1所示,计算系统100可以包括:中央处理单元(CPU)101、随机存取存储器(RAM)102、只读存储器(ROM)103、系统总线104、硬盘控制器105、键盘控制器106、串行接口控制器107、并行接口控制器108、显示控制器109、硬盘110、键盘111、串行外部设备112、并行外部设备113和显示器114。这些设备中,与系统总线104耦合的有CPU 101、RAM 102、ROM 103、硬盘控制器105、键盘控制器106、串行控制器107、并行控制器108和显示控制器109。硬盘110与硬盘控制器105耦合,键盘111与键盘控制器106耦合,串行外部设备112与串行接口控制器107耦合,并行外部设备113与并行接口控制器108耦合,以及显示器114与显示控制器109耦合。应当理解,图1所述的结构框图仅仅是为了示例的目的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况增加或减少某些设备。

本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是,但不限于,电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举示例)例如可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络(包括局域网(LAN)或广域网(WAN))连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

下面将参照本发明实施例的方法的流程图和设备(或系统)的框图描述本发明的实施方式。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。

也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置的产品。

也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。

根据本发明的实施方式,提出了一种识字量检测方法、阅读书籍确定方法及其相关产品。

在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。

下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。

发明概述

本发明人发现,根据字频可以对测试字的识别难度进行区分,日常中使用频率较高的字可以认为其难度较低,而使用频率较低的字的难度较高,能够识别出较高难度的字的检测对象大概率也能够掌握较低难度的字,由此,可以依据测试字的字频设置测试字的识字率。字频越低的测试字的识字率越高,若检测对象能够识别正确某一测试字,则意味着其大概率能够识别出字频高于该测试字的其他测试字,该测试字的识字率可以视作检测对象在阅读相当难度的书籍时,能够正确识别的测试字的比例。

基于以上发现,本发明提出了一种识字量检测方案,其以一个依据字频进行排序的字表作为测试库,从中随机抽取测试字对检测对象进行识字测试,当检测对象的识字测试结果触发一个测试终止条件后,即从检测对象识别正确的测试字中确定字频最低的第一测试字,以及从识别错误的测试字中确定字频最高的第二测试字,从而确定检测对象的识字临界区间。由于前文所述的字频与识字率之间的关系,该识字临界区间字频较低一侧可以被认定为检测对象无法识别正确的区间,另一侧则可以认定为检测对象潜在认识的区间,由此,无需将字表中测试字全部测完,根据该目标测试字的识字率即可确定检测对象的识字量。

在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。

应用场景总览

在教学过程中,对于学习者识字量的检测是语文教学中很重要的一环。了解学习者的识字量不仅是为了检测学习者当前阅读、理解和写作的能力,其对于语文教材的编写以及教学进度的安排来说也是一个重要依据。

识字量是筛查学习者是否具有阅读障碍的重要指标,同时也是分级阅读的基本途径。

根据学习者的识字量也能够对实现对学习者进行有针对性的课外读物的推荐,实现因材施教,提高教学效率。

示例性方法

需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。

本发明的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

图2示意性地示出了根据本发明实施例的识字量检测方法的流程图。

如图2所示,在步骤201中,从字表中随机抽取测试字以对检测对象进行识字测试。

以上字表中,测试字依据字频排序。在一些实施例中,字表中测试字可以按照字频由高至低排序。在另一些实施例中,字表中测试字可以按照字频由低至高排序。

测试字的识字率是预先根据每个测试字的字频生成的,具体地,测试字的识字率与测试字的字频负相关。

字频越低意味着测试字的使用频率越低,其能够被检测对象正确识别的概率越小,也意味着该测试字的识别难度越高,在此前提下,若检测对象能够正确识别该测试字,能间接反映出检测对象的识字水平较高,检测对象能够正确识别一定比例的测试字。有鉴于此,可以对该测试字赋予一个识字率,用于表示能够正确识别该测试字的检测对象在阅读相当难度的书籍时,能够正确识别的测试字的比例。

需要说明的是,如图3示出的字表示意图,虽然字表中测试字依据字频排序,且字频与识字率呈负相关关系,但字表中测试字的排序与测试字的识字率大小并不是呈严格的线性关系的。可以理解,字频极低的测试字数量,也即生僻字的数量,是要远小于高字频的测试字的数量的。

另外,字表中测试字的识字率也不一定呈现严格的递增或递减趋势,以字表中测试字可以按照字频由高至低排序的情况为例,以较大粒度分析测试字的识字率与排序的关系,可以确定排序在先的测试字的识字率小于排序在后的测试字的识字率,但在较小粒度对应的区间范围内可能出现排序在先的测试字的识字率大于或等于排序在后的测试字的识字率的情况。

在步骤202中,当达成测试终止条件时,分别获取第一测试字以及第二测试字。其中,第一测试字是检测对象识别正确的测试字中字频最低的测试字;第二测试字是检测对象识别错误的测试字中字频最高的测试字。

也即是说,在字表中,第一测试字和第二测试字是排序最近的识别正确的测试字和识别错误的测试字。

本发明实施例在步骤202中设置了一个测试终止条件,示例性地,该测试终止条件包括:字表的识字错误结果的最大连续个数达到预设连续个数,且识字测试次数达到预设测试次数。

假设预设连续个数设置为3,预设测试次数为50,则当检测对象进行识字测试的字数达到50且其中连续3次识字错误时,结束识字测试,此时,需要在检测对象识字正确的测试字中确定出第一测试字,以及从识字错误的测试字中确定出第二测试字,根据字表的排序与字频的关系,可以评估检测对象对于字频高于第一测试字的部分可以正确识出,而对于字频低于第二测试字的部分则无法正确识出,由此将字表分割为3个区间,首尾两段对应的是潜在能够认识的区间和潜在无法识出的区间,而中段则是由第一测试字和第二测试字定义出的识字临界区间。

在步骤203中,根据字表中第一测试字与第二测试字之间的测试字的识字率,计算得到检测对象的识字量。

示例性地,在一些实施例中,可以对第一测试字与第二测试字之间的测试字的识字率求平均值以得到一个目标识字率,通过该目标识字率计算出检测对象的识字量。在另一些实施例中,也可以在第一测试字与第二测试字之间确定一个目标测试字,该目标测试字位于第一测试字和第二测试字之间,以该目标测试字的识字率作为目标识字率,计算得到检测对象的识字量。

需要说明的是,在一些实施例中,可以认为识字临界区段中有一半的测试字可以被检测对象正确识出,因此,目标测试字可以位于第一测试字和第二测试字的中间位置,即1/2处。在另一些实施例中,目标测试字还可以位于1/3处或2/3处等其他位置,此处不作唯一限定。

在一些实施例中,检测对象的识字量计算过程如下:计算目标识字率与字表总字数的乘积,以该乘积作为检测对象的识字量。例如:以目标测试字的识字率与字表总字数的乘积作为检测对象的识字量。

通过如上实施例提供的识字量检测方法,无需完成整个字表的识字测试,即可确定检测对象的识字量,大幅缩减了识字量检测所需时长,并且,由于检测过程是从整个字表中随机抽取测试字,测试字的范围并不会局限在某一字频区间,从而避免了测试字库对检测结果造成的影响,从而提高了检测结果的准确度和稳定性。

由于整个字表的字频覆盖范围较大,虽然每个测试字的抽取概率相同,但仍存在抽取的低难度测试字与高难度测试字数量不均衡的情况,导致得到的检测结果不够精准。

针对以上问题,本发明还提供了一种基于分区测试方式的识字量检测方法和另一种基于升级测试方式的识字量检测方法。

下面结合图4对基于分区测试方式的识字量检测方法进行说明。

图4示意性地示出了根据本发明另一实施例的识字量检测方法的流程图。

如图4所示,在步骤401中,依据语料库的字频统计结果生成测试字的识字率和字表。

在该字表中,测试字依据字频排序;测试字的识字率与测试字的字频负相关。

在本实施例中,以中小学生的识字量检测场景为例,语料库可以包括:中小学语文教材和同步读物。可以理解,对于不同的识字量检测场景,可以对语料库中的教材进行调整。

在步骤402中,将字表划分为若干个子字表。

示例性地,以字表中测试字可以按照字频由高至低排序的情况为例,依据高字频对应低难度,低字频对应高难度的对应方式将字表划分为若干个难度区间,其中每个难度区间即为一个子字表。如图5示出的字表示意图,可以将字表分为四个区间以形成四个子字表,该四个子字表从前往后难度递增。

需要说明的是,由于字表中测试字的分布并不是均匀的,因此,在划分字表时,可以不采用平均划分的方式,而是采用如图5所示的划分方式,其中,难度1子字表的长度小于难度2子字表的长度小于难度3子字表的长度小于难度4子字表的长度。

通过如图5所示的划分方式,能够缩小子字表之间的测试字数量的差距,保证高难度子字表中也有足够的测试字。

在步骤403中,遍历若干个子字表以基于若干个子字表分别对检测对象进行识字测试。

在步骤404中,在当前子字表中达成测试终止条件时,分别获取当前子字表对应的第一测试字和第二测试字。

具体地,当访问到一个子字表时,则从子字表中随机抽取测试字以对检测对象进行识字测试,判断当前访问的子字表的识字测试次数是否达到了预设测试次数,且当前访问的子字表的识字错误结果的最大连续个数是否达到预设连续个数,当判断结果均为是时,则在当前访问的子字表中确定检测对象的第一测试字和第二测试字。

针对一个子字表进行识字测试的过程可以参考图2示出的识字量检测方法。可以理解,图2示出的特征也适用于本实施例。

在步骤405中,根据当前子字表中第一测试字与第二测试字之间的测试字的子表识字率,计算得到检测对象的当前子字表的识字量。

目标测试字的子表识字率是指在以当前子字表作为测试字库时,测试字对应的识字率。即,子表识字率表示能够正确识别目标测试字的检测对象在阅读当前子字表时,能够正确识别的测试字的比例。

需要说明的是,目标测试字的子表识字率与该目标测试字的识字率不同,目标测试字的子表识字率是在划分得到子字表后,根据每个子字表重新对测试字赋值生成的。字表的划分方式发生变化,目标测试字的子表识字率也会相应调整。

与前文实施例相对应地,可以对第一测试字与第二测试字之间的测试字的子表识字率求平均值以得到一个目标子表识字率,通过该目标子表识字率计算出检测对象的识字量;也可以在第一测试字与第二测试字之间确定一个目标测试字,该目标测试字位于第一测试字和第二测试字之间,以该目标测试字的子表识字率作为目标子表识字率,计算得到检测对象的识字量。

具体地,步骤405可以包括:

计算当前子字表中目标测试字的子表识字率与当前子字表的总字数的乘积以得到检测对象的当前子字表的识字量;其中,目标测试字位于第一测试字和第二测试字之间;

或对第一测试字与第二测试字之间的测试字的识字率求平均值以得到一个目标子表识字率,并计算目标子表识字率与当前子字表的总字数的乘积以得到检测对象的当前子字表的识字量。

在步骤406中,基于检测对象的若干子字表的识字量,计算得到检测对象的识字量。

具体地,将检测对象的若干子字表的识字量相加即可得到检测对象的识字量。

以上提供的识字量检测方法,通过将字表分区形成若干个子字表,若干个子字表成立若干个不同难度的测试库,检测对象需完成每个难度的测试库的识字测试,从而得到每个难度下检测对象的识字量,进而得到整个字表下该检测对象的识字量。由于检测对象的识字量检测结果是基于每个难度的子字表的识字测试后计算得到的,有效避免了随机抽取的测试字难度失衡的情况出现,保证了检测结果的准确度。

基于上述实施例提供的基于分区测试方式的识字量检测方法,本发明还提供了一种子表识字率的赋值方法,在将字表划分为若干个子字表之后,依据若干个子字表中每个测试字在其所属子字表中的位置,生成每个测试字的子表识字率。

图6示意性地示出了根据本发明一个实施例的子表识字率的赋值方法的流程图。

如图6所示,以一个测试字的子表识字率的赋值步骤为例:

在步骤601中,确定测试字的在前测试字的字数。

需要说明的是,在本实施例中,字表中测试字至字表初始位置的距离与测试字的字频负相关,即,子表中位置越靠前的测试字,其字频越高。

在本实施例中,在前测试字为该测试字所属子字表中,排序位于该测试字之前的其他测试字,也即字频高于该测试字的其他测试字。

由于在前测试字的字频高于该测试字,因此,在检测对象正确识出该测试字之后,即可认为检测对象也能够正确识出该测试字的在前测试字。因此,可以将某一测试字的在前测试字的字数作为当前子字表中,正确识别该测试字的检测对象能够正确识别的测试字数。

在步骤602中,计算测试字的在前测试字的字数与测试字所属子字表中的总字数的比值,得到测试字的子表识字率。

子表识字率表示能够正确识别目标测试字的检测对象在阅读当前子字表时,能够正确识别的测试字的比例。因此,基于检测对象能够正确识别的测试字数与当前子字表的总字数可以计算出上述比例,即测试字的子表识字率。

需要说明的是,在一些实施例中,由于当前测试字也是被检测对象正确识别的测试字,因此可以将当前测试字视作其在前测试字的一部分,即,在计算测试字的子表识字率时,先将测试字的在前测试字的字数加一,接着计算测试字的在前测试字的字数与测试字所属子字表中的总字数的比值。

以上实施例对基于分区测试方式的识字量检测方法进行了介绍。

下面结合图7对基于升级测试方式的识字量检测方法进行说明。

图7示意性地示出了根据本发明又一实施例的识字量检测方法的流程图。

如图7所示,在步骤701中,依据语料库的字频统计结果生成测试字的识字率和字表。

在步骤702中,将字表划分为若干个子字表。其中,沿字表的长度方向,子字表的难度级别递增。

上述步骤701和步骤702可以参考前文实施例中步骤401和步骤402的描述,此处不再赘述。

在步骤703中,从当前难度级别的子字表中随机抽取测试字以对检测对象进行识字测试。其中,当前难度级别为最小难度级别。

在步骤704中,确定是否满足难度升级条件。

若是,则执行步骤705后返回执行步骤703;若否,则执行步骤706。

在一些实施例中,难度升级条件包括:当前难度级别的子字表中,第一测试字占总字数的比值达到预设比值,且当前难度级别非最大难度级别。

由于每个子字表中的测试字处于同一难度级别,因此,当检测对象能够正确识别当前子字表中一定比例的测试字后即可视作检测对象已经掌握当前难度级别的所有测试字,即可对检测对象进行下一难度级别的识字测试。

在步骤705中,将当前难度级别增加一级。

在步骤706中,确定测试终止条件是否达成。

若是,则执行步骤707;若否,则执行步骤708后返回步骤706。

具体地,测试终止条件可以包括:字表的识字错误结果的最大连续个数达到预设连续个数,且识字测试次数达到预设测试次数。

在步骤707中,计算检测对象的识字量。

在步骤708中,从当前子字表中随机抽取测试字进行识字测试。

在本实施例中,步骤707和步骤708可以参考图2示出的识字量检测方法的描述,此处不再赘述。

以图5示出的字表为例,对上述识字量检测方法进行进一步说明。

在图5示出的字表中,难度1子字表为最小难度级别的子字表,从难度1子字表中随机抽取测试字对检测对象进行识字测试,若难度1子字表中已有预设比值的测试字被正确识别,则说明检测对象已经掌握了难度级别为1的测试字,则从难度2子字表中随机抽取测试字对检测对象再次进行识字测试,以此类推,直至子字表的难度级别升级至难度4或者检测对象在某一子字表的识字测试中,正确识字的比例未达到预设比值。

进一步地,难度升级条件还可以包括:当前难度级别的子字表中,第二测试字占总字数的比值小于预设错字比值。此难度升级条件限制了检测对象识字测试时的识字错误率,若当前子字表的识字错误率超过预设错字比值,则说明检测对象无法完全掌握当前子字表中的测试字,此时检测对象的识字水平与当前难度级别相匹配,则可以停止识字测试并计算检测对象的识字量。

与图2示出的识字量检测方法类似地,在步骤707中,可以对第一测试字与第二测试字之间的测试字的识字率求平均值以得到一个目标识字率,通过该目标识字率计算出检测对象的识字量;也可以在第一测试字与第二测试字之间确定一个目标测试字,该目标测试字位于第一测试字和第二测试字之间,以该目标测试字的识字率作为目标识字率,计算得到检测对象的识字量。

在本实施例中,目标测试字的确定过程与前文实施例中一致,此处不再赘述。

需要说明的是,虽然本实施例的识字测试是基于子字表进行的,但在识字量计算环节,仍是以整个字表的识字率进行识字量的计算。基于此,可能出现距离最近的第一测试字与第二测试字分属于不同子字表的情况。

需要说明的是,各难度级别对应的预设比值和/或预设错字比值可以设置为同一数值,例如90%等。也可以设置为不同数值与若干个子字表的难度级别一一对应,例如难度1子字表对应的预设比值设置为90%,难度2子字表对应的预设比值设置为85%等。

通过以上实施例提供的基于升级测试方式的识字量检测方法,检测对象需要从最小难度级别开始,逐级增加识字测试的难度,从而确定出检测对象的识字水平。当确定检测对象的识字水平后,更高难度级别的识字测试则无需进行,能够节省检测用时,同时,能够避免随机抽取的测试字难度跨度过大所导致的检测结果失真的问题。

通过以上识字量检测方式计算出检测对象的识字量后,还可以根据检测结果为检测对象推荐阅读书籍。

图8示意性地示出了根据本发明实施例的阅读书籍确定方法的流程图。

如图8所示,在步骤801中,基于字表进行识字测试,以得到检测对象的识字量。

在本实施例中,步骤801可以通过前文任一实施例提供的识字量检测方法来得到检测对象的识字量,此处不再赘述。

在步骤802中,依据检测对象的识字量生成检测对象的识字库。

示例性地,检测对象的识字库可以包括:字表中字频高于目标测试字的测试字,以及检测对象识别正确的测试字。

示例性地,检测的识字库可以包括:字表中字频高于第一测试字的测试字,以及检测对象识别正确的测试字。

若采用基于分区测试方式的识字量检测方法,检测对象的识字库可以包括:每一子字表中目标测试字的在前测试字。

若采用基于升级测试方式的识字量检测方法,检测对象的识字库可以包括:当前难度级别的子字表及在前子字表中的测试字;其中,在前子字表为难度级别低于当前难度级别的子字表。

在步骤803中,基于检测对象的识字库生成检测对象的推荐阅读书籍。

推荐阅读书籍中,熟字的占比处于预设占比范围内;熟字指的是属于检测对象的识字库中的字。需要说明的是,预设占比范围是可以依据教学需求等实际条件进行适应性调整的预设数值,例如,为识字水平更高的检测对象设置更高的预设占比范围。

在完成检测对象的识字量计算之后,系统可以得知字表中哪些测试字是能够被检测对象正确识别的和/或检测对象的识字水平处于哪一难度级别,从而为检测对象推荐对其而言具有一定比例生字的书籍,例如含有30%生字和70%熟字的书籍,既不影响其阅读,又能让其在阅读过程中学习生字,从而可以帮助其更快速地提升识字量。

需要说明的是,上述识字库的组成仅是本实施例提供的几种示例,在实际应用过程中,可以对识字库的构成进行调整,以上描述不构成对本发明的唯一限定。

示例性设备

在介绍了本发明示例性实施方式的方法之后,接下来,参考图9对本发明示例性实施方式的识字量检测装置进行介绍。图9示意性地示出了根据本发明实施例的识字量检测装置的结构框图。

本发明示例性实施方式的识字量检测装置包括:

识字测试模块901,用于从字表中随机抽取测试字以对检测对象进行识字测试。

识字量计算模块902,用于在达成测试终止条件时,分别获取检测对象识别正确的测试字中字频最低的第一测试字,以及识别错误的测试字中字频最高的第二测试字;并根据字表中第一测试字与第二测试字之间的测试字的识字率,计算得到检测对象的识字量。

其中,在字表中,测试字依据字频排序;测试字的识字率与测试字的字频负相关。

进一步地,本发明还提供了一种阅读书籍确定装置,其在上述识字量检测装置的基础上增加了一个书籍确定模块,用于基于检测对象的识字库生成检测对象的推荐阅读书籍;与之对应地,识字量计算模块还用于依据检测对象的识字量生成检测对象的识字库。

与前述方法实施例相对应地,本发明实施例中还提供了一种如图10所示的电子设备。图10示意性地示出了本发明实施例的电子设备的示例性结构框图。

图10所示的电子设备1000,包括:处理器1010;以及存储器1020,存储器1020上存储有可执行的程序指令,当所述程序指令由所述处理器1010来执行时,使得所述电子设备实现如前文所述的任一项方法。

在图10的电子设备1000中,仅示出了与本实施例有关的组成元素。因此,对于本领域普通技术人员而言显而易见的是:电子设备1000还可以包括与图10中所示的组成元素不同的常见组成元素。

处理器1010可以控制电子设备1000的操作。例如,处理器1010通过执行电子设备1000上的存储器1020中存储的程序,来控制电子设备1000的操作。处理器1010可以由电子设备1000中提供的中央处理单元(CPU)、应用处理器(AP)、人工智能处理器芯片(IPU)等来实现。然而,本披露不限于此。在本实施方式中,处理器1010可以按任何适当的方式实现。例如,处理器1010可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。

存储器1020可以用于存储电子设备1000中处理的各种数据、指令的硬件。例如,存储器1020可以存储电子设备1000中的处理过的数据和待处理的数据。存储器1020可存储处理器1010已处理或要处理的数据集。此外,存储器1020可以存储要由电子设备1000驱动的应用、驱动程序等。存储器1020可以是DRAM,但是本披露不限于此。存储器1020可以包括易失性存储器或非易失性存储器中的至少一种。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存、相变RAM(PRAM)、磁性RAM(MRAM)、电阻RAM(RRAM)、铁电RAM(FRAM)等。易失性存储器可以包括动态RAM(DRAM)、静态RAM(SRAM)、同步DRAM(SDRAM)、PRAM、MRAM、RRAM、铁电RAM(FeRAM)等。在实施例中,存储器1020可以包括硬盘驱动器(HDD)、固态驱动器(SSD)、高密度闪存(CF)、安全数字(SD)卡、微安全数字(Micro-SD)卡、迷你安全数字(Mini-SD)卡、极限数字(xD)卡、高速缓存(caches)或记忆棒中的至少一项。

综上,本说明书实施方式提供的电子设备1000的存储器1020和处理器1010实现的具体功能,可以与本说明书中的前述实施方式相对照解释,并能够达到前述实施方式的技术效果,这里便不再赘述。

或者,本披露还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有计算机程序指令(或计算机程序、或计算机指令代码),当所述计算机程序指令(或计算机程序、或计算机指令代码)被电子设备(或电子设备、服务器等)的处理器执行时,使所述处理器执行根据本披露的上述方法的各个步骤的部分或全部。

应当注意,尽管在上文详细描述中提及了设备的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。

此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

申请文件中提及的动词“包括”、“包含”及其词形变化的使用不排除除了申请文件中记载的那些元素或步骤之外的元素或步骤的存在。元素前的冠词“一”或“一个”不排除多个这种元素的存在。

虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。

技术分类

06120115925456