一种在国际中文教学中的语素测试方法、系统及终端

文献发布时间：2024-04-18 19:59:31

技术领域

本发明属于国际中文教育技术领域，尤其涉及一种在国际中文教学中的语素测试方法、系统及终端。

背景技术

目前，随着国际中文教育事业的蓬勃发展，我们一方面需要与世界接轨的国际标准来指导现有的国际中文教学；另一方面国际中文教育也要顺应数字化时代潮流、满足海外不同国家不同区域中文教学的特点，进行智能化、精准化和个性化教学。2021年7月1日开始实施的《国际中文教育中文水平等级标准》为国际中文教育需要掌握的语素制定了全球化标准，然而目前依然缺乏统一的、客观的测试方法，便于教师了解学生语素掌握情况以进行有效评估，实现教学的智能化、个性化和精准化。

通过上述分析，目前国际中文教学研究中存在学习者语素量测试无依据，无法匹配测试语素难度和被测者词汇掌握程度以及不能根据语素信息熵分布进行测试的问题。因此，亟需设计一种国际中文教学中的新型的语素测试方法及系统。

发明内容

针对现有技术存在的问题，本发明提供了一种在国际中文教学中的语素测试方法、系统及终端，尤其涉及一种在国际中文教学中的基于IRT反应理论的语素测试方法、系统、介质、设备及终端，旨在解决现有中文研究中，学习者语素量测试无依据，无法匹配测试语素难度和被测者词汇掌握程度以及不能根据语素信息熵分布进行测试的问题。

本发明是这样实现的，一种在国际中文教学中的语素测试方法，所述在国际中文教学中的语素测试方法，包括基于IRT的语素认知概率分布模型算法，基于IRT的最小二乘拟合方法和被测者语素量估计算法三部分，具体包括依赖语素信息熵进行排序、筛选待测语素、被测者认知度估计、语素认知度概率拟合最小二乘拟合以及基于IRT方法的语素量计算方法。

进一步，所述在国际中文教学中的语素测试方法包括以下步骤：

步骤一，依赖语素频次和难度的信息熵对语素进行排序，完成对语素难度的排序过程，便于了解不同出现频次和难度的语素所包含的实际信息量的大小，从而有利于对不同程度的测试者进行筛选测试；

步骤二，筛选待测语素，被测者对待测语素的认知度估计，主要完成对被测试者的认知度抽样概率估计；

步骤三，基于IRT方法的语素认知度概率拟合最小二乘拟合，通过最小二乘和滤波拟合的方法，得到对所有已知语素的掌握度估计，完成被测试者的语素掌握度的总体分布估计；

步骤四，计算被测者的语素量，通过计算掌握程度概率分布和语速信息量的加权和，得到被测试者的整体语速掌握程度，便于国际中文教师对学生的中文认知水平的客观评价。

进一步，所述步骤一中的依赖语素频次和难度信息熵对语素进行排序包括：

开始测试前，根据语素长度、年级学段和HSK考试词频的关键因素，计算语素的信息熵h(n),n＝1,2,…,N，并依照语素的信息熵由小到大进行排序。

其中，词汇分层方法中按照以下步骤对语素进行分组：

(1)将所得到的语素列表进行属性填充，获得每个语素的长度、HSK考试词频参数，计算词汇表中每个语素的具体难度，计算公式如下：

式中，F

(2)依据语素信息熵进行排序，其中取出1级、3级、5级的HSK常考词汇算例并组成列表。

进一步，所述步骤二中的筛选待测语素包括：依据信息熵的具体分布，挑选出K个待测语素，推送被测者进行认知度测试。

其中，语素测试初始值设定方法中，对词汇量测试初始值设定的步骤如下：

(1)从所有的语素排序中，均匀取出K个语素；

(2)其中K的个数不超过100个。

所述被测者对待测语素的认知度估计包括：被测者查看待测词汇表，获知被测者对每个语素的认知与否，用

其中，语素测试方法中对待测者进行词汇认知度测试的步骤如下：

(1)将K个取出的词汇交给被测者进行测试；

(2)被测者按照认知与否给出词汇的认识标识，认知给1，不认知给0；

(3)将被测的序列组成认知度测试的结果，形成一个序列：

进一步，所述步骤三中的语素认知度概率拟合最小二乘拟合包括：

采用形态滤波数据拟合方法，对采集的语素进行滤波拟合处理，得到所有待测词汇的认知度概率；依据语素区分度参数a、语素难度b和语素认知度猜测参数c，利用最小二乘准则，估计出实际被测者的IRT认知曲线参数a，b和c；认知曲线为

其中，所述语素认知度概率拟合最小二乘拟合具体包括：

(1)将步骤二中获得的序列A(n)依次排列，得到一个0～1序列；

(2)将序列A(n)中的1修改为100，序列中的0保持为0，整个序列由0～1二进制序列变为0～100的浮点序列；

(3)通过三界贝塞尔平滑滤波算法，对序列A(n)进行滤波，得到一个非零的浮点序列

B(t)＝(1-t)

(4)利用最小二乘算法，利用序列

(5)根据公式

进一步，所述步骤四中的语素量计算方法包括：依据拟合结果，计算得到被测试者的实际语素量，计算公式为

其中，所述语素量计算方法具体包括：根据获得的语素的认知度以及语素的信息量，计算得到被测者掌握的所有的语素的量，计算公式如下：

本发明的另一目的在于提供一种应用所述在国际中文教学中的语素测试方法的在国际中文教学中的语素测试系统，所述在国际中文教学中的语素测试系统包括：

语素排序模块，用于依赖语素频次和难度的信息熵对语素进行排序；

认知度估计模块，用于筛选待测语素，被测者对待测语素的认知度估计；

最小二乘拟合模块，用于利用最小二乘算法，采用形态滤波数据拟合方法对采集的语素进行滤波拟合处理，获取所有待测词汇的认知度概率；

语素量计算模块，用于根据获得的语素的认知度以及语素的信息量，计算得到被测者掌握的所有语素量。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述在国际中文教学中的语素测试方法的步骤。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行所述在国际中文教学中的语素测试方法的步骤。

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述在国际中文教学中的语素测试系统。

结合上述的技术方案和解决的技术问题，本发明所要保护的技术方案所具备的优点及积极效果为：

第一，针对上述现有技术存在的技术问题以及解决该问题的难度，紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等，详细、深刻地分析本发明技术方案如何解决的技术问题，解决问题之后带来的一些具备创造性的技术效果。具体描述如下：

本发明提供的在国际中文教学中的基于IRT反应理论的语素测试方法，达到了对语素信息熵进行估计，并且依据语素信息熵进行测试语素的挑选，通过IRT理论和最小二乘算法对被测者掌握的语素关键曲线进行拟合，得到个性化的认知度估计函数，从认知度概率出发，通过一次性给用户固定的单词测试，精准估计了被测者的语素量，达到了语素随机测试的精准性，有利于国际中文教学中确定被测者的语素掌握程度，快速展开有针对性的个性化教学。

第二，把技术方案看做一个整体或者从产品的角度，本发明所要保护的技术方案具备的技术效果和优点，具体描述如下：

本发明提供的在国际中文教学中的基于IRT反应理论的语素测试方法，主要解决现有中文研究中，学习者语素量测试无依据，无法匹配测试语素难度和被测者词汇掌握程度以及不能根据语素信息熵分布进行测试的问题。本专利提出了一种基于IRT反应理论的国际中文教学的语速测试方法，创新点在于(1)创新型的利用语速信息熵理论的客观方法，替代了依赖教师教学经验的主观方法，对语速进行分级分类，(2)采用了基于IRT反应曲线进行抽样语速测试和曲线拟合，通过抽样方法和IRT理论，保证了抽样测试的精准性，减小了测试误差，(3)通过语素信息熵和被测者的对每个语速的掌握概率加权，精确计算了被测者的语速掌握程度，客观反映了被测者的中文水平。

第三，作为本发明的权利要求的创造性辅助证据，还体现在以下几个重要方面：

(1)本发明的技术方案转化后的预期收益和商业价值为：

为国际中文教学的规范化及学生中文语素的掌握水平，提供了客观、统一、精准的国际中文教学中学生中文掌握水平的理论依据；为开发标准的个性化、智能化的国际中文教学系统提供了量化统一的计算标准；为开发统一的国际中文教学的软件系统提供了理论基础，具备很高的商业价值。

(2)本发明的技术方案填补了国内外业内技术空白：

本方案解决了现有国际中文教学研究中存在学习者语素量测试无依据，无法匹配测试语素难度和被测者词汇掌握程度以及不能根据语素信息熵分布进行测试的问题，填补了国际中文教学中语素掌分级分类标准、语速测试方法的空白。

(3)本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题：

本发明的技术方案，规避了国际中文教学过程中，不同教学经验和层次的教师对语素的难度认知的不同理解和评价，形成了统一的语素难度的评价标准形成了客观、统一、精确的语素测试方法。

(4)本发明的技术方案克服了技术偏见：

本发明有效的克服了传统的国际中文教学过程中教师的主观性带来的理解和认知偏差，形成了统一的语素评价和学习者语素的测试标准。具备客观性，没有技术偏见。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的在国际中文教学中的语素测试方法流程图；

图2是本发明实施例提供的三界贝塞尔平滑滤波算法原理图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种在国际中文教学中的语素测试方法、系统及终端，下面结合附图对本发明作详细的描述。

为了使本领域技术人员充分了解本发明如何具体实现，该部分是对权利要求技术方案进行展开说明的解释说明实施例。

如图1所示，本发明实施例提供的在国际中文教学中的语素测试方法包括以下步骤：

S101，依赖语素频次和难度的信息熵对语素进行排序；

S102，筛选待测语素，被测者对待测语素的认知度估计；

S103，基于IRT方法的语素认知度概率拟合最小二乘拟合；

S104，计算被测者的语素量。

作为优选实施例，本发明实施例提供的在国际中文教学中的语素测试方法，具体包括以下步骤：

(1)依赖语素信息熵进行排序：开始测试前，根据语素长度、年级学段、HSK考试词频等关键因素，计算语素的信息熵h(n),n＝1,2,…,N，并且依照语素的信息熵由小到大进行排序。

(2)筛选待测语素：依据信息熵的具体分布，挑选出K个待测语素，推送被测者进行认知度测试。

(3)被测者认知度估计：被测者查看待测词汇表，获知被测者对每个语素的认知与否，用

(4)语素认知度概率拟合最小二乘拟合：采用形态滤波数据拟合方法，对采集的语素进行滤波拟合处理，得到所有待测词汇的认知度概率。依据语素区分度参数a，语素难度b和语素认知度猜测参数c，利用最小二乘准则，估计出实际被测者的IRT认知曲线参数a，b和c。认知曲线为

(5)基于IRT方法的语素量计算方法：依据拟合结果，计算出被测试者的实际语素量，计算公式为

本发明实施例提供的词汇分层方法中对语素进行分组是按照以下步骤进行：

1a)首先将所得到的语素列表进行属性填充，获得每个语素的长度、HSK考试词频等参数，计算词汇表中每个语素的具体难度。计算公式如下：

其中F

1b)依据语素信息熵进行排序，其中取出1级、3级、5级的HSK常考词汇算例列表如表1所示。

表1 HSK常考词汇算例

本发明实施例提供的语素测试初始值设定方法中，对词汇量测试初始值设定的具体步骤如下：

3a)从所有的语素排序中，均匀取出K个语素；

3b)其中K的个数不超过100个。

本发明实施例提供的语素测试方法中，所描述的对待测者进行词汇认知度测试，其步骤如下：

3a)将K个取出的词汇交给被测者进行测试；

3b)被测者按照认知与否，给出该词汇的认识标识，认知了就给1，不认知就给0；

3c)将被测的序列组成认知度测试的结果，形成一个序列，即

本发明实施例提供的语素认知度概率拟合最小二乘拟合中，采用形态滤波数据拟合方法，对采集的语素进行滤波拟合处理，获取所有待测词汇的认知度概率，是通过以下步骤实现的：

4a)先将步骤(3c)中获得的序列A(n)依次排列，得到一个0-1序列；

4b)将序列A(n)中的1修改为100，序列中的0保持为0，整个序列由0-1二进制序列变为0-100的浮点序列；

4c)通过三界贝塞尔平滑滤波算法，对序列A(n)进行滤波，得到一个非零的浮点序列

B(t)＝(1-t)

4c)利用最小二乘算法，利用序列

4d)根据公式

本发明实施例提供的基于IRT方法的语素量计算方法，具体的步骤如下：

5a)根据获得的语素的认知度，以及语素的信息量，计算得出被测者掌握的所有的语素的量，计算公式如下：

本发明实施例提供的在国际中文教学中的语素测试系统包括：

语素排序模块，用于依赖语素频次和难度的信息熵对语素进行排序；

认知度估计模块，用于筛选待测语素，被测者对待测语素的认知度估计；

最小二乘拟合模块，用于利用最小二乘算法，采用形态滤波数据拟合方法对采集的语素进行滤波拟合处理，获取所有待测词汇的认知度概率；

语素量计算模块，用于根据获得的语素的认知度以及语素的信息量，计算得到被测者掌握的所有语素量。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：温州大学;

上一篇：基于分数阶模型的电池SOC与SOP估计方法及系统
下一篇：喇叭和/或麦克风的检测方法、指标处理方法及装置