掌桥专利:专业的专利平台
掌桥专利
首页

一种增强的神经认知诊断模型

文献发布时间:2023-06-19 11:57:35


一种增强的神经认知诊断模型

技术领域

本发明涉及教育数据挖掘技术领域,涉及学生认知诊断方法。

背景技术

一、名词解释:

1.试题难度:表示试题考察每个知识点的难度。2.试题区分度:表示试题区分不同水平学生的参数。3.知识点熟练度:表示学生的知识点掌握程度的参数。4.Q矩阵:描述测验项目(试题)与属性(知识点)间关系的矩阵,一般由J(试题数)行K(知识点数)列的0-1矩阵组成。Q

二、现有技术:1.项目反映理论(Item Response Theory,IRT):最常用的单维连续认知诊断模型之一,它假设学生对试题的作答结果服从独立同分布,并将每位学生的认知状态表示为一个单维连续的能力值,再结合试题特征(区分度、难度等)建模学生的答题情况。IRT模型的评估函数有多种形式,较常见的IRT模型的函数形式是三参数逻辑斯蒂回归IRT模型(Three-Parameter Logistic IRT,3PL-IRT)。2.DINA(Deterministic Input,NoisyAND-gate)模型:DINA模型在使用学生在试题上的答题情况的基础上,通过结合试题知识点关联矩阵(Q矩阵)对学生的知识点掌握程度进行诊断并将学生建模成一个在多维知识点上的掌握向量,然后进一步结合试题上的猜测和失误参数,并预测学生在试题上的表现情况。3.NeuralCDM(Neural Cognitive Diagnosis Model):对于每个作答记录,NeuralCD模型首先使用学生和试题对应的one-hot向量作为输入。然后在获得学生的知识点熟练度向量和试题的知识点相关度向量、试题难度向量与试题区分度向量后,将它们输入神经交互层。最后该框架输出学生正确作答的概率,并同时获取学生的知识点熟练度向量。

三、技术问题:现有认知诊断模型通常使用人工设计的函数对学生的练习过程进行挖掘,这些函数通常较为简单且不能很好地捕获学生和习题间的复杂关系,影响了诊断效果。另一方面,NeuralCD模型仍存在试题方面的诊断因素利用不充分的缺点,忽略知识点重要性因素对诊断效果的影响。此外,在学生和试题的交互函数拟合方面,对于知识点熟练度向量和知识点难度向量,NeuralCD模型仅通过简单地相减来融合诊断因素。而并未考虑知识点熟练度和知识点难度本身对作答预测结果的重要程度信息,进而影响诊断效果。

发明内容

一、针对上述缺点,本发明的目的是为了提高了学生和习题间的复杂关系的拟合程度,不仅考虑了试题所考查的知识点的重要性(即知识点的重要程度)因素对诊断效果的影响,而且分别考虑了学生的知识点熟练度和试题的知识点难度本身对答题预测的重要程度对诊断效果的影响,从而提升诊断效果。

二、本发明的技术创新点:1.达到的技术效果是:对于试题与知识点的关系是一对多的数据,在诊断效果上,优于NeuralCD模型。2.达到的技术效果是:对于试题与知识点的关系是一对多和一对一的数据,在诊断效果上,均优于NeuralCD模型。

附图说明

附图1解释发明内容

具体实施方式

见说明书附图1所示,ENeuralCD模型主要由4个部分组成:

1.诊断因素的向量表示:

在学生方面,本文采用知识点熟练度向量α表征学生。α由学生独热编码向量x与可训练矩阵A相乘得出的,即

α=sigmoid(x×A)

其中,α∈(0,1)

在试题方面,知识点关联向量p直接来自预先给定的Q矩阵:

p=z×Q

其中,p∈{0,1}

对于其他可选因素,使用知识点难度向量β和试题区分度γ。β=[β

β=sigmoid(z×B)

γ=sigmoid(z×D)

其中,β∈(0,1)

2.计算知识点重要性向量:

知识点的频率信息由知识点在试题中的考查次数除以试题数量决定,通过Q矩阵来实现,具体见以下公式。

其中,kf

对于知识点重要性的计算,首先将知识点频率向量kf和试题的知识点难度向量β按列拼接得到所有试题考查到的知识点的矩阵化表示(类似于文本的一个句子的矩阵化表示形式):

现在把π

c

其中,b为偏置,运算符·为点乘。激活函数f,本文选sigmoid函数。c

为了更加精准地获得知识点的重要性,本文采用多个滤波器提取更多的特征向量,即矩阵C=[c

λ=softmax(Cw)

3.其中,w∈R

4.诊断因素向量融合:

使用注意力机制计算知识点熟练度和知识点难度本身对作答预测结果的重要程度信息。首先将α和β进行拼接,得到Ω=[α,β]

a′

其中,W

借鉴NeuralCD模型的方法,首先对知识点相关度向量p、知识点熟练度向量α、知识点难度向量β和试题区分度γ采用下面公式融合:

其中,h∈(0,1)

而对公式融合诊断因素向量h和知识点重要性因素向量λ的融合,采用add融合方法实现所有诊断因素的融合,得到融合所有诊断因素的融合向量t。公式如下:

其中,t∈(0,1)

5.交互函数及损失函数:

ENeuralCDM的交互函数是由两个全连接层和一个输出层构成:

f

f

y=Φ(W

其中,W

ENeuralCD模型的损失函数是输出y与真实标签r之间的交叉熵:

此外,在训练结束后,α的值就是对学生的知识水平的诊断结果,即知识点掌握程度。

相关技术
  • 一种增强的神经认知诊断模型
  • 一种用于增强大脑认知功能的脑神经刺激装置
技术分类

06120113114968