作答准确率的预测方法、装置、设备及介质

文献发布时间：2023-06-19 19:30:30

技术领域

本公开涉及人工智能领域，尤其涉及作答准确率的预测方法、装置、设备及介质。

背景技术

知识追踪技术可根据学生过去的答题情况对学生的知识掌握情况进行建模，以此可预测学生的未来答题表现，也即可预估学生的学习能力，据此可为学生提供个性化教学辅导及制定个性化学习路径，实现教学方案的个性化设计。然而，发明人经研究发现，在现有的知识追踪技术中主要是将学生在题目上的作答记录替换为在题目对应的知识点上的作答记录，以此对学生在未来知识点上的作答情况进行预测，但这种方式所得的预测结果的准确率仍旧有待提高。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种作答准确率的预测方法、装置、设备及介质。

根据本公开的一方面，提供了一种作答准确率的预测方法，包括：获取用户的已作答题目的题目信息、作答结果和时间信息，以及待作答题目的题目信息和时间信息；根据所述已作答题目的题目信息和作答结果、以及所述待作答题目的题目信息，确定所述用户的第一知识状态；根据所述已作答题目的时间信息和作答结果、以及所述待作答题目的时间信息，确定所述用户的第二知识状态；基于所述第一知识状态和所述第二知识状态，预测所述待作答题目的作答准确率。

根据本公开的另一方面，提供了一种作答准确率的预测装置，包括：信息获取模块，用于获取用户的已作答题目的题目信息、作答结果和时间信息，以及待作答题目的题目信息和时间信息；第一状态确定模块，用于根据所述已作答题目的题目信息和作答结果、以及所述待作答题目的题目信息，确定所述用户的第一知识状态；第二状态确定模块，用于根据所述已作答题目的时间信息和作答结果、以及所述待作答题目的时间信息，确定所述用户的第二知识状态；准确率预测模块，用于基于所述第一知识状态和所述第二知识状态，预测所述待作答题目的作答准确率。

根据本公开的另一方面，提供了一种电子设备，包括：处理器；以及存储程序的存储器，其中，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行所述的作答准确率的预测方法。

根据本公开的另一方面，提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述作答准确率的预测方法。

本公开实施例中提供的上述技术方案，能够根据已作答题目的题目信息和作答结果、以及待作答题目的题目信息，确定用户的第一知识状态，以及根据已作答题目的时间信息和作答结果、以及待作答题目的时间信息，确定用户的第二知识状态，并可以综合第一知识状态和第二知识状态，预测待作答题目的作答准确率。上述方式可以基于题目信息、时间信息等不同因素分别确定不同的知识状态，进一步基于题目信息所得的知识状态以及基于时间信息所得的知识状态综合预测作答准确率，有助于进一步提升预测准确性，较好地保障预测结果的可靠性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种作答准确率的预测方法的流程示意图；

图2为本公开实施例提供的一种作答准确率的预测系统的结构示意图；

图3为本公开实施例提供的一种作答准确率的训练方法的流程示意图；

图4为本公开实施例提供的一种作答准确率的预测装置的结构示意图；

图5为本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本公开使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

图1为本公开实施例提供的一种作答准确率的预测方法的流程示意图，该方法可以由作答准确率的预测装置执行，其中该装置可以采用软件和/或硬件实现，一般可集成在电子设备中。如图1所示，该方法主要包括如下步骤S102～步骤S108：

步骤S102，获取用户的已作答题目的题目信息、作答结果和时间信息，以及待作答题目的题目信息和时间信息。

在一些实施示例中，假设待作答题目为第t+1道题目，则已作答题目可以是第t道题目，也可以是第1道题目～第t道题目，也可以是第t+1道题目之前的N道题目，在此不进行限制。另外，待作答题目也可以理解为第t+1时刻要做的题目，而已作答题目可以是已在第t时刻作答的题目，或者已在第1～t时刻作答的t道题目，或者已在第t+1时刻之前作答的N道题目，应当说明的是，相邻时刻之间的间隔不进行限制，上述时刻主要用于表征题目的作答时刻。已作答题目的题目信息可以包括题目的知识点信息、文本信息、ID信息、难度信息、题库中包含有该题目的知识点的所有题目的整体变化信息中的一种或多种，具体可根据需求灵活设置。为便于处理，已作答题目的作答结果可以直接用作答正误表示。待作答题目的题目信息可参照已作答题目的题目信息，在此不再赘述，已作答题目的时间信息可以包括已作答题目的开始作答时间，还可以包含作答结束时间或者作答时长等，在此不进行限制，待作答题目的时间信息可以是待作答题目的开始作答时间，只是待作答题目还未作答完成，需要对待作答题目的作答结果是否准确进行预测。另外，已作答题目及未作答题目的时间信息还可以包含该题目与上一道题目之间的时间间隔、该题目的作答时间与上一次作答该题目的知识点的时间之间的时间间隔等，在此不进行限制。

步骤S104，根据已作答题目的题目信息和作答结果、以及待作答题目的题目信息，确定用户的第一知识状态。

在本公开实施例中，可以首先基于已作答题目的题目信息和待作答题目的题目信息分别进行题目特征提取，还可以基于已作答题目的题目信息和作答结果进行交互特征提取，以此衡量用户与已作答题目的交互情况，进而可基于未作答题目的题目特征以及已作答题目(也可称为历史题目)的题目特征及交互特征来评估用户在作答第t+1道题目(也可称为在待作答题目对应的t+1时刻)时的知识状态，其中，知识状态可以表征用户的学习能力、知识水平等。也即，上述步骤可以站在题目角度上评估用户的知识状态。

步骤S106，根据已作答题目的时间信息和作答结果、以及待作答题目的时间信息，确定用户的第二知识状态。

在本公开实施例中，充分考虑到用户作答的时间信息对于预测结果的影响，因此在题目信息的基础上额外引入了时间信息，基于已作答题目的时间信息和待作答题目的时间信息分别进行时间特征提取，以及衡量用户与已作答题目的交互情况，进而可基于未作答题目的时间特征以及已作答题目的时间特征及交互特征来评估用户在作答第t+1道题目(也可称为在待作答题目对应的t+1时刻)时的知识状态，也即上述步骤站在时间角度上评估用户的知识状态。

步骤S108，基于第一知识状态和第二知识状态，预测待作答题目的作答准确率。

在一些具体的实施示例中，可以将第一知识状态和第二知识状态进行加权，得到综合知识状态，从而基于综合知识状态对学生在待作答题目的表现进行预测，由于上述方式不仅基于题目信息生成的第一知识状态，而且还充分利用作答时间信息并生成相应的第二知识状态，并通过多个知识状态综合进行预测评估，进一步优化了知识追踪效果。

综上，上述方式可以基于题目信息、时间信息等不同因素分别确定不同的知识状态，进一步基于题目信息所得的知识状态以及基于时间信息所得的知识状态综合预测作答准确率，有助于进一步提升预测准确性，较好地保障预测结果的可靠性。

在一些实施方式中，本公开实施例提供了上述步骤S104，也即根据已作答题目的题目信息和作答结果、以及待作答题目的题目信息，确定用户的第一知识状态的步骤，可以参照如下步骤a～步骤c执行：

步骤a，基于目标题目的题目信息进行特征提取，得到目标题目的题目特征；其中，目标题目包括已作答题目和待作答题目。也即，已作答题目和待作答题目分别可作为目标题目，既基于已作答题目的题目信息进行特征提取，得到已作答题目的题目特征，又基于未作答题目的题目信息进行特征提取，得到未作答题目的题目特征。其中，上述题目特征也可称为题目表征或者题目特征向量。

在一些具体的实施示例中，目标题目的题目信息包括：目标题目的知识点信息、目标题目的难度信息以及目标题目对应的题目集合的整体变化信息中的一种或多种；其中，题目集合是预设题库中包含有目标题目的知识点的题目的集合，整体变化信息用于表征题目集合中的题目之间的差异，也即，题目集合包含有同一知识点的不同题目，整体变化信息可衡量归属同一知识点下的所有题目的差异性。在一些实施示例中，对于每个目标题目而言，倘若该目标题目有多个知识点，则可以针对每个知识点分别获取包含该知识点的所有题目的题目集合，也即获取多个题目集合；也可以获取同时包含相同的多个知识点的所有题目的题目集合，也即只获取一个题目集合；具体可根据需求灵活设置，在此不进行限制。上述方式在提取题目特征时，不仅考虑到题目的知识点，而且还考虑到题目本身的难度，以及同一知识点的不同题目的差异性。基于知识点信息和/或难度信息进行特征提取，避免相关技术中直接采用题目ID提取题目特征所存在的稀疏性问题，而基于知识点对应的整体变化信息进行特征提取，而也可避免仅使用知识点信息而导致同一知识点下各个题目无法区分的问题。综上，通过基于本公开实施例提供的上述题目信息进行特征提取，可较好地保障提取的题目特征的有效性和可靠性。

在一些实施方式中，目标题目的题目信息同时包括：目标题目的知识点信息、目标题目的难度信息以及目标题目对应的题目集合的整体变化信息，在此基础上，上述步骤a在具体实施时，可以根据目标题目的知识点信息、难度信息以及整体变化信息，生成目标题目的题目特征。也即，通过上述方式，可以分别得到已作答题目的题目特征以及未作答题目的题目特征。具体实现时，对于任一时刻t对应的题目(也可理解为任一第t道题目)，题目特征可以为：

步骤b，基于已作答题目的题目信息和作答结果，得到已作答题目的交互特征。该交互特征可用于体现用户与已作答题目之间的交互情况。

在一些实施方式中，题目信息包括知识点信息，上述步骤b在具体实施时，可以基于已作答题目的知识点信息和作答结果，生成已作答题目的交互特征。具体实现时，对于任一时刻t对应的题目，交互特征

步骤c，根据目标题目的题目特征以及已作答题目的交互特征，确定用户的第一知识状态。

在一些实施示例中，可以利用注意力机制，根据目标题目的题目特征以及已作答题目的交互特征，确定用户的第一知识状态。示例性地，目标题目的题目特征包括未作答题目(假设第t+1时刻对应的题目)的题目特征x

其中，

应当说明的是，以上仅为示例性说明，本公开实施例对用于执行本公开实施例提供的作答准确率的预测方法的知识追踪模型的实现方式不进行限制，该模型可以采用注意力网络，也可以采用诸如图网络、循环神经网络、记忆网络等，采用不同的网络，则可基于不同网络各自的参数确定相应的第一知识状态，无需局限于只利用注意力机制的方式确定第一知识状态，具体可灵活设置，在此不进行限制。

在一些实施方式中，本公开实施例提供了上述步骤S106，也即根据已作答题目的时间信息和作答结果、以及待作答题目的时间信息，确定用户的第二知识状态的步骤，可以参照如下步骤A～步骤C执行：

步骤A，基于目标题目的时间信息进行特征提取，得到目标题目的时间特征；其中，目标题目包括已作答题目和待作答题目。也即，已作答题目和待作答题目分别可作为目标题目，既基于已作答题目的时间信息进行特征提取，得到已作答题目的时间特征，又基于未作答题目的时间信息进行特征提取，得到未作答题目的时间特征。其中，上述时间特征也可称为时间表征或者时间特征向量。

本公开实施例中的目标题目的时间信息可以不仅包含开始作答时间或者作答时长，为了能够更合理地提取时间特征，从时间角度上评估用户的知识状态，在一些实施方式中，在目标题目为非首道题目的情况下，目标题目的时间信息包括：目标题目与目标题目的上一道题目之间的时间间隔；和/或，在目标题目之前还存在与目标题目具有相同知识点的关联题目的情况下，目标题目的时间信息包括：目标题目与目标题目之前的上一道关联题目之间的时间间隔。

在此基础上，上述步骤A在具体实施时，可以参照如下步骤A1～步骤A3实现：

步骤A1，在目标题目为非首道题目的情况下，根据目标题目与目标题目的上一道题目之间的时间间隔，生成目标题目对应的第一特征向量；且在目标题目为首道题目的情况下，确定目标题目对应的第一特征向量为第一预设向量。

具体实现时，可以对目标题目与目标题目的上一道题目之间的时间间隔进行离散化处理，基于离散化处理结果得到目标题目对应的第一特征向量。诸如，可以统计任一时刻t(也即任一第t道题)与上一时刻t-1(也即第t-1道题)之间时间戳的差值，并基于差值进行离散化处理得到one-hot向量(独热向量)，将得到的one-hot向量作为t时刻的题目对应的第一特征向量rg

步骤A2，在目标题目之前还存在与目标题目具有相同知识点的关联题目的情况下，根据目标题目与目标题目之前的上一道关联题目之间的时间间隔，生成目标题目对应的第二特征向量；且在目标题目之前不存在与目标题目具有相同知识点的关联题目的情况下，确定目标题目对应的第二特征向量为第二预设向量。

具体实现时，可以对目标题目与目标题目之前的上一道关联题目之间的时间间隔进行离散化处理，基于离散化处理结果得到目标题目对应的第二特征向量。诸如，可以统计第t时刻所做的知识点c

在实际应用中，步骤A1和步骤A2可以任选其一执行，也可以均执行，具体可根据实际需求进行选择，在此不进行限制。

步骤A3，根据获得的第一特征向量和/或第二特征向量，生成目标题目的时间特征。

倘若仅执行上述步骤A1，则只获得第一特征向量，即根据第一特征向量生成目标题目的时间特征；倘若仅执行上述步骤A2，则只获得第二特征向量，即根据第二特征向量生成目标题目的时间特征；倘若同时执行上述步骤A1和步骤A2，则可同时获得第一特征向量和第二特征向量，即根据第一特征向量和第二特征向量，生成目标题目的时间特征。在实际应用中，可以将获得的第一特征向量和/或第二特征向量进行矩阵变化，从而得到时间特征。在同时获得第一特征向量和第二特征向量的情况下，可以将第一特征向量和第二特征向量进行拼接，然后将拼接向量进行矩阵变化，得到时间特征。

进一步，为了得到更可靠更丰富的时间特征，在一些具体的示例中，上述步骤A3可以参照如下步骤A3.1～步骤A3.3执行：

步骤A3.1，获取用户针对目标题目的知识点的作答总次数，并根据作答总次数生成第三特征向量。在实际应用中，可以获取用户所有所做的历史题目中出现的该知识点的作答总次数，也可以获取指定历史时长内用户所做题目中出现的该知识点的作答总次数，具体可灵活设置，在此不进行限制。具体的，可以基于作答总次数进行离散化处理，基于离散化处理结果得到目标题目对应的第三特征向量。诸如，假设第t时刻的题目的知识点为c

步骤A3.2，将第三特征向量与获得的第一特征向量和/或第二特征向量进行拼接，得到拼接结果。

以同时获得第一特征向量rg

步骤A3.3，根据拼接结果生成目标题目的时间特征。

示例性地，可以对拼接结果(拼接向量)进行稠密处理，诸如通过对拼接结果进行矩阵变化，从而得到时间特征。具体的，时间特征t

通过上述方式，新增两个时间戳相关的特征及一个基于时间步的统计特征，从而对时间信息进行了充分编码，可有效增强模型对用户知识状态的建模效果。相比于直接使用时间差并进行离散化的方法，上述方式利用的时间信息更为丰富，所得的时间特征更丰富更可靠，有助于后续能够更可靠地获得在时间层面上的用户知识状态。

步骤B，基于已作答题目的题目信息和作答结果，获取已作答题目的交互特征。获取交互特征的方式具体可参照前述步骤b，也可以直接获取前述步骤b所得的交互特征，无需重复计算。

步骤C，根据目标题目的时间特征以及已作答题目的交互特征，确定用户的第二知识状态。

在一些实施示例中，可以利用注意力机制，根据目标题目的时间特征以及已作答题目的交互特征，确定用户的第二知识状态。示例性地，目标题目的时间特征包括未作答题目(假设第t+1时刻对应的题目)的时间特征t

其中，

与第一知识状态类似，以上仅为示例性说明，本公开实施例对知识追踪模型的实现方式不进行限制，该模型可以采用注意力网络，也可以采用诸如图网络、循环神经网络、记忆网络等，采用不同的网络，则可基于不同网络各自的参数确定相应的第二知识状态，无需局限于只利用注意力机制的方式确定第二知识状态，具体可灵活设置，在此不进行限制。

在一些实施方式中，本公开实施例提供了上述步骤S108，也即基于第一知识状态和第二知识状态，预测待作答题目的作答准确率的步骤，可以参照如下步骤一和步骤二执行：

步骤一，基于第一知识状态和第二知识状态，生成综合知识状态。相比于相关技术中只针对单一的知识状态进行知识追踪，预测用户在未作答题目上的表现，本公开实施例可以从不同角度分别确定相应的知识状态，并基于不同的知识状态确定综合知识状态，从而对知识追踪效果进行优化。

在一些实施示例中，可以获取预先设定的第一知识状态和第二知识状态的权重，并基于获取到的权重对第一知识状态和第二知识状态进行加权处理，从而得到综合知识状态。本公开实施例对第一知识状态和第二知识状态的权重的获取方式不进行限制，可以根据需求灵活设置，为了能够更合理可靠地对第一知识状态和第二知识状态进行综合，在一些具体的实施示例中，步骤一可以参照如下步骤(1)和步骤(2)执行：

(1)根据第一知识状态和第二知识状态确定权重向量；权重向量的维度与第一知识状态的维度及第二知识状态的维度均相同。应当说明的是，与只设置单一数值的权重相比，本公开实施例可基于第一知识状态和第二知识状态生成多维的权重向量，权重向量的维度与第一知识状态的维度及第二知识状态的维度均相同，也即，可以在每个维度上分别对第一知识状态与第二知识状态进行加权，以此确保最终所得的综合知识状态的可靠性。

权重向量是基于第一知识状态和第二知识状态生成的，示例性地，可以对第一知识状态和第二知识状态分别进行稠密处理，并基于稠密处理后的第一知识状态和稠密处理后的第二知识状态进行加和处理，得到加和结果；最后基于sigmoid函数对加和结果进行处理，得到权重向量。应当说明的是，第一知识状态和第二知识状态的具体稠密处理方式可以相同，也可以不同，且稠密处理所需的参数也可以相同或不同，在此不进行限制。在实际应用中，可通过矩阵变化的方式进行稠密处理，也即，首先对第一知识状态进行第一矩阵变化，对第二知识状态进行第二矩阵变化，然后基于经第一矩阵变化后的第一知识状态和经第二矩阵变化的第二知识状态的加和结果，生成权重向量。示例性地，可以参照如下公式：

其中，w

(2)根据权重向量对第一知识状态和第二知识状态进行加权求和，得到综合知识状态。

在一些具体的实施示例中，可以参照如下公式对第一知识状态和第二知识状态进行加权求和：

其中，h

步骤二，根据综合知识状态预测待作答题目的作答准确率。

在一些具体的实施示例中，在执行步骤二时，可以根据待作答题目的题目信息和时间信息、以及综合知识状态，预测待作答题目的作答准确率。具体实现时，可以将待作答题目对应的题目特征和时间特征相加之后与综合知识状态进行拼接，对拼接结果进行稠密化处理，并利用ReLU函数对稠密化处理结果进行处理，以得到待作答题目的作答准确率。示例性地，可以参照如下公式获取待作答题目的作答准确率：：

其中，W、W3和W4分别为矩阵，b、b3、b4分别为偏置参数，，具体数值可基于训练时学习得到或者预先设置，在此不再赘述。

在前述实施例的基础上，图2所示的一种作答准确率的预测系统的结构示意图，可利用该预测系统实现本公开实施例提供的作答准确率的预测方法，在该系统中，示意出题目特征提取器、时间特征提取器、知识状态提取器、作答结果预测器，除此之外，还用虚线框示意出模型训练器，应当说明的是，模型训练器只用于知识追踪模型的训练期间，而在模型训练结束之后，则可去除模型训练器，因此在图2中仅以虚线框示意模型训练器。

在图2中，可通过题目特征提取器获得题目特征和交互特征，应当说明的是，在本公开实施例中的题目特征提取器也可用于生成交互特征，在实际应用中也可单独设置交互特征提取器，具体可灵活设置；可通过时间特征提取器获得时间特征；通过知识状态提取器利用题目特征、交互特征和时间特征生成第一知识状态及第二知识状态，并在第一知识状态和第二知识状态的基础上生成综合知识状态；作答结果预测器可基于综合知识状态预测未作答题目的作答准确率。模型训练器可以在模型训练阶段根据真实作答结果与模型预测结果计算损失函数，通过反向传播方法进行模型参数优化，具体的，损失函数可以参照如下所示:

对于任一时刻t对应的题目，r

以上仅为示例性说明，在实际应用中也可采用其它方式进行模型训练，在此不进行限制。

在实际应用中，为达到预测目的，可以利用任意知识追踪模型，知识追踪模型可以采用注意力网络实现，也可以采用循环神经网络、记忆网络、图网络等模型实现，在此不进行限制。以知识追踪模型采用注意力网络为例，利用本公开实施例提供的上述方式，可将作答时间信息融入注意力网络，从而对网络预测性能进行优化。

在前述基础上，本公开实施例进一步提供了如图3所示的一种作答准确率的训练方法的流程示意图，该方法主要包括如下步骤S302～步骤S318：

步骤S302，获取目标题目的题目信息和时间信息，以及已作答题目的作答结果；其中，目标题目包括已作答题目和待作答题目。

步骤S304，根据目标题目的题目信息，生成目标题目的题目特征。

步骤S306，基于已作答题目的题目信息和作答结果，生成已作答题目的交互特征。

步骤S308，根据目标题目的时间信息，生成目标题目的时间特征。

步骤S310，根据目标题目的题目特征以及已作答题目的交互特征，确定用户的第一知识状态。

步骤S312，根据目标题目的时间特征以及已作答题目的交互特征，确定用户的第二知识状态。

步骤S314，根据所述第一知识状态和所述第二知识状态确定权重向量。

步骤S316，根据所述权重向量对所述第一知识状态和所述第二知识状态进行加权求和，得到综合知识状态。

步骤S318，根据待作答题目的题目特征和时间特征以及综合知识状态，预测待作答题目的作答准确率。

以上步骤的具体实现方式可参照前述相关内容，在此不再赘述。

综上所述，通过本公开实施例提供的上述方法，可以基于题目信息、时间信息等不同因素分别确定不同的知识状态，进一步基于题目信息所得的知识状态以及基于时间信息所得的知识状态综合预测作答准确率，有助于进一步提升预测准确性，较好地保障预测结果的可靠性。另外，应当说明的是，发明人经研究发现，在相关技术提供的知识追踪方法中基本均未充分利用作答时间信息，多数仅利用模型自身的序列属性来对作答先后次序进行建模，或者基于作答时间步的差异来微调注意力权重等，忽略了作答时间信息之间的相似性，并未考虑到时间信息对于预测结果的重要性，而本公开实施例中不仅站在题目角度上评估用户的知识状态，而且还站在时间角度上评估用户的知识状态，且时间信息可以包含用户作答相邻题目之间的时间间隔、用户作答同一知识点之间的时间间隔等信息，因此可充分利用时间信息，从而更合理可靠地评估用户在时间层面上的知识状态，并且，通过基于时间信息的知识状态和基于题目信息的知识状态进行加权，所得的综合知识状态更为准确客观，进一步基于综合知识状态可更有效地预测学生在未作答题目上的表现，提高预测结果的准确性。

对应于前述作答准确率的预测方法，本公开实施例还提供了一种作答准确率的预测装置，图4为本公开实施例提供的一种作答准确率的预测装置的结构示意图，该装置可由软件和/或硬件实现，一般可集成在电子设备中。如图4所示，作答准确率的预测装置400包括：

信息获取模块402，用于获取用户的已作答题目的题目信息、作答结果和时间信息，以及待作答题目的题目信息和时间信息；

第一状态确定模块404，用于根据已作答题目的题目信息和作答结果、以及待作答题目的题目信息，确定用户的第一知识状态；

第二状态确定模块406，用于根据已作答题目的时间信息和作答结果、以及待作答题目的时间信息，确定用户的第二知识状态；

准确率预测模块408，用于基于第一知识状态和第二知识状态，预测待作答题目的作答准确率。

上述装置可以基于题目信息、时间信息等不同因素分别确定不同的知识状态，进一步基于题目信息所得的知识状态以及基于时间信息所得的知识状态综合预测作答准确率，有助于进一步提升预测准确性，较好地保障预测结果的可靠性。

在一些实施方式中，第一状态确定模块404具体用于：基于目标题目的题目信息进行特征提取，得到所述目标题目的题目特征；其中，所述目标题目包括所述已作答题目和所述待作答题目；基于所述已作答题目的题目信息和作答结果，得到所述已作答题目的交互特征；根据所述目标题目的题目特征以及所述已作答题目的交互特征，确定所述用户的第一知识状态。

在一些实施方式中，所述目标题目的题目信息包括：所述目标题目的知识点信息、所述目标题目的难度信息以及所述目标题目对应的题目集合的整体变化信息中的一种或多种；其中，所述题目集合是预设题库中包含有所述目标题目的知识点的题目的集合，所述整体变化信息用于表征所述题目集合中的题目之间的差异。

在一些实施方式中，第一状态确定模块404具体用于：根据所述目标题目的知识点信息、难度信息以及整体变化信息，生成所述目标题目的题目特征；基于所述已作答题目的知识点信息和作答结果，生成所述已作答题目的交互特征。

在一些实施方式中，第二状态确定模块406具体用于：基于目标题目的时间信息进行特征提取，得到所述目标题目的时间特征；其中，所述目标题目包括所述已作答题目和所述待作答题目；基于所述已作答题目的作答结果，获取所述已作答题目的交互特征；根据所述目标题目的时间特征以及所述已作答题目的交互特征，确定所述用户的第二知识状态。

在一些实施方式中，在所述目标题目为非首道题目的情况下，所述目标题目的时间信息包括：所述目标题目与所述目标题目的上一道题目之间的时间间隔；和/或，在所述目标题目之前还存在与所述目标题目具有相同知识点的关联题目的情况下，所述目标题目的时间信息包括：所述目标题目与所述目标题目之前的上一道关联题目之间的时间间隔。

在一些实施方式中，第二状态确定模块406具体用于：在所述目标题目为非首道题目的情况下，根据所述目标题目与所述目标题目的上一道题目之间的时间间隔，生成所述目标题目对应的第一特征向量；且在所述目标题目为首道题目的情况下，确定所述目标题目对应的第一特征向量为第一预设向量；和/或，在所述目标题目之前还存在与所述目标题目具有相同知识点的关联题目的情况下，根据所述目标题目与所述目标题目之前的上一道关联题目之间的时间间隔，生成所述目标题目对应的第二特征向量；且在所述目标题目之前不存在与所述目标题目具有相同知识点的关联题目的情况下，确定所述目标题目对应的第二特征向量为第二预设向量；根据获得的所述第一特征向量和/或所述第二特征向量，生成所述目标题目的时间特征。

在一些实施方式中，第二状态确定模块406具体用于：获取所述用户针对所述目标题目的知识点的作答总次数，并根据所述作答总次数生成第三特征向量；将所述第三特征向量与获得的所述第一特征向量和/或所述第二特征向量进行拼接，得到拼接结果；根据所述拼接结果生成所述目标题目的时间特征。

在一些实施方式中，准确率预测模块408具体用于：基于所述第一知识状态和所述第二知识状态，生成综合知识状态；根据所述综合知识状态预测所述待作答题目的作答准确率。

在一些实施方式中，准确率预测模块408具体用于：根据所述第一知识状态和所述第二知识状态确定权重向量；根据所述权重向量对所述第一知识状态和所述第二知识状态进行加权求和，得到综合知识状态。其中，所述权重向量的维度与所述第一知识状态的维度及所述第二知识状态的维度均相同。

在一些实施方式中，准确率预测模块408具体用于：对所述第一知识状态和所述第二知识状态分别进行稠密处理；基于稠密处理后的所述第一知识状态和稠密处理后的所述第二知识状态进行加和处理，得到加和结果；利用sigmoid函数对所述加和结果进行处理，得到权重向量。

在一些实施方式中，准确率预测模块408具体用于：根据所述待作答题目的题目信息和时间信息、以及所述综合知识状态，预测所述待作答题目的作答准确率。

本公开实施例所提供的作答准确率的预测装置可执行本公开任意实施例所提供的作答准确率的预测方法，具备执行方法相应的功能模块和有益效果。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置实施例的具体工作过程，可以参考方法实施例中的对应过程，在此不再赘述。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

本公开示例性实施例还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序，所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的方法。

本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。

本公开示例性实施例还提供一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本公开实施例所提供的作答准确率的预测方法。所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

参考图5，现将描述可以作为本公开的服务器或客户端的电子设备500的结构框图，其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图5所示，电子设备500包括计算单元501，其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序，来执行各种适当的动作和处理。在RAM 503中，还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

电子设备500中的多个部件连接至I/O接口505，包括：输入单元506、输出单元507、存储单元508以及通信单元509。输入单元506可以是能向电子设备500输入信息的任何类型的设备，输入单元506可以接收输入的数字或字符信息，以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元507可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元508可以包括但不限于磁盘、光盘。通信单元509允许电子设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理。例如，在一些实施例中，作答准确率的预测方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到电子设备500上。在一些实施例中，计算单元501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行作答准确率的预测方法。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

如本公开使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘子韬;刘琼琼;罗伟其;
专利申请人：北京乐柏信息咨询有限公司;

上一篇：一种多时间尺度实时优化调度方法、系统、设备及介质
下一篇：多层中高渗砂岩储层化学转向酸化分级方法