教学水平评估方法、装置、电子设备及存储介质

文献发布时间：2024-07-23 01:35:21

技术领域

本发明涉及数据处理技术领域，尤其是涉及一种教学水平评估方法、装置、电子设备及存储介质。

背景技术

在传统的教育环境中，教学水平的评估通常依赖于直接的观察、学生的反馈、考试成绩等直观且定性的方法。然而，这些方法存在着一些局限性，比如评估的主观性高、覆盖面和细致程度有限、数据利用率低、缺乏客观和系统的评估机制。随着教育数据的快速增长和技术的进步，有必要开发更高效、更准确的评估方法来应对这些挑战。

此外，随着人工智能和机器学习技术的发展，数据驱动的教学评估方法开始受到重视。这些方法能够处理大量的教学相关数据，如教学活动记录、学生反馈、成绩记录等，从而提供更全面和客观的教学质量评估。然而，在教学领域中，获取到的数据量通常是有限的，以及在数据处理能力、模型稳定性和评估准确性方面仍有不足。

发明内容

有鉴于此，本发明的目的在于提供一种教学水平评估方法、装置、电子设备及存储介质，不仅扩大了训练数据量，解决了训练数据量不足的问题，还提高数据处理能力、模型稳定性和评估的准确性。

第一方面，本发明实施例提供了一种教学水平评估，包括：获取教学数据；将教学数据进行格式转换和特征提取，得到教学数据向量；将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果；教学水平评估模型基于目标训练数据集进行迭代训练得到；目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。

在本发明较佳的实施例中，上述预先训练的教学水平评估模型通过以下步骤进行训练：对采集到的多个教学数据样本进行标注得到第一训练数据集；对第一训练数据集进行数据向量化处理得到第二训练数据集；对第二训练数据集进行数据扩充得到第三训练数据集；对第三训练数据集进行特征提取得到第四训练数据集；对第四训练数据集进行特征降维得到目标训练数据集；基于目标训练数据集训练教学水平评估模型，得到预先训练的教学水平评估模型。

在本发明较佳的实施例中，上述对采集到的多个教学数据样本进行标注得到第一训练数据集，包括：确定多个教学数据样本分别对应的评估等级；基于评估等级对教学数据样本进行标注得到第一训练数据集。

在本发明较佳的实施例中，上述第一训练数据集中包括多个第一训练数据，对第一训练数据集进行数据向量化处理得到第二训练数据集，包括：对第一训练数据中的文本数据进行向量化处理得到文本特征向量；对第一训练数据中的类别数据利用独热编码进行向量化处理得到类别特征向量；对第一训练数据中的数值数据进行标准化处理得到数值特征向量；将文本特征向量、类别特征向量和数值特征向量进行向量合并，得到第二训练数据集。

在本发明较佳的实施例中，上述对第二训练数据集进行数据扩充得到第三训练数据集，包括：基于第二训练数据集采用基于潜在狄利克雷分配的生成对抗网络进行数据扩充，得到第三训练数据集。

在本发明较佳的实施例中，上述对第三训练数据集进行特征提取得到第四训练数据集，包括：基于第三训练数据集利用全连接神经网络进行特征提取，得到第四训练数据集；其中，全连接神经网络为预先进行参数优化的基于光谱能量的神经网络。

在本发明较佳的实施例中，上述第四训练数据集中包括多个第四训练数据，对第四训练数据集进行特征降维得到目标训练数据集，包括：将第四训练数据输入至自编码器网络中，自编码器网络捕捉第四训练数据的层次特征并进行特征选择得到信息特征；自编码器网络基于信息特征对第四训练数据进行重建输出目标训练数据；多个目标训练数据组成目标训练数据集。

第二方面，本发明实施例还提供一种教学水平评估装置，包括：教学数据获取模块，用于获取教学数据；教学数据处理模块，用于将教学数据进行格式转换和特征提取，得到教学数据向量；教学数据向量输入模块，用于将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果；教学水平评估模型基于目标训练数据集进行迭代训练得到；目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。

第三方面，本发明实施例还提供一种电子设备，包括处理器和存储器，存储器存储有能够被处理器执行的计算机可执行指令，处理器执行计算机可执行指令以实现上述第一方面的教学水平评估方法。

第四方面，本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令，计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现上述第一方面的教学水平评估方法。

本发明实施例带来了以下有益效果：

本发明实施例提供了一种教学水平评估方法、装置、电子设备及存储介质，通过获取教学数据，将教学数据进行格式转换和特征提取，得到教学数据向量，再将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果。其中，教学水平评估模型基于目标训练数据集进行迭代训练得到，目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。该方式中，不仅扩大了训练数据量，解决了训练数据量不足的问题，还提高数据处理能力、模型稳定性和评估的准确性。

本公开的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本公开的上述技术即可得知。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种教学水平评估方法的流程图；

图2为本发明实施例提供的另一种教学水平评估方法的流程图；

图3为本发明实施例提供的一种教学水平评估装置的结构示意图；

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以及，在相关技术中，可能存在以下问题仍需进一步解决：

1）传统技术可能未能充分捕获和分析复杂的教学活动数据，如教师的教学方法、学生反馈等多维度信息。这限制了评估的全面性和准确性。

2）现有技术可能缺乏有效的数据扩充方法，特别是在处理有限或不平衡的数据集时。这导致训练模型时的数据不足，影响模型的泛化能力和准确性。

3）在某些神经网络结构中，可能会遇到梯度消失、爆炸或陷入局部最优解的问题。这些问题影响训练的稳定性和模型的性能。

4）传统的特征处理方法可能未能有效降低特征冗余和噪声，导致特征表示不够精确，影响最终的分类准确性和区分性。

5）现有的分类方法可能未充分考虑异常值处理和分类置信度评估，导致分类结果的准确性和鲁棒性不足。

基于此，本发明实施例提供的一种教学水平评估方法、装置、电子设备及存储介质，可以通过获取教学数据，将教学数据进行格式转换和特征提取，得到教学数据向量，再将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果。其中，教学水平评估模型基于目标训练数据集进行迭代训练得到，目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。该方式中，不仅扩大了训练数据量，解决了训练数据量不足的问题，还提高数据处理能力、模型稳定性和评估的准确性。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种教学水平评估方法进行详细介绍。

实施例1

本发明实施例提供一种教学水平评估方法，图1为本发明实施例提供的一种教学水平评估方法的流程图。如图1所示，该教学水平评估方法可以包括如下步骤：

步骤S101，获取教学数据。

其中，教学数据可以来源于教学场景，教学数据可以是教学数据记录文档，教学数据记录文档中可以包括教师名称、教学方法、教学内容、学生反馈、学习效果评估、上课时间、课程难度评级等，教学方法可以是讲授、讨论、实验等，学生反馈可以通过问卷调查获取，学习效果评估可以通过测试分数确定。

步骤S102，将教学数据进行格式转换和特征提取，得到教学数据向量。

其中，格式转换具体是将教学数据转换为结构化文本，转换后得到的结构化文本具体包括文本、数值、时间戳等多种类型数据。

其中，可以提取格式转换后的教学数据的文本特征、类别特征和数值特征并进行合并，得到教学数据向量。

步骤S103，将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果。

其中，教学水平评估模型基于目标训练数据集进行迭代训练得到；目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。

本发明实施例提供的教学水平评估方法，可以通过获取教学数据，将教学数据进行格式转换和特征提取，得到教学数据向量，再将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果。其中，教学水平评估模型基于目标训练数据集进行迭代训练得到，目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。该方式中，不仅扩大了训练数据量，解决了训练数据量不足的问题，还提高数据处理能力、模型稳定性和评估的准确性。

实施例2

本发明实施例还提供另一种教学水平评估方法；该方法在上述实施例方法的基础上实现；该方法重点描述预先训练的教学水平评估模型的训练步骤。

图2为本发明实施例提供的另一种教学水平评估方法的流程图，如图2所示，该预先训练的教学水平评估模型可以通过以下步骤进行训练：

步骤S201，对采集到的多个教学数据样本进行标注得到第一训练数据集。

其中，教学数据样本可以来源于教学场景，教学数据样本可以是教学数据样本记录文档，教学数据样本记录文档中可以包括教师名称、教学方法、教学内容、学生反馈、学习效果评估、上课时间、课程难度评级等，教学方法可以是讲授、讨论、实验等，学生反馈可以通过问卷调查获取，学习效果评估可以通过测试分数确定。

具体地，对采集到的多个教学数据样本进行标注得到第一训练数据集可以包括：确定多个教学数据样本分别对应的评估等级；基于评估等级对教学数据样本进行标注得到第一训练数据集。

其中，可以对该教学数据样本的评估等级进行标记，可以通过人工确定评估等级并标注，也可以另外训练模型进行评估等级的确定及标注，此处不作限定。标注的评估等级可以包括“优秀”、“良好”、“一般”、“较差”，分别对应标号1、2、3、4，进行标记后的教学数据样本即为第一训练数据，多个第一训练数据组成第一训练数据集。

步骤S202，对第一训练数据集进行数据向量化处理得到第二训练数据集。

其中，可以对第一训练数据进行向量化处理，以构建特征集，

具体地，对第一训练数据集进行数据向量化处理得到第二训练数据集，可以包括：对第一训练数据中的文本数据进行向量化处理得到文本特征向量；对第一训练数据中的类别数据利用独热编码进行向量化处理得到类别特征向量；对第一训练数据中的数值数据进行标准化处理得到数值特征向量；将文本特征向量、类别特征向量和数值特征向量进行向量合并，得到第二训练数据集。

其中，可以先进行词汇索引构建，即为第一训练数据中的文本数据建立词汇索引，文本数据可以是教师名称、教学方法、教学内容等，文本数据中每个特殊的词汇项分配一个唯一的索引值，然后进行特征编码，利用词袋模型对文本数据进行向量化处理，得到文本特征向量。文本特征向量的每个元素代表对应词汇索引中的词是否出现在第一训练数据中，或代表对应词汇索引中的词在第一训练数据中出现频率的权重。

其中，可以对类别数据使用独热编码进行向量化，得到类别特征向量。类别数据可以是教学方法的分类，例如教学方法分为讲授、讨论、实验，对应的三个特征向量可以为：[1,0,0]、[0,1,0]、[0,0,1]。

其中，可以对数值数据进行标准化处理，得到数值特征向量，使其均值为0，标准差为1，数值数据可以是测试分数。

进一步地，将文本特征向量、类别特征向量和数值特征向量进行向量合并，得到综合特征向量，以构建特征集，

为了保证数据的一致性和完整性，在对第一训练数据中的文本数据进行向量化处理之前，可以先对第一训练数据进行数据清洗，例如将第一训练数据转换为标准化文本格式，以及填补缺失值或移除无关数据等。

步骤S203，对第二训练数据集进行数据扩充得到第三训练数据集。

由于训练数据的采集获取、标注及预处理是耗时耗力的，且训练数据样本不足，容易导致模型泛化能力差，同时影响模型的精度，因此可以对数据进行扩充，以增加样本数据的数量。具体可以通过使用潜在狄利克雷分配模型捕捉数据中的潜在主题结构，作为生成对抗网络生成新样本数据的先验知识，同时，利用距离度量学习确保生成的样本数据在特征空间中保持适当的差异性，避免过度类似的重复数据。

具体地，对第二训练数据集进行数据扩充得到第三训练数据集，可以包括：基于第二训练数据集采用基于潜在狄利克雷分配的生成对抗网络进行数据扩充，得到第三训练数据集。

其中，基于潜在狄利克雷分配的生成对抗网络的训练流程可以包括以下步骤：

步骤A1：训练潜在狄利克雷分配模型。

具体地，定义

进一步地，对第二训练数据应用潜在狄利克雷分配模型，识别每个第二训练数据中的潜在主题。在潜在狄利克雷分配模型中，每个第二训练数据的主题分布由Dirichlet分布生成，可以表示为以下算式（1）：

（1）

每个词

（2）

每个主题

（3）

每个词

（4）

其中，

进一步地，Dirichlet分布是一个多变量概率分布，用于描述

（5）

其中，

步骤A2：初始化生成对抗网络网络。

具体地，构建生成器和判别器网络，其中生成器接收潜在主题分布作为输入。生成器

（6）

其中，

（7）

其中，

进一步地，对于生成器

（8）

（9）

其中，

步骤A3：训练生成对抗网络网络。

具体地，使用第二训练数据训练生成对抗网络，生成器试图生成新样本，判别器试图区分真实样本和生成样本，生成器的损失函数可以为以下算式（10），判别器的损失函数可以为以下算式（11）：

（10）

其中，

（11）

其中，

步骤A4：应用距离度量学习。

具体地，在生成对抗网络的训练过程中引入距离度量学习，调整生成样本使其在特征空间中保持一定的差异性。其中，对于每一对样本

（12）

进一步地，目标函数

（13）

其中，

进一步地，对于相似性和不相似性样本对的确定，相似性样本对

步骤A5：样本生成和评估。

具体地，生成新的数据样本，并通过判别器进行质量评估，确保样本的真实性和多样性，计算真实性得分

（14）

步骤A6：采用同步骤二相同的数据向量化处理方式，将生成的样本构建为特征集

具体的，对特征集

步骤A61：特征关联矩阵的构建。

对于特征集

（15）

其中，

进一步地，定义特征映射函数

（16）

将原始特征空间映射到一个新的特征空间，以加强特征间的关联性，可以表示为以下算式（17）：

（17）

其中，

步骤A62：进行自适应权重调整。

具体地，为了适应不同数据的特性，引入自适应权重，调整方式可以表示为以下算式（18）：

（18）

其中，

步骤A7：数据扩充。

具体地，重复迭代步骤A2-A6，直至满足预设的最大迭代次数。将质生成样本添加到第二训练数据集中，形成第三训练数据集，用于后续的特征提取。

步骤S204，对第三训练数据集进行特征提取得到第四训练数据集。

由于在一些情况下使用神经网络进行特征提取，在某些神经网络结构中，可能会遇到梯度消失、梯度爆炸或陷入局部最优解的问题，影响训练的稳定性和模型的性能。因此，可以通过基于光谱能量的神经网络参数优化方法解决上述问题。

该方式受启发于自然界中光谱的分布与变化原理，在自然界中，光谱的变化反映了物质的不同状态和性质。类似地，本方式通过模拟光谱的分布和调整来实现神经网络参数的优化。在这种框架下，每个神经网络的参数，例如权重和偏置，被视为一个光谱能量点，其位置和强度随着训练过程动态变化。将神经网络的每个参数映射到一个光谱能量分布上，通过调整能量分布来优化参数。同时，根据网络在训练过程中的表现，动态调整每个参数对应的光谱能量，以达到最优化。此外，当某些参数的光谱能量达到共振状态时，这些参数被认为是最优的，此时会减少对这些参数的调整，从而保持网络的稳定性。

具体地，对第三训练数据集进行特征提取得到第四训练数据集，可以包括：基于第三训练数据集利用全连接神经网络进行特征提取，得到第四训练数据集。

其中，全连接神经网络为预先进行参数优化的基于光谱能量的神经网络。对基于光谱能量的神经网络进行参数优化方式可以包括以下步骤：

步骤B1：初始化光谱能量分布。

具体地，定义

进一步地，为神经网络的每个参数分配初始的光谱能量值。对于神经网络中的每个参数

（19）

其中，

步骤B2：前向传播与能量映射。

具体地，在神经网络的前向传播过程中，根据参数的当前值映射出相应的光谱能量。在前向传播期间，每个参数的光谱能量

（20）

其中，

进一步地，梯度项

（21）

其中，

（22）

其中，

步骤B3：损失计算与能量分析。

具体地，计算网络输出的损失，并分析当前光谱能量分布对损失的影响。在一个实施例中，损失函数

（23）

其中，

步骤B4：能量调整策略。

具体地，根据损失和光谱能量分布的关系，调整每个参数的光谱能量，可以表示为以下算式（24）：

（24）

其中，

进一步地，梯度项

（25）

其中，根据

（26）

其中，

（27）

将这一算式（27）代入上述链式法则中，得到更完整的

（28）

其中，

步骤B5：参数更新。

具体地，根据调整后的光谱能量更新神经网络的参数。神经网络的每个参数

进一步地，对于频谱特性值的计算，每个参数不仅有光谱能量

（29）

其中，

步骤B6：共振检测与稳定化。

具体地，检测光谱能量的共振状态，并对达到共振状态的参数进行稳定化处理。如果

步骤B7：迭代优化。

具体地，重复以上步骤B1-B6，直到达到预设的迭代次数。

步骤S205，对第四训练数据集进行特征降维得到目标训练数据集。

其中，可以通过最优稀疏化的自编码器算法实现数据特征的有效降维，通过自编码器的编码和解码过程，提取第四训练数据的关键特征，同时通过最优稀疏化策略，减少特征的冗余和噪声，从而提高特征的代表性和区分性。

具体地，第四训练数据集中包括多个第四训练数据，对第四训练数据集进行特征降维得到目标训练数据集，可以包括：将第四训练数据输入至自编码器网络中，自编码器网络捕捉第四训练数据的层次特征并进行特征选择得到信息特征；自编码器网络基于信息特征对第四训练数据进行重建输出目标训练数据；多个目标训练数据组成目标训练数据集。

其中，设第四训练数据集为

具体地，编码器的每一层可以表示为以下算式（30）：

（30）

其中，

进一步地，稀疏化正则化约束条件为以下算式（31）：

（31）

其中，

进一步地，对于编码层公式权重矩阵

进一步地，稀疏化项

（32）

其中，

（33）

其中，

具体地，信息特征为最有信息量的特征，可以通过ReliefF特征选择得到信息特征，ReliefF算法用于特征选择，通过考察特征与输出类别之间的相关性，得到信息特征。

其中，可以将ReliefF算法与自编码器的训练过程相结合，用于指导稀疏化过程，进一步提高降维的有效性，评估并选择最具代表性的特征。

具体地，ReliefF算法更新权重的方式可以表示为以下算式（34）：

（34）

其中，

（35）

其中，

（36-1）

（36-2）

其中，

具体地，解码器的每一层可以表示为以下算式（37）：

（37）

其中，

其中，可以结合自编码器和ReliefF算法的特点，开发一种动态调整的稀疏化策略。根据数据的特征和网络的学习进展，动态调整稀疏化强度，以实现最优的特征提取。

具体地，根据学习进度调整稀疏化强度的方式可以表示为以下算式（38）：

（38）

其中，

最后，输出降维后的目标训练数据

步骤S206，基于目标训练数据集训练教学水平评估模型，得到预先训练的教学水平评估模型。

其中，教学水平评估模型可以为一种改进的反传播神经网络分类器，通过结合分位数梯度下降和置信度评分，能够更有效地处理教学水平评估中的数据，提高分类的准确性和鲁棒性。

具体地，改进的反传播神经网络分类器算法构建流程可以包括以下步骤：

步骤C1：基础反传播神经网络模型构建。

其中，反传播神经网络是一种结合了Kohonen神经网络和Grossberg神经网络的混合型神经网络。它能够通过自我组织和有监督学习来实现模式识别和非线性映射。反传播神经网络的输入层接收数据，Kohonen层（竞争层）进行自我组织学习，Grossberg层（输出层）进行有监督学习。

步骤C2：基于分位数梯度下降优化。

其中，在传统的反传播神经网络训练过程中引入分位数梯度下降算法，以优化网络对异常值的鲁棒性。使用分位数梯度下降来调整Kohonen层的权重，增强网络对数据分布尾部的敏感性，从而更好地处理异常值或极端案例。在Grossberg层应用分位数梯度下降，以优化输出层的权重更新。

步骤C3：置信度评估。

其中，在反传播神经网络的训练和输出阶段加入置信度评估机制，以提高分类的准确性和可靠性。具体地，在Kohonen层的输出加入置信度评分，基于输入数据与目标训练数据的相似度给出一个置信度评分。Grossberg层根据置信度评分调整输出，增强或减弱某些分类的权重。

步骤C4：迭代训练。

具体地，迭代训练可以包括以下步骤：

步骤C41：数据接收。

具体地，输入层接收目标训练数据。同时，定义

步骤C42：自我组织学习。

其中，Kohonen层对数据进行自我组织，具体地，Kohonen层对数据进行自我组织学习的方式可以表示为以下算式（39）：

（39）

其中，

进一步地，利用分位数梯度下降优化权重，即，对

步骤C43：置信度评分。

具体地，可以根据数据与目标训练数据的相似度计算置信度评分，可以表示为以下算式（40）：

（40）

其中，

进一步地，计算距离

（41）

其中，

步骤C44：有监督学习。

其中，Grossberg层根据置信度调整输出，完成最终的分类，可以表示为以下算式（42）:

（42）

其中，

进一步地，输出层权重更新的方式结合邻域函数，可以表示为以下算式（43）：

（43）

其中，

（44）

其中，

在迭代时进行梯度计算，考虑到输出层的非线性激活函数，本发明采用链式法则进行梯度计算，可以表示为以下算式（45）：

（45）

其中，

对于每一轮训练，不断迭代上述步骤C41-C44，直到网络输出稳定，即为训练完成，得到预先训练的教学水平评估模型。

本发明实施例提供的教学水平评估方法，通过详细的数据向量化处理和特征提取，更准确地捕捉数据的多维特征。通过使用生成对抗网络进行数据扩充，并结合潜在狄利克雷分配捕捉数据中的潜在主题结构，创新性地增加了数据多样性，同时保持了数据的真实性和相关性。通过基于光谱能量的神经网络参数优化，借鉴自然界中光谱的分布与变化原理，通过模拟光谱能量分布来动态调整神经网络参数，解决了梯度消失、爆炸的问题，提高了模型的稳定性和性能。通过结合自编码器的强大特征提取能力和ReliefF算法的有效特征选择，实现了数据特征的有效降维和噪声减少，提高了特征的代表性和区分性。通过结合分位数梯度下降和置信度评分，在处理异常值和提高分类准确性的方面表现出较传统方式更优的性能。

实施例3

对应于上述方法实施例，本发明实施例提供了一种教学水平评估装置，图3为本发明实施例提供的一种教学水平评估装置的结构示意图，如图3所示，该教学水平评估装置可以包括：

教学数据获取模块301，用于获取教学数据。

教学数据处理模块302，用于将教学数据进行格式转换和特征提取，得到教学数据向量。

教学数据向量输入模块303，用于将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果；教学水平评估模型基于目标训练数据集进行迭代训练得到；目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。

本发明实施例提供的教学水平评估装置，可以通过获取教学数据，将教学数据进行格式转换和特征提取，得到教学数据向量，再将教学数据向量输入至预先训练的教学水平评估模型中，输出教学数据对应的教学水平评估结果。其中，教学水平评估模型基于目标训练数据集进行迭代训练得到，目标训练数据集基于对采集到的多个教学数据样本进行标注、数据向量化处理、数据扩充、特征提取以及特征降维后得到。该方式中，不仅扩大了训练数据量，解决了训练数据量不足的问题，还提高数据处理能力、模型稳定性和评估的准确性。

在一些实施例中，教学数据向量输入模块，还用于对采集到的多个教学数据样本进行标注得到第一训练数据集；对第一训练数据集进行数据向量化处理得到第二训练数据集；对第二训练数据集进行数据扩充得到第三训练数据集；对第三训练数据集进行特征提取得到第四训练数据集；对第四训练数据集进行特征降维得到目标训练数据集；基于目标训练数据集训练教学水平评估模型，得到预先训练的教学水平评估模型。

在一些实施例中，教学数据向量输入模块，还用于确定多个教学数据样本分别对应的评估等级；基于评估等级对教学数据样本进行标注得到第一训练数据集。

在一些实施例中，第一训练数据集中包括多个第一训练数据，教学数据向量输入模块，还用于对第一训练数据中的文本数据进行向量化处理得到文本特征向量；对第一训练数据中的类别数据利用独热编码进行向量化处理得到类别特征向量；对第一训练数据中的数值数据进行标准化处理得到数值特征向量；将文本特征向量、类别特征向量和数值特征向量进行向量合并，得到第二训练数据集。

在一些实施例中，教学数据向量输入模块，还用于基于第二训练数据集采用基于潜在狄利克雷分配的生成对抗网络进行数据扩充，得到第三训练数据集。

在一些实施例中，教学数据向量输入模块，还用于基于第三训练数据集利用全连接神经网络进行特征提取，得到第四训练数据集；其中，全连接神经网络为预先进行参数优化的基于光谱能量的神经网络。

在一些实施例中，第四训练数据集中包括多个第四训练数据，教学数据向量输入模块，还用于将第四训练数据输入至自编码器网络中，自编码器网络捕捉第四训练数据的层次特征并进行特征选择得到信息特征；自编码器网络基于信息特征对第四训练数据进行重建输出目标训练数据；多个目标训练数据组成目标训练数据集。

本发明实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

实施例4

本发明实施例还提供了一种电子设备，用于运行上述教学水平评估方法；参见图4所示的一种电子设备的结构示意图，该电子设备包括存储器400和处理器401，其中，存储器400用于存储一条或多条计算机指令，一条或多条计算机指令被处理器401执行，以实现上述教学水平评估方法。

进一步地，图4所示的电子设备还包括总线402和通信接口403，处理器401、通信接口403和存储器400通过总线402连接。

其中，存储器400可能包含高速随机存取存储器（RAM，Random Access Memory），也可能还包括非不稳定的存储器（non-volatile memory），例如至少一个磁盘存储器。通过至少一个通信接口403（可以是有线或者无线）实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线402可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器401可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DigitalSignal Processor，简称DSP)、专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器400，处理器401读取存储器400中的信息，结合其硬件完成前述实施例的方法的步骤。

本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现上述教学水平评估方法，具体实现可参见方法实施例，在此不再赘述。

本发明实施例所提供的进行教学水平评估方法的计算机程序产品，包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：山东理工职业学院;

上一篇：面向任务效能的试验因素水平分析方法、装置和电子设备
下一篇：医用吊塔供气状态智能监控预警系统