导航：首页> 道路、铁路或桥梁的建筑>自适应学习信息推荐方法、装置、设备及存储介质

自适应学习信息推荐方法、装置、设备及存储介质

文献发布时间：2024-01-17 01:13:28

技术领域

本申请涉及自适应学习技术领域，具体而言，涉及一种自适应学习信息推荐方法、装置、设备及存储介质。

背景技术

自适应学习是通过学习者每一阶段的个体特征测评结果，再制定出适应于学习者自身需求的学习解决方案，精准定制专属于每一位学习者的学习计划的一种学习方式。

现有的自适应学习系统中，一般是记录学习者的学习过程、学习行为、学习结果等要素，通过学习分析自动评估学习者的认知状态，并根据学习者的特征推荐适合学习者个性特征的学习资源。

但是，目前的自适应学习系统对学习者的学习路径的制定不够精准和灵活，因此存在学习资源推荐准确度低的问题。

发明内容

本申请的目的在于，针对上述现有技术中的不足，提供一种自适应学习信息推荐方法、装置、设备及存储介质，以解决现有技术中学习资源推荐准确度低的问题。

为实现上述目的，本申请采用的技术方案如下：

第一方面，本申请提供了一种自适应学习信息推荐方法，所述方法包括：

基于学习者的当前学习策略向所述学习者推荐当前学习资源,并获取所述学习者对所述当前学习资源的当前学习测量结果；

根据所述学习者的预期学习目标和所述当前学习测量结果,确定所述学习者对应的调整参数；

根据所述预期学习目标、所述当前学习测量结果以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略，所述目标学习策略用于向所述学习者推荐目标学习资源,所述目标学习资源与所述学习者的匹配度大于所述当前学习资源与所述学习者的匹配度。

可选的，所述根据所述学习者的预期学习目标和所述当前学习测量结果,确定所述学习者对应的调整参数，包括：

将所述当前学习资源的历史测量结果输入第一深度神经网络中，得到各所述当前学习资源的特征参数，所述特征参数包括如下至少一项：所述学习资源的难度、所述学习资源的区分度；

将各所述当前学习资源的特征参数、所述当前测量结果和所述学习者的当前学习信息输入第二深度神经网络中，得到所述学习者的调整参数。

可选的，将各所述当前学习资源的特征参数、所述当前测量结果和所述学习者的当前学习信息输入第二深度神经网络中，得到所述学习者的调整参数之前，还包括：

在所述学习者对各所述当前学习资源进行学习的过程中，识别并存储所述学习者的当前学习信息，所述当前学习信息包括如下至少一项：学习时长、学习次数、当前已学习的学习资源。

可选的，所述根据所述预期学习目标、所述当前学习测量结果以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略，包括：

根据所述预期学习目标、所述当前学习测量结果确定所述学习者的学习偏差；

根据所述学习偏差、预设的学习偏差阈值以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略。

可选的，所述根据所述学习偏差、预设的学习偏差阈值以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略，包括：

若所述学习偏差的绝对值大于所述学习偏差阈值，则根据所述调整参数在所述当前学习策略中增加或减少学习资源；

若所述学习偏差的绝对值小于或等于所述学习偏差阈值，则将当前学习策略作为所述学习者的目标学习策略。

可选的，所述方法还包括：

对学习资料进行资料标注，得到所述学习资料的标注信息，所述标注信息包括：所述学习资料所属的知识点、所述学习资料的难度；

通过资料传感器识别各所述学习资料的标注信息，并基于自组织算法根据各所述学习资料的标注信息将所述学习资料组织为所述学习资源。

可选的，所述根据所述预期学习目标、所述当前学习测量结果以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略之后，还包括：

基于学习者的目标学习策略向所述学习者推荐目标学习资源,并获取所述学习者对所述目标学习资源的目标学习测量结果；

将所述学习者对所述当前学习策略的当前学习信息和当前测量结果以及对所述目标学习策略的目标学习信息和目标测量结果组合并输出，得到所述学习者的学习日志。

第二方面，本申请提供了一种自适应学习信息推荐装置，所述装置包括：

推荐模块，用于：基于学习者的当前学习策略向所述学习者推荐当前学习资源,并获取所述学习者对所述当前学习资源的当前学习测量结果；

确定模块，用于：根据所述学习者的预期学习目标和所述当前学习测量结果,确定所述学习者对应的调整参数；

调整模块，用于：根据所述预期学习目标、所述当前学习测量结果以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略，所述目标学习策略用于向所述学习者推荐目标学习资源,所述目标学习资源与所述学习者的匹配度大于所述当前学习资源与所述学习者的匹配度。

可选的，所述确定模块具体用于：

将各所述当前学习资源的特征参数、所述当前测量结果和所述学习者的当前学习信息输入第二深度神经网络中，得到所述学习者的调整参数。

可选的，所述调整模块具体用于：

根据所述预期学习目标、所述当前学习测量结果确定所述学习者的学习偏差；

根据所述学习偏差、预设的学习偏差阈值以及所述调整参数，对所述当前学习策略进行调整，得到所述学习者的目标学习策略。

可选的，所述调整模块还具体用于：

若所述学习偏差的绝对值大于所述学习偏差阈值，则根据所述调整参数在所述当前学习策略中增加或减少学习资源；

若所述学习偏差的绝对值小于或等于所述学习偏差阈值，则将当前学习策略作为所述学习者的目标学习策略。

第三方面，本申请提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如上述第一方面所述方法的步骤。

第四方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如上述第一方面所述方法的步骤。

本申请的有益效果是：基于学习者的当前学习策略向学习者推荐当前学习资源,并获取学习者对当前学习资源的当前学习测量结果，根据学习者的预期学习目标和当前学习测量结果,确定学习者对应的调整参数，根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略。其中，通过学习测量结果和预期学习目标确定的调整参数可以更准确的表征学习者的学习情况与学习目标的差异，从而实现对当前学习策略的及时调整，以得到更符合学习者当前学习情况的学习策略，实现学习资源的动态推荐和学习策略的动态规划，从而提高学习资源推荐的准确度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的一种本领域的自适应学习系统的架构图；

图2示出了本申请实施例提供的一种自适应学习信息推荐方法的流程图；

图3示出了本申请实施例提供的一种确定调整参数的流程图；

图4示出了本申请实施例提供的一种确定目标学习策略的流程图；

图5示出了本申请实施例提供的又一种确定目标学习策略的流程图；

图6示出了本申请实施例提供的一种获得学习资源的流程图；

图7示出了本申请实施例提供的一种输出学习日志的流程图；

图8示出了本申请实施例提供的又一种自适应学习信息推荐方法的流程图；

图9示出了本申请实施例提供的一种自适应学习信息推荐装置的结构示意图；

图10示出了本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

现有的自适应学习系统中，一般是根据学习者的作答情况判定学习者的认知水平，然后为学习者推荐静态的学习策略。

但是，首先现有技术中没有很好的将学习者的测量结果(即作答情况)作为学习内容推荐的考虑因素，并且由于学习者的学习认知水平是内隐的，因此很难直接测量其学习情况，且现有技术中的静态学习策略推荐很难适应学习者动态变化的学习水平。因此目前的自适应学习系统对学习者的学习策略的制定不够精准和灵活，存在学习资源推荐准确度低的问题。

基于上述问题，本申请提出一种自适应学习信息推荐方法，将学习者的测量结果作为学习资源推荐的参考因素，可以实现对学习者学习路径的动态精确规划，如图1所示，是本领域常用的一种自适应学习系统的架构图。

参照图1，其中领域模型定义了学科知识和概念，为学习者的学习提供内容。学生模型代表学生的特点，包括个性特征、学科知识水平等。教育学模型定义了教育学规则，即如何跟学生模型中定义的学生特点访问领域模型中的知识和概念。自适应引擎可以创建和更新领域概念及链接的全部软件环境，自适应机制本身使用教育学模型、学生模型以及领域模型中的信息对学习者进行个性化的选择、注释和呈现学习内容。接口模块定义了用户与自适应学习系统间的交互，使用接口模块的数据可以推测用户的特点，以此更新学习对象并验证学生模型。

图1的运行机制可以概括为：系统根据学习者的评估结果智能化的从领域模型中选择合适的内容推荐给学习者。其具体的实现过程可以是：系统记录学习者的学习过程、学习行为、学习结果以及所用时间、次数等要素，通过学习分析自动评估学习者的认知状态，并将评估的认知状态反馈给学习推荐系统，系统根据学习者的特征推荐适合学习者个性特征的学习资源，并根据即时的学习反馈，不断调整学习策略，从而实现个性化学习。

本申请的方法可以应用于图1所示的自适应学习系统，以实现对学习者的学习策略的动态规划，该方法的执行主体可以是电子设备。

接下来结合图2对本申请的自适应学习信息推荐方法做进一步说明，如图2所示，该方法包括：

S201：基于学习者的当前学习策略向学习者推荐当前学习资源,并获取学习者对当前学习资源的当前学习测量结果。

可选的，学习策略可以是对学习者指定的学习计划，应当理解，学习计划可以包括对多个知识点的学习以及测试，因此一个学习策略可以对应多个学习资源。

可选的，学习资源可以是电子设备针对一个知识点将相关的学习资料组合得到的该知识点的学习资料组，学习资料例如可以包括对该知识点的至少一个课前预习视频、课前预习文档、知识点视频讲解、课后测试题以及课后测试题讲解等。

可选的，学习测量结果可以是学习者在学习当前学习资源后，向电子设备提交的当前学习资源达到预期学习目标的数量化表示，例如成绩表单可以作为一种学习测量结果。

需要说明的是，学习测量是对学生的学习行为进行数学方法的描述和价值的确定，可以实现把学生达到教学目标的程度加以数量化。学习者和学习环境形成对偶关系，学习者隐式状态或水平可以通过测量其与学习环境交互的结果来间接测量。

值得注意的是，学习策略可以是针对一节课程的学习计划，对于首次使用的学习者，电子设备可以将预设的该节课程默认的学习策略作为学习者的当前学习策略。

S202：根据学习者的预期学习目标和当前学习测量结果,确定学习者对应的调整参数。

可选的，预期学习目标可以是电子设备根据教师的教学目标或学习者以往的学习情况对期望学习效果的预设值。例如可以将教师对于一个知识点的教学目标作为该知识点的预期学习目标，或将教师对于一节课的教学目标作为该节课的预期学习目标，或是结合教师的教学目标与学习者以往的学习情况确定的预期学习目标。

示例性的，假设教师的教学目标为掌握知识点一，那么预期的学习目标就可以是使学习者能够正确完成知识点一对应的测试题目。

值得注意的是，由于学习者与学习环境存在对偶关系，因此可以通过测量学习者与其学习环境之间的交互结果实现对学习者学习情况的测量，交互结果例如可以是对学习资源的当前学习测量结果。

可选的，学习者的预期学习目标和当前学习测量结果可以反映学习者对知识点的掌握情况，电子设备根据学习者的掌握情况可以确定学习者对应的调整参数。

可选的，调整参数可以反映学习者当前学习情况与预期学习目标的差异，可以将调整参数引入自适应算法中对学习者的学习路径进行调整，以使得学习策略更适应于学习者的当前学习情况，示例性的，自适应算法可以是图神经网络、最优化算法等。

示例性的，调整参数可以用θ表示，θ可以为一个数值(例如可以是正数、负数或零)，当调整参数为正数时，可以理解为需要增加推荐的学习资源，当调整参数为负数时，可以理解为需要减少推荐的学习资源，该数值的绝对值越小，说明需要调整的程度越小。

S203：根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略，目标学习策略用于向学习者推荐目标学习资源,目标学习资源与学习者的匹配度大于当前学习资源与学习者的匹配度。

可选的，对学习策略进行调整，例如可以是对当前学习策略中各学习资源的难度和数量进行调整，以得到更符合学习者当前学习情况的学习策略。

可选的，在确定目标学习策略之后，可以将该目标学习策略中的学习资源作为目标学习资源推荐给学习者，以使得学习者对目标学习资源进行学习。

需要说明的是，学习者的知识水平随着时间的推移会不停的变化，对于学习资源的需求也会随之变动，因此在确定目标学习策略之后，可以重复多次执行上述S201-S203步骤，以实现对学习者动态的推荐学习资源，并提高为学习者制定的学习策略的准确度。

可选的，学习资源与学习者的匹配度可以表征学习策略是否适合学习者，可以理解，若学习资源与学习者的匹配度高，则说明该学习资源更适合学习者当前的学习情况，为了提高学习资源推荐的精确度，目标学习资源与学习者的匹配度应该大于当前学习资源与学习者的匹配度。

在本申请实施例中，电子设备基于学习者的当前学习策略向学习者推荐当前学习资源,并获取学习者对当前学习资源的当前学习测量结果，根据学习者的预期学习目标和当前学习测量结果,确定学习者对应的调整参数，根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略。其中，结合学习测量结果和预期学习目标确定的调整参数可以更准确的表征学习者的学习情况与学习目标的差异，从而及时调整学习者的当前学习策略，以得到更符合学习者当前学习情况的学习策略，实现学习资源的动态推荐和学习策略的动态规划，从而提高学习资源推荐的准确度。

以下是对上述根据学习者的预期学习目标和当前学习测量结果,确定学习者对应的调整参数的步骤说明，如图3所示，上述S202步骤包括：

S301：将当前学习资源的历史测量结果输入第一深度神经网络中，得到各当前学习资源的特征参数，特征参数包括如下至少一项：学习资源的难度、学习资源的区分度。

可选的，当前学习资源的历史测量结果可以是具有不同知识和能力水平的学习者针对当前学习资源的答题记录。

可选的，学习资源的特征参数可以包括学习资源的难度，学习资源的区分度等。

作为另一种可能的实施方式，也可以在上述S201步骤之前将学习资源库中的所有学习资源的历史测量结果输入第一深度神经网络中，得到各学习资源的特征参数，并根据各学习资源的特征参数从学习资源库中确定适合学习者当前学习情况的当前学习资源。

S302：将各当前学习资源的特征参数、当前测量结果和学习者的当前学习信息输入第二深度神经网络中，得到学习者的调整参数。

可选的，将各当前学习资源的特征参数、当前测量结果和学习者的当前学习信息输入第二深度神经网络中，可以确定学习者对不同难度和不同区分度的学习资源的掌握情况，并确定学习者的调整参数。

可选的，学习信息可以是学习者在对学习资源进行学习的过程中被电子设备记录的学习信息，例如学习者对学习资源的学习时长、学习次数等。

示例性的，假设当前的学习资源包括：题目1、题目2、题目3、题目4以及题目5，且其特征参数中的难度和区分度依次增大，学习者甲对于各学习资源的测量结果(以正误作为测量结果)分别为：正、正、正、误、正，那么就可以将测量结果、各题目的特征参数以及学习者学习各学习资源时的学习信息作为第二深度神经网络的输入，由第二深度神经网络输出针对学习者此时学习情况的调整参数。

值得说明的是，上述第一深度神经网络和第二深度神经网络可以是长短期记忆神经网络(Long short-term memory,LSTM)或Transformer模型等。

在本申请实施例中，通过第一深度神经网络获取学习资源的特征参数，并由第二深度神经网络根据学习资源的特征参数、当前测量结果和学习者的当前学习信息确定调整参数，可以实现对学习者学习水平的数值化测量。

在上述将各当前学习资源的特征参数、当前测量结果和学习者的当前学习信息输入第二深度神经网络中，得到学习者的调整参数之前，还可以先确定学习者的学习信息，上述S302步骤之前还包括：

在学习者对各当前学习资源进行学习的过程中，识别并存储学习者的当前学习信息，当前学习信息包括如下至少一项：学习时长、学习次数、当前已学习的学习资源。

可选的，在学习者对各当前学习资源进行学习的过程中，电子设备可以识别并记录学习者对各学习资源的学习信息。

示例性的，假设学习资源包括讲解视频1、讲解视频2、题目1、题目2、讲解文档1等，在学习者学习各学习资源的过程中，假设学习者已学习的学习资源有讲解视频1、讲解视频2以及题目1，电子设备就可以记录学习者对讲解视频1、讲解视频2的学习次数以及学习时长，并记录学习者对题目1的学习时长，并对讲解视频1、讲解视频2以及题目1添加标识，以表征该学习资源为已学习的学习资源。

值得注意的是，本申请实施例中，可以结合学习者的学习信息、学习测量结果和预期学习目标综合判断学习者的学习水平。

示例性的，假设学习者对讲解视频1的学习时长大于预设阈值，可以说明学习者对讲解视频1对应的知识点掌握的不牢固，或是学习中存在困难，则电子设备就可以结合该条学习信息为学习者推荐该知识点难度低一些的学习资源。

再比如假设学习者对知识点1所对应的学习文档1的学习时长远小于预设阈值，但对于知识点1所对应的讲解视频1的学习时长在正常范围内，那么就可以判断该学习者更偏好于视频讲解，在之后的推荐中，电子设备就可以结合这条学习信息为该学习者优先推荐知识点的讲解视频。

以下是对上述根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略的步骤的进一步说明，如图4所示，上述S203步骤包括：

S401：根据预期学习目标、当前学习测量结果确定学习者的学习偏差。

可选的，学习偏差可以是预期学习目标与当前学习测量结果的差值，电子设备可以先将预期学习目标和当前学习测量结果数值化，再将二者的差值作为学习偏差。

S402：根据学习偏差、预设的学习偏差阈值以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略。

可选的，预设的学习偏差阈值可以是教师根据学习者实际作答情况确定或由电子设备根据所有学习者的实际作答情况确定的常数阈值，示例性的，可以用σ表示学习偏差阈值，理想情况下σ可以为0。

值得说明的是，根据学习偏差和预设的学习偏差阈值，电子设备可以确定学习者当前的学习水平是否达到预期，并对当前学习策略进行相应的调整。

以下是对上述根据学习偏差、预设的学习偏差阈值以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略的步骤中，调整学习策略的步骤说明，如图5所示，上述S402步骤包括：

S501：若学习偏差的绝对值大于学习偏差阈值，则根据调整参数在当前学习策略中增加或减少学习资源。

可选的，若学习偏差的绝对值大于学习偏差阈值，即预期学习目标减去学习测量结果的值大于σ或小于-σ，可以说明学习者对当前知识点的掌握情况不好，需要对学习者增加或减少学习资源。

具体的，当预期学习目标减去学习测量结果的值大于σ时，可以说明学习者对当前的知识点掌握情况不好。需要对学习者增加学习资源，那么就可以根据调整参数从学习资源库中确定至少一个学习资源，并将这些学习资源增加到当前学习策略中。

当预期学习目标减去学习测量结果的值小于-σ时，说明学习者对当前的知识点的掌握情况远远优于预设目标阈值，需要对学习者增加学习资源的难度，或者减少部分学习资源，从而调整当前学习策略。

需要说明的是，当学习偏差大于学习偏差阈值时，也可能是当前的学习资源对学习者而言难度过大，因此，不仅可以根据调整参数增加难度更适合于学习者的学习资源，还可以根据调整参数对原本的学习策略中的学习资源进行修正，例如适度的删除难度大于学习者目前掌握水平的学习资源，使调整后的学习策略更适合于学习者的学习水平。

当学习偏差的绝对值小于学习偏差阈值时，也可能是当前的学习资源对学习者而言难度过小，因此，不仅可以根据调整参数减少难度低于学习者掌握难度的学习资源，还可以从学习资源库中确定至少一个学习资源(例如可以选择难度高于学习者当前掌握难度的学习资源)，并将这些学习资源添加到当前学习策略中，使调整后的学习策略更适合于学习者的学习水平。

S502：若学习偏差的绝对值小于或等于学习偏差阈值，则将当前学习策略作为学习者的目标学习策略。

可选的，若学习偏差的绝对值小于或等于学习偏差阈值，即预期学习目标减去学习测量结果的值小于或等于σ，可以说明学习者对当前知识点的掌握情况良好，此时可以认为找到了符合学习者当前学习水平的最佳的学习策略和资源，因此无需对学习资源进行调整，可以将当前学习策略作为学习者的目标学习策略。

值得注意的是，以一节课程为例，一节课程中可以包括多个知识点，各个知识点的学习策略中可以包括多组穿插在学习策略中的测量题目(可以理解为测试题)，学习者完成一个知识点中的一组测量题目并得到测量结果后，电子设备就可以根据调整参数、测量结果以及预期目标对后续的学习策略进行调整。

在本申请实施例中，根据调整参数对当前学习策略中的学习资源进行调整，可以使得到的学习策略更适合于学习者的学习水平，实现对学习者学习策略的动态规划。

如图6所示，是本申请给出的一种获得学习资源的流程图，参照图6，获得学习资源的步骤包括：

S601：对学习资料进行资料标注，得到学习资料的标注信息，标注信息包括：学习资料所属的知识点、学习资料的难度。

可选的，可以通过上述S301步骤中的第一深度神经网络对学习资料进行资料标注，例如可以将学习资料输入第一深度神经网络中，得到学习资料的标注信息。其中，标注信息可以包括学习资料的难度、学习资料的区分度以及学习资料所属的知识点等，应当理解，这些标注信息只是本申请给出的一种示例，具体的标注信息可以根据实际实施情况确定，本申请在此不作限制。

值得注意的是，学习资料所属的知识点可以是一个也可以是多个，例如综合性较强的题目中，可能包含不止一个知识点。

需要说明的是，为了提高对学习资料标注的准确性，可以先将人工标注的样本资料输入第一深度神经网络中，并根据人工标注的信息和第一深度神经网络的输出结果对第一深度神经网络进行迭代优化，以提高资料标注的准确度。

S602：通过资料传感器识别各学习资料的标注信息，并基于自组织算法根据各学习资料的标注信息将学习资料组织为学习资源。

可选的，资料传感器可以是一种算法，用于识别输入的学习资料的标注信息，在上述S601步骤完成对所有学习资料的标注后，可以通过资料传感器识别各学习资料的标注信息，并根据标注信息采用自组织算法将学习资料组织为学习资源。

自组织算法是一种无监督式的神经网络算法，可以将输入的学习资料根据其标注信息进行分类。

作为一种可能的实施方式，可以基于自组织算法和知识图谱将归属于相同知识点的学习资料分为一类，并将归属于同一知识点的学习资料按照难度和区分度从低到高组织为该知识点的学习资源。

作为另一种可能的实施方式，也可以基于自组织算法和知识图谱将属于同一节课程的多个知识点所对应的学习资料按照难度和区分度从低到高组织为该节课的学习资源。

在本申请实施例中，通过将学习资料进行标注，并按照标注信息将学习资料组织为学习资源，可以在规划学习策略时快速确定可用的学习资源，提高学习策略规划的效率。

在上述根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略之后，如图7所示，上述S203步骤之后包括：

S701：基于学习者的目标学习策略向学习者推荐目标学习资源,并获取学习者对目标学习资源的目标学习测量结果。

可选的，在向学习者根据目标学习策略重新推荐目标学习资源之后，学习者可以对目标学习资源进行学习，并向电子设备提交对目标学习资源的目标学习测量结果。

S702：将学习者对当前学习策略的当前学习信息和当前测量结果以及对目标学习策略的目标学习信息和目标测量结果组合并输出，得到学习者的学习日志。

可选的，电子设备可以将学习者开始学习之后所有已学习的学习资源对应的学习信息以及测量结果组合为学习者的学习日志，并将学习日志存储在数据库中。

作为另一种可能的实施方式，电子设备也可以将学习者开始学习之后所有已学习的学习资源对应的学习信息组合为学习者的学习日志，并将学习者的测量结果组合为学习者的成绩表，建立学习日志与成绩表之间的映射表，并将学习日志、成绩表以及映射表存储在数据库中。

在本申请实施例中，通过将学习者的学习信息和测量结果保存为学习日志，可以使得学习者随时了解自己的学习情况，并根据学习情况及时进行学习巩固。

接下来结合图8对本申请的自适应学习信息推荐方法作进一步说明。

如图8所示，电子设备可以根据学习者的预期学习目标先制定一个初步的学习策略，并由执行机构根据学习策略将该学习策略对应的学习资源推荐给学习者，在学习者学习该学习资源的过程中，电子设备可以识别并存储学习者的学习信息，并获取学习者的学习后输出(可以理解为学习日志和成绩表)，根据学习后输出和预期学习目标可以确定学习测量结果，根据学习信息和学习后输出，电子设备可以对学习者进行建模，即确定调整参数，同时，电子设备还可以根据学习测量结果和与其学习目标确定学习者的学习偏差，并最终根据调整参数和学习偏差基于自适应算法(例如图神经网络、最优化算法等)对学习策略进行调整。

基于同一发明构思，本申请实施例中还提供了与自适应学习信息推荐方法对应的自适应学习信息推荐装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述自适应学习信息推荐方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参照图9所示，为本申请实施例提供的一种自适应学习信息推荐装置的示意图，所述装置包括：推荐模块901、确定模块902、调整模块903，其中：

推荐模块901，用于：基于学习者的当前学习策略向学习者推荐当前学习资源,并获取学习者对当前学习资源的当前学习测量结果；

确定模块902，用于：根据学习者的预期学习目标和当前学习测量结果,确定学习者对应的调整参数；

调整模块903，用于：根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略，目标学习策略用于向学习者推荐目标学习资源,目标学习资源与学习者的匹配度大于当前学习资源与学习者的匹配度。

可选的，确定模块902具体用于：

将当前学习资源的历史测量结果输入第一深度神经网络中，得到各当前学习资源的特征参数，特征参数包括如下至少一项：学习资源的难度、学习资源的区分度；

将各当前学习资源的特征参数、当前测量结果和学习者的当前学习信息输入第二深度神经网络中，得到学习者的调整参数。

可选的，调整模块903具体用于：

根据预期学习目标、当前学习测量结果确定学习者的学习偏差；

根据学习偏差、预设的学习偏差阈值以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略。

可选的，调整模块903还具体用于：

若学习偏差的绝对值大于学习偏差阈值，则根据调整参数在当前学习策略中增加或减少学习资源；

若学习偏差的绝对值小于或等于学习偏差阈值，则将当前学习策略作为学习者的目标学习策略。

可选的，装置还包括识别模块，识别模块具体用于：

可选的，装置还包括组织模块，组织模块具体用于：

对学习资料进行资料标注，得到学习资料的标注信息，标注信息包括：学习资料所属的知识点、学习资料的难度；

通过资料传感器识别各学习资料的标注信息，并基于自组织算法根据各学习资料的标注信息将学习资料组织为学习资源。

可选的，装置还包括输出模块，输出模块具体用于：

基于学习者的目标学习策略向学习者推荐目标学习资源,并获取学习者对目标学习资源的目标学习测量结果；

将学习者对当前学习策略的当前学习信息和当前测量结果以及对目标学习策略的目标学习信息和目标测量结果组合并输出，得到学习者的学习日志。

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明，这里不再详述。

本申请实施例通过基于学习者的当前学习策略向学习者推荐当前学习资源,并获取学习者对当前学习资源的当前学习测量结果，根据学习者的预期学习目标和当前学习测量结果,确定学习者对应的调整参数，根据预期学习目标、当前学习测量结果以及调整参数，对当前学习策略进行调整，得到学习者的目标学习策略。其中，通过学习测量结果和预期学习目标确定的调整参数可以更准确的表征学习者的学习情况与学习目标的差异，从而使得电子设备可以及时调整学习者的当前学习策略，以得到更符合学习者当前学习情况的学习策略，实现学习资源的动态推荐和学习策略的动态规划，从而提高学习资源推荐的准确度。

本申请实施例还提供了一种电子设备，如图10所示，为本申请实施例提供的电子设备结构示意图，包括：处理器1001、存储器1002和总线。所述存储器1002存储有所述处理器1001可执行的机器可读指令(比如，图9中的装置中推荐模块901、确定模块902、调整模块903对应的执行指令等)，当计算机设备运行时，所述处理器1001与所述存储器1002之间通过总线通信，所述机器可读指令被所述处理器1001执行时执行上述自适应学习信息推荐方法的处理。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述自适应学习信息推荐方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：童名文;庄自超;曾柯良;孙佳;范云霞;高倩倩;龙陶陶;姚璜;
专利申请人：华中师范大学;