一种基于大数据的教育系统及数据处理方法

文献发布时间：2023-06-19 12:13:22

技术领域

本发明涉及远程教育技术领域，具体是一种基于大数据的教育系统及数据处理方法。

背景技术

伴随着互联网和以机器学习、深度学习为代表的智能技术的快速发展及在线学习平台对网络教育发展的促进，使得在线学习社区平台得到广泛应用，它以其丰富的教学资料和灵活多变的学习方式，实现了对不同种类学习者对学习需求的满足，为传统教育方式的变革创造了新的机会。

但是现有的远程教育系统中，对于学习过程的促进作用很低，大部分人在使用的时候，往往只会坚持几天，然后便不再使用了；其原因是，现有的远程教育系统对于课程的推送过程不够重视，当推送课程与用户的相关性不强时，用户很容易失去兴趣，当推送课程与用户的相关性过强时，又会引起用户基于隐私权的反感。

因此，如何优化课程推送过程，提高用户学习的积极性是本发明想要解决的问题。

发明内容

本发明的目的在于提供一种基于大数据的教育系统及数据处理方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于大数据的教育系统及数据处理方法，包括：

获取用户偏好类型，根据所述偏好类型确定推送比例，根据所述推送比例随机读取课程库中的课程信息并展示；其中，所述偏好类型包括视频、音频和文本；

接收用户对展示的课程信息的查询请求，计算对应课程的偏好值，当所述偏好值大于预设的偏好阈值时，读取对应课程的显示词条；

确定所述显示词条中的关键词，根据所述关键词遍历所述课程库，生成子课程库，再根据所述推送比例随机读取子课程库中的课程信息并展示；

接收用户选取请求，读取课程价格，判断用户余额是否大于所述课程价格，当所述用户余额大于所述课程价格时，给予用户访问权限并更新用户余额。

作为本发明技术方案进一步的限定：所述获取用户偏好类型，根据所述偏好类型确定推送比例的步骤具体包括：

获取用户终端的屏幕使用时间，根据屏幕使用时间确定各应用程序使用时间；

依次判断所述应用程序使用时间是否大于时间阈值，当所述应用程序使用时间大于时间阈值时，标记应用程序；

当所有应用程序使用时间均小于时间阈值时，基于应用程序使用时间对各应用程序进行降序排列，并标记应用程序，标记数量至少为三个，且按降序排列顺序进行标记；

根据标记的应用程序确定推送比例。

作为本发明技术方案进一步的限定：所述根据标记的应用程序确定推送比例的步骤具体包括：

获取标记的应用程序及其文件类型；

根据文件类型对标记的应用程序进行分类，并分别计算同一文件类型对应的应用程序的总应用程序使用时间；

根据计算出的不同文件类型对应的总应用程序使用时间确定推送比例。

作为本发明技术方案进一步的限定：所述接收用户对展示的课程信息的查询请求，计算对应课程的偏好值的步骤具体包括：

接收用户查询请求，向用户展示课程介绍；

获取用户浏览时长和标记指令；

根据所述用户浏览时长和标记指令计算对应课程的偏好值；其中，所述标记指令至少包括点赞和关注请求。

作为本发明技术方案进一步的限定：接收用户选取请求，读取课程价格，判断用户余额是否大于所述课程价格的步骤包括：

基于所述课程访问频率和课程观看时长生成信用值；

基于所述信用值确定欠费额度，并根据所述欠费额度降低课程价格；

判断用户余额是否大于根据欠费额度降低后的课程价格；

所述信用值的计算公式为：

信用值=α*课程访问频率+β*课程观看时长；

其中，α和β均为修正系数，α和β的单位分别用于消除课程访问频率和课程观看时长的单位。

本发明技术方案还提供了一种基于大数据的教育系统，其特征在于，所述系统包括：

第一展示模块，用于获取用户偏好类型，根据所述偏好类型确定推送比例，根据所述推送比例随机读取课程库中的课程信息并展示；其中，所述偏好类型包括视频、音频和文本；

词条读取模块，用于接收用户对展示的课程信息的查询请求，计算对应课程的偏好值，当所述偏好值大于预设的偏好阈值时，读取对应课程的显示词条；

第二展示模块，用于确定所述显示词条中的关键词，根据所述关键词遍历所述课程库，生成子课程库，再根据所述推送比例随机读取子课程库中的课程信息并展示；

权限确定模块，用于接收用户选取请求，读取课程价格，判断用户余额是否大于所述课程价格，当所述用户余额大于所述课程价格时，给予用户访问权限并更新用户余额。

作为本发明技术方案进一步的限定：所述第一展示模块具体包括：

时间确定单元，用于获取用户终端的屏幕使用时间，根据屏幕使用时间确定各应用程序使用时间；

比较单元，用于依次判断所述应用程序使用时间是否大于时间阈值，当所述应用程序使用时间大于时间阈值时，标记应用程序；

排序标记单元，用于当所有应用程序使用时间均小于时间阈值时，基于应用程序使用时间对各应用程序进行降序排列，并标记应用程序，标记数量至少为三个，且按降序排列顺序进行标记；

比例确定单元，用于根据标记的应用程序确定推送比例。

作为本发明技术方案进一步的限定：所述比例确定单元具体包括：

类型确定子单元，用于获取标记的应用程序及其文件类型；

计算子单元，用于根据文件类型对标记的应用程序进行分类，并分别计算同一文件类型对应的应用程序的总应用程序使用时间；

数据处理子单元，用于根据计算出的不同文件类型对应的总应用程序使用时间确定推送比例。

作为本发明技术方案进一步的限定：所述词条读取模块包括：

介绍单元，用于接收用户查询请求，向用户展示课程介绍；

参数获取单元，用于获取用户浏览时长和标记指令；

第一执行单元，根据所述用户浏览时长和标记指令计算对应课程的偏好值；其中，所述标记指令至少包括点赞和关注请求。

作为本发明技术方案进一步的限定：所述权限确定模块包括：

信用值生成单元，用于基于所述课程访问频率和课程观看时长生成信用值；

价格修正单元，用于基于所述信用值确定欠费额度，并根据所述欠费额度降低课程价格；

第二执行单元，用于判断用户余额是否大于根据欠费额度降低后的课程价格；

所述信用值的计算公式为：

信用值=α*课程访问频率+β*课程观看时长；

其中，α和β均为修正系数，α和β的单位分别用于消除课程访问频率和课程观看时长的单位。

与现有技术相比，本发明的有益效果是：本发明通过用户的屏幕使用时间获取用户偏好类型，根据偏好类型进行课程推送，然后再根据用户的互动情况更正推送过程，优化了课程推送过程，提高了用户学习的积极性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例。

图1为基于大数据的数据处理方法的流程框图。

图2为基于大数据的数据处理方法的第一子流程框图。

图3为基于大数据的数据处理方法的第二子流程框图。

图4为基于大数据的数据处理方法的第三子流程框图。

图5为基于大数据的数据处理方法的第四子流程框图。

图6为基于大数据的教育系统的组成结构框图。

图7为基于大数据的教育系统中第一展示模块的组成结构框图。

图8为第一展示模块中比例确定单元的组成结构框图。

图9为基于大数据的教育系统中词条读取模块的组成结构框图。

图10为基于大数据的教育系统中权限确定模块的组成结构框图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明实施例中可能采用术语第一、第二等来描述不同的模块，但这些模块不应限于这些术语。这些术语仅用来将同一类型的模块彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一展示模块也可以被称为第二展示模块，不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。类似地，第二展示模块也可以被称为第一展示模块。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

实施例1

图1示出了基于大数据的数据处理方法的流程框图，本发明实施例中，提供了一种数据处理方法，所述方法具体包括步骤S200-步骤S800：

步骤S200：获取用户偏好类型，根据所述偏好类型确定推送比例，根据所述推送比例随机读取课程库中的课程信息并展示；其中，所述偏好类型包括视频、音频和文本；

步骤S200是在用户进入系统后，最先进行的步骤，我们知道，现有的APP中，在首页总会有些推送内容，这些推送内容代表着一个APP的“门面”，在很大程度上反应了本APP的主题，但是具体的推送内容也有讲究，不契合用户的推送内容很难吸引用户，进而降低用户与APP的亲合度，过于契合用户的推送内容也会引起用户的反感，使得用户觉得隐私权被侵犯，因此，推送内容是存在一个平衡点的。

步骤S400：接收用户对展示的课程信息的查询请求，计算对应课程的偏好值，当所述偏好值大于预设的偏好阈值时，读取对应课程的显示词条；

步骤S400是由用户查询请求触发的，查询请求的发送方式很常见，可以是触屏信号，也可能是键入信号，这取决于承载系统的计算机设备；在查询请求发送过程中，就说明用户对该课程存在着兴趣，这也从某种程度上反应了用户的偏好；当然，也有些用户是误触或是兴趣不高，那自然也是需要忽略的内容，因此，上述预设的偏好阈值便是用于评判到何种程度才算是有兴趣，当用户有兴趣时，则读取对应课程的显示词条。

步骤S600：确定所述显示词条中的关键词，根据所述关键词遍历所述课程库，生成子课程库，再根据所述推送比例随机读取子课程库中的课程信息并展示；

显示词条中一定有着关键词，这些关键词在有的系统中，是一些标签，如果是这种方式，那么显示词条中关键词的确定过程是很容易的，如果不是，那么关键词的确定过程，就是一个文本操作过程，一般情况下，都是先进行名词提取，再判断提取出的名词是否为关键词；

步骤S800：接收用户选取请求，读取课程价格，判断用户余额是否大于所述课程价格，当所述用户余额大于所述课程价格时，给予用户访问权限并更新用户余额；

步骤S800是最终处理步骤，即，真正的教育步骤，向用户展示课程的过程；其判断过程是很常见的一种方式，即，判断判断用户余额是否大于所述课程价格，如果大于，给予用户访问权限并更新用户余额；值得一提的是，对于一些免费课程，只需将所述课程价格设为零即可，甚至，可以将课程价格设为负数，可以想象的到，这种课程一般作为奖励课程而存在。

图2示出了基于大数据的数据处理方法的第一子流程框图，所述获取用户偏好类型，根据所述偏好类型确定推送比例的步骤具体包括步骤S201-步骤S207：

步骤S201：获取用户终端的屏幕使用时间，根据屏幕使用时间确定各应用程序使用时间；

步骤S203：依次判断所述应用程序使用时间是否大于时间阈值，当所述应用程序使用时间大于时间阈值时，标记应用程序；

步骤S205：当所有应用程序使用时间均小于时间阈值时，基于应用程序使用时间对各应用程序进行降序排列，并标记应用程序，标记数量至少为三个，且按降序排列顺序进行标记；

步骤S207：根据标记的应用程序确定推送比例；

步骤S201-步骤S207是推送过程的一个具体技术方案，此技术方案是与本发明技术所要解决的问题有关的，我们知道，学习过程是分人的，有些人喜欢看书本，有些人喜欢看视频，还有些人喜欢听课程，这与每个人的习惯非常相关；在不知道用户喜欢什么内容的课程中，我们可以了解用户喜欢的方式，根据方式进行推送；至于用户喜欢的方式，最简单的，通过获取用户终端的屏幕使用时间即可得到用户偏好情况，如果视频类软件的屏幕时长占比较大，那么视频类课程也一定是用户更喜欢的；如果是阅读类软件或是音频类软件，也是相同的道理。

图3示出了基于大数据的数据处理方法的第二子流程框图，所述根据标记的应用程序确定推送比例的步骤具体包括步骤S2071-步骤S2075：

步骤S2071：获取标记的应用程序及其文件类型；

步骤S2073：根据文件类型对标记的应用程序进行分类，并分别计算同一文件类型对应的应用程序的总应用程序使用时间；

步骤S2075：根据计算出的不同文件类型对应的总应用程序使用时间确定推送比例。

步骤S2071-步骤S2075是步骤S207的具体计算流程，其中，首先计算的是同一文件类型对应的应用程序的总应用程序使用时间，然后再计算不同文件类型对应的总应用程序使用时间；举例来说，抖音、快手和腾讯视频均为视频类软件，在计算视频类软件对应的总应用程序使用时间时，要把各个视频类软件的使用时间加起来。然后根据不同文件类型对应的时间，计算出一个比例，再进行一个简单的处理，比如4.2：2.9：2.9，可以近似的修正为4：3：3。

图4示出了基于大数据的数据处理方法的第三子流程框图，所述接收用户对展示的课程信息的查询请求，计算对应课程的偏好值的步骤具体包括步骤S401-步骤S405：

步骤S401：接收用户查询请求，向用户展示课程介绍；

步骤S403：获取用户浏览时长和标记指令；

步骤S405：根据所述用户浏览时长和标记指令计算对应课程的偏好值；其中，所述标记指令至少包括点赞和关注请求。

步骤S401-步骤S405的目的是计算对应课程的偏好值，当用户点开一个课程观看课程介绍时，其浏览时长就代表着他的兴趣程度，如果有一些点赞或者收藏的操作，也就是上述标记指令，那么该用户对该课程就是非常有兴趣的。当然，在此基础上，还可以检测一些互动情况，比如用户评论这种，都是影响用户偏好值的行为。值得一提的是，用户浏览时长和标记指令中哪个更重要，则取决于系统设计者。

图5示出了基于大数据的数据处理方法的第四子流程框图，接收用户选取请求，读取课程价格，判断用户余额是否大于所述课程价格的步骤包括：

步骤S801：基于所述课程访问频率和课程观看时长生成信用值；

步骤S803：基于所述信用值确定欠费额度，并根据所述欠费额度降低课程价格；

步骤S805：判断用户余额是否大于根据欠费额度降低后的课程价格；

所述信用值的计算公式为：

信用值=α*课程访问频率+β*课程观看时长；

其中，α和β均为修正系数，α和β的单位分别用于消除课程访问频率和课程观看时长的单位。

步骤S801-步骤S805是收费过程，在上述的收费过程中，与传统的收费方式不同的点在于，系统默认有个欠费额度，根据欠费额度可以降低课程价格，而欠费额度是和课程访问频率和课程观看时长有关的；课程访问频率越高和课程观看时长越长，欠费额度越多；

这么做的目的是，在用户最后一次使用本系统的时候，都会尽量的去使用这部分欠费额度，进而再进行一次学习行为，从而起到鼓励学习的目的。值得一提的是，本发明并不涉及后续的征信问题，对于欠费信息，其只是一个数据，不对人造成任何影响，甚至在用户长时间未登陆系统时，删除欠费信息也是可行的。

实施例2

图6示出了基于大数据的教育系统的组成结构框图，本发明实施例中，还提供了一种基于大数据的教育系统，所述系统10具体包括：

第一展示模块11，用于获取用户偏好类型，根据所述偏好类型确定推送比例，根据所述推送比例随机读取课程库中的课程信息并展示；其中，所述偏好类型包括视频、音频和文本；

所述第一展示模块11用于完成步骤S200；

词条读取模块12，用于接收用户对展示的课程信息的查询请求，计算对应课程的偏好值，当所述偏好值大于预设的偏好阈值时，读取对应课程的显示词条；

所述词条读取模块12用于完成步骤S400；

第二展示模块13，用于确定所述显示词条中的关键词，根据所述关键词遍历所述课程库，生成子课程库，再根据所述推送比例随机读取子课程库中的课程信息并展示；

所述第二展示模块13用于完成步骤S600；

权限确定模块14，用于接收用户选取请求，读取课程价格，判断用户余额是否大于所述课程价格，当所述用户余额大于所述课程价格时，给予用户访问权限并更新用户余额；

所述权限确定模块14用于完成步骤S800。

图7示出了基于大数据的教育系统中第一展示模块的组成结构框图，所述第一展示模块11具体包括：

时间确定单元111，用于获取用户终端的屏幕使用时间，根据屏幕使用时间确定各应用程序使用时间；

所述时间确定单元111用于完成步骤S201；

比较单元112，用于依次判断所述应用程序使用时间是否大于时间阈值，当所述应用程序使用时间大于时间阈值时，标记应用程序；

所述比较单元112用于完成步骤S203；

排序标记单元113，用于当所有应用程序使用时间均小于时间阈值时，基于应用程序使用时间对各应用程序进行降序排列，并标记应用程序，标记数量至少为三个，且按降序排列顺序进行标记；

所述排序标记单元113用于完成步骤S205；

比例确定单元114，用于根据标记的应用程序确定推送比例；

所述比例确定单元114用于完成步骤S207。

图8示出了第一展示模块中比例确定单元的组成结构框图，所述比例确定单元114具体包括：

类型确定子单元1141，用于获取标记的应用程序及其文件类型；

所述类型确定子单元1141用于完成步骤S2071；

计算子单元1142，用于根据文件类型对标记的应用程序进行分类，并分别计算同一文件类型对应的应用程序的总应用程序使用时间；

所述计算子单元1142用于完成步骤S2073；

数据处理子单元1143，用于根据计算出的不同文件类型对应的总应用程序使用时间确定推送比例；

所述数据处理子单元1143用于完成步骤S2075。

图9示出了基于大数据的教育系统中词条读取模块的组成结构框图，所述词条读取模块12包括：

介绍单元121，用于接收用户查询请求，向用户展示课程介绍；

所述介绍单元121用于完成步骤S401；

参数获取单元122，用于获取用户浏览时长和标记指令；

所述参数获取单元122用于完成步骤S403；

第一执行单元123，根据所述用户浏览时长和标记指令计算对应课程的偏好值；其中，所述标记指令至少包括点赞和关注请求；

所述第一执行单元123用于完成步骤S405。

图10示出了基于大数据的教育系统中权限确定模块的组成结构框图，所述权限确定模块14包括：

信用值生成单元141，用于基于所述课程访问频率和课程观看时长生成信用值；

所述信用值生成单元141用于完成步骤S801；

价格修正单元142，用于基于所述信用值确定欠费额度，并根据所述欠费额度降低课程价格；

所述价格修正单元142用于完成步骤S803；

第二执行单元143，用于判断用户余额是否大于根据欠费额度降低后的课程价格；

所述第二执行单元143用于完成步骤S805。

所述信用值的计算公式为：

信用值=α*课程访问频率+β*课程观看时长；

其中，α和β均为修正系数，α和β的单位分别用于消除课程访问频率和课程观看时长的单位。

上述基于大数据的数据处理方法所能实现的功能均由计算机设备完成，所述计算机设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述程序代码由所述一个或多个处理器加载并执行以实现所述基于大数据的数据处理方法的功能。

处理器从存储器中逐条取出指令、分析指令，然后根据指令要求完成相应操作，产生一系列控制命令，使计算机各部分自动、连续并协调动作，成为一个有机的整体，实现程序的输入、数据的输入以及运算并输出结果，这一过程中产生的算术运算或逻辑运算均由运算器完成；所述存储器包括只读存储器(Read-Only Memory，ROM)，所述只读存储器用于存储计算机程序，所述存储器外部设有保护装置。

示例性的，计算机程序可以被分割成一个或多个模块，一个或者多个模块被存储在存储器中，并由处理器执行，以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序在终端设备中的执行过程。

本领域技术人员可以理解，上述服务设备的描述仅仅是示例，并不构成对终端设备的限定，可以包括比上述描述更多或更少的部件，或者组合某些部件，或者不同的部件，例如可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，上述处理器是上述终端设备的控制中心，利用各种接口和线路连接整个用户终端的各个部分。

上述存储器可用于存储计算机程序和/或模块，上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如信息采集模板展示功能、产品信息发布功能等）等；存储数据区可存储根据泊位状态显示系统的使用所创建的数据（比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等）等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（Smart Media Card， SMC），安全数字（Secure Digital， SD）卡，闪存卡（Flash Card）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例系统中的全部或部分模块/单元，也可以通过计算机程序来指令相关的硬件来完成，上述的计算机程序可存储于计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个系统实施例的功能。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random AccessMemory）、电载波信号、电信信号以及软件分发介质等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：任剑岚;陈静茹;任剑洪;洪伟;熊慧芹;
专利申请人：江西交通职业技术学院;

上一篇：基于SD-WAN的服务级别协议SLA的业务承载方法、系统及设备
下一篇：基于注入锁定倍频的相干微波光子雷达探测方法及系统