一种基于在线教育大数据的深度学习样本标注方法及系统
文献发布时间:2023-06-19 10:05:17
技术领域
本发明属于样本标注技术领域,尤其涉及一种基于在线教育大数据的深度学习样本标注方法及系统。
背景技术
目前,对于在线教育文件(视频、音频、图片等)的标注方法主要有:第一种,通过单个人对文件进行甄别以实现标注,是一个纯体力劳动,而且单个人的主观性太强,导致标注不准确;第二种,基于自动化的标注,目前还处在研究阶段,对于图片的标注都还不能应用,更遑论提视频和音频。现有样本标注方法需要反复观看音频、视频 或者图片进行筛选,耗费大量的人力物力,且主观性较强,容易导致深度学习的输出结果不准确。因此,亟需一种新的深度学习样本标注方法。
通过上述分析,现有技术存在的问题及缺陷为:现有样本标注方法需要反复观看音频、视频 或者图片进行筛选,耗费大量的人力物力,且主观性较强,容易导致深度学习的输出结果不准确。
发明内容
针对现有技术存在的问题,本发明提供了一种基于在线教育大数据的深度学习样本标注方法及系统。
本发明是这样实现的,一种基于在线教育大数据的深度学习样本标注系统,所述基于在线教育大数据的深度学习样本标注系统包括:
数据样本获取模块、分类处理模块、中央控制模块、标注模型构建模块、模型训练模块、模型测试模块、样本标注模块、样本标注审核模块、数据存储模块、更新显示模块。
样本获取模块,与中央控制模块连接,用于通过样本获取设备获取待标注的在线教育数据样本;
分类处理模块,与中央控制模块连接,用于通过分类处理程序对获取的待标注的在线教育数据样本进行分类处理,使得待标注的在线教育数据样本为同一种类别;
中央控制模块,与数据样本获取模块、分类处理模块、标注模型构建模块、模型训练模块、模型测试模块、样本标注模块、样本标注审核模块、数据存储模块、更新显示模块连接,用于通过中央处理器协调控制所述基于在线教育大数据的深度学习样本标注系统各个模块的正常运行;
标注模型构建模块,与中央控制模块连接,用于通过模型构建程序构建深度学习样本标注模型;
模型训练模块,与中央控制模块连接,用于通过模型训练程序利用获取的待标注的在线教育数据集对构建的深度学习样本标注模型进行训练;
模型测试模块,与中央控制模块连接,用于通过模型测试程序对训练好的深度学习样本标注模型进行测试,并根据测试结果对深度学习样本标注模型进行调整;
样本标注模块,与中央控制模块连接,用于通过样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注;
样本标注审核模块,与中央控制模块连接,用于通过标注审核程序对已标注的在线教育数据样本进行审核;
数据存储模块,与中央控制模块连接,用于通过存储器存储获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果;
更新显示模块,与中央控制模块连接,用于通过显示器对获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果的实时数据进行更新显示。
本发明的另一目的在于提供一种应用所述的基于在线教育大数据的深度学习样本标注系统的基于在线教育大数据的深度学习样本标注方法,所述基于在线教育大数据的深度学习样本标注方法包括以下步骤:
步骤一,通过样本获取模块利用样本获取设备获取待标注的在线教育数据样本;通过分类处理模块利用分类处理程序对获取的待标注的在线教育数据样本进行分类处理,使得待标注的在线教育数据样本为同一种类别;
步骤二,通过中央控制模块利用中央处理器协调控制所述基于在线教育大数据的深度学习样本标注系统各个模块的正常运行;
步骤三,通过标注模型构建模块利用模型构建程序构建深度学习样本标注模型;通过模型训练模块利用模型训练程序利用获取的待标注的在线教育数据集对构建的深度学习样本标注模型进行训练;
步骤四,通过模型测试模块利用模型测试程序对训练好的深度学习样本标注模型进行测试,并根据测试结果对深度学习样本标注模型进行调整;
步骤五,通过样本标注模块利用样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注;通过样本标注审核模块利用标注审核程序对已标注的在线教育数据样本进行审核;
步骤六,通过数据存储模块利用存储器存储获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果;
步骤七,通过更新显示模块利用显示器对获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果的实时数据进行更新显示。
进一步,步骤四中,所述通过模型测试模块利用模型测试程序对训练好的深度学习样本标注模型进行测试,包括:
(1)接收模型测试请求;其中,所述请求携带待测模型的测试信息,所述测试信息包括模型文件、测试数据集和待测模型的参数;
(2)根据所述模型文件确定所述待测模型的的深度学习框架为第一框架;
(3)根据所述第一框架、模型文件和待测模型的参数搭建测试模型;
(4)通过所述测试模型对所述测试数据集进行测试,并输出对所述待测模型的测试结果。
进一步,所述所述第一框架为模型测试服务中包括的多种深度学习框架中的框架;所述多种深度学习框架中不同的框架用于搭建不同的测试模型;所述不同的测试模型用于测试不同的深度学习模型。
进一步,步骤五中,所述通过样本标注模块利用样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注,包括:
(1)获取待标注的在线教育数据样本;
(2)通过样本标注模块识别所述待标注样本的至少一个区域,对所述至少一个区域进行切割形成至少一个样本区域;
(3)根据接收到的样本标注指令,利用深度学习样本标注模型对每个样本区域进行标注处理。
进一步,所述根据接收到的样本标注指令,利用深度学习样本标注模型对每个样本区域进行标注处理,包括:
1)通过样本标注模块向所述中央处理器发送样本标注请求;
2)中央处理器根据样本标注请求发出样本标注指令;
3)根据样本标注指令将每个样本区域均通过至少两个预设深度学习样本标注模型分别进行识别及标注处理。
进一步,步骤五中,所述通过样本标注审核模块利用标注审核程序对已标注的在线教育数据样本进行审核,包括:
(1)获取已标注的在线教育数据样本;
(2)将经过标注处理的样本发送给样本标注审核模块,通过所述样本标注审核模块对样本的标注结果进行审核,如果审核出所述标注结果为错误则对所述预标注结果进行修改;
(3)将经过样本标注审核模块审核的样本发送至标注审核程序,通过所述标注审核程序对经过样本标注审核模块审核后的样本标注信息进行校验处理。
进一步,所述通过所述标注审核程序对经过样本标注审核模块审核后的样本标注信息进行校验处理,包括:
针对每个已标注的在线教育数据样本,标注审核程序检验经过该样本标注审核模块审核后的样本标注信息是否准确,若不准确,则对所述已标注的在线教育数据样本进行重新识别。
本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施所述的基于在线教育大数据的深度学习样本标注方法。
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行所述的基于在线教育大数据的深度学习样本标注方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的基于在线教育大数据的深度学习样本标注系统,通过对在线教育大数据样本进行标注,为深度学习模型提供了不依赖于个人的数据入口,提高了对于在线教育数据的识别准确率,避免了个人的主观性,释放了单个重复劳动的枯燥性,也极大的方便了所有标注的用户,提升用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于在线教育大数据的深度学习样本标注系统结构框图;
图中:1、数据样本获取模块;2、分类处理模块;3、中央控制模块;4、标注模型构建模块;5、模型训练模块;6、模型测试模块;7、样本标注模块;8、样本标注审核模块;9、数据存储模块;10、更新显示模块。
图2是本发明实施例提供的基于在线教育大数据的深度学习样本标注方法流程图。
图3是本发明实施例提供的通过模型测试模块利用模型测试程序对训练好的深度学习样本标注模型进行测试的方法流程图。
图4是本发明实施例提供的通过样本标注模块利用样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注的方法流程图。
图5是本发明实施例提供的通过样本标注审核模块利用标注审核程序对已标注的在线教育数据样本进行审核的方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于在线教育大数据的深度学习样本标注方法及系统,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于在线教育大数据的深度学习样本标注系统包括:数据样本获取模块1、分类处理模块2、中央控制模块3、标注模型构建模块4、模型训练模块5、模型测试模块6、样本标注模块7、样本标注审核模块8、数据存储模块9、更新显示模块10。
样本获取模块1,与中央控制模块3连接,用于通过样本获取设备获取待标注的在线教育数据样本;
分类处理模块2,与中央控制模块3连接,用于通过分类处理程序对获取的待标注的在线教育数据样本进行分类处理,使得待标注的在线教育数据样本为同一种类别;
中央控制模块3,与数据样本获取模块1、分类处理模块2、标注模型构建模块4、模型训练模块5、模型测试模块6、样本标注模块7、样本标注审核模块8、数据存储模块9、更新显示模块10连接,用于通过中央处理器协调控制所述基于在线教育大数据的深度学习样本标注系统各个模块的正常运行;
标注模型构建模块4,与中央控制模块3连接,用于通过模型构建程序构建深度学习样本标注模型;
模型训练模块5,与中央控制模块3连接,用于通过模型训练程序利用获取的待标注的在线教育数据集对构建的深度学习样本标注模型进行训练;
模型测试模块6,与中央控制模块3连接,用于通过模型测试程序对训练好的深度学习样本标注模型进行测试,并根据测试结果对深度学习样本标注模型进行调整;
样本标注模块7,与中央控制模块3连接,用于通过样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注;
样本标注审核模块8,与中央控制模块3连接,用于通过标注审核程序对已标注的在线教育数据样本进行审核;
数据存储模块9,与中央控制模块3连接,用于通过存储器存储获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果;
更新显示模块10,与中央控制模块3连接,用于通过显示器对获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果的实时数据进行更新显示。
如图2所示,本发明实施例提供的基于在线教育大数据的深度学习样本标注方法包括以下步骤:
S101,通过样本获取模块利用样本获取设备获取待标注的在线教育数据样本;通过分类处理模块利用分类处理程序对获取的待标注的在线教育数据样本进行分类处理,使得待标注的在线教育数据样本为同一种类别;
S102,通过中央控制模块利用中央处理器协调控制所述基于在线教育大数据的深度学习样本标注系统各个模块的正常运行;
S103,通过标注模型构建模块利用模型构建程序构建深度学习样本标注模型;通过模型训练模块利用模型训练程序利用获取的待标注的在线教育数据集对构建的深度学习样本标注模型进行训练;
S104,通过模型测试模块利用模型测试程序对训练好的深度学习样本标注模型进行测试,并根据测试结果对深度学习样本标注模型进行调整;
S105,通过样本标注模块利用样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注;通过样本标注审核模块利用标注审核程序对已标注的在线教育数据样本进行审核;
S106,通过数据存储模块利用存储器存储获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果;
S107,通过更新显示模块利用显示器对获取的待标注的在线教育数据样本、样本分类处理结果、深度学习样本标注模型、样本标注结果以及样本标注审核结果的实时数据进行更新显示。
如图3所示,本发明实施例提供的步骤S104中,所述通过模型测试模块利用模型测试程序对训练好的深度学习样本标注模型进行测试,包括:
S201,接收模型测试请求;其中,所述请求携带待测模型的测试信息,所述测试信息包括模型文件、测试数据集和待测模型的参数;
S202,根据所述模型文件确定所述待测模型的的深度学习框架为第一框架;
S203,根据所述第一框架、模型文件和待测模型的参数搭建测试模型;
S204,通过所述测试模型对所述测试数据集进行测试,并输出对所述待测模型的测试结果。
本发明实施例提供的第一框架为模型测试服务中包括的多种深度学习框架中的框架;所述多种深度学习框架中不同的框架用于搭建不同的测试模型;所述不同的测试模型用于测试不同的深度学习模型。
如图4所示,本发明实施例提供的步骤S105中,所述通过样本标注模块利用样本标注程序利用深度学习样本标注模型对待标注的在线教育数据样本进行标注,包括:
S301,获取待标注的在线教育数据样本;
S302,通过样本标注模块识别所述待标注样本的至少一个区域,对所述至少一个区域进行切割形成至少一个样本区域;
S303,根据接收到的样本标注指令,利用深度学习样本标注模型对每个样本区域进行标注处理。
本发明实施例提供的根据接收到的样本标注指令,利用深度学习样本标注模型对每个样本区域进行标注处理,包括:
1)通过样本标注模块向所述中央处理器发送样本标注请求;
2)中央处理器根据样本标注请求发出样本标注指令;
3)根据样本标注指令将每个样本区域均通过至少两个预设深度学习样本标注模型分别进行识别及标注处理。
如图5所示,本发明实施例提供的步骤S105中,所述通过样本标注审核模块利用标注审核程序对已标注的在线教育数据样本进行审核,包括:
S401,获取已标注的在线教育数据样本;
S402,将经过标注处理的样本发送给样本标注审核模块,通过所述样本标注审核模块对样本的标注结果进行审核,如果审核出所述标注结果为错误则对所述预标注结果进行修改;
S403,将经过样本标注审核模块审核的样本发送至标注审核程序,通过所述标注审核程序对经过样本标注审核模块审核后的样本标注信息进行校验处理。
本发明实施例提供的通过所述标注审核程序对经过样本标注审核模块审核后的样本标注信息进行校验处理,包括:针对每个已标注的在线教育数据样本,标注审核程序检验经过该样本标注审核模块审核后的样本标注信息是否准确,若不准确,则对所述已标注的在线教育数据样本进行重新识别。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
- 一种基于在线教育大数据的深度学习样本标注方法及系统
- 一种基于在线教育大数据的深度学习样本标注方法