掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及大数据的数据处理领域,尤其涉及一种基于智能笔手写图像的处理方法、装置、系统及存储介质。

背景技术

随着信息技术和物联网技术的发展,在线教育平台越显发展趋势。而在线教育平台随着用户以及在线互动的增加,即时生成的智能笔手写图像数据越多,即时生成的智能笔手写图像数据的存储,对于在线教育平台的数据处理的准确性、协调性和效率等起到重要作用。

目前,一般都是通过关系型数据库来存储即时生成的智能笔手写图像数据,但是该存储方式,对于即时生成的智能笔手写图像数据的读写性能较差、高并发读写需求和表结构扩展不方便等缺点,从而导致基于在线教育的智能笔手写图像的存取效率低。

发明内容

本发明提供一种基于智能笔手写图像的处理方法、装置、系统及存储介质,用于提高基于在线教育的智能笔手写图像的存取效率。

本发明第一方面提供了一种基于智能笔手写图像的处理方法,包括:

获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对所述基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息;

对所述笔顺识别信息和所述基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据;

获取所述预处理数据的文件大小,并将所述文件大小与预设阈值进行对比分析,得到对比分析结果;

根据所述对比分析结果,将所述预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;

将所述待存储数据存储至预置的基于分布式文件存储的数据库。

可选的,在本发明第一方面的第一种实现方式中,所述根据所述对比分析结果,将所述预处理数据进行二进制格式转换和/或分片处理,得到待存储数据,包括:

根据所述对比分析结果,对所述预处理数据进行分类,得到待转换数据和待分片数据,所述待转换数据用于指示所述文件大小小于所述预设阈值,所述待分片数据用于指示所述文件大小大于或等于所述预设阈值;

将所述待转换数据转换为预设维度的数组,得到目标数组,并将所述目标数组写入预置的二进制文件中,得到二进制文件数据;

通过预置的分片机制,将所述待分片数据进行分片处理并写入预置的分片队列中,得到目标分片数据,所述分片机制包括分片的数据大小和分片方式;

将所述二进制文件数据和所述目标分片数据确定为待存储数据。

可选的,在本发明第一方面的第二种实现方式中,所述将所述待存储数据存储至预置的基于分布式文件存储的数据库,包括:

获取基于分布式文件存储的数据库对应各存储节点的资源占比,按照所述各存储节点的资源占比的值从大到小的顺序,对所述各存储节点进行排序,得到存储节点序列;

对所述待存储数据进行缓存得到缓存数据,并创建所述缓存数据的索引;

获取所述基于在线教育的智能笔手写图像序列对应的用户身份标识号,根据所述用户身份标识号匹配对应的用户存储策略,所述用户存储策略包括存储节点和存储比例;

按照预设的用户存储策略,将创建索引的缓存数据存储至存储节点序列。

可选的,在本发明第一方面的第三种实现方式中,所述对所述待存储数据进行缓存得到缓存数据,并创建所述缓存数据的索引,包括:

对所述待存储数据进行基于时间局部性和空间局部性的分析,得到初始数据;

对所述初始数据进行组相联高级缓存,得到缓存数据,并对所述缓存数据进行安全性度量检测,得到目标数据;

通过预置的倒排索引算法创建所述目标数据的索引。

可选的,在本发明第一方面的第四种实现方式中,所述通过预置的笔顺识别神经网络模型,对所述基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息,包括:

通过预置的笔顺识别神经网络模型中的光学字符识别网络层,对所述基于在线教育的智能笔手写图像序列进行字符识别和字符分割,得到字符图像,一张智能笔手写图像对应一个或一个以上的字符图像,所述笔顺识别神经网络模型包括光学字符识别网络层、目标检测网络层和分类网络层;

通过所述目标检测网络层,对所述字符图像进行目标框检测、目标框提取和基于多尺度跨通道的卷积融合,得到多尺度特征图序列集;

通过所述分类网络层,基于预置的多种类语言的词典和所述多尺度特征图序列集,计算所述基于在线教育的智能笔手写图像序列中字符匹配的概率,所述多种类语言的词典包括多种类语言的笔画和文字;

根据所述概率确定字符信息得到笔顺识别信息,所述笔顺识别信息包括笔顺信息和所述笔顺信息对应的文字信息。

可选的,在本发明第一方面的第五种实现方式中,所述对所述笔顺识别信息和所述基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据,包括:

对所述笔顺识别信息进行空值识别得到空值数据,将所述笔顺识别信息中的空值数据进行删除,得到目标识别信息;

从所述基于在线教育的智能笔手写图像序列中匹配与所述目标识别信息对应的目标图像集;

创建所述目标图像集与所述目标识别信息之间的对应关系,将创建有对应关系的目标图像集和目标识别信息确定为预处理数据。

可选的,在本发明第一方面的第六种实现方式中,所述将所述待存储数据存储至预置的基于分布式文件存储的数据库之后,包括:

获取所述基于分布式文件存储的数据库的数据状况,根据所述数据状况,对所述基于分布式文件存储的数据库进行新增节点的配置和连接。

本发明第二方面提供了一种基于智能笔手写图像的处理装置,包括:

识别模块,用于获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对所述基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息;

过滤模块,用于对所述笔顺识别信息和所述基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据;

分析模块,用于获取所述预处理数据的文件大小,并将所述文件大小与预设阈值进行对比分析,得到对比分析结果;

转换分片模块,用于根据所述对比分析结果,将所述预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;

存储模块,用于将所述待存储数据存储至预置的基于分布式文件存储的数据库。

可选的,在本发明第二方面的第一种实现方式中,所述转换分片模块具体用于:

根据所述对比分析结果,对所述预处理数据进行分类,得到待转换数据和待分片数据,所述待转换数据用于指示所述文件大小小于所述预设阈值,所述待分片数据用于指示所述文件大小大于或等于所述预设阈值;

将所述待转换数据转换为预设维度的数组,得到目标数组,并将所述目标数组写入预置的二进制文件中,得到二进制文件数据;

通过预置的分片机制,将所述待分片数据进行分片处理并写入预置的分片队列中,得到目标分片数据,所述分片机制包括分片的数据大小和分片方式;

将所述二进制文件数据和所述目标分片数据确定为待存储数据。

可选的,在本发明第二方面的第二种实现方式中,所述存储模块包括:

排序单元,用于获取基于分布式文件存储的数据库对应各存储节点的资源占比,按照所述各存储节点的资源占比的值从大到小的顺序,对所述各存储节点进行排序,得到存储节点序列;

缓存创建单元,用于对所述待存储数据进行缓存得到缓存数据,并创建所述缓存数据的索引;

匹配单元,用于获取所述基于在线教育的智能笔手写图像序列对应的用户身份标识号,根据所述用户身份标识号匹配对应的用户存储策略,所述用户存储策略包括存储节点和存储比例;

存储单元,用于按照预设的用户存储策略,将创建索引的缓存数据存储至存储节点序列。

可选的,在本发明第二方面的第三种实现方式中,所述缓存创建单元具体用于:

对所述待存储数据进行基于时间局部性和空间局部性的分析,得到初始数据;

对所述初始数据进行组相联高级缓存,得到缓存数据,并对所述缓存数据进行安全性度量检测,得到目标数据;

通过预置的倒排索引算法创建所述目标数据的索引。

可选的,在本发明第二方面的第四种实现方式中,所述识别模块具体用于:

通过预置的笔顺识别神经网络模型中的光学字符识别网络层,对所述基于在线教育的智能笔手写图像序列进行字符识别和字符分割,得到字符图像,一张智能笔手写图像对应一个或一个以上的字符图像,所述笔顺识别神经网络模型包括光学字符识别网络层、目标检测网络层和分类网络层;

通过所述目标检测网络层,对所述字符图像进行目标框检测、目标框提取和基于多尺度跨通道的卷积融合,得到多尺度特征图序列集;

通过所述分类网络层,基于预置的多种类语言的词典和所述多尺度特征图序列集,计算所述智能笔手写图像序列中字符匹配的概率,所述多种类语言的词典包括多种类语言的笔画和文字;

根据所述概率确定字符信息得到笔顺识别信息,所述笔顺识别信息包括笔顺信息和所述笔顺信息对应的文字信息。

可选的,在本发明第二方面的第五种实现方式中,所述过滤模块具体用于:

对所述笔顺识别信息进行空值识别得到空值数据,将所述笔顺识别信息中的空值数据删除,得到目标识别信息;

从所述基于在线教育的智能笔手写图像序列中匹配与所述目标识别信息对应的目标图像集;

创建所述目标图像集与所述目标识别信息之间的对应关系,将创建有对应关系的目标图像集和目标识别信息确定为预处理数据。

可选的,在本发明第二方面的第六种实现方式中,所述基于智能笔手写图像的处理装置,还包括:

配置连接模块,用于获取所述基于分布式文件存储的数据库的数据状况,根据所述数据状况,对所述基于分布式文件存储的数据库进行新增节点的配置和连接。

本发明第三方面提供了一种基于智能笔手写图像的处理系统,所述基于智能笔手写图像的处理系统包括智能笔、服务器和基于分布式文件存储的数据库;

所述服务器与所述智能笔和所述基于分布式文件存储的数据库网络连接;

所述智能笔包括声敏开关模块、压力传感器、光学字符识别扫描仪、处理器、图像转换器、无线网络模块、温度传感器、跟踪模块和无线充电模块;其中,所述声敏开关模块,用于检测所述智能笔上的敲击声音,根据所述敲击声音启动所述智能笔;

所述压力传感器,用于检测所述智能笔对应的点阵压力,以及采集所述智能笔书写参数,并根据所述点阵压力启动所述光学字符识别扫描仪;

所述光学字符识别扫描仪,用于将所述智能笔进行手动书写时的内容进行拍摄或扫描,得到视频信息或图像信息;

所述图像转换器,用于对所述视频信息或所述图像信息生成基于在线教育的点阵图像序列;

所述处理器,用于将所述智能笔书写参数标记在所述基于在线教育的点阵图像序列,得到基于在线教育的智能笔手写图像序列;

所述无线网络模块,用于将所述基于在线教育的智能笔手写图像序列发送至所述服务器;

所述温度传感器,用于检测所述智能笔的温度值;

所述跟踪模块,用于对所述智能笔所处的位置进行定位,以及对定位的路径进行计算;

所述无线充电模块,用于对所述智能笔进行无线充电;

所述服务器包括数据传输组件和处理模块;其中,所述数据传输组件,用于接收所述智能笔发送的基于在线教育的智能笔手写图像序列;

所述处理模块,用于对所述笔顺识别信息依次进行识别、过滤、分析和转换分片,得到待存储数据;

所述数据传输组件,用于将所述待存储数据发送至所述基于分布式文件存储的数据库;

所述基于分布式文件存储的数据库,用于存储所述服务器对所述智能笔发送的基于在线教育的智能笔手写图像序列进行处理后的待存储数据。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于智能笔手写图像的处理方法。

本发明提供的技术方案中,获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息;对笔顺识别信息和基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据;获取预处理数据的文件大小,并将文件大小与预设阈值进行对比分析,得到对比分析结果;根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;将待存储数据存储至预置的基于分布式文件存储的数据库。本发明实施例中,通过对基于在线教育的智能笔手写图像序列进行字符识别、字符分割、多层的笔顺特征提取、字符信息生成和过滤处理,根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;将待存储数据存储至预置的基于分布式文件存储的数据库,实现了统一分步式存储待存储数据,减小了待存储数据的存储开销,实现了待存储数据的存储负载均衡,提高了即时生成的待存储数据的读写性能和表结构扩展便捷性,降低了即时生成的待存储数据的高并发读写需求,并提高了待存储数据的存储准确性,从而提高了基于在线教育的智能笔手写图像的存取效率。

附图说明

图1为本发明实施例中基于智能笔手写图像的处理基于智能笔手写图像的处理方法的一个实施例示意图;

图2为本发明实施例中基于智能笔手写图像的处理方法的另一个实施例示意图;

图3为本发明实施例中基于智能笔手写图像的处理装置的一个实施例示意图;

图4为本发明实施例中基于智能笔手写图像的处理装置的另一个实施例示意图;

图5为本发明实施例中基于智能笔手写图像的处理系统的一个实施例示意图。

具体实施方式

本发明实施例提供了一种基于智能笔手写图像的处理方法、装置、系统及存储介质,提高了基于在线教育的智能笔手写图像的存取效率。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或系统固有的其它步骤或单元。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于智能笔手写图像的处理方法的一个实施例包括:

101、获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息。

可以理解的是,本发明的执行主体可以为基于智能笔手写图像的处理装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

当用户基于在线教育平台进行在线教育的在线问答,通过预置的智能笔在预置的输入装备或输入屏幕或纸张上进行手动书写时,智能笔将手动书写时的内容进行拍摄或扫描,并生成基于在线教育的智能笔手写图像序列,基于在线教育的智能笔手写图像的序列为通过智能笔手动书写的时间顺序,其中,基于在线教育的智能笔手写图像序列中的智能笔手写图像为标记点阵坐标、笔迹路径、压力参数和书写速度等智能笔书写参数的点阵图像。

智能笔将生成的基于在线教育的智能笔手写图像序列发送至(云平台对应的)服务器,(云平台对应的)服务器接收该基于在线教育的智能笔手写图像序列后,对基于在线教育的智能笔手写图像序列进行数据清洗、去噪处理、图像尺寸变换、图像增强处理以及滤波处理(包括均值滤波、中值滤波、图像双边滤波和/或高斯滤波),得到处理后的智能笔手写图像序列。

调用预先训练好的笔顺识别神经网络模型,依照生成时间的顺序,对处理后的智能笔手写图像序列中的每张智能笔手写图像中的字符进行识别以及字符所在的区域分割,得到字符区域图像,通过笔顺识别神经网络模型中的多层特征提取网络,该多层特征提取网络包括但不限于尺度不变特征变换算法surf网络、特征提取算法(oriented fast androtated brief,ORB)网络、局部二值模式(local binary patterns,LBP)网络、哈尔算法HAAR网络和门控循环单元(gated recurrent unit,GRU)网络,该多层特征提取网络之间的逻辑关系可为依次串连关系,即上一个网络的输出为下一个网络的输入,也可为并列关系,即各网络的输入相同,对字符区域图像进行多层级的特征图提取,得到多个特征图,以实现多层的笔顺特征提取,通过预置的注意力机制,将多个特征图进行融合,得到每张智能笔手写图像的融合特征,将每张智能笔手写图像的融合特征,依照生成时间从早到晚的顺序进行拼接合成,得到合成特征,根据合成特征从预置数据库中匹配对应的字符信息(该字符信息包括笔顺信息和笔顺综合对应的文字信息),即字符信息生成,得到笔顺识别信息,笔顺识别信息包括每张智能笔手写图像对应的笔顺信息以及基于在线教育的智能笔手写图像序列综合的文字信息,例如:基于在线教育的智能笔手写图像序列对应的笔顺信息为“丿”和

102、对笔顺识别信息和基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据。

服务器通过相似度算法,计算笔顺识别信息与预置的笔顺模板之间的相似度,将该相似度与预设的目标值进行对比分析,将相似度小于或等于预设的目标值的笔顺识别信息分类为待删除信息,将笔顺识别信息中的待删除信息过滤,得到目标信息,从基于在线教育的智能笔手写图像序列中获取目标信息对应的目标图像序列,从而得到预处理数据,预处理数据可包括目标图像序列以及目标图像序列对应的目标信息,预处理数据也可仅包括目标图像序列。

或者,服务器从基于在线教育的智能笔手写图像序列中获取目标信息对应的目标图像序列后,对目标图像序列中每张目标图像进行滤波处理(包括均值滤波、中值滤波、图像双边滤波和/或高斯滤波),得到预处理数据。

103、获取预处理数据的文件大小,并将文件大小与预设阈值进行对比分析,得到对比分析结果。

服务器通过调用预置的文件大小计算脚本,计算预处理数据中各数据(目标图像序列和/或目标图像序列对应的目标信息)的文件大小,判断各数据的文件大小是否大于预设阈值,若是,则得到大于的判定结果,并将对应的数据确定为待分片数据,若否,则得到小于或等于的判定结果,并将对应的数据确定为待转换数据,从而得到对比分析结果,该对比分析结果包括判定结果和判定结果对应的数据(该数据包括目标图像序列和/或目标图像序列对应的目标信息)。

104、根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据。

服务器得到对比分析结果后,获取对比分析结果中待分片数据和待转换数据,其中,当对比分析结果不存在大于的判定结果时,待分片数据为空值,当对比分析结果不存在小于或等于的判定结果时,待转换数据为空值。

服务器通过预置的文件服务器gridfs,基于预置的分片机制和复制机制,按照目标图像序列的序列顺序,将待分片数据分成预设数量的块,得到目标分片数据,每个块的大小相同。

若待转换数据存在目标图像序列,则服务器调用预置的二进制图像转换器,将目标图像序列转换为二进制数据流,若待转换数据存在目标图像序列对应的目标信息,将目标信息写入预置对象(如bson.binary.Binary)中,得到写入数据,通过预置的二进制算法对写入数据进行二进制转换,得到二进制文件数据。

当对比分析结果存在待分片数据和待转换数据,待分片数据和待转换数据均不为空值时,将目标分片数据和二进制文件数据确定为待存储数据,当对比分析结果存在待分片数据或待转换数据,待分片数据或待转换数据不为空值时,将目标分片数据或二进制文件数据确定为待存储数据。

105、将待存储数据存储至预置的基于分布式文件存储的数据库。

服务器按照预置的存储节点比例,将待存储数据存储至预置的基于分布式文件存储的数据库MongonDB中的各存储节点中,例如:基于分布式文件存储的数据库MongonDB具有存储节点A、存储节点B、存储节点C和存储节点D,存储节点A、存储节点B、存储节点C和存储节点D分别为40%、30%、20%和10%,则将40%的待存储数据存储到数据库MongonDB的存储节点A中,将30%的待存储数据存储到数据库MongonDB的存储节点B中,将20%的待存储数据存储到数据库MongonDB的存储节点C中,将10%的待存储数据存储到数据库MongonDB的存储节点D中,其中,40%的待存储数据可为待存储数据排序前40%的数据,也可为待存储数据中随机40%的数据,同理可得30%的待存储数据、20%的待存储数据和10%的待存储数据。

可选的,基于分布式文件存储的数据库中预先创建有区块链,区块链包括多个区块链节点,基于分布式文件存储的数据库中每个存储节点对应一个或多个区块链节点。服务器获得待存储数据后,获取基于分布式文件存储的数据库中对应的目标存储节点,该目标存储节点的数量包括一个或多个,将待存储数据平均存储至目标存储节点,目标存储节点根据待存储数据生成存储请求,并将该存储请求发送至对应的区块链节点,该区块链节点接收到该存储请求后,对存储请求依次进行解析、验证和执行结果生成,并将执行结果发送至目标存储节点,以实现结合区块链的基于分布式文件存储的数据库,对待存储数据的存储,使得待存储数据的存储具备高可用性和更高的容错能力,以及较好的安全性。

可选的,服务器将待存储数据存储至预置的基于分布式文件存储的数据库之后,当接收到处理指令时,根据该处理指令遍历预置的机器人树,得到对应的机器人,调用该机器人,对基于分布式文件存储的数据库中的待存储数据进行检索和读取,得到读取后的待存储数据,根据读取后的待存储数据,对数据库中的预先存储的笔顺视频和笔顺动态图片进行匹配,得到对应的目标笔顺信息,或者,服务器对读取后的待存储数据进行笔顺错误信息标识和反馈。

本发明实施例中,通过对基于在线教育的智能笔手写图像序列进行字符识别、字符分割、多层的笔顺特征提取、字符信息生成和过滤处理,根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;将待存储数据存储至预置的基于分布式文件存储的数据库,实现了统一分步式存储待存储数据,减小了待存储数据的存储开销,实现了待存储数据的存储负载均衡,提高了即时生成的待存储数据的读写性能和表结构扩展便捷性,降低了即时生成的待存储数据的高并发读写需求,并提高了待存储数据的存储准确性,从而提高了基于在线教育的智能笔手写图像的存取效率。

请参阅图2,本发明实施例中基于智能笔手写图像的处理方法的另一个实施例包括:

201、获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息。

当用户基于在线教育平台进行在线教育的在线问答,通过预置的智能笔在预置的输入装备或者输入屏幕或纸张上进行手动书写时,智能笔中的光学字符识别扫描仪,将手动书写时的内容进行拍摄或扫描,生成智能笔手写视频,通过预置的转换工具或转换脚本,将智能笔手写视频转换为基于在线教育的智能笔手写图像序列,并将该基于在线教育的智能笔手写图像序列发送至服务器,其中,智能笔手写图像的序列表示通过智能笔手动书写的时间顺序。

具体地,服务器通过预置的笔顺识别神经网络模型中的光学字符识别网络层,对基于在线教育的智能笔手写图像序列进行字符识别和字符分割,得到字符图像,一张智能笔手写图像对应一个或一个以上的字符图像,笔顺识别神经网络模型包括光学字符识别网络层、目标检测网络层和分类网络层;通过目标检测网络层,对字符图像进行目标框检测、目标框提取和基于多尺度跨通道的卷积融合,得到多尺度特征图序列集;通过分类网络层,基于预置的多种类语言的词典和多尺度特征图序列集,计算基于在线教育的智能笔手写图像序列中字符匹配的概率,多种类语言的词典包括多种类语言的笔画和文字;根据概率确定字符信息得到笔顺识别信息,笔顺识别信息包括笔顺信息和笔顺信息对应的文字信息。

服务器获得基于在线教育的智能笔手写图像序列后,调用预置的笔顺识别神经网络模型,笔顺识别神经网络模型包括光学字符识别网络层、目标检测网络层和分类网络层,其中,光学字符识别网络层可由光学字符识别(Optical Character Recognition,OCR)算法构成,目标检测网络层可由快速卷积神经网络(faster r-convolutional neuralnetworks,Faster R-CNN)和单阶段目标检测网络RetinaNet和单阶段目标检测算法ET-YOLOv3组合构成,分类网络层可由多个分类器构成。

服务器通过光学字符识别网络层,对基于在线教育的智能笔手写图像序列中的每张智能笔手写图像进行字符识别和字符分割,得到每张智能笔手写图像的字符图像,该字符图像的数量包括一个或一个以上,通过目标检测网络层,基于预置的多个锚框,对每张字符图像依次进行锚框标注、交并比计算、目标框确定和目标框分割,得到每张智能笔手写图像的目标框图像,该目标框图像的数量包括一个或一个以上,基于卷积激活层(包括5层卷积层、1层批正常化BN层和1层激活层)、卷积激活块(包括1层卷积层、1层批正常化BN层和1层激活层)、卷积层(包括2层)、上采样层和融合层,依次对每张智能笔手写图像的目标框图像进行多尺度跨通道的特征提取,得到多尺度特征图,所有智能笔手写图像的多尺度特征图,依生成时间的先后顺序排列得到多尺度特征图序列集。

通过分类网络层,基于预置的多种类语言的词典(该词典包括笔画和文字)和多尺度特征图序列集,计算基于在线教育的智能笔手写图像序列中文字匹配的概率,将概率从大到小的顺序进行排序,将排序第一的概率所对应多种类语言的词典中的笔顺和/或字词确定为笔顺识别信息。通过上述的执行过程,提高笔顺识别信息识别的准确性和效率。

202、对笔顺识别信息和基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据。

具体地,服务器对笔顺识别信息进行空值识别得到空值数据,将笔顺识别信息中的空值数据进行删除,得到目标识别信息;从基于在线教育的智能笔手写图像序列中匹配与目标识别信息对应的目标图像集;创建目标图像集与目标识别信息之间的对应关系,将创建有对应关系的目标图像集和目标识别信息确定为预处理数据。

服务器判断笔顺识别信息中是否存在预置的空值字段和空值字段值,若否,则停止执行,若是,则将对应的笔顺识别信息确定为空值数据,将空值数据从笔顺识别信息中剔除,得到目标识别信息,根据目标识别信息对基于在线教育的智能笔手写图像序列进行分类,得到对应的目标图像集;创建目标图像集与目标识别信息的对应关系,将创建有对应关系的目标图像集和目标识别信息确定为预处理数据。

或者,服务器通过预置的过滤规则树,对笔顺识别信息和基于在线教育的智能笔手写图像序列进行匹配,得到过滤之后的预处理数据,该过滤规则树包括但不限于笔顺识别信息和基于在线教育的智能笔手写图像序列的完整性、安全性和再处理的识别规则,通过对笔顺识别信息和基于在线教育的智能笔手写图像序列进行过滤处理,减少了无需存储的智能笔手写图像和笔顺识别信息,减少了存储数据量,提高了存储的智能笔手写图像和笔顺识别信息的准确性,减少了后续对于无需存储的智能笔手写图像和笔顺识别信息的操作和计算,便于提高存取的效率。

203、获取预处理数据的文件大小,并将文件大小与预设阈值进行对比分析,得到对比分析结果。

服务器通过调用预置的文件大小计算脚本,计算预处理数据中各数据(目标图像序列和/或目标图像序列对应的目标信息)的文件大小,判断各数据的文件大小是否大于预设阈值,若是,则得到大于的判定结果,若否,则得到小于或等于的判定结果,从而得到对比分析结果,该对比分析结果包括判定结果和判定结果对应的数据(该数据包括目标图像序列和/或目标图像序列对应的目标信息)。

204、根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据。

具体地,服务器根据对比分析结果,对预处理数据进行分类,得到待转换数据和待分片数据,待转换数据用于指示文件大小小于预设阈值,待分片数据用于指示文件大小大于或等于预设阈值;将待转换数据转换为预设维度的数组,得到目标数组,并将目标数组写入预置的二进制文件中,得到二进制文件数据;通过预置的分片机制,将待分片数据进行分片处理并写入预置的分片队列中,得到目标分片数据,分片机制包括分片的数据大小和分片方式;将二进制文件数据和目标分片数据确定为待存储数据。

其中,待转换数据或待分片数据可为空值。服务器通过预置的矩阵变换函数reshape函数,将待转换数据转换为预设维度(为一维)的数组,得到一维数组,将一维数组转换为预置行列的二维数组,得到目标数组,将目标数据写入预置的二进制文件中,得到二进制文件数据。

服务器识别待分片数据中的分片字段区间(分片字段区间包括时间段字段),通过预置的分片机制中的时间主键切片方式,基于分片字段区间和预设的分片的数据大小,将待分片数据进行时间分片处理,得到初始分片数据,计算初始分片数据中预置字段(该预置字段为预设分片点对应的字段)的哈希值,对哈希值和预置的分片总数进行取模,得到分片维度,根据分片维度、预设的分片的数据大小和预置的一致性哈希算法,对初始分片数据进行分片,得到目标分片数据。

205、将待存储数据存储至预置的基于分布式文件存储的数据库。

具体地,服务器获取基于分布式文件存储的数据库对应各存储节点的资源占比,按照各存储节点的资源占比的值从大到小的顺序,对各存储节点进行排序,得到存储节点序列;对待存储数据进行缓存得到缓存数据,并创建缓存数据的索引;获取基于在线教育的智能笔手写图像序列对应的用户身份标识号,根据用户身份标识号匹配对应的用户存储策略,用户存储策略包括存储节点和存储比例;按照预设的用户存储策略,将创建索引的缓存数据存储至存储节点序列。

其中,该资源占比包括中央处理器(central processing unit,CPU)资源占比、存储空间数据占比和空闲资源占比。服务器通过实时监测机制,对基于分布式文件存储的数据库对应各存储节点的资源状况进行实时监测、计算和读取,从而得到资源占比,根据资源占比的值从小到大的顺序,对各存储节点进行排序,得到存储节点序列。通过预置的高速缓存器,对待存储数据进行缓存得到缓存数据,并通过预置的哈希算法建立缓存数据的索引。服务器根据用户身份标识号,对预置的策略树进行遍历,得到对应的用户存储策略,该用户存储策略包括存储节点和存储比例,其中,存储节点和存储比例之间创建有对应关系,根据用户存储策略中的存储节点从存储节点序列中匹配对应的目标存储节点,按照存储比例,将创建索引的缓存数据存储到对应的目标存储节点中。通过上述执行过程,能够快速、有序和有效地存储和读取待存储数据,从而提高基于在线教育的智能笔手写图像的存取效率。

具体地,服务器对待存储数据进行基于时间局部性和空间局部性的分析,得到初始数据;对初始数据进行组相联高级缓存,得到缓存数据,并对缓存数据进行安全性度量检测,得到目标数据;通过预置的倒排索引算法创建目标数据的索引。

服务器获取待存储数据的访问时间,判断访问时间是否为预设的访问时间,若是,则将待存储数据确定为初始数据,若否,则停止执行,以及通过预置的预测模型,对与待存储数据相关的访问数据进行预测,得到相关访问数据,将待存储数据和相关访问数据确定为初始数据,以实现对待存储数据的基于时间局部性和空间局部性的分析。

服务器对初始数据进行组选择、行匹配和字选择,得到缓存数据,以实现对初始数据的组相联高级缓存,并对缓存数据进行路径遍历的正确性、缓冲区溢出、格式化字符串的准确性、加密算法的审查状况和资源的释放状况等参数的安全性度量检测,从而得到目标数据,通过预置的倒排索引算法创建目标数据的索引,提高了后续存储待存储数据的并发能力和效率。

206、获取基于分布式文件存储的数据库的数据状况,根据数据状况,对基于分布式文件存储的数据库进行新增节点的配置和连接。

其中,数据状况包括待存储数据访问量和数据存储量,服务器启动定时器,通过该定时器进行计时,当定时器计时到预设时刻时,统计基于分布式文件存储的数据库中基于预设时段的待存储数据访问量,以及待存储数据对应的存储节点的数据存储量;判断待存储数据访问量和数据存储量是否符合预设的增设条件,若是,则对基于分布式文件存储的数据库进行新增节点的配置和连接,若否,则不对基于分布式文件存储的数据库进行新增节点的配置和连接,其中,新增节点可为数据库服务器或虚拟存储节点。通过新增节点分担基于分布式文件存储的数据库的存储压力,便于基于分布式文件存储的数据库对基于在线教育的智能笔手写图像快速、有效和准确的存取,从而提高了基于在线教育的智能笔手写图像的存取效率。

本发明实施例中,不仅实现了统一分步式存储待存储数据,减小了待存储数据的存储开销,实现了待存储数据的存储负载均衡,提高了即时生成的待存储数据的读写性能和表结构扩展便捷性,降低了即时生成的待存储数据的高并发读写需求,并提高了待存储数据的存储准确性,从而提高了基于在线教育的智能笔手写图像的存取效率,还通过新增节点分担基于分布式文件存储的数据库的存储压力,便于基于分布式文件存储的数据库对基于在线教育的智能笔手写图像的存取,从而提高了基于在线教育的智能笔手写图像的存取效率。

上面对本发明实施例中基于智能笔手写图像的处理方法进行了描述,下面对本发明实施例中基于智能笔手写图像的处理装置进行描述,请参阅图3,本发明实施例中基于智能笔手写图像的处理装置一个实施例包括:

识别模块301,用于获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息;

过滤模块302,用于对笔顺识别信息和基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据;

分析模块303,用于获取预处理数据的文件大小,并将文件大小与预设阈值进行对比分析,得到对比分析结果;

转换分片模块304,用于根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;

存储模块305,用于将待存储数据存储至预置的基于分布式文件存储的数据库。

上述基于智能笔手写图像的处理装置中各个模块的功能实现与上述基于智能笔手写图像的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

本发明实施例中,通过对基于在线教育的智能笔手写图像序列进行字符识别、字符分割、多层的笔顺特征提取、字符信息生成和过滤处理,根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;将待存储数据存储至预置的基于分布式文件存储的数据库,实现了统一分步式存储待存储数据,减小了待存储数据的存储开销,实现了待存储数据的存储负载均衡,提高了即时生成的待存储数据的读写性能和表结构扩展便捷性,降低了即时生成的待存储数据的高并发读写需求,并提高了待存储数据的存储准确性,从而提高了基于在线教育的智能笔手写图像的存取效率。

请参阅图4,本发明实施例中基于智能笔手写图像的处理装置的另一个实施例包括:

识别模块301,用于获取基于在线教育的智能笔手写图像序列,通过预置的笔顺识别神经网络模型,对基于在线教育的智能笔手写图像序列依次进行字符识别、字符分割、多层的笔顺特征提取和字符信息生成,得到笔顺识别信息;

过滤模块302,用于对笔顺识别信息和基于在线教育的智能笔手写图像序列进行过滤处理,得到预处理数据;

分析模块303,用于获取预处理数据的文件大小,并将文件大小与预设阈值进行对比分析,得到对比分析结果;

转换分片模块304,用于根据对比分析结果,将预处理数据进行二进制格式转换和/或分片处理,得到待存储数据;

存储模块305,用于将待存储数据存储至预置的基于分布式文件存储的数据库;

配置连接模块306,用于获取基于分布式文件存储的数据库的数据状况,根据数据状况,对基于分布式文件存储的数据库进行新增节点的配置和连接。

可选的,转换分片模块304还可以具体用于:

根据对比分析结果,对预处理数据进行分类,得到待转换数据和待分片数据,待转换数据用于指示文件大小小于预设阈值,待分片数据用于指示文件大小大于或等于预设阈值;

将待转换数据转换为预设维度的数组,得到目标数组,并将目标数组写入预置的二进制文件中,得到二进制文件数据;

通过预置的分片机制,将待分片数据进行分片处理并写入预置的分片队列中,得到目标分片数据,分片机制包括分片的数据大小和分片方式;

将二进制文件数据和目标分片数据确定为待存储数据。

可选的,存储模块305包括:

排序单元3051,用于获取基于分布式文件存储的数据库对应各存储节点的资源占比,按照各存储节点的资源占比的值从大到小的顺序,对各存储节点进行排序,得到存储节点序列;

缓存创建单元3052,用于对待存储数据进行缓存得到缓存数据,并创建缓存数据的索引;

匹配单元3053,用于获取基于在线教育的智能笔手写图像序列对应的用户身份标识号,根据用户身份标识号匹配对应的用户存储策略,用户存储策略包括存储节点和存储比例;

存储单元3054,用于按照预设的用户存储策略,将创建索引的缓存数据存储至存储节点序列。

可选的,缓存创建单元3052还可以具体用于:

对待存储数据进行基于时间局部性和空间局部性的分析,得到初始数据;

对初始数据进行组相联高级缓存,得到缓存数据,并对缓存数据进行安全性度量检测,得到目标数据;

通过预置的倒排索引算法创建目标数据的索引。

可选的,识别模块301还可以具体用于:

通过预置的笔顺识别神经网络模型中的光学字符识别网络层,对基于在线教育的智能笔手写图像序列进行字符识别和字符分割,得到字符图像,一张智能笔手写图像对应一个或一个以上的字符图像,笔顺识别神经网络模型包括光学字符识别网络层、目标检测网络层和分类网络层;

通过目标检测网络层,对字符图像进行目标框检测、目标框提取和基于多尺度跨通道的卷积融合,得到多尺度特征图序列集;

通过分类网络层,基于预置的多种类语言的词典和多尺度特征图序列集,计算基于在线教育的智能笔手写图像序列中字符匹配的概率,多种类语言的词典包括多种类语言的笔画和文字;

根据概率确定字符信息得到笔顺识别信息,笔顺识别信息包括笔顺信息和笔顺信息对应的文字信息。

可选的,过滤模块302还可以具体用于:

对笔顺识别信息进行空值识别得到空值数据,将笔顺识别信息中的空值数据进行删除,得到目标识别信息;

从基于在线教育的智能笔手写图像序列中匹配与目标识别信息对应的目标图像集;

创建目标图像集与目标识别信息之间的对应关系,将创建有对应关系的目标图像集和目标识别信息确定为预处理数据。

上述基于智能笔手写图像的处理装置中各模块和各单元的功能实现与上述基于智能笔手写图像的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

本发明实施例中,不仅实现了统一分步式存储待存储数据,减小了待存储数据的存储开销,实现了待存储数据的存储负载均衡,提高了即时生成的待存储数据的读写性能和表结构扩展便捷性,降低了即时生成的待存储数据的高并发读写需求,并提高了待存储数据的存储准确性,从而提高了基于在线教育的智能笔手写图像的存取效率,还通过新增节点分担基于分布式文件存储的数据库的存储压力,便于基于分布式文件存储的数据库对基于在线教育的智能笔手写图像的存取,从而提高了基于在线教育的智能笔手写图像的存取效率。

上面图3和图4从模块化功能实体的角度对本发明实施例中的基于智能笔手写图像的处理装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于智能笔手写图像的处理系统进行详细描述。

图5是本发明实施例提供的一种基于智能笔手写图像的处理系统的结构示意图,该基于智能笔手写图像的处理系统包括智能笔5100、服务器5200和基于分布式文件存储的数据库5300;服务器5200与智能笔和基于分布式文件存储的数据库5300网络连接;智能笔包括声敏开关模块5101、压力传感器5102、光学字符识别扫描仪5103、处理器5104、图像转换器5105、无线网络模块5106、温度传感器5107、跟踪模块5108和无线充电模块5109;其中,声敏开关模块5101,用于检测智能笔上的敲击声音,根据敲击声音启动智能笔;压力传感器5102,用于检测智能笔对应的点阵压力,以及采集智能笔书写参数,并根据点阵压力启动光学字符识别扫描仪5103;光学字符识别扫描仪5103,用于将智能笔进行手动书写时的内容进行拍摄或扫描,得到视频信息或图像信息;图像转换器5105,用于对视频信息或图像信息生成基于在线教育的点阵图像序列;处理器5104,用于将智能笔书写参数标记在基于在线教育的点阵图像序列,得到基于在线教育的智能笔手写图像序列;无线网络模块5106,用于将基于在线教育的智能笔手写图像序列发送至服务器5200;温度传感器5107,用于检测智能笔的温度值;跟踪模块5108,用于对智能笔所处的位置进行定位,以及对定位的路径进行计算;无线充电模块5109,用于对智能笔进行无线充电;服务器5200包括数据传输组件5210和处理模块5220;其中,数据传输组件5210,用于接收智能笔发送的基于在线教育的智能笔手写图像序列;处理模块5220,用于对笔顺识别信息依次进行识别、过滤、分析和转换分片,得到待存储数据;数据传输组件5210,用于将待存储数据发送至基于分布式文件存储的数据库5300;基于分布式文件存储的数据库5300,用于存储服务器5200对智能笔发送的基于在线教育的智能笔手写图像序列进行处理后的待存储数据。

其中,智能笔5100还包括电源模块5110和信号收发器5111。声敏开关模块5101包括声敏传感器和开关电路。用户通过在智能笔5100的笔身上任何一处进行敲击,发出敲击声,声敏开关模块5101中的声敏传感器检测到声音,通过开关电路和电源模块5110启动智能笔5100,智能笔5100的笔尖处设有压力传感器5102,用户基于在线教育平台进行在线教育的在线问答,通过预置的智能笔5100在预置的输入装备或输入屏幕或纸张上进行手动书写时,产生点阵压力,压力传感器5102检测到该点阵压力,采集智能笔5100的笔尖所对应的点阵坐标、笔迹路径、压力参数和书写速度等智能笔书写参数,并通过信号收发器5111将这些智能笔书写参数发送至处理器5104,在用户通过智能笔5100在预置的输入装备或输入屏幕或纸张上进行手动书写时,启动光学字符识别扫描仪5103,光学字符识别扫描仪5103将智能笔进行手动书写时的内容进行拍摄或扫描,得到视频信息或图像信息,并通过信号收发器5111将视频信息或图像信息发送至图像转换器5105,图像转换器5105将视频信息或图像信息生成基于在线教育的点阵图像序列,将基于在线教育的点阵图像序列发送至处理器5104,处理器5104将标记点阵坐标、笔迹路径、压力参数和书写速度等智能笔书写参数对应标记在基于在线教育的点阵图像序列上,得到基于在线教育的智能笔手写图像序列,通过信号收发器5111和无线网络模块5106,将基于在线教育的智能笔手写图像序列发送至服务器5200。

智能笔5100还包括起保停电路。无线网络模块5106的发送方式包括无线Wifi发送方式、移动通信信号4G发送方式、蓝牙低能耗(bluetooth low energy,BLE)发送方式和移动通信信号5G发送方式。当智能笔5100被使用时,可通过温度传感器5107检测智能笔5100的温度值,并将温度值发送至处理器5104,处理器5104判断该温度值是否大于预设阈值,若是,则启动起保停电路,控制智能笔5100停止工作,若否,则继续检测,通过温度传感器5107起到温度保护作用。跟踪模块5108包括全球定位系统(global positioning system,GPS)定位器和跟踪计算单元,智能笔5100可通过跟踪模块5108中的GPS定位器对智能笔5100所处的位置进行定位,通过跟踪计算单元对定位的路径进行计算,以防止智能笔5100的丢失,以及便于智能笔5100的定位召回。智能笔5100可通过无线充电模块5109进行无线充电,提高了智能笔的充电便捷性。

智能笔5100还包括半导体光电器件5112,半导体光电器件5112如光导管、光电池、光电二极管或光电晶体管等。当智能笔5100启动,并且半导体光电器件5112监测到智能笔5100所处环境的光度小于预设亮度时,进行照明,便于智能笔5100在亮度低的环境下能够有足够的亮度操作智能笔5100。

数据传输组件5210可包括收发器。数据传输组件5210中的收发器的收发方式可为有线网络收发方式、无线网络收发方式或协议收发方式。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行基于智能笔手写图像的处理方法的步骤。

进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 基于智能笔手写图像的处理方法、装置、系统及存储介质
  • 基于智能笔手写图像的处理方法、装置、系统及存储介质
技术分类

06120112965037