掌桥专利:专业的专利平台
掌桥专利
首页

基于笔顺及OCR文字识别方法、装置、设备及存储介质

文献发布时间:2023-06-19 11:32:36


基于笔顺及OCR文字识别方法、装置、设备及存储介质

技术领域

本发明涉及字符识别技术领域,尤其涉及一种基于笔顺及OCR文字识别方法、装置、设备及存储介质。

背景技术

随着信息技术和计算机技术的日益普及,人类社会已进入信息时代,把各类载体上的原始信息转化为计算机可处理和传输的电子比特信息已成为要解决的重要问题;光学字符识别(Optical Character Recognition,OCR)技术成为有效解决手工输入文字信息的重要工具,在各领域被广泛应用,并产生了巨大的社会效益和经济效益。

OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

现有的字符识别中单独通过OCR识别的准确率不高,影响了用户的体验度。

发明内容

本发明的主要目的在于提供一种基于笔顺及OCR文字识别方法、装置、设备及存储介质,旨在解决现有技术中单独通过OCR识别的准确率不高,影响了用户的体验度的技术问题。

第一方面,本发明提供一种基于笔顺及OCR的文字识别方法,所述基于笔顺及OCR的文字识别方法包括以下步骤:

在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;

通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;

从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。

可选地,所述在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据,包括:

在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值;

根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据;

通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据。

可选地,所述在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值,包括:

在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据;

通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标;

通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。

可选地,所述通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果,包括:

对所述当前文本图像数据进行二值化处理,获得二值化图;

对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据;

对所述字符数据进行字符识别,获得初步文字识别结果。

可选地,所述从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果,包括:

从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符;

分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配,将综合匹配度最高的若干字符作为各最终匹配文字;

获取所述智能书写笔书写时对应的书写时序,根据所述书写时序对各最终匹配文字进行排序,生成最终文字识别结果。

可选地,所述从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果之后,所述基于笔顺及OCR的文字识别方法还包括:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作。

可选地,所述将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作,包括:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,在所述身份识别结果为教师时,开启布置作业及批改作业功能;在所述身份识别结果为学生时,开启答题功能及上交作业功能。

第二方面,为实现上述目的,本发明还提出一种基于笔顺及OCR的文字识别装置,所述基于笔顺及OCR的文字识别装置包括:

采集模块,用于在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;

初步识别模块,用于通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;

优化模块,用于从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。

第三方面,为实现上述目的,本发明还提出一种基于笔顺及OCR的文字识别设备,所述基于笔顺及OCR的文字识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于笔顺及OCR的文字识别程序,所述基于笔顺及OCR的文字识别程序配置为实现如权利要求上文所述的基于笔顺及OCR的文字识别方法的步骤。

第四方面,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于笔顺及OCR的文字识别程序,所述基于笔顺及OCR的文字识别程序被处理器执行时实现如上文所述的基于笔顺及OCR的文字识别方法的步骤。

本发明提出的基于笔顺及OCR的文字识别方法,通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;

图2为本发明基于笔顺及OCR的文字识别方法第一实施例的流程示意图;

图3为本发明基于笔顺及OCR的文字识别方法第二实施例的流程示意图;

图4为本发明基于笔顺及OCR的文字识别方法第三实施例的流程示意图;

图5为本发明基于笔顺及OCR的文字识别方法第四实施例的流程示意图;

图6为本发明基于笔顺及OCR的文字识别方法第五实施例的流程示意图;

图7为本发明基于笔顺及OCR的文字识别方法第六实施例的流程示意图;

图8为本发明基于笔顺及OCR的文字识别装置第一实施例的功能模块图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的解决方案主要是:通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验,解决了现有技术中单独通过OCR识别的准确率不高,影响了用户的体验度的技术问题。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。

如图1所示,该设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(Non-Volatile Memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本实施例中的基于笔顺及OCR的文字识别设备可以是智能书写笔,所述智能书写笔中还可以集成有OCR采集装置、压力传感器、微型运动传感器、供电单元及无线传输单元等,本实施例对此不加以限制。

本领域技术人员可以理解,图1中示出的设备结构并不构成对该设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于笔顺及OCR的文字识别程序。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,并执行以下操作:

在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;

通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;

从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,还执行以下操作:

在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值;

根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据;

通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,还执行以下操作:

在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据;

通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标;

通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,还执行以下操作:

对所述当前文本图像数据进行二值化处理,获得二值化图;

对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据;

对所述字符数据进行字符识别,获得初步文字识别结果。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,还执行以下操作:

从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符;

分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配,将综合匹配度最高的若干字符作为各最终匹配文字;

获取所述智能书写笔书写时对应的书写时序,根据所述书写时序对各最终匹配文字进行排序,生成最终文字识别结果。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,还执行以下操作:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序,还执行以下操作:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,在所述身份识别结果为教师时,开启布置作业及批改作业功能;在所述身份识别结果为学生时,开启答题功能及上交作业功能。

本实施例通过上述方案,通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。

基于上述硬件结构,提出本发明基于笔顺及OCR的文字识别方法实施例。

参照图2,图2为本发明基于笔顺及OCR的文字识别方法第一实施例的流程示意图。

在第一实施例中,所述基于笔顺及OCR的文字识别方法包括以下步骤:

步骤S10、在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据。

需要说明的是,所述笔迹数据为智能书写笔在书写时产生的相关笔迹对应的笔迹轨迹数据,所述当前文本图像数据为通过OCR采集装置在所述智能书写笔书写时实时采集的笔迹对应的文字图像对应的当前文本图像数据。

步骤S20、通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果。

需要说明的是,所述预设OCR识别算法为预先设置的光学字符识别的算法,通过对所述当前本图像数据进行识别出书写文字对应的图像通过OCR识别算法分析获得的初步文字识别结果。

步骤S30、从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。

需要说明的是,所述笔迹数据中对应有落笔顺序,即智能书写笔在落笔书写时同时产生的落笔顺序,通过所述落笔顺序可以对所述初步文字识别结果中的相关文字进行优化,从而获得最终文字识别结果。

本实施例通过上述方案,通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。

进一步地,图3为本发明基于笔顺及OCR的文字识别方法第二实施例的流程示意图,如图3所示,基于第一实施例提出本发明基于笔顺及OCR的文字识别方法第二实施例,在本实施例中,所述步骤S10具体包括以下步骤:

步骤S11、在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值。

需要说明的是,所述书写动作数据为用户在使用智能书写笔书写时产生的相关动作对应的动作数据,所述点阵坐标为在使用智能书写笔书写时对应的矩阵坐标,所述点阵坐标可以是书写的文字对应的空间坐标记录,所述压力变化值为通过智能书写笔的压力传感器检测到智能书写笔在书写产生的压力对应的变化值。

步骤S12、根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据。

可以理解的是,根据所述书写动作对应的动作数据,所述点阵坐标对应的坐标数据和所述压力变化值对应的压力数据可以综合构成当前书写的笔迹数据。

步骤S13、通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据。

应当理解的是,通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,即对书写的文字进行实时摄像或扫描能够生成对应的图像,即获得当前文本图像数据。

本实施例通过上述方案,通过在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值;根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据;通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据,能够利用书写动作数据、点阵坐标及智能书写笔的压力变化值对当前文本图像数据进行和结合对比分析,进一步提高了字符的识别能力,在保证工作效率的同时,提高了文字识别的效率和准确率,避免了识别效果差,识别错误率高的问题。

进一步地,图4为本发明基于笔顺及OCR的文字识别方法第三实施例的流程示意图,如图4所示,基于第二实施例提出本发明基于笔顺及OCR的文字识别方法第三实施例,在本实施例中,所述步骤S11具体包括以下步骤:

步骤S111、在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据。

需要说明的是,在智能书写笔书写时,可以通过安装在智能书写笔内部或外部的微型运动传感器获得用户的握笔运动轨迹数据,所述微型运动传感器可以是力传感器、位置传感器、位移传感器、触摸传感器中的任意一种或结合,或者为其他能够起到相同或类似功能的传感器,例如陀螺仪、加速度传感器、重力传感器及红外传感器等,本实施例对此不加以限制;通过所述微型运动传感器能够实时采集用户在握笔书写时产生的握笔运动轨迹数据,其可以包括上下前后左右各个方向的智能书写笔数据。

可以理解的是,对所述握笔运动轨迹数据进行运动序列整合处理,即通过运动时的时序对握笔运动轨迹数据进行运动轨迹数据帧图像提取,从而获得对应的运动数据作为用户的书写动作数据。

步骤S112、通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标。

应当理解的是,通过所述智能书写笔中的坐标记录仪可以实时采集并记录在书写过程中产生的点阵坐标,所述点阵坐标可以是智能书写笔在电极相应书写屏幕产生的屏幕点阵坐标,也可以是智能书写笔在书写纸质界面映射在本地或云端显示界面形成的空间点阵坐标,本实施例对此不加以限制。

步骤S113、通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。

可以理解的是,通过所述智能书写笔中的压力传感器可以获得所述智能书写笔在书写过程中笔迹滚珠形成的压力滚动数据,通过所述压力滚动数据按照时间先后顺序记录,并计算出对应的压力变化情况可以获得所述智能书写笔书写时的压力变化值。

本实施例通过上述方案,通过在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据;通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标;通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值;能够通过智能书写笔的数据采集装置采集用户的书写动作数据、点阵坐标及智能书写笔的压力变化值,保证了数据的精确性和全面性,进一步提高了字符的识别能力,在保证工作效率的同时,提高了文字识别的效率和准确率,避免了识别效果差,识别错误率高的问题。

进一步地,图5为本发明基于笔顺及OCR的文字识别方法第四实施例的流程示意图,如图5所示,基于第一实施例提出本发明基于笔顺及OCR的文字识别方法第四实施例,在本实施例中,所述步骤S20具体包括以下步骤:

步骤S21、对所述当前文本图像数据进行二值化处理,获得二值化图。

需要说明的是,由于所述当前文本图像数据对应的图片大多数彩色图像,而彩色图像所含信息量巨大,对于图片的内容,为了让计算机更快的,更好的识别文字,先对彩色图进行二值化处理,使图片只存在前景信息与背景信息,从而生成二值化图,进一步提升识别处理的效率和精确度。

步骤S22、对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据。

可以理解的是,由于二值化图像的品质受限于输入设备、环境、以及文档的印刷质量,在对图像中印刷体字符进行识别处理前,需要根据噪声的特征对待识别图像进行去噪处理,即对所述二值化图进行噪声去除,从而提升识别处理的精确度。

应当理解的是,由于扫描和拍摄过程是在智能书写笔上操作的,输入计算机的待识别图像或多或少都会存在一些倾斜,在对图像字符进行识别处理前,就需要进行图像方向检测,并校正图像方向。

在具体实现中,由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了OCR识别的性能,此时需要将处理后的图像数据进行字符切割,获得切割后的字符数据。

步骤S23、对所述字符数据进行字符识别,获得初步文字识别结果。

可以理解的是,对所述字符数据进行字符识别即将图像信息还原成文本信息,从而获得字符数据对应的文本数据,即初步文字识别结果。

本实施例通过上述方案,通过对所述当前文本图像数据进行二值化处理,获得二值化图;对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据;对所述字符数据进行字符识别,获得初步文字识别结果;能够通过光学识别将图像数据变为文本数据,提高识别处理的效率和精确度。

进一步地,图6为本发明基于笔顺及OCR的文字识别方法第五实施例的流程示意图,如图6所示,基于第一实施例提出本发明基于笔顺及OCR的文字识别方法第五实施例,在本实施例中,所述步骤S30具体包括以下步骤:

步骤S31、从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符。

需要说明的是,所述笔迹数据中包括落笔顺序和落笔间隔时间,所述落笔间隔时间为在书写过程中上一笔和下一笔的停顿间隔时间,根据所述落笔顺序以及落笔间隔时间的大小可以对应生成不同字符,即通过落笔间隔时间判断字符的连贯性,结合落笔顺序后可以确定每个字符构成的笔画,从而生成手写字符。

步骤S32、分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配,将综合匹配度最高的若干字符作为各最终匹配文字。

可以理解的是,所述预设字符数据库为预先设置包含各类文字不同书写方式的字符数据库,所述预设字符数据库可以为实时更新或周期性更新的数据库,通过将所述手写字符与所述预设字符数据库进行匹配,可以将匹配度最高的字符作为最高手写字符,同时将该字符相似度较高的的初步文字识别结果中的字符与预设字符数据库中的字符进行匹配,从而将匹配度最高的字符作为最高文字识别字符,若所述最高手写字符和所述最高文字识别字符对应的文字一样,则可以作为综合匹配度最高的字符作为最终匹配文字,而文字不一样时,进行多次匹配,或以两者匹配度最高的字符作为最终匹配文字,当然也可以为其他匹配规则,本实施例对此不加以限制。

步骤S33、获取所述智能书写笔书写时对应的书写时序,根据所述书写时序对各最终匹配文字进行排序,生成最终文字识别结果。

应当理解的是,所述书写时序为所述智能书写笔书写时各个字符对应的书写先后顺序,通过所述书写时序对各最终匹配文字进行排序,从而生成对应的最终文字识别结果。

本实施例通过上述方案,通过从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符;分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配,将综合匹配度最高的若干字符作为各最终匹配文字;获取所述智能书写笔书写时对应的书写时序,根据所述书写时序对各最终匹配文字进行排序,生成最终文字识别结果,能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。

进一步地,图7为本发明基于笔顺及OCR的文字识别方法第六实施例的流程示意图,如图7所示,基于第一实施例提出本发明基于笔顺及OCR的文字识别方法第六实施例,在本实施例中,所述步骤S30之后,所述基于笔顺及OCR的文字识别方法还包括以下步骤:

步骤S40、将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作。

需要说明的是,在获得最终文字识别结果时,可以将最终文字识别结果进行反馈,即反馈至相应的在线作业平台,从而进行相关在线作业操作,一般会进行身份验证,不同的身份对应不同的操作权限。

进一步的,所述步骤S40具体包括以下步骤:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,在所述身份识别结果为教师时,开启布置作业及批改作业功能;在所述身份识别结果为学生时,开启答题功能及上交作业功能。

可以理解的是,在所述身份识别结果为教师时,开启布置作业及批改作业功能;在所述身份识别结果为学生时,开启答题功能及上交作业功能,当然也可以具有其他功能,例如教师添加管理监督功能,本实施例对此不加以限制。

在具体实现中,在线作业提供了网上布置作业、批改作业的功能,教师可以方便地向班级学生布置作业;学生完成在线作业后,教师在线批改和点评,省时省力,有助于提高教学效率。

本实施例通过上述方案,通过将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作,能够提高教学效率,有助于提高学生积极性,让各地的教师和学生不受地域限制都能享受到高质量的教学体验。

相应地,本发明进一步提供一种基于笔顺及OCR的文字识别装置。

参照图8,图8为本发明基于笔顺及OCR的文字识别装置第一实施例的功能模块图。

本发明基于笔顺及OCR的文字识别装置第一实施例中,该基于笔顺及OCR的文字识别装置包括:

采集模块10,用于在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据。

初步识别模块20,用于通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果。

优化模块30,用于从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。

其中,基于笔顺及OCR的文字识别装置的各个功能模块实现的步骤可参照本发明基于笔顺及OCR的文字识别方法的各个实施例,此处不再赘述。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于笔顺及OCR的文字识别程序,所述基于笔顺及OCR的文字识别程序被处理器执行时实现如下操作:

在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;

通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;

从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果。

进一步地,所述基于笔顺及OCR的文字识别程序被处理器执行时还实现如下操作:

在智能书写笔书写时,获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值;

根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据;

通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别,获得当前文本图像数据。

进一步地,所述基于笔顺及OCR的文字识别程序被处理器执行时还实现如下操作:

在智能书写笔书写时,通过微型运动传感器获得用户的握笔运动轨迹数据,对所述握笔运动轨迹数据进行运动序列整合处理,将处理后的数据作为用户的书写动作数据;

通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标;

通过所述智能书写笔中的压力传感器获得压力滚动数据,根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。

进一步地,所述基于笔顺及OCR的文字识别程序被处理器执行时还实现如下操作:

对所述当前文本图像数据进行二值化处理,获得二值化图;

对所述二值化图依次进行噪声去除和倾斜校正,将处理后的图像数据进行字符切割,获得切割后的字符数据;

对所述字符数据进行字符识别,获得初步文字识别结果。

进一步地,所述基于笔顺及OCR的文字识别程序被处理器执行时还实现如下操作:

从所述笔迹数据中获得落笔顺序和落笔间隔时间,根据所述落笔顺序和落笔间隔时间生成手写字符;

分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配,将综合匹配度最高的若干字符作为各最终匹配文字;

获取所述智能书写笔书写时对应的书写时序,根据所述书写时序对各最终匹配文字进行排序,生成最终文字识别结果。

进一步地,所述基于笔顺及OCR的文字识别程序被处理器执行时还实现如下操作:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,并根据身份识别结果进行相应的在线作业操作。

进一步地,所述基于笔顺及OCR的文字识别程序被处理器执行时还实现如下操作:

将所述最终文字识别结果反馈至在线作业平台,以使所述在线作业平台对当前用户的身份进行识别,在所述身份识别结果为教师时,开启布置作业及批改作业功能;在所述身份识别结果为学生时,开启答题功能及上交作业功能。

本实施例通过上述方案,通过在智能书写笔书写时,记录当前书写的笔迹数据,并通过所述智能书写笔的OCR采集装置采集当前文本图像数据;通过预设OCR识别算法对所述当前文本图像数据进行识别,获得初步文字识别结果;从所述笔迹数据中获得落笔顺序,通过所述落笔顺序对所述初步文字识别结果进行优化,获得最终文字识别结果;能够提高字符的识别能力,高效率的完成对书写文字的识别,在保证工作效率的同时,提高了文字识别的效率和准确率,方便了用户使用,提升了用户体验。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 基于笔顺及OCR文字识别方法、装置、设备及存储介质
  • 基于OCR的票据识别方法、设备、存储介质及装置
技术分类

06120112965038