基于笔顺及OCR文字识别方法、装置、设备及存储介质

文献发布时间：2023-06-19 11:32:36

技术领域

本发明涉及字符识别技术领域，尤其涉及一种基于笔顺及OCR文字识别方法、装置、设备及存储介质。

背景技术

随着信息技术和计算机技术的日益普及，人类社会已进入信息时代，把各类载体上的原始信息转化为计算机可处理和传输的电子比特信息已成为要解决的重要问题；光学字符识别(Optical Character Recognition，OCR)技术成为有效解决手工输入文字信息的重要工具，在各领域被广泛应用，并产生了巨大的社会效益和经济效益。

OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

现有的字符识别中单独通过OCR识别的准确率不高，影响了用户的体验度。

发明内容

本发明的主要目的在于提供一种基于笔顺及OCR文字识别方法、装置、设备及存储介质，旨在解决现有技术中单独通过OCR识别的准确率不高，影响了用户的体验度的技术问题。

第一方面，本发明提供一种基于笔顺及OCR的文字识别方法，所述基于笔顺及OCR的文字识别方法包括以下步骤：

在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；

通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；

从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果。

可选地，所述在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据，包括：

在智能书写笔书写时，获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值；

根据所述书写动作、所述点阵坐标和所述压力变化值生成当前书写的笔迹数据；

通过所述智能书写笔的OCR采集装置对当前书写的文本进行光学字符识别，获得当前文本图像数据。

可选地，所述在智能书写笔书写时，获取用户的书写动作数据、点阵坐标及智能书写笔的压力变化值，包括：

在智能书写笔书写时，通过微型运动传感器获得用户的握笔运动轨迹数据，对所述握笔运动轨迹数据进行运动序列整合处理，将处理后的数据作为用户的书写动作数据；

通过所述智能书写笔中的坐标记录仪记录当前书写过程产生的点阵坐标；

通过所述智能书写笔中的压力传感器获得压力滚动数据，根据所述压力滚动数据获得所述智能书写笔书写时的压力变化值。

可选地，所述通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果，包括：

对所述当前文本图像数据进行二值化处理，获得二值化图；

对所述二值化图依次进行噪声去除和倾斜校正，将处理后的图像数据进行字符切割，获得切割后的字符数据；

对所述字符数据进行字符识别，获得初步文字识别结果。

可选地，所述从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果，包括：

从所述笔迹数据中获得落笔顺序和落笔间隔时间，根据所述落笔顺序和落笔间隔时间生成手写字符；

分别将所述手写字符与所述初步文字识别结果与预设字符数据库进行匹配，将综合匹配度最高的若干字符作为各最终匹配文字；

获取所述智能书写笔书写时对应的书写时序，根据所述书写时序对各最终匹配文字进行排序，生成最终文字识别结果。

可选地，所述从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果之后，所述基于笔顺及OCR的文字识别方法还包括：

将所述最终文字识别结果反馈至在线作业平台，以使所述在线作业平台对当前用户的身份进行识别，并根据身份识别结果进行相应的在线作业操作。

可选地，所述将所述最终文字识别结果反馈至在线作业平台，以使所述在线作业平台对当前用户的身份进行识别，并根据身份识别结果进行相应的在线作业操作，包括：

将所述最终文字识别结果反馈至在线作业平台，以使所述在线作业平台对当前用户的身份进行识别，在所述身份识别结果为教师时，开启布置作业及批改作业功能；在所述身份识别结果为学生时，开启答题功能及上交作业功能。

第二方面，为实现上述目的，本发明还提出一种基于笔顺及OCR的文字识别装置，所述基于笔顺及OCR的文字识别装置包括：

采集模块，用于在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；

初步识别模块，用于通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；

优化模块，用于从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果。

第三方面，为实现上述目的，本发明还提出一种基于笔顺及OCR的文字识别设备，所述基于笔顺及OCR的文字识别设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于笔顺及OCR的文字识别程序，所述基于笔顺及OCR的文字识别程序配置为实现如权利要求上文所述的基于笔顺及OCR的文字识别方法的步骤。

第四方面，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有基于笔顺及OCR的文字识别程序，所述基于笔顺及OCR的文字识别程序被处理器执行时实现如上文所述的基于笔顺及OCR的文字识别方法的步骤。

本发明提出的基于笔顺及OCR的文字识别方法，通过在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果；能够提高字符的识别能力，高效率的完成对书写文字的识别，在保证工作效率的同时，提高了文字识别的效率和准确率，方便了用户使用，提升了用户体验。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图；

图2为本发明基于笔顺及OCR的文字识别方法第一实施例的流程示意图；

图3为本发明基于笔顺及OCR的文字识别方法第二实施例的流程示意图；

图4为本发明基于笔顺及OCR的文字识别方法第三实施例的流程示意图；

图5为本发明基于笔顺及OCR的文字识别方法第四实施例的流程示意图；

图6为本发明基于笔顺及OCR的文字识别方法第五实施例的流程示意图；

图7为本发明基于笔顺及OCR的文字识别方法第六实施例的流程示意图；

图8为本发明基于笔顺及OCR的文字识别装置第一实施例的功能模块图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例的解决方案主要是：通过在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果；能够提高字符的识别能力，高效率的完成对书写文字的识别，在保证工作效率的同时，提高了文字识别的效率和准确率，方便了用户使用，提升了用户体验，解决了现有技术中单独通过OCR识别的准确率不高，影响了用户的体验度的技术问题。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。

如图1所示，该设备可以包括：处理器1001，例如CPU，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(Non-Volatile Memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本实施例中的基于笔顺及OCR的文字识别设备可以是智能书写笔，所述智能书写笔中还可以集成有OCR采集装置、压力传感器、微型运动传感器、供电单元及无线传输单元等，本实施例对此不加以限制。

本领域技术人员可以理解，图1中示出的设备结构并不构成对该设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于笔顺及OCR的文字识别程序。

本发明设备通过处理器1001调用存储器1005中存储的基于笔顺及OCR的文字识别程序，并执行以下操作：

在智能书写笔书写时，记录当前书写的笔迹数据，并通过所述智能书写笔的OCR采集装置采集当前文本图像数据；

通过预设OCR识别算法对所述当前文本图像数据进行识别，获得初步文字识别结果；

从所述笔迹数据中获得落笔顺序，通过所述落笔顺序对所述初步文字识别结果进行优化，获得最终文字识别结果。