字符矫正方法、装置、终端设备及存储介质

文献发布时间：2023-06-19 11:39:06

技术领域

本申请涉及信息处理与人机交互技术领域，尤其涉及一种字符矫正方法、装置、终端设备及存储介质。

背景技术

人工智能技术在各行各业中逐渐应用。人工智能与人机交互的结合，近年来吸引了大量研究，其中一个热点方面为：利用惯性传感器进行空中手写。

空中手写是指挥动手部和手臂，将手部运动轨迹转换并识别为对应信息的技术，可通过佩戴或手持搭载惯性传感器的设备实现。与日常在纸张、电子设备触摸屏上面的书写方式不同，手部挥舞的动作幅度远大于笔尖书写，因此在进行动作时一般带有不同程度的抖动，且不同用户的行为方式存在差异，因此书写的字符笔划和整体都可能出现倾斜。这两种类型的书写干扰会影响字符识别结果，同时不标准的字形也会影响交互体验。

相关技术对空中手写的字符进行矫正时，通常对字符进行整体倾斜或抖动矫正，导致字符识别结果不佳，而且需要预先获取大量数据进行统计或建模学习，线下计算量大，导致矫正方案工作开销大。

发明内容

本申请的主要目的在于提供一种字符矫正方法、装置、终端设备及存储介质，旨在提升书写字符的识别结果,降低矫正处理工作开销。

为实现上述目的，本申请实施例提供一种字符矫正方法，所述方法包括以下步骤：

获取书写数据，将所述书写数据转换为与输入字符对应的笔划序列；

对所述笔划序列依据拐点进行切分，得到与所述输入字符的子笔划对应的子笔划序列；

基于所述子笔划序列对所述子笔划进行矫正处理，得到所述子笔划矫正后的子笔划序列；

拼接所述矫正后的子笔划序列，得到所述输入字符矫正后的笔划序列。

此外，本申请实施例还提出一种字符矫正装置，所述字符矫正装置包括：

转换模块，用于获取书写数据，将所述书写数据转换为与输入字符对应的笔划序列；

切分模块，用于对所述笔划序列依据拐点进行切分，得到与所述输入字符的子笔划对应的子笔划序列；

矫正模块，用于基于所述子笔划序列对所述子笔划进行矫正处理，得到所述子笔划矫正后的子笔划序列；

拼接模块，用于拼接所述矫正后的子笔划序列，得到所述输入字符矫正后的笔划序列。

此外，本申请实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的字符矫正方法。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被所述处理器执行时实现如上所述的字符矫正方法。

本申请实施例提出的字符矫正方法、装置、终端设备及存储介质，通过获取书写数据，将所述书写数据转换为与输入字符对应的笔划序列；对所述笔划序列依据拐点进行切分，得到与所述输入字符的子笔划对应的子笔划序列；基于所述子笔划序列对所述子笔划进行矫正处理，得到所述子笔划矫正后的子笔划序列；拼接所述矫正后的子笔划序列，得到所述输入字符矫正后的笔划序列。该方案可以对书写数据(比如空中手写数据)实时进行矫正处理，在矫正时，通过对书写数据的笔划依据拐点进行切分，基于切分得到的子笔划对书写字符进行矫正，不仅提升了最终字符识别结果，增强交互体验，而且无需预先获取大量数据进行统计或建模学习，无线下计算量，可极大减少矫正方案的工作开销。相对现有方案一般只能对字符进行整体倾斜或抖动矫正，不仅方案单一，而且矫正效果不佳，本方案从笔划切分这种更细粒度的级别进行矫正，可以依次对笔划进行逐一处理，通过有效拐点搜索将笔划切分为更细粒度的子笔划级别，对子笔划进行矫正，再组合成为笔划和字符，由此，基于更细粒度的子笔划级别矫正，可以从字符整体和笔划细节上同时提升矫正效果，能够克服倾斜和抖动等多种干扰因素影响字符识别效果的问题。

附图说明

图1为本申请字符矫正装置所属终端设备的功能模块示意图；

图2为本申请字符矫正方法一示例性实施例的流程示意图；

图3为本申请实施例中将笔划依据有效笔划拐点拆分为子笔划的效果示意图；

图4为本申请实施例中在轨迹点的左右寻找与其构成夹角的点的轨迹示意图；

图5为本申请实施例中筛选有效笔划拐点的轨迹示意图；

图6为本申请实施例中对笔划进行倾斜矫正的效果示意图；

图7为本申请实施例中对笔划进行抖动矫正的效果示意图；

图8为本申请实施例中对笔划进行倾斜和抖动矫正两种处理均包含的效果示意图；

图9为本申请字符矫正方法另一示例性实施例的流程示意图；

图10为本申请字符矫正方法实施例的细化流程示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例的主要解决方案是：获取书写数据，将所述书写数据转换为与输入字符对应的笔划序列；对所述笔划序列依据拐点进行切分，得到与所述输入字符的子笔划对应的子笔划序列；基于所述子笔划序列对所述子笔划进行矫正处理，得到所述子笔划矫正后的子笔划序列；拼接所述矫正后的子笔划序列，得到所述输入字符矫正后的笔划序列。该方案可以对书写数据(比如空中手写数据)实时进行矫正处理，在矫正时，通过对书写数据的笔划依据拐点进行切分，基于切分得到的子笔划对书写字符进行矫正，不仅提升了最终字符识别结果，增强交互体验，而且无需预先获取大量数据进行统计或建模学习，无线下计算量，可极大减少矫正方案的工作开销。相对现有方案一般只能解决某一种干扰，本方案从笔划切分这种更细粒度的级别进行矫正，可以依次对笔划进行逐一处理，通过有效拐点搜索将笔划切分为更细粒度的子笔划级别，对子笔划进行矫正，再组合成为笔划和字符，由此，基于更细粒度的子笔划级别矫正，可以从字符整体和笔划细节上同时提升矫正效果，能够克服倾斜和抖动等多种干扰因素影响字符识别效果的问题。

本申请实施例考虑到，空中书写或手写输入过程中，对字形结果的主要干扰包括手部无意识旋转带来的倾斜和手部抖动带来的笔划轨迹抖动。现有相关方案主要针对手写，且一般只能解决某一种干扰，在对手写字符进行矫正时，通常对字符进行整体倾斜或抖动矫正，导致字符识别结果不佳，而且通常采用神经网络模型，需要预先获取大量数据进行统计或建模学习，线下计算量大，导致矫正方案工作开销大。

因此，本申请实施例提出解决方案，从笔划切分这种更细粒度的级别进行矫正，可以依次对笔划进行逐一处理，通过有效拐点搜索将笔划切分为更细粒度的子笔划级别，对子笔划进行矫正，再组合成为笔划和字符，基于更细粒度的子笔划级别矫正，可以从字符整体和笔划细节上同时提升矫正效果，能够克服倾斜和抖动等多种干扰因素影响字符识别效果的问题。区别于现有的单一解决方案，能够同时解决笔划倾斜与抖动等干扰问题，提升书写字符的识别结果。进一步，还可以通过最近邻聚类(最近邻准则)和平滑滤波，在矫正流程中同时完成倾斜和抖动矫正，进一步提升矫正效果。

具体地，参照图1，图1为本申请字符矫正装置所属终端设备的功能模块示意图。该字符矫正装置可以为独立于终端设备的、能够进行数据处理和人机交互的装置，其可以通过硬件或软件的形式承载于终端设备上。该终端设备可以为搭载惯性传感器的智能穿戴设备，或搭载惯性传感器的手机、平板电脑等智能移动终端，或者是搭载惯性传感器的其他手持设备，该手持设备可以与终端、服务器等设备通讯。

本申请实施例方案主要采用字符处理算法对书写数据进行矫正处理，其中，书写场景可以是空中书写，也可以是常规的平面书写，对于空中书写一般要配置惯性传感器，对惯性传感器采集的书写数据进行处理，本实施例以配置惯性传感器的空中书写场景进行举例，因此该方案可以适用于所有搭载惯性传感器的设备，如手机、智能手表、手环等，用户可以佩戴或手持搭载惯性传感器的设备进行空中书写。

在本实施例中，该字符矫正装置所属终端设备至少包括输出模块110、处理器120、存储器130、以及通信模块140，还可以包括惯性传感器等。

存储器130中存储有操作系统以及字符矫正程序，字符矫正装置可以将获取的书写数据、对应的笔划序列、子笔划序列、矫正后的子笔划、笔划、字符等信息存储于该存储器130中；输出模块110可为显示屏、扬声器等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等，通过通信模块140与外部设备或服务器进行通信。

其中，作为一种实施例方式，存储器130中的字符矫正程序被处理器执行时实现以下步骤：

获取书写数据，将所述书写数据转换为与输入字符对应的笔划序列；

对所述笔划序列依据拐点进行切分，得到与所述输入字符的子笔划对应的子笔划序列；

基于所述子笔划序列对所述子笔划进行矫正处理，得到所述子笔划矫正后的子笔划序列；

拼接所述矫正后的子笔划序列，得到所述输入字符矫正后的笔划序列。