掌桥专利:专业的专利平台
掌桥专利
首页

一种笔迹练习系统的练习笔迹自动评测方法

文献发布时间:2024-04-18 19:54:45


一种笔迹练习系统的练习笔迹自动评测方法

技术领域

本发明涉及文体教育领域,具体地说,涉及一种笔迹练习系统的练习笔迹自动评测方法。

背景技术

对笔迹极为重视的思想自古已有,“字如其人”的说法一直流传至今,笔迹一直被认为是一个人性格的体现,在一部分心理测验中甚至直接通过书写人的笔迹特征来推断其人所处的状态。科学技术的发展使人们的书写方式发生了翻天覆地的变化,人们对于练字的需求越来越高,但是业余者仍需一个完善的字迹评价方法,本发明对字体的练习本发明包括字迹图像输入模块、数据库检索模块、字迹识别模块、字体匹配度差异分析模块和字体评测模块。将手写笔迹转化为数字图像,基于计算机视觉算法进行二值化处理和边缘检测,实现手写字体的识别与标准字体进行匹配度分析,基于匹配度差异实现练习笔迹的自动测评方法。其应用场景广泛,应用限制较低,具有教育价值和社会意义。

发明内容

本发明的目的在于提供一种笔迹练习系统的练习笔迹自动评测方法,以解决上述背景技术中提出的问题。

为实现上述目的,一种笔迹练习系统的练习笔迹自动评测方法,包括字迹图像输入模块、数据库检索模块、字迹识别模块、匹配度差异分析模块和字体评测模块;采集手写笔迹并转化为以像素为单位的数据图像,基于实时的计算机视觉中的Canny算法模型对笔迹数据图像进行边缘检测,利用字体匹配算法引入改进的高斯函数处理约束度量P

进一步的,所述字迹图像输入模块,本发明利用移动摄像机设备采集手写字体后,为了提高手写字体的识别精度,使用神经网络和传统的机器学习方法对图像进行检测和识别,为了缓解图像识别中过拟合的现象,采用去除均值的方法,采用灰度化、二值化和归一化处理,对原始手写字体图像RGB三个色彩通道分量加权平均得到灰度图像,然后采用全局阈值处理算法自动选取最佳阈值T,最终达到二值化处理的目标。为了提高手写字体中不同笔画特征识别的准确性,将图像语义分割的像素点统一大小归一化成64×64像素。

进一步的,所述字迹图像输入模块,本发明在数据输入之前进行PCA降维操作确保特征信息不丢失,除此以外,在采集手写字体数据集中,由于通过摄像头采集,过程中存在一定的倾斜,因此在预处理的过程中采用Hough变换检测图像的边缘直线并调整其倾斜程度。同时,本发明还利用滤波器去除手写字体图像框线。

进一步的,所述数据库检索模块,本发明使用的MongoDB是基于分布式文件系统的NoSQL开源数据库项目,它是一个高性能且可扩展的数据库。它使用C++编程语言开发,使用类BSON(BinaryJSON)松散式格式,可存储比较复杂的数据类型,可作为Web应用程序优秀的数据源。MongoDB提供了索引、聚合、分片和负载均衡等功能,支持大规模数据批处理,是一种介于关系型数据库和非关系型数据之间的数据库,其读写效率高字迹数据信息存储在JSON中,查询数据时用很少的时间就可查询到磁头,相比于关系模型的二维表,在IO性能上有明显优势。同时可扩展能力强。由于多节点数据关联存在性能问题,因此关系型数据库很难做分布式。而字迹数据不考虑关联,数据容易分库,水平扩展比较容易。关系模型中二维表表示数据相对固定;数据结构灵活,且字迹数据与对象模型十分类似,无需经过对象关系映射双向转换,可直接用于内存和存储之间相互操作。

进一步的,所述数据库检索模块,本发明采用基于模式图的方法进行数据库MongoDB检索,在数据库中,包括字体完成的时间,书写人,字的行列号等信息,数据库的模式数据图G(V,E)为V={v

其中,e

数据图G包含节点集合V和边集合E,关系中R的任意元组记录表示为节点,元组与元组间的主外键关联表示为边。若属于不同关系R的两个元组T

进一步的,所述字迹识别模块,所述字迹识别模块,假设两个笔划间的距离为l,利用改进的高斯函数处理约束度量P

其中,l

其中,a

d=argmin

其中,x

其中,参数含义保持不变,参照上述计算公式聚类处理所有的笔划轨迹,直至中心点不发生变化:将数值不变的中心点作为识别的类中心,再分配到对应类的类中心中,即可完成对笔划运动轨迹的自动识别。

进一步的,所述字迹识别模块,采用Canny算法进行图像降噪处理,采用一种基于小波变换与双边滤波的方法代替改进高斯滤波器,一个原始字迹图像信号通过小波分解后变为高频和低频部分,高频部分经过分离后,可以选择合适的小波系数进行阈值去噪处理;之后将它与低频部分进行重构,得到高频去噪图,再利用双边滤波对高频去噪图中的低频信号进行去噪处理,最后通过小波逆变换得到去噪后的图像;采用长度有限具有衰减特性的小波基来表示信号,并能实现信号分割,可将一个字迹图像信号转换成高低频两部分信号,小波变换基于它的二维特性可以同时定位时域和频域,频率分辨率和时间分辨率可以在处理低频和高频信号时分别达到最好效果,改进后的小波变换WT(α,γ,τ)公式为:

其中,R表示实数域;涉及小波变换中的三个变量参数为尺度因子α,γ和位移参数τ,分别对应于控制小波函数的伸缩与位移;ψ(t)表示小波函数;

采用小波变换去噪图像的改进模型为:

X(i)=f(i)+[σe(i)]

其中,x(i)为噪声图;f(i)为纯净图;σ为标准差;e(i)为噪声,i表示图像中的像素,i=0,1,…,n-1,使用的去噪改进模型增加了噪声的数据量级,相比于传统模型可以达到更好的去噪效果,随后,用双边滤波对含有空域分量k

其中,h

进一步的,所述字体匹配度差异分析模块,本发明中假设任意变形字体图像对应N个提取的特征信息FI,其中FI(i)=(x

其中,FI为提取的特征信息,FI

本发明中得到的度量信息可以获得比较满意的字体识别结果,获得变形字体与数据库中字体图像间的相似性度量公式,使用改进的相似性距离公式E

其中,

进一步的,所述字体评测模块,第一步输入数据库模板、待匹配模板、与阈值S。第二步将提取的书法字骨架图像输入至笔迹自动评测流程,分别与源字体库中楷书、仿宋、隶书、行书、黑体以及宋体等标准字体中同一个字做骨架九宫格相似度判别,第三步计算书法字骨架图像与标准字体两帧之间的欧氏距离,与阈值进行比较,如果小于阈值,则判定为合格笔迹,以评分制确定水平,包括0~60分,60~70分,70~80分,80~100分,分别代表不合格,达标,良好,优秀;如果大于阈值,则判定为不合格笔迹。

本发明有益效果:本发明开发了一种笔迹练习系统的练习笔迹自动评测方法,包括字迹图像输入模块、数据库检索模块、字迹识别模块、字体匹配度差异分析模块和字体评测模块。本发明利用移动摄像机设备采集手写字体后,将采集的手写笔迹并转化为以像素为单位的数据图像,为了提高手写字体的识别精度,使用神经网络和传统的机器学习方法对图像进行检测和识别,采用去除均值的方法,采用灰度化、二值化和归一化处理,对原始手写字体图像RGB三个色彩通道分量加权平均得到灰度图像,然后采用全局阈值处理算法自动选取最佳阈值T,最终达到二值化处理的目标,将图像语义分割的像素点统一大小归一化成64×64像素,并基于实时的计算机视觉中的Candy算法模型对笔迹数据图像进行边缘检测,进行图像降噪处理,采用一种基于小波变换与双边滤波的方法代替传统高斯滤波器,改进的高斯函数处理约束度量P

附图说明

利用附图对发明创造作进一步说明,但附图中的实施例不构成对本发明创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。

图1是本发明结构示意图。

具体实施方式

结合以下实例对本发明作进一步描述。

参见图1,本发明旨在提供一种笔迹练习系统的练习笔迹自动评测方法,以解决上述背景技术中提出的问题。

为实现上述目的,提供了一种笔迹练习系统的练习笔迹自动评测方法,包括字迹图像输入模块、数据库检索模块、字迹识别模块、匹配度差异分析模块和字体评测模块;采集手写笔迹并转化为以像素为单位的数据图像,基于实时的计算机视觉中的Canny算法模型对笔迹数据图像进行边缘检测,利用字体匹配算法引入改进的高斯函数处理约束度量P

字迹图像输入模块,利用移动摄像机设备采集手写字体后,为了提高手写字体的识别精度,使用神经网络和传统的机器学习方法对图像进行检测和识别,为了缓解图像识别中过拟合的现象,采用去除均值的方法,采用灰度化、二值化和归一化处理,对原始手写字体图像RGB三个色彩通道分量加权平均得到灰度图像,然后采用全局阈值处理算法自动选取最佳阈值T,最终达到二值化处理的目标。为了提高手写字体中不同笔画特征识别的准确性,将图像语义分割的像素点统一大小归一化成64×64像素;在数据输入之前进行PCA降维操作确保特征信息不丢失,除此以外,在采集手写字体数据集中,由于通过摄像头采集,过程中存在一定的倾斜,因此在预处理的过程中采用Hough变换检测图像的边缘直线并调整其倾斜程度。同时,本发明还利用滤波器去除手写字体图像框线。

数据库检索模块,使用的MongoDB是基于分布式文件系统的NoSQL开源数据库项目,它是一个高性能且可扩展的数据库,MongoDB提供了索引、聚合、分片和负载均衡等功能,支持大规模数据批处理,是一种介于关系型数据库和非关系型数据之间的数据库,其读写效率高。字迹数据信息存储在JSON中,查询数据时用很少的时间就可查询到磁头,相比于关系模型的二维表,在IO性能上有明显优势,同时可扩展能力强;由于多节点数据关联存在性能问题,因此关系型数据库很难做分布式。而字迹数据不考虑关联,数据容易分库,水平扩展比较容易。关系模型中二维表表示数据相对固定;数据结构灵活,且字迹数据与对象模型十分类似,无需经过对象关系映射向转换,可直接用于内存和存储之间相互操作;采用基于模式图的方法进行数据库MongoDB检索,在数据库中,包括字体完成的时间,书写人,字的行列号等信息,数据库的模式数据图G(V,E)为V={v

其中,e

数据图G包含节点集合V和边集合E,关系中R的任意元组记录表示为节点,元组与元组间的主外键关联表示为边。若属于不同关系R的两个元组T

字迹识别模块,假设两个笔划间的距离为l,利用高斯函数处理约束度量P

其中,l

其中,a

d=argmin

其中,x

上述计算公式中,参数含义保持不变:参照上述计算公式聚类处理所有的笔划轨迹,直至中心点不发生变化:将数值不变的中心点作为识别的类中心,再分配到对应类的类中心中,即可完成对笔划运动轨迹的自动识别;采用Canny算法进行图像降噪处理,采用一种基于小波变换与双边滤波的方法代替传统高斯滤波器。一个原始字迹图像信号通过小波分解后变为高频和低频部分,高频部分经过分离后,可以选择合适的小波系数进行阈值去噪处理;之后将它与低频部分进行重构,得到高频去噪图,再利用双边滤波对高频去噪图中的低频信号进行去噪处理,最后通过小波逆变换得到去噪后的图像。此方法不仅提升了对图像中高频和低频噪声信号的滤波效果,还解决了高斯滤波导致图像边缘模糊的问题;其中,小波变换不同于傅立叶变换,它采用长度有限具有衰减特性的小波基来表示信号,并能实现信号分割,可将一个字迹图像信号转换成高低频两部分信号。小波变换基于它的二维特性可以同时定位时域和频域。频率分辨率和时间分辨率可以在处理低频和高频信号时分别达到最好效果,改进后的小波变换WT(α,γ,τ)公式为:

其中,R表示实数域;涉及小波变换中的两个变量参数为尺度因子α和位移参数τ,分别对应于控制小波函数的伸缩与位移;ψ(t)表示小波函数,当取α=1,τ=0为标准波时,则当0<α<1时,波形瘦且高,震荡时间短;当α>1时,波形胖且矮,震荡时间长;

小波变换去噪图像的一般模型为:

X(i)=f(i)+σe(i)

其中,x(i)为噪声图;f(i)为纯净图;σ为标准差;e(i)为噪声,i表示图像中的像素,i=0,1,…,n-1,随后采用双边滤波中对含有空域分量k

其中,积分号前的部分是归一化因子,式中包括空域分量k

它可以实现对图像的进一步滤波,并保留细节边缘信息。

字体匹配度差异分析模块,本发明中假设任意变形字体图像对应N个提取的特征信息FI,其中FI(i)=(x

其中,FI为提取的特征信息,FI

本发明中得到的度量信息可以获得比较满意的字体识别结果,获得变形字体与数据库中字体图像间的相似性度量公式,相似性距离公式E

其中,

字体评测模块,第一步输入数据库模板、待匹配模板、与阈值S。第二步将提取的书法字骨架图像输入至笔迹自动评测流程,分别与源字体库中楷书、仿宋、隶书、行书、黑体以及宋体等标准字体中同一个字做骨架九宫格相似度判别,第三步计算书法字骨架图像与标准字体两帧之间的欧氏距离,与阈值进行比较,如果小于阈值,则判定为合格笔迹,以评分制确定水平,包括0~60分,60~70分,70~80分,80~100分,分别代表不合格,达标,良好,优秀。如果大于阈值,则判定为不合格笔迹。

本发明有益效果:本发明开发了一种笔迹练习系统的练习笔迹自动评测方法,包括字迹图像输入模块、数据库检索模块、字迹识别模块、字体匹配度差异分析模块和字体评测模块。本发明利用移动摄像机设备采集手写字体后,将采集的手写笔迹并转化为以像素为单位的数据图像,为了提高手写字体的识别精度,使用神经网络和传统的机器学习方法对图像进行检测和识别,采用去除均值的方法,采用灰度化、二值化和归一化处理,对原始手写字体图像RGB三个色彩通道分量加权平均得到灰度图像,然后采用全局阈值处理算法自动选取最佳阈值T,最终达到二值化处理的目标,将图像语义分割的像素点统一大小归一化成64×64像素,并基于实时的计算机视觉中的Candy算法模型对笔迹数据图像进行边缘检测,进行图像降噪处理,采用一种基于小波变换与双边滤波的方法代替传统高斯滤波器,改进的高斯函数处理约束度量P

本发明还提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令,该指令由处理器加载并执行,以实现上述方法。其中,该计算机可读存储介质可以是ROM、随机存取存储器、CD-ROM、磁带、软盘和光数据存储设备等。其内存储的指令可由终端中的处理器加载并执行上述方法。

本发明实施方式是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术分类

06120116380968