掌桥专利:专业的专利平台
掌桥专利
首页

文本字符串的识别方法、装置和服务器

文献发布时间:2023-06-19 11:45:49


文本字符串的识别方法、装置和服务器

技术领域

本说明书属于人工智能技术领域,尤其涉及文本字符串的识别方法、装置和服务器。

背景技术

在许多数据处理场景中,常常需要先识别并提取出图像中所包含的文本字符串;再利用所获取的文本字符串进行下一步的业务数据处理。

但是,有时待识别处理的图像中的字符串的字符尺寸较小、分辨率较低,常规的识别模型所能够提取到的与该字符串相关的图像特征也相对较少。针对上述情况,基于现有方法进行字符串的识别提取时,往往很容易出现误差,所得到的字符串的准确度也相对较差。

针对上述问题,目前尚未提出有效的解决方案。

发明内容

本说明书提供了一种文本字符串的识别方法、装置和服务器,可以较好地适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况,精准地识别并确定出目标图像中所包含的目标字符串。

本说明书提供了一种文本字符串的识别方法,包括:

获取包含有待识别的目标字符串的目标图像;

对所述目标图像进行预处理,得到预处理后的目标图像;

调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像中提取出与目标字符串相关的目标图像特征;

根据所述目标处理结果,确定出目标图像中的目标字符串。

在一个实施例中,所述预设的识别模型还包括定位子模型;其中,所述定位子模型与所述预设的空洞卷积层相连,所定位子模型用于根据目标图像特征,以及预设的锚点框参数,通过锚点回归,为目标字符串中的各个文本字符分别生成相对应的多个候选框;并分别为各个文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作为文本字符的边界框;所边界框携带有所包含的文本字符的位置信息。

在一个实施例中,所述预设的锚点框参数按照以下方式获取:

获取包含有样本字符串的样本图像;

根据预设的标注规则,在所述样本图像中,为样本字符串中的各个样本字符分别标注出对应的边界框;并采集样本字符的边界框参数;其中,相邻的两个样本字符的边界框之间存在重叠的区域范围小于预设的区域范围阈值;

对所述样本字符的边界框参数进行聚类处理,以得到所述预设的锚点框参数。

在一个实施例中,分别为各个文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作为文本字符的边界框,包括:

按照以下方式为目标字符串中的当前文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作边界框:

调用预设的软化非极大值抑制算法处理所述多个候选框,以从多个候选框中筛选出一个置信度符合要求的候选框,作为当前文本字符的边界框;并滤除所述多个候选框中除所述边界框以外的其他候选框。

在一个实施例中,所述预设的识别模型还包括分类子模型;其中,所述分类子模型与所述空洞卷积层相连,所述分类子模型用于根据目标图像特征,识别并确定出待识别的目标字符串中的各个文本字符的类别值。

在一个实施例中,对所述目标图像进行预处理,包括:

检测目标图像,并在目标图像中确定出包含有待识别的目标字符串的目标图像区域;

从所述目标图像中裁剪出所述目标图像区域,作为所述预处理后的目标图像。

在一个实施例中,对所述目标图像进行预处理还包括:

对所述目标图像进行图像校正处理;和/或,对所述目标图像进行降噪处理。

在一个实施例中,所述待识别的目标字符串包括以下至少之一:目标货币上的冠字号、目标支票上的出票人账号、目标快递单上的物流编号。

在一个实施例中,在所述待识别的目标字符串包括目标货币上的冠字号的情况下,在确定出目标图像中的目标字符串之后,所述方法还包括:

将所述目标字符串确定为所述目标货币上的冠字号;

根据所述目标货币上的冠字号,跟踪并确定出目标货币的交易流转路径;

根据所述目标货币的交易流转路径,确定是否存在交易风险。

在一个实施例中,所述方法还包括:

使用预设的空洞卷积层代替卷积网络层和池化层的组合,作为网络模型中的图像特征的提取结构,以构建得到初始的识别模型;

获取包含有待识别的样本字符串的样本图像;并对所述样本图像进行标注处理,得到标注后的样本图像;

利用所述标注后的样本图像训练所述初始的识别模型,以得到预设的识别模型。

在一个实施例中,对所述样本图像进行标注处理,得到标注后的样本图像,包括:

根据预设的标注规则,在所述样本图像中,为样本字符串中的各个样本字符分别标注出对应的边界框;其中,相邻的两个样本字符的边界框之间存在重叠的区域范围小于预设的区域范围阈值;

根据边界框中所包含的样本字符,标注出相应的字符类别值,得到所述标注后的样本图像。

本书明书还提供了一种文本字符串的识别装置,包括:

获取模块,用于获取包含有待识别的目标字符串的目标图像;

预处理模块,用于对所述目标图像进行预处理,得到预处理后的目标图像;

调用模块,用于调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像提取出与目标字符串相关的目标图像特征;

确定模块,用于根据所述目标处理结果,确定出目标图像中的目标字符串。

本书明书还提供了一种文本字符串的识别方法,包括:

获取包含有待识别的目标字符串的目标图像;

调用预设的识别模型处理所述目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述目标图像中提取出与目标字符串相关的目标图像特征;

根据所述目标处理结果,确定出目标图像中的目标字符串。

本书明书还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述文本字符串的识别方法的相关步骤。

本书明书还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述文本字符串的识别方法的相关步骤。

本说明书提供的文本字符串的识别方法、装置和服务器,具体实施前,对用于识别提取图像中的文本字符串的识别模型的模型结构行了针对性的改进:使用预设的空洞卷积层代替卷积网络层和池化层的组合,作为用于提取与文本字符串相关的图像特征的特征提取结构,得到效果较好的、改进后的预设的识别模型。具体实施时,在对所获取的目标图像进行预处理,得到预处理后的目标图像之后,可以调用上述预设的识别模型处理预处理后的目标图像,从而可以较好地适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的识别难度较高的情况,精准地识别并确定出目标图像中所包含的目标字符串,提高了文本字符串的识别精度和识别效率,减少了识别误差。

附图说明

为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是应用本说明书实施例提供的文本字符串的识别方法的系统的结构组成的一个实施例的示意图;

图2是在一个场景示例中,应用本说明书实施例提供的文本字符串的识别方法的一种实施例的示意图;

图3是在一个场景示例中,应用本说明书实施例提供的文本字符串的识别方法的一种实施例的示意图;

图4是本说明书的一个实施例提供的文本字符串的识别方法的流程示意图;

图5是在一个场景示例中,应用本说明书实施例提供的文本字符串的识别方法的一种实施例的示意图;

图6是本说明书的一个实施例提供的文本字符串的识别方法的流程示意图;

图7是本说明书的一个实施例提供的服务器的结构组成示意图;

图8是本说明书的一个实施例提供的文本字符串的识别装置的结构组成示意图;

图9是在一个场景示例中,应用本说明书实施例提供的文本字符串的识别方法的一种实施例的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。

本说明书实施例提供了一种文本字符串的识别方法,所述文本字符串的识别方法具体可以应用于包含有服务器和终端设备的系统中。具体可以参阅图1所示,服务器和终端设备之间可以通过有线或无线的方式相连,以进行具体的数据交互。

在本实施例中,所述服务器具体可以包括一种应用于网络平台一侧,能够实现数据传输、数据处理等功能的后台云端服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。

在本实施例中,所述终端设备具体可以包括一种布设于用户一侧,配置或连接有摄像头,能够实现图片数据采集、数据传输等功能的前端电子设备。具体的,所述终端设备例如可以为监控摄像头、台式电脑、平板电脑、笔记本电脑、智能手机等。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在智能手机上运行的某APP等。

具体实施时,用户可以使用智能手机作为终端设备通过拍摄目标对象上待识别的目标字符串(例如,目标货币上的冠字号),采集得到包含有目标字符串的照片作为目标图像。可以参阅图2所示。其中,上述目标字符串具体可以包含有一个或多个文本字符。

终端设备在采集得到上述目标图像之后,可以通过有线或无线的方式,将上述目标图像发送到服务器。相应的,服务器接收并获取来自终端设备的目标图像。

服务器可以先对目标图像进行预处理,得到预处理后的、更适于后续文本字符串的识别提取的预处理后的目标图像。

具体的进行预处理时,服务器可以先对目标图像进项降噪处理,以初步滤除目标图像中的图像噪声,得到噪声较少、相对较为纯净的目标图像。

接着,服务器可以调用预先训练好的预设的文本字符区域识别模型处理该目标图像,以先在目标图像中找出包含有待识别的目标字符串的图像区域作为目标图像区域。服务器再从上述目标图像中裁剪出上述目标图像区域,得到数据量相对更少的预处理后的目标图像。可以参阅图2所示。

需要说明的是,对于诸如目标货币上的冠字号等目标字符串而言,相对于常规的字符串,上述目标字符串中的文本字符的尺寸往往较小,所能提取到的特征信息相对较少、分辨率较差;并且由于诸如目标纸币等目标对象的使用往往比较频繁,导致所采集的目标图像中目标字符串所在的图像区域大多还会存在诸如由于折痕、污渍等因素所形成的图像噪声,对目标字符串的识别造成干扰。

而如果直接使用常规的识别模型来识别提取上述情况的目标字符串,所得到的目标字符串往往会存在较大误差、准确度相对较差。

正是注意到了上述问题,在具体进行目标字符串的识别提取时,服务器所使用的是模型结构与常规的识别模型不同、改进后的预设的识别模型。

服务器可以将上述预处理后的目标图像作为模型输入,输入至上述预设的识别模型中,并运行该预设的识别模型,得到相应的模型输出,作为对应的目标处理结果。

其中,上述预设的识别模型区别于常规的识别模型,是使用预设的空洞卷积层代替常规的识别模型所使用的卷积网络层和池化层的组合。

预设的识别模型具体运行时,可以通过上述预设的空洞卷积层从目标图像中精细、全面地提取出与目标字符串相关,且感受野较大的目标图像特征,避免由于池化层的池化作用所导致的特征丢失。

上述预设的识别模型还可以同时集成有定位子模型和分类子模型。其中,定位子模型与上述预设的空洞卷积层相连,分类子模型与上述预设的空洞卷积层相连。

预设的识别模型具体运行时,可以通过上述定位子模型执行针对目标字符串中的各个文本字符的定位流程。具体的,可以通过定位子模型接收从预设的空洞卷积层输出的目标图像特征;并根据上述目标图像特征,结合预设的锚点框参数,通过锚点回归,为目标字符串中的各个文本字符分别生成相对应的多个候选框;进一步,通过上述定位子模型可以为各个文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作为该文本字符的边界框,并删除其余的冗余候选框。其中,上述边界框可以携带有所包含的文本字符的位置信息。例如,所包含的文字字符在目标字符串中的排列序号等位置信息。

预设的识别模型在按照上述方式通过定位子模型执行定位流程的同时,还可以通过分类子模型执行针对目标字符串中的各个文本字符的分类流程。具体的,可以通过分类子模型接收从预设的空洞卷积层输出的目标图像特征;并根据上述目标图像特征,通过逻辑回归,识别并确定出目标字符串中的各个文本字符的类别值。

由于上述定位子模型和分类子模型都是集成在同一个预设的识别模型中,且都与同一个预设的空洞卷积层相连。因此,可以使得预设的识别模型具体运行时,所述涉及到的上述定位流程和分类流程是同时执行的。

这样一方面可以避免像现有方法、模型那样由于分开、按序依次执行定位流程(包括分割边界框)、分类流程,导致处理时长增长、处理效率降低;同时,另一方面也可以避免像现有方法、模型那样由于将定位流程和分类流程分离,并依次执行,导致不同流程执行时的损失精度逐层累加,影响最终结果的精度。

预设的识别模型按照上述方式运行,通过利用上述预设的空洞卷积层、定位子模型和分类子模型,最终可以输出基于边界框所携带的位置信息,按顺序排列的文本字符的类别值列,作为目标处理结果。可以参阅图3所示。

服务器可以根据上述目标处理结果,得到从目标图像中识别并提取出精度较高、误差较小的目标字符串。

进而,服务器可以根据所提取出的目标字符串,结合具体的应用场景,利用上述目标字符串进行进一步的数据处理。

例如,在交易风险检测场景中,服务器可以根据所识别提取出的目标货币上的冠字号,跟踪并确定出该目标货币的交易流转路径。进而后续可以根据目标货币的交易流转路径,分析该目标纸币所涉及的交易行为是否存在诸如洗钱、赌博等交易风险。从而可以更加高效、智能对交易行为的交易风险进行检测。

通过上述系统,利用改进后的预设的识别模型,可以有效地适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况,精准地识别并确定出目标图像中所包含的目标字符串,提高了文本字符串的识别精度和识别效率,减少了识别误差。

参阅图4所示,本说明书实施例提供了一种文本字符串的识别方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容。

S401:获取包含有待识别的目标字符串的目标图像;

S402:对所述目标图像进行预处理,得到预处理后的目标图像;

S403:调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像中提取出与目标字符串相关的目标图像特征;

S404:根据所述目标处理结果,确定出目标图像中的目标字符串。

通过上述实施例,可以利用使用预设的空洞卷积层代替常规的识别模型中卷积网络层和池化层的组合的预设的识别模型,有效地适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况,精准地识别并确定出目标图像中所包含的目标字符串,提高了文本字符串的识别精度和识别效率,减少了识别误差。

在一些实施例中,上述目标图像具体可以是包含有待识别的目标字符串的图像。具体的,可以通过拍摄得到包含有目标字符串的照片作为上述目标图像;也可以通过从视频中截取包含有目标字符串的截图得到上述目标图像。

上述目标字符串具体可以是待识别提取的文本字符串。其中,上述目标字符串可以只包含有一个文本字符,也可以包含有按顺序排序的多个文本字符。

在一些实施例中,上述目标字符串具体可以是识别难度较低,基于常规的识别模型就能够较准确地识别提取出的文本字符串(可以记为第一类文本字符串),例如,图像中文字符尺寸较大、分辨率较高、字符间隔较大的文本字符串。

上述目标字符串还可以是识别难度较高,基于常规的识别模型往往无法准确识别提取出的文本字符串(可以记为第二类字符串),例如,图像中文字符尺寸较小、分辨率较低、字符间隔较小的文本字符串。针对这类目标字符串,由于基于常规的识别模型所能提取到的图像特征相对较少、存在特征丢失,感受野相对有限,导致识别精度较差。此外,还由于目标字符串中相邻字符之间的字符间隔较小,进一步增加了识别难度,导致使用常规的识别模型进行识别时,很容易出现诸如遗漏字符串中的文本字符、字符识别错位等误差。

在一些实施例中,所述待识别的目标字符串具体可以包括以下至少之一:目标货币上的冠字号、目标支票上的出票人账号、目标快递单上的物流编号等。其中,上述冠字号具体可以是指设置于货币(例如,纸币)上的,由多个数字和字母所组成的字符串。通常一个冠字号与一个设置有该冠字号的货币一一对应。

上述所列举的目标货币上的冠字号、目标支票上的出票人账号、目标快递单上的物流编号都属于识别难度较高的第二类字符串。通常所使用的常规的识别模型往往很难精准、快速地从目标图像中识别并提取出上述目标字符串。

当然,上述所列举的目标字符串只是一种示意性说明。具体实施时,根据具体应用场景和处理需求,还可以引入其他类型的文本字符串作为上述待识别的目标字符串。对此,本说明书不作限定。

通过上述实施例,可以应用本说明书所提供的文本字符串的识别方法,适用于多种不同的业务场景,以对诸如货币上的冠字号、目标支票上的出票人账号、目标快递单上的物流编号等识别难度较高的文本字符串进行精准识别。

在一些实施例中,上述预设的识别模型具体可以理解为一种预先训练好的,能够从图像中较为精准地识别、提取出目标字符串的神经网络模型。其中,上述预设的识别模型区别于常规的识别,具有改进后的模型结构。

具体的,上述预设的识别模型至少包含有预设的空洞卷积层。在预设的识别模型中,使用上述预设的空洞卷积层代替常规的卷积网络层和池化层的组合。通过上述预设的空洞卷积层可以在提取得到感受野较大的目标图像特征的同时,避免特征信息的丢失,从而可以得到相对较为全面、完整,且使用效果较好的目标图像特征。

需要说明的是,基于常规的识别模型,为了提取得到使用效果相对较好的图像特征,在利用卷积网络层从图像中提取出相应的图像特征后;还会使用池化层对所提取出的图像特征进行池化操作,以达到增大感受野的效果。

但是在利用池化层对图像特征进行池化操作的过程中,会同时过滤掉图像状态中的部分特征信息,导致丢失字符间的细节特征等,使得最终得到的图像特征是不完整、存在缺失的。而对于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况,利用常规的识别模型进行上述处理会使得最终得到的图像特征变得更少,进而导致识别字符串的精度变得更差。

在本实施例中,通过在预设的识别模型中引入预设的空洞卷积层代替常规的卷积网络层和池化层的组合,能够在提取得到感受野较大、使用效果较好的图像特征的同时,避免特征的丢失,保证所提取的图像特征的完整。

在一些实施例中,上述空洞卷积层(Dilated Convolution)具体可以是指是在标准的Convolution Map里注入空洞,以此来增加reception field。相比原来的正常的Convolution(例如,卷积网络层),空洞卷积层多了一个hyper-parameter,可以称之为dilation rate,具体指的是kernel的间隔数量。

在一些实施例中,上述预设的空洞卷积层具体可以配置有预设的膨胀系数和相应的卷积核。其中,上述预设的膨胀系数,以及卷积核的尺寸参数可以根据目标字符串在目标图像中的占比、分辨率等信息灵活设置。

具体运行预设的识别模型处理上述预处理后的目标图像时,可以利用预设的膨胀系数,对卷积核在对预处理后的目标图像进行正常卷积操作后得到的初始的图像特征矩阵进行膨胀处理,并使用数据值0来填充膨胀出来新增的矩阵区域,从而可以得到包含有相对较大视野范围的特征信息的膨胀后的图像特征矩阵,作为目标图像特征。这样既可以有效地增加所得到的目标图像特征的感受野,同时也不会丢失掉卷积核原本提取出的特征信息。

具体可以参阅图5所示,所使用的预设的空洞卷积层中配置有数据值为1的预设的膨胀系数,以及3*3的卷积核。在利用预设的空洞卷积层处理预处理后的目标图像时,可以先通过3*3的卷积核对预处理后的目标图像进行卷积操作,提取出左侧所示的3*3的初始的图像特征矩阵。然后,可以利用预设的膨胀系数(1)对上述初始的图像特征矩阵进行膨胀处理,得到扩充后的5*5的矩阵;并利用数据值0对扩充后新增的矩阵区域进行填充,从而可以得到右侧所示的5*5的膨胀后的图像特征矩阵作为目标图像特征。

在一些实施例中,所述预设的识别模型具体还可以包括定位子模型;其中,所述定位子模型与所述预设的空洞卷积层相连,所定位子模型用于根据目标图像特征,以及预设的锚点框参数,通过锚点回归,为目标字符串中的各个文本字符分别生成相对应的多个候选框;并分别为各个文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作为文本字符的边界框;所边界框携带有所包含的文本字符的位置信息。

通过上述实施例,运行预设的识别模型时,可以先利用内部集成的定位子模型精准地定位出目标字符串中各个文本字符的边界框,并基于边界框对各个文字符进行准确切割。

在一些实施例中,所述预设的锚点框参数具体可以按照以下方式获取:

S1:获取包含有样本字符串的样本图像;

S2:根据预设的标注规则,在所述样本图像中,为样本字符串中的各个样本字符分别标注出对应的边界框;并采集样本字符的边界框参数;其中,相邻的两个样本字符的边界框之间存在重叠的区域范围小于预设的区域范围阈值;

S3:对所述样本字符的边界框参数进行聚类处理,以得到所述预设的锚点框参数。

通过上述实施例,可以获取并利用效果更好、更加合适的预设的锚点框参数来进行锚点回归,从而可以加快网络模型的收敛速度,提高模型的计算效率,更加准确、高效地分别针对各个文本字符生成对应的多个候选框。

在一些实施例中,上述预设的锚点框参数具体可以是理解为锚点(Anchor)的参数值。

在一些实施例中,对所述样本字符的边界框参数进行聚类处理具体可以包括:对所述样本字符的边界框参数进行基于K均值聚类算法进行的聚类处理。

需要说明的是,基于现有方法,通常是依赖人工固定设置上述锚点框参数。导致在进行锚点回归时所使用的锚点框参数与实际的目标字符串并不匹配,从而影响锚点回归的结果。

在一些实施例中,上述分别为各个文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作为文本字符的边界框,具体实施时,可以包括以下内容:按照以下方式为目标字符串中的当前文本字符从所对应的多个候选框中筛选出一个符合要求的候选框作边界框:调用预设的软化非极大值抑制算法处理所述多个候选框,以从多个候选框中筛选出一个置信度符合要求的候选框,作为当前文本字符的边界框;并滤除所述多个候选框中除所述边界框以外的其他候选框。

通过上述实施例,利用软化非极大值抑制算法可以较好地适用于字符间隔较小的文本字符串的识别场景,可以有效地避免由于误删相邻近的其他文本字符的候选框,导致最终提取到的目标字符串不完整、存在遗失的问题。

在一些实施例中,需要说明的是,基于现有方法往往是调用非极大值抑制算法来从多个候选框中确定出对应的边界框。具体的,基于非极大值抑制算法,具体实施时,会先选定置信度最高的字符的候选框作为基准框,如果有和它重叠的候选框则计算两者重叠区域占总面积的比例,如果该比例大于设定的阈值,则将该候选框的置信度直接设置为0。

而在本实施例中,上述调用预设的软化非极大值抑制算法处理所述多个候选框,具体实施时,可以包括:先选定置信度最高的字符的候选框作为基准框,如果有和它重叠的候选框则计算两者重叠区域占总面积的比例,如果该比例大于设定的阈值,则采用预设的线性函数对该候选框的置信度进行修改调整,而不是像非极大值抑制算法那样直接设置为0。这样可以有效地避免了在文字字符之间间隔较近的情况下,误删相邻近的其他文字符的候选框。

上述预设的线性函数具体可以表示为以下形式:

其中,S

在一些实施例中,所述预设的识别模型具体还可以包括分类子模型;其中,所述分类子模型与所述空洞卷积层相连,所述分类子模型用于根据目标图像特征,识别并确定出待识别的目标字符串中的各个文本字符的类别值。

通过上述实施例,运行预设的识别模型时,可以利用内部集成的分类子模型精准地识别出目标字符串中的各个文本字符的类别值。

在一些实施例中,具体实施时,上述分类子模型可以根据目标图像特征,通过逻辑回归识别并确定出各个文本字符的类别值。

在一些实施例中,在所述目标字符串包括目标货币上的冠字号的情况下,所述字符类别值具体可以包括:0-9和/或A-Z等。

在一些实施例中,上述预设的识别模型可以同时集成有定位子模型和分类子模型。相应的,预设的识别模型具体运行时,可以利用上述定位子模型和分类子模型根据预设的空洞卷积层所提取出的目标图像特征,同时执行定位流程和分类流程,以便能够高效地在将目标字符串分割为多个按序连接的并各自包含有一个文本字符的多个边界框的同时,一并识别出各个边界框中的文本字符的类别值,从而可以得到基于边界框所携带的位置信息按顺序排列的多个文本字符的类别值,作为预设的识别模型输出的目标处理结果。

通过利用上述同时集成了定位子模型和分类子模型的预设的识别模型,可以将定位流程和分类流程这两个流程同时执行,避免了分开依次执行上述两个流程时出现的精度损失的逐层叠加,提高了所得到的目标处理结果的精度;同时,由于将上述两个流程同时执行,也提高了模型的处理效率。

在一些实施例中,上述对所述目标图像进行预处理,具体实施时,可以包括以下内容:检测目标图像,并在目标图像中确定出包含有待识别的目标字符串的目标图像区域;从所述目标图像中裁剪出所述目标图像区域,作为所述预处理后的目标图像。

通过上述实施例,可以先从目标图像中初步定为出包含有目标字符串的相对较小的目标图像区域,进而可以从目标图像中裁剪出只包含有上述目标图像区域的图像作为预处理后的目标图像输入值预设的识别模型中进行后续的识别处理。从而可以降低后续预设的识别模型的数据处理量,提高识别效率和识别精度。

在一些实施例中,具体实施时,服务器可以调用预先训练好的预设的文本字符区域识别模型来处理目标图像,以便能够较为快速、准确地在目标图像中检测并找出包含有目标字符串的目标图像区域。

在一些实施例中,上述对所述目标图像进行预处理具体实施时,还可以包括:对所述目标图像进行图像校正处理;和/或,对所述目标图像进行降噪处理。

通过上述实施例,可以减少目标图像中诸如图像噪声等干扰因素对后续字符串识别的影响,有助于提高后续字符串识别的精度。

在一些实施例中,在所述待识别的目标字符串包括目标货币上的冠字号的情况下,在确定出目标图像中的目标字符串之后,所述方法具体实施时,还可以包括以下内容:

S1:将所述目标字符串确定为所述目标货币上的冠字号;

S2:根据所述目标货币上的冠字号,跟踪并确定出目标货币的交易流转路径;

S3:根据所述目标货币的交易流转路径,确定是否存在交易风险。

通过上述实施例,可以根据具体情况和处理需求,利用所识别提取出的目标字符串进行后续具体的数据处理。

在一些实施例中,在将所述目标字符串确定为所述目标货币上的冠字号之后,所述方法还可以包括:根据所述冠字号,确定目标纸币的真伪。

在一些实施例中,在所述待识别的目标字符串包括目标快递单上的物流编号的情况下,在确定出目标图像中的目标字符串之后,所述方法具体实施时,还可以包括以下内容:将所述目标字符串确定为目标快递单上的物流编号;根据所述物流编号,对设置有改目标快递单的包裹或邮件进行物流追踪,并及时向用户反馈最新的物流信息。

在一些实施例中,所述方法具体实施前,还可以包括以下内容:

S1:使用预设的空洞卷积层代替卷积网络层和池化层的组合,作为网络模型中的图像特征的提取结构,以构建得到初始的识别模型;

S2:获取包含有待识别的样本字符串的样本图像;并对所述样本图像进行标注处理,得到标注后的样本图像;

S3:利用所述标注后的样本图像训练所述初始的识别模型,以得到预设的识别模型。

通过上述实施例,可以预先构建并训练得到能够适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况下的识别难度较高的字符串识别的预设的识别模型。

在一些实施例中,具体实施时,可以在基于Tiny-YOLOv2的网络结构的基础上,使用预设的空洞卷积层代替卷积网络层和池化层的组合,代替卷积网络层和池化层的组合,作为模型中的特征提取结构,得到初始的识别模型。

在一些实施例中,上述对所述样本图像进行标注处理,得到标注后的样本图像,具体实施时,可以包括以下内容:根据预设的标注规则,在所述样本图像中,为样本字符串中的各个样本字符分别标注出对应的边界框;其中,相邻的两个样本字符的边界框之间存在重叠的区域范围小于预设的区域范围阈值;根据边界框中所包含的样本字符,标注出相应的字符类别值,得到所述标注后的样本图像。

通过上述实施例,可以更加有效、准确地对样本图像进行标注,得到训练效果相对较好的标注后的样本图像。

由上可见,本说明书实施例提供的文本字符串的识别方法,具体实施前,对用于识别提取图像中的文本字符串的识别模型的模型结构行了针对性的改进:使用预设的空洞卷积层代替卷积网络层和池化层的组合,作为用于提取与文本字符串相关的图像特征的特征提取结构,得到效果较好的、改进后的预设的识别模型。具体实施时,在对所获取的目标图像进行预处理后,可以调用上述预设的识别模型处理预处理后的目标图像,从而可以有效地适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况,精准地识别并确定出目标图像中所包含的目标字符串,提高了文本字符串的识别精度和识别效率,减少了识别误差。还通过使用预先基于聚类处理所得到的预设的锚点框参数,来进行具体的锚点回归,使得所生成的候选框相对更加准确、合理,提高了后续确定边界框时的处理精度。还通过引入并利用预设的软化非极大值抑制算法处理各个文本字符所对应的多个候选框,以筛选出对应的边界框,有效地避免了在文字字符之间间隔较近的情况下,误删了相邻的其他文字符的候选框,造成最终提取到的目标字符串不完整,存在遗漏的问题。

参阅图6所示,本说明书实施例还提供了另一种文本字符串的识别方法。其中,该方法具体实施时,可以包括以下内容:

S601:获取包含有待识别的目标字符串的目标图像;

S602:调用预设的识别模型处理所述目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述目标图像中提取出与目标字符串相关的目标图像特征;

S603:根据所述目标处理结果,确定出目标图像中的目标字符串。

通过上述实施例,可以利用预设的识别模型较为高效地从目标图像中直接识别出目标字符串。

本说明书还提供了一种文本字符的识别方法,包括:获取包含有待识别的目标字符的目标图像;调用预设的识别模型处理所述目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述目标图像中提取出与目标字符相关的目标图像特征;根据所述目标处理结果,确定出目标图像中的目标字符。

本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取包含有待识别的目标字符串的目标图像;对所述目标图像进行预处理,得到预处理后的目标图像;调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像中提取出与目标字符串相关的目标图像特征;根据所述目标处理结果,确定出目标图像中的目标字符串。

为了能够更加准确地完成上述指令,参阅图7所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口701、处理器702以及存储器703,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。

其中,所述网络通信端口701,具体可以用于获取包含有待识别的目标字符串的目标图像。

所述处理器702,具体可以用于对所述目标图像进行预处理,得到预处理后的目标图像;调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像中提取出与目标字符串相关的目标图像特征;根据所述目标处理结果,确定出目标图像中的目标字符串。

所述存储器703,具体可以用于存储相应的指令程序。

在本实施例中,所述网络通信端口701可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。

在本实施例中,所述处理器702可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。

在本实施例中,所述存储器703可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。

本说明书实施例还提供了一种基于上述文本字符串的识别方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取包含有待识别的目标字符串的目标图像;对所述目标图像进行预处理,得到预处理后的目标图像;调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像中提取出与目标字符串相关的目标图像特征;根据所述目标处理结果,确定出目标图像中的目标字符串。

在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。

在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。

本说明书实施例还提供了另一种基于上述文本字符串的识别方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取包含有待识别的目标字符串的目标图像;调用预设的识别模型处理所述目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述目标图像中提取出与目标字符串相关的目标图像特征;根据所述目标处理结果,确定出目标图像中的目标字符串。

参阅图8所示,在软件层面上,本说明书实施例还提供了一种文本字符串的识别装置,该装置具体可以包括以下的结构模块:

获取模块801,具体可以用于获取包含有待识别的目标字符串的目标图像;

预处理模块802,具体可以用于对所述目标图像进行预处理,得到预处理后的目标图像;

调用模块803,具体可以用于调用预设的识别模型处理所述预处理后的目标图像,得到对应的目标处理结果;其中,所述预设的识别模型至少包括预设的空洞卷积层;所述预设的空洞卷积层用于代替卷积网络层和池化层的组合从所述预处理后的目标图像提取出与目标字符串相关的目标图像特征;

确定模块804,具体可以用于根据所述目标处理结果,确定出目标图像中的目标字符串。

需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

由上可见,基于本说明书实施例提供的文本字符串的识别装置,可以较好地适用于图像中的字符串字符尺寸较小、分辨率较低,所能够提取到的相关的图像特征相对较少的情况,精准地识别并确定出目标图像中所包含的目标字符串,提高了文本字符串的识别精度和识别效率,减少了识别误差。

在一个具体的场景示例中,可以应用本说明书所提供的文本字符串的识别方法来精准地识别出纸币上的冠字号。具体实施过程可以参阅以下内容。

在本场景示例中,考虑到由于纸币上冠字号(待识别的目标字符串)在纸币上的区域大致是固定的,所以可以先根据已知的先验信息,大致地确定出纸币冠字号的所在区域。如果采用现有的识别方法,一般需要经过精确定位、单个字符分割以及字符识别三个步骤(相当于定位流程和分类流程)。且每个步骤都是一个独立的过程,导致不同步骤之间是相互隔离开来,这样不可避免使得每个步骤在按序执行的过程中会存在一定的精度损失,三个步骤中精度损失所引入的误差会在整个过程中层层累计,最终作用于识别的准确率上,导致识别的准确度较差。因此,考虑可以减少不同任务之间的误差影响,整合三个步骤,提出构建并训练一个端到端的冠字号识别网络(对应的预设的识别模型)。

进一步,又考虑到现在已有的大部分文本检测网络模型(即,常规的识别模型),所使用的训练数据集较多为图片像素点多、噪声少或者较为规律的高清少噪的样本图像。但是,纸币在流通过程中,会产生很多折痕以及污损,且这些噪声会随机分布在冠字号区域中,这会对冠字号识别的精准度带来一定的影响。同时,由于冠字号字符面积区域较小,所以冠字号字符图片具有高噪声、低分辨率的特点,识别难度较大。

此外,如果使用网络层次较深的深度学习模型虽然能在精度上可以满足,但往往需要以时间的牺牲为代价,或者依赖于设备的性能。但纸币冠字号识别的场景下,没有较强的性能设备,同时对于时间要求较高。所以,目前已有的网络结构大多不能满足实际的业务需求。

基于上述考虑,为了解决传统字符识别过程分为三个步骤的识别方法所带来的局限性,以及已有深度学习网络结构精度和时效不能同时满足的问题,得到正确的冠字号字符序列,具体可以结合本说明书所提供的文本字符串的识别方法,进一步提出了一种针对纸币冠字号的基于Tiny-YOLOv2的端到端的冠字号字符识别方法。

该方法具体实施,可以包括:首先将经过预处理得到的区域较大,冠字号区域粗定位的图像(例如,预处理后的目标图像)作为输入,送入到冠字号识别网络中进行特征提取,该部分识别网络的卷积层去掉传统的池化操作,并使用空洞卷积(例如,预设的空洞卷积层)进行代替。

接着,可以根据提取到的特征性质,生成多个不同的可能的候选字符框(例如,候选框),并对字符进行具体类别的初始分类。再通过软化非极大值抑制算法(Non-MaximumSuppression,Soft-NMS)去除掉冗余的框,这样每个字符最终只输出一个置信度最大的预测框(例如,边界框)。然后通过锚点回归确定单个字符的具体坐标信息。

最后根据冠字号排列特征,以及所得到的每个字符的坐标信息,依次排列冠字号,得到最终的识别结果(例如,目标处理结果)。

考虑到在包含有纸币冠字号的图像中,冠字号的字符分辨率较低,能提取到的冠字号的特征较少,同时对于识别速度与精度通常要求会相对较高。因此,整个识别网络结构需要采用一个较为精简的网络作为算法的基础网络,并以此展开做出算法改进,以达到识别速度与准确率之间的一个平衡。

首先可以将包含有纸币的图像进行预处理。具体包括:图像校正(Rectification)、图像裁剪(Crop)和调整大小(Resize)等步骤,得到包含有冠字号区域粗定位图像(例如,预处理后的目标图像);再将粗定位图像作为输入图像,送入到冠字号识别网络中进行特征提取;预测得到每个字符的具体类别,即0-9或A-Z之间的字符;通过锚点回归得到每个字符的具体坐标;通过非极大值抑制算法去除掉冗余的框,最终每个字符只输出一个置信度最大的预测框;最后根据冠字号排列特点,根据预测的每个字符的坐标信息,依次排列冠字号,最终输出为冠字号识别结果。可以参阅图9所示。

具体处理时,可以包括以下步骤。

步骤101:空洞卷积操作提取图像特征。

一般的卷积神经网络的结构中,都是采用卷积层提取特征,在经过池化层筛选部分特征,同时达到增大感受野(Reception Field)的效果。但因为冠字号字符图像较少,本身能够提取到的特征较少,采用池化层,不仅不能达到特征过滤的效果反而会丢失字符间的细节特征。但如果直接去除掉池化层的话,又不能保证有相同的感受野。因此,采用空洞卷积在不减少字符特征信息的基础上,还能保持跟池化同等效果的感受野。

在本场景示例中,基于空洞卷积可以通过1个膨胀系数,可以将卷积核膨胀到膨胀系数设定的尺度内,膨胀出来的多余区域用0填充,因此每个卷积核都可以提取到较之前相比较大范围的特征信息,可以参阅图5所示,表示了3*3的卷积核,在经历了膨胀系数为1的膨胀操作后,实际进行卷积操作的卷积核。

空洞卷积与普通的卷积在时间消耗上并无差异,并且由于空洞卷积并没有增加参数量,所以可以使用较小的卷积核就可以达到之前的效果。同时由于感受野增加了,可以相应的减少池化层,从而减少了信息的损失。

一般的卷积加上池化的操作可以通过空洞卷积替代,并且空洞卷积可以在不带来额外时间消耗的情况下,加快卷积神经网络的计算效率。对于冠字号识别这个场景来说,池化是一个降低特征的过程,但由于冠字号字符本身分辨率就较低。

如果进行多次池化,会把冠字号字符本来就不丰富的特征信息带来了进一步的损失,造成对字符的局部特征信息提取不足,也就导致了对于相似图像分辨不清。

冠字号识别准确率下降。所以通过减少池化层,可以提升冠字号识别的准确率。

步骤102:通过k均值聚类预设锚点。

目标检测的框架通常会提前在图像上预设好不同大小、长宽比不同的框,这些框被称为锚点(Anchor)。对于一个目标检测的网络框架,将锚点框设置到一个合理的值,不但会加速网络收敛速度,还会保证最终的检测效果。

锚点的值一般都是通过人工设置的,例如比较出名的Fast-RCNN中,就是设计了9个不同的锚点,但这些人工设计的锚点有一个问题,就是并不能很好地适用于我们纸币冠字号字符的数据集。因此,我们提出了采用K均值聚类算法,自动生成适合数据集的锚点。

采用的聚类算法通过借鉴K均值聚类算法,把原本是通过欧氏距离聚类的方法,转换成通过交并比(Intersection-over-Union,IoU)聚类,以此产生初始锚点,保证了误差的大小是与真实框大小是无关的。

步骤103:利用软化非极大值抑制过滤掉冗余的边界框。

在通过锚点回归得到边界框后,同一个字符类别可能会检测出多个目标,每个字符可能存在多个重叠的边界框。在目标检测的网络中,通常采用非极大值抑制筛选得到一个置信度较高的边界框。非极大值抑制的算法思想核心是:对于每个字符都只保留一个最优的框。先选定置信度最高的字符的框为基准,如果有和它重叠的候选框则计算两者重叠区域占总面积的比例,若比例大于设定阈值则认为它是该字符冗余的候选框,则将该框的置信度置为0,即相当于剔除该候选框,小于则认为可能是其他字符的候选框则不改变其置信度,相当于保留该候选框。该方法对于图片中存在多个目标,且目标之间间隔较大的有较好的效果。

但由于纸币冠字号上的字符分布较为密集,字符于字符之间间隔较小,当出现噪声干扰的时候,很容易造成两个字符候选框之间重叠较大。当其中一个字符被选定为基准时,和它重叠较高的另外一个字符,则很容易造成字符检测的丢失。可以参阅图3所示,当字符4(从左往右第4个字符)被选为基准时,字符0(从左往右第5个字符)的候选框将会被删除。

为了应对这种情况,在本场景示例中,采用了软化非极大值抑制的方法,对于比例大于阈值的候选框,不再直接将置信度置为0,而是采用线性函数降低。相当于平滑化普通的非极大值抑制算法的衰减函数,如以下公式所示,公式(1)表示非极大值抑制,公式(2)则代表软化后的。

其中,S

通过上述场景示例,验证了本说明书所提供的文本字符串的识别方法可以将字符的分割和分类问题整合在一个网络模型中进行,很好地解决了之前因为两者分割开来造成的特征损失问题;通过采用空洞卷积提取冠字号字符图像特征,可以较好地解决纸币冠字号字符这类像素较少的图像,由于池化过程导致丢失特征的问题;通过采用软化非极大值抑制算法平滑化原来的评价函数,较好地解决了冠字号字符分布较为密集,字符检测框重叠的容易误删邻近字符的候选框的问题。

虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

相关技术
  • 文本字符串的识别方法、装置和服务器
  • 文本信息的识别方法、装置及服务器、存储介质
技术分类

06120113046710