掌桥专利:专业的专利平台
掌桥专利
首页

文本识别方法、装置、电子设备和可读存储介质

文献发布时间:2023-06-19 11:26:00


文本识别方法、装置、电子设备和可读存储介质

技术领域

本申请涉及文本识别技术领域,具体而言,涉及一种文本识别方法、一种文本识别装置、一种电子设备和一种可读存储介质。

背景技术

相关技术中,根据书写场景的不同,文本的书写模式也不同,有的文字横向书写,有的文字纵向书写,有的文字按照从左到右的顺序书写,还有的文字按照从右到左的顺序书写。

目前采用OCR(Optical Character Recognition,光学字符识别)原理对书写的文字进行识别,只是按照固定的识别顺序进行识别并输出,导致输出的语句不符合语义,文字识别结果不正确,影响文字识别的准确性。

本申请实施例提供了一种文本识别方法、文本识别装置、电子设备和可读存储介质,能够解决相关技术中只是按照固定的识别顺序进行识别并输出,导致输出的语句不符合语义,文字识别结果不正确,影响文字识别的准确性。

为了解决上述技术问题,本申请是这样实现的:

第一方面,本申请实施例提供了一种文本识别方法,包括:将识别到的字符进行N种组合,获得字符组成的M个语句;确定M个语句中每个语句的语句流畅值;将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值;基于语句流畅值和分词分值显示M个语句中的目标语句;其中,M≤N。

第二方面,本申请实施例提供了一种文本识别装置,包括:组合单元,用于将识别到的字符进行N种组合,获得字符组成的M个语句;确定单元,用于确定M个语句中每个语句的语句流畅值;分词单元,用于将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值;显示单元,用于基于语句流畅值和分词分值显示M个语句中的目标语句;其中,M≤N。

第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器及存储在该存储器上并在处理器上运行的程序或指令,该程序或指令被处理器执行时实现如第一方面提供的文本识别方法的步骤。

第四方面,本申请实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面提供的文本识别方法的步骤。

第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面提供的文本识别方法的步骤。

在本申请实施例中,在对文本进行识别之后,通过对识别得到的字符进行组合,获得多个语句,确定每个语句的语句流畅值以及分词分值,根据每个语句的语句流畅值和分词分值从多个语句中筛选得到目标语句,使得筛选得到的目标语句更加符合语义,降低出现输出的语句与其实际书写的语句存在偏差的概率,提高文本识别的准确性。

附图说明

图1是本申请实施例的文本识别方法的流程图之一;

图2是本申请实施例的文本识别示意图之一;

图3是相关技术方案中的文本识别结果示意图之一;

图4是相关技术方案中的文本识别结果示意图之二;

图5是本申请实施例的文本识别方法的流程图之二;

图6是本申请实施例的文本识别方法的流程图之三;

图7是本申请实施例的对语句流畅值进行加权的示意图;

图8是本申请实施例的文本识别方法的示意图;

图9是本申请实施例的文本识别方法的示意图;

图10是本申请实施例的文本识别方法的流程图之四;

图11是本申请实施例的文本识别装置的示意框图;

图12是本申请实施例的电子设备结构示意框图之一;

图13是本申请实施例的电子设备结构示意框图之二。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。

下面参照图1至图13描述根据本申请一些实施例的文本识别方法、文本识别装置、电子设备和可读存储介质。

为了解决相关技术中的上述问题,在本申请的一个实施例中,图1示出了本申请实施例的文本识别方法的步骤流程图之一,如图1所示,文本识别方法包括:

步骤102,将识别到的字符进行N种组合,获得字符组成的M个语句。

在步骤102中,识别到的字符可以是通过对图像进行OCR识别所得到的结果,其中,OCR原理(Optical Character Recognition)也即是光学字符识别,通过电子设备,例如扫描仪或者照相机等获取字符,检查纸上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

在其中一个实施例中,OCR识别所识别的对象可以是软件截图,也可以是传输或存储的照片。

在其中一个实施例中,软件截图、输或存储的照片所包含的文字可以是打印的文字,也可以为手写的文字。可以为中文,也可以为英文或者其他外语等。

在其中一个实施例中,对识别到中的字符进行N种组合,可以是对识别得到所有字符进行排列组合,以得到所有字符的序列,即得到M个语句。

在其中一个实施例中,N的取值可以根据字符数量进行设定。

在其中一个实施例中,M≤N,可以理解的是,在不同组合方式下,组合得到的语句有可能是相同的,故此,得到的语句数量M可能会小于N。

步骤104,确定M个语句中每个语句的语句流畅值。

在步骤104中,语句流畅值用于表征该语句的流畅程度,其具体数值与组合得到的语句的流畅程度成负相关,通常情况下,组合得到的语句越流畅,此时,语句流畅值越小。

步骤106,将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值。

在步骤106中,从另外一个维度对每个语句进行评分,具体地,使用分词模型对每个语句进行分词,并对分词得到的分词结果进行评分,对应语句越合理的情况下,分词后得到的分词分值越高。

步骤108,基于语句流畅值和分词分值显示M个语句中的目标语句。

在步骤108中,在确定每个语句的语句流畅值和分词分值之后,根据语句流畅值和分词分值对M个语句进行筛选,从而得到目标语句,在此过程中,由于语句流畅值用于表征语句的流畅程度,通过在语句流畅值的基础上引入用于表征语句的合理情况的分词分值,以便筛选得到符合语义的语句,确保显示的语句的准确性。

在其中一个实施例中,目标语句的筛选是比较不同语句的语句流畅值以及比较不同语句的分词分值,从M个语句中筛选得到语句流畅值较小且分词分值较大的语句,来作为目标语句。

在其中一个实施例中,考虑到上述目标语句的筛选需要比较两个参数,需要处理的数据量比较大,本申请实施例中,对分词分值取负值,通过比较不同语句所对应的和值(其中,和值为语句流畅值与取负值的分词分值的和),以将两个比较参数归一为单一参数,以此降低了语句筛选过程中所需要比较的数据量,进而提高了输出结果的效率。

在其中一个实施例中,可以对M个语句所对应的和值按照由小到大的顺序进行排序,通过选取前N个句子,作为目标语句。

举例来说,以图2中所记载的内容为例,通过对图2进行字符识别,可以得到“打气补”、“胎”的内容,具体地,“打气补”、“胎”的显示方式如图3所示,如果将字符按照行排序,并且按照从左到右的顺序组成句子,得到的句子为{“打气补胎”},如果将字符按照列排序,并且按照从左到右的顺序组成句子,得到的句子为{“打胎气补”}。很显然,在对识别到的字符按照不同的顺序排列,得到的句子并不相同。很明显,只有{“打气补胎”}是符合语义的,而{“打胎气补”}由于字符顺序的错误,直接导致了语义出现了偏差,影响了显示的语句的准确性。

又如,相关技术方案中,针对操作界面(包括A、B至少两个应用图标)进行OCR识别之后,其中,B的应用图标中有“特价”的文字,如图4所示,相关技术方案会识别得到{“A知特价”},其语义与实际语义不符合,显示的语句的准确性较差。

在其中一个实施例中,将识别到的字符进行N种组合,获得字符组成的M个语句,包括:将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合,获得M1个语句;以及将识别到的每一列字符按照由上至下的顺序进行组合,以及按照由下至上的顺序进行组合,获得M2个语句,其中,M1与M2的总和为M。

在该实施例中,考虑到基于OCR识别所得到的字符之间存在相对位置关系,因此,可以基于该位置关系对字符进行组合,具体地,将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合;以及将识别到的每一列字符按照由上至下的顺序进行组合,以及按照由下至上的顺序进行组合。

在其中一个实施例中,可以根据识别得到的字符之间的相对位置关系,对所有字符进行位置划分,如识别得到字符按照多行多列的形式分布时,将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合,获得M1个语句可以理解为,以行为单位,由左至右的顺序对每行进行组合,以得到至少一个句子;或以行为单位,由右至左的顺序对每行进行组合,以得到至少一个句子。

举例来说,以图3中所记载的内容为例,通过上述组合,按照由左至右的顺序对每行进行组合可以得到{“打气补”,“胎”},而按照由右至左的顺序对每行进行组合可以得到{“补气打”,“胎”},此时,得到的语句包括:{“打气补”,“胎”,“补气打”,“胎”},在此过程中,得到第一语句集合。

对于行数大于1的情况下,以行为单位,由第一行向最后一行进行组合以及由最后一行向第一行进行组合,其中,在每行中,字符按照由右至左的顺序进行组合或按照由左至右的顺序进行组合,在此过程中,得到第二语句集合。

举例来说,以图3中所记载的内容为例,通过上述组合,可以得到的语句包括{“打气补胎”,“补气打胎”,“胎打气补”,“胎补气打”}。

在其中一个实施例中,将识别到的每一列字符按照由上至下的顺序进行组合,以及按照由下至上的顺序进行组合,获得M2个语句可以理解为以列为单位进行组合。

在该实施例中,通过对不同列之间的内容进行组合,减少了由识别得到的字符所构成的语句出现遗漏的几率,以确保组合的完整性。

举例来说,以图3中所记载的内容为例,通过上述组合,按照由上至下的顺序以及按照由下至上的顺序进行组合能够得到{‘打胎’,‘气’,‘补’}和{‘胎打’,‘气’,‘补’},在此过程中,得到第三语句集合。

而在列的数量大于1的情况下,考虑对不同列之间的内容进行组合,其可以得到{‘打胎气补’,‘补气打胎’},{‘胎打气补’,‘补气胎打’},在此过程中,得到第四语句集合。在其中一个实施例中,确定M个语句中每个语句的语句流畅值,如图5所示,包括:

步骤202,确定M个语句中每个语句中的每个字符在M个语句组成的语句集合中出现的概率值;

步骤204,根据概率值以及M个语句中每个语句对应的字符数量,确定M个语句中每个语句的语句流畅值。

在该实施例中,具体地说明了语句流畅值的计算方法,具体地,

S=C

公式(1)示出了语句S包含依次的字符C

其中,每个语句出现的概率值如公式2所示,具体地,参见如下:

P(S)=P(C

其中,p(C

举例来说,统计当前文本中总共字符数为100,字符“打”出现了10次,那么“打”出现的概率为

其中,P(C

举例来说,C

在本申请实施例中,语句流畅值,即困惑度,其表达式如公式5所示:

PPL(S)=P(C

其中,PPL(S)为语句S的困惑度,1/N为语句S中包含的字符数量。

举例来说,PPL(‘打气补胎’)=P(打,气,补,胎)

在其中一个实施例中,考虑到M个语句中并非所有的语句都可以作为目标语句进行输出,在确定每个语句的语句流畅值之后,可以根据语句流畅值对M个语句进行筛选,如预先设置一个语句流畅值阈值,将每个语句流畅值与该语句流畅值阈值进行比较,在语句流畅值大于语句流畅值阈值的情况下,舍弃该语句流畅值对应的语句,以便降低文字识别所处理的数据量。

举例来说,第一语句集合对应的语句流畅值分别为Score_1,Score_2,Score_3,Score_4与预先设定的语句流畅值阈值θ做比较,舍弃大于阈值θ的候选项。

同样地,对于第二语句集合对应的语句流畅值分别为Score_5,Score_6,Score_7,Score_8与预先设定的语句流畅值阈值θ做比较,舍弃大于阈值θ的候选项。

在其中一个实施例中,根据概率值以及M个语句中每个语句对应的字符数量,确定M个语句中每个语句的语句流畅值之后,如图6所示,还包括:

步骤302,获取M个语句中每个语句的权重值;

步骤304,根据权重值对M个语句中每个语句中的语句流畅值进行修正。

在该实施例中,文本识别方法可以根据用户的设定对组合得到的语句给出权重,以便在文本识别方法的实际应用过程中,可以根据使用场景进行调整,以便满足不同的使用场景。

其中,权重值与可以根据每个语句所归属的语句集合来确定,如,第一语句集合的权重为α,第二语句集合的权重是β,第三语句集合的权重是γ,第四语句集合的权重是δ,(注:α+β+γ+δ=1,其中α,β,γ,δ,分别α代表行优先但是不合并,β代表行优先且行合并,γ代表列优先但不合并,δ代表列优先且合并。),其中,α,β,γ,δ的具体选取可以由用户进行设定。

如图7所示,第一语句集合的权重值为α,第一语句集合中语句流畅值分数分别为A,B,C,D,可以理解地,A,B,C,D的数值可以相同,也可以不同。通过第一语句集合的权重值α分别修正第一语句集合中的语句流畅值,也即是用α与A,B,C,D分别相乘,得到第一集合中每一个语句修正后的语句流畅值。

第N语句集合的权重值为δ,可以理解地,α与δ可以相同,也可以不同。第N集合中语句流畅值分数分别为E,F,G,H,可以理解地,E,F,G,H的数值可以相同,也可以不同。通过第N语句集合的权重值δ分别修正第N语句集合中的语句流畅值,也即是用δ与E,F,G,H分别相乘,得到第N语句集合中每一个语句修正后的语句流畅值。

在其中一个实施例中,将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值,具体包括:根据M个语句中每个语句包含的分词与目标词库中的字符匹配的数量确定M个语句中每个语句包含的分词的分词分值。

在该实施例中,使用分词模型对每个语句进行分词,并对分词得到的分词结果进行评分,对应语句越合理的情况下,分词后得到的分词分值越高。因此,通过对于与目标词库中的字符匹配的数量的分词的分值进行统计,以便可以得到每个语句的分词分值。

举例来说,一个句子中命中一个词记一分,命中词典越多,则表明句子越合理,在分词分值取值为负的情况下,每个语句的分词分值越小,则代表该语句越合理。

在其中一个实施例中,以图3中所记载的内容为例,如图8所示,对字符排序{“打气补胎”}进行预处理,得到“打气补胎”,其中,预处理可以理解为,从排序后{“打气补胎”}中,提取得到文字“打气补胎”,在预处理之后,将“打气补胎”输入分词模型中,得到分词结果“打气”和“补胎”,将分词结果“打气”和“补胎”分别与词库中的字符进行对比,得到对比结果,分词“打气”与词库中的字符一致,得分为-1,分词“补胎”与词库中的字符一致得分为-1,因此字符排序“打气补胎”的分词得分为-2。将字符排序“打气补胎”的困惑度得分与分词得分进行求和,得打字符排序“打气补胎”的和值。

在其中一个实施例中,将目标语句输入至目标主题模型,以便目标主题模型输出目标语句所对应的主题。

在该实施例中,由于输入至目标主体模型中的语句更加符合语义,因此,目标主体模型输出的主题更加准确。

举例来说,以图3中所记载的内容为例,相关技术直接向目标主体模型输入{“打胎气补”},经过目标主体模型处理之后,返回的主题是{高考考试考生试卷复习题题目学生中考成绩,胎儿孕妇孕妈怀孕孕期宝宝发育准妈妈孕妈妈肚子},而在对字符不进行合并时,向目标主体模型输入{“打气补”}和{“胎”},此时,{“打气补”}返回的主题为{“老板小白懂鸡汤朋友肯定楼主听告诉毒”},而{“胎”}返回的主题为空。

通过本申请实施例对其进行处理之后,所输出的内容为{“打气补胎”},经过目标主体模型处理之后,返回的主题是{轮胎汽车车辆更换检查行驶胎压爆胎磨损车主},对比可知,目标主体模型输出的主题更加准确。

在其中一个实施例中,如图9所示,针对图像识别到的不同的语句,分别采用语句对应的权重值修正语句流畅值,再将修正后的语句流畅值与对应的分词分值求和,按照和值从小到大的顺序对语句进行排列,将和值排序中前预设个数和值对应的语句发送给目标主题模型,以得到与目标语句对应的目标主题信息。可以理解地,本实施例中A至J仅仅代表不同语句的语句流畅值和分词分值,A至J的数值可以相同,也可以不同。

在其中一个实施例中,目标主题模型可以是LDA(Latent DiricheletAllocation,一种文档主题生成模型)可以通过如下方法得到目标主题信息:

遍历所有的主题中的所有词语,并且为所有词语随机分配一个主题,即Z

对所有文档中的所有词语进行遍历,假如当前文档m的词t对应主题为k,则

在其中一个实施例中,如图10所示,本申请中文本识别方法的具体实施步骤如下:

步骤1002,获取OCR的识别结果;

在步骤1002中,通过OCR(Optical Character Recognition,光学字符识别)原理识别字符,将图像中的文字转换为计算机文字。

步骤1004,判断是否为多行为本,如果是,则执行步骤1010,如果否,则执行步骤1008;

步骤1006,判断是否为多列文本,如果是,则执行步骤1014,如果否,则执行步骤1012;

步骤1008,以行为单位进行组合,分别从左到右和从右到左组合,计算组合后的语句的语句流畅值和取负值之后的分词分值的和值;

步骤1010,以行为单位进行组合,分别从上到下和从下到上进行合并,计算组合后的语句的语句流畅值和取负值之后的分词分值的和值;

步骤1012,以列为单位进行组合,分别从上到下和从下到上组合,计算组合后的语句的语句流畅值和取负值之后的分词分值的和值;

步骤1014,以列为单位进行组合,分别从左到右和从右到左进行合并,计算组合后的语句的语句流畅值和取负值之后的分词分值的和值;

步骤1016,赋予不同语句不同的权重值;

步骤1018,将每一语句中的语句流畅值分别乘以权重值,得到修正后的语句流畅值,再与取负值之后的分词分值求和计算得到和值,最终将所有语句按照和值重新升序排序,取前N个结果;

步骤1020,将最符合语义的目标语句发送至目标主题模型,得到目标主题信息。

在本申请的一个实施例中,如图11所示,提出了一种文本识别装置400,包括:组合单元402,用于将识别到的字符进行N种组合,获得字符组成的M个语句;确定单元404,用于确定M个语句中每个语句的语句流畅值;分词单元406,用于将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值;显示单元408,用于基于语句流畅值和分词分值显示M个语句中的目标语句;其中,M≤N。

在其中一个实施例中,识别到的字符可以是通过对图像进行OCR识别所得到的结果,其中,OCR原理(Optical Character Recognition)也即是光学字符识别,通过电子设备,例如扫描仪或者照相机等获取字符,检查纸上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

在其中一个实施例中,OCR识别所识别的对象可以是软件截图,也可以是传输或存储的照片。

在其中一个实施例中,软件截图、输或存储的照片所包含的文字可以是打印的文字,也可以为手写的文字。可以为中文,也可以为英文或者其他外语等。

在其中一个实施例中,对识别到中的字符进行N种组合,可以是对识别得到所有字符进行排列组合,以得到所有字符的序列,即得到M个语句。

在其中一个实施例中,N的取值可以根据字符数量进行设定。

在其中一个实施例中,M≤N,可以理解的是,在不同组合方式下,组合得到的语句有可能是相同的,故此,得到的语句数量M可能会小于N。

在其中一个实施例中,语句流畅值用于表征该语句的流畅程度,其具体数值与组合得到的语句的流畅程度成负相关,通常情况下,组合得到的语句越流畅,此时,语句流畅值越小。

在其中一个实施例中,从另外一个维度对每个语句进行评分,具体地,使用分词模型对每个语句进行分词,并对分词得到的分词结果进行评分,对应语句越合理的情况下,分词后得到的分词分值越高。

在确定每个语句的语句流畅值和分词分值之后,根据语句流畅值和分词分值对M个语句进行筛选,从而得到目标语句,在此过程中,由于语句流畅值用于表征语句的流畅程度,通过在语句流畅值的基础上引入用于表征语句的合理情况的分词分值,以便筛选得到符合语义的语句,确保显示的语句的准确性。

在其中一个实施例中,目标语句的筛选是比较不同语句的语句流畅值以及比较不同语句的分词分值,从M个语句中筛选得到语句流畅值较小且分词分值较大的语句,来作为目标语句。

在其中一个实施例中,考虑到上述目标语句的筛选需要比较两个参数,需要处理的数据量比较大,本申请实施例中,对分词分值取负值,通过比较不同语句所对应的和值(其中,和值为语句流畅值与取负值的分词分值的和),以将两个比较参数归一为单一参数,以此降低了语句筛选过程中所需要比较的数据量,进而提高了输出结果的效率。

在其中一个实施例中,可以对M个语句所对应的和值按照由小到大的顺序进行排序,通过选取前N个句子,作为目标语句。

在其中一个实施例中,组合单元402具体用于:将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合,获得M1个语句;以及将识别到的每一列字符按照由上至下的顺序进行组合,以及按照由下至上的顺序进行组合,获得M2个语句,其中,M1与M2的总和为M。

在该实施例中,考虑到基于OCR识别所得到的字符之间存在相对位置关系,因此,可以基于该位置关系对字符进行组合,具体地,将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合;以及将识别到的每一列字符按照由上至下的顺序进行组合,以及按照由下至上的顺序进行组合。

在其中一个实施例中,可以根据识别得到的字符之间的相对位置关系,对所有字符进行位置划分,如识别得到字符按照多行多列的形式分布时,将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合,获得M1个语句可以理解为,以行为单位,由左至右的顺序对每行进行组合,以得到至少一个句子;或以行为单位,由右至左的顺序对每行进行组合,以得到至少一个句子。

在其中一个实施例中,确定单元404具体用于:确定M个语句中每个语句中的每个字符在M个语句组成的语句集合中出现的概率值;根据概率值以及M个语句中每个语句对应的字符数量,确定M个语句中每个语句的语句流畅值。

在其中一个实施例中,考虑到M个语句中并非所有的语句都可以作为目标语句进行输出,在确定每个语句的语句流畅值之后,可以根据语句流畅值对M个语句进行筛选,如预先设置一个语句流畅值阈值,将每个语句流畅值与该语句流畅值阈值进行比较,在语句流畅值大于语句流畅值阈值的情况下,舍弃该语句流畅值对应的语句,以便降低文字识别所处理的数据量。

在其中一个实施例中,确定单元404还用于:获取M个语句中每个语句的权重值;根据权重值对M个语句中每个语句中的语句流畅值进行修正。

在该实施例中,文本识别方法可以根据用户的设定对组合得到的语句给出权重,以便在文本识别方法的实际应用过程中,可以根据使用场景进行调整,以便满足不同的使用场景。

在其中一个实施例中,分词单元406具体用于:根据M个语句中每个语句包含的分词与目标词库中的字符匹配的数量确定M个语句中每个语句包含的分词的分词分值。

在该实施例中,使用分词模型对每个语句进行分词,并对分词得到的分词结果进行评分,对应语句越合理的情况下,分词后得到的分词分值越高。因此,通过对于与目标词库中的字符匹配的数量的分词的分值进行统计,以便可以得到每个语句的分词分值。

本申请实施例中的文本识别装置400可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。

本申请实施例中的文本识别装置400可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。

在该实施例中,文本识别装置400的各模块执行各自功能时实现如上述任一实施例中的文本识别方法的步骤,因此,文本识别装置400同时也包括如上述任一实施例中的文本识别方法的全部有益效果,在此不再赘述。

在本申请的一个实施例中,如图12所示,提供了一种电子设备200,包括处理器220,存储器210及存储在存储器210上并可在处理器220上运行的程序或指令,程序或指令被处理器220执行时实现如上述任一实施例的文本识别方法的步骤,因此具有上述任一实施例的全部有益效果,在此不再赘述。

需要说明的是,本申请实施例中的电子设备200包括上述的移动电子设备和非移动电子设备。

如图13所示,该电子设备200包括但不限于:射频单元230、网络模块260、音频输出单元270、输入单元280、传感器310、显示单元290、用户输入单元250、接口单元240、存储器210、以及处理器220等部件。其中用户输入单元250包括触控面板2502和其他输入设备2504,输入单元280包括图形处理器2802和麦克风2804,显示单元290包括显示面板2902。

本领域技术人员可以理解,电子设备200还可以包括给各个部件供电的电源,例如电池,比如电池,电源可以通过电源管理系统与处理器220逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图13中示出的电子设备200结构并不构成对电子设备200的限定,电子设备200可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。

在本申请实施例中,电子设备200包括但不限于移动终端、平板电脑、笔记本电脑、掌上电脑、车载电子设备200、可穿戴设备、以及计步器等。

本实施例中,处理器220用于将识别到的字符进行N种组合,获得字符组成的M个语句;确定M个语句中每个语句的语句流畅值;将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值;基于语句流畅值和分词分值显示M个语句中的目标语句;其中,M≤N。

可选的,将识别到的字符进行N种组合,获得字符组成的M个语句,处理器220具体用于将识别到的字符按照由左至右的顺序进行组合,以及按照由右至左的顺序进行组合,获得M1个语句;以及将识别到的每一列字符按照由上至下的顺序进行组合,以及按照由下至上的顺序进行组合,获得M2个语句,其中,M1与M2的总和为M。

可选的,确定M个语句中每个语句的语句流畅值,处理器220具体用于确定M个语句中每个语句中的每个字符在M个语句组成的语句集合中出现的概率值;根据概率值以及M个语句中每个语句对应的字符数量,确定M个语句中每个语句的语句流畅值。

可选的,根据概率值以及M个语句中每个语句对应的字符数量,确定M个语句中每个语句的语句流畅值之后,处理器220具体用于:获取M个语句中每个语句的权重值;根据权重值对M个语句中每个语句中的语句流畅值进行修正。

可选的,将M个语句进行分词,获得M个语句中每个语句包含的分词的分词分值,处理器220具体用于:根据M个语句中每个语句包含的分词与目标词库中的字符匹配的数量确定M个语句中每个语句包含的分词的分词分值。

在本申请的一个实施例中,提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如上述任一实施例的文本识别方法的步骤,因此具有上述任一实施例的全部有益效果,在此不再赘述。

其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述文本识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。术语“多个”则指两个或两个以上,除非另有明确的限定。术语“相连”、“连接”、等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。术语“第一”、“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。

此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。

上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

相关技术
  • 文本识别方法、装置、电子设备及可读存储介质
  • 文本识别方法、装置、电子设备及计算机可读存储介质
技术分类

06120112922551