掌桥专利:专业的专利平台
掌桥专利
首页

图像处理方法、词典笔及存储介质

文献发布时间:2023-06-19 18:27:32


图像处理方法、词典笔及存储介质

技术领域

本申请实施例涉及计算机技术领域,尤其涉及一种图像处理方法、词典笔及存储介质。

背景技术

目前,具有文本识别功能的电子设备在教育硬件领域不断出现,例如词典笔等。

一般情况下,会通过电子设备连续采集书本上本的内容得到多帧图像,每张图像中可以包括书本上的文字片段,之后可以通过电子设备对采集到的多帧图像进行识别,得到对应的文本内容,并可以基于文本内容确定对应的原文、译文、释义等。

但是,这要求电子设备对采集到的多帧图像中包括的文本进行精准识别。

发明内容

有鉴于此,本申请实施例提供一种图像处理方案,以至少部分解决上述问题。

根据本申请实施例的第一方面,提供了一种图像处理方法,包括:获取连续的多帧待识别文本图像;对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域;对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域,所述第一图像质量阈值大于所述第二图像质量阈值;将所述目标区域中的像素,与所述待拼接区域的像素进行比对,从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域;基于所述目标区域和所述拼接区域,将所述最后一帧图像和所述相邻的上一帧图像进行拼接,获得拼接图像;获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符;根据所述位置信息,及所述第二待处理字符与所述多个第一待处理字符之间的关系,对所述多个第一待处理字符进行删除处理。

根据本申请实施例的第二方面,提供了一种词典笔,包括:图像采集装置、处理器、输出装置,所述图像采集装置,用于采集连续的多帧待识别文本图像;所述处理器,用于对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域;对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域,所述第一图像质量阈值大于所述第二图像质量阈值;将所述目标区域中的像素,与所述待拼接区域的像素进行比对,从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域;基于所述目标区域和所述拼接区域,将所述最后一帧图像和所述相邻的上一帧图像进行拼接,获得拼接图像;获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符;根据所述位置信息,及所述第二待处理字符与所述多个第一待处理字符之间的关系,对所述多个第一待处理字符进行删除处理得到处理后字符,并根据所述处理后字符确定对应的输出内容;所述输出装置用于输出所述输出内容。

根据本申请实施例的第三方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的图像处理方法。

根据本申请实施例提供方案,通过获取连续的多帧待识别文本图像;对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域;对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域,所述第一图像质量阈值大于所述第二图像质量阈值,由此,可以从最后一帧图像中靠近图像采集起始侧的一侧,确定出图像质量较高的目标区域,并从最后一帧图像相邻的上一帧图像中确定出图像质量较高的待拼接区域,并通过保证第一图像阈值大于第二图像阈值,使得待拼接图像区域的面积大于目标区域的面积,从而在将所述目标区域中的像素,与所述待拼接区域的像素进行比对时,可以从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域;基于所述目标区域和所述拼接区域,将所述最后一帧图像和所述相邻的上一帧图像进行拼接,获得拼接图像,可以保证最后一帧图像较为完整地保留在拼接图像的尾部;之后获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符,由于最后一帧图像较为完整地保留在拼接图像的尾部,因此,拼接图像对应的第一待处理字符与最后一帧图像对应的第二待处理字符的位置匹配程度较高,由此,可以尽量减少由于图像中的字符形变导致的位置误差,尤其可以提高拼接图像中与最后一帧图像对应的部分第一待处理字符的位置误差,使得根据所述位置信息,及所述第二待处理字符与所述多个第一待处理字符之间的关系,对所述多个第一待处理字符进行删除处理时的误差较小,提高了精度;并且,本申请提供的方案基于位置信息对所述多个第一待处理字符进行删除处理,因此当第一待处理字符存在多行时,也不会出现错误的情况。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1A为本申请实施例提供的一种词典笔的结构示意图;

图1B为图1A所示实施例中的一种图像识别的示意图;

图2A为本申请实施例提供的一种图像处理方法的流程示意图;

图2B为图2A所示实施例中的一种场景示例的示意图;

图3A为本申请实施例提供的一种图像处理方法的步骤流程图;

图3B为图3A所示实施例中的一种图像拼接的示意图;

图3C为图3A所示实施例中的一种场景示例的示意图;

图3D为图3A所示实施例中的另一种图像拼接的示意图;

图4为本申请实施例提供的一种词典笔的结构示意图;

图5为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。

下面先对本申请的使用场景进行说明,参见图1,示出了一种词典笔采集书本的示意图,词典笔包括笔身和笔头10,笔头10上设置有遮挡板11,遮挡板11内侧设置有摄像头(图中未示出),用于对书本上的内容(例如图1中示出的whale)进行采集。

具体在使用过程中,用户可以使用词典笔按照书本中的文字顺序划过文本,通过笔头的摄像头对文本进行快速录像或者快速拍摄得到多帧图像,再对多帧图像进行图像拼接,基于拼接后的图像进行文字识别,再进行文本转语音播放,同步输出对应的翻译(如英汉)结果。

具体在使用词典笔划过文本时,以从左向右划过为例,遮挡板左侧的为用户看到的内容,遮挡板右侧的为摄像头拍摄下来的图像。当用户抬笔时,摄像头仍然会采集遮挡板右侧的内容,即摄像头采集的最后一帧图像,这些内容是抬笔位置之后的内容,在处理时需要被丢弃。

一般情况下,可以对最后一帧图像进行识别,并从多帧图像对应的识别出的文本中,将与最后一帧的识别结果对应的文本丢弃;但是,若最后一帧图像中包括多行文字,特别是多行文字中还包括一些单词或词组和根据前面的图像识别出的结果重复时,容易出现误丢弃的情况。例如,参见图1B,当图像中存在多行文字时,词典笔一般只识别图像的中间一行文字,即图像中的“I love China.”第一行的“ive in China.China”因为不在中间,所以不进行识别。图1B所示的抬笔处之后的部分为最后一帧图像,其只包含第一行的China,即最后一帧图像对应的识别结果为“China”,若将之前的识别结果中的China进行丢弃,保留的内容为“I love”,即出现误丢弃的情况。

此外,还可以直接将多帧图像进行拼接,并将最后一帧图像从拼接后的图像中取出,但是由于图像拼接时的拼接精度有限,同样可能出现多删除或者少删除的情况。

为此,本申请实施例提供一种图像处理方法,以尽量解决或者缓解上述问题。

下面结合本申请实施例附图进一步说明本申请实施例具体实现。

图2A为本申请实施例提供的一种图像处理方法的流程示意图,如图所示,其包括:

S201、获取连续的多帧待识别文本图像;

本实施例中,获取待识别文本图像的电子设备可以是词典笔,也可以是其他能够采集图像的设备,本实施例对此不进行限定。

具体采集待识别文本图像时,用户可以手持电子设备划过待采集的书本,电子设备的摄像头进行连续拍摄,得到多帧待识别文本图像。当然,上述仅以书本为例进行示例性说明,任何具有文字的物体均可作为被采集的对象。

S202、对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域;

通过对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,可以选择出靠近采集起始侧且图像质量较高的区域作为目标区域,提高了后续步骤S204中将像素进行比对时的准确率。

示例地,图像质量分析可以包括但不限于亮度分析、对比度分析、文本清晰度分析等,本实施例对此不进行限定。

S203、对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域,所述第一图像质量阈值大于所述第二图像质量阈值。

通过对所述最后一帧图像相邻的上一帧图像进行图像质量分析,可以选择出靠近采集起始侧且图像质量较高的区域作为待拼接区域,也可以提高后续步骤S204中将像素进行比对时的准确率。

另外,本申请实施例中,由于第一图像质量阈值大于第二图像质量阈值,可以使得确定出的待拼接区域的面积大于目标区域的面积,以保证在将所述目标区域中的像素与所述待拼接区域的像素进行比对时,可以从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域。

第一图像阈值和第二图像阈值本领域的技术人员可以根据需求确定,只要能够保证待拼接区域中存在与目标区域像素分布相同的拼接区域即可。

S204、将所述目标区域中的像素,与所述待拼接区域的像素进行比对,从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域。

另外,由于目标区域和拼接区域均靠近采集起始侧,使得将最后一帧图像与相邻的上一帧图像进行拼接后,最后一帧图像可以较为完整地占据拼接图像的尾部。具体进行像素比对的方法可参考相关技术,在此不再赘述。

S205、基于所述目标区域和所述拼接区域,将所述最后一帧图像和所述相邻的上一帧图像进行拼接,获得拼接图像。

针对多帧待识别文本图像中的最后一帧图像,可以将最后一帧图像中采集起始侧的目标区域的像素与相邻的上一帧图像的待拼接区域进行匹配,确定相邻的上一帧图像中与目标区域的像素匹配的拼接区域,并据此进行图像拼接。

示例地,以词典笔从左向右采集多帧待识别文本图像为例,针对多帧待识别文本图像中的最后一帧图像,可以基于最后一帧图像左侧的目标区域的像素与相邻的上一帧图像的待拼接区域的像素的对应关系确定出拼接区域,将最后一帧图像中目标区域及右侧至少一半区域与相邻的上一帧图像进行拼接,使得得到的拼接图像中,最后一帧图像可以较为完整地保留在拼接图像的右侧。

另外需要说明的是,本实施例中,可以先将多帧待识别文本图像按照顺序进行拼接,在拼接至最后一帧图像时执行上述步骤S202;或者,也可以不按照顺序进行拼接而直接执行上述步骤S202,此时,针对除最后一帧图像之外的任意两帧相邻的图像,可以将多帧图像中任意一帧图像的像素与相邻的上一帧图像进行比对,从而确定两帧图像中像素分布相同的区域,在确定出所有任意相邻的两帧图像中像素分布相同的区域后,可以将连续多帧图像进行拼接,获得拼接图像。

拼接图像的方法可参考相关技术,本实施例对此不进行限定。

S206、获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符;

本实施例中,通过对拼接图像进行文本识别,可以获得拼接图像对应的多个第一待处理字符,以及各个第一待处理字符在拼接图像中的位置信息,例如,可以得到各个第一待处理字符相对于拼接图像的左侧边沿的偏置距离。

本实施例中,通过对最后一帧图像进行文本识别,可以得到最后一帧图像对应的第二待处理字符。

具体进行文本识别的方法可参考相关技术,在此不再赘述。

S207、根据所述位置信息,及所述第二待处理字符与所述多个第一待处理字符之间的关系,对所述多个第一待处理字符进行删除处理。

由于在上述步骤S202-S205中,在拼接最后一帧图像时,可以保证最后一帧图像可以较为完整地保留在拼接图像的尾部,因此,拼接图像对应的第一待处理字符与最后一帧图像对应的第二待处理字符的位置匹配程度较高,由此,可以尽量减少由于图像中的字符形变导致的位置误差,提高了精度;并且,本申请提供的方案基于位置信息对所述多个第一待处理字符进行删除处理,因此当第一待处理字符存在多行时,也不会出现错误的情况。

示例地,本实施例中,若最后一帧图像对应有第二待处理字符,则可以根据各个第一待处理字符在拼接字符中的位置信息,将位置信息与最后一帧图像对应的第一待处理字符删除,避免了进行其他匹配引入的误差,提高了精度。

下面通过一具体实现场景,对本申请的方案进行示例性说明。

参见图2B,展示了采集到的连续多帧待识别文本图像,多帧待识别文本图像可以按照从左到右的顺序采集得到;

将多帧待识别文本图像进行拼接后可以得到拼接图像。在具体进行拼接时,尤其是针对最后一帧图像进行拼接时,可以根据最后一帧图像左侧的目标区域与相邻的上一帧图像中靠近左侧的拼接区域进行拼接得到拼接图像,使得最后一帧图像较为完整地占据拼接图像的尾部,拼接图像中与最后一帧图像对应为图2B中的线框内的部分。

之后可以针对拼接图像和最后一帧图像进行文本识别,得到拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符。位置信息具体为第一待处理字符距离拼接图像左侧边沿的位置偏执,图2B示例性示出了部分第一待处理字符在拼接图像中的位置信息,例如字符“ina.ch”分别对应的位置信息为285、315、351、381、424、463。

通过对最后一帧图像进行文字识别,可以确定最后一帧图像中是否对应有待处理字符,若对应有待处理字符,可以根据位置信息,将位置信息与最后一帧图像对应的第一待处理字符删除,删除后的第一待处理字符可以包括“I love china.”,得到删除后的第一待处理字符后,可以确定删除后的第一待处理字符对应的翻译、释义等,并可以进行展示。

本实施例提供的方案,通过获取连续的多帧待识别文本图像;对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域;对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域,所述第一图像质量阈值大于所述第二图像质量阈值,由此,可以从最后一帧图像中靠近图像采集起始侧的一侧,确定出图像质量较高的目标区域,并从最后一帧图像相邻的上一帧图像中确定出图像质量较高的待拼接区域,并通过保证第一图像阈值大于第二图像阈值,使得待拼接图像区域的面积大于目标区域的面积,从而在将所述目标区域中的像素,与所述待拼接区域的像素进行比对时,可以从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域;基于所述目标区域和所述拼接区域,将所述最后一帧图像和所述相邻的上一帧图像进行拼接,获得拼接图像,由此,可以保证最后一帧图像较为完整地保留在拼接图像的尾部;之后获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符,由于最后一帧图像较为完整地保留在拼接图像的尾部,因此,拼接图像对应的第一待处理字符与最后一帧图像对应的第二待处理字符的位置匹配程度较高,由此,可以尽量减少由于图像中的字符形变导致的位置误差,尤其可以提高拼接图像中与最后一帧图像对应的部分第一待处理字符的位置误差,使得根据所述位置信息,及所述第二待处理字符与所述多个第一待处理字符之间的关系,对所述多个第一待处理字符进行删除处理时的误差较小,提高了精度;并且,本申请提供的方案基于位置信息对所述多个第一待处理字符进行删除处理,因此当第一待处理字符存在多行时,也不会出现错误的情况。

本实施例的图像处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。

图3A为本申请实施例提供的一种图像处理方法的步骤流程图,如图所示,其包括:

S301、获取连续的多帧待识别文本图像。

S302、将第二帧图像及倒数第二帧图像依次确定为待拼接图像,确定待拼接图像中的目标区域以及待拼接图像相邻的上一帧图像中与目标区域像素分布相同的拼接区域。

可选地,本申请实施例中,针对任意待拼接图像,可以对待拼接图像进行图像质量分析,将靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域,并可以对待拼接图像的相邻上一帧图像进行图像质量分析,将靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域;将所述目标区域中的像素,与所述待拼接区域的像素进行比对,从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域。

具体确定目标区域和拼接区域的方法可参考上述实施例,在此不再赘述。

参见图3B,图3B中的右侧区域为待拼接图像,左侧为与其相邻的上一帧图像,右侧区域中的方框示出了一种目标区域的示意图。

S303、对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域。

需要说明的是,针对上述步骤S302中确定出的目标区域的方法和针对最后一帧图像中确定出目标区域的方法相同。

可选地,本实施例中,步骤S303可以包括:对所述最后一帧图像中靠近采集起始侧的至少一半图像区域进行图像质量分析;根据图像质量分析结果,从所述最后一帧图像中靠近采集起始侧的至少一半图像区域中,确定图像质量大于所述第一图像阈值的区域作为所述目标区域。由此,可以选择出图像质量较高的目标区域进行匹配,提高匹配的准确率,并通过选择靠近采集起始侧的至少一半图像区域进行分析,与对整帧图像进行图像质量分析相比,减少了图像质量分析耗费的资源量。

可选地,本实施例中,所述图像质量分析包括所述图像质量分析包括以下至少之一:亮度分析、形变分析、亮度均匀性分析、对比度分析、信噪比分析、清晰度分析。对应地,所述第一图像阈值包括以下至少之一:第一亮度阈值、第一形变阈值、第一亮度均匀度阈值、第一对比度阈值、第一信噪比阈值、第一分辨率阈值;对应地,所述第二图像阈值包括以下至少之一:第二亮度阈值、第二形变阈值、第二亮度均匀度阈值、第二对比度阈值、第二信噪比阈值、第二分辨率阈值。由于通过词典笔进行采集的过程中,摄像头会与被采集的表面成一定角度,例如45度,导致拍摄出来的图像中的内容会存在形变,则本实施例中,优选至少根据亮度分析和形变分析作为图像质量分析,提高了确定出的目标区域的质量。

亮度分析

一般情况下,通过词典笔采集的图像一般为白底黑字的图像,因此,进行亮度分析时主要分析某一图像区域中白底的亮度作为该图像区域的亮度。

形变分析

进行形变分析时,可以主要分析垂直于采集方向上的形变程度,当然,也可以分析平行于采集方向上的形变程度,这也在本申请的保护范围内。

亮度均匀性分析

针对某一图像区域,可以采集图像区域中各个像素点的亮度,计算亮度的方差,将方差结果作为亮度均匀性分析结果;或者,可以计算各个像素点的亮度与图像区域中的最高亮度或者最低亮度之间的偏差,并将偏差结果作为亮度均匀性分析结果。

对比度分析

针对某一图像区域,可以采集图像区域中各个像素点的亮度,并根据亮度计算图像区域的对比度。例如,将不同颜色的亮度值的平均值进行差值计算,确定图像区域的对比度。

信噪比分析

进行信噪比分析时,可以使用词典笔的摄像头采集具有单一颜色填充的图像,并基于采集得到的图像,针对某一图像区域计算信噪比。并且,可以扫描具有不同单一颜色填充的图像,分别基于扫描到的图像计算同一图像区域的信噪比,得到最终的信噪比分析结果。

清晰度分析

进行清晰度分析时,可以使用词典笔的摄像头采集具有单一方向线条的图像,并基于采集得到的图像,判断线条是否能够被区分出。并且,可以扫描具有不同粗细或者间距的单一方向线条的图像,分别基于扫描到的图像判断线条是否能够被区分出,得到最终的清晰度分析结果。

此外,针对词典笔,还可以进行灰阶测试和收敛测试。

灰阶测试

进行灰阶测试时,可以使用词典笔的摄像头采集具有多行色彩方框的图像,并基于采集得到的图像,判断色彩方框是否能够被区分出,得到灰阶测试结果。

收敛测试

进行收敛测试时,可以使用词典笔的摄像头采集上半部分为黑底白字、下半部分为白底黑字的图像,并基于采集得到的图像确定曝光稳定帧数,根据帧数得到收敛测试结果。

S304、对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域。

需要说明的是,针对上述步骤S302中确定出的待拼接区域的方法和针对最后一帧图像中确定出待拼接区域的方法相同。

S305、将所述目标区域中的像素,与所述待拼接区域的像素进行比对,从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域。

具体地,本实施例中,可以从上一帧图像中确定出待拼接区域,待拼接区域的面积大于目标区域,待拼接区域具体如图3B左侧的方框所示。之后可以将待拼接区域中确定与目标区域相同的滑动窗口,并比对目标区域的像素和滑动窗口的像素,以通过滑动窗口从待拼接区域中确定出与目标区域匹配的区域作为拼接区域。

S306、基于所述目标区域和所述拼接区域,进行图像拼接,获得所述拼接图像。

可选地,本实施例中,步骤S305可以包括:以所述目标区域的中心线和所述拼接区域的中心线为拼接位置,将所述最后一帧图像和所述相邻的上一帧图像进行拼接。具体地,中心线可以参考图3B中的拼接区域和目标区域的竖直中心线所示。由于中心线位置的形变一般最小,因此,通过将中心线作为拼接位置,可以提高拼接图像的图像质量。

当然,需要说明的是,拼接除最后一帧图像之外的其他相邻两帧图像时,也可以采用上述方式,当然,也可以采用其他方式,本实施例对此不进行限定。

可选地,步骤S306之前,所述方法还可以包括:对所述目标区域和所述拼接区域进行图像亮度预处理和/或图像跳变预处理。由此,可以保证拼接图像不会发生亮度跳变或者图像内容跳变等情况,提高了拼接图像的质量。具体进行图像亮度预处理和/或图像跳变预处理的方法可参考相关技术,在此不再赘述。

S307、对所述拼接图像进行文本识别,获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息。

S308、对所述最后一帧图像进行文本识别,获得最后一帧图像对应的第二待处理字符。

S309、判断第二待处理字符是否为空。

S310、若所述第二待处理字符不为空字符,则根据所述位置信息,将所述第一待处理字符中与所述第二待处理字符位置对应的字符删除。

可选地,本申请实施例中,所述第一待处理字符在所述拼接图像中的位置信息包括:各所述第一待处理字符相对于所述拼接图像的采集起始侧的边沿的位置偏移,对应地,步骤S309可以包括:确定所述拼接图像在采集方向上的第一图像长度,以及所述最后一帧图像在采集方向上的第二图像长度,计算所述第一图像长度和所述第二图像长度的差值,得到所述最后一帧图像对应的距离阈值;将所述位置偏移大于所述距离阈值的所述第一待处理字符删除。

示例地,参见图3C,本实施例中当采集方向为从左向右时,距离阈值=拼接图像在水平方向上的总长度(第一图像长度)-最后一帧图像在水平方向上的长度(第二图像长度),长度具体可以为像素值。当然,若采集方向为从上至下或者斜向,则采用对应方向上的第一图像长度和第二图像长度进行计算,这也在本申请的保护范围内。

S311、若所述第二待处理字符为空字符,则将所述多个第一待处理字符全部保留。

参见图3D,第二待处理字符为空字符,表示最后一帧图像可能为空白的书面,空白书面的有效信息较少,在拼接时位置极易发生偏差,导致最后一帧图像的位置不准确。图3D上方为拼接前的连续多帧待识别文本图像,图3D中间为期望的拼接图像,图3D下方为真实的拼接图像,图3D的中间和下方的拼接图像中的虚线对应最后一帧图像,如图3D所示,真实的拼接图像中最后一帧图像的位置不准确。为此,本实施例中,只有第二待处理字符不为空字符时才对第一待处理字符进行字符删除,第二待处理字符为空字符时,可以将第一待处理字符全部保留。

图4为本申请实施例提供一种词典笔的结构示意图,如图所示,其包括:图像采集装置401、处理器402、输出装置403。图像采集装置401可以为摄像头等任意具有图像采集功能的设备;输出装置可以包括但不限于以下至少一个:显示器、扬声器。

所述图像采集装置401,用于采集连续的多帧待识别文本图像。

所述处理器402,用于对所述多帧待识别文本图像中的最后一帧图像进行图像质量分析,将所述最后一帧图像中靠近采集起始侧且图像质量大于第一图像阈值的区域确定为目标区域;对所述最后一帧图像相邻的上一帧图像进行图像质量分析,将所述相邻的上一帧图像中靠近采集起始侧且图像质量大于第二图像阈值的区域确定为待拼接区域,所述第一图像质量阈值大于所述第二图像质量阈值;将所述目标区域中的像素,与所述待拼接区域的像素进行比对,从所述待拼接区域中确定出与所述目标区域的像素分布相同的拼接区域;基于所述目标区域和所述拼接区域,将所述最后一帧图像和所述相邻的上一帧图像进行拼接,获得拼接图像;获得所述拼接图像对应的多个第一待处理字符以及各所述第一待处理字符在所述拼接图像中的位置信息,以及所述最后一帧图像对应的第二待处理字符;根据所述位置信息,及所述第二待处理字符与所述多个第一待处理字符之间的关系,对所述多个第一待处理字符进行删除处理得到处理后字符,并根据所述处理后字符确定对应的输出内容。

所述输出装置403用于输出所述输出内容。

可选地,本实施例中,词典笔还包括存储器,用于存储知识库,所述处理器具体用于根据所述处理后字符在所述知识库中进行查询,根据查询结果确定对应的输出内容。知识库可以为任意知识库,例如双语词典、唐诗三百首等。本实施例对此不进行限定。

参照图5,示出了本申请实施例提供的一种电子设备的结构示意图,本申请具体实施例并不对电子设备的具体实现做限定。

如图5所示,该电子设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、、通信总线508、图像采集装置510、输出装置512。

其中:

处理器502、通信接口504、存储器506、图像采集装置510以及输出装置512通过通信总线508完成相互间的通信。

图像采集装置510,用于采集连续的多帧待识别文本图像。图像采集装置510可以为摄像头等。

通信接口504,用于与其它电子设备或服务器进行通信。

处理器502,用于执行程序514,具体可以针对多帧待识别文本图像执行上述图像处理方法实施例中的相关步骤,并确定输出内容。

输出装置512用于输出所述输出内容。输出装置512可以为显示器或者扬声器等。

具体地,程序514可以包括程序代码,该程序代码包括计算机操作指令。

处理器502可能是CPU(central processing unit),或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。

存储器506,用于存放程序514。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序514中各步骤的具体实现可以参见上述图像处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。

本申请实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述多个方法实施例中的任一图像处理方法。

本申请实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一图像处理方法对应的操作。

需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。

上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的图像处理方法。此外,当通用计算机访问用于实现在此示出的图像处理方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的图像处理方法的专用计算机。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。

以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。

技术分类

06120115576612