掌桥专利:专业的专利平台
掌桥专利
首页

一种扫描打印方法、装置、设备及存储介质

文献发布时间:2023-06-19 13:29:16


一种扫描打印方法、装置、设备及存储介质

技术领域

本发明实施例涉及扫描笔技术领域,尤其涉及一种扫描打印方法、装置、设备及存储介质。

背景技术

传统的词典产品都需要手动输入单词进行查询,查词效率低。近年来,机器扫描识别文字在多种多样的场景和设备上应用,结合扫描识别和查询功能,目前出现了一些基于OCR技术的词典笔,扫描笔可以实现对纸质文本或图像的扫描并查询对应内容,查询到的词典内容只能在词典笔的显示屏中查看,或者朗读查询的内容,按一般用户使用习惯,只会浏览或听取一遍查到的词典内容,存在不符合长期积累记忆习惯,也不便于用户在学习和办公时进行笔记记录的问题。

发明内容

本发明提供一种扫描打印方法、装置、设备及存储介质,以实现集精准扫描识别、内容查询及打印于一体,并且有利于用户进行长期积累和笔记记录的效果。

第一方面,本发明实施例提供了一种扫描打印方法,该方法基于一种扫描打印装置实现,所述扫描打印装置包括图像获取模块、图像处理模块、图像显示模块、控制模块和与之连接的打印机;所述扫描打印方法包括:

扫描目标文档的预设区域,获取目标图像;

将所述目标图像经过OCR文字识别处理,获取识别的目标文字;

将所述目标文字在词典笔的显示屏上进行显示;

对所述目标文字进行排版并生成目标位图,并将所述目标位图发送至与所述词典笔连接的打印机进行打印。

可选的,所述扫描目标文档的预设区域,获取目标图像,包括:

以预设参数采集所述目标文档的预设区域的图像数据,得到多幅采集图像;

对所述采集图像进行剪裁操作,得到对应的剪裁图像;

将所述剪裁图像进行拼接处理,得到所述目标图像。

可选的,所述对所述采集图像进行剪裁操作,得到对应的剪裁图像,包括:

获取所述采集图像的点阵数据的坐标数据,将所述点阵数据的纵坐标的中间位置确定为剪裁的横向坐标轴;

对所述采集图像沿着所述横向坐标轴从左往右进行扫描,当获取的数据首次不为零时,确定对应的第一位置,根据所述第一位置和目标裁剪高度确定所述剪裁图像的左边界;

根据所述左边界和目标裁剪宽度得到所述剪裁图像的右边界;

根据所述第一位置和目标裁剪高度分别得到所述剪裁图像的上边界和下边界;

根据所述左边界、所述右边界、所述上边界和所述下边界对所述采集图像进行剪裁得到所述裁剪图像。

可选的,所述将所述剪裁图像进行拼接处理,得到所述目标图像包括:

将所述剪裁图像进行拼接处理,得到没有特征重叠部分的目标图像;所述拼接处理包括特剪裁图像的征点提取与匹配、图像配准和图像融合。

可选的,在所述将所述目标图像经过OCR文字识别处理,获取识别的目标文字之后,还包括:

将所述目标图像经过OCR文字识别处理得到识别文字;

确定所述识别文字的文字类型;

根据所述文字类型选择对应的预装词典资源数据,并在所述预装词典资源数据查找得到所述目标文字。

可选的,所述对所述目标文字进行排版并生成目标位图,并将所述目标位图发送至与所述词典笔蓝牙连接的打印机进行打印,包括:

判断所述词典笔是否与对应的打印机通过蓝牙连接;

若是,则根据所述打印机的打印协议将所述目标文字进行重新排版,生成目标位图并发送至所述打印机进行打印;

若否,则所述词典笔尝试重新连接所述打印机。

可选的,所述根据所述打印机的打印协议将所述目标文字进行重新排版,生成目标位图并发送至所述打印机,包括:

对所述目标文字进行重新排版生成原始位图;

根据所述打印机的打印协议调整所述原始位图的尺寸,并进行灰度化处理,生成灰度位图;

根据所述灰度位图每个像素点确定对应的打印位图;

将所述打印位图的头部加上协议头生成所述目标位图;

发送所述目标位图至所述打印机进行打印。

第二方面,本发明实施例还提供了一种扫描打印装置,包括:

图像获取模块,用于扫描目标文档的预设区域,获取目标图像;

图像处理模块,用于将所述目标图像经过OCR文字识别处理,获取识别的目标文字;

图像显示模块,用于将所述目标文字在词典笔的显示屏上进行显示;

控制模块,用于对所述目标文字进行排版并生成目标位图,并将所述目标位图发送至与所述词典笔蓝牙连接的打印机进行打印。

第三方面,本发明实施例还提供了一种扫描打印设备,所述设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

摄像头,用于扫描目标文档的预设区域;

打印机,用于打印目标位图;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一所述的扫描打印方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一所述的扫描打印方法。

本发明通过扫描目标文档的预设区域,获取目标图像,将目标图像经过OCR文字识别处理,获取识别的目标文字;将目标文字在词典笔的显示屏上进行显示;对目标文字进行排版并生成目标位图,并将目标位图发送至与词典笔蓝牙连接的打印机进行打印,解决查询到的词典内容只能通过显示屏查显示或朗读,造成的不符合长期积累和不便于笔记记录的问题,实现集精准扫描识别、内容查询及打印于一体,并且有利于用户进行长期积累和笔记记录的效果。

附图说明

图1为本发明实施例一提供的一种扫描打印方法的流程示意图;

图2为本发明实施例一提供的一种扫描打印方法的子流程示意图;

图3为本发明实施例一提供的一种扫描打印方法的子流程示意图;

图4为本发明实施例二提供的一种扫描打印装置的结构示意图;

图5为本发明实施例三提供的一种扫描打印设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种扫描打印方法的流程示意图,本实施例可适用于扫描识别纸面文字进行查询、学习和记录笔记的情况,该方法可以由一种扫描打印装置来执行,具体包括如下步骤:

步骤110、扫描目标文档的预设区域,获取目标图像。

词典笔包括摄像头,在用户使用词典笔在文档上滑动时,摄像头拍摄预设区域内的画面,通过处理得到目标图像。在摄像头扫描目标文档的预设区域获取目标图像过程中,具体包括以下步骤:

步骤111、以预设参数采集所述目标文档的预设区域的图像数据,得到多幅采集图像。

词典笔的摄像头以120fps的频率采集目标文档的预设区域的图像数据,生成多幅采集图像,采集图像大小为128*96,保证词典笔在快速扫描预设区域时,获取到足够的图像数据,同时数据量又不会过大。高帧率的图像采集,只获取使用到的数据部分,有利于提高数据的获取速度,以及快速扫描时掉帧数据不足导致识别不准的问题。

其中,采集图像为YUV格式像素,如果要变成灰度图像,每一帧图像数据都只需要获取Y分量值,将U、V分别默认设置为128,Y表示亮度分量,U和V表示色度分量,因为U、V是图像经过偏置处理的色度分量,色度分量在偏置处理前的取值范围为-128至127,此时的无色对应的0值。生成YUV格式的灰度图像,有利于提高摄像头数据的采集速度。

步骤112、对所述采集图像进行剪裁操作,得到对应的剪裁图像。

采集图像可能存在阴影、黑边及图像要素不居中等问题,为了保证后续文字识别的准确性,需要对采集图像进行校正裁剪操作,得到对应的裁剪图像。其中,词典笔需要采用动态校正技术首先对摄像头进行校正,然后对采集图像进行裁剪操作,具体包括:

S1、获取所述采集图像的点阵数据的坐标数据,将所述点阵数据的纵坐标的中间位置确定为剪裁的横向坐标轴。

在确定采集图像的裁剪区域时,要先获取裁剪区域的坐标轴从而确定裁剪区域的边界线。获取采集图像的点阵数据的坐标数据,并根据点阵数据纵坐标的中间位置确定为剪裁的横向坐标轴,横向坐标轴也为裁剪区域的中轴线。

S2、对所述采集图像沿着所述横向坐标轴从左往右进行扫描,当获取的数据首次不为零时,确定对应的第一位置,根据所述第一位置和目标裁剪高度确定所述剪裁图像的左边界。

对采集图像沿着横向坐标轴从左往右进行扫描,由于采集图像为YUV格式的灰度图,采集图像上空白处的数据为0,当获取的数据首次不为零时,记此数据为第一数据,根据第一数据确定对应的第一位置,第一位置为第一数据所在列与横向坐标轴的交点;因此将第一位置所处的列作为左边界,裁剪区域由目标裁剪高度和目标裁剪宽度构成,左边界的范围根据第一位置和目标裁剪高度确定。进一步的,左边界的横坐标加上需要裁剪的目标宽必须要小于等于原始图片的宽,否则无法进行裁剪。

S3、根据所述左边界和目标裁剪宽度得到所述剪裁图像的右边界。

从左边界处沿着横向坐标轴的方向移动目标裁剪宽度得到剪裁图像的右边界。

S4、根据所述第一位置和目标裁剪高度分别得到所述剪裁图像的上边界和下边界。

根据第一位置沿着垂直于横向坐标轴的方向向上移动目标裁剪高度的一半得到剪裁图像的上边界,根据第一位置沿着垂直于横向坐标轴的方向向下移动目标裁剪高度的一半得到剪裁图像的下边界。

S5、根据所述左边界、所述右边界、所述上边界和所述下边界对所述采集图像进行剪裁得到所述裁剪图像。

由左边界、右边界、上边界和下边界构成的封闭区间对采集图像进行裁剪,得到裁剪图像。

经过对词典笔的摄像头的校正,可以确保采集图像数据完整方正,不包含干扰识别的部分,确保目标图像包含数据的有效性和完整性。

步骤113、将所述剪裁图像进行拼接处理,得到所述目标图像。

将多个裁剪图像进行征点提取与匹配、图像配准和图像融合等拼接处理,得到没有特征重叠部分的目标图像。

步骤120、将所述目标图像经过OCR文字识别处理,获取识别的目标文字。

步骤120具体包括:

步骤121、将所述目标图像经过OCR文字识别处理得到识别文字。

OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。通过OCR文字识别处理得到目标图像上完整的识别文字。通过以上处理步骤可以提高词典笔扫描文字内容获取准确度。

步骤122、确定所述识别文字的文字类型。

识别文字可以为中文字符也可以为英文字符,则预设的文字类型包括:中文类型和英文类型。需要先判定文字类型再查询预存内容确定识别文字的含义及扩展内容。

步骤123、根据所述文字类型选择对应的预装词典资源数据,并在所述预装词典资源数据查找得到所述目标文字。

预装词典资源包括中文词典资源数据和英文词典资源数据。当识别文字的文字类型为中文类型时,则按中文类型优先查询中文词典资源数据;当识别文字的文字类型为英文类型时,则按英文类型优先查询英文词典资源数据。根据识别文字和文字类型查询查找得到目标文字,目标文字包括识别文字及相关的解释内容和扩展内容;示例性的,识别文字为一句古诗词,则优先在中文词典资源数据中进行查询,查询到的目标文字为对应的整首古诗词的内容及解析;示例性的,识别文字为英文单词,则优先在英文词典资源数据中进行查询,查询到的目标文字可以为英文单词的释义、读音、相近词、相反词、造句及有关名人名言等扩展内容。按照文字类型优先查询对应的预装词典资源数据,减小查询的范围,提高查询速度。

步骤130、将所述目标文字在词典笔的显示屏上进行显示。

将查询得到的目标文字在词典笔的显示屏上进行显示,按预设频率滚动显示,进一步的,可以进行同步语音播报。

步骤140、对所述目标文字进行排版并生成目标位图,并将所述目标位图发送至与所述词典笔连接的打印机进行打印。

在查询到目标文字后,用户不仅可以通过词典笔的显示屏查看和语音播报,还可以通过与词典笔蓝牙连接的打印机进行打印,作为笔记进行保存,便于用户记忆。

具体包括:

步骤141、判断所述词典笔是否与对应的打印机通过蓝牙连接。若判断结果为是,则执行步骤142;若判断结果为都,则执行步骤143。

词典笔内置有蓝牙模块,与词典笔连接的打印机为随身蓝牙阴极,词典笔和打印机均支持蓝牙4.0BLE协议,词典笔可通过蓝牙连接打印机的蓝牙进行数据传输连接方式支持蓝牙BLE4.0,在查询到目标文字后,在词典笔的显示屏幕上显示打印入口,用户可根据个人需求进行选择是否进行打印。

步骤142、根据所述打印机的打印协议将所述目标文字进行重新排版,生成目标位图并发送至所述打印机进行打印。

若词典笔与对应的打印机已通过蓝牙连接时,词典笔需要将目标文字按打印协议将其转化为打印机能够识别和打印的目标位图,再将目标位图发送至打印机进行打印。

具体包括:

a、对所述目标文字进行重新排版生成原始位图。

b、根据所述打印机的打印协议调整所述原始位图的尺寸,并进行灰度化处理,生成灰度位图。

c、根据所述灰度位图每个像素点确定对应的打印位图。

d、将所述打印位图的头部加上协议头生成所述目标位图。

e、发送所述目标位图至所述打印机进行打印。

在确定词典笔与打印机处于连接状态时,词典笔将目标文字重新排版生成原始位图,当原始位图的宽度大于蓝牙打印机支持的打印宽度时,需要对原始位图的尺寸进行调整,按蓝牙打印机支撑的打印宽度将原始位图进行缩放;当原始位图的宽度小于等于蓝牙打印机支持的打印宽度时,不作调整。在根据原始位图生成灰度位图后,还需要判断灰度位图上的每个像素点是否需要打印,将需要打印的像素点保存为1,将不需要打印的像素点保存为0,从而生成打印位图。打印位图不能被蓝牙打印机直接识别,还需在打印位图的头部加上协议头生成最终打印机可以识别的目标位图,从而发送至打印机进行打印。

步骤143、所述词典笔尝试重新连接所述打印机。

若词典笔与对应的打印机未通过蓝牙连接时,词典笔需要重新尝试连接打印机,若尝试连接预设次数后,词典笔还未与对应打印机连接上,则需要重新搜索对应的打印机。

词典笔的显示屏幕上设置有搜索按钮、连接按钮和查看按钮,搜索按钮用于搜索可用的蓝牙打印机,连接按钮用于连接可用的蓝牙打印机,查看按钮用于查看连着的蓝牙打印机的当前状态。

本实施例的技术方案,通过扫描目标文档的预设区域,获取目标图像,经过对词典笔的摄像头的校准剪裁,可以确保采集图像数据完整方正,不包含干扰识别的部分,获得更准确的目标图像,将目标图像经过OCR文字识别处理,获取识别的目标文字;将目标文字在词典笔的显示屏上进行显示;对目标文字进行排版并生成目标位图,并将目标位图发送至与词典笔蓝牙连接的打印机进行打印,解决查询到的词典内容只能通过显示屏查显示或朗读,造成的不符合长期积累和不便于笔记记录的问题,实现集精准扫描识别、内容查询及打印于一体,适用于随时打印的使用场景,有利于用户进行长期积累和笔记记录的效果。

在上述技术方案的基础上,进一步的,词典笔的显示屏幕上还包括收藏按钮,点击收藏按钮可进入收藏界面,对收藏内容可以选择发送至连接的打印机进行打印。便于用户在词典笔未连接蓝牙打印机时先进行收藏保存,在连接蓝牙打印机后再进行打印,扩展了适用范围,提高用户使用的便利性。

实施例二

图4为本发明实施例二提供的一种扫描打印装置的结构示意图,如图4所示,一种扫描打印装置,包括:

图像获取模块210,用于扫描目标文档的预设区域,获取目标图像。

词典笔包括摄像头,在用户使用词典笔在文档上滑动时,摄像头拍摄预设区域内的画面,通过处理得到目标图像。

进一步的,图像获取模块210包括:

采集图像获取单元,用于以预设参数采集所述目标文档的预设区域的图像数据,得到多幅采集图像。

裁剪图像获取单元,用于对所述采集图像进行剪裁操作,得到对应的剪裁图像。

坐标轴确定子单元,用于获取所述采集图像的点阵数据的坐标数据,将所述点阵数据的纵坐标的中间位置确定为剪裁的横向坐标轴。

剪裁左边界获取子单元,用于对所述采集图像沿着所述横向坐标轴从左往右进行扫描,当获取的数据首次不为零时,确定对应的第一位置,根据所述第一位置和目标裁剪高度确定所述剪裁图像的左边界。

裁剪有边界获取子单元,用于根据所述左边界和目标裁剪宽度得到所述剪裁图像的右边界。

裁剪上下边界获取子单元,用于根据所述第一位置和目标裁剪高度分别得到所述剪裁图像的上边界和下边界。

裁剪子单元,用于根据所述左边界、所述右边界、所述上边界和所述下边界对所述采集图像进行剪裁得到所述裁剪图像。

拼接子单元,用于将所述剪裁图像进行拼接处理,得到所述目标图像。

图像处理模块220,用于将所述目标图像经过OCR文字识别处理,获取识别的目标文字。

图像处理模块220具体包括:

识别单元,用于将所述目标图像经过OCR文字识别处理得到识别文字。

文字类型确定单元,用于确定所述识别文字的文字类型。

目标文字查找单元,用于根据所述文字类型选择对应的预装词典资源数据,并在所述预装词典资源数据查找得到所述目标文字。

图像显示模块230,用于将所述目标文字在词典笔的显示屏上进行显示。

将查询得到的目标文字在词典笔的显示屏上进行显示,按预设频率滚动显示,进一步的,可以进行同步语音播报。

控制模块240,用于对所述目标文字进行排版并生成目标位图,并将所述目标位图发送至与所述词典笔蓝牙连接的打印机进行打印。

在查询到目标文字后,用户不仅可以通过词典笔的显示屏查看和语音播报,还可以通过与词典笔蓝牙连接的打印机进行打印,作为笔记进行保存,便于用户记忆。

进一步的,控制模块240包括:

连接判断单元,用于判断所述词典笔是否与对应的打印机通过蓝牙连接。

打印执行单元,用于若判断结果为是,则根据所述打印机的打印协议将所述目标文字进行重新排版,生成目标位图并发送至所述打印机进行打印。

排版子单元,用于对所述目标文字进行重新排版生成原始位图。

调整子单元,用于根据所述打印机的打印协议调整所述原始位图的尺寸,并进行灰度化处理,生成灰度位图。

打印点确定子单元,用于根据所述灰度位图每个像素点确定对应的打印位图。

协议头添加子单元,用于将所述打印位图的头部加上协议头生成所述目标位图。

发送子单元,用于发送所述目标位图至所述打印机进行打印。

重连单元,用于若判断结果为否,则所述词典笔尝试重新连接所述打印机。

本实施例的技术方案,通过扫描目标文档的预设区域,获取目标图像,经过对词典笔的摄像头的校准剪裁,可以确保采集图像数据完整方正,不包含干扰识别的部分,获得更准确的目标图像,将目标图像经过OCR文字识别处理,获取识别的目标文字;将目标文字在词典笔的显示屏上进行显示;对目标文字进行排版并生成目标位图,并将目标位图发送至与词典笔蓝牙连接的打印机进行打印,解决查询到的词典内容只能通过显示屏查显示或朗读,造成的不符合长期积累和不便于笔记记录的问题,实现集精准扫描识别、内容查询及打印于一体,适用于随时打印的使用场景,有利于用户进行长期积累和笔记记录的效果。

本发明实施例所提供的扫描打印装置可执行本发明任意实施例所提供的扫描打印方法,具备执行方法相应的功能模块和有益效果。

实施例三

图5为本发明实施例三提供的一种扫描打印设备的结构示意图,如图5所示,该扫描打印设备包括处理器30、存储器31、输入装置32和输出装置33;扫描打印设备中处理器30的数量可以是一个或多个,图5中以一个处理器30为例;扫描打印设备中的处理器30、存储器31、输入装置32和输出装置33可以通过总线或其他方式连接,图5中以通过总线连接为例。

存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的扫描打印方法对应的程序指令/模块(例如,扫描打印装置中的图像获取模块210、图像处理模块220、图像显示模块230和控制模块240)。处理器30通过运行存储在存储器31中的软件程序、指令以及模块,从而执行扫描打印设备的各种功能应用以及数据处理,即实现上述的扫描打印方法。

存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器30远程设置的存储器,这些远程存储器可以通过网络连接至扫描打印设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置32可用于接收输入的数字或字符信息,以及产生与扫描打印设备的用户设置以及功能控制有关的键信号输入。输出装置33可包括显示屏等显示设备。

实施例四

本发明实施例四还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种扫描打印方法,该方法包括:

扫描目标文档的预设区域,获取目标图像;

将所述目标图像经过OCR文字识别处理,获取识别的目标文字;

将所述目标文字在词典笔的显示屏上进行显示;

对所述目标文字进行排版并生成目标位图,并将所述目标位图发送至与所述词典笔连接的打印机进行打印。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的扫描打印方法中的相关操作。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是,上述扫描打印装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

相关技术
  • 一种三维打印扫描方法、可读存储介质及三维打印扫描控制设备
  • 三维打印扫描方法、可读存储介质及三维打印扫描控制设备
技术分类

06120113692531