掌桥专利:专业的专利平台
掌桥专利
首页

一种文字反向定位图片的方法及装置、计算机储存介质

文献发布时间:2023-06-19 09:30:39


一种文字反向定位图片的方法及装置、计算机储存介质

技术领域

本发明涉及文书定位领域,尤其涉及一种文字反向定位图片的方法及装置、计算机储存介质。

背景技术

司法文书是指侦查、检察、审判、公证等司法机关在处理各类案件的各个环节、步骤上形成与使用的专用文书。主要包括具有法律效力的文书,如判决书、裁定书等;也包括不直接发生法律效力,但对执行法律有切实保证作用的文书,如判决书等。司法文书的数量多,且文本的形式为非结构化,通常采用文字反向定位图片技术,但现有文字反向定位图片的方法存在以下几个方面的问题:

(1)只能定位到单张图片,无法跨图片定位选中。

(2)编辑器中只支持光标所在段落文字定位,无法精确定位到文字。

发明内容

本发明提出一种文字反向定位图片的方法及装置、计算机储存介质,以解决现有定位方法无法精确定位到文字的问题。

本发明解决上述问题的技术方案是:一种文字反向定位图片的方法,其特殊之处在于,包括以下步骤:

在显示界面显示预设的第一窗口和第二窗口;

接收用户端在第一窗口选择的携带有坐标信息的关键字段,其中,所述坐标信息是图片信息和位置信息交叉定位后生成的信息;

根据所述图片信息定位到所述关键字段所在的图片并在第二窗口内显示所述图片;

根据所述位置信息在所述图片内点亮与关键字段相对应文字。

进一步的是,还包括以下步骤:所述第一窗口上还有用于供用户端选择的目录,所述目录是根据需要选取多个关键字段生成的。

进一步的是,所述根据所述位置信息在所述图片内点亮与关键字段相对应的文字的步骤包括:

根据关键字段的位置信息在图片内查找相对应的文字;

判断所述关键字段和查找到的所述文字的相似度是否大于阈值,若大于阈值则点亮所述文字。

进一步的是,所述图片信息是通过对多个目标图片进行OCR识别后的得到的信息,所述图片信息包括文字信息和多个段落信息,其中文字信息包括图片中的各个文字和各个文字的坐标。

进一步的是,所述的位置信息是通过多段落信息进行提取后得到的关键字段位置的信息,所述位置信息包括关键字段所在段落起始位置的信息,所述多段落信息是分别对多个图片进行OCR识别所得到的各个段落信息的组合。。

进一步的是,所述多段落信息进行提取的方法为,基于正则表达式强匹配及NLP能力算法。

另外,本发明还提出一种文字反向定位图片的装置,其特殊之处在于,包括:显示模块,用于在展示区域展示第一窗口和第二窗口;

接收模块,用于接收用户端在第一窗口选择的携带有坐标信息的第一文字,所述坐标信息是图片信息和位置信息交叉定位后生成的信息;

定位模块,用于根据所述图片信息定位到所述关键字段所在的图片;

点亮模块,用于根据所述位置信息在所述图片内点亮与关键字段相对应文字。

进一步的是,还包括判断模块,判断模块用于判断所述关键字段和查找到的所述文字的相似度是否大于阈值。

另外,本发明还提出一种计算机存储介质,其特殊之处在于,一其上存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8任一项所述的方法步骤。

本发明的优点:

1)本发明能够跨图片定位选中;

2)本发明能够精确定位到图片所在文字并高亮显示该文字;

3)本发明根据图片上覆盖的文字坐标,支持行内,多行,多页的定位。

附图说明

图1为本发明实施例1的流程示意图;

图2为本发明实施例2流程示意图;

图3为本发明实施例2中网页定位的示意图;

图4为本发明实施例2中编辑器定位的示意图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。

实施例1:如图1所示的一种文字反向定位图片的方法,包括:

在显示界面显示预设的第一窗口和第二窗口;

接收用户端在第一窗口选择的携带有坐标信息的关键字段,其中,坐标信息是图片信息和位置信息交叉定位后生成的信息;

根据图片信息定位到关键字段所在的图片并在第二窗口内显示图片;

根据位置信息在图片内点亮与关键字段相对应文字。

作为本发明一个优选的实施例,第一窗口上还有用于供用户端选择的目录,目录是根据需要选取多个关键字段生成的。

作为本发明一个优选的实施例,根据位置信息在图片内点亮与关键字段相对应的文字的步骤包括:

根据关键字段的位置信息在图片内查找相对应的文字;

判断关键字段和查找到的文字的相似度是否大于阈值,若大于阈值则点亮文字。

作为本发明一个优选的实施例,图片信息是通过对多个目标图片进行OCR识别后的得到的信息,图片信息包括文字信息和多个段落信息,其中文字信息包括图片中的各个文字和各个文字的坐标。

作为本发明一个优选的实施例,位置信息是通过多段落信息进行提取后得到的关键字段位置的信息,位置信息包括关键字段所在段落起始位置的信息,多段落信息是分别对多个图片进行OCR识别所得到的各个段落信息的组合。

作为本发明一个优选的实施例,多段落信息进行提取的方法为,基于正则表达式强匹配及NLP能力算法。

实施例2:如图2所示的文字反向定位图片的方法,包括以下步骤:

步骤一:坐标信息的生成

坐标信息的生成方法包括以下步骤:

1、将图片进行OCR识别,得到图片内所有文字、所有文字的坐标信息以及所有段落的信息;

2、将多个图片进行OCR识别得到的各个段落的信息组合成多段落信息,通过正则表达式强匹配及NLP能力的算法提取关键字段以及关键字段所在段落起始位置的信息,关键字段为案件类型、文书类型等业务字段;

3、将步骤2中关键字段所在段落起始位置的信息和步骤1中多段落信息进行交叉定位;

4、根据交叉定位的结果得到坐标信息。

步骤2:根据用户端需要网页定位或编辑器定位

如图3所示,当选择网页定位时,在网页中接收用户端点击或在目录中搜索的关键字段,根据关键字段所携带的坐标信息定位到相对应的图片并根据位置信息高亮选中图片上的与关键字段相对应的文字,关键字段和文字的内容相同的。

如图4所示,当选择编辑器定位时,在编辑器中接收用户端选中的文字,通过选中文字所携带的坐标信息定位到相对应的图片,根据选中文字的位置信息在图片内查找与选中文字相似度大于阈值的文字,并点亮该文字。

实施例3:一种文字反向定位图片的装置,包括

显示模块,用于在展示区域展示第一窗口和第二窗口;

接收模块,用于接收用户端在第一窗口选择的携带有坐标信息的第一文字,所述坐标信息是图片信息和位置信息交叉定位后生成的信息;

定位模块,用于根据所述图片信息定位到所述关键字段所在的图片;

点亮模块,用于根据所述位置信息在所述图片内点亮与关键字段相对应文字。

作为本发明一个优选的实施例:还包括判断模块,判断模块用于判断所述关键字段和查找到的所述文字的相似度是否大于阈值。

实施例4:一种计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现实施例1-实施例4的文字反向定位图片方法的步骤。

以上所述仅为本发明的实施例,并非以此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的系统领域,均同理包括在本发明的保护范围内。

相关技术
  • 一种文字反向定位图片的方法及装置、计算机储存介质
  • 图片文字定位方法、装置、计算机设备和存储介质
技术分类

06120112189708