掌桥专利:专业的专利平台
掌桥专利
首页

基于银行回单的关键信息提取方法、装置、设备及介质

文献发布时间:2023-06-19 10:57:17


基于银行回单的关键信息提取方法、装置、设备及介质

技术领域

本发明涉及信息识别技术领域,更具体地说,涉及一种基于银行回单的关键信息提取方法、装置、设备及介质。

背景技术

近年来,基于深度学习的文字识别落地应用已经非常成熟,在银行回单识别领域中,相关的识别算法是对基于深度学习的文字识别结果进行相关优化工作,优化工作的中心思想是基于关键字模板匹配的方式,来获取银行回单中的关键信息字段,但由于基于深度学习的文字识别在识别银行回单相关任务中,会出现识别的字段分开的问题,导致识别出的银行回单关键信息字段缺失等问题,识别性能不够鲁棒。

因此,如何提高银行回单中关键信息的完整性及准确性,是本领域技术人员需要解决的问题。

发明内容

本发明的目的在于提供一种基于银行回单的关键信息提取方法、装置、设备及介质,以提高银行回单中关键信息的完整性及准确性。

为实现上述目的,本发明提供一种基于银行回单的关键信息提取方法,包括:

识别银行回单的初始文字字段;

对所述初始文字字段执行清洗操作,得到目标文字字段;

对相邻的目标文字字段间建立动态链接,生成文字字段组合;

识别每个文字字段组合的类型,并通过机器学习模型从每个文字字段组合中提取所述银行回单的关键信息。

其中,所述对所述初始文字字段执行清洗操作,包括:

识别所述初始文字字段中的停用词,并删除。

其中,所述对所述初始文字字段执行清洗操作,包括:

识别所述初始文字字段中非标准文字字段,并通过预先存储的常用词库对非标准文字字段进行更改。

其中,所述通过预先存储的常用词库对非标准文字字段进行更改,包括:

通过预先存储的公司名词词库对非标准文字字段进行更改;和/或,通过通过预先存储的格式正则规则对非标准文字字段进行更改。

其中,所述识别每个文字字段组合的类型,包括:

通过关键词分类算法、分词分类算法、特定模板分类算法中的任意一者,确定每个文字字段组合的类型。

其中,若通过所述关键词分类算法、分词分类算法、模板分类算法均不能确定文字字段组合的类型,则所述关键信息提取方法还包括:

通过语言分类模型确定文字字段组合的类型。

其中,所述对相邻的目标文字字段间建立动态链接,包括:

确定各个目标文字字段的位置;

对属于同一水平方向的、且位置相邻的目标文字字段间建立动态链接,和/或,对属于同一垂直方向的、且位置相邻的目标文字字段间建立动态链接,和/或,对不属于同一水平方向和垂直方向的、且位置相邻的目标文字字段间建立动态链接。

为实现上述目的,本发明进一步提供一种基于银行回单的关键信息提取装置,包括:

识别模块,用于识别银行回单的初始文字字段;

字段清洗模块,用于对所述初始文字字段执行清洗操作,得到目标文字字段;

链接建立模块,用于对相邻的目标文字字段间建立动态链接,生成文字字段组合;

类型识别模块,用于识别每个文字字段组合的类型;

提取模块,用于通过机器学习模型从每个文字字段组合中提取所述银行回单的关键信息。

为实现上述目的,本发明进一步提供一种电子设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现上述基于银行回单的关键信息提取方法的步骤。

为实现上述目的,本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于银行回单的关键信息提取方法的步骤。

通过以上方案可知,本发明实施例提供的一种基于银行回单的关键信息提取方法,包括:识别银行回单的初始文字字段;对初始文字字段执行清洗操作,得到目标文字字段;对相邻的目标文字字段间建立动态链接,生成文字字段组合;识别每个文字字段组合的类型,并通过机器学习模型从每个文字字段组合中提取所述银行回单的关键信息。可见,在本方案中,识别银行回单的初始文字字段后,通过对初始文字字段清洗的方式,可避免提取的关键信息出现字段错误、不完整等问题,通过建立文字字段组合的方式,可提高字段间的关联度,从而提高关键信息的完整性和准确性;本发明还公开了一种基于银行回单的关键信息提取装置、设备及介质,同样能实现上述技术效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种基于银行回单的关键信息提取方法流程示意图;

图2为本发明实施例公开的一种基于银行回单的关键信息提取装置结构示意图;

图3为本发明实施例公开的一种电子设备结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种基于银行回单的关键信息提取方法、装置、设备及介质,以提高银行回单中关键信息的完整性及准确性。

参见图1,本发明实施例提供的一种基于银行回单的关键信息提取方法流程示意图;该方法包括:

S101、识别银行回单的初始文字字段;

在本方案中,首先需要识别银行回单中的文字字段,在本方案中,将识别出来的未执行清洗操作的文字字段作为初始文字字段;并且,在识别初始文字字段时,可通过基于深度学习的文字识别方法识别初始文字字段。在银行回单中,文字字段可以为:收款方、公司名称、账号、银行卡号等等。

S102、对初始文字字段执行清洗操作,得到目标文字字段;

需要说明的是,在本方案中,为了避免提取的关键信息出现不准确、不完整等情况,识别出初始文字字段后,需要对该初始文字字段执行清洗操作,将清洗后的文字字段称为目标文字字段。

具体来说,本方案对初始文字字段执行清洗操作包括:识别初始文字字段中的停用词,并删除。如:预先设置停用词库,该停用词库中的停用词为已经停止使用的词,如果在初始文字字段中检测出停用词,则直接删除,实现对初始文字字段中停用词的清理。

进一步,本方案对初始文字字段执行清洗操作还包括:识别所述初始文字字段中非标准文字字段,并通过预先存储的常用词库对非标准文字字段进行更改。其中,本方案中的非标准文字字段包括:识别错误、不完整等字段,如果检测出该非标准文字字段,则通过预先存储的常用词库对非标准文字字段进行更改。该常用词库中包括:公司名称词库,格式正则规则,因此在更改时,可通过预先存储的公司名词词库对非标准文字字段进行更改,和/或,通过通过预先存储的格式正则规则对非标准文字字段进行更改。例如:若识别的非标准文字字段为:“浙工XX网络”,则通过公司名词词库将“浙工XX网络”更改为“浙江XX网络”,然后再通过格式正则规则将“浙江XX网络”修改为“浙江XX网络科技有限公司”,通过该方式,即可得到即准确又完整的目标文字字段,进而提高了关键信息的准确定及准确定。

S103、对相邻的目标文字字段间建立动态链接,生成文字字段组合;

其中,对相邻的目标文字字段间建立动态链接的过程具体包括:确定各个目标文字字段的位置;对属于同一水平方向的、且位置相邻的目标文字字段间建立动态链接,和/或,对属于同一垂直方向的、且位置相邻的目标文字字段间建立动态链接,和/或,对不属于同一水平方向和垂直方向的、且位置相邻的目标文字字段间建立动态链接。

具体来说,本方案中的各个目标文字字段的位置,为各个目标文字字段在银行回单中的坐标位置。通过各个目标文字字段的位置即可了解各个目标文字字段之间的位置关系。本方案中的相邻目标文字字段具体是指:距离值小于预定阈值的两个相邻的目标文字字段,若两个目标文字字段之间的距离过大,则不需要建立两者的动态链接。如果通过位置关系判定两个目标文字字段是距离值小于预定阈值的相邻的文字字段,则判定这两个字段之间具有关联关系,并将这两个字段间建立动态链接。例如:“收款人”这一字段,与“XX公司”这一字段是相邻字段,则建立“收款人”与“XX公司”之间的动态链接,生成的文字字段组合为:“收款人XX公司”。

需要说明的是,本方案中的动态链接具体可以为文字空间链接,包括对不同方向上的相邻的目标文字字段间建立动态链接。因此本方案中的相邻文字字段的动态链接,包括:同行坐标距离最短链接、垂直坐标距离最短链接、相邻坐标距离最短链接等等,在实际应用时还可以根据实际需求自定义坐标距离最短链接。其中,同行坐标距离最短链接为:对属于同一水平方向的、且位置相邻的目标文字字段间建立动态链接,例如:“收款人”与“XX公司”在水平方向上相邻,则在“收款人”与“XX公司”间建立链接,生成文字字段组合“收款人XX公司”;垂直坐标距离最短链接为:对属于同一垂直方向的、且位置相邻的目标文字字段间建立动态链接,例如:“收款人”与“XX公司”在垂直方向上相邻,则在“收款人”与“XX公司”间建立链接,生成文字字段组合“收款人XX公司”;相邻坐标距离最短链接为:对不属于同一水平方向和垂直方向的、且位置相邻的目标文字字段间建立动态链接,例如:“收款人”与“XX公司”既不在水平方向上相邻,也不在垂直方向上相邻,但是“XX公司”在“收款人”的相邻的右下角,在该情况下,也可判定两者也具有相邻关系,则在“收款人”与“XX公司”间建立链接,生成文字字段组合“收款人XX公司”。

可见,本方案通过将文字空间链接结构应用到银行回单关键信息提取中,通过相邻文字字段动态链接模块来将关联密切字段进行优化组合,提高本方案在对关键信息抽取的完整性和准确性。

S104、识别每个文字字段组合的类型,并通过机器学习模型从每个文字字段组合中提取银行回单的关键信息。

在本方案中,在识别每个文字字段组合的类型时,可以通过关键词分类算法、分词分类算法、特定模板分类算法中的任意一者,确定每个文字字段组合的类型。其中,基于关键词分类算法对文字字段组合进行分类,具体是根据文字字段组合中的关键词进行确定,例如:文字字段组合中出现了关键字“收款人账号”,则可判定该文字字段组合的类型为收款人账号类型;基于分词分类算法对文字字段组合进行分类,具体是根据分词进行确定,分词是指关键词中的一部分,例如:文字字段组合中出现了分析“账”,则可判定该文字字段组合的类型为账号类型;基于特定模板分类算法对文字字段组合进行分类时,首先需要预先设置不同的模板,如:央行模板或者地方银行模板,由于不同银行之间的字段不同,因此设置模板后,在对某公司的银行回单进行关键信息提取时,可通过与该公司对应的模板来对文字字段组合进行分类,从而提高了分类速度及准确性。如果通过上关键词分类算法、分词分类算法、模板分类算法均不能确定文字字段组合的类型,则本方案还可以通过语言分类模型确定文字字段组合的类型。

需要说明的是,通过上述分类后,还存在不能识别具体类型的问题,例如:基于分词分类算法对文字字段组合进行分类时,文字字段组合中出现了分析“账”,则可判定该文字字段组合的类型为账号类型,但是该方式并不能确定该账号类型为收款人账号类型还是付款人账号类型,在该情况下,还需要对类型进行再次确定。在本方案中,还可以使用正则、关键词、自定义模板、规则模板来精准分类。

其中,使用正则方式进行分类时,需要预先存储不同类型的字段,例如:预先存储了收款方账号和付款方账号,如果该文字字段组合中的账号属于收款方账号,则判定该文字字段组合的类型为收款方账号;使用关键词进行分类时,如果检测到该文字字段组合中存在“收”字,则判定该文字字段组合为收款方账号;使用自定义模板进行分类时,需要预先根据用户自身体验,自由定义关键字和字段的坐标位置来确定文字字段组合的类型;使用规则模板进行分类时,需要预先设定规则模板,该规则模板中的一些规则可以用来识别文字字段组合的类型,例如:若规则为:收款人的位置在付款人的位置上侧,则可通过文字字段组合的位置确定类型为收款人还是付款人,如果位置靠上,则为收款人,如果位置靠下,则为付款人。

进一步的,通过上述方式识别每个文字字段组合的类型后,需要将每个文字字段组合及对应的相关信息发送至机器学习模型,通过机器学习模型从每个文字字段组合中抽取银行回单的关键信息。该相关信息具体为文字字段组合的类型、坐标位置、相邻字段。其中,基于机器学习的关键信息抽取模型的离线训练流程,可根据字段的相关信息来进行关键信息抽取训练。机器学习模型从每个文字字段组合中抽取银行回单的关键信息具体可以为:将从每个类型的文字字段组合中提取对应的具体内容,例如:文字字段组合为“收款人XX公司”,则机器学习模型抽取银行回单的关键信息为:“XX公司”,通过该方式,即可精准的确定银行回单中的收款人为“XX公司”。

并且,为了提高模型提取的准确定,本方案提取出银行回单的关键信息后,如果识别的关键信息出现错误,则后台会自动记录出错的关键信息,并通过对上述错误信息的分析识别,更改对应的模板、规则、机器学习模型,或者重新对机器学习模型训练等操作,通过这种持续训练方式,来优化模型的参数和结构,以此来实现更好的字段关键信息提取效果。可见,本方案根据已有的字段链接,使用关键词/规则等技术来选择字段和相关参数,并将字段和相关参数输送至机器学习模型来进行关键信息抽取,可以应对不断扩展的用户群体和市场,保证银行回单识别相关服务的健壮性及先进性。

综上可见,本方案通过上述清洗文字字段、动态文字字段链接、文字字段分类,关键信息提取等操作,即可完成银行回单的关键信息的抽取流程,并保证了关键信息的完整和准确性。

下面对本发明实施例提供的关键信息提取装置、设备及介质进行介绍,下文描述的关键信息提取装置、设备及介质与上文描述的关键信息提取方法可以相互参照。

参见图2,本发明实施例提供的一种基于银行回单的关键信息提取装置,包括:

识别模块100,用于识别银行回单的初始文字字段;

字段清洗模块200,用于对所述初始文字字段执行清洗操作,得到目标文字字段;

链接建立模块300,用于对相邻的目标文字字段间建立动态链接,生成文字字段组合;

类型识别模块400,用于识别每个文字字段组合的类型;

提取模块500,用于通过机器学习模型从每个文字字段组合中提取所述银行回单的关键信息。

其中,所述字段清洗模块,包括:

删除单元,用于识别所述初始文字字段中的停用词,并删除。

其中,所述字段清洗模块,包括:

识别单元,用于识别所述初始文字字段中非标准文字字段;

更改单元,用于通过预先存储的常用词库对非标准文字字段进行更改。

其中,所述更改单元具体用于:通过预先存储的公司名词词库对非标准文字字段进行更改;和/或,通过通过预先存储的格式正则规则对非标准文字字段进行更改。

其中,所述识别单元具体用于:通过关键词分类算法、分词分类算法、特定模板分类算法中的任意一者,确定每个文字字段组合的类型。若通过所述关键词分类算法、分词分类算法、模板分类算法均不能确定文字字段组合的类型,则通过语言分类模型确定文字字段组合的类型。

其中,链接建立模块包括:

位置确定单元,用于确定各个目标文字字段的位置;

链接建立单元,用于对属于同一水平方向的、且位置相邻的目标文字字段间建立动态链接,和/或,对属于同一垂直方向的、且位置相邻的目标文字字段间建立动态链接,和/或,对不属于同一水平方向和垂直方向的、且位置相邻的目标文字字段间建立动态链接。

参见图3,为本发明实施例公开的一种电子设备结构示意图;包括:

存储器11,用于存储计算机程序;

处理器12,用于执行所述计算机程序时实现上述任意方法实施例所述的基于银行回单的关键信息提取方法的步骤。

在本实施例中,设备可以是PC(Personal Computer,个人电脑),也可以是智能手机、平板电脑、掌上电脑、便携计算机等终端设备。

该设备可以包括存储器11、处理器12和总线13。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是设备的内部存储单元,例如该设备的硬盘。存储器11在另一些实施例中也可以是设备的外部存储设备,例如设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括设备的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据。

该总线13可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

进一步地,设备还可以包括网络接口14,网络接口14可选的可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该设备与其他电子设备之间建立通信连接。

可选地,该设备还可以包括用户接口15,用户接口15可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口15还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在设备中处理的信息以及用于显示可视化的用户界面。

图3仅示出了具有组件11-15的设备,本领域技术人员可以理解的是,图3示出的结构并不构成对设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例所述的基于银行回单的关键信息提取方法的步骤。

其中,该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 基于银行回单的关键信息提取方法、装置、设备及介质
  • 银行回单的关键信息提取方法、装置、设备及存储介质
技术分类

06120112739859