掌桥专利:专业的专利平台
掌桥专利
首页

一种针对银行回单的断言元素智能识别方法及系统

文献发布时间:2023-06-19 18:58:26


一种针对银行回单的断言元素智能识别方法及系统

技术领域

本发明涉及图像处理、文字识别技术领域,尤其涉及一种针对银行回单的断言元素智能识别方法及系统。

背景技术

银行回单是个人或单位在银行办理业务的有效凭证,是企业编制记账凭证的原始依据,在银行系统中有着广泛的应用。银行回单存在多种不同类型,例如存取款回单、转账回单、收费回单、利息回单、缴税回单、结售汇回单等等。在针对银行系统的软件测试过程中,有很多交易涉及回单文件的测试,我们需要将回单文件上的所有元素提取并且与系统数据库中对应字段做比对,来验证回单文件上所有元素的正确性。

目前,回单测试的比对过程需要人工完成,往往比较耗时且效率不高,我们需要引入自动化测试将整个测试过程由机器完成。自动化实施过程中,回单文件元素的自动识别提取是重中之重,只有识别提取后的数据足够精确才能保证自动化测试的顺利执行,然而,目前市面上常见的针对PDF文件的元素识别方法往往存在精度不够的问题,精度不够会导致元素名称提取错误或者元素数据提取错误,无论哪种错误都会促使断言无法正常校验从而阻断自动化测试的运行。

卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,可以进行监督学习和非监督学习,而LeNet-5模型是第一个成功应用于数字识别问题的卷积神经网络,在处理数字识别问题以及文字识别问题方面可以达到约99.2%的正确率。

发明内容

为解决现有技术的不足,本发明提出一种针对银行回单的断言元素智能识别方法及系统,针对银行回单类自动化测试工作的痛点,优化针对回单PDF文件的元素识别方法,利用卷积神经网络中LeNet-5模型对回单中断言元素进行智能识别,提取识别后的数据与数据库中字段取值进行比对后将校验结果直接打印在回单文件上,并支持对断言元素的精确校验,从而完成银行回单类的全流程自动化测试。

为实现以上目的,本发明所采用的技术方案包括:

一种针对银行回单的断言元素智能识别方法,所述断言元素包括业务类型、交易日期、付款人名称、付款人账号、付款人开户行名和付款人开户行号,包括:

获取银行回单PDF文件;

将所述银行回单PDF文件进行划分,生成若干个元素区域;

根据所述元素区域的位置,将所述元素区域转化为相应的像素数据;

将所述像素数据作为输入数据输入至卷积神经网络LeNet-5模型进行初次识别,根据第一校验规则得到各元素区域的初次识别结果;

将所述初次识别结果打印至对应的元素区域;

所述初次识别结果包括断言校验通过、断言校验失败和断言校验结果待定;

获取所述初次识别结果为断言校验失败和断言校验结果待定的元素区域;

调整所述卷积神经网络LeNet-5模型参数,对所述初次识别结果为断言校验失败和断言校验结果待定的元素区域进行精确识别,根据第二校验规则得到精确识别结果;

将所述精确识别结果打印至对应的元素区域。

进一步地,所述卷积神经网络LeNet-5模型共有7层,其中前4层由卷积层和池化层交替,后三层为全连接层。

进一步地,所述第一校验规则包括:若所述元素区域内所有字符全部通过,则初次识别结果为断言校验通过;

若所述元素区域内有两个或两个以上字符校验失败,则初次识别结果为断言校验失败;

若所述元素区域内仅有一个字符校验失败,则初次识别结果为断言校验结果待定。

进一步地,所述精确识别结果包括断言校验通过和断言校验失败。

进一步地,所述第二校验规则包括:若所述元素区域内所有字符全部通过,则精确识别结果为断言校验通过;

若所述元素区域内存在字符校验失败,则精确识别结果为断言校验失败。

本发明还涉及一种针对银行回单的断言元素智能识别系统,包括:

获取模块,用于获取银行回单PDF文件;

划分模块,用于将所述银行回单PDF文件进行划分,生成若干个元素区域;

转化模块,用于根据所述元素区域的位置,将所述元素区域转化为相应的像素数据;

第一处理模块,用于将所述像素数据作为输入数据输入至卷积神经网络LeNet-5模型进行初次识别,根据第一校验规则得到各元素区域的初次识别结果;

第一输出模块,用于将所述初次识别结果打印至对应的元素区域;所述初次识别结果包括断言校验通过、断言校验失败和断言校验结果待定;

第二处理模块,用于调整所述卷积神经网络LeNet-5模型参数,对所述初次识别结果为断言校验失败和断言校验结果待定的元素区域进行精确识别,根据第二校验规则得到精确识别结果;

第二输出模块,用于将所述精确识别结果打印至对应的元素区域。

本发明还涉及一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。

本发明还涉及一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器,用于执行存储器中存储的计算机程序,执行上述的方法。

本发明的有益效果为:

本发明优化针对回单PDF文件的元素识别方法,利用卷积神经网络中LeNet-5模型对回单中断言元素进行智能识别,提取识别后的数据与数据库中字段取值进行比对后将校验结果直接打印在回单文件上,并支持对断言元素的精确校验,从而完成银行回单类的全流程自动化测试。

附图说明

图1为本发明一种针对银行回单的断言元素智能识别方法流程示意图。

图2为本发明一种针对银行回单的断言元素智能识别系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明第一方面涉及一种步骤流程如图1所示的针对银行回单的断言元素智能识别方法,所述断言元素包括业务类型、交易日期、付款人名称、付款人账号、付款人开户行名和付款人开户行号,包括:

获取银行回单PDF文件;

将所述银行回单PDF文件进行划分,生成若干个元素区域;

具体而言,在申请实施例中,对银行回单PDF文件进行预处理,处理成可以作为卷积神经网络的输入图像像素数据。先将银行回单PDF文件按照不同的回单类型模板,划分出元素区域,例如转账回单中付款人名称元素区域为:

币种及金额元素区域为:

根据所述元素区域的位置,将所述元素区域转化为相应的像素数据;

将所述像素数据作为输入数据输入至卷积神经网络LeNet-5模型进行初次识别,根据第一校验规则得到各元素区域的初次识别结果;

具体而言,在申请实施例中,LeNet-5模型总共有7层,层级顺序分别为卷积层、池化层、卷积层、池化层、全连接层、全连接层、全连接层。其中,卷积层是卷积神经网络的核心,将每个神经元看做一个滤波器,并利用窗口滑动对局部数据进行计算;池化层是用于压缩数据和参数的量以减小过拟合;全连接层用于权重连接所有神经元,使得模型计算更加精确,通常放在卷积神经网络的尾部。

每一层的结构详情如下:

第一层(卷积层):这一层的输入就是原始的图像像素,LeNet-5模型接受的输入层大小为32×32×1,将原始像素数据拆分成多个32×32的像素数据作为输入。第一个卷积层过滤器尺寸为5×5,深度为6,步长为1;

第二层(池化层):这一层的输入为第一层的输出,是一个28×28×6的节点矩阵,过滤器大小为2×2,长和宽的步长均为2;

第三层(卷积层):本层的输入矩阵大小为14×14×6,使用的过滤器大小为5×5,深度为16,步长为1;

第四层(池化层):本层的输入矩阵大小为10×10×16,使用的过滤器大小为2×2,步长为2;

第五层(全连接层):本层的输入矩阵大小为5×5×16,输出节点个数为120个;

第六层(全连接层):本层输入节点个数为120个,输出节点个数为84个;

第七层(全连接层):本层输入节点个数为84个,输出节点个数为10个。

将回单文件中每个区域元素对应的原始像素数据拆分成多个32×32的像素数据作为输入,经过7个层级后可得到区域元素数据输出。

本发明采集不同回单类型的历史数据作为训练集,按照上述模型结构确定各层级数量后,利用误差反向传播算法(BP算法)对卷积神经网络模型进行迭代训练,训练收敛后可得到卷积神经网络模型的各项权重,也就是节点与节点之间的连线对应的系数。模型训练完毕后,采集待识别的银行回单文件区域元素数据作为输入,可得到输出结果。

将所述初次识别结果打印至对应的元素区域;

具体而言,在本申请实施例中,通过上述LeNet-5模型得到断言元素初次识别结果,提取初次识别后的数据与数据库中字段取值进行比对后,根据第一校验规则得到各元素区域的初次识别结果,将初次识别结果直接打印在回单文件上。

具体的,初次识别结果包括断言校验通过、断言校验失败和断言校验结果待定,第一校验规则为若所述元素区域内所有字符全部通过,则初次识别结果为断言校验通过;

若所述元素区域内有两个或两个以上字符校验失败,则初次识别结果为断言校验失败;

若所述元素区域内仅有一个字符校验失败,则初次识别结果为断言校验结果待定。

获取所述初次识别结果为断言校验失败和断言校验结果待定的元素区域;

调整所述卷积神经网络LeNet-5模型参数,对所述初次识别结果为断言校验失败和断言校验结果待定的元素区域进行精确识别,根据第二校验规则得到精确识别结果;

将所述精确识别结果打印至对应的元素区域。

具体而言,在本申请实施例中,选择重新校验后,将针对需要重新校验的元素区域启动精确识别,精确识别同样利用上述LeNet-5模型进行,但需要对模型参数进行调整以达到精确校验的目的,具体的参数调整方案如下:

第一层(卷积层)中,LeNet-5模型输入层大小调整为32×32×1,即将原始像素数据拆分成多个16×16的像素数据作为输入;

第二层(池化层)中,输入层调整为14×14×6的节点矩阵;

第三层(卷积层)中,输入层调整为7×7×6的节点矩阵;

其余层无调整。

根据第二校验规则得到精确识别结果,将所述精确识别结果打印至对应的元素区域,具体的,第二校验规则包括,若所述元素区域内所有字符全部通过,则精确识别结果为断言校验通过;

若所述元素区域内存在字符校验失败,则精确识别结果为断言校验失败。

本发明另一方面还涉及针对银行回单的断言元素智能识别处理系统,其结构如图2所示,包括:

获取模块,用于获取银行回单PDF文件;

划分模块,用于将所述银行回单PDF文件进行划分,生成若干个元素区域;

转化模块,用于根据所述元素区域的位置,将所述元素区域转化为相应的像素数据;

第一处理模块,用于将所述像素数据作为输入数据输入至卷积神经网络LeNet-5模型进行初次识别,根据第一校验规则得到各元素区域的初次识别结果;

第一输出模块,用于将所述初次识别结果打印至对应的元素区域;所述初次识别结果包括断言校验通过、断言校验失败和断言校验结果待定;

第二处理模块,用于调整所述卷积神经网络LeNet-5模型参数,对所述初次识别结果为断言校验失败和断言校验结果待定的元素区域进行精确识别,根据第二校验规则得到精确识别结果;

第二输出模块,用于将所述精确识别结果打印至对应的元素区域。

通过使用该系统,能够执行上述的运算处理方法并实现对应的技术效果。

本发明的实施例还提供能够实现上述实施例中的针对银行回单的断言元素智能识别方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的针对银行回单的断言元素智能识别方法的全部步骤。

本发明的实施例还提供一种用于执行上述方法的电子设备,作为该方法的实现装置,所述电子设备至少具备有处理器和存储器,特别是该存储器上存储有执行方法所需的数据和相关的计算机程序,并通过由处理器调用存储器中的数据、程序执行实现方法的全部步骤,并获得对应的技术效果。

优选的,该电子设备可以包含有总线架构,总线可以包括任意数量的互联的总线和桥,总线将包括由一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和接收器和发送器之间提供接口。接收器和发送器可以是同一个元件,即收发机,提供用于在传输介质上与各种其他系统通信的单元。处理器负责管理总线和通常的处理,而存储器可以被用于存储处理器在执行操作时所使用的数据。

额外的,所述电子设备还可以进一步包括通信模块、输入单元、音频处理器、显示器、电源等部件。其所采用的处理器(或称为控制器、操作控件)可以包括微处理器或其他处理器装置和/或逻辑装置,该处理器接收输入并控制电子设备的各个部件的操作;存储器可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种,可储存上述有关的数据信息,此外还可存储执行有关信息的程序,并且处理器可执行该存储器存储的该程序,以实现信息存储或处理等;输入单元用于向处理器提供输入,例如可以为按键或触摸输入装置;电源用于向电子设备提供电力;显示器用于进行图像和文字等显示对象的显示,例如可为LCD显示器。通信模块即为经由天线发送和接收信号的发送机/接收机。通信模块(发送机/接收机)耦合到处理器,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)还经由音频处理器耦合到扬声器和麦克风,以经由扬声器提供音频输出,并接收来自麦克风的音频输入,从而实现通常的电信功能。音频处理器可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器还耦合到中央处理器,从而使得可以通过麦克风能够在本机上录音,且使得可以通过扬声器来播放本机上存储的声音。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

以上所述仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换等都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

技术分类

06120115758832