电子汇票瑕疵识别方法、系统、设备及存储介质
文献发布时间:2023-06-19 09:46:20
技术领域
本申请涉及票据处理领域,具体而言,涉及一种电子汇票瑕疵识别方法、系统、设备及存储介质。
背景技术
票据瑕疵指的是在票据开出和流转过程中,由于一些不规范操作导致的非常规票面要素,可能影响该票据后期的流通使用或到期承兑。常见的瑕疵有上下不一致、代开票、银票企业承兑、不可转让等。依靠人力在票据签收时识别瑕疵,不仅耗时且易遗漏,给组织引入财务损失的风险。
针对相关技术中的对于电子汇票瑕疵的识别耗时且易遗漏的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种电子汇票瑕疵识别方法、系统、设备及存储介质,以解决相关技术中的对于电子汇票瑕疵的识别耗时且易遗漏的问题。
为了实现上述目的,本申请提供了一种电子汇票瑕疵识别方法,该电子汇票瑕疵识别方法包括:
提取电子汇票票面的HTML串;
从所述HTML串中抽取票面信息进行结构化处理,得到电子汇票票面信息的JSON对象;
根据瑕疵的既定规则与所述JSON对象进行比较,得到瑕疵结果,并输出瑕疵结果。
进一步的,结构化处理中,利用汇票抽取模板对所述电子汇票票面的HTML串进行进行文本抽取,对于从不同页面提取的电子汇票票面的HTML串,采用不同的汇票抽取模板进行文本抽取。
进一步的,在提取电子汇票票面的HTML串之前,预设瑕疵的既定规则;瑕疵的既定规则为由多个瑕疵处理类组成的瑕疵处理链,其中,每个所述瑕疵处理类通过工厂模板方法确定处理逻辑,且每种瑕疵由特定的瑕疵处理类进行处理。
进一步的,根据瑕疵的既定规则与JSON对象进行比较中,由所述瑕疵处理链对所述JSON对象进行串行处理,并将识别到的瑕疵丢入瑕疵池。
根据本申请的另一方面,提供一种电子汇票瑕疵识别系统,该电子汇票瑕疵识别系统包括:
数据库,用于存储数据;
服务端,与所述数据库连接,用于读写所述数据库,并运行实现电子汇票瑕疵识别功能的系统固件;其中,
所述服务端的系统固件包括:
导入模块,用于向所述数据库中导入预设瑕疵的既定规则;
提取模块,用于提取电子汇票票面的HTML串;
处理模块,用于从所述HTML串中抽取票面信息进行结构化处理,并得到电子汇票票面信息的JSON对象;
瑕疵识别模块,用于根据所述瑕疵的既定规则与所述JSON对象进行比较,并输出瑕疵结果。
进一步的,导入模块还用于导入不同的汇票抽取模板。
进一步的,处理模块利用汇票抽取模板对所述电子汇票票面的HTML串进行进行文本抽取,对于从不同页面提取的电子汇票票面的HTML串,采用不同的汇票抽取模板进行文本抽取。
根据本申请的另一方面,提供一种电子汇票瑕疵识别设备,该电子汇票瑕疵识别设备包括处理器,以及被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现电子汇票瑕疵识别方法的步骤。
根据本申请的另一方面,提供一种存储介质,该存储介质用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现电子汇票瑕疵识别方法的步骤。
在本申请实施例中,通过预设瑕疵的既定规则;提取电子汇票票面的HTML串;从所述HTML串中抽取票面信息进行结构化处理,并得到电子汇票票面信息的JSON对象;根据所述瑕疵的既定规则与所述JSON对象进行比较,并输出瑕疵结果,从而实现了快速、准确的对电子汇票瑕疵进行识别的技术效果,进而解决了相关技术中的对于电子汇票瑕疵的识别耗时且易遗漏的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的流程示意图;
图2是根据本申请实施例的结构示意图;
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。
在本申请中,术语“上”、“下”、“内”、等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“设置”、“设有”、“连接”、“固定”等应做广义理解。例如,“连接”可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
另外,术语“多个”的含义应为两个以及两个以上。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,本申请实施例提供了一种电子汇票瑕疵识别方法,该电子汇票瑕疵识别方法包括:
步骤S10,预设瑕疵的既定规则,瑕疵的既定规则为由多个瑕疵处理类组成的一个瑕疵处理链,其中,每个所述瑕疵处理类通过工厂模板方法确定处理逻辑,且每种瑕疵由特定的瑕疵处理类进行处理,可针对不同的用户自由配置和组合瑕疵处理类,做到瑕疵识别的定制化;
步骤S20,提取电子汇票票面的HTML串,针对基于微软IE内核的浏览器(例如微软Internet Explorer,搜狗浏览器,360急速浏览器等),可以采用MSHTML来访问指定网银中的电子汇票信息,MSHTML是一个COM组件,该组件封装了HTML语言中的所有元素及其属性,通过其提供的标准接口来访问页面元素,得到电子汇票票面的HTML串;
步骤S30,从所述HTML串中抽取票面信息进行结构化处理,并得到电子汇票票面信息的JSON对象,由于不同银行的网银页面结构差异化大,因此在结构化处理中,利用汇票抽取模板对所述电子汇票票面的HTML串进行进行文本抽取,对于从不同页面提取的电子汇票票面的HTML串,采用不同的汇票抽取模板进行文本抽取,可实现针对不同的银行网银配置不同的汇票模板,无需修改代码和发布系统即可支持新的网银;
步骤S40,根据所述瑕疵的既定规则与所述JSON对象进行比较,得到瑕疵结果,并输出瑕疵结果,具体的,根据瑕疵的既定规则进行比较,如“不可转让”瑕疵,票面有“不*转让”字样则识别为瑕疵,若上述JSON对象中的transferStatus=不可转让,表示此张票据输出了“不可转让”的瑕疵,同理对于电子汇票的背书信息、承兑信息等均采用同样的逻辑进行瑕疵判断和输出。
人力识别汇票瑕疵需要3-10分钟,而计算机采用本实施例中的识别方法,识别瑕疵只需要不到1秒钟,极大的提高识别的效率和准确率。从而实现了快速、准确的对电子汇票瑕疵进行识别的技术效果,进而解决了相关技术中的对于电子汇票瑕疵的识别耗时且易遗漏的问题。
进一步的,根据瑕疵的既定规则与JSON对象进行比较中,由所述瑕疵处理链对所述JSON对象进行串行处理,并将识别到的瑕疵丢入瑕疵池。
如图2所示,根据本申请的另一方面,提供一种电子汇票瑕疵识别系统,该电子汇票瑕疵识别系统包括:
数据库,用于存储数据;
服务端,与所述数据库连接,用于读写所述数据库,并运行实现电子汇票瑕疵识别功能的系统固件;其中,
所述服务端的系统固件包括:
导入模块10,用于向所述数据库中导入预设瑕疵的既定规则,以及导入不同的汇票抽取模板;
提取模块20,用于提取电子汇票票面的HTML串;
处理模块30,用于从所述HTML串中抽取票面信息进行结构化处理,并得到电子汇票票面信息的JSON对象;
瑕疵识别模块40,用于根据所述瑕疵的既定规则与所述JSON对象进行比较,并输出瑕疵结果。
进一步的,处理模块30利用汇票抽取模板对所述电子汇票票面的HTML串进行进行文本抽取,对于从不同页面提取的电子汇票票面的HTML串,采用不同的汇票抽取模板进行文本抽取。
进一步的,还包括与所述瑕疵识别模块40连接的暂存模块,用于对瑕疵结果进行暂存,用户可通过暂存模块对瑕疵进行查看,在瑕疵电子汇票被处理后暂存模块内的瑕疵结果被清除。
根据本申请的另一方面,提供一种电子汇票瑕疵识别设备,该电子汇票瑕疵识别设备包括处理器,以及被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现电子汇票瑕疵识别方法的步骤。
根据本申请的另一方面,提供一种存储介质,该存储介质用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现电子汇票瑕疵识别方法的步骤。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
- 电子汇票瑕疵识别方法、系统、设备及存储介质
- 一种运维设备的识别方法、系统、电子设备及存储介质