掌桥专利:专业的专利平台
掌桥专利
首页

异常数据分拣方法、装置、计算设备及计算机存储介质

文献发布时间:2023-06-19 11:49:09


异常数据分拣方法、装置、计算设备及计算机存储介质

技术领域

本发明实施例涉及移动通信技术领域,具体涉及一种异常数据分拣方法、装置、计算设备及计算机存储介质。

背景技术

在移动通信领域,用户的信息、资料、账户金额,根据配置的公共稽核规则和业务稽核模板对数据进行稽核比对后,由于会随着一些业务的订购或者一些其他业务的变更导致一些数据的变化,需要将一些信息记录下来,在后续包含产品订购、资金充值、网络使用、计费出账、销账欠费、结算酬金到入账等操作后数据是否一致,需要与之前的数据进行稽核校验,分拣出真实的异常差异数据进行修复。

对于生产系统内部数据,如果直接去比对,首先移动通信领域的生产数据极其庞大且在实时变化,进行全量数据实时稽核会对生产系统产生较大压力,数据获取上也会比较耗时且稽核效率比较低下。稽核平台首先采用的是采集+稽核的方式进行批量稽核,通过采集前一天的数据到稽核数据库然后进行比对,这样首先会稽核出一批异常的数据,经过对差异数据分析后,会过滤掉一些差异数据,剩下的数据需要进行修复,但是由于数据可能是前一天的数据采集过来的,所以在修复和采集之间有很长的一段时间,数据可能被人工修复或发生其他变化。

现有稽核比对存在如下缺陷:数据是采集过来的,实时性不强,比对出来的数据可能与生产系统当前数据已存在误差,误判率较高。当数据和生产实时数据存在误差时,以此份数据对生产系统进行数据修复时容易造成生产数据更不准确。

发明内容

鉴于上述问题,本发明实施例提供了一种异常数据分拣方法、装置、计算设备及计算机存储介质,克服了上述问题或者至少部分地解决了上述问题。

根据本发明实施例的一个方面,提供了一种异常数据分拣方法,所述方法包括:获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据。

在一种可选的方式中,所述获取历史稽核数据并根据所历史稽核数据进行离线对比获取历史主键数据,包括:获取所述历史稽核数据并建立包括多个稽核节点的稽核流程;根据所述稽核流程收集主键字段;根据所述主键字段对所述历史稽核数据进行离线对比获取所述历史主键数据。

在一种可选的方式中,所述根据所述历史主键数据获取实时参数模型,包括:根据所述历史主键数据对所述主键字段进行业务分析,获取属性字段以及关联字段信息;根据所述属性字段、所述关联字段信息以及预设的在线规则获取所述实时参数模型。

在一种可选的方式中,所述根据所述历史主键数据以及所述实时参数模型获取实时数据,包括:以所述实时参数模型作为输入参数根据所述历史主键数据应用http协议接口、webservice协议接口、跨数据库访问获取实时数据。

在一种可选的方式中,所述对所述实时数据进行一致性分析,并获取异常数据,包括:依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致;获取不一致的异常数据,其中,所述异常数据包括差异结果索引表和差异结果明细表。

在一种可选的方式中,所述依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致,包括:判断所述第一方数据和所述第二方数据的主键是否一致;如果所述第一方数据的主键大于所述第二方数据的主键,则将所述第一方数据记为空,所述第二数据继续向下取数据;如果所述第一方数据的主键小于所述第二方数据的主键,则将所述第二方数据记为空,所述第一数据继续向下取数据;如果主键一致,则判断所述第一方数据和所述第二方数据的字符串是否一致;如果一致,则确定所述第一方数据与所述第二方数据一致;如果字符串不一致,则判断所述第一方数据和所述第二方数据的每一个属性字段是否相等;如果是,则确定所述第一方数据与所述第二方数据一致。

在一种可选的方式中,所述对所述实时数据进行一致性分析,并获取异常数据,还包括:统计所述异常数据的差异数、一致数以及一致率,其中,所述差异数为所述地市的差异数据的总和,所述一致数为所述地市的一致数据的总和,所述一致率为所有地市一致数据的占比情况,所述一致率为所述一致数/(所述一致数+所述差异数)。

根据本发明实施例的另一个方面,提供了一种异常数据分拣装置,所述装置包括:离线对比单元,用于获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;参数获取单元,用于根据所述历史主键数据获取实时参数模型;实时数据获取单元,用于根据所述历史主键数据以及所述实时参数模型获取实时数据;分析单元,用于对所述实时数据进行一致性分析,并获取异常数据。

根据本发明实施例的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述异常数据分拣方法的步骤。

根据本发明实施例的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行上述异常数据分拣方法的步骤。

本发明实施例通过获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据,能够弥补现有的比对的不实时性和不准确性,可以有效的稽核出真实差异数据,避免产生多余的异常数据。

上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的异常数据分拣方法的流程示意图;

图2示出了本发明实施例提供的异常数据分拣方法的步骤S11的流程示意图;

图3示出了本发明实施例提供的异常数据分拣方法的实时数据获取示意图;

图4示出了本发明实施例提供的异常数据分拣装置的结构示意图;

图5示出了本发明实施例提供的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

图1示出了本发明实施例提供的异常数据分拣方法的流程示意图。如图1所示,异常数据分拣方法包括:

步骤S11:获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据。

在步骤S11中,如图2所示,包括:

步骤S111:获取所述历史稽核数据并建立包括多个稽核节点的稽核流程。

在本发明实施例中,稽核流程是由许多稽核节点组成,每个节点对应各自的功能,例如二次确认功能,有对应的二次确认节点,还需配置和节点关联的必需节点以及根据各自业务所需的节点,组成一条完整的稽核流程。

步骤S112:根据所述稽核流程收集主键字段。

具体地,针对业务需求创建的规则模板,生成取数规则表,如表1所示,提取取数规则表中的主键字段。

表1取数规则表

步骤S113:根据所述主键字段对所述历史稽核数据进行离线对比获取所述历史主键数据。

具体地,根据步骤111中获取出的字段名称,去离线比对的结果中获取主键数据。

步骤S12:根据所述历史主键数据获取实时参数模型。

在步骤S12中,根据所述历史主键数据对所述主键字段进行业务分析,获取属性字段以及关联字段信息;根据所述属性字段、所述关联字段信息以及预设的在线规则获取所述实时参数模型。

在本发明实施例中,分析主键对应的属性字段和关联字段,通过业务分析,同取表1所示的规则表,获取对应的属性字段和关联字段信息。然后获取预存的在线规则,判断规则类型,从表2所示的业务稽核规则模板表、以及表3所示的中业务稽核规则模板实例表获取对应的字段。

表2业务稽核规则模板表

表3业务稽核规则模板实例表

如果规则是SQL类型,根据获取的字段组装成SQL语句,获取对应的属性和关联字段。若为脚本类型,则根据接口类型调用对应的接口来获取属性和关联字段。

至此,形成一套完整的自动稽核流程,该流程可以适用于各种业务场景,对于不同的业务,在规则配置时存在一定差异,但稽核流程可实现对业务场景的自适应。例如:对于生产资料一致性的稽核业务,可由一套相同的稽核流程来匹配不同的业务场景,最终分拣出各类异常数据。

步骤S13:根据所述历史主键数据以及所述实时参数模型获取实时数据。

在本发明实施例中,如图3所示,以所述实时参数模型作为输入参数根据所述历史主键数据应用http协议接口、webservice协议接口、跨数据库访问获取实时数据。

应用http协议接口时,通过http协议的方式,通过系统端和数据端进行报文交互,根据主键字段和辅助信息,获取需要的属性字段以及关联字段。应用webservice接口时,系统端作为webservice客户端与数据端的服务端进行交互,根据主键字段和辅助信息,获取需要的属性字段以及其他关联字段信息。应用跨数据库访问时,通过打通与生产数据库之间防火墙,直接通过ORACLE调用接口(Oracle Call Interface,OCI)接口,根据规则组成的SQL语句直接执行获取实时数据,具体可以是根据SQL语句或SQL语句块的方式获取实时数据。

步骤S14:对所述实时数据进行一致性分析,并获取异常数据。

在本发明实施例中,获取到实时数据之后,需要对其进行稽核,二次确认主要是对数据进行一致性分析,可以是对一方数据或多方数据进行稽核。在步骤S14中,首先需要判断N方是否有数据,N为大于等于2的正整数。如果一方没数据,那么该方记作空。以2方数据为例,有一方数据为空,那么分析出来的结果为01或者10。

当2方都存在数据时,在步骤S14中,依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致;获取不一致的异常数据,其中,所述异常数据包括差异结果索引表和差异结果明细表。

当2方都存在数据时,判断所述第一方数据和所述第二方数据的主键是否一致。如果所述第一方数据的主键大于所述第二方数据的主键,则将所述第一方数据记为空,所述第二数据继续向下取数据。如果所述第一方数据的主键小于所述第二方数据的主键,则将所述第二方数据记为空,所述第一数据继续向下取数据。

如果主键一致,则判断所述第一方数据和所述第二方数据的字符串是否一致。如果一致,则确定所述第一方数据与所述第二数据一致。如果字符串不一致,则判断所述第一方数据和所述第二方数据的每一个属性字段是否相等。如果是,则确定所述第一方数据与所述第二方数据一致。参见如表4所示的二次确认示意表,其中,A、B分别为对应主键,C和D为对应属性字段。

表4二次确认示意表

从表4可以看出,对主键都为aa的第一方数据和第二方数据,两者的属性字段并不完全相同,因此第一方数据和第二方数据不一致。主键为bb的第一方数据和主键为cc的第二方数据,由于主键不相同,所以两者也不一致。

本发明实施例利用生产系统数据间数据之间的关联关系,通过获取实时参数模型,在数据修复前增加二次稽核节点,避免对生产数据进行异常的修复操作;突破传统方式因人力及复杂流程的局限,通过自动梳理不同场景及业务下的数据规则形式,可以对提前采集到系统中的数据差异进行二次在线稽核,并在完成传统方式端对端数据质量差异比对的同时,提供数据异常的具体细节字段信息。

通过算法稽核出来的异常数据需要对其进行保存以及展示。在数据库中,通过2张结果表对异常数据进行储存,分别为表5所示的差异结果索引表和表6所示的差异结果明细表。

表5差异结果索引表

表6差异结果明细表

差异结果索引表中主要记录了异常数据的差异类型、主键信息,而差异结果明细表中记录了具体字段的信息。

在本发明实施例中,还统计所述异常数据的差异数、一致数以及一致率。其中,所述差异数为所述地市的差异数据的总和,所述一致数为所述地市的一致数据的总和,所述一致率为所有地市一致数据的占比情况,所述一致率为所述一致数/(所述一致数+所述差异数)。

u地市的差异数sam(u)满足以下关系式:

其中,Wui是u地市到i地市差异量的总和。例如,u地市差异量为100,i地市为200,则差异量为300。

u地市的一致数dif(u)满足以下关系式:

其中,Dui是u地市到i地市差异量的总和,例如u地市一致数为100,i地市为200,则一致数为300。

u地市的一致率rig(u)满足以下关系式:

本发明实施例通过获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据,能够弥补现有的比对的不实时性和不准确性,可以有效的稽核出真实差异数据,避免产生多余的异常数据。

图4示出了本发明实施例的异常数据分拣装置的结构示意图。如图4所示,该异常数据分拣装置包括:离线对比单元401、参数获取单元402、实时数据获取单元403以及分析单元404。其中:

离线对比单元401用于获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;参数获取单元402用于根据所述历史主键数据获取实时参数模型;实时数据获取单元403用于根据所述历史主键数据以及所述实时参数模型获取实时数据;分析单元404用于对所述实时数据进行一致性分析,并获取异常数据。

在一种可选的方式中,离线对比单元401用于:获取所述历史稽核数据并建立包括多个稽核节点的稽核流程;根据所述稽核流程收集主键字段;根据所述主键字段对所述历史稽核数据进行离线对比获取所述历史主键数据。

在一种可选的方式中,参数获取单元402用于:根据所述历史主键数据对所述主键字段进行业务分析,获取属性字段以及关联字段信息;根据所述属性字段、所述关联字段信息以及预设的在线规则获取所述实时参数模型。

在一种可选的方式中,实时数据获取单元403用于:以所述实时参数模型作为输入参数根据所述历史主键数据应用http协议接口、webservice协议接口、跨数据库访问获取实时数据。

在一种可选的方式中,分析单元404用于:依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致;获取不一致的异常数据,其中,所述异常数据包括差异结果索引表和差异结果明细表。

在一种可选的方式中,分析单元404用于:判断所述第一方数据和所述第二方数据的主键是否一致;如果所述第一方数据的主键大于所述第二方数据的主键,则将所述第一方数据记为空,所述第二数据继续向下取数据;如果所述第一方数据的主键小于所述第二方数据的主键,则将所述第二方数据记为空,所述第一数据继续向下取数据;如果主键一致,则判断所述第一方数据和所述第二方数据的字符串是否一致;如果一致,则确定所述第一方数据与所述第二方数据一致;如果字符串不一致,则判断所述第一方数据和所述第二方数据的每一个属性字段是否相等;如果是,则确定所述第一方数据与所述第二方数据一致。

在一种可选的方式中,分析单元404用于:统计所述异常数据的差异数、一致数以及一致率,其中,所述差异数为所述地市的差异数据的总和,所述一致数为所述地市的一致数据的总和,所述一致率为所有地市一致数据的占比情况,所述一致率为所述一致数/(所述一致数+所述差异数)。

本发明实施例通过获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据,能够弥补现有的比对的不实时性和不准确性,可以有效的稽核出真实差异数据,避免产生多余的异常数据。

本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的异常数据分拣方法。

可执行指令具体可以用于使得处理器执行以下操作:

获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;

根据所述历史主键数据获取实时参数模型;

根据所述历史主键数据以及所述实时参数模型获取实时数据;

对所述实时数据进行一致性分析,并获取异常数据。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

获取所述历史稽核数据并建立包括多个稽核节点的稽核流程;

根据所述稽核流程收集主键字段;

根据所述主键字段对所述历史稽核数据进行离线对比获取所述历史主键数据。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

根据所述历史主键数据对所述主键字段进行业务分析,获取属性字段以及关联字段信息;

根据所述属性字段、所述关联字段信息以及预设的在线规则获取所述实时参数模型。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

以所述实时参数模型作为输入参数根据所述历史主键数据应用http协议接口、webservice协议接口、跨数据库访问获取实时数据。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致;

获取不一致的异常数据,其中,所述异常数据包括差异结果索引表和差异结果明细表。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

判断所述第一方数据和所述第二方数据的主键是否一致;如果所述第一方数据的主键大于所述第二方数据的主键,则将所述第一方数据记为空,所述第二数据继续向下取数据;如果所述第一方数据的主键小于所述第二方数据的主键,则将所述第二方数据记为空,所述第一数据继续向下取数据;

如果主键一致,则判断所述第一方数据和所述第二方数据的字符串是否一致;如果一致,则确定所述第一方数据与所述第二方数据一致;

如果字符串不一致,则判断所述第一方数据和所述第二方数据的每一个属性字段是否相等;如果是,则确定所述第一方数据与所述第二方数据一致。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

统计所述异常数据的差异数、一致数以及一致率,其中,所述差异数为所述地市的差异数据的总和,所述一致数为所述地市的一致数据的总和,所述一致率为所有地市一致数据的占比情况,所述一致率为所述一致数/(所述一致数+所述差异数)。

本发明实施例通过获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据,能够弥补现有的比对的不实时性和不准确性,可以有效的稽核出真实差异数据,避免产生多余的异常数据。

本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任意方法实施例中的异常数据分拣方法。

可执行指令具体可以用于使得处理器执行以下操作:

获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;

根据所述历史主键数据获取实时参数模型;

根据所述历史主键数据以及所述实时参数模型获取实时数据;

对所述实时数据进行一致性分析,并获取异常数据。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

获取所述历史稽核数据并建立包括多个稽核节点的稽核流程;

根据所述稽核流程收集主键字段;

根据所述主键字段对所述历史稽核数据进行离线对比获取所述历史主键数据。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

根据所述历史主键数据对所述主键字段进行业务分析,获取属性字段以及关联字段信息;

根据所述属性字段、所述关联字段信息以及预设的在线规则获取所述实时参数模型。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

以所述实时参数模型作为输入参数根据所述历史主键数据应用http协议接口、webservice协议接口、跨数据库访问获取实时数据。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致;

获取不一致的异常数据,其中,所述异常数据包括差异结果索引表和差异结果明细表。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

判断所述第一方数据和所述第二方数据的主键是否一致;如果所述第一方数据的主键大于所述第二方数据的主键,则将所述第一方数据记为空,所述第二数据继续向下取数据;如果所述第一方数据的主键小于所述第二方数据的主键,则将所述第二方数据记为空,所述第一数据继续向下取数据;

如果主键一致,则判断所述第一方数据和所述第二方数据的字符串是否一致;如果一致,则确定所述第一方数据与所述第二方数据一致;

如果字符串不一致,则判断所述第一方数据和所述第二方数据的每一个属性字段是否相等;如果是,则确定所述第一方数据与所述第二方数据一致。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

统计所述异常数据的差异数、一致数以及一致率,其中,所述差异数为所述地市的差异数据的总和,所述一致数为所述地市的一致数据的总和,所述一致率为所有地市一致数据的占比情况,所述一致率为所述一致数/(所述一致数+所述差异数)。

本发明实施例通过获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据,能够弥补现有的比对的不实时性和不准确性,可以有效的稽核出真实差异数据,避免产生多余的异常数据。

图5示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对设备的具体实现做限定。

如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。处理器502,用于执行程序510,具体可以执行上述异常数据分拣方法实施例中的相关步骤。

具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或各个集成电路。设备包括的一个或各个处理器,可以是同一类型的处理器,如一个或各个CPU;也可以是不同类型的处理器,如一个或各个CPU以及一个或各个ASIC。

存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行以下操作:

获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;

根据所述历史主键数据获取实时参数模型;

根据所述历史主键数据以及所述实时参数模型获取实时数据;

对所述实时数据进行一致性分析,并获取异常数据。

在一种可选的方式中,所述程序510使所述处理器执行以下操作:

获取所述历史稽核数据并建立包括多个稽核节点的稽核流程;

根据所述稽核流程收集主键字段;

根据所述主键字段对所述历史稽核数据进行离线对比获取所述历史主键数据。

在一种可选的方式中,所述程序510使所述处理器执行以下操作:

根据所述历史主键数据对所述主键字段进行业务分析,获取属性字段以及关联字段信息;

根据所述属性字段、所述关联字段信息以及预设的在线规则获取所述实时参数模型。

在一种可选的方式中,所述程序510使所述处理器执行以下操作:

以所述实时参数模型作为输入参数根据所述历史主键数据应用http协议接口、webservice协议接口、跨数据库访问获取实时数据。

在一种可选的方式中,所述程序510使所述处理器执行以下操作:

依次对进行一致性分析的第一方数据和第二方数据的主键、字符串以及属性字段判断是否一致;

获取不一致的异常数据,其中,所述异常数据包括差异结果索引表和差异结果明细表。

在一种可选的方式中,所述程序510使所述处理器执行以下操作:

判断所述第一方数据和所述第二方数据的主键是否一致;如果所述第一方数据的主键大于所述第二方数据的主键,则将所述第一方数据记为空,所述第二数据继续向下取数据;如果所述第一方数据的主键小于所述第二方数据的主键,则将所述第二方数据记为空,所述第一数据继续向下取数据;

如果主键一致,则判断所述第一方数据和所述第二方数据的字符串是否一致;如果一致,则确定所述第一方数据与所述第二方数据一致;

如果字符串不一致,则判断所述第一方数据和所述第二方数据的每一个属性字段是否相等;如果是,则确定所述第一方数据与所述第二方数据一致。

在一种可选的方式中,所述程序510使所述处理器执行以下操作:

统计所述异常数据的差异数、一致数以及一致率,其中,所述差异数为所述地市的差异数据的总和,所述一致数为所述地市的一致数据的总和,所述一致率为所有地市一致数据的占比情况,所述一致率为所述一致数/(所述一致数+所述差异数)。

本发明实施例通过获取历史稽核数据并根据所述历史稽核数据进行离线对比获取历史主键数据;根据所述历史主键数据获取实时参数模型;根据所述历史主键数据以及所述实时参数模型获取实时数据;对所述实时数据进行一致性分析,并获取异常数据,能够弥补现有的比对的不实时性和不准确性,可以有效的稽核出真实差异数据,避免产生多余的异常数据。

在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

相关技术
  • 异常数据分拣方法、装置、计算设备及计算机存储介质
  • 疾病异常数据检测方法及装置、计算机装置及存储介质
技术分类

06120113066832