掌桥专利:专业的专利平台
掌桥专利
首页

基于进销项发票差异进行企业异常行为监控的方法及系统

文献发布时间:2023-06-19 10:51:07


基于进销项发票差异进行企业异常行为监控的方法及系统

技术领域

本发明涉及税务监控技术领域,并且更具体地,涉及一种基于进销项发票差异进行企业异常行为监控的方法及系统。

背景技术

现在税局利用税收大数据开展税收风险分析,对于明显涉嫌偷税(逃避缴纳税款)、逃避追缴欠税、骗税、抗税、虚开发票等税收违法线索的相关企业,依法实施税务检查,切实维护国家税收安全。目前,现有的虚开发票稽查方法以专家经验为主,辅助以部分大数据分析预测方式。由于发票链条比较长,基于专家经验的数据筛查不能全面覆盖虚开发票的行业或地区特点,从而导致一种分析方法只适合于一种虚开发票的稽查工作。

发明内容

本发明提出一种基于进销项发票差异进行企业异常行为监控的方法及系统,以解决如何对企业异常行为进行监控的问题。

为了解决上述问题,根据本发明的一个方面,提供了一种基于进销项发票差异进行企业异常行为监控的方法,所述方法包括:

分别获取企业在预设时间段内的进项发票数据和销项发票数据,并根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理;

基于纳税人名称和物品名称分别对经过过滤处理的进项发票数据和销项发票数据按照预时间周期进行聚合,以获取每个纳税人对应的进项物品聚合列表和销项物品聚合列表;

基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度;

将每个纳税人的进销项差异度和预设的进销项差异度阈值进行比较,并当确定某个纳税人的进销项差异度大于预设的进销项差异度阈值时,确定该纳税人为异常纳税主体,并发送与所述异常纳税主体相关的告警信息至监管部门。

优选地,其中所述根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理,包括:

剔除发票合计金额小于预设金额阈值的进项发票数据和销项发票数据。

优选地,其中所述基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度,包括:

当某纳税人对应的进项物品聚合列表和/或销项物品列表中某物品的进项/销项为空时,确定该纳税人对应的该物品的物品差异度为预设差异度阈值;

当纳税人对应的进项物品聚合列表和销项物品列表均不为空时,基于进项聚合列表和销项聚合列表进行联合查询,将物品名称相等的数据去除,并使用spark遍历每个纳税人,循环对比进项物品聚合列表和销项物品聚合列表中的所有物品,以确定每个纳税人对应的进项物品和销项物品的差异度,形成一个二维矩阵;根据所述二位矩阵基于匈牙利算法进行最佳匹配得到一个匹配列表,根据所述匹配列表确定每个物品相对整个物品列表的物品差异度;

将每个纳税人对应的所有物品的物品差异度进行累加,以获取每个纳税人对应的进销项差异度。

优选地,其中所述预设差异度阈值为1。

优选地,其中所述方法还包括:

在对进项发票数据和销项发票数据进行聚合之前,对进项发票数据和销项发票数据进行特殊票排重处理;其中,所述特殊票包括:红票和废票。

根据本发明的另一个方面,提供了一种基于进销项发票差异进行企业异常行为监控的系统,所述系统包括:

数据获取单元,用于分别获取企业在预设时间段内的进项发票数据和销项发票数据,并根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理;

聚合单元,用于基于纳税人名称和物品名称分别对经过过滤处理的进项发票数据和销项发票数据按照预时间周期进行聚合,以获取每个纳税人对应的进项物品聚合列表和销项物品聚合列表;

进销项差异度确定单元,用于基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度;

异常监控单元,用于将每个纳税人的进销项差异度和预设的进销项差异度阈值进行比较,并当确定某个纳税人的进销项差异度大于预设的进销项差异度阈值时,确定该纳税人为异常纳税主体,并发送与所述异常纳税主体相关的告警信息至监管部门。

优选地,其中所述数据获取单元,根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理,包括:

剔除发票合计金额小于预设金额阈值的进项发票数据和销项发票数据。

优选地,其中所述进销项差异度确定单元,基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度,包括:

当某纳税人对应的进项物品聚合列表和/或销项物品列表中某物品的进项/销项为空时,确定该纳税人对应的该物品的物品差异度为预设差异度阈值;

当纳税人对应的进项物品聚合列表和销项物品列表均不为空时,基于进项聚合列表和销项聚合列表进行联合查询,将物品名称相等的数据去除,并使用spark遍历每个纳税人,循环对比进项物品聚合列表和销项物品聚合列表中的所有物品,以确定每个纳税人对应的进项物品和销项物品的差异度,形成一个二维矩阵;根据所述二位矩阵基于匈牙利算法进行最佳匹配得到一个匹配列表,根据所述匹配列表确定每个物品相对整个物品列表的物品差异度;

将每个纳税人对应的所有物品的物品差异度进行累加,以获取每个纳税人对应的进销项差异度。

优选地,其中所述预设差异度阈值为1。

优选地,其中所述数据获取单元,还包括:

在对进项发票数据和销项发票数据进行聚合之前,对进项发票数据和销项发票数据进行特殊票排重处理;其中,所述特殊票包括:红票和废票。

本发明提供了一种基于进销项发票差异进行企业异常行为监控的方法及系统,通过对纳税人在预设时间段内的进项发票和销项发票进行分析,从而确定纳税人的进销项差异度,并根据进销项差异度和预设的进销项差异度阈值,确定异常纳税主体,从而对企业异常行为进行监控;其中,进销项差异度分析的参数可以灵活设置,不同纳税人的进销项差异度也可以根据分析人员的要求进行排序,以使分析人员根据排序结果衡量纳税人进销商品之间的合理性,通过该方法,经过一段时间训练,参数和排序方式固化后,也可以启动自动识别设置,将问题纳税主体清单定时发送给其他监管部门,辅助识别异常行为判断。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明实施方式的基于进销项发票差异进行企业异常行为监控的方法100的流程图;

图2为根据本发明实施方式的基于进销项发票差异进行企业异常行为监控的系统200的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

图1为根据本发明实施方式的基于进销项发票差异进行企业异常行为监控的方法100的流程图。如图1所示,本发明实施方式提供的基于进销项发票差异进行企业异常行为监控的方法,通过对纳税人在预设时间段内的进项发票和销项发票进行分析,从而确定纳税人的进销项差异度,并根据进销项差异度和预设的进销项差异度阈值,确定异常纳税主体,从而对企业异常行为进行监控;其中,进销项差异度分析的参数可以灵活设置,不同纳税人的进销项差异度也可以根据分析人员的要求进行排序,以使分析人员根据排序结果衡量纳税人进销商品之间的合理性,通过该方法,经过一段时间训练,参数和排序方式固化后,也可以启动自动识别设置,将问题纳税主体清单定时发送给其他监管部门,辅助识别异常行为判断。本发明实施方式提供的基于进销项发票差异进行企业异常行为监控的方法100,从步骤101处开始,在步骤101分别获取企业在预设时间段内的进项发票数据和销项发票数据,并根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理。

优选地,其中所述根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理,包括:

剔除发票合计金额小于预设金额阈值的进项发票数据和销项发票数据。

优选地,其中所述方法还包括:

在对进项发票数据和销项发票数据进行聚合之前,对进项发票数据和销项发票数据进行特殊票排重处理;其中,所述特殊票包括:红票和废票。

在对本发明中,首先获取企业进销项发票全票面信息,以完成数据采集,然后对获取的数据进行过滤和排重处理。具体地,通过过滤发票小于开票总额的某一区域值的数据实现过滤。例如,将发票合计金额小于5000的数据删除。排重处理是在对进项发票数据和销项发票数据进行聚合之前,对进项发票数据和销项发票数据中的红票和废票去除,排出干扰发票。

在步骤102,基于纳税人名称和物品名称分别对经过过滤处理的进项发票数据和销项发票数据按照预时间周期进行聚合,以获取每个纳税人对应的进项物品聚合列表和销项物品聚合列表。

在本发明中,根据纳税人信息分别对进项发票数据和销项发票数据进行分析,获取进项物品聚合列表和销项物品聚合列表。其中,通过进项分析将选定物品按月做聚合,按照购方纳税人和物品名称做聚合,得到每个纳税人进项物品聚合列表;通过销项分析将选定物品按月做聚合,按照销方纳税人和物品名称做聚合,得到每个纳税人销项物品聚合列表。

在步骤103,基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度。

优选地,其中所述基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度,包括:

当某纳税人对应的进项物品聚合列表和/或销项物品列表中某物品的进项/销项为空时,确定该纳税人对应的该物品的物品差异度为预设差异度阈值;

当纳税人对应的进项物品聚合列表和销项物品列表均不为空时,基于进项聚合列表和销项聚合列表进行联合查询,将物品名称相等的数据去除,并使用spark遍历每个纳税人,循环对比进项物品聚合列表和销项物品聚合列表中的所有物品,以确定每个纳税人对应的进项物品和销项物品的差异度,形成一个二维矩阵;根据所述二位矩阵基于匈牙利算法进行最佳匹配得到一个匹配列表,根据所述匹配列表确定每个物品相对整个物品列表的物品差异度;

将每个纳税人对应的所有物品的物品差异度进行累加,以获取每个纳税人对应的进销项差异度。

优选地,其中所述预设差异度阈值为1。

在本发明中国,计算进销项差异度分为:物品的进项为空、销项为空和进销项都不为空三类进行计算。为计算某些特定物品的差异度分析,可以在物品差异度的经验参数中进行调整。

对于进项为空的物品,遍历每个进项为空的纳税人,以设置每个进项为空的纳税人对应的该物品的物品差异度为预设差异度阈值1;同样地,对于销项为空的物品,遍历每个销项为空的纳税人,以设置每个销项为空的纳税人对应的该物品的物品差异度为预设差异度阈值1。对于进销项都不为空的物品,确定差异度的过程包括:通过将进项物品聚合列表和销项物品聚合列表进行联合查询,得到每个纳税人的进销项物品列表;将物品名称相等的直接拿出来和所有物品差异度都小于经验参数的直接不计算,差异度为0;将剩下的物品做匈牙利算法,使用spark遍历每个纳税人,循环对比进项物品列表和销项物品列表中的所有物品计算进项物品和销项物品的差异度,形成一个二维矩阵,使用匈牙利算法求得最佳匹配得到一个匹配列表,基于匹配得到的结果求出每个物品相对整个进销项物品列表的差异度。最后,将每个纳税人对应的所有物品的物品差异度进行累加,以获取每个纳税人对应的进销项差异度。

步骤104,将每个纳税人的进销项差异度和预设的进销项差异度阈值进行比较,并当确定某个纳税人的进销项差异度大于预设的进销项差异度阈值时,确定该纳税人为异常纳税主体,并发送与所述异常纳税主体相关的告警信息至监管部门。

在本发明中,按照进销项差异度数值的大小对企业进行排序,用户可以设置进销项差异度阈值,超过预设的进销项差异度阈值的企业将被筛查出来,作为异常纳税主体,并发送与所述异常纳税主体相关的告警信息至监管部门。

基于本发明的方法还可以灵活配置采样发票范围和发票类型,利用参数配置,可提高方法的复用范围,当方法应用成功案例增加时,某些参数可以固化成为差异监控模型而独立应用。另外,系统采用的大数据分析方法,提高计算速度。

图2为根据本发明实施方式的基于进销项发票差异进行企业异常行为监控的系统200的结构示意图。如图2所示,本发明实施方式提供的基于进销项发票差异进行企业异常行为监控的系统200,包括:数据获取单元201、聚合单元202、进销项差异度确定单元203和异常监控单元204。

优选地,所述数据获取单元201,用于分别获取企业在预设时间段内的进项发票数据和销项发票数据,并根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理。

优选地,其中所述数据获取单元201,根据预设的过滤条件对所述进项发票数据和销项发票数据进行过滤处理,包括:

剔除发票合计金额小于预设金额阈值的进项发票数据和销项发票数据。

优选地,其中所述数据获取单元201,还包括:

在对进项发票数据和销项发票数据进行聚合之前,对进项发票数据和销项发票数据进行特殊票排重处理;其中,所述特殊票包括:红票和废票。

优选地,所述聚合单元202,用于基于纳税人名称和物品名称分别对经过过滤处理的进项发票数据和销项发票数据按照预时间周期进行聚合,以获取每个纳税人对应的进项物品聚合列表和销项物品聚合列表。

优选地,所述进销项差异度确定单元203,用于基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度。

优选地,其中所述进销项差异度确定单元203,基于每个纳税人对应的进项物品聚合列表和销项物品聚合列表按照预设的差异度确定策略确定每个纳税人的进销项差异度,包括:

当某纳税人对应的进项物品聚合列表和/或销项物品列表中某物品的进项/销项为空时,确定该纳税人对应的该物品的物品差异度为预设差异度阈值;

当纳税人对应的进项物品聚合列表和销项物品列表均不为空时,基于进项聚合列表和销项聚合列表进行联合查询,将物品名称相等的数据去除,并使用spark遍历每个纳税人,循环对比进项物品聚合列表和销项物品聚合列表中的所有物品,以确定每个纳税人对应的进项物品和销项物品的差异度,形成一个二维矩阵;根据所述二位矩阵基于匈牙利算法进行最佳匹配得到一个匹配列表,根据所述匹配列表确定每个物品相对整个物品列表的物品差异度;

将每个纳税人对应的所有物品的物品差异度进行累加,以获取每个纳税人对应的进销项差异度。

优选地,其中所述预设差异度阈值为1。

优选地,所述异常监控单元204,用于将每个纳税人的进销项差异度和预设的进销项差异度阈值进行比较,并当确定某个纳税人的进销项差异度大于预设的进销项差异度阈值时,确定该纳税人为异常纳税主体,并发送与所述异常纳税主体相关的告警信息至监管部门。

本发明的实施例的基于进销项发票差异进行企业异常行为监控的系统200与本发明的另一个实施例的基于进销项发票差异进行企业异常行为监控的方法100相对应,在此不再赘述。

已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

相关技术
  • 基于进销项发票差异进行企业异常行为监控的方法及系统
  • 一种基于进销项比对的生产企业发票虚开风险评估方法
技术分类

06120112706772