掌桥专利:专业的专利平台
掌桥专利
首页

一种基于银行流水收支重合度的不规范行为判断方法

文献发布时间:2023-06-19 12:02:28


一种基于银行流水收支重合度的不规范行为判断方法

技术领域

本发明涉及金融数据处理技术领域,尤其涉及一种基于银行流水收支重合度的不规范行为判断方法。

背景技术

银行的电子流水记录着大量个人和公司的现金交易,从银行的电子流水中我们可以获取大量信息来达到某些目的。例如我们可以利用银行的电子流水来检验一个企业是否存在洗钱的行为。洗钱一般发生在两种情况下:企业频繁有大笔金钱转入和流出;没有正当的资金来源或没有正当的资金流向。在第一种情况下,企业的标准洗钱方式是收到大笔的收入,然后在短时间内分成几笔转出。针对第一种情况,目前的方法主要是靠人力去筛选和甄别。然而,要用人工去一条条筛查大笔金钱转入和流出费时费力,还容易出错;如何用人工去断定大笔金额的具体数值是另一个难点。我们急需一种方法迅速地判断企业潜在的洗钱行为。

发明内容

鉴于目前存在的上述不足,本发明提供一种基于银行流水收支重合度的不规范行为判断方法,通过自动识别计算企业银行流水中的收支重合度,甄别企业潜在的不规范行为。

为达到上述目的,本发明的实施例采用如下技术方案:

一种银行流水收支重合度计算方法,所述银行流水收支重合度计算方法包括以下步骤:

读取银行电子流水信息;

筛选出具有大额收入的账户;

计算账户中所有大额收入的转出时长;

计算单位时间内账户的收支重合度。

依照本发明的一个方面,所述筛选出具有大额收入的账户包括以下步骤:

选取银行流水中本方名称为企业名称的账户的数据;

使用三西格玛准则确定账户中是否有大额收入;

若有大额收入则将该大额收入输出。

依照本发明的一个方面,所述转出时长的定义为:每一条大额收入的金额全部花出去所需的时间。

依照本发明的一个方面,所述计算账户中所有大额收入的转出时长包括以下步骤:

以出现大额收入这一条银行流水作为起点,计算大额收入之后的每一条支出并进行加总,直到总支出大于等于这笔大额收入;

计算大额收入开始的时间和总支出大于等于这笔大额收入的时间差作为这一笔大额收入的转出时长。

依照本发明的一个方面,所述计算账户中所有大额收入的转出时长还包括以下步骤:

计算账户中所有的大额收入的转出时长;

计算账户中所有的大额收入的转出时长的平均数和中位数;

如果遇到某一笔或多笔大额收入在没有在账号结束时完全转出,则删除这条大额收入。

依照本发明的一个方面,所述单位时间内账户的收支重合度定义为:以一单位时间作为一个滑动窗口计算单位时间内内的总收入和下一个单位时间内的总支出的比值。

依照本发明的一个方面,所述计算单位时间内账户的收支重合度包括:

计算出整个银行流水一共有多少天,设单位时间为N天;

从银行流水中时间最早的条目开始计算1至N天内的总收入;

计算N+1至2N天内的总支出;

计算1至N天内的总收入/N+1至2N天内的总支出,得出一个N天内账户收支重合度;

将整个滑块向后移动一天,再重复进行计算;

当出现支出或收入为0的时候,不参与计算。

依照本发明的一个方面,所述计算单位时间内账户的收支重合度还包括:计算所有N天内企业收支重合度的平均数和中位数。

一种基于银行流水收支重合度的不规范行为判断方法,所述基于银行流水收支重合度的不规范行为判断方法包括以下步骤:

读取银行电子流水信息;

筛选出具有大额收入的账户;

计算账户中所有大额收入的转出时长;

计算单位时间内账户的收支重合度;

根据转出时长和收支重合度判断账户是否存在不规范行为。

依照本发明的一个方面,所述根据转出时长和收支重合度判断账户是否存在不规范行为包括:获取多账户的转出时长和收支重合度分布情况,根据分布情况划定正常范围区间,在某账户的转出时长和收支重合度超出正常范围区间时则判断该账户存在不规范行为。

本发明实施的优点:本发明所述的基于银行流水收支重合度的不规范行为判断方法,包括以下步骤:读取银行电子流水信息;筛选出具有大额收入的账户;计算账户中所有大额收入的转出时长;计算单位时间内账户的收支重合度;根据转出时长和收支重合度判断账户是否存在不规范行为;通过计算企业银行流水中的一些变量,能够自动识别账户银行电子流水中大额的收入条目、转出时长、一段时间内的收入支出比例,从而达到甄别企业潜在的不规范行为。利用已有的银行电子流水来自动筛选出企业的大额收入并计算收支相关的一些变量(‘转出时长’,‘N天内企业收支重合度’),迅速地判断企业潜在的洗钱或者异常行为,这个方法省去了人工的成本,不需要人工去逐条筛选,在省时的情况下还保证了准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例一所述的一种银行流水收支重合度计算方法示意图;

图2为本发明实施例二所述的一种基于银行流水收支重合度的不规范行为判断方法示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

如图1所示,一种银行流水收支重合度计算方法,所述银行流水收支重合度计算方法包括以下步骤:

步骤S1:读取银行电子流水信息;

所述步骤S1读取银行电子流水信息具体为:读取标准化银行电子流水(包含八要素:本方账号,本方名称,交易金额,交易对手方名称,交易对手方账号,交易时间,账户余额,交易附言);

步骤S2:筛选出具有大额收入的账户;

所述步骤S2筛选出具有大额收入的账户包括以下步骤:

S21:选取银行流水中本方名称为企业名称的账户的数据;

S22:使用三西格玛准则确定账户中是否有大额收入;

S23:若有大额收入则将该大额收入输出。

其中,所述三西格玛准则为:它是先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。

在实际应用中,如果没有大额收入则所有的输出参数都默认为0。

步骤S3:计算账户中所有大额收入的转出时长;

所述步骤S3计算账户中所有大额收入的转出时长具体包括:

首先定义所述转出时长为:每一条大额收入的金额全部花出去所需的时间。

具体方法如下:

以出现大额收入这一条银行流水作为起点,计算大额收入之后的每一条支出并进行加总,直到总支出大于等于这笔大额收入;

计算大额收入开始的时间和总支出大于等于这笔大额收入的时间差作为这一笔大额收入的转出时长。

在实际应用中,所述计算账户中所有大额收入的转出时长还包括以下步骤:

计算账户中所有的大额收入的转出时长;

计算账户中所有的大额收入的转出时长的平均数和中位数;

如果遇到某一笔或多笔大额收入在没有在账号结束时完全转出,则删除这条大额收入。

其中,所述平均数为:An=(a1+a2+a3+…+an)/n;

所述中位数为:按顺序排列的一组数据中居于中间位置的数。

步骤S4:计算单位时间内账户的收支重合度。

所述步骤S4计算单位时间内账户的收支重合度包括:

首先定义所述单位时间内账户的收支重合度为:以一单位时间作为一个滑动窗口计算单位时间内内的总收入和下一个单位时间内的总支出的比值。

在实际应用中,所述单位时间一般定义为N天,N为大于0的自然数,例如:1月1日3:00开始计算,那么以5天作为一个滑动窗口,计算1月1日3:00至1月5日3:00内的总收入/1月5日3:00至1月9日3:00内的总支出。在实际应用中,所述计算单位时间内账户的收支重合度包括:

S41:计算出整个银行流水一共有多少天,设单位时间为N天;

S42:从银行流水中时间最早的条目开始计算1至N天内的总收入;

S43:计算N+1至2N天内的总支出;

S44:计算1至N天内的总收入/N+1至2N天内的总支出,得出一个N天内账户收支重合度;

S45:将整个滑块向后移动一天,再重复上述步骤进行计算;

当出现支出或收入为0的时候,不参与计算。

以N=3为例:计算1月1日-1月3日的总收入/1月4日-1月6日的总支出,得出一个“N天内企业收支重合度”;

再计算1月2日-1月4日的总收入/1月5日-1月7日的总支出,得出一个“N天内企业收支重合度”;

再计算1月3日-1月5日的总收入/1月6日-1月8日的总支出,得出一个“N天内企业收支重合度”,以此类推。

在实际应用中,所述计算单位时间内账户的收支重合度还包括:计算所有N天内企业收支重合度的平均数和中位数。

实施例二

如图2所示,一种基于银行流水收支重合度的不规范行为判断方法,所述基于银行流水收支重合度的不规范行为判断方法包括以下步骤:

步骤S1:读取银行电子流水信息;

所述步骤S1读取银行电子流水信息具体为:读取标准化银行电子流水(包含八要素:本方账号,本方名称,交易金额,交易对手方名称,交易对手方账号,交易时间,账户余额,交易附言);

步骤S2:筛选出具有大额收入的账户;

所述步骤S2筛选出具有大额收入的账户包括以下步骤:

S21:选取银行流水中本方名称为企业名称的账户的数据;

S22:使用三西格玛准则确定账户中是否有大额收入;

S23:若有大额收入则将该大额收入输出。

其中,所述三西格玛准则为:它是先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。

在实际应用中,如果没有大额收入则所有的输出参数都默认为0。

步骤S3:计算账户中所有大额收入的转出时长;

所述步骤S3计算账户中所有大额收入的转出时长具体包括:

首先定义所述转出时长为:每一条大额收入的金额全部花出去所需的时间。

具体方法如下:

以出现大额收入这一条银行流水作为起点,计算大额收入之后的每一条支出并进行加总,直到总支出大于等于这笔大额收入;

计算大额收入开始的时间和总支出大于等于这笔大额收入的时间差作为这一笔大额收入的转出时长。

在实际应用中,所述计算账户中所有大额收入的转出时长还包括以下步骤:

计算账户中所有的大额收入的转出时长;

计算账户中所有的大额收入的转出时长的平均数和中位数;

如果遇到某一笔或多笔大额收入在没有在账号结束时完全转出,则删除这条大额收入。

其中,所述平均数为:An=(a1+a2+a3+…+an)/n;

所述中位数为:按顺序排列的一组数据中居于中间位置的数。

步骤S4:计算单位时间内账户的收支重合度。

所述步骤S4计算单位时间内账户的收支重合度包括:

首先定义所述单位时间内账户的收支重合度为:以一单位时间作为一个滑动窗口计算单位时间内内的总收入和下一个单位时间内的总支出的比值。

在实际应用中,所述单位时间一般定义为N天,N为大于0的自然数,例如:1月1日3:00开始计算,那么以5天作为一个滑动窗口,计算1月1日3:00至1月5日3:00内的总收入/1月5日3:00至1月9日3:00内的总支出。在实际应用中,所述计算单位时间内账户的收支重合度包括:

S41:计算出整个银行流水一共有多少天,设单位时间为N天;

S42:从银行流水中时间最早的条目开始计算1至N天内的总收入;

S43:计算N+1至2N天内的总支出;

S44:计算1至N天内的总收入/N+1至2N天内的总支出,得出一个N天内账户收支重合度;

S45:将整个滑块向后移动一天,再重复上述步骤进行计算;

当出现支出或收入为0的时候,不参与计算。

以N=3为例:计算1月1日-1月3日的总收入/1月4日-1月6日的总支出,得出一个“N天内企业收支重合度”;

再计算1月2日-1月4日的总收入/1月5日-1月7日的总支出,得出一个“N天内企业收支重合度”;

再计算1月3日-1月5日的总收入/1月6日-1月8日的总支出,得出一个“N天内企业收支重合度”,以此类推。

在实际应用中,所述计算单位时间内账户的收支重合度还包括:计算所有N天内企业收支重合度的平均数和中位数。

步骤S5:根据转出时长和收支重合度判断账户是否存在不规范行为。

所述步骤S5所述根据转出时长和收支重合度判断账户是否存在不规范行为包括:获取多账户的转出时长和收支重合度分布情况,根据分布情况划定正常范围区间,在某账户的转出时长和收支重合度超出正常范围区间时则判断该账户存在不规范行为。

在实际应用中,对企业账户根据行业进行分类,不同行业的账户分布情况不同,因此设定不同的区间。

在实际应用中,具体过程可为:将多家企业的银行流水账号按照行业进行分类,并画出一个行业的转出时长和收支重合度的分布。将行业中每一个账号的转出时长和收支重合度从短到长排序,找到第5和第95分位的值作为的临界值(临界值1,临界值2)。如果某一个账户的转出时长和收支重合小于对应行业的临界值1或者大于对应行业的临界值2,则定义账户是否存在不规范行为。

本发明实施的优点:本发明所述的基于银行流水收支重合度的不规范行为判断方法,包括以下步骤:读取银行电子流水信息;筛选出具有大额收入的账户;计算账户中所有大额收入的转出时长;计算单位时间内账户的收支重合度;根据转出时长和收支重合度判断账户是否存在不规范行为;通过计算企业银行流水中的一些变量,能够自动识别账户银行电子流水中大额的收入条目、转出时长、一段时间内的收入支出比例,从而达到甄别企业潜在的不规范行为。利用已有的银行电子流水来自动筛选出企业的大额收入并计算收支相关的一些变量(‘转出时长’,‘N天内企业收支重合度’),迅速地判断企业潜在的洗钱或者异常行为,这个方法省去了人工的成本,不需要人工去逐条筛选,在省时的情况下还保证了准确率。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种基于银行流水收支重合度的不规范行为判断方法
  • 一种用于判断车辆直线来回行驶重合度的计算方法
技术分类

06120113147285