掌桥专利:专业的专利平台
掌桥专利
首页

一种基于关联分析的金融对象单项异常属性分析方法

文献发布时间:2023-06-19 09:32:16


一种基于关联分析的金融对象单项异常属性分析方法

技术领域

本发明涉及金融数据分析,特别是涉及一种基于关联分析的金融对象单项异常属性分析 方法。

背景技术

就当今社会而言,移动支付已成主流,怎样提交交易成功率增强用户体验是各支付企业 及相关商户和银行机构需要关注的问题。支付是一个长链路交易活动,参与方众多,包括: 持卡人或者支付用户、商户、收单机构、发卡机构、网联或者银联等相关机构,引起交易失 败的因素可能是单个因素,但更多的是多因素组合或者叠加,很多失败因素不能简单通过一 个点来判断。另外,目前交易的成功率都非常高,一般整体交易成功率在99%左右,面对海 量的支付交易数据,怎样查找和发现交易失败的问题和原因是非常困难的一件事情。

对于失败交易的数据,可以通过失败数据在不同对象或不同属性下的占比来分析失败原 因,但是支付失败交易数据具有比较明显的几个特征:一、海量数据;二、数据倾斜非常严 重(失败交易占比非常少);三、小机构或者商户(包括某类业务)数据极其容易被淹没,例如: 某机构有较高的交易成功率98%,但某类新业务由于某些原因失败率却很高,几乎全部失败, 要从整体来看很难发现这类小业务量交易。

同时,对于失败的交易数据,也可以通过金融系统反馈的失败应答码来判别交易失败原 因,但是,目前有些失败应答码会涉及多个属性,这种情况下无法得到较为明确的分析结果, 不利于快速确定异常属性。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于关联分析的金融对象单项异常属 性分析方法,能够通过对金融交易数据的处理和关联分析,快速确定异常金融对象,并进行 分析筛选获得较为准确的单项异常属性集合,有助于较为快速和完整地确定交易失败的原因。

本发明的目的是通过以下技术方案来实现的:一种基于关联分析的金融对象单项异常属 性分析方法,包括以下步骤:

S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的 对象信息,将待筛选的金融交易数据划分到每一个对象下;

S2.计算每一个对象下的交易失败率和失败贡献度;

S3.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的 边界条件和正常属性的边界条件;

S4.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正 常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;

S5.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素 作为目标金融对象的属性;

S6.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项 异常属性集合A;

S7.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B;

S8.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集 D中的每一个元素均为该目标金融对象的单项异常属性;

S9.对于不同的异常对象,重复执行步骤S5~S8,得到每一个异常对象下的单项异常属性 集合。

优选地,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方面,其中:

卡方面的因素包括:卡BIN、卡性质和卡介质;

通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收 机构标识码;

操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;

终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码。

所述步骤S1中,选定的因素为受理机构标识码或发卡机构标识码。

其中,所述步骤S2包括以下子步骤:

S201.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个 对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;

S202.对于第i个对象,计算对应的交易失败率ER

其中,

S203.在i=1,2,...,T时,重复执行步骤S202,计算出每一个对象下的交易失败率和失败贡 献度。

其中,所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定; 所述正常属性的边界条件即对正常属性的交易失败率和失败贡献度的范围限定。

进一步地,所述步骤S6包括以下子步骤:

S601.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对 象每一个属性下失败的金融交易数据数量;

S602.对于目标金融对象P下的第j个属性,计算对应的交易失败率ER

其中,

S603.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条 件内的异常属性;

S604.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率 和失败贡献度确定各个解之间的支配关系:

对于任意两个解任意两个解x

第一、当|f

(1)m在集合{1,2}中取任意值时,x

f

(2)至少存在一个m∈{1,2}使得x

第二、当|f

其中,m=1时f

S605.对于每一个解,按照确定的支配关系,统计该解的支配解数目;

S606.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,将 其中优先级最高的解保存到一个集合中,形成单项异常属性集合A。

其中,所述优先级最高的解为一个或多个:

满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属 性集合A中只有一个解;

满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属 性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。

进一步地,所述步骤S7包括以下子步骤:

S701.将目标金融对象下的失败应答码划分到该对象的每一个属性中;

S702.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:

目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金 融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答 码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包 括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下 的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;

所述计算过程包括:

A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数 目为q,目标金融对象第i个属性下的失败应答码出现次数为n

则:

目标金融对象下第i个属性的失败应答码出现频率为:

目标金融对象第j种失败应答码下的失败应答码出现频率为:

目标金融对象第i个属性下第j种失败应答码的出现频率为:

A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取n

S703.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集 程度,实现对异常属性的筛选,其中,卡方值越大,则失败应答码的聚集程度越高:

B1.计算第i个属性下第j个失败应答码的卡方值为:

B2.计算第i个属性对应的卡方值为:

B3.将各个属性的卡方值与预设阈值进行比较,筛选出卡方值不小于设定阈值的属性,将 这些属性保存到一个集合中,得到目标金融对象的单项异常属性集合B。

本发明的有益效果是:本发明基于不同属性下的交易失败率和失败贡献度,筛选出异常 属性,并基于支配关系进行多目标优化,得到目标金融对象的单项异常属性集合A,然后基 于目标金融对象的失败应答码信息的聚集程度,分析目标金融对象的单项异常属性集合B, 再将两个集合进行合并,以实现互相关联,得到较为准确和完整的单项异常属性集合,有助 于较为快速和完整地确定交易失败的原因;由于进行异常对象与异常属性筛选时,综合考虑 了交易失败率和失败贡献度,能够有效降低小业务交易数据被淹没的可能性。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所 述。

如图1所示,一种基于关联分析的金融对象单项异常属性分析方法,包括以下步骤:

S1.给定影响金融交易数据质量的多个因素,并选定其中一个因素,获取该因素下不同的 对象信息,将待筛选的金融交易数据划分到每一个对象下;

S2.计算每一个对象下的交易失败率和失败贡献度;

S3.建立投影坐标系,纵坐标为交易失败率,横坐标为失败贡献度,并在设定正常对象的 边界条件和正常属性的边界条件;

S4.根据各个对象的交易失败率和失败贡献度,将每一个对象投影到坐标系中,并结合正 常对象的边界条件,筛选出不在正常对象边界条件内的一个或多个异常对象;

S5.选择其中一个异常对象作为筛选分析的目标金融对象,除选定因素外给定的剩余因素 作为目标金融对象的属性;

S6.基于目标金融对象不同属性下的交易失败率和失败贡献度,获取目标金融对象的单项 异常属性集合A;

S7.基于目标金融对象的失败应答码信息,分析目标金融对象的单项异常属性集合B;

S8.将单项异常属性集合A与B合并,得到并集D作为最终的单项异常属性集合,并集 D中的每一个元素均为该目标金融对象的单项异常属性;

S9.对于不同的异常对象,重复执行步骤S5~S8,得到每一个异常对象下的单项异常属性 集合。

在本申请的实施例中,所述步骤S1中给定的因素分为卡、通信路线、操作和终端四个方 面,其中:

卡方面的因素包括:卡BIN、卡性质和卡介质;

通信路线方面的因素包括:受理机构标识码、发卡机构标识码、发送机构标识码和接收 机构标识码;

操作方面的因素包括:交易代码、服务点输入方式和服务点条件代码;

终端方面的因素包括:商户类型、交易渠道、受卡发商户标识代码。

所述步骤S1中,选定的因素为受理机构标识码或发卡机构标识码。例如,选定的因素为 受理机构标识码时,由于不同的受理机构标识码对应于不同的受理机构,故该因素下的对象 其实就是各个受理机构;选定的因素为发卡机构识别码时,由于不同的发卡机构标识码对应 于不同的发卡机构,故该因素的对象其实就是各个发卡机构。

其中,所述步骤S2包括以下子步骤:

S201.设选定的因素下共包含T个对象,统计所有对象失败的金融交易数据总数、每一个 对象下的金融交易数据数量以及每一个对象下失败的金融交易数据数量;

S202.对于第i个对象,计算对应的交易失败率ER

其中,

S203.在i=1,2,...,T时,重复执行步骤S202,计算出每一个对象下的交易失败率和失败贡 献度。

其中,所述正常对象的边界条件即对正常对象的交易失败率和失败贡献度的范围限定; 所述正常属性的边界条件即对正常属性的交易失败率和失败贡献度的范围限定。

进一步地,所述步骤S6包括以下子步骤:

S601.对于选择的目标金融对象P,设该对象为选定因素下的第i个对象,统计该异常对 象每一个属性下失败的金融交易数据数量;

S602.对于目标金融对象P下的第j个属性,计算对应的交易失败率ER

其中,

S603.将目标金融对象P的每一个属性投影到坐标系中,并筛选出不在正常属性的边界条 件内的异常属性;

S604.将目标金融对象的异常属性作为多目标优化的解,根据各个异常属性的交易失败率 和失败贡献度确定各个解之间的支配关系:

对于任意两个解任意两个解x

第一、当|f

(1)m在集合{1,2}中取任意值时,x

f

(2)至少存在一个m∈{1,2}使得x

第二、当|f

其中,m=1时f

S605.对于每一个解,按照确定的支配关系,统计该解的支配解数目;

S606.将各个解按照支配解数目的从小到大进行排序,支配解数目越少,优先级越高,该 解对应的异常属性引起交易失败的概率越大,将其中优先级最高的解保存到一个集合中,形 成单项异常属性集合A。

其中,所述优先级最高的解为一个或多个:

满足条件“支配解数目最少,优先级最高”的解只有一个时,该解即为最优解,单项异常属 性集合A中只有一个解;

满足条件“支配解数目最少,优先级最高”的解存在多个时,这些解均为最优解单项异常属 性集合中包含多个解,情况下,这种各个最优解的支配解数目相同。

进一步地,所述步骤S7包括以下子步骤:

S701.将目标金融对象下的失败应答码划分到该对象的每一个属性中;

S702.统计目标金融对象下的频数信息,并据此计算相关的频率信息;所述频数信息包括:

目标金融对象下的失败应答码出现次数、目标金融对象下的失败应答码种类数目、目标金 融对象每一个属性下的失败应答码出现次数、目标金融对象每一种失败应答码下的失败应答 码出现次数以及目标金融对象每一个属性下每一种失败应答码的出现次数;所述频率信息包 括:目标金融对象下每一个属性的失败应答码出现频率、目标金融对象每一种失败应答码下 的失败应答码出现频率以及每一个属性下每一种失败应答码的出现频率;

所述计算过程包括:

A1、设目标金融对象下的失败应答码出现次数为n,目标金融对象下的失败应答码种类数 目为q,目标金融对象第i个属性下的失败应答码出现次数为n

则:

目标金融对象下第i个属性的失败应答码出现频率为:

目标金融对象第j种失败应答码下的失败应答码出现频率为:

目标金融对象第i个属性下第j种失败应答码的出现频率为:

A2、在i=1,2,...,p,j=1,2,...,q的情况下,获取n

在本申请的实施例中,统计的频数信息如下表所示:

计算的到的频率信息如下图所示:

一个属性对于某个应答码是否有聚集,不能只看n

S703.定义每一个属性中各个失败应答码的卡方值,并根据卡方值得到失败应答码的聚集 程度,实现对异常属性的筛选,其中,卡方值越大,则失败应答码的聚集程度越高:

B1.计算第i个属性下第j个失败应答码的卡方值为:

B2.计算第i个属性对应的卡方值为:

得到的卡方值如下表所示:

B3.在卡方值较大的属性上,失败应答码的聚集程度最高,由该属性引起交易失败的概 率较大,因此因素为异常属性;在本申请中,将各个属性的卡方值与预设阈值进行比较,筛 选出卡方值不小于设定阈值的属性,将这些属性保存到一个集合中,得到目标金融对象的单 项异常属性集合B。

本发明基于不同属性下的交易失败率和失败贡献度,筛选出异常属性,并基于支配关系 进行多目标优化,得到目标金融对象的单项异常属性集合A,然后基于目标金融对象的失败 应答码信息的聚集程度,分析目标金融对象的单项异常属性集合B,再将两个集合进行合并, 以实现互相关联,得到较为准确和完整的单项异常属性集合,有助于较为快速和完整地确定 交易失败的原因;由于进行异常对象与异常属性筛选时,综合考虑了交易失败率和失败贡献 度,能够有效降低小业务交易数据被淹没的可能性。

以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不 应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想 范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变 化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

相关技术
  • 一种基于关联分析的金融对象单项异常属性分析方法
  • 一种基于多目标优化的金融对象异常因素优先级分析方法
技术分类

06120112202573