掌桥专利:专业的专利平台
掌桥专利
首页

交易数据异常确定方法、装置、设备、介质及产品

文献发布时间:2023-06-19 16:08:01



技术领域

本发明涉及数据处理技术领域,尤其涉及一种交易数据异常确定方法、装置、设备、介质及产品。

背景技术

随着网络技术的飞速发展,金融行业目前主要采用线上和线下结合的方式办理业务。客户可以通过线上方式以终端的方式完成大部分支付行为和业务签约行为,为客户提供了较大的便利。同时,与之相对的,线上方式的安全性相比线下方式更低。

为了提高线上方式的安全性,安全风险识别的分析和防控是目前的主要手段之一。安全风险识别的分析和防控主要是依据一定的规则,通过人工的方式筛选可能存在异常的交易数据,由于规则存在一定的滞后性,且人工的方式依赖人工经验,交易数据异常确定的准确性较低。

发明内容

本发明提供一种交易数据异常确定方法、装置、设备、介质及产品,用以解决目前安全风险识别的分析和防控中人工的方式依赖人工经验,交易数据异常确定的准确性较低的问题。

本发明第一方面提供一种交易数据异常确定方法,包括:

获取待确定异常结果的目标交易数据;

根据所述目标交易数据确定目标客户标识;

根据所述目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据;所述目标交易数据包括目标交易时间;

将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型,以输出所述目标交易数据对应的异常结果。

进一步地,如上所述的方法,所述客户交易相关数据包括:客户位置画像、历史交易对象数据、客户业务签约数据;

所述将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型,以输出所述目标交易数据对应的异常结果,包括:

采用所述决策树算法模型对所述客户位置画像和历史交易对象数据分别进行特征提取,以生成对应位置特征和交易对象特征;

采用所述决策树算法模型根据所述目标交易数据、位置特征、交易对象特征和客户业务签约数据输出所述目标交易数据对应的异常结果。

进一步地,如上所述的方法,所述目标交易数据还包括:目标交易位置、目标交易对象数据和目标交易所属业务;

所述采用所述决策树算法模型根据所述目标交易数据、位置特征、交易对象特征和客户业务签约数据输出所述目标交易数据对应的异常结果,包括:

采用所述决策树算法模型根据所述目标交易位置和所述位置特征生成客户位置信息熵;

采用所述决策树算法模型根据目标交易对象数据和交易对象特征判断目标交易对象是否为异常交易对象;

采用所述决策树算法模型根据所述客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出所述目标交易数据对应的异常结果。

进一步地,如上所述的方法,所述采用所述决策树算法模型根据所述客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出所述目标交易数据对应的异常结果,包括:

采用所述决策树算法模型确定客户业务签约数据中处于所述目标交易时间之前预设签约次数内的历史业务签约数据;

采用所述决策树算法模型判断所述历史业务签约数据中是否包含所述目标交易所属业务;

采用所述决策树算法模型根据所述客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、所述历史业务签约数据中是否包含所述目标交易所属业务的结果输出所述目标交易数据对应的异常结果。

进一步地,如上所述的方法,所述目标客户标识与交易账号标识、交易客户号标识、交易客户号子标识具有映射关系;

所述根据所述目标交易数据确定目标客户标识之前,还包括:

建立目标客户标识与目标客户对应的交易账号标识、交易客户号标识以及渠道客户号标识之间的映射关系;

根据所述交易账号标识获取交易账号标识对应的第一交易相关数据;

根据交易客户号标识获取交易客户号标识对应的第二交易相关数据;

根据渠道客户号标识获取渠道客户号标识对应的第三交易相关数据;

根据所述第一交易相关数据、第二交易相关数据和第三交易相关数据生成目标客户标识对应的客户交易相关数据。

进一步地,如上所述的方法,所述客户交易相关数据还包括:客户历史交易时间;

所述将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型之前,还包括:

判断目标交易时间与最近的客户历史交易时间之间的时间差值是否小于预设差值阈值;

若确定所述时间差值小于预设差值阈值,则确定目标交易数据对应状态为连续交易;

所述将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型,包括:

将所述目标交易数据、目标交易数据对应状态为连续交易和所述客户交易相关数据输入训练至收敛的决策树算法模型。

进一步地,如上所述的方法,所述将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型之前,还包括:

获取训练样本,所述训练样本中包括:客户的历史客户交易相关数据;

将所述训练样本输入到预设决策树算法模型中,以对所述预设决策树算法模型进行训练;

采用接受者操作特性曲线判断所述预设决策树算法模型是否满足收敛条件;

将满足收敛条件的所述预设决策树算法模型确定为训练至收敛的决策树算法模型。

本发明第二方面提供一种交易数据异常确定装置,包括:

获取模块,用于获取待确定异常结果的目标交易数据;

第一确定模块,用于根据所述目标交易数据确定目标客户标识;

第二确定模块,用于根据所述目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据;所述目标交易数据包括目标交易时间;

输出模块,用于将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型,以输出所述目标交易数据对应的异常结果。

进一步地,如上所述的装置,所述客户交易相关数据包括:客户位置画像、历史交易对象数据、客户业务签约数据;

所述输出模块具体用于:

采用所述决策树算法模型对所述客户位置画像和历史交易对象数据分别进行特征提取,以生成对应位置特征和交易对象特征;采用所述决策树算法模型根据所述目标交易数据、位置特征、交易对象特征和客户业务签约数据输出所述目标交易数据对应的异常结果。

进一步地,如上所述的装置,所述目标交易数据还包括:目标交易位置、目标交易对象数据和目标交易所属业务;

所述输出模块在采用所述决策树算法模型根据所述目标交易数据、位置特征、交易对象特征和客户业务签约数据输出所述目标交易数据对应的异常结果时,具体用于:

采用所述决策树算法模型根据所述目标交易位置和所述位置特征生成客户位置信息熵;采用所述决策树算法模型根据目标交易对象数据和交易对象特征判断目标交易对象是否为异常交易对象;采用所述决策树算法模型根据所述客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出所述目标交易数据对应的异常结果。

进一步地,如上所述的装置,所述输出模块在采用所述决策树算法模型根据所述客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出所述目标交易数据对应的异常结果时,具体用于:

采用所述决策树算法模型确定客户业务签约数据中处于所述目标交易时间之前预设签约次数内的历史业务签约数据;采用所述决策树算法模型判断所述历史业务签约数据中是否包含所述目标交易所属业务;采用所述决策树算法模型根据所述客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、所述历史业务签约数据中是否包含所述目标交易所属业务的结果输出所述目标交易数据对应的异常结果。

进一步地,如上所述的装置,所述目标客户标识与交易账号标识、交易客户号标识、交易客户号子标识具有映射关系;

所述装置还包括:

数据关联模块,用于建立目标客户标识与目标客户对应的交易账号标识、交易客户号标识以及渠道客户号标识之间的映射关系;根据所述交易账号标识获取交易账号标识对应的第一交易相关数据;根据交易客户号标识获取交易客户号标识对应的第二交易相关数据;根据渠道客户号标识获取渠道客户号标识对应的第三交易相关数据;根据所述第一交易相关数据、第二交易相关数据和第三交易相关数据生成目标客户标识对应的客户交易相关数据。

进一步地,如上所述的装置,所述客户交易相关数据还包括:客户历史交易时间;

所述装置还包括:

判断模块,用于判断目标交易时间与最近的客户历史交易时间之间的时间差值是否小于预设差值阈值;若确定所述时间差值小于预设差值阈值,则确定目标交易数据对应状态为连续交易;

所述输出模块在将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型时,具体用于:

将所述目标交易数据、目标交易数据对应状态为连续交易和所述客户交易相关数据输入训练至收敛的决策树算法模型。

进一步地,如上所述的装置,所述装置还包括:

训练模块,用于获取训练样本,所述训练样本中包括:客户的历史客户交易相关数据;将所述训练样本输入到预设决策树算法模型中,以对所述预设决策树算法模型进行训练;采用接受者操作特性曲线判断所述预设决策树算法模型是否满足收敛条件;将满足收敛条件的所述预设决策树算法模型确定为训练至收敛的决策树算法模型。

本发明第三方面提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

所述存储器存储计算机执行指令;

所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面任一项所述的交易数据异常确定方法。

本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面任一项所述的交易数据异常确定方法。

本发明第五方面提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面任一项所述的交易数据异常确定方法。

本发明提供的一种交易数据异常确定方法、装置、设备、介质及产品,该方法包括:获取待确定异常结果的目标交易数据;根据所述目标交易数据确定目标客户标识;根据所述目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据;所述目标交易数据包括目标交易时间;将所述目标交易数据和所述客户交易相关数据输入训练至收敛的决策树算法模型,以输出所述目标交易数据对应的异常结果。本发明的交易数据异常确定方法,首先获取待确定异常结果的目标交易数据,并根据目标交易数据确定目标客户标识,同时,根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。从而通过训练至收敛的决策树算法模型对目标交易数据和客户交易相关数据进行处理,以输出对应的异常结果。由于本实施例的方法基于训练后的决策树算法模型,同时结合了客户交易相关数据,可以从数据的多个维度来确定目标交易数据是否异常,提高了交易数据异常确定的准确性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1为可以实现本发明实施例的交易数据异常确定方法的场景图;

图2为本发明第一实施例提供的交易数据异常确定方法的流程示意图;

图3为本发明第二实施例提供的交易数据异常确定方法的流程示意图;

图4为本发明第三实施例提供的交易数据异常确定方法的流程示意图;

图5为本发明第三实施例提供的交易数据异常确定方法的签约表示意图;

图6为本发明第三实施例提供的交易数据异常确定方法的客户标识关联示意图;

图7为本发明第四实施例提供的交易数据异常确定装置的结构示意图;

图8为本发明第五实施例提供的电子设备的结构示意图。

通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

本发明实施例的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。

为了清楚理解本申请的技术方案,首先对现有技术的方案进行详细介绍。目前,随着金融技术领域中网络金融和移动支付的迅速发展,为客户提供了高效、便捷的全新金融服务,该金融服务通过线上线下结合的方式,客户可以通过终端以线上的方式完成诸如支付行为和业务签约行为。因此,线上的安全威胁发生了较大变化,新兴威胁越来越多。

安全风险识别的分析和防控是目前的主要防护手段之一。安全风险识别的分析和防控主要是依据一定的规则,通过人工的方式筛选可能存在异常的交易数据,由于规则存在一定的滞后性,且人工的方式依赖人工经验,交易数据异常确定的准确性较低。

所以针对现有技术中目前安全风险识别的分析和防控中人工的方式依赖人工经验,交易数据异常确定的准确性较低的问题,发明人在研究中发现,为了解决该问题,可以结合大数据、机器学习等技术,通过决策树算法模型来确定交易数据是否异常,提高准确性。

具体的,首先获取待确定异常结果的目标交易数据,并根据目标交易数据确定目标客户标识,同时,根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。从而通过训练至收敛的决策树算法模型对目标交易数据和客户交易相关数据进行处理,以输出对应的异常结果。由于本实施例的方法基于训练后的决策树算法模型,同时结合了客户交易相关数据,可以从数据的多个维度来确定目标交易数据是否异常,提高了交易数据异常确定的准确性。

发明人基于上述的创造性发现,提出了本申请的技术方案。

下面对本发明实施例提供的交易数据异常确定方法的应用场景进行介绍。如图1所示,其中,1为第一电子设备,2为第二电子设备。本发明实施例提供的交易数据异常确定方法对应的应用场景的网络架构中包括:第一电子设备1和第二电子设备2。第二电子设备2存储有客户交易数据和客户交易相关数据,比如存储有待确定异常结果的目标交易数据,客户交易相关数据如客户交易位置、客户交易时间、客户交易对象等数据。第二电子设备2中存储的数据可以是从金融系统获取的,也可以是人工输入的。

当需要进行交易数据异常确定时,第一电子设备1从第二电子设备2处获取待确定异常结果的目标交易数据。同时,第一电子设备1根据目标交易数据确定目标客户标识,并根据目标客户标识从第二电子设备2处确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。然后,第一电子设备1将目标交易数据和客户交易相关数据输入训练至收敛的决策树算法模型,以输出目标交易数据对应的异常结果。在生成异常结果后,若确定是异常,则可以根据将该异常结果发送至客户终端设备和/或金融系统,以进行后续的安全处理。

下面结合说明书附图对本发明实施例进行介绍。

图2为本发明第一实施例提供的交易数据异常确定方法的流程示意图,如图2所示,本实施例中,本发明实施例的执行主体为交易数据异常确定装置,该交易数据异常确定装置可以集成在金融系统或其他电子设备中。则本实施例提供的交易数据异常确定方法包括以下几个步骤:

步骤S101,获取待确定异常结果的目标交易数据。

本实施例中,目标交易数据可以是刚完成的交易流水数据,目标交易数据一般包含交易时间、交易对象数据、交易位置数据、交易所属业务等数据。

步骤S102,根据目标交易数据确定目标客户标识。

本实施例中,目标客户标识是每个客户都设有的唯一标识,可以采用身份证号作为该唯一标识。在金融系统中每个客户对应有唯一标识,设置唯一标识是由于客户在不同业务情况下还可能对应多个客户号标识、渠道客户号标识等,同时,金融系统中记录在不同的数据表中客户号和渠道客户号都存在不同程度的缺失。身份证号还记录有客户的位置信息,方便后续的位置画像处理。

在确定出目标客户标识后,即可以在数据库中获取与该目标客户标识对应的客户交易相关数据。由于金融系统中,业务类别较多,客户交易数据也较多,本实施例中,需要提前对客户的交易相关数据进行整合,形成客户交易相关数据,并建立与目标客户标识之间的关联,从而方便后续确定交易数据是否异常。

步骤S103,根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。目标交易数据包括目标交易时间。

本实施例中,需要通过客户在目标交易时间之前预设时间段内的客户交易相关数据确定交易数据是否异常。预设时间段可以根据实际需求进行设置,比如设置3个月,半年,一个月等。客户交易相关数据可以包括交易时间、交易位置、交易对象、交易频率、交易金额数据等数据。

步骤S104,将目标交易数据和客户交易相关数据输入训练至收敛的决策树算法模型,以输出目标交易数据对应的异常结果。

本实施例中,采用决策树算法模型(英文全称为:Gradient Boosting DecisionTree,英文简称为:GBDT),在训练时,可以调整决策树算法模型的参数,如单棵数的最大深度、特征的最大分桶数量、树的叶节点最小样本数、叶节点分割的最小信息增益、决策树数量、学习率、单棵树学习的样本采样率、叶节点分离时用于计算分割特征的候选特征比例等。

通过训练好的决策树算法模型结合目标交易数据和客户交易相关数据,确定出的目标交易数据对应的异常结果更准确。

本发明实施例提供的一种交易数据异常确定方法,该方法包括:获取待确定异常结果的目标交易数据。根据目标交易数据确定目标客户标识。根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。目标交易数据包括目标交易时间。将目标交易数据和客户交易相关数据输入训练至收敛的决策树算法模型,以输出目标交易数据对应的异常结果。

本发明的交易数据异常确定方法,首先获取待确定异常结果的目标交易数据,并根据目标交易数据确定目标客户标识,同时,根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。从而通过训练至收敛的决策树算法模型对目标交易数据和客户交易相关数据进行处理,以输出对应的异常结果。由于本实施例的方法基于训练后的决策树算法模型,同时结合了客户交易相关数据,可以从数据的多个维度来确定目标交易数据是否异常,提高了交易数据异常确定的准确性。

图3为本发明第二实施例提供的交易数据异常确定方法的流程示意图,如图3所示,本实施例提供的交易数据异常确定方法,是在本发明上一实施例提供的交易数据异常确定方法的基础上,进行了进一步的细化。则本实施例提供的交易数据异常确定方法包括以下步骤。

步骤S201,获取待确定异常结果的目标交易数据。

本实施例中,步骤201的实现方式与本发明上一实施例中的步骤101的实现方式类似,在此不再一一赘述。

步骤S202,根据目标交易数据确定目标客户标识。

本实施例中,步骤202的实现方式与本发明上一实施例中的步骤102的实现方式类似,在此不再一一赘述。

步骤S203,根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。

本实施例中,步骤203的实现方式与本发明上一实施例中的步骤103的实现方式类似,在此不再一一赘述。

需要说明的是,客户交易相关数据包括:客户位置画像、历史交易对象数据、客户业务签约数据。

步骤S204,采用决策树算法模型对客户位置画像和历史交易对象数据分别进行特征提取,以生成对应位置特征和交易对象特征。

本实施例中,客户位置画像可以根据客户在目标交易时间之前预设时间段内的交易位置数据进行预构建。预构建过程可以为:抽取客户原始地理位置信息和客户交易时的交互行为记录,然后根据客户原始地理位置信息和客户交易时的交互行为记录构建带权重的位置交互关系图,在位置交互关系图上采用位置传播算法,迭代更新客户的实际地理位置和终端实体的地理位置信息。最后根据客户的实际地理位置和终端实体的地理位置信息生成客户位置画像,采用位置信息熵来表示用户的位置特性。

同时,在预构建完成后,可以采取定期全量更新的方式,每次更新都需要重新计算整个流程,得到新的客户位置画像。也可以在决策树算法模型检测出大量客户位置画像中不包含的数据时进行更新,或决策树算法模型确定异常的准确性下降时进行客户位置画像更新。

历史交易对象数据可以包括交易对象地址、交易对象标识、交易对象属性等数据。客户业务签约数据包括业务类别数据、签约时间、签约账户、签约动作、签约内容等数据。

位置特征可以包括在某些位置的频率、位置次数、位置数量等特征,交易对象特征包括交易对象类别,比如商户类别、个人类别等,交易对象使用实体类别,交易总次数,频率等。

同时,为了进一步提高确定交易数据的准确性,还可以对目标交易时间邻近时间段的交易数据产生频率进行分析。具体为:

判断目标交易时间与最近的客户历史交易时间之间的时间差值是否小于预设差值阈值。需要说明的是,客户交易相关数据还包括:客户历史交易时间。

若确定时间差值小于预设差值阈值,则确定目标交易数据对应状态为连续交易。

从而将连续交易的状态作为判断分析的一个因素结合目标交易数据以及客户交易相关数据一起分析。

示例性的,假设目标交易时间为上午10点,客户历史交易时间为上午9点50点,上午8点55分,则最近的客户历史交易时间为上午9点。时间差值为10分钟,若预设差值阈值为30分钟,则可以确定为连续交易。

由于金融领域中,在产生安全问题后,很容易发生连续交易,因而,可以根据该连续交易的状态进一步判断交易数据是否具有异常。

步骤S205,采用决策树算法模型根据目标交易数据、位置特征、交易对象特征和客户业务签约数据输出目标交易数据对应的异常结果。

本实施例中,可以从目标交易数据、位置特征、交易对象特征和客户业务签约数据等维度进行分析判断。

具体的,目标交易数据还包括:目标交易位置、目标交易对象数据和目标交易所属业务。

采用决策树算法模型根据目标交易位置和位置特征生成客户位置信息熵。客户位置信息熵可以反映该位置是否比较意料之外,若客户经常在位置A、B、C中产生交易数据,其中A为9次,B为3次,C为5次,若目标交易位置为B,则客户位置信息熵较高,若客户位置信息为D,则客户位置信息熵会变得很高,从而一定程度上指示用户交易位置是否是常用位置。

采用决策树算法模型根据目标交易对象数据和交易对象特征判断目标交易对象是否为异常交易对象。

因而,交易对象特征是客户在预设时间段内的交易对象综合特征,比如交易对象数量、交易对象的交易次数、交易对象的位置区域等,若目标交易对象数据与交易对象特征有较大差异,则可以判断为异常交易对象。

异常交易对象可以根据实际需求进行设置,比如新增交易对象,可以列为异常交易对象,常发生安全事故的网络协议地址也可以被列为异常交易对象。

采用决策树算法模型根据客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出目标交易数据对应的异常结果。

同时,还可以针对客户业务签约数据进行进一步的分析判断。

采用决策树算法模型确定客户业务签约数据中处于目标交易时间之前预设签约次数内的历史业务签约数据。

采用决策树算法模型判断历史业务签约数据中是否包含目标交易所属业务。判断历史业务签约数据中是否包含目标交易所属业务主要是用于判断目标交易数据是否涉及到变更业务签约,一般情况下,网络威胁会变更客户签署的业务签约已达到更大的收益。

采用决策树算法模型根据客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、历史业务签约数据中是否包含目标交易所属业务的结果输出目标交易数据对应的异常结果。

在本实施例中,可以从客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、历史业务签约数据中是否包含目标交易所属业务的结果这多个维度来判断,也可以增加是否为连续交易状态,目标交易数据之前的交易数据的网络协议地址涉及的地址区域数量、网络协议地址使用频率等来进行进一步分析确定。

本实施例中仅以举例的方式进行说明,并不限定决策树算法模型的分析维度数量。

图4为本发明第三实施例提供的交易数据异常确定方法的流程示意图,如图4所示,本实施例提供的交易数据异常确定方法,是在本发明上一实施例提供的交易数据异常确定方法的基础上,进行了进一步的细化。则本实施例提供的交易数据异常确定方法包括以下步骤。

需要说明的是,目标客户标识与交易账号标识、交易客户号标识、交易客户号子标识具有映射关系。

步骤S301,建立目标客户标识与目标客户对应的交易账号标识、交易客户号标识以及渠道客户号标识之间的映射关系。

步骤S302,根据交易账号标识获取交易账号标识对应的第一交易相关数据。

步骤S303,根据交易客户号标识获取交易客户号标识对应的第二交易相关数据。

步骤S304,根据渠道客户号标识获取渠道客户号标识对应的第三交易相关数据。

步骤S305,根据第一交易相关数据、第二交易相关数据和第三交易相关数据生成目标客户标识对应的客户交易相关数据。

本实施例中,由于金融系统的数据类别较多、客户交易数据较多、与客户交易相关的子标识较多,因而需要预先对客户交易相关数据进行整合处理。

目标客户标识可以采用客户的身份证号或其他身份证明编码。交易账号标识一般可以指金融行业中银行账户,交易客户号标识一般可以指银行客户号,渠道客户号标识一般可以指银行渠道客户号。

交易相关数据可以包括多个维度,比如金融系统记录的签约表、交易表、登录信息表等。如图5所示,图5为签约表的关联示意图,签约表包括账户签约痕迹表、签约痕迹表以及渠道签约痕迹表,签约痕迹表记录了签约时间、签约客户的客户号等基础信息,具体的签约动作、签约账户、签约内容等信息在账户签约痕迹表与渠道签约痕迹表中。通过关键字段分别对签约痕迹表与账户签约表、签约痕迹表与渠道签约表做关联就能得到包含签约客户、签约时间、签约账户、签约动作、签约内容的完整签约信息,生成最终的签约宽表。

交易表也类似,可以从渠道交易痕迹表、超网交易痕迹表、交易支付痕迹表、龙支付痕迹表、挂起交易表进行关联,这些表中包含交易账号标识、交易客户号标识以及渠道客户号标识对应的表。

超网交易流水表与渠道交易流水表、交易支付流水表与龙支付流水表分别存在交集,首先通过流水号与账号对两组转账交易表分别关联,可以完成对交集部分记录的去重处理,避免在后续各种关联任务中衍生出大量重复记录。

交易宽表可以包括交易对象数据,比如包括交易对象账号历史信息缓存表、交易对象名称历史信息缓存表、终端信息缓存表、二级商户标识历史信息缓存表、二级商户名历史信息缓存表、一级商户标识历史信息缓存表以及一级商户名历史信息缓存表等。终端可以为平板电脑、手机等设备。

然后将签约宽表、交易宽表、登录信息表合并为最终的行为宽表。

在生成行为宽表后,可以按照客户的唯一标识,来关联具体数据。唯一标识本实施例采用身份证号,通过建立身份证号与目标客户对应的交易账号标识、交易客户号标识以及渠道客户号标识之间的映射关系,从而生成账户-身份证号映射表,客户号-身份证号映射表,渠道客户号-身份证号映射表。如图6所示,可以在具有规范账号的数据,通过账户-身份证号映射表进行关联,具有规范客户号且不能通过账户关联上身份证号的数据可以通过客户号-身份证号映射表关联,具有规范渠道客户号且不能通过账户和客户号关联上身份证号的数据,可以通过渠道客户号-身份证号映射表进行关联。对于不能关联的数据,采取丢弃的方式处理。

在处理完数据后可以对决策树算法模型进行训练,训练过程如下:

获取训练样本,训练样本中包括:客户的历史客户交易相关数据。

将训练样本输入到预设决策树算法模型中,以对预设决策树算法模型进行训练。

采用接受者操作特性曲线判断预设决策树算法模型是否满足收敛条件。

将满足收敛条件的预设决策树算法模型确定为训练至收敛的决策树算法模型。

训练过程中可以采用ROC曲线(英文全称为:receiver operatingcharacteristic curve,中文为:接受者操作特性曲线)来判断是否满足收敛条件,也可以采用其他误差损失函数来判断。

决策树算法模型可以提取包含位置特征,交易对象特征,连续交易特征等特征,位置特征可以包括前序网络协议地址的最大区域数量,其中,前序行为指当前交易行为之前若干小时之内的行为,前序行为使用相同网络协议地址的不同区域数量,还可以包括当前网络协议地址的使用频率,网络协议地址、电话号等使用频率指来自不同区域的客户使用该网络协议地址的人数最大值,分桶成N份,N根据实验调整32、64、128等。

位置特征还可以包括前序电话号的最大熵,电话号的地理位置信息熵通过历史上与该电话号相关的客户的地理位置总体分布计算,反应使用过该电话号的客户在地理位置上的分散性。

IP相关省份数指历史上使用过该IP的人来自于多少个不同的省份相关IP、电话号等实体的使用频率指来自不同省份的客户使用该实体的人数最大值,分桶成N份,N根据实验调整32、64、128等

图7为本发明第四实施例提供的交易数据异常确定装置的结构示意图,如图7所示,本实施例中,该交易数据异常确定装置400可以设置在金融系统中,交易数据异常确定装置400包括:

获取模块401,用于获取待确定异常结果的目标交易数据。

第一确定模块402,用于根据目标交易数据确定目标客户标识。

第二确定模块403,用于根据目标客户标识确定目标客户在目标交易时间之前预设时间段内的客户交易相关数据。目标交易数据包括目标交易时间。

输出模块404,用于将目标交易数据和客户交易相关数据输入训练至收敛的决策树算法模型,以输出目标交易数据对应的异常结果。

本实施例提供的交易数据异常确定装置可以执行图2所示方法实施例的技术方案,其实现原理和技术效果与图2所示方法实施例类似,在此不再一一赘述。

本发明提供的交易数据异常确定装置在上一实施例提供的交易数据异常确定装置的基础上,对交易数据异常确定装置进行了进一步的细化。

可选的,本实施例中,客户交易相关数据包括:客户位置画像、历史交易对象数据、客户业务签约数据。

输出模块404具体用于:

采用决策树算法模型对客户位置画像和历史交易对象数据分别进行特征提取,以生成对应位置特征和交易对象特征。采用决策树算法模型根据目标交易数据、位置特征、交易对象特征和客户业务签约数据输出目标交易数据对应的异常结果。

可选的,本实施例中,目标交易数据还包括:目标交易位置、目标交易对象数据和目标交易所属业务。

输出模块404在采用决策树算法模型根据目标交易数据、位置特征、交易对象特征和客户业务签约数据输出目标交易数据对应的异常结果时,具体用于:

采用决策树算法模型根据目标交易位置和位置特征生成客户位置信息熵。采用决策树算法模型根据目标交易对象数据和交易对象特征判断目标交易对象是否为异常交易对象。采用决策树算法模型根据客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出目标交易数据对应的异常结果。

可选的,本实施例中,输出模块404在采用决策树算法模型根据客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、目标交易所属业务和客户业务签约数据输出目标交易数据对应的异常结果时,具体用于:

采用决策树算法模型确定客户业务签约数据中处于目标交易时间之前预设签约次数内的历史业务签约数据。采用决策树算法模型判断历史业务签约数据中是否包含目标交易所属业务。采用决策树算法模型根据客户位置信息熵、目标交易对象是否为异常交易对象的判断结果、历史业务签约数据中是否包含目标交易所属业务的结果输出目标交易数据对应的异常结果。

可选的,本实施例中,目标客户标识与交易账号标识、交易客户号标识、交易客户号子标识具有映射关系。

交易数据异常确定装置400还包括:

数据关联模块,用于建立目标客户标识与目标客户对应的交易账号标识、交易客户号标识以及渠道客户号标识之间的映射关系。根据交易账号标识获取交易账号标识对应的第一交易相关数据。根据交易客户号标识获取交易客户号标识对应的第二交易相关数据。根据渠道客户号标识获取渠道客户号标识对应的第三交易相关数据。根据第一交易相关数据、第二交易相关数据和第三交易相关数据生成目标客户标识对应的客户交易相关数据。

可选的,本实施例中,客户交易相关数据还包括:客户历史交易时间。

交易数据异常确定装置400还包括:

判断模块,用于判断目标交易时间与最近的客户历史交易时间之间的时间差值是否小于预设差值阈值。若确定时间差值小于预设差值阈值,则确定目标交易数据对应状态为连续交易。

输出模块404在将目标交易数据和客户交易相关数据输入训练至收敛的决策树算法模型时,具体用于:

将目标交易数据、目标交易数据对应状态为连续交易和客户交易相关数据输入训练至收敛的决策树算法模型。

可选的,本实施例中,交易数据异常确定装置400还包括:

训练模块,用于获取训练样本,训练样本中包括:客户的历史客户交易相关数据。将训练样本输入到预设决策树算法模型中,以对预设决策树算法模型进行训练。采用接受者操作特性曲线判断预设决策树算法模型是否满足收敛条件。将满足收敛条件的预设决策树算法模型确定为训练至收敛的决策树算法模型。

本实施例提供的交易数据异常确定装置可以执行图2-图6所示方法实施例的技术方案,其实现原理和技术效果与图2-图6所示方法实施例类似,在此不再一一赘述。

根据本发明的实施例,本发明还提供了一种电子设备、一种计算机可读存储介质和一种计算机程序产品。

如图8所示,图8是本发明第五实施例提供的电子设备的结构示意图。电子设备旨在各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、刀片式服务器、大型计算机、和其它适合的计算机。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图8所示,该电子设备包括:处理器501、存储器502。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理。

存储器502即为本发明所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本发明所提供的交易数据异常确定方法。本发明的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本发明所提供的交易数据异常确定方法。

存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本发明实施例中的交易数据异常确定方法对应的程序指令/模块(例如,附图7所示的获取模块401、第一确定模块402、第二确定模块403和输出模块404)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例中的交易数据异常确定方法。

同时,本实施例还提供一种计算机产品,当该计算机产品中的指令由电子设备的处理器执行时,使得电子设备能够执行上述实施例的交易数据异常确定方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明实施例的其它实施方案。本发明旨在涵盖本发明实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明实施例的一般性原理并包括本发明实施例未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是,本发明实施例并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明实施例的范围仅由所附的权利要求书来限制。

相关技术
  • 交易数据异常确定方法、装置、设备、介质及产品
  • 一种异常交易确定方法、装置、设备及介质
技术分类

06120114718727