掌桥专利:专业的专利平台
掌桥专利
首页

交易检测方法、模型的训练方法、装置及计算机可读存储介质

文献发布时间:2023-06-19 11:32:36


交易检测方法、模型的训练方法、装置及计算机可读存储介质

技术领域

本发明属于机器学习领域,具体涉及交易检测方法、模型的训练方法、装置及计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

在大数据和人工智能时代,数据驱动的金融风险防控模型构建是金融风控领域的热点研究之一。在实际的金融风控业务场景中,特征工程作为风控建模中处理和分析数据的关键步骤,直接影响后续的模型构建效果。

在交易场景中,通过大量账号之间的交易关系可以构成一张大规模的复杂交易网络。为了有效利用数据构建鲁棒性的高精度模型,通常会基于业务经验构造人工特征,以及采用机器学习方法自动化地抽取深度特征,并将这两类特征简单拼接融合作为下游任务模型的输入。然而这样会导致下游任务模型的检测效果不佳,并会造成一定程度的特征冗余。

因此,在交易检测过程中,如何有效且快速地进行特征融合是一个亟待解决的问题。

发明内容

针对上述现有技术中存在的问题,提出了交易检测模型的训练方法、交易检测方法、装置及计算机可读存储介质,利用这种方法、装置及计算机可读存储介质,能够解决上述问题。

本发明提供了以下方案。

第一方面,提供一种交易检测模型的训练方法,包括:获取交易样本集,交易样本集包括携带样本标签的多个交易样本,样本标签用于指示交易样本的异常情况;根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。

在一种可能的实施方式中,构建待训练模型,还包括:基于自编码器构建特征重建网络,其中,自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据编码器的输出数据而确定分类网络的输入数据。

在一种可能的实施方式中,构建待训练模型,还包括:基于多层感知机MLP构建分类器网络,其中,多层感知机MLP的最后一层是softmax层。

在一种可能的实施方式中,基于训练样本集对待训练模型迭代地执行端到端的训练,包括:将交易样本的人工特征和深度特征输入待训练的特征重建网络,其中,特征重建网络至少包括待训练的第一自编码器和第二自编码器,特征重建网络将人工特征和深度特征融合为综合特征,并将综合特征和人工特征输入第一自编码器,将综合特征和深度特征输入第二自编码器,第一自编码器根据综合特征和人工特征依次生成第一编码特征和第一重建特征,第二自编码器根据综合特征和深度特征依次生成第二编码特征和第二重建特征,特征重建网络根据第一编码特征和第二编码特征生成交易样本的综合编码特征。

在一种可能的实施方式中,基于训练样本集对待训练模型迭代地执行端到端的训练,还包括:将特征重建网络生成的交易样本的综合编码特征输入待训练的分类网络,得到交易样本的样本检测结果;根据第一重建特征和人工特征之间的差异程度、第二重建特征和深度特征之间的差异程度以及样本检测结果和样本标签之间的差异程度,调整待训练模型的各个参数,直至达到预设收敛条件。

在一种可能的实施方式中,调整待训练模型的各个参数,还包括:根据第一重建特征和人工特征之间的差异程度确定第一损失函数;根据第二重建特征和深度特征之间的差异程度确定第二损失函数;根据样本检测结果和样本标签之间的差异程度确定第三损失函数;根据第一损失函数、第二损失函数和第三损失函数确定综合损失函数;根据综合损失函数联合调整第一自编码器、第二自编码器以及分类网络中的各个参数。

在一种可能的实施方式中,调整待训练模型的各个参数,还包括:采用随机梯度下降的反向传播算法优化待训练模型的各个参数。

在一种可能的实施方式中,构造人工特征还包括:基于交易样本的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。

在一种可能的实施方式中,构造人工特征,还包括:对非数值类型数据进行one-hot编码。

在一种可能的实施方式中,构造深度特征还包括:基于交易样本提取交易网络图中的图结构特征作为深度特征;其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:交易样本对应的账户节点的出度、入度,其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。

在一种可能的实施方式中,提取交易网络图中的图结构特征,还包括:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。

在一种可能的实施方式中,方法还包括:利用以下公式计算第一损失函数

和/或,利用以下公式计算第二损失函数

在一种可能的实施方式中,分类网络采用交叉熵损失函数。

在一种可能的实施方式中,方法还包括:利用以下公式计算第三损失函数L

在一种可能的实施方式中,还包括:确定综合损失函数L为:

第二方面,提供一种交易检测方法,包括:接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果;其中,交易检测模型利用如第一方面的方法训练得到。

在一种可能的实施方式中,构造人工特征还包括:基于原始交易数据的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。

在一种可能的实施方式中,构造人工特征,还包括:对非数值类型数据进行one-hot编码。

在一种可能的实施方式中,还包括:基于原始交易数据提取交易网络图中的图结构特征,作为深度特征;其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:原始交易数据对应的账户节点的出度、入度;其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。

在一种可能的实施方式中,提取交易网络图中的图结构特征,还包括:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。

第三方面,提供一种交易检测模型的训练装置,其被配置为用于执行如第一方面的方法,装置包括:获取模块,用于获取交易样本集,交易样本集包括携带样本标签的多个交易样本,样本标签用于指示交易样本的异常情况;特征模块,用于根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;训练模块,用于构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。

第四方面,提供一种交易检测装置,其被配置为用于执行如第二方面的方法,装置包括:接收模块,用于接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;

检测模块,用于将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果,其中,交易检测模型利用如第一方面的方法训练得到。

第五方面,提供一种交易检测模型的训练装置,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第一方面的方法。

第六方面,提供一种交易检测装置,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第二方面的方法。

第七方面,提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被多核处理器执行时,使得多核处理器执行:如第一方面的方法,和/或如第二方面的方法。

采用随机梯度下降的反向传播算法优化待训练模型的各个参数

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本实施例中,将上游的特征重建网络和下游的分类网络一起进行端到端的优化,利用下游的分类网络学习过程中生成的监督信号来指导特征重建网络的学习,优化特征融合过程,从人工特征以及深度特征中自动提取利于下游的分类网络质量提升的特征。

应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举例说明本发明的具体实施方式。

附图说明

通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:

图1为根据本发明一实施例的交易检测模型的训练方法的流程示意图;

图2为根据本发明另一实施例的交易检测模型的训练方法的流程示意图;

图3为根据本发明一实施例的交易检测模型的示意图;

图4为根据本发明一实施例的交易检测方法的流程示意图;

图5为根据本发明一实施例的交易检测模型的训练装置的结构示意图。

图6为根据本发明一实施例的交易检测装置的结构示意图;

图7为根据本发明又一实施例的交易检测模型的训练装置的结构示意图。

图8为根据本发明又一实施例的交易检测装置的结构示意图。

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

在本申请实施例的描述中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。

除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。

术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。

本申请中的所有代码都是示例性的,本领域技术人员根据所使用的编程语言,具体的需求和个人习惯等因素会在不脱离本申请的思想的条件下想到各种变型。

另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

图1是根据本申请一实施例的交易检测模型的训练方法的流程示意图,用于训练得到交易检测模型,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。

如图1所示,本实施例提供的方法可以包括以下步骤S101-S103:

S101、获取交易样本集,交易样本集包括携带样本标签的多个交易样本。

其中,交易样本集中可以包括若干正交易样本和若干负交易样本,样本标签用于指示交易样本的异常情况,可以分别对应于样本标签为1和0。其中,正交易样本可以对应于非异常交易,负交易样本可以对应于异常交易。

S102、根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集。

可以基于业务经验构造出正负交易样本的人工特征。例如,人工特征可以包括:根据交易卡的账号信息、交易流水、卡标签表确定出交易卡相关的多个交易特征和属性特征(如笔数、金额、交易时间分布、交易行业分布、交易代码分布、卡品牌、性别、年龄、地域、消费周期等)

在一些可能的实施方式中,上述S102中,为了构造人工特征,还可以基于交易样本的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。

在一些可能的实施方式中,上述S102中,为了构造人工特征,还可以对非数值类型数据进行one-hot编码,可以有效地标识非数值类型数据。该one-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器位,并且在任意时候只有一位有效。

可以通过机器学习方法/深度学习方法提取出正/负交易样本的深度特征。深度特征是指通过深度网络获得的可以表征正/负交易样本的隐特征。例如,大量交易卡之间的转账关系可以构成一张大规模的复杂交易网络,为了有效利用数据构建鲁棒性的高精度模型,可以采用机器学习方法自动化地从复杂交易网络中抽取出与该正/负交易样本相关的深度特征。

在一些可能的实施方式中,上述S102中,为了提取该深度特征,还可以基于交易样本提取交易网络图中的图结构特征,以作为该深度特征。

具体地,交易网络图可以包括根据多个交易账户设置的多个账户节点,该账户节点可以是用户节点、商户节点或者设备节点等中的任意一种或多种。交易网络图中的两个节点之间可能存在节点关系,例如,节点2和节点3之间可能存在转账关系、节点1和节点3之间可能存在转账关系,换言之账户节点之间的交易边以及边权值可以根据多个交易账户之间的交易记录而设置。例如,在赌博交易卡侦测场景中,可以基于大量

在具体实施过程中,可以先获取历史交易信息,并根据历史交易信息的交易关系路径确定交易网络图。可选的,历史交易信息可以理解为预设时段内统计的历史交易信息,该预设时段可以根据经验进行设定,例如一个月、一周等,该历史交易信息可以为多条,每条历史交易信息对应至少两个节点,例如,历史交易信息1为“账户2向账户3转账”,涉及到账户节点2和账户节点3,则历史交易信息1的交易关系路径即为账户节点2和账户节点3组成的路径,根据历史交易信息中的交易关系路径,可以确定出由账户节点组成的交易网络图。

在一些可能的实施方式中,为了提取交易网络图中的图结构特征,还可以采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。

当然,还可以采用其他图结构特征提取算法,如LINE(Large-scale InformationNetwork Embedding,大规模网络信息嵌入)、TransE(Translating Embedding)等,本申请对此不做具体限定。

在一些可能的实施方式中,基于上述交易结构图,所提取的图结构特征可以包括以下中的一种或多种:交易样本对应的账户节点的出度、入度、节点度数,其中,出度是交易网络图中账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。

S103、构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。

其中,特征重建网络是用于融合人工特征和深度特征的网络,分类网络是用于具体执行检测异常交易的下游任务的网络。

本发明实施例中的待训练模型是一种端到端学习模型,该端到端学习模型是指使用单个模型来建模解决多步骤/模块解决的任务。可以理解,使用多步骤/多模块解决一个复杂任务的时候,一个明显的弊端是各个模块训练目标不一致,单个模块的目标函数可能与总体的宏观目标有偏差,这样训练出来的系统最终很难达到最优的性能,另一个问题是误差的累积,前一模块产生的偏差可能影响后一个模块。端到端模型仅使用一个模型、就规避了前面的多模块固有的缺陷,另外,这样还可以减少训练复杂度。

本实施例中,将上游的特征重建网络和下游的分类网络一起进行端到端的优化,在训练整个模型的过程中,特征重建和分类网络的参数同时被更新,以保证编码特征与分类任务具有较好的适应性。利用下游的分类网络学习过程中生成的监督信号来指导特征重建网络的学习,能够优化特征融合过程,从人工特征以及图结构特征中自动提取利于下游的分类网络质量提升的特征。

在一些可能的实施方式中,S103中的构建待训练模型,还可以包括:基于自编码器(autoencoder,AE)构建特征重建网络,其中,自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据编码器的输出数据而确定分类网络的输入数据。

具体地,自编码器是一类在半监督学习和非监督学习中使用的人工神经网络(Artificial Neural Networks,ANNs),其功能是通过将输入信息作为学习目标,对输入信息进行表征学习(representation learning)。自编码器包含编码器(encoder)和解码器(decoder)两部分。自编码器的学习过程可以如下:将初始数据输入编码器,由编码器对初始数据进行特征提取,获得数据特征,再根据该数据特征进行数据重建,然后计算重建的数据与初始数据之间的差异,并根据该差异来调整编码器的网络参数。

本实施例中,通过采用自编码器技术,可以从人工特征和深度特征中提取关键特征,减缓特征融合对模型泛化能力的影响。

在一些可能的实施方式中,S103中的构建待训练模型,还可以基于多层感知机(Multi-Layer Perception,简称MLP)构建分类器网络,其中,多层感知机MLP的最后一层可以是softmax层,可以通过softmax函数生成类别的概率值。

图2是本发明另一示例性实施例示出的交易检测模型的训练方法的流程示意图,本实施例在图1所示实施例的基础上,对模型训练的过程进一步详细描述。

在一些可能的实施方式中,上述S103中,基于训练样本集对待训练模型迭代地执行端到端的训练,如图2所示,还可以包括S201:

S201、将交易样本的人工特征和图结构特征输入待训练的特征重建网络。

参考图3,特征重建网络至少包括待训练的第一自编码器和第二自编码器,特征重建网络将人工特征和图结构特征融合为综合特征。例如,针对任意一个交易样本,将构造的人工特征

在一些可能的实施方式中,在S201之后,基于训练样本集对待训练模型迭代地执行端到端的训练,如图2所示,还可以包括S202-S203:

S202、将特征重建网络生成的交易样本的综合编码特征输入待训练的分类网络,得到交易样本的样本检测结果。

其中,将综合编码特征h

S203、根据第一重建特征和人工特征之间的差异程度、第二重建特征和深度特征之间的差异程度以及样本检测结果和样本标签之间的差异程度,调整待训练模型的各个参数,直至达到预设收敛条件。

在本实施例中,通过为人工特征和深度特征分别设立用于特征重建的自编码器,并将综合特征作为自编码器的输入,可以在保证不丢失主要信息的前提下,减少融合后特征的冗余信息,加快下游任务的模型构建。

在一些可能的实施方式中,上述S203中,为了调整待训练模型的各个参数,还可以包括:步骤a、根据第一重建特征和人工特征之间的差异程度确定第一损失函数。步骤b、根据第二重建特征和深度特征之间的差异程度确定第二损失函数;步骤c、根据样本检测结果和样本标签之间的差异程度确定第三损失函数;步骤d、根据第一损失函数、第二损失函数和第三损失函数确定综合损失函数;根据综合损失函数联合调整第一自编码器、第二自编码器以及分类网络中的各个参数。换言之,在训练整个模型的过程中,特征重建和分类网络的参数同时被更新,以保证编码特征与分类任务具有较好的适应性。

在一些可能的实施方式中,上述S203中,为了调整待训练模型的各个参数,还包括:采用随机梯度下降的反向传播算法优化待训练模型的各个参数。

在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:利用以下公式(1)计算第一损失函数

其中,N为交易样本的个数,

在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:利用以下公式(2)计算第二损失函数

其中,N为交易样本的个数,

在一些可能的实施方式中,为了调整待训练模型的各个参数,分类网络可以采用交叉熵损失函数。

在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:利用以下公式(3)计算第三损失函数L

其中,N为交易样本的个数,K为样本标签个数,

在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:

利用以下公式(4)确定综合损失函数L:

其中,

在本申请实施例中,利用以上公式(1)、(2)、(3)、(4),以获取最小综合损失函数L为目标,对

可选地,α

在本说明书的描述中,参考术语“一些可能的实施方式”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

关于本申请实施例的方法流程图,将某些操作描述为以一定顺序执行的不同的步骤。这样的流程图属于说明性的而非限制性的。可以将在本文中所描述的某些步骤分组在一起并且在单个操作中执行、可以将某些步骤分割成多个子步骤、并且可以以不同于在本文中所示出的顺序来执行某些步骤。可以由任何电路结构和/或有形机制(例如,由在计算机设备上运行的软件、硬件(例如,处理器或芯片实现的逻辑功能)等、和/或其任何组合)以任何方式来实现在流程图中所示出的各个步骤。

本发明实施例还提供一种交易检测方法。

图4是根据本申请一实施例的交易检测方法的流程示意图,用于依据上述实施例训练得到交易检测模型进行异常交易的检测,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。

如图4所示,本实施例提供的方法可以包括以下步骤:

S401、接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;

S402、将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果;

其中,交易检测模型利用如以上实施例的模型训练方法得到。

在一些可能的实施方式中,上述S401中,为了构造人工特征,还可以基于原始交易数据的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。

在一些可能的实施方式中,上述S401中,为了构造人工特征,还可以对非数值类型数据进行one-hot编码,可以有效地标识非数值类型数据。该one-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器位,并且在任意时候只有一位有效。

可以通过机器学习方法/深度学习方法提取出原始交易数据的深度特征。深度特征是指通过深度网络获得的可以表征原始交易数据的隐特征。例如,大量交易卡之间的转账关系可以构成一张大规模的复杂交易网络,为了有效利用数据构建鲁棒性的高精度模型,可以采用机器学习方法自动化地从复杂交易网络中抽取出与该原始交易数据相关的深度特征。

在一些可能的实施方式中,上述S401中,为了提取该深度特征,还可以基于原始交易数据提取交易网络图中的图结构特征,以作为该深度特征。

具体地,交易网络图可以包括根据多个交易账户设置的多个账户节点,该账户节点可以是用户节点、商户节点或者设备节点等中的任意一种或多种。交易网络图中的两个节点之间可能存在节点关系,例如,节点2和节点3之间可能存在转账关系、节点1和节点3之间可能存在转账关系,换言之账户节点之间的交易边以及边权值可以根据多个交易账户之间的交易记录而设置。例如,在赌博交易卡侦测场景中,可以基于大量

在具体实施过程中,可以先获取历史交易信息,并根据历史交易信息的交易关系路径确定交易网络图。可选的,历史交易信息可以理解为预设时段内统计的历史交易信息,该预设时段可以根据经验进行设定,例如一个月、一周等,该历史交易信息可以为多条,每条历史交易信息对应至少两个节点,例如,历史交易信息1为“账户2向账户3转账”,涉及到账户节点2和账户节点3,则历史交易信息1的交易关系路径即为账户节点2和账户节点3组成的路径,根据历史交易信息中的交易关系路径,可以确定出由账户节点组成的交易网络图。

在一些可能的实施方式中,为了提取交易网络图中的图结构特征,还可以采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。

当然,还可以采用其他图结构特征提取算法,如LINE(Large-scale InformationNetwork Embedding,大规模网络信息嵌入)、TransE(Translating Embedding)等,本申请对此不做具体限定。

在一些可能的实施方式中,基于上述交易结构图,所提取的图结构特征可以包括以下中的一种或多种:原始交易数据对应的账户节点的出度、入度、节点度数,其中,出度是交易网络图中账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。

根据本发明实施例的各个方面,该交易检测方法可以从原始交易数据中提取重要信息,减缓特征融合对模型泛化能力的影响。并且,通过将上游的特征重建网络和下游的分类网络一起进行端到端的优化,利用下游的分类网络学习过程中生成的监督信号来指导特征重建网络的学习,优化特征融合过程,从人工特征以及图结构特征中自动提取利于下游的分类网络质量提升的特征,由此可以获得检测效果更好的交易检测模型,得到更好的检测效果。

需要说明的是,本申请实施例中的交易检测方法是基于前述交易检测的训练方法的实施例的各个过程而训练得到交易检测模型而执行的,因此,交易检测方法可以和前述交易检测的训练方法达到相似的效果和功能,这里不再赘述。

基于相同的技术构思,本发明实施例还提供一种交易检测模型的训练装置,用于执行上述任一实施例所提供的交易检测模型的训练方法。图5为本发明实施例提供的一种交易检测模型的训练装置结构示意图。

如图5所示,装置500包括:

获取模块501,用于获取交易样本集,交易样本集包括携带样本标签的多个交易样本,样本标签用于指示交易样本的异常情况;

特征模块502,用于根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;

训练模块503,用于构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。

在一种可能的实施方式中,训练模块还用于:基于自编码器构建特征重建网络,其中,自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据编码器的输出数据而确定分类网络的输入数据。

在一种可能的实施方式中,训练模块还用于:基于多层感知机MLP构建分类器网络,其中,多层感知机MLP的最后一层是softmax层。

在一种可能的实施方式中,训练模块还用于:将交易样本的人工特征和深度特征输入待训练的特征重建网络,其中,特征重建网络至少包括待训练的第一自编码器和第二自编码器,特征重建网络将人工特征和深度特征融合为综合特征,并将综合特征分别输入第一自编码器和第二自编码器,第一自编码器根据综合特征生成第一编码特征和第一重建特征,第二自编码器根据综合特征生成第二编码特征和第二重建特征,特征重建网络根据第一编码特征和第二编码特征生成交易样本的综合编码特征;

将特征重建网络生成的交易样本的综合编码特征输入待训练的分类网络,得到交易样本的样本检测结果;

根据第一重建特征和人工特征之间的差异程度、第二重建特征和深度特征之间的差异程度以及样本检测结果和样本标签之间的差异程度,调整待训练模型的各个参数,直至达到预设收敛条件。

在一种可能的实施方式中,训练模块还用于:根据第一重建特征和人工特征之间的差异程度确定第一损失函数;根据第二重建特征和深度特征之间的差异程度确定第二损失函数;根据样本检测结果和样本标签之间的差异程度确定第三损失函数;根据第一损失函数、第二损失函数和第三损失函数确定综合损失函数;根据综合损失函数联合调整第一自编码器、第二自编码器以及分类网络中的各个参数。

在一种可能的实施方式中,训练模块还用于:调整待训练模型的各个参数,还包括:采用随机梯度下降的反向传播算法优化待训练模型的各个参数。

在一种可能的实施方式中,特征模块还用于:基于交易样本的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地,也可以是交易的统计特征(金额/笔数的均值、标准差、中位数等)、交易时长等。

在一种可能的实施方式中,特征模块还用于:对非数值类型数据进行one-hot编码。

在一种可能的实施方式中,特征模块还用于:基于交易样本提取交易网络图中的图结构特征作为深度特征;

其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:交易样本对应的账户节点的出度、入度、节点度数,其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。

在一种可能的实施方式中,特征模块还用于:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。

在一种可能的实施方式中,训练模块还用于利用以下公式计算第一损失函数

其中,N为交易样本的个数,

和/或,利用以下公式计算第二损失函数

其中,N为交易样本的个数,

在一种可能的实施方式中,分类网络可以采用交叉熵损失函数。

在一种可能的实施方式中,训练模块还用于利用以下公式计算第三损失函数L

在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:利用以下公式(3)计算第三损失函数L

其中,N为交易样本的个数,K为样本标签个数,

在一种可能的实施方式中,训练模块还用于:确定综合损失函数L为:

基于相同的技术构思,本发明实施例还提供一种交易检测装置,用于执行上述任一实施例所提供的交易检测方法。图6为本发明实施例提供的一种交易检测装置结构示意图。

如图6所示,装置600包括:

接收模块601,用于接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;

检测模块602,用于将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果,其中,交易检测模型利用如权利要求1-13中任一项的方法训练得到。

在一种可能的实施方式中,接收模块还用于:基于原始交易数据的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。

在一种可能的实施方式中,接收模块还用于:对非数值类型数据进行one-hot编码。

在一种可能的实施方式中,检测模块还用于:基于原始交易数据提取交易网络图中的图结构特征,作为深度特征;其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:原始交易数据对应的账户节点的出度、入度和节点度数;其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。

在一种可能的实施方式中,接收模块还用于:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。

需要说明的是,本申请实施例中的装置可以实现前述对应方法的实施例的各个过程,并达到相同的效果和功能,这里不再赘述。

图7为根据本申请一实施例的交易检测模型的训练装置,用于执行图1所示出的方法,图8为根据本申请一实施例的交易检测装置,用于执行图4所示出的方法,该装置均包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例的方法。

根据本申请的一些实施例,提供了交易检测模型的训练方法和/或交易检测方法的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:上述实施例的方法。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。

本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

相关技术
  • 交易检测方法、模型的训练方法、装置及计算机可读存储介质
  • 模型训练方法、装置、计算机设备及计算机可读存储介质
技术分类

06120112964471