掌桥专利:专业的专利平台
掌桥专利
首页

一种风险预测模型训练、应用方法、装置和计算机设备

文献发布时间:2024-01-17 01:17:49


一种风险预测模型训练、应用方法、装置和计算机设备

技术领域

本说明书涉及人工智能技术领域,尤其涉及一种风险预测模型训练、应用方法、装置和计算机设备。

背景技术

目前,随着科技的发展,采用线上方式进行交易的人越来越多。为了降低线上交易过程产生的风险,多采用问卷调查的方式确定具有风险的交易流程的特征,以用于与每个当前交易的过程进行匹配,确定当前交易是否存在风险。由于问卷调查的过程较主观,导致对设计问卷的人要求较高,且需要较多的用户参与此问卷调查,从而致使得到较高准确率的风险识别结果的困难较大。进一步,目前还存在基于机器学习的算法进行风险识别,此种方法仅从用户维度的特征预测风险,但是用户的行为里包括了大量的互动行为,由于未考虑该互动行为,致使目前基于机器学习的风险识别算法的识别准确率较低。

如何在交易风险识别的过程中考虑用户的行为中的互动行为,提高风险识别的准确率是现有技术中亟需解决的问题。

发明内容

为解决现有技术中的问题,本说明书实施例提供了一种风险预测模型训练、应用方法、装置和计算机设备,实现了在交易风险识别的过程中考虑用户的行为中的互动行为,提高风险识别的准确率。

为了解决上述技术问题,本说明书的具体技术方案如下:

一方面,本说明书实施例提供了一种风险预测模型训练方法,包括,

针对样本交易图数据库进行图处理,得到预设样本交易拓扑图;

针对所述样本交易拓扑图进行优化和打标处理,得到目标样本交易拓扑图和与所述目标样本交易拓扑图包括的目标节点对应真实风险标识;

针对每个目标节点,利用预设聚合模型对与所述目标节点连接的多个目标跳邻居节点进行处理,得到与所述目标节点对应的目标特征向量;

利用预设预测模型针对所述目标特征向量进行处理,得到预测风险标识;以及

基于所述预测风险标识与所述真实风险标识之间的差异,对所述预设聚合模型和所述预设预测模型进行训练,得到训练后的风险预测模型。

进一步,该针对样本交易图数据库进行图处理,得到预设样本交易拓扑图进一步包括:

从所述样本交易图数据库中,筛选与每个预设属性相匹配的多个已存储数据,并将每个所述已存储数据作为预设节点;

针对每个所述预设节点,基于所述样本交易图数据库,确定与之相连接的目标预设节点;以及

将所述预设节点与每个所述目标预设节点相连接,得到所述预设样本交易拓扑图。

进一步,该针对所述样本交易拓扑图包括的每个预设节点和预设边进行优化处理,得到目标样本交易拓扑图进一步包括,

根据预设样本交易拓扑图包括的预设节点和预设边,分别确定每个所述预设节点与其他节点之间的相似度并将每个所述预设节点作为目标节点;

在确定所述预设节点与候选节点之间的相似度大于或等于预设相似度阈值的情况下,判断所述预设节点与所述候选节点之间是否相连接;以及

在确定所述预设节点与所述候选节点之间是未连接的情况下,构建所述预设节点与所述候选节点之间的目标边,以与所述目标节点构建所述目标样本交易拓扑图。

进一步,还包括,

在确定所述预设节点与所述候选节点之间相连接的情况下,确定所述预设节点与所述候选节点之间的预设边为目标边,以与所述目标节点构建所述目标样本交易拓扑图。

进一步,还包括:

在确定所述预设节点与候选节点之间的相似度小于预设相似度阈值的情况下,判断所述预设节点与所述候选节点之间是否相连接;

在确定所述预设节点与所述候选节点之间相连接的情况下,断开所述预设节点与所述候选节点之间预设边。

进一步,该针对所述样本交易拓扑图包括的每个预设节点和预设边进行优化处理,得到目标样本交易拓扑图进一步包括,

利用社区发现算法,针对所述预设节点和预设边进行聚类处理,得到多个子候选样本交易拓扑图;

针对每个子候选样本交易拓扑图,判断所述子候选样本交易拓扑图包括的任意两个预设节点是否表征相同信息;以及

在确定两个所述预设节点表征相同信息的情况下,将所述两个预设节点合并,且将与所述两个预设节点中任一所述预设节点相连接的邻居预设节点均与合并后的目标节点相连接,以得到所述目标样本交易拓扑图。

进一步,还包括,

在确定每两个所述预设节点均表征不相同信息的情况下,基于所述子候选样本交易拓扑图构建所述目标样本交易拓扑图。

进一步,该针对所述样本交易拓扑图包括的每个节点和边进行优化处理,得到目标样本交易拓扑图进一步包括,

针对预设样本交易拓扑图包括的每个预设节点,分别确定与其他节点之间的相似度;

在确定所述预设节点与候选节点之间的相似度大于或等于预设相似度阈值的情况下,执行第一判断,以判断所述预设节点与所述候选节点之间是否相连接;

根据第一判断的结果,将所述预设节点和预设边进行第一优化,得到更新节点和更新边;

利用社区发现算法,针对所述更新节点和所述更新边进行聚类处理,得到多个子更新样本交易拓扑图;

针对每个子更新样本交易拓扑图,执行第二判断,以判断所述子更新样本交易拓扑图包括的任意两个更新节点是否表征相同信息;以及

根据第二判断结果,针对所述更新节点和更新边进行第二优化,得到包括目标节点和目标边的所述目标样本交易拓扑图。

进一步,该根据第一判断的结果,将所述预设节点和预设边进行第一优化,得到更新节点和更新边进一步包括,

在所述第一判断结果指示所述预设节点与所述候选节点之间未连接的情况下,构建所述预设节点与所述候选节点之间的所述更新边;

在所述第一判断结果指示所述预设节点与所述候选节点之间相连接的情况下,确定所述预设节点与所述候选节点之间的预设边为所述更新边;以及

确定每个所述预设节点为所述更新节点。

进一步,该根据第二判断结果,针对所述更新节点和更新边进行第二优化,得到包括目标节点和目标边的所述目标样本交易拓扑图进一步包括,

在确定所述第二判断结果指示两个所述更新节点表征相同信息的情况下,将所述两个更新节点合并,且将与所述两个更新节点中任一所述更新节点相连接的邻居预设节点均与合并后的目标节点相连接,以得到所述目标样本交易拓扑图;以及

在确定所述第二判断结果指示每两个所述更新节点均表征不相同信息的情况下,基于所述子更新样本交易拓扑图构建所述目标样本交易拓扑图。

进一步,该目标跳邻居节点包括一跳邻居节点和二跳邻居节点。

进一步,该利用预设聚合模型对与所述目标节点连接的多个目标跳邻居节点进行处理,得到与所述目标节点对应的目标特征向量进一步包括,

利用所述预设聚合模型,针对与每个一跳邻居节点连接的多个二跳邻居节点进行处理,得到与每个所述一跳邻居节点对应的子特征向量;以及

利用所述预设聚合模型,针对与每个所述一跳邻居节点对应的所述子特征向量进行处理,得到所述目标特征向量。

另一方面,本说明书实施例还提供一种风险预测模型应用方法,包括,

接收待风险识别记录;以及

利用训练后的风险预测模型针对所述待风险识别记录进行处理,得到与所述待风险识别记录对应的识别标识,

其中,所述训练后的风险预测模型是采用任一项上述方法针对预设聚合模型和预设预测模型训练得到的。

进一步,该训练后的风险预测模型包括训练后的聚合模型和训练后的预测模型,所述利用训练后的风险预测模型针对所述待风险识别记录进行处理,得到与所述待风险识别记录对应的识别标识进一步包括:

利用所述训练后的聚合模型针对所述待风险识别记录进行处理,得到待风险识别特征向量;以及

利用所述训练后的预测模型针对所述待风险识别特征向量进行处理,得到所述识别标识。

另一方面,本说明书实施例还提供了一种风险预测模型训练装置,包括,

第一处理单元,用于针对样本交易图数据库进行图处理,得到预设样本交易拓扑图;

优化打标单元,用于针对所述样本交易拓扑图包括的每个预设节点和预设边进行优化和打标处理,得到目标样本交易拓扑图和与所述目标样本交易拓扑图包括的目标节点对应真实风险标识;

第二处理单元,用于针对每个目标节点,利用预设聚合模型对与所述目标节点连接的多个目标跳邻居节点进行处理,得到与所述目标节点对应的目标特征向量;

预测单元,用于利用预设预测模型针对所述目标特征向量进行处理,得到预测风险标识;以及

训练单元,用于基于所述预测风险标识与所述真实风险标识之间的差异,对所述预设聚合模型和所述预设预测模型进行训练,得到训练后的风险预测模型。

另一方面,本说明书实施例还提供了一种风险预测模型应用装置,包括,

接收单元,用于接收待风险识别记录;以及

识别单元,用于利用训练后的风险预测模型针对所述待风险识别记录进行处理,得到与所述待风险识别记录对应的识别标识,

其中,所述训练后的风险预测模型是采用上述的装置针对预设聚合模型和预设预测模型训练得到的。

进一步,该训练后的风险预测模型包括训练后的聚合模型和训练后的预测模型,所述识别单元进一步包括:

第一子识别单元,用于利用所述训练后的聚合模型针对所述待风险识别记录进行处理,得到待风险识别特征向量;以及

第二子识别单元,用于利用所述训练后的预测模型针对所述待风险识别特征向量进行处理,得到所述识别标识。

另一方面,本说明书实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。

另一方面,本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述的方法。

另一方面,本说明书实施例还提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现的方法。

利用本说明书实施例,在风险预测模型的训练过程中,针对由样本交易图数据库得到的样本交易拓扑图进行优化和打标处理,得到目标样本交易拓扑图和与目标样本交易拓扑图包括的目标节点对应真实风险标识;利用预设聚合模型针对与每个目标节点连接的多个目标跳邻居节点进行处理,得到与目标节点对应的目标特征向量;利用预设预测模型针对目标特征向量进行处理,得到预测风险标识;以及基于预测风险标识与真实风险标识之间的差异,对预设聚合模型和预设预测模型进行训练,得到训练后的风险预测模型。从而,在构建用于训练预设聚合模型和预设预测模型的样本时,针对由样本交易图数据库得到的样本交易拓扑图进行优化,提高了构建得到的目标样本交易拓扑图的准确性,基于更准确的目标样本交易拓扑图和对应的真实风险标识针对预设聚合模型和预设预测模型进行训练,得到训练后的风险预测模型,使得该训练后的风险预测模型是在考虑准确的互动行为的基础上得到的,从而进一步提高了风险识别的准确率。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1所示为本说明书实施例一种风险预测模型训练和应用方法的实施系统示意图;

图2所示为本说明书实施例一种风险预测模型训练方法的流程图;

图3所示为本说明书实施例一种预设样本交易拓扑图确定方法的流程图;

图4A所示为本说明书实施例一种目标样本交易拓扑图确定方法的流程图;

图4B所示为本说明书另一实施例的一种目标样本交易拓扑图确定方法的流程图;

图5所示为本说明书另一实施例的一种目标样本交易拓扑图确定方法的流程图;

图6A所示为本说明书另一实施例的一种目标样本交易拓扑图确定方法的流程图;

图6B所示为本说明书实施例的一种第一优化方法的流程图;

图6C所示为本说明书实施例的一种第二优化方法的示意图;

图7A所示为本说明书实施例的一种风险预测模型应用方法的示意图;

图7B所示为本说明书另一实施例的一种风险预测模型应用方法的示意图;

图8所示为本说明书实施例的一种风险预测模型训练装置的结构示意图;

图9A所示为本说明书实施例的一种风险预测模型应用装置的结构示意图;

图9B所示为本说明书另一实施例的一种风险预测模型应用装置的结构示意图;

图10为本说明书实施例一种计算机设备的结构示意图。

【附图标记说明】

110、电子设备;

120、数据库;

130、训练后的风险预测模型;

140、用户终端;

150、识别标识;

160、待风险识别记录;

810、第一处理单元;

820、优化打标单元;

830、第二处理单元;

840、预测单元;

850、训练单元;

910、接收单元;

920、识别单元;

921、第一子识别单元;

922、第二子识别单元;

1004、处理设备;

1006、存储资源;

1008、驱动机构;

1010、输入/输出模块;

1012、输入设备;

1014、输出设备;

1016、呈现设备;

1018、图形用户接口;

1020、网络接口;

1022、通信链路;

1024、通信总线。

具体实施方式

下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。

需要说明的是,本说明书的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本说明书的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

在本说明书的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。

图1所示为本说明书实施例一种能源用量预测模型训练方法的实施系统示意图,可以包括电子设备110和数据库120。

电子设备110例如可以通过网络访问数据库120。数据库120中可以存储有样本交易图数据库,或针对样本交易图数据库包括的数据经过图处理、优化处理和打标处理之后的目标样本交易拓扑图和与目标样本交易拓扑图包括的目标节点对应真实风险标识。

在一实施例中,该电子设备110可以从数据库120中读取目标样本交易拓扑图和真实风险标识,或样本交易图数据库。在读取样本交易图数据库的情况下,针对样本交易图数据库进行图处理,得到预设样本交易拓扑图;针对样本交易拓扑图进行优化和打标处理,得到目标样本交易拓扑图和与目标样本交易拓扑图包括的目标节点对应真实风险标识。在得到目标样本交易拓扑图和真实风险标识之后,电子设备110针对每个目标节点,利用预设聚合模型对与目标节点连接的多个目标跳邻居节点进行处理,得到与目标节点对应的目标特征向量;利用预设预测模型针对目标特征向量进行处理,得到预测风险标识;以及基于预测风险标识与真实风险标识之间的差异,对预设聚合模型和预设预测模型进行训练。

在一实施例中,该应用场景还可以包括训练得到的训练后的风险预测模型130、用户终端140、识别标识150和待风险识别记录160,该待风险识别记录例如可以包括交易记录。该用户终端140通过网络与电子设备110通信连接。例如,该用户终端140可以从电子设备110处获取训练后的风险预测模型130,并基于获取的训练后的风险预测模型130对待风险识别记录160进行处理,得到与该待风险识别记录160对应的识别标识150。

需要说明的是,本说明书所提供的风险预测模型训练方法一般可以由电子设备110执行,或者可以由与电子设备110通信连接的服务器等执行。本说明书所提供的风险预测模型应用方法可以由用户终端140或电子设备110执行。相应地,本说明书所提供的风险预测模型训练装置一般可以设置于电子设备110中,或者可以设置在与电子设备110通信连接的服务器中。本说明书所提供的风险预测模型应用装置可以设置在用户终端140或电子设备110中。

应该理解,图1中的电子设备、数据库、待风险识别记录和用户终端的数目和类型仅仅是示意性的。根据实现需要,可以具有任意数目和类型的电子设备、数据库、待风险识别记录和用户终端。

如图2所示为本说明书实施例一种风险预测模型训练方法的流程图。在本图中描述了风险预测模型训练过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体的如图2所示,方法可以包括:

S210,针对样本交易图数据库进行图处理,得到预设样本交易拓扑图;

S220,针对样本交易拓扑图进行优化和打标处理,得到目标样本交易拓扑图和与目标样本交易拓扑图包括的目标节点对应真实风险标识;

S230,针对每个目标节点,利用预设聚合模型对与目标节点连接的多个目标跳邻居节点进行处理,得到与目标节点对应的目标特征向量;

S240,利用预设预测模型针对目标特征向量进行处理,得到预测风险标识;

S250,基于预测风险标识与真实风险标识之间的差异,对预设聚合模型和预设预测模型进行训练,得到训练后的风险预测模型。

利用本说明书实施例,在风险预测模型的训练过程中,针对由样本交易图数据库得到的样本交易拓扑图进行优化和打标处理,得到目标样本交易拓扑图和与目标样本交易拓扑图包括的目标节点对应真实风险标识;利用预设聚合模型针对与每个目标节点连接的多个目标跳邻居节点进行处理,得到与目标节点对应的目标特征向量;利用预设预测模型针对目标特征向量进行处理,得到预测风险标识;以及基于预测风险标识与真实风险标识之间的差异,对预设聚合模型和预设预测模型进行训练,得到训练后的风险预测模型。从而,在构建用于训练预设聚合模型和预设预测模型的样本时,针对由样本交易图数据库得到的样本交易拓扑图进行优化,提高了构建得到的目标样本交易拓扑图的准确性,基于更准确的目标样本交易拓扑图和对应的真实风险标识针对预设聚合模型和预设预测模型进行训练,得到训练后的风险预测模型,使得该训练后的风险预测模型是在考虑准确的互动行为的基础上得到的,从而进一步提高了风险识别的准确率。

根据本说明书的一个实施例,样本交易图数据库为存储用户交易记录的图数据库。具体地,图数据库为以图的形式进行存储的数据库,其为数据库的一种类型。针对样本交易图数据库包括用户交易记录进行图处理,得到预设样本交易拓扑图。图处理为将以文字存储或其他图形式存储的关联关系,转化为拓扑图形式的预设样本交易拓扑图,以完成目标图结构的转换。具体地,图处理可以是基于现有的任意实现转为拓扑图的方式进行处理的方法,本说明书在此不再赘述。具体地用户交易记录例如可以为用户A通过B软件消费C元。例如可以将A、B和C均作为节点,且依次串联。

针对样本交易拓扑图进行优化处理,得到目标样本交易拓扑图。具体例如可以为,针对每个三元组(两个预设节点和两个预设节点之间的预设边)进行真实性验证,在该三元组通过真实性验证的情况下,确定两个预设节点和之间的预设边为目标预设节点和预设边。真实性验证例如可以是任意验证是否存在互动过程的验证,本说明书对此不作限定。进一步,针对目标样本交易拓扑图包括的每个目标节点,分别确定与之对应的真实风险标识,即标签。该真实风险标识例如可以包括三类,有风险、无风险和不确定。需要说明的是,该真实风险标识例如还可以为,高风险、中风险、低风险、无风险和不确定。具体标签表征的内容和内容的类别可以根据实际情况而确定,本说明书对此不做限定。针对每个目标节点打标处理为,基于现有的打标方法确定与目标节点对应的标签的过程,在此不再赘述。

预设聚合模型例如可以包括预先设定的用于聚合的算法,该算法包括聚合函数,聚合函数例如可以为平均聚合函数(mean)、池化聚合函数(pooling)、长短期记忆函数(LSTM)。在目标跳为一跳的情况下,目标跳邻居节点包括一跳邻居节点;在目标跳为二跳的情况下,目标跳邻居节点包括一跳邻居节点和二跳邻居节点;在目标跳为三跳的情况下,目标跳邻居节点包括一跳邻居节点、二跳邻居节点和三条邻居节点。邻居节点为与当前目标节点之间存在目标边相连接,一跳邻居节点为与当前目标节点之间存在一个目标边相连接,二跳邻居节点为与当前目标节点之间存在两个目标边相连接,三跳邻居节点为与当前目标节点之间存在三个目标边相连接。

针对每个目标节点,利用预设聚合模型对与之连接的多个目标跳邻居节点进行聚合处理,得到对应的目标特征向量。

预设预测模型例如可以包括由随机参数构成的全连接层。利用该预设预测模型针对目标特征向量进行处理,得到与之对应的预测风险标识。利用损失函数,针对该预测风险标识和与目标特征向量对应的真实风险标识进行处理,得到预测风险标识与真实风险标识之间的差异(损失函数值)。利用该差异,针对该预设聚合模型和预设预测模型进行训练,直至得到满足预设条件的训练后的聚合模型和训练后的预测模型。该预设条件例如可以为训练的次数和/或由损失函数值构成的数列收敛等。

在得到训练后的聚合模型和训练后的预测模型后,将该训练后的聚合模型和训练后的预测模型合并为训练后的风险预测模型,以用于交易记录的风险预测。

根据本说明书的另一个实施例,目标跳邻居节点例如可以包括一跳邻居节点和二跳邻居节点。

根据实验数据表明,仅包括两跳的邻居节点时,最终得到的训练后的风险预测模型的识别准确率最高。

根据本说明书的另一个实施例,利用预设聚合模型对与目标节点连接的多个目标跳邻居节点进行处理,得到与目标节点对应的目标特征向量包括:利用预设聚合模型,针对与每个一跳邻居节点连接的多个二跳邻居节点进行处理,得到与每个一跳邻居节点对应的子特征向量;以及利用预设聚合模型,针对与每个一跳邻居节点对应的子特征向量进行处理,得到目标特征向量。

例如,针对目标节点A,存在二十个一跳邻居节点,每个一跳邻居节点有与之对应的多个一跳邻居节点,即目标节点A的二跳邻居节点。

首先,利用预设聚合模型针对与每个一跳邻居节点连接的邻居节点(二跳邻居节点)进行处理,得到与该一跳邻居节点对应的子特征向量。进一步,利用预设聚合模型针对与每个一跳邻居节点对应的子特征项链进行处理,得到与该目标节点对应的目标特征向量。

图3所示为本说明书实施例一种预设样本交易拓扑图确定方法的流程图。在本图中描述了一种预设样本交易拓扑图确定的过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图3所示,方法可以包括:

S311,从样本交易图数据库中,筛选与每个预设属性相匹配的多个已存储数据,并将每个已存储数据作为预设节点;

S312,针对每个预设节点,基于样本交易图数据库,确定与之相连接的目标预设节点;

S313,将预设节点与每个目标预设节点相连接,得到预设样本交易拓扑图。

利用本说明书实施例,由于样本交易图数据库中包括较多与风险识别无关的信息,若不针对样本交易图数据库中的信息进行筛选,会导致后续进行模型训练时浪费资源。

根据本说明书的另一个实施例,预先确定与风险识别有关系的预设属性,该预设属性例如可以包括用户标识(与该用户标识对应的信息包括性别、年龄、等级、积分、职业和地址)、商品标识(与商品标识对应的信息包括类型、商家、状态、价格和地址)、理财产品标识(与理财产品标识对应的信息包括类型、状态、发行商和等级)、银行卡标识(与银行卡标识对应的信息包括卡号、类型和开户行)、地理位置信息(与地理位置信息对应的信息包括城市和经纬度)、设备标识(与设备标识对应的信息包括设备ID和型号)、软件标识(与软件标识对应的信息包括渠道和软件版本)。

将与预设属性相匹配(或相对应)的已存储数据作为预设节点。针对每两个预设节点,从样本交易图数据库中确定是否该两个预设节点之间存在联系,在确定存在联系的情况下,构建该两个预设节点之间的预设边,以将该两个预设节点相连接,从而得到预设样本交易拓扑图。在确定不存在联系的情况下,不在该两个预设节点之间构建预设边。需要说明的是,该预设边代表的关系例如可以包括但不限于银行卡归属、生活商品购买、理财购买、设备归属、软件归属、设备位置、用户转账等。

图4A所示为本说明书实施例一种目标样本交易拓扑图确定方法的流程图。在图4A中描述了一种第一候选区间确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图4A所示,方法可以包括:

S421,根据预设样本交易拓扑图包括的预设节点和预设边,分别确定每个预设节点与其他节点之间的相似度并将每个预设节点作为目标节点;

S422,在确定预设节点与候选节点之间的相似度大于或等于预设相似度阈值的情况下,判断预设节点与候选节点之间是否相连接;

S423,在确定预设节点与候选节点之间是未连接的情况下,构建预设节点与候选节点之间的目标边,以与目标节点构建目标样本交易拓扑图;

S424,在确定预设节点与候选节点之间相连接的情况下,确定预设节点与候选节点之间的预设边为目标边,以与目标节点构建目标样本交易拓扑图。

根据本说明书的另一个实施例,由于样本交易图数据库存储的数据均为实际产生的记录,但是未曾针对该记录进行进一步的数据挖掘,为了使得小样本量表征较多的信息,针对由该样本交易图数据库得到的预设样本交易拓扑图进行优化处理。将每个预设节点作为目标节点。

针对每个预设节点,根据与该预设节点对应的信息和与该预设节点之间存在预设边连接的连接节点对应的信息,确定与该预设节点对应的相似度特征;根据该预设节点的相似度特征和与每个其他节点对应的相似度特征,确定该预设节点与每个其他节点之间的相似度。具体地,确定该相似度的方法例如可以包括雅卡尔指数法(Jaccard Index)或余弦相似度法等。相似度特征的确定方法例如可以为现有技术中任意可以确定节点的特征的方法,例如知识图谱中与每个节点对应的特征的确定方法。

将每个相似度与预设相似度阈值进行对比。需要说明的是,候选节点为其他节点中的任意一个节点。

在确定该候选节点与预设节点之间的相似度大于或等于预设相似度阈值的情况下,则说明在风险预测的过程中需要考虑该两个预设节点之间关系。由此,判断该候选节点与预设节点之间是否相连接,即候选节点与预设节点之间是否存在预设边,在确定不存在该预设边的情况下,构建该预设节点与候选节点之间的目标边,以与目标节点构成目标样本交易拓扑图。在确定该候选节点与预设节点之间存在预设边的情况下,确定该预设边为目标边,以与目标节点构成目标样本交易拓扑图。

图4B所示为本说明书另一实施例的一种目标样本交易拓扑图确定方法的流程图。在图4B中描述了另一种目标样本交易拓扑图的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图4B所示,方法可以包括:

S425,在确定预设节点与候选节点之间的相似度小于预设相似度阈值的情况下,判断预设节点与候选节点之间是否相连接;

S426,在确定预设节点与候选节点之间相连接的情况下,断开预设节点与候选节点之间预设边。

根据本说明书的另一个实施例,在确定预设节点与候选节点之间的相似度小于该相似度阈值的情况下,即说明在风险预测的过程中可以不考虑该两个预设节点之间关系。由此,判断该预设节点与候选节点之间是否相连接,即预设节点与候选节点之间是否存在预设边,在存在该预设边的情况下,断开该预设边,若不存在该预设边,则进行下一个预设节点与候选节点之间相似度与预设相似度阈值对比。

图5所示为本说明书另一实施例的一种目标样本交易拓扑图确定方法的流程图。在本图中描述了另一种目标样本交易拓扑图的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图5所示,方法可以包括:

S541,利用社区发现算法,针对预设节点和预设边进行聚类处理,得到多个子候选样本交易拓扑图;

S542,针对每个子候选样本交易拓扑图,判断子候选样本交易拓扑图包括的任意两个预设节点是否表征相同信息;

S543,在确定两个预设节点表征相同信息的情况下,将两个预设节点合并,且将与两个预设节点中任一预设节点相连接的邻居预设节点均与合并后的目标节点相连接,以得到目标样本交易拓扑图;

S543,在确定每两个预设节点均表征不相同信息的情况下,基于子候选样本交易拓扑图构建目标样本交易拓扑图。

根据本说明书的另一个实施例,社区发现类似于聚类,将预设样本交易拓扑图中相似的预设节点进行划分,甚至可以发现不同预设节点为相同的用户,这样可以对“马甲”、“团伙”等进行有效的识别。社区发现算法例如可以为Louvain算法。

利用社区发现算法,针对预设节点和预设边进行聚类处理,得到多个子类,每个子类中包括多个预设节点,和预设节点之间的预设边;进而将每个子类均作为子候选样本交易拓扑图。

针对每个子候选样本交易拓扑图,判断该子候选样本交易拓扑图包括的任意两个预设节点是否表征相同信息。具体地,例如可以求该两个预设节点之间的预设相似度,在确定该预设相似度大于或等于相同阈值的情况下,确定该两个预设节点表征相同信息,反之则确定该两个预设节点表征不相同信息。具体地,两个预设节点之间的预设相似度为与该两个预设节点中每个预设节点对应的信息之间的相似度。

进而,在确定该两个预设节点表征相同信息的情况下,将该两个预设节点合并,例如任意去除一个预设节点,剩下的预设节点即为合并后的目标节点。进一步,将与去除的那个预设节点相连接的一跳邻居节点与合并后的目标节点相连接,以得到目标样本交易拓扑图。

在确定该子候选样本交易拓扑图中任意两个预设节点均表征不相同的信息的情况下,基于该子候选样本交易拓扑图构建目标样本交易拓扑图。

图6A所示为本说明书另一实施例的一种目标样本交易拓扑图确定方法的流程图。在本图中描述了另一种目标样本交易拓扑图的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图6A所示,方法可以包括:

S621,针对预设样本交易拓扑图包括的每个预设节点,分别确定与其他节点之间的相似度;

S622,在确定预设节点与候选节点之间的相似度大于或等于预设相似度阈值的情况下,执行第一判断,以判断预设节点与候选节点之间是否相连接;

S623,根据第一判断的结果,将预设节点和预设边进行第一优化,得到更新节点和更新边;

S624,利用社区发现算法,针对更新节点和更新边进行聚类处理,得到多个子更新样本交易拓扑图;

S625,针对每个子更新样本交易拓扑图,执行第二判断,以判断子更新样本交易拓扑图包括的任意两个更新节点是否表征相同信息;

S626,根据第二判断结果,针对更新节点和更新边进行第二优化,得到包括目标节点和目标边的目标样本交易拓扑图。

根据本说明书的另一个实施例,S621~S623例如与图4A的执行方法相类似,仅将图4A得到的目标节点和目标边用更新节点和更新边代替,在此不再赘述。

S624~S626例如与图5的执行方法类似,仅将图5中处理的预设节点和预设边以更新节点和更新边代替,且得到的子候选样本交易拓扑图用子更新样本交易拓扑图代替,在此不再赘述。

需要说明的是,在确定预设节点与候选节点之间的相似度小于预设相似度阈值的情况下,判断预设节点与候选节点之间是否相连接;在确定预设节点与候选节点之间相连接的情况下,断开预设节点与候选节点之间预设边,具体例如与图4B的执行方法相类似,在此不再赘述。

图6B所示为本说明书实施例的一种第一优化方法的流程图。图6B所示为本说明书实施例的一种第一优化方法的示意图。在本图中描述了另一种第一候选区间的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图6B所示,方法可以包括:

S6231,在第一判断结果指示预设节点与候选节点之间未连接的情况下,构建预设节点与候选节点之间的更新边;

S6232,在第一判断结果指示预设节点与候选节点之间相连接的情况下,确定预设节点与候选节点之间的预设边为更新边;

S6233,确定每个预设节点为更新节点。

根据本说明书的另一个实施例,S6231~S6232例如与图4A中的S423~S424的执行方法相类似,仅将得到的目标节点和目标边用更新节点和更新边代替,在此不再赘述。

如图6C所示为本说明书实施例的一种第二优化方法的示意图。图6C所示为本说明书实施例的一种第二优化方法的示意图。在本图中描述了另一种第一候选区间的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图6C所示,方法可以包括:

S6261,在确定第二判断结果指示两个更新节点表征相同信息的情况下,将两个更新节点合并,且将与两个更新节点中任一更新节点相连接的邻居预设节点均与合并后的目标节点相连接,以得到目标样本交易拓扑图;

S6262,在确定第二判断结果指示每两个更新节点均表征不相同信息的情况下,基于子更新样本交易拓扑图构建目标样本交易拓扑图。

根据本说明书的另一个实施例,S6261~S6262例如与图5中的S523~S524的执行方法类似,仅将处理的预设节点和预设边以更新节点和更新边代替,且得到的子候选样本交易拓扑图用子更新样本交易拓扑图代替,在此不再赘述。

如图7A所示为本说明书实施例的一种风险预测模型应用方法的示意图。图7A所示为本说明书实施例的一种风险预测模型应用方法的示意图。在本图中描述了另一种第一候选区间的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图7A所示,方法可以包括:

S710,接收待风险识别记录;

S720,利用训练后的风险预测模型针对待风险识别记录进行处理,得到与待风险识别记录对应的识别标识。

根据本说明书的另一个实施例,待风险识别记录为需要进行风险识别的交易记录,该交易记录中至少包括与预设属性相匹配的信息。从该待风险识别记录中获取与预设属性相匹配的待风险识别信息,将每个待风险识别信息作为待风险识别节点。根据待风险识别记录包括的待风险识别信息之间的关系,构建待风险识别节点之间的待风险识别边,以构成待风险识别图。具体的过程与图3中构建预设样本交易拓扑图相类似,在此不再赘述。

需要说明的是,训练后的风险预测模型是采用如图2的方法针对预设聚合模型和预设预测模型训练得到的。

将该待风险识别图输入训练后的风险预测模型中,得到识别标识。具体地识别标识例如可以包括,有风险、无风险和不确定,或高风险、中风险、低风险、无风险和不确定。

需要说明的是,现有的图神经网络在应用阶段,仅可针对训练阶段采用的图进行预测,但是本说明书中的训练后的风险预测模型可以针对训练阶段采用的图(目标样本交易拓扑图)之外的图进行预测,提高了训练后的风险预测模型利用率。

图7B所示为本说明书另一实施例的一种风险预测模型应用方法的示意图。图7B所示为本说明书实施例的一种风险预测模型应用方法的示意图。在本图中描述了另一种第一候选区间的确定过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。具体的如图7B所示,方法可以包括:

S721,利用训练后的聚合模型针对待风险识别记录进行处理,得到待风险识别特征向量;

S722,利用训练后的预测模型针对待风险识别特征向量进行处理,得到识别标识。

根据本说明书的另一个实施例,训练后的风险预测模型包括训练后的聚合模型和训练后的预测模型。

将待风险识别图输入训练后的聚合模型,得到待风险识别特征向量,具体得到该特征向量的方法例如可以与图2中得到目标特征向量的过程相类似,在此不再赘述。

利用训练后的预测模型针对该待风险识别特征向量进行处理,得到识别标识。

图8所示为本说明书实施例的一种风险预测模型训练装置的结构示意图。如图8所示,包括,

第一处理单元810,用于针对样本交易图数据库进行图处理,得到预设样本交易拓扑图;

优化打标单元820,用于针对样本交易拓扑图包括的每个预设节点和预设边进行优化和打标处理,得到目标样本交易拓扑图和与目标样本交易拓扑图包括的目标节点对应真实风险标识;

第二处理单元830,用于针对每个目标节点,利用预设聚合模型对与目标节点连接的多个目标跳邻居节点进行处理,得到与目标节点对应的目标特征向量;

预测单元840,用于利用预设预测模型针对目标特征向量进行处理,得到预测风险标识;以及

训练单元850,用于基于预测风险标识与真实风险标识之间的差异,对预设聚合模型和预设预测模型进行训练,得到训练后的风险预测模型。

由于上述装置解决问题的原理与上述方法相似,因此上述装置的实施可以参见上述方法的实施,重复之处不再赘述。

图9A所示为本说明书实施例的一种风险预测模型应用装置的结构示意图。如图9A所示,包括,

接收单元910,用于接收待风险识别记录;以及

识别单元920,用于利用训练后的风险预测模型针对待风险识别记录进行处理,得到与待风险识别记录对应的识别标识,

其中,训练后的风险预测模型是如图8的装置针对预设聚合模型和预设预测模型训练得到的。

由于上述装置解决问题的原理与上述方法相似,因此上述装置的实施可以参见上述方法的实施,重复之处不再赘述。

图9B所示为本说明书另一实施例的一种风险预测模型应用装置的结构示意图。如图9B所示,包括,

第一子识别单元921,用于利用训练后的聚合模型针对待风险识别记录进行处理,得到待风险识别特征向量;以及

第二子识别单元922,用于利用训练后的预测模型针对待风险识别特征向量进行处理,得到识别标识。

由于上述装置解决问题的原理与上述方法相似,因此上述装置的实施可以参见上述方法的实施,重复之处不再赘述。

如图10所示为本说明书实施例一种计算机设备的结构示意图,本说明书中的装置可以为本实施例中的计算机设备,执行上述本说明书的方法。计算机设备1002可以包括一个或多个处理设备1004,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备1002还可以包括任何存储资源1006,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储资源1006可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储资源都可以使用任何技术来存储信息。进一步地,任何存储资源可以提供信息的易失性或非易失性保留。进一步地,任何存储资源可以表示计算机设备1002的固定或可移除部件。在一种情况下,当处理设备1004执行被存储在任何存储资源或存储资源的组合中的相关联的指令时,计算机设备1002可以执行相关联指令的任一操作。计算机设备1002还包括用于与任何存储资源交互的一个或多个驱动机构1008,诸如硬盘驱动机构、光盘驱动机构等。

计算机设备1002还可以包括输入/输出模块1010(I/O),其用于接收各种输入(经由输入设备1012)和用于提供各种输出(经由输出设备1014)。一个具体输出机构可以包括呈现设备1016和相关联的图形用户接口(GUI)1018。在其他实施例中,还可以不包括输入/输出模块1010(I/O)、输入设备1012以及输出设备1014,仅作为网络中的一台计算机设备。计算机设备1002还可以包括一个或多个网络接口1020,其用于经由一个或多个通信链路1022与其他设备交换数据。一个或多个通信总线1024将上文所描述的部件耦合在一起。

通信链路1022可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路1022可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。

本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述方法。

本说明书实施例还提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序被处理器执行时实现上述方法。

本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上的具体实施例,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本说明书的具体实施例而已,并不用于限定本说明书的保护范围,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。

相关技术
  • 一种模型训练方法、装置、及计算机设备
  • 一种神经网络训练方法、装置、计算机设备和存储介质
  • 一种浴室加热装置和用于控制浴室加热装置的方法、设备、电子设备及计算机可读存储介质
  • 相似度预测模型训练方法、设备及计算机可读存储介质
  • MR图像预测模型的训练方法、装置、设备及存储介质
  • 一种供应链风险预测模型的训练和应用方法及装置
  • 一种非法集资风险预测模型的训练方法、装置及设备
技术分类

06120116113210