掌桥专利:专业的专利平台
掌桥专利
首页

基于多维度关系型数据的风控方法、图聚类方法及装置

文献发布时间:2023-06-19 16:08:01



技术领域

本文件属于风控领域,尤其涉及一种基于多维度关系型数据的风控方法、图聚类方法及装置。

背景技术

目前很多领域常用的风控方法是通过构造关系型网络的视图(View),来挖掘群体性风险。群体中的每个对象作为View中节点,以金融领域为例,节点不仅具有不同的属性特征(如注册地址、法人姓名等),同时之间还存在不同类型的关联关系(如介质关联、资金关联等),因此能够构造的关系型网络的视图也有很多种维度。在进行风险识别的时候,业内望能够综合利用不同维度(不同的关联关系、属性特征)的关系型视图数据,以更全面的角度进行节点聚类,从而更加准确地找出风险对象。

为此,如何融合不同维度的关系型视图数据,并按照各维度对于风险影响的程度进行聚类,是当前亟需解决的技术问题。

发明内容

本说明书实施例目的是提供一种基于多维度关系型数据的风控方法、图聚类方法及装置,能够融合群体对应不同维度的关系型视图数据,并按照各维度对于风险影响的程度进行统一聚类,从而更加准确找出群体中的风险对象。

为了实现上述目的,本说明书实施例是这样实现的:

第一方面,提供了一种基于多维度关系型数据的风控方法,包括:

获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果;

基于所述聚类结果呈现的所述待执行对象与已知黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

第二方面,提供了一种多维度关系型数据的图聚类方法,包括:

获取目标对象集的多维度的关系型视图数据,所述目标对象集包中的对象作为关系型视图数据中的节点;

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于预设聚类簇数的秩约束;

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

第三方面,提供一种基于多维度关系型数据的风控装置,包括:

视图数据获取模块,获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;

相似度矩阵计算模块,计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

统一矩阵构建模块,构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;

目标函数构建模块,构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

目标函数优化模块,基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果;

风控执行模块,基于所述聚类结果呈现的所述待执行对象与黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

第四方面,提供了一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:

获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果;

基于所述聚类结果呈现的所述待执行对象与黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:

获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果;

基于所述聚类结果呈现的所述待执行对象与黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

第六方面,提供了一种多维度关系型数据的图聚类装置,包括:

视图数据获取模块,获取目标对象集的多维度的关系型视图数据,所述目标对象集中的对象作为关系型视图数据中的节点;

相似度矩阵计算模块,计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

统一矩阵构建模块,构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于预设聚类簇数的秩约束;

目标函数构建模块,构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

目标函数优化模块,基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

第七方面,提供了一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:

获取目标对象集的多维度的关系型视图数据,所述目标对象集中的对象作为关系型视图数据中的节点;

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

第八方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:

获取目标对象集的多维度的关系型视图数据,所述目标对象集中的对象作为关系型视图数据中的节点;

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束;

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

本发明实施例的方案构建包含有待执行对象和已知黑名单对象的目标对象集,并基于目标对象集对应各维度的关系型视图数据,计算各维度的相似度矩阵。之后构建以各维度的相似度矩阵自加权表达的统一矩阵,以使各维度的相似度矩阵映射在该统一矩阵的向量空间上进行对比,并通过各维度的相似度矩阵与统一矩阵互耦合的目标函数,对各维度的相似度矩阵与统一矩阵进行相互优化,从而学习各维度的相似度矩阵在统一矩阵的向量空间上的自加权权重,该自加权权重可以反映各维度的相似度矩阵对于风险的影响程度,因此优化得到的统一矩阵在视图上呈现出融合不同维度的关系型视图数据,并按照对应学习得到的权重进行节点聚类的结果,并最终通过聚类的结果所反映出的待执行对象与已知黑名单对象之间的相似度,对待执行对象执行风险相匹配的风控操作,实现了风控的自动化决策。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通相关负责人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本说明书实施例提供的基于区块链货物管理的服务方法的流程示意图。

图2为本说明书实施例提供的基于区块链货物管理的云系统法的结构示意图。

图3为本说明书实施例提供的基于区块链货物管理的服务装置的结构示意图。

图4为本说明书实施例提供的图聚类装置的结构示意图。

图5为本说明书实施例提供的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通相关负责人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。

如前所述,在通过关系型网络的视图来挖掘群体性风险时,需要利用不同维度的关系型视图数据,以更全面的角度进行节点聚类,从而才能准确地找出风险对象。而将这些不同维度的关系型视图数据进行统一的节点聚类,同时还要体现出不同维度对于风险影响的权重,是业内的技术难题。为此,本文件旨在提出一种能够融合群体对应不同维度的关系型视图数据,并按照各维度对于风险影响的程度进行统一聚类的技术方案。

图1是本说明书一个实施例的基于多维度关系型数据的风控方法,如图1所示的方法可以由下文对应的装置执行,步骤包括:

S102,获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点。

其中,目标对象集是指某一群体的对象集合,包含有待执行对象和已知黑名单对象。待执行对象是指待执行风控操作的对象。在本说明书实施例中,需要先识别待执行对象的是否为风险对象,再根据识别结果进行相匹配的风控操作。已知黑名单对象是指已经确定的风险对象,通过对目标对象集的多维度的关系型视图数据进行节点的图聚类,可以确定出待执行对象与已知黑名单对象之间的联系,进而根据这种联系再判断待执行对象是否为风险对象。

多维度的关系型视图数据是指包含有不同关联关系的关系型视图数据,和/或,不同属性特征的关系型视图数据。其中,关联关系体现了对象之间的一些交互上的联系,比如资金上的联系、通讯上的联系,属性特征体现了对象之间的相似度,这些维度的关系型视图数据都可以用于挖掘出待执行对象与已知黑名单对象之间的关系。

以挖掘交易凭条的黑商户为例,关系型视图数据可以是

S104,计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵。

需要说明的是,相似度矩阵是一种视图矩阵,计算相似度矩阵的算法属于现有技术,由于实现方式并不唯一,这里本文不作具体限定。

S106,构建以各维度的相似度矩阵自加权表达的统一矩阵,统一矩阵具有连通分量数等于聚类簇数的秩约束。

其中,通过各维度的相似度矩阵自加权表达的统一矩阵也属于视图矩阵,统一矩阵视图中所呈现的各个节点,即为融合不同维度的关系型视图数据,按照各维度对于风险影响的权重进行同一聚类的结果。

这里,聚类簇数即为分类需求的类目数,引入连通分量数等于聚类簇数的秩约束是为了使统一矩阵能够按照分类需求的类目数进行聚类。比如,在实际应用中,需要统一矩阵进行3种分类,则引入统一矩阵连通分量数等于3的秩约束,从而使统一矩阵的视图会将节点分类出3种聚类簇,如果待执行对象与已知黑名单对象属于同一聚类簇,则表示待执行对象与已知黑名单属于同一分类,对应有较高的风险系数;反之,如果待执行对象与已知黑名单对象属于不同的聚类簇,则表示待执行对象对应有较低的风险系数。

应理解,分类的类目数设置太多会导致分类结果过拟合,类目数设置太少会导致无法对待执行对象和已知黑名单对象进行有效的区分,因此需要根据实际场景进行灵活设置,这里本文不作具体限定。

此外,初始的统一矩阵很难体现出理想的各维度相似度矩阵自加权的表达关系,因此在接下来的步骤中,需要对统一矩阵进行优化。

S108,构建各维度的相似度矩阵与统一矩阵互耦合的目标函数。

本发明实施例中,各维度的相似度矩阵与统一矩阵作为目标函数的变量,目标函数用于体现统一矩阵的聚类性能。

S110,基于目标函数的损失函数,对各维度的相似度矩阵与统一矩阵按,照互耦合关系进行相互优化,得到优化后统一矩阵提供的目标对象集的聚类结果。

其中,这里所述的损失函数是指与目标函数相等价的用于计算目标函数的聚类性能损失的表达函数。由于各维度的相似度矩阵与统一矩阵属于互耦合关系,通过对互耦合的变量进行优化,可以使各维度的相似度矩阵与统一矩阵之间相互进行学习,从而使统一矩阵体现出更加准确的各维度相似度矩阵自加权的表达关系,不仅可以改善统一矩阵的聚类性能,同时还挖掘了各维度相似度矩阵对于风险影响的程度(也就是自加权对应权重的大小),可以作为风险分析的解释性数据。

具体地,可以采用拉格朗日乘子法实现优化,以绕开变量在互耦合关系下的计算难度。拉格朗日乘子法是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法。这种方法将一个有n个变量与k个约束条件的最优化问题转换为一个有n+k个变量的方程组的极值问题,其变量不受任何约束,从而有效降低了计算难度。

鉴于上述原理,本步骤可以基于拉格朗日乘子法,构建目标函数中各维度的相似度矩阵与统一矩阵之间互耦合的各变量的拉格朗日函数。变量可以包括:各维度的相似度矩阵、各维度的相似度矩阵对应自加权的权重、统一矩阵以及统一矩阵的嵌入矩阵。在任一目标变量的拉格朗日函数中,除目标变量外的其余变量均为固定值。通过各变量的拉格朗日函数,可以按照极值问题,对目标函数中的各快速完成优化。

应理解,在优化完成后,当前统一矩阵在视图上呈现的各簇节点,即为目标对象集最终的聚类结果。

S112,基于聚类结果呈现的待执行对象与已知黑名单对象之间的相似度,对待执行对象执行相匹配的风控操作。

作为示例性介绍,本发明实施例可以基于聚类结果中待执行对象与已知黑名单对象之间的数学距离(如余弦距离、欧式距离等),来量化待执行对象与已知黑名单对象之间的相似度,或者,也可以根据待执行对象与已知黑名单对象是否属于同一分类(簇),来量化与已知黑名单对象之间的相似度。

之后,如果待执行对象与已知黑名单对象之间的相似度达到一定的相似度标准,则确定待执行对象属于风险对象,对应地,本步骤对待执行对象执行针对风险对象所设置的风控操作。同理,如果待执行对象与已知黑名单对象之间的相似度未达到相似度标准,则确定待执行对象为非风险对象,对应地,本步骤对待执行对象执行针对非风险对象所设置的风控操作。

这里,本文不对风控操作进行具体限定。以支付场景为示例,在待执行对象发起目标交易后,如果确定待执行对象为风险对象,则对待执行对象发起核身验证,并在核身验证通过后再执行待执行对象所发起的目标交易;如果待执行对象为非风险对象,则可以免掉核身验证流程直接执行该目标交易。

本发明实施例的方法构建包含有待执行对象和已知黑名单对象的目标对象集,并基于目标对象集对应各维度的关系型视图数据,计算各维度的相似度矩阵。之后构建以各维度的相似度矩阵自加权表达的统一矩阵,以使各维度的相似度矩阵映射在该统一矩阵的向量空间上进行对比,并通过各维度的相似度矩阵与统一矩阵互耦合的目标函数,对各维度的相似度矩阵与统一矩阵进行相互优化,从而学习各维度的相似度矩阵在统一矩阵的向量空间上的自加权权重,该自加权权重可以反映各维度的相似度矩阵对于风险的影响程度,因此优化得到的统一矩阵在视图上呈现出融合不同维度的关系型视图数据,并按照对应学习得到的权重进行节点聚类的结果,并最终通过聚类的结果所反映出的待执行对象与已知黑名单对象之间的相似度,对待执行对象执行风险相匹配的风控操作,实现了风控的自动化决策。

下面结合具体的实现方式,对本发明实施例的基于多维度关系型数据的风控方法进行详细介绍。

本实现方式中,首先对收集到的目标对象集对应不同模态的原生关系型数据进行预处理,形成不同维度的关系型视图数据,并将不同维度的关系型视图数据转换为由稀疏表示的相似度诱导矩阵,以对噪声和异常值具有鲁棒性;之后,对各维度的相似度诱导矩阵进行加权融合得到统一矩阵,统一矩阵的视图直接呈现出各维度的关系型视图数据的聚类结果,无需执行任何额外的聚类步骤。最后,为了增强输出的可解释性和高准确率,计算聚类结果呈中待执行对象与已知黑名单对象之间的相似度,并根据相似度的计算结果,对待执行对象决策所需执行的风控操作。

其中,上述流程主要包括以下三个阶段:

一、原生关系型数据的预处理

本阶段获取目标对象集对应的不同模态的原生关系型数据,由于不同模态的具有不同的数据格式,因此需要将分别将这些原生关系型数据进行特征向量编码,投影到相应的向量空间才能进行比较。

其中,原生关系型数据可以但不限于包括:拓扑类的原生关系型数据、文本类的原生关系型数据、独热码类的原生关系型数据和数值类的原生关系型数据。

针对拓扑类的原生关系型数据,可以采用node2vec编码方式进行特征向量编码;针对文本类的原生关系型数据,可以采用word2vec编码方式进行特征向量编码;针对独热码的原生关系型数据,可以采用embedding-lookup编码方式进行特征向量编码;针对数值类的原生关系型数据,可以采用归一化编码方式进行特征向量编码。

不同模态的原生关系型数据在特征编码后,即可得到多维度的关系型视图数据(View),这样可以基于节点之间的特征向量,计算节点的相似性(相似度向量)。

二、多维度的视图聚类

本阶段综合考虑各维度View的相似性,并把View上的节点进行聚类,除了得到聚类结果之外,还能得到每个维度View在聚类过程中的权重,这样我们就知道聚类结果中,哪个维度View起了决定性作用。

具体地,这里使用拉普拉斯矩阵来作为统一矩阵。目标函数中各维度的相似度矩阵与统一矩阵之间互耦合的变量包括:各维度的相似度矩阵、各维度的相似度矩阵对应自加权的权重、统一矩阵以及统一矩阵的嵌入矩阵。

其中,拉普拉斯矩阵特征值为0的通分量数对应聚类簇数;对任意的向量f∈R

其中,L表示拉普拉斯矩阵,且有L=D-W,D为度矩阵,W为邻接矩阵,ω

该目标函数为:

其中,

目标函数的优化方式如下:

首先对其中的一些变量进行初始化,因为上面的目标函数中包含ω、U、S、F这4个待求解变量,子求解过程中,依次固定其中的3个取值,然后对剩下的变量采用拉格朗日乘子法进行求解。

首先将变量S的初始化为:

之后,基于拉格朗日乘子法对每个变量进行更新。

STEP1:固定ω、U和F,更新S:

STEP2:固定S,U和F,更新ω为:

STEP3:固定ω、S和F,更新U为:

STEP4:固定w、S和U,更新F为:

由于ω、S、U和F这四个参数是互耦合的关系,通过不断更新,可使U与各维度View自加权的表达关系不断优化。

三、风控操作决策

优化完成后U的视图中呈现的各簇的节点即最终的聚类结果。本阶段,通过计算待执行对象与已知黑名单对象之间的相似度,来判断待执行对象是否为风险用户,决策对待执行对象执行针对风险对象所设置的风控操作,还是针对非风险对象所设置的风控操作。

可以看出,本实现方式的聚类方法在目标函数中增加了每个View的权重,这样就可以知道在聚类结果中哪个View对于风险的影响更为重要;同时,各个View的相似度均映射在U中,通过对U的更新,可直接得到U提供的聚类结果。

此外,还应理解的是,本实现方式的聚类方法可以应用于任何风控场景,这里本文不作具体限定。作为其中一种可行的应用场景,可以用于识别网络交易平台的风险商户。对应地,可以将商户群体中对应的同介质关系(如同买家关系)的View、相似商户名的View、相似交易特征的View按照上述方式进行融合聚类,并将与黑名单商户相似度较高的商户作为风险商户,执行针对风险商户所设置的风控操作,如买家购买这些商户的商品发起交易风险的提醒等。

与上述图1所示方法相对应地,本发明实施例还提供一种基于多维度关系型数据的风控装置。图3是该风控装置的结构示意图,包括:

视图数据获取模块310,获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点。

相似度矩阵计算模块320,计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵。

统一矩阵构建模块330,构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束。

目标函数构建模块340,构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

目标函数优化模块350,基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

风控执行模块360,基于所述聚类结果呈现的所述待执行对象与黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

本发明实施例的装置构建包含有待执行对象和已知黑名单对象的目标对象集,并基于目标对象集对应各维度的关系型视图数据,计算各维度的相似度矩阵。之后构建以各维度的相似度矩阵自加权表达的统一矩阵,以使各维度的相似度矩阵映射在该统一矩阵的向量空间上进行对比,并通过各维度的相似度矩阵与统一矩阵互耦合的目标函数,对各维度的相似度矩阵与统一矩阵进行相互优化,从而学习各维度的相似度矩阵在统一矩阵的向量空间上的自加权权重,该自加权权重可以反映各维度的相似度矩阵对于风险的影响程度,因此优化得到的统一矩阵在视图上呈现出融合不同维度的关系型视图数据,并按照对应学习得到的权重进行节点聚类的结果,并最终通过聚类的结果所反映出的待执行对象与已知黑名单对象之间的相似度,对待执行对象执行风险相匹配的风控操作,实现了风控的自动化决策。

显然,本说明书实施例的风控装置可以作为上述图1所示方法的执行主体,因此能够实现该方法在图1所实现的步骤和功能。由于原理相同,本文不再赘述。

与上述图2所示方法相对应地,本发明实施例还提供一种多维度关系型数据的图聚类装置。图4是该图聚类装置的结构示意图,包括:

视图数据获取模块410,获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点;

相似度矩阵计算模块420,计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵;

统一矩阵构建模块430,构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于预设聚类簇数的秩约束;

目标函数构建模块440,构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数;

目标函数优化模块450,基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

本发明实施例的装置基于目标对象集对应各维度的关系型视图数据,计算各维度的相似度矩阵。之后构建以各维度的相似度矩阵自加权表达的统一矩阵,以使各维度的相似度矩阵映射在该统一矩阵的向量空间上进行对比,并通过各维度的相似度矩阵与统一矩阵互耦合的目标函数,对各维度的相似度矩阵与统一矩阵进行相互优化,从而学习各维度的相似度矩阵在统一矩阵的向量空间上的自加权权重,该自加权权重可以反映各维度的相似度矩阵对于风险的影响程度,因此优化得到的统一矩阵在视图上呈现出融合不同维度的关系型视图数据,并按照对应学习得到的权重进行节点聚类的结果,从而实现更加准确的分类。

图5是本说明书的一个实施例电子设备的结构示意图。请参考图5,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。

可选地,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成上述图3所示的风控装置。对应地,处理器,执行存储器所存放的程序,并具体用于执行以下操作:

获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点。

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵。

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束。

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数。

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

基于所述聚类结果呈现的所述待执行对象与已知黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

可选地,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成上述图4所示的图聚类装置。对应地,处理器,执行存储器所存放的程序,并具体用于执行以下操作:

获取目标对象集的多维度的关系型视图数据,所述目标对象集中的对象作为关系型视图数据中的节点。

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵。

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于预设聚类簇数的秩约束。

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数。

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

上述如本说明书图1或图2所示实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。

应理解,本说明书实施例的电子设备可以实现上述取证方法在图1或图2所示的实施例的功能。由于原理相同,本文不再赘述。

当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

此外,本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令。

可选地,上述该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下步骤:

获取目标对象集的多维度的关系型视图数据,所述目标对象集包括待执行对象和已知黑名单对象,所述待执行对象和已知黑名单对象作为关系型视图数据中的节点。

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵。

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于聚类簇数的秩约束。

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数。

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

基于所述聚类结果呈现的所述待执行对象与已知黑名单对象之间的相似度,对所述待执行对象执行相匹配的风控操作。

可选地,上述该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图2所示实施例的方法,并具体用于执行以下步骤:

获取目标对象集的多维度的关系型视图数据,所述目标对象集中的对象作为关系型视图数据中的节点。

计算各维度的关系型视图数据中节点之间的相似度向量,并将各维度的相似度向量计算结果进行矩阵转换,得到目标对象集对应各维度的相似度矩阵。

构建以各维度的相似度矩阵自加权表达的统一矩阵,所述统一矩阵具有连通分量数等于预设聚类簇数的秩约束。

构建各维度的相似度矩阵与所述统一矩阵互耦合的目标函数。

基于所述目标函数的损失函数,对各维度的相似度矩阵与所述统一矩阵,按照互耦合关系进行相互优化,得到优化后所述统一矩阵提供的所述目标对象集的聚类结果。

本领域相关负责人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

以上仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域相关负责人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。此外,本领域普通相关负责人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。

相关技术
  • 基于多维度关系型数据的风控方法、图聚类方法及装置
  • 一种基于关系型数据库数据生成图数据的方法和装置
技术分类

06120114714510