掌桥专利:专业的专利平台
掌桥专利
首页

异常商户群体的识别方法、装置、设备及介质

文献发布时间:2024-04-18 20:00:50


异常商户群体的识别方法、装置、设备及介质

技术领域

本申请属于数据处理领域,尤其涉及一种异常商户群体的识别方法、装置、设备及介质。

背景技术

随着电子信息技术在交易领域中的不断发展,有部分非法人员以商户作为伪装进行不法活动,这类商户即为异常商户,需要将异常商户识别出来,以便于采取相应措施。

现阶段,可将商户作为节点,采用基于图神经网络的异常检测模型FRAUDRE(即Fraud Detection Dual-Resistant to Graph Inconsistency and Imbalance)对单个节点进行检测,判断该节点是否为异常节点,即,判断该商户是否为异常商户。但该异常检测模型FRAUDRE算法复杂,开销极大,难以进行即时识别。

发明内容

本申请实施例提供一种异常商户群体的识别方法、装置、设备及介质,能够降低识别异常商户的开销,提高响应速度。

第一方面,本申请实施例提供一种异常商户群体的识别方法,包括:根据商户节点与用户的交易关系,得到商户节点的网络同构图,部分商户节点为异常种子节点;根据网络同构图和商户节点关联的交易信息,确定商户节点的重要性参数;对商户节点进行多轮标签传播,直至标签传播形成结构稳定的社区,在每轮标签传播中,根据网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,进行标签传播,经标签传播后具有相同标签的商户节点划分至同一社区;在结构稳定的社区中,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。

第二方面,本申请实施例提供一种异常商户群体的识别装置,包括:图构建模块,用于根据商户节点与用户的交易关系,得到商户节点的网络同构图,部分商户节点为异常种子节点;重要性确定模块,用于根据网络同构图和商户节点关联的交易信息,确定商户节点的重要性参数;标签传播模块,用于对商户节点进行多轮标签传播,直至标签传播形成结构稳定的社区,在每轮标签传播中,根据网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,进行标签传播,经标签传播后具有相同标签的商户节点划分至同一社区;识别模块,用于在结构稳定的社区中,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。

第三方面,本申请实施例提供一种电子设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的异常商户群体的识别方法。

第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的异常商户群体的识别方法。

本申请实施例提供一种异常商户群体的识别方法、装置、设备及介质,可根据商户节点的网络同构图和商户节点关联的交易信息,得到商户节点的重要性参数。网络同构图包括预先给定的异常种子节点,异常种子节点为异常商户。根据网络同构图、商户节点的重要性和商户节点所在社区的结构信息进行多轮自适应的标签传播,形成社区。位于同一社区中的商户节点为关联紧密的商户节点,包含异常种子节点的社区中的商户节点与异常种子节点关联紧密,充分挖掘了异常的节点之间的社区关联性。可通过异常条件对包含异常种子节点的社区进行筛选,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。标签传播算法的时间复杂度近似线性,开销较小,能够快速响应,以实现异常商户群体的即时识别。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的异常商户群体的识别方法的流程图;

图2为本申请实施例提供的异常种子节点与商户节点的一示例的关系示意图;

图3为本申请另一实施例提供的异常商户群体的识别方法的流程图;

图4为本申请实施例提供的商户节点的网络同构图的一示例的示意图;

图5为本申请实施例提供的商户节点形成社区的一示例的示意图;

图6为本申请一实施例提供的异常商户群体的识别装置的结构示意图;

图7为本申请一实施例提供的电子设备的结构示意图。

具体实施方式

下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。需要说明的是,本申请实施例中对信息、数据的获取、存储、使用、处理等均得到用户或相关机构的授权,符合国家法律法规的相关规定。

随着电子信息技术在交易领域中的不断发展,有部分非法人员以商户作为伪装进行不法活动,这类商户即为异常商户,需要将异常商户识别出来,以便于采取相应措施。现阶段,可将商户作为节点,采用基于图神经网络的异常检测模型FRAUDRE(即FraudDetection Dual-Resistant to Graph Inconsistency and Imbalance)对单个节点进行检测,判断该节点是否为异常节点,即,判断该商户是否为异常商户。但该异常检测模型FRAUDRE算法复杂,开销极大,难以进行即时识别。

本申请实施例提供一种异常商户群体的识别方法、装置、设备及介质,可利用异常节点之间存在的社区关联性,从社区发现的角度,参考商户节点的图结构特性与商户节点的相关信息,构建商户节点的重要性参数,并基于重要性参数进行自适应地社区标签传播,充分挖掘与异常种子节点存在关联的异常的商户节点,以及与异常的商户节点存在关联的其他异常的商户节点,标签传播算法的时间复杂度近似线性,开销较小,能够快速响应,实现异常商户群体的即时识别。

下面对本申请提供的异常商户群体的识别方法、装置、设备及介质分别进行说明。

本申请第一方面提供一种异常商户群体的识别方法,可应用于异常商户群体的识别装置、设备等,即,该异常商户群体的识别方法可由异常商户群体的识别装置、设备等执行。图1为本申请一实施例提供的异常商户群体的识别方法的流程图,如图1所示,该异常商户群体的识别方法可包括步骤S101至步骤S104。

在步骤S101中,根据商户节点与用户的交易关系,得到商户节点的网络同构图。

用户与商户节点发生交易,则用户与商户节点之间具有交易关系,不同的商户节点可能会与同一用户发生交易关系,则可认为与同一用户发生交易关系的不同的商户节点之间具有关联关系。具体地,可先根据商户节点与用户的交易关系,建立商户节点与用户的商户用户异构图,商户用户异构图中的节点包括商户节点和用户节点,具有交易关系的商户节点和用户之间通过连接边连接。再将商户用户异构图转换为商户节点的网络同构图,可将连接有相同用户节点的商户节点通过连接边连接,并删去用户节点以及用户节点与商户节点之间的连接边,形成商户节点的网络同构图。

在一些示例中,还可预先对商户节点和用户进行筛选,将非本次异常商户群体识别重点的商户节点和用户筛除,保留本次异常商户群体识别重点的商户节点和用户。具体地,根据商户节点与用户的交易关系,获取商户节点关联的交易信息;从交易信息中筛选符合预设要求的交易信息;根据符合预设要求的交易信息关联的商户节点和用户,构建商户用户异构图;将商户用户异构图转化为网络同构图。商户节点关联的交易信息可包括但不限于交易类型、交易金额、交易时间等信息。预设要求包括表征本次异常商户群体的识别所关注的重点的要求。例如,预设要求可包括交易时间在0:00至4:00的交易信息。又例如,预设要求可包括交易类型为转账的交易信息。可通过交易信息筛选得到本次异常商户群体识别所关注的重点交易对应的交易信息。基于该交易信息关联的商户节点和用户构建商户用户异构网。商户用户异构网包括商户节点、用户节点以及商户节点与用户节点之间的连接边,商户节点与用户节点之间存在交易关系,则商户节点与用户之前具有连接边。将商户用户异构图中与同一用户节点具有连接边的商户节点用连接边连接,在完成商户节点之间的连接边的连接后,删去用户节点以及商户节点与用户节点之间的连接边,即可得到商户节点的网络同构图。

在商户节点中,部分商户节点为异常种子节点,异常种子节点是已知的异常商户,是预先给定的。通过商户节点的网络同构图,可展示其中商户节点之间的关联关系,商户节点之间的关联关系包括异常种子节点与其他商户节点的关联关系。

在步骤S102中,根据网络同构图和商户节点关联的交易信息,确定商户节点的重要性参数。

根据网络同构图,可得到商户节点在网络同构图中结构上的重要性。根据商户节点关联的商户节点,可得到商户节点在交易场景上的重要性。根据网络同构图和商户节点关联的交易信息,可综合结构上的重要性和交易场景上的重要性,得到重要性参数,该重要性参数可表征商户节点的重要性,该重要性是综合的重要性。

在步骤S103中,对商户节点进行多轮标签传播,直至标签传播形成结构稳定的社区。

利用标签传播算法,对商户节点进行多轮标签传播,每一轮标签传播都会形成社区。在本轮标签传播形成的社区与上一轮标签传播形成的社区相同或差别在预设的可接受范围内的情况下,可认为本轮标签传播形成的社区为结构稳定的社区。或者,在标签传播轮数达到预设轮数的情况下,也可认为这轮标签传播形成的社区为结构稳定的社区。

在每轮标签传播中,根据网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,进行标签传播。经标签传播后具有相同标签的商户节点划分至同一社区。在每轮标签传播中,商户节点均具有标签,标签可表征商户节点所属的社区。在第一轮标签传播中,可对商户节点进行标签初始化,即,为商户节点分配初始化的标签,初始化的标签可按照预设的规律生成,或随机生成,在此并不限定。基于网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,可对商户节点之间的标签的传播性进行定义,从而根据商户节点的重要性和传播性进行标签传播。标签传播后,商户节点的标签可能会发生更新。根据标签传播后的商户节点更新后的标签,可形成新的社区。由于每轮标签传播形成的社区不同,对应地,每轮标签传播过程中涉及的商户节点所在社区的结构信息可能不同,基于商户节点所在社区的结构信息进行的标签传播具有自适应性,能够使密集的社区倾向于扩张,稀疏的社区倾向于收缩,从而使得社区中的商户节点关联紧密。

在步骤S104中,在结构稳定的社区中,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。

异常种子节点是异常商户,与异常种子节点具有密切联系的商户节点为异常商户节点的可能性很大。例如,图2为本申请实施例提供的异常种子节点与商户节点的一示例的关系示意图,如图2所示,不法分子1、不法分子2和不法分子3可将资金汇集到异常种子节点,异常种子节点可与商户节点1、商户节点2以及商户节点3通过交易等方式流转资金,商户节点1、商户节点2和商户节点3之间也可通过交易等方式,由图2可明显得到,商户节点1、商户节点2和商户节点3均是与异常种子节点具有密切联系的商户节点,其实际为异常商户节点的可能性非常大。因此,可利用异常种子节点与商户节点之间的连接边,通过标签传递的方式形成社区,使得多轮标签传播后形成包括异常种子节点的结构稳定的社区包括尽可能多的异常商户节点,减少该社区中正常商户节点的加入,其中,异常商户节点包括异常种子节点。

在结构稳定的社区中,获取包含异常种子节点的社区,判断该社区包含的异常种子节点是否满足预设条件。若该社区包含的异常种子节点满足预设条件,可将该社区确定为异常商户群体,即,将该社区中的商户节点确定为异常商户。同理,若该社区包含的异常种子节点不满足预设条件,则将该社区确定为正常群体。

预设条件包括用于判定社区是否为异常商户群体的条件。在一些示例中,预设条件可包括以下一项或两项以上:社区中异常种子节点占社区中商户节点的比例大于等于预设比例阈值;社区中异常种子节点的数量大于等于预设节点数量;社区包含最多的异常种子节点;社区中异常种子节点占社区中商户节点的比例最大。

可通过异常种子节点在社区中占据的比例确定异常商户群体。若预设条件包括社区中异常种子节点占社区中商户节点的比例大于等于预设比例阈值,可计算社区中异常种子节点占社区中商户节点的比例,若该比例大于等于预设比例阈值,则确定该社区为异常商户群体。预设比例阈值可根据场景、需求、经验等设定,在此并不限定其具体取值。若预设条件包括社区中异常种子节点占社区中商户节点的比例最大,则将结构稳定的社区中异常种子节点占社区中商户节点的比例最大的社区确定为异常商户群体。

可通过异常种子节点在社区中的数量确定异常商户群体。若预设条件包括社区中异常种子节点的数量大于等于预设节点数量,则将异常种子节点的数量大于等于预设节点数量的社区确定为异常商户群体。预设节点数量可根据场景、需求、经验等设定,在此并不限定。若预设条件包括社区包含最多的异常种子节点,则将包含异常种子节点的数量最大的社区确定为异常商户群体。

在本申请实施例中,可根据商户节点的网络同构图和商户节点关联的交易信息,得到商户节点的重要性参数。网络同构图包括预先给定的异常种子节点,异常种子节点为异常商户。根据网络同构图、商户节点的重要性和商户节点所在社区的结构信息进行多轮自适应的标签传播,形成社区。位于同一社区中的商户节点为关联紧密的商户节点,包含异常种子节点的社区中的商户节点与异常种子节点关联紧密,充分挖掘了异常的节点之间的社区关联性。可通过异常条件对包含异常种子节点的社区进行筛选,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。标签传播算法的时间复杂度近似线性,开销较小,能够快速响应,以实现异常商户群体的即时识别。

在一些实施例中,可根据商户节点在结构上的特征和商户节点在交易场景中的特征,确定商户节点的重要性,根据商户节点的结构以及重要性确定商户节点之间的传播性,基于商户节点的重要性和传播性进行标签传播。图3为本申请另一实施例提供的异常商户群体的识别方法的流程图,图3与图1的不同之处在于,图1中的步骤S102可具体细化为图3中的步骤S1021至步骤S1023,图1中的步骤S103可具体细化为图3中的步骤S1031和步骤S1032。

在步骤S1021中,基于网络同构图,得到商户节点的结构特征。

商户节点的结构特征(structure,STR)可表征商户节点在网络同构图中结构上的特性。在一些示例中,可根据商户节点自身连接的连接边以及商户节点的邻居节点连接的连接边得到商户节点的结构特征,这里商户节点的邻居节点指与该商户节点具有连接关系的其他商户节点。具体地,可在网络同构图中,获取商户节点的节点度和与商户节点具有连接关系的其他商户节点之间连接边的连接边数;根据商户节点的节点度和商户节点的连接边数,得到商户节点的结构特征。商户节点的节点度为与该商户节点连接的连接边的数量。与商户节点具有连接关系的其他商户之间的连接边的边数也可称为含有该商户节点的三角环数,商户节点的两个邻居节点之间存在连接边,则可记包含该商户节点的三角环数加一。可将商户节点的节点度和与商户节点具有连接关系的其他商户节点之间连接边的连接边数的加和确定为商户节点的结构特征。例如,商户节点的结构特征可如下式(1)计算得到:

其中,STR(v)为商户节点v的结构特征;degree(v)为商户节点v的节点度;

在步骤S1022中,基于商户节点关联的交易信息,得到商户节点的场景属性特征。

商户节点的场景属性特征(attribute,ATTR)可表征商户节点在交易场景上的特性。在一些示例中,从商户节点关联的交易信息中筛选得到商户节点对应的异常交易信息;根据商户节点对应的异常交易信息和关联的交易信息,得到商户节点的场景属性特征。异常交易信息的特征与正常交易信息的特征有所区别,可根据预设的异常交易筛选条件来获取异常交易信息。通过异常交易信息与关联的交易信息即总的交易信息的比对,来确定商户节点的场景属性特征。交易信息可包括交易时间、交易金额等。例如,可获取交易时间处于异常时间范围内的交易信息作为异常交易信息,异常时间范围为非工作时间范围,可获取该商户节点的异常交易信息中的异常交易金额和异常交易笔数,还可获取该商户节点所有交易信息中的总交易金额和总交易笔数,根据异常交易金额、异常交易笔数和总交易金额、总交易笔数来计算商户节点的场景属性特征。例如,商户节点的场景属性特征可根据下式(2)计算得到:

其中,ATTR(v)为商户节点v的场景属性特征;num_abnormal(v)为商户节点v的异常交易笔数;num_total(v)为商户节点v的总交易笔数;amount_abnormal(v)为商户节点v的异常交易金额;amount_total(v)为商户节点v的总交易金额。

在步骤S1023中,根据商户节点的结构特征和场景属性特征,确定商户节点的重要性参数。

重要性参数表征重要性(node importance,NI)。可根据商户节点的结构特征与场景属性特征的乘积,得到商户节点的重要性参数。在一些示例中,为了重要性参数更加精准,可对商户节点的结构特征和场景属性特征分别进行归一化处理;将归一化处理后的结构特征与归一化处理后的场景属性特征的乘积确定为商户节点的重要性参数。对各商户节点的结构特征和场景属性特征进行归一化处理,使得各商户节点的结构特征和场景属性特征在同一标准,更有利于后续重要性参数计算的精准性。例如,重要性参数的计算可根据下式(3)至(5)得到:

其中,

在步骤S1031中,在每轮标签传播中,基于网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,确定不同商户节点之间的传播性参数。

通过网络同构图,可得到不同商户节点之间的结构关系,从而得到计算传播性参数所需的不同商户节点之间的结构关系。通过重要性参数可得到商户节点的重要性,还可按照商户节点的重要性顺序来进行标签传播。通过商户节点所在社区的结构信息,可得到商户节点所在社区的结构,可为确定商户节点所在社区是继续扩张还是停止扩张提供参考。

在一些示例中,可基于网络同构图,得到不同的商户节点的邻居节点的相似度;基于商户节点所在社区的结构信息,得到商户节点所在社区的社区特征;根据不同的商户节点的邻居节点的相似度、商户节点所在社区的社区特征以及商户节点的重要性参数,计算得到不同商户节点之间的传播性参数。

商户节点的邻居节点包括与商户节点具有连接关系的其他商户节点。例如,图4为本申请实施例提供的商户节点的网络同构图的一示例的示意图,如图4所示,该网络同构图包括商户节点A1至商户节点A8,商户节点A3的邻居节点包括商户节点A1、商户节点A4、商户节点A6、商户节点A7和商户节点A8。两个商户节点共有的邻居节点的比例越高,两个商户节点之间越可能联系密切,属于同一社区的可能性越大。可利用商户节点的邻居节点的相似度来衡量不同商户节点之间共有的邻居节点的比例。例如,商户节点i和商户节点j的邻居节点的相似度可根据下式(6)计算得到:

其中,Jaccard(i,j)为商户节点i和商户节点j的邻居节点的相似度;Neighbor(i)为商户节点i的邻居节点的集合;Neighbor(j)为商户节点j的邻居节点的集合;Neighbor(i)∩Neighbor(j)为商户节点i的邻居节点的集合与商户节点j的邻居节点的集合的交集;Neighbor(i)∪Neighbor(j)为商户节点i的邻居节点的集合与商户节点j的邻居节点的集合的并集。

商户节点所在社区的结构信息可体现商户节点所在社区中的商户节点和连接边。如,结构信息可包括社区中的连接边数和社区中商户节点的节点数。商户节点所在社区的社区特征可体现商户节点所在社区的结构特征。如,社区特征可包括社区密度参数和社区规模社区参数;社区密度参数可体现社区的密度,可通过社区中连接边数和节点数计算得到;社区规模参数可作为社区规模设置惩罚因子使用,用于控制标签传播形成的社区的大小,避免形成意义较小的巨型社区和微型社区。

可根据社区中商户节点的节点数,确定社区对应的极限连接边数;在社区中商户节点的节点数大于等于2的情况下,将社区中的连接边数与极限连接边数的比值确定为社区密度参数;在社区中商户节点的节点数等于1的情况下,将1确定为社区密度参数;对比社区中商户节点的节点数和预设的异常社区节点数,根据对比结果和社区中商户节点的节点数,得到社区规模参数;其中,在对比结果表征社区中商户节点的节点数小于异常社区节点数的情况下,社区规模参数与社区中商户节点的节点数呈正相关;在对比结果表征社区中商户节点的节点数大于等于异常社区节点数的情况下,社区规模参数与社区中商户节点的节点数呈负相关。

社区对应的极限连接边数为社区中若每两个商户节点都连接有连接边情况下的连接边数。例如,若社区包括n个商户节点,则该社区对应的极限连接边数为n(n-1)/2,其中,n为大于等于2的整数。社区密度参数可根据社区中实际的连接边数与极限连接边数来确定。在社区中商户节点的节点数大于等于2的情况下,可将社区中实际的连接边数与极限连接边数的比值确定为社区密度参数,社区密度参数越大表示社区密度越大。例如,在社区包括两个以上的商户的情况下,社区密度参数可根据下式(7)得到:

其中,community_d(v)为商户节点v所在社区的社区密度参数;num_links(v)为商户节点v所在社区的实际的连接边数;community(v)为商户节点v所在社区的极限连接边数。

社区中包括一个商户节点时,社区密度参数并不适用上述计算方式,可直接将1确定为社区密度参数。

为了避免形成巨型社区和微型社区,在社区中商户节点的节点数不同的情况下,可采用不同的算法那得到社区规模参数。异常社区节点数是一般情况下异常社区中商户节点的数量,可通过对多个异常社区进行研究得到,例如,异常社区节点数可为实际得到的异常社区中节点数的平均值。在社区中商户节点的节点数小于异常社区节点数的情况下,所采用的算法使得社区规模参数与社区中商户节点的节点数呈正相关,即,社区中商户节点的节点数越大,社区规模参数越大,避免形成微型社区。在社区中商户节点的节点数大于等于异常社区节点数的情况下,所采用的算法使得社区规模参数与社区中商户节点的节点数呈负相关,即,社区中商户节点的节点数越大,社区规模参数越小,避免形成巨型社区。例如,社区规模参数可根据下式(8)得到:

其中,scale(v)为商户节点v所在社区的社区规模参数;community(v)为商户节点v所在社区中商户节点的节点数;exp为以自然常数e为底的指数计算;avg_gang为异常社区节点数。

传播性参数可体现商户节点之间的标签的传播性。传播性考量商户节点的重要性参数,使得重要性越高的商户节点对邻居节点的影响越大;传播性考量与商户节点之间的邻居节点的相似度,使得共有的邻居节点的数量越多,两个商户节点之间的影响越大;传播性考量传播过程中的自适应性,使得越密集的社区倾向于扩张,越稀疏的社区倾向于收缩,并规避实际意义不大的巨型社区和微型社区。

根据不同商户节点的邻居节点的相似度、所在社区的社区特征以及重要性参数,可计算得到不同商户节点之间的传播性参数。商户节点i和商户节点j之间的传播性参数可根据商户节点i和商户节点j之间的邻居节点的相似度、商户节点i所在社区的社区密度参数、商户节点j所在社区的社区密度参数、商户节点i所在社区的社区规模参数、商户节点j所在社区的社区规模参数、商户节点i的重要性参数和商户节点j的重要性参数得到。例如,商户节点i与商户节点j之间的传播性参数可根据下式(9)和(10)得到:

NP(i,j)=Jaccard(i,j)·M(i,j) (9)

其中,NP(i,j)为商户节点i和商户节点j之间的传播性参数;Jaccard(i,j)为商户节点i和商户节点j的邻居节点的相似度;NI(i)为商户节点i的重要性参数;NI(j)为商户节点j的重要性参数;community_d(i)为商户节点i所在社区的社区密度参数;community_d(j)为商户节点j所在社区的社区密度参数;scale(i)为商户节点i所在社区的社区规模参数;scale(i)为商户节点j所在社区的社区规模参数。

在步骤S1032中,按照重要性参数表征的重要性由高至低的顺序,利用不同商户节点之间的传播性参数,传播标签,形成新的社区,直至标签传播形成结构稳定的社区。

重要性越高的商户节点,越先传播自己的标签,传播的强度越大。在每轮标签传播中,可先获取重要性最高的商户节点与邻居节点之间的传播性参数,在邻居节点记录商户节点与其的传播性参数以及商户节点的标签;再获取重要性第二高的商户节点与邻居节点之间的传播性参数,并在邻居节点记录商户节点与其的传播性参数以及商户节点的标签;以此类推,直至获取重要性最低的商户节点与邻居节点之间的传播性参数,在邻居节点记录商户节点与其的传播性参数以及商户节点的标签。此时,至少部分商户节点记录有与其他商户节点的传播性参数以及其他商户节点的标签,对于一个记录有与邻居节点的传播性参数以及邻居节点的标签的商户节点而言,该商户节点自身的标签可更新为与该商户节点的传播性参数最高的一邻居节点的标签,或者,该商户节点自身的标签可更新为与该商户节点具有传播性的各邻居节点的标签,即,商户节点更新后的标签可包括多个标签,在此并不限定。一轮标签传播结束后,至少部分商户节点的标签发生了更新,可按照更新后的标签重新形成社区。一个商户节点可位于一个社区中,也可位于多个社区中。

例如,图5为本申请实施例提供的商户节点形成社区的一示例的示意图,如图5所示,若商户节点A3的重要性最高,则从商户节点A3开始进行标签传播,经过传播性参数的计算,商户节点A6的标签、商户节点A7的标签和商户节点A8的标签更新为商户节点A3的标签,在又一轮标签传播中,经过传播性参数的计算,商户节点A5的标签更新为商户节点A8的标签,即也与商户节点A3的标签相同,因此,商户节点A3、商户节点A5、商户节点A6、商户节点A7和商户节点A8形成一个社区(即虚线圈起的部分)。

通过标签传播形成的社区能够深度挖掘商户节点与异常种子节点之间的关系,以及商户节点之间的关系,从而快速识别出异常商户群体。

本申请第二方面提供一种异常商户群体的识别装置。图6为本申请一实施例提供的异常商户群体的识别装置的结构示意图,如图6所示,该异常商户群体的识别装置200可包括图构建模块201、重要性确定模块202、标签传播模块203和识别模块204。

图构建模块201可用于根据商户节点与用户的交易关系,得到商户节点的网络同构图。部分商户节点为异常种子节点。

重要性确定模块202可用于根据网络同构图和商户节点关联的交易信息,确定商户节点的重要性参数。

标签传播模块203可用于对商户节点进行多轮标签传播,直至标签传播形成结构稳定的社区,在每轮标签传播中,根据网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,进行标签传播,经标签传播后具有相同标签的商户节点划分至同一社区。

识别模块204可用于在结构稳定的社区中,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。

在一些示例中,预设条件包括以下一项或多项:社区中异常种子节点占社区中商户节点的比例大于等于预设比例阈值;社区中异常种子节点的数量大于等于预设节点数量;社区包含最多的异常种子节点;社区中异常种子节点占社区中商户节点的比例最大。

在本申请实施例中,可根据商户节点的网络同构图和商户节点关联的交易信息,得到商户节点的重要性参数。网络同构图包括预先给定的异常种子节点,异常种子节点为异常商户。根据网络同构图、商户节点的重要性和商户节点所在社区的结构信息进行多轮自适应的标签传播,形成社区。位于同一社区中的商户节点为关联紧密的商户节点,包含异常种子节点的社区中的商户节点与异常种子节点关联紧密,充分挖掘了异常的节点之间的社区关联性。可通过异常条件对包含异常种子节点的社区进行筛选,将包含的异常种子节点满足预设条件的社区确定为异常商户群体。标签传播算法的时间复杂度近似线性,开销较小,能够快速响应,以实现异常商户群体的即时识别。

在一些实施例中,重要性确定模块202可用于:基于网络同构图,得到商户节点的结构特征;基于商户节点关联的交易信息,得到商户节点的场景属性特征;根据商户节点的结构特征和场景属性特征,确定商户节点的重要性参数。

在一些示例中,重要性确定模块202可具体用于:在网络同构图中,获取商户节点的节点度和与商户节点具有连接关系的其他商户节点之间连接边的连接边数;根据商户节点的节点度和商户节点的连接边数,得到商户节点的结构特征。

在一些示例中,重要性确定模块202可具体用于:从商户节点关联的交易信息中筛选得到商户节点对应的异常交易信息;根据商户节点对应的异常交易信息和关联的交易信息,得到商户节点的场景属性特征。

在一些示例中,重要性确定模块202可具体用于:对商户节点的结构特征和场景属性特征分别进行归一化处理;将归一化处理后的结构特征与归一化处理后的场景属性特征的乘积确定为商户节点的重要性参数。

在一些实施例中,标签传播模块203可用于:在每轮标签传播中,基于网络同构图、商户节点的重要性参数和商户节点所在社区的结构信息,确定不同商户节点之间的传播性参数;按照重要性参数表征的重要性由高至低的顺序,利用不同商户节点之间的传播性参数,传播标签,形成新的社区。

在一些示例中,标签传播模块203可具体用于:基于网络同构图,得到不同的商户节点的邻居节点的相似度,商户节点的邻居节点包括与商户节点具有连接关系的其他商户节点;基于商户节点所在社区的结构信息,得到商户节点所在社区的社区特征;根据不同的商户节点的邻居节点的相似度、商户节点所在社区的社区特征以及商户节点的重要性参数,计算得到不同商户节点之间的传播性参数。

在一些示例中,结构信息包括社区中的连接边数和社区中商户节点的节点数,社区特征包括社区密度参数和社区规模参数。标签传播模块203可具体用于:根据社区中商户节点的节点数,确定社区对应的极限连接边数;在社区中商户节点的节点数大于等于2的情况下,将社区中的连接边数与极限连接边数的比值确定为社区密度参数;在社区中商户节点的节点数等于1的情况下,将1确定为社区密度参数;对比社区中商户节点的节点数和预设的异常社区节点数,根据对比结果和社区中商户节点的节点数,得到社区规模参数。其中,在对比结果表征社区中商户节点的节点数小于异常社区节点数的情况下,社区规模参数与社区中商户节点的节点数呈正相关;在对比结果表征社区中商户节点的节点数大于等于异常社区节点数的情况下,社区规模参数与社区中商户节点的节点数呈负相关。

在一些实施例中,图构建模块201可用于:根据商户节点与用户的交易关系,获取商户节点关联的交易信息;从交易信息中筛选符合预设要求的交易信息;根据符合预设要求的交易信息关联的商户节点和用户,构建商户用户异构图;将商户用户异构图转化为网络同构图。

本申请第三方面提供一种电子设备。图7为本申请一实施例提供的电子设备的结构示意图,如图7所示,电子设备300包括存储器301、处理器302及存储在存储器301上并可在处理器302上运行的计算机程序。

在一些示例中,上述处理器302可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。

存储器301可包括只读存储器(Read-Only Memory,ROM),随机存取存储器(RandomAccess Memory,RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本申请实施例中异常商户群体的识别方法所描述的操作。

处理器302通过读取存储器301中存储的可执行程序代码来运行与可执行程序代码对应的计算机程序,以用于实现上述实施例中的异常商户群体的识别方法。

在一些示例中,电子设备300还可包括通信接口303和总线304。其中,如图7所示,存储器301、处理器302、通信接口303通过总线304连接并完成相互间的通信。

通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。也可通过通信接口303接入输入设备和/或输出设备。

总线304包括硬件、软件或两者,将电子设备300的部件彼此耦接在一起。举例来说而非限制,总线304可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Enhanced Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(IndustryStandard Architecture,ISA)总线、无限带宽互连、低引脚数(Low pin count,LPC)总线、存储器总线、微信道架构(Micro Channel Architecture,MCA)总线、外围组件互连(Peripheral Component Interconnect,PCI)总线、PCI-Express(PCI-E)总线、串行高级技术附件(Serial Advanced Technology Attachment,SATA)总线、视频电子标准协会局部(Video Electronics Standards Association Local Bus,VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线304可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。

本申请第四方面提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,该计算机程序指令被处理器执行时可实现上述实施例中的异常商户群体的识别方法,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,上述计算机可读存储介质可包括非暂态计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等,在此并不限定。

本申请实施例提供一种计算机程序产品,该计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述实施例中的异常商户群体的识别方法,且能达到相同的技术效果,为避免重复,这里不再赘述。

需要明确的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。对于装置实施例、设备实施例、计算机可读存储介质实施例、计算机程序产品实施例而言,相关之处可以参见方法实施例的说明部分。本申请并不局限于上文所描述并在图中示出的特定步骤和结构。本领域的技术人员可以在领会本申请的精神之后,作出各种改变、修改和添加,或者改变步骤之间的顺序。并且,为了简明起见,这里省略对已知方法技术的详细描述。

上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。

本领域技术人员应能理解,上述实施例均是示例性而非限制性的。在不同实施例中出现的不同技术特征可以进行组合,以取得有益效果。本领域技术人员在研究附图、说明书及权利要求书的基础上,应能理解并实现所揭示的实施例的其他变化的实施例。在权利要求书中,术语“包括”并不排除其他装置或步骤;数量词“一个”不排除多个;术语“第一”、“第二”用于标示名称而非用于表示任何特定的顺序。权利要求中的任何附图标记均不应被理解为对保护范围的限制。权利要求中出现的多个部分的功能可以由一个单独的硬件或软件模块来实现。某些技术特征出现在不同的从属权利要求中并不意味着不能将这些技术特征进行组合以取得有益效果。

技术分类

06120116541713