掌桥专利:专业的专利平台
掌桥专利
首页

异常团伙识别方法、装置、计算机设备和存储介质

文献发布时间:2024-04-18 19:57:31


异常团伙识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域,特别是涉及一种异常团伙识别方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

目前,电信诈骗团伙大多数是以团伙的形式实施诈骗行为;为了预防用户产生经济损失,对电信诈骗团伙进行有效识别,是非常重要的。

现有电信诈骗团伙的识别方法,主要是通过人工对通信号码进行一一排查,比如点对点检测判断。但是,通过人工排查的方法非常耗时耗力,导致识别效率较低。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高电信诈骗团伙的识别效率的异常团伙识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本申请提供了一种异常团伙识别方法。所述方法包括:

根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新;

从更新后通话关系图中与所述已知异常通信号码关联的通信号码中,确定出初始异常通信号码;

基于所述更新后通话关系图,从所述初始异常通信号码中,确定出候选异常通信号码;

对所述候选异常通信号码进行识别,得到对应的识别结果;所述识别结果用于表示所述候选异常通信号码所属用户是否为所述已知异常通信号码所属用户的异常团伙。

在其中一个实施例中,所述从更新后通话关系图中与所述已知异常通信号码关联的通信号码中,确定出初始异常通信号码,包括:

从所述更新后通话关系图中,确定出与所述已知异常通信号码关联的通信号码的关联通信号码数量,作为所述通信号码的中心度评分;

按照所述中心度评分,对所述通信号码进行排序,得到排序后的通信号码;

从所述排序后的通信号码中,筛选出所述中心度评分靠前的N个通信号码,作为初始异常通信号码;N为大于或者等于2的正整数。

在其中一个实施例中,所述基于所述更新后通话关系图,从所述初始异常通信号码中,确定出候选异常通信号码,包括:

根据所述初始异常通信号码和所述已知异常通信号码,对所述更新后通话关系图进行环路遍历,得到环路遍历结果;所述环路遍历结果用于表示所述初始异常通信号码和所述已知异常通信号码是否构成通话关系环路;

根据所述环路遍历结果,从所述初始异常通信号码中,筛选出与所述已知异常通信号码构成通话关系环路的通信号码;

将筛选出的通信号码,确认为所述候选异常通信号码。

在其中一个实施例中,所述根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新,包括:

从所述历史通话记录信息中,提取出所述已知异常通信号码的关联通信号码,以及所述已知异常通信号码与所述关联通信号码之间的通话关系;

按照所述已知异常通信号码与所述关联通信号码之间的通话关系,将所述已知异常通信号码与所述关联通信号码,添加至通话关系图中,得到所述更新后通话关系图。

在其中一个实施例中,在根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新之前,还包括:

获取多个通信号码的历史通话记录信息;

对每个通信号码的历史通话记录信息进行解析,得到所述每个通信号码的关联通信号码;

根据所述每个通信号码和所述每个通信号码的关联通信号码,构建得到所述通话关系图。

在其中一个实施例中,所述对所述候选异常通信号码进行识别,得到对应的识别结果,包括:

提取所述候选异常通信号码的特征信息;

将所述特征信息输入预先训练的通信号码识别模型,得到候选异常通信号码的异常概率;

在所述异常概率大于预设概率的情况下,将所述候选异常通信号码所属用户确认为所述已知异常通信号码所属用户的异常团伙。

在其中一个实施例中,在根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新之前,还包括:

获取与所述已知异常通信号码对应的通信数据;

从所述通信数据中,筛选出所述已知异常通信号码在过去预设时间段的通话记录信息,作为所述历史通话记录信息。

第二方面,本申请还提供了一种异常团伙识别装置。所述装置包括:

关系图更新模块,用于根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新;

第一筛选模块,用于从更新后通话关系图中与所述已知异常通信号码关联的通信号码中,确定出初始异常通信号码;

第二筛选模块,用于基于所述更新后通话关系图,从所述初始异常通信号码中,确定出候选异常通信号码;

结果确定模块,用于对所述候选异常通信号码进行识别,得到对应的识别结果。

第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新;

从更新后通话关系图中与所述已知异常通信号码关联的通信号码中,确定出初始异常通信号码;

基于所述更新后通话关系图,从所述初始异常通信号码中,确定出候选异常通信号码;

对所述候选异常通信号码进行识别,得到对应的识别结果;所述识别结果用于表示所述候选异常通信号码所属用户是否为所述已知异常通信号码所属用户的异常团伙。

第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新;

从更新后通话关系图中与所述已知异常通信号码关联的通信号码中,确定出初始异常通信号码;

基于所述更新后通话关系图,从所述初始异常通信号码中,确定出候选异常通信号码;

对所述候选异常通信号码进行识别,得到对应的识别结果;所述识别结果用于表示所述候选异常通信号码所属用户是否为所述已知异常通信号码所属用户的异常团伙。

第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新;

从更新后通话关系图中与所述已知异常通信号码关联的通信号码中,确定出初始异常通信号码;

基于所述更新后通话关系图,从所述初始异常通信号码中,确定出候选异常通信号码;

对所述候选异常通信号码进行识别,得到对应的识别结果;所述识别结果用于表示所述候选异常通信号码所属用户是否为所述已知异常通信号码所属用户的异常团伙。

上述异常团伙识别方法、装置、计算机设备、存储介质和计算机程序产品,先根据历史通话记录信息,对通话关系图进行更新;再从更新后通话关系图中与已知异常通信号码关联的通信号码中,确定出初始异常通信号码;接着基于更新后通话关系图,从初始异常通信号码中,确定出候选异常通信号码;最后对候选异常通信号码进行识别,得到对应的识别结果;识别结果用于表示候选异常通信号码所属用户是否为已知异常通信号码所属用户的异常团伙。这样,在进行异常团伙识别时,先根据已知异常通信号码的历史通话记录信息,通话关系图进行更新,从更新后通话关系图中,获取与已知异常通信号码关联的通信号码,再对与已知异常通信号码关联的通信号码进行两次筛选,即先从更新后通话关系图中与已知异常通信号码关联的通信号码中,筛选出初始异常通信号码,基于更新后通话关系图,从初始异常通信号码中,筛选出候选异常通信号码,并对第二次筛选得到的通信号码进行识别,得到对应的识别结果。该技术通过获取已知异常通信号码关联的通信号码,再借助更新后通话关系图对其进行二次筛选的过程,有利于自动筛选出可能为异常团伙的用户的通信号码,使得后续仅需要对这些筛选出的通信号码进行识别,无需通过人工对每个通信号码进行一一排查,从而减少了通信号码的排查范围,有利于简化异常团伙识别过程,进而提高了异常团伙的识别效率。

附图说明

图1为一个实施例中异常团伙识别方法的流程示意图;

图2为一个实施例中通话关系图的结构示意图;

图3为一个实施例中更新后的通话关系图的结构示意图;

图4为一个实施例中确定出初始异常通信号码的步骤的流程示意图;

图5为一个实施例中确定出候选异常通信号码的步骤的流程示意图;

图6为一个实施例中对通话关系图进行更新的步骤的流程示意图;

图7为一个实施例中得到候选异常通信号码的识别结果的步骤的流程示意图;

图8为一个实施例中获取已知异常通信号码的历史通话记录信息的步骤的流程示意图;

图9为另一个实施例中异常团伙识别方法的流程示意图;

图10为一个实施例中基于图数据库技术的电信团伙诈骗检测方法的流程示意图;

图11为一个实施例中异常团伙识别装置的结构框图;

图12为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

在一个实施例中,如图1所示,提供了一种异常团伙识别方法,本实施例以该方法应用于服务器进行举例说明;可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器之间的交互实现。其中,终端可以但不限于是各种智能手机和平板电脑;服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤:

步骤S101,根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新。

其中,已知异常通信号码是指已被识别为存在异常通信行为的电话号码,比如被服务器识别为存在可疑行为的电话号码、被人工电话核实为存在可疑行为的电话号码、被现场核实为存在可疑行为的电话号码、被诈骗大数据库识别为存在可疑行为的电话号码等。在实际场景中,已知异常通信号码是指诈骗可疑电话。

其中,历史通话记录信息是指已知异常通信号码以前一段时间内的通话记录信息,具体包括以前一段时间内,与已知异常通信号码进行通话的通信号码。在实际场景中,历史通话记录信息是指诈骗可疑电话一个月内的通话记录信息。

其中,通话关系图用于表征通信号码之间的通话关系。

其中,通话关系图是指由其他通信号码的通话记录信息所组成的图网络,具体是指由其他电话号码的关联电话号码所组成的图网络;例如,如图2所示的通话关系图中,点B、C、D、E、F代表的是其他通信号码,点和点之间的箭头代表的是其通话关系。需要说明的是,图2所示的通话关系图只是通话关系图中的一部分。

其中,通话关系是指通信号码所属终端与另一通信号码所属终端之间建立通信行为的关系,包括头部、关系边和尾部。例如,参考图3,通信号码A与通信号码B之间存在通话关系,那么头部是指通信号码A,尾部是指通信号码B,关系边是指通信号码A与通信号码B之间的无向边。

具体地,服务器从历史通话记录信息中,提取已知异常通信号码和与已知异常通信号码关联的通信号码之间的通话关系,将通话关系录入至通话关系图,使通话关系图中原有的通话关系与录入的通话关系进行组合,得到一个新的通话关系图,作为更新后通话关系图。

进一步地,在步骤S101之前,还包括:服务器获取已知异常通信号码的历史通话记录信息;具体地,服务器接收终端发送的异常团伙识别请求,并对异常团伙识别请求进行解析,得到已知异常通信号码;根据已知异常通信号码查询通话记录数据库,得到已知异常通信号码的通话记录信息,从已知异常通信号码的通话记录信息中,筛选出已知异常通信号码以前一段时间内的通话记录信息,作为已知异常通信号码的历史通话记录信息。

步骤S102,从更新后通话关系图中与已知异常通信号码关联的通信号码中,确定出初始异常通信号码。

其中,更新后通话关系图是指利用已知异常通信号码的历史通话记录信息,对通话关系图进行更新后所得到的通话关系图;如图3所示,更新后通话关系图也可以用于表征通信号码之间的通话关系。例如,图数据库中原先存储有通话关系图(比如图2),将已知异常通信号码的历史通话记录信息导入到图数据库之后,通话关系图会得到相应的更新处理,即图数据库中原先存储的通话关系图被替换为更新后通话关系图(比如图3)。

其中,与已知异常通信号码关联的通信号码,是指更新后通话关系图中与已知异常通信号码存在通话关系的通信号码,即与异常通信号码存在关系边的通信号码。

其中,初始异常通信号码是指从更新后通话关系图中与已知异常通信号码关联的通信号码中,筛选出的中心度评分满足预设评分条件的通信号码。

其中,中心度评分是指通信号码所建立的通话关系个数,即所连接的通信号码数量。在实际场景中,中心度评分指的是通信号码的出度跟入度的总和。其中,通信号码的出度是指以该通信号码为起点的关系边的数量,通信号码的入度是指以该通信号码为终点的关系边的数量。

其中,预设评分条件是指预先设置的中心度评分的筛选条件,比如大于预设评分阈值。若通信号码的中心度评分满足预设评分条件,比如中心度评分大于预设评分,则该通信号码会被识别为初始异常通信号码;若通信号码的中心度评分不满足预设评分条件,比如中心度评分小于或者等于预设评分,则该通信号码会被识别为正常通信号码。

其中,初始异常通信号码是指中心度评分满足预设评分条件的通信号码,比如中心度评分大于预设评分的通信号码。

具体地,服务器从更新后通话关系图中与已知异常通信号码关联的通信号码中,筛选出中心度评分满足预设评分条件的通信号码,作为初始异常通信号码。

举例说明,服务器查询更新后通话关系图,从更新后通话关系图中,获取与已知异常通信号码关联的通信号码;根据与已知异常通信号码关联的通信号码的出度和入度总和,确认与已知异常通信号码关联的通信号码的中心度评分,比如将与已知异常通信号码关联的通信号码的出度和入度总和,直接作为与已知异常通信号码关联的通信号码的中心度评分,或者将与已知异常通信号码关联的通信号码的出度和入度总和所匹配的评分,作为与已知异常通信号码关联的通信号码的中心度评分;接着判断中心度评分是否满足预设评分条件,若是,则将该通信号码确认为初始异常通信号码;若否,则将该通信号码确认为正常通信号码。

步骤S103,基于更新后通话关系图,从初始异常通信号码中,确定出候选异常通信号码。

其中,候选异常通信号码是指从初始异常通信号码中筛选出的,在更新后通话关系图中与已知异常通信号码构成通话关系环路的通信号码。

进一步地,候选异常通信号码是指初始异常通信号码中与已知异常通信号码之间的通话关系能够形成一个闭合环状路径的通信号码。在实际场景中,候选异常通信号码是指可能为已知异常通信号码所属用户的异常团伙的成员,具体是指可能为已知异常通信号码所属用户的诈骗团伙成员。

其中,通话关系环路是指三个或者三个以上通信号码之间的通话关系形成的一个闭合环状的路径。需要说明的是,本申请涉及的通话关系环路的组成要件为已知异常通信号码、候选异常通信号码与一个或若干个其他通信号码。例如,在更新后通话关系图中,若初始异常通信号码中存在一个通信号码,与已知异常通信号码和其他通信号码共同构成一个闭环的通话关系环路,则该通信号码为候选异常通信号码。

具体地,服务器从初始异常通信号码中,筛选出在更新后通话关系图中,与已知异常通信号码构成通话关系环路的通信号码,作为与已知异常通信号码关联的候选异常通信号码。

进一步地,服务器每次从初始异常通信号码中选择一个通信号码,并在更新后通话关系图中获取选择的通信号码与已知异常通信号码的点位,将该两个点位作为环路必要点位;接着,服务器判断更新后通话关系图中是否存在除该两个点位的其他点位,与环路必要点位构成通话关系环路,若存在,则将选择的通信号码作为候选异常通信号码。以此类推,服务器能够从初始异常通信号码中,筛选出候选异常通信号码。

例如,参考图3,点B为其中的一个初始异常通信号码。服务器是以已知异常通信号码A与初始异常通信号码B作为环路必要点位进行判断,由图3可知,点C可以与点A和点B构成通话关系环路,则判断点B为候选异常通信号码。

步骤S104,对候选异常通信号码进行识别,得到对应的识别结果;识别结果用于表示候选异常通信号码所属用户是否为已知异常通信号码所属用户的异常团伙。

其中,异常团伙是指诈骗团伙,比如电信诈骗团伙。

其中,候选异常通信号码所属用户为已知异常通信号码所属用户的异常团伙,是指候选异常通信号码所属用户属于已知异常通信号码所属用户所在的异常团伙中的成员,具体是指候选异常通信号码所属用户为已知异常通信号码所属用户的诈骗团伙成员。在实际场景中,已知异常通信号码所属用户的异常团伙是指通过人工电话核实或者现场核实进行可疑号码标记,或者与目前的诈骗大数据库信息进行比对所判断出的诈骗团伙成员。

具体地,服务器获取候选异常通信号码的信息,对候选异常通信号码的信息进行识别,得到候选异常通信号码的识别结果;根据候选异常通信号码的识别结果,判断候选异常通信号码所属用户是否为已知异常通信号码所属用户的异常团伙;举例说明,服务器将候选异常通信号码(比如图3中的B)的信息与目前的诈骗大数据库信息进行比对,如果比对结果为属于异常团伙,则判断候选异常通信号码所属用户为已知异常通信号码所属用户的异常团伙。

上述异常团伙识别方法,先根据历史通话记录信息,对通话关系图进行更新;再从更新后通话关系图中与已知异常通信号码关联的通信号码中,确定出初始异常通信号码;接着基于更新后通话关系图,从初始异常通信号码中,确定出候选异常通信号码;最后对候选异常通信号码进行识别,得到对应的识别结果;识别结果用于表示候选异常通信号码所属用户是否为已知异常通信号码所属用户的异常团伙。这样,在进行异常团伙识别时,先根据已知异常通信号码的历史通话记录信息,通话关系图进行更新,从更新后通话关系图中,获取与已知异常通信号码关联的通信号码,再对与已知异常通信号码关联的通信号码进行两次筛选,即先从更新后通话关系图中与已知异常通信号码关联的通信号码中,筛选出初始异常通信号码,基于更新后通话关系图,从初始异常通信号码中,筛选出候选异常通信号码,并对第二次筛选得到的通信号码进行识别,得到对应的识别结果。该技术通过获取已知异常通信号码关联的通信号码,再借助更新后通话关系图对其进行二次筛选的过程,有利于自动筛选出可能为异常团伙的用户的通信号码,使得后续仅需要对这些筛选出的通信号码进行识别,无需通过人工对每个通信号码进行一一排查,从而减少了通信号码的排查范围,有利于简化异常团伙识别过程,进而提高了异常团伙的识别效率。

在一个实施例中,如图4所示,上述步骤S102,从更新后通话关系图中与已知异常通信号码关联的通信号码中,确定出初始异常通信号码,具体包括如下步骤:

步骤S401,从更新后通话关系图中,确定出与已知异常通信号码关联的通信号码的关联通信号码数量,作为通信号码的中心度评分。

步骤S402,按照中心度评分,对通信号码进行排序,得到排序后的通信号码。

步骤S403,从排序后的通信号码中,筛选出中心度评分靠前的N个通信号码,作为初始异常通信号码;N为大于或者等于2的正整数。

其中,与已知异常通信号码关联的通信号码的关联通信号码数量,是指在更新后通话关系图中,与已知异常通信号码关联的通信号码所连接的通信号码数量。在实际场景中,关联通信号码数量是指与已知异常通信号码关联的通信号码的出度跟入度的总和。

具体地,服务器从更新后通话关系图中,获取与已知异常通信号码连接的通信号码,作为与已知异常通信号码关联的通信号码;从更新后通话关系图中,获取与已知异常通信号码关联的通信号码所连接的通信号码的数量,作为与已知异常通信号码关联的通信号码的关联通信号码数量,并将通信号码的关联通信号码数量,确认为通信号码的中心度评分;例如,参考图3,与通信号码B连接的通信号码数量为5,说明通信号码B的中心度评分为5。接着,服务器按照中心度评分从高到低排序,对与已知异常通信号码关联的通信号码进行排序,得到排序后的通信号码,根据排序后的通信号码,筛选出中心度评分靠前的通信号码,筛选后的通信号码即为初始异常通信号码。

本实施例中,从更新后通话关系图中,确定出与已知异常通信号码关联的通信号码的关联通信号码数量,作为通信号码的中心度评分,按照中心度评分对通信号码进行排序,得到排序后的通信号码,从排序后的通信号码中筛选出中心度评分靠前的通信号码,作为初始异常通信号码。这样,以中心度评分作为指标来表征与已知异常通信号码关联的通信号码的关联通信号码数量,并以此指标来对通信号码进行评分排序。若通信号码的中心度评分越高,则代表通信号码的异常程度更高,因此可以对已知异常通信号码关联的通信号码进行初步筛选,使得后续基于环路确定出的异常团伙更加准确,进一步提高了异常团伙的识别准确率。

在一个实施例中,如图5所示,上述步骤S103,基于更新后通话关系图,从初始异常通信号码中,确定出候选异常通信号码,具体包括如下步骤:

步骤S501,根据初始异常通信号码和已知异常通信号码,对更新后通话关系图进行环路遍历,得到环路遍历结果;环路遍历结果用于表示初始异常通信号码和已知异常通信号码是否构成通话关系环路。

步骤S502,根据环路遍历结果,从初始异常通信号码中,筛选出与已知异常通信号码构成通话关系环路的通信号码。

步骤S503,将筛选出的通信号码,确认为候选异常通信号码。

其中,环路遍历是指选择初始异常通信号码和已知异常通信号码作为必要通信号码,在更新后通话关系图中,对其他通话号码中的每个通话号码进行通话关系环路判断,查找是否存在与上述必要通信号码共同构成通话关系环路的通信号码。

具体地,服务器获取初始异常通信号码和已知异常通信号码,将获取初始异常通信号码和已知异常通信号码作为环路必经节点,并根据环路必经节点对更新后通话关系图进行环路遍历,判断更新后通话关系图中是否存在与环路必经节点共同构成通话关系环路的通信号码,从而得到对应的环路遍历结果;根据环路遍历结果,判断到更新后通话关系图中存在与环路必经节点共同构成通话关系环路的通信号码,则将该初始异常通信号码进行标记;最后,从初始异常通信号码中,筛选出已标记的初始异常通信号码,作为候选异常通信号码。

本实施例中,通过根据初始异常通信号码和已知异常通信号码,对更新后通话关系图进行环路遍历,根据环路遍历结果,从初始异常通信号码中,筛选出与已知异常通信号码构成通话关系环路的通信号码,将筛选出的通信号码,确认为候选异常通信号码。这样,通过将构成通话关系环路作为条件限定,可以避免筛选到中心度评分较高但不能与已知异常通信号码构成通话关系环路的通信号码,从而使得最终筛选出的候选异常通信号码更加准确,可以有效提高筛选准确率,从而使得后续识别异常团伙更加准确。

在一个实施例中,如图6所示,上述步骤S101,根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新,具体包括如下步骤:

步骤S601,从历史通话记录信息中,提取出已知异常通信号码的关联通信号码,以及已知异常通信号码与关联通信号码之间的通话关系。

步骤S602,按照已知异常通信号码与关联通信号码之间的通话关系,将已知异常通信号码与关联通信号码,添加至通话关系图中,得到更新后通话关系图。

需要说明的是,步骤S601中的已知异常通信号码的关联通信号码,与步骤S401中的与已知异常通信号码关联的通信号码是一样的。

举例说明,假设已知异常通信号码为A,服务器从A的历史通话记录信息中,提取出A的关联通信号码(比如B、C、D、E、F、G、H、I),以及A与关联通信号码之间的通话关系;按照A与关联通信号码之间的通话关系,将已知异常通信号码A与关联通信号码(比如B、C、D、E、F、G、H、I),添加至如图2所示的通话关系图中的相应位置,得到如图3所示的通话关系图,作为更新后通话关系图。

本实施例中,通过从已知异常通信号码的历史通话记录信息中,提取出已知异常通信号码的关联通信号码,以及已知异常通信号码与关联通信号码之间的通话关系,按照已知异常通信号码与关联通信号码之间的通话关系,将已知异常通信号码与关联通信号码,添加至通话关系图中,得到更新后通话关系图。这样,通过对通话关系图进行更新,有利于后续利用更新后通话关系图,进行通信号码的二次筛选,即先自动筛选出初始异常通信号码,再自动筛选出候选异常通信号码,从而实现了快速筛选出可能为异常团伙的通信号码的目的,进一步提高了异常团伙的识别效率。

在一个实施例中,上述步骤S101,在根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新之前,还包括如下内容:获取多个通信号码的历史通话记录信息;对每个通信号码的历史通话记录信息进行解析,得到每个通信号码的关联通信号码;根据每个通信号码和每个通信号码的关联通信号码,构建得到通话关系图。

其中,通信号码的历史通话记录信息中记录有该通信号码,与该通信号码进行通话的通信号码,以及这两者之间的通话关系;与该通信号码进行通话的通信号码称为该通信号码的关联通信号码。

具体地,服务器获取多个通信号码(比如B、C、D、E、F)的历史通话记录信息,对每个通信号码的历史通话记录信息进行解析,得到解析结果;从解析结果中,获取每个通信号码的关联通信号码;比如,对B的历史通话记录信息进行解析,可以得到B的关联通信号码为C、D、E、F。接着,服务器按照每个通信号码的关联通信号码与该通信号码之间的通话关系,构建该通信号码对应的节点和该通信号码的关联通信号码对应的节点,并在这两个节点之间构建关系边,从而得到一个用于表征这几个通信号码之间的通话关系的通话关系图。例如,服务器先构建节点B、节点C、节点D、节点E、节点F,并在节点B与节点C之间、节点B与节点D之间、节点B与节点E之间、节点B与节点F之间构建关系边,最终得到如图2所示的通话关系图。

本实施例中,通过获取多个通信号码的历史通话记录信息,对每个通信号码的历史通话记录信息进行解析,得到每个通信号码的关联通信号码,根据每个通信号码和每个通信号码的关联通信号码,构建得到通话关系图。这样,通过预先构建一个通话关系图,便于后续在得到已知异常通信号码的历史通话记录信息之后,仅需要利用已知异常通信号码的历史通话记录信息,对通话关系图进行更新即可,无需在每次进行异常团伙识别时,都重新构建一个新的通话关系图,进一步简化了异常团伙识别过程,有利于进一步提高异常团伙识别效率。

在一个实施例中,如图7所示,上述步骤S104,对候选异常通信号码进行识别,得到对应的识别结果,具体包括如下步骤:

步骤S701,提取候选异常通信号码的特征信息。

步骤S702,将特征信息输入预先训练的通信号码识别模型,得到候选异常通信号码的异常概率。

步骤S703,在异常概率大于预设概率的情况下,将候选异常通信号码所属用户确认为已知异常通信号码所属用户的异常团伙。

其中,候选异常通信号码的特征信息是指是指与候选异常通信号码相关的特征信息,比如候选异常通信号码的长度信息、标签信息等。

其中,通信号码识别模型是指能够对通信号码进行识别,判断通信号码是否为异常团伙的网络模型(比如卷积神经网络模型、深度学习模型等),即能够获取候选异常通信号码的特征信息,并将候选异常通信号码的特征信息与历史数据库中其他异常通信号码的特征信息进行比对,并基于比对结果判断出候选异常通信号码是否属于异常团伙。

其中,候选异常通信号码的异常概率是指候选异常通信号码所属用户属于异常团伙的概率;例如,候选异常通信号码的特征信息与历史数据库中其他异常通信号码的特征信息之间的相似度较高,则候选异常通信号码的异常概率也较高。

具体地,服务器获取候选异常通信号码的相关数据,并对相关数据进行特征提取处理,得到候选异常通信号码的特征信息;将候选异常通信号码的特征信息输入预先训练的通信号码识别模型,通过通信号码识别模型对异常通信号码的特征信息进行特征映射,得到异常通信号码的特征向量,对特征向量进行分析处理,得到候选异常通信号码的异常概率;将异常概率与预设概率进行比较,得到比较结果;根据比较结果,筛选出异常概率大于预设概率的候选异常通信号码,并将该候选异常通信号码所属用户确认为已知异常通信号码所属用户的异常团伙,即该候选异常通信号码所属用户为已知异常通信号码所属用户的诈骗团伙成员。

需要说明的是,在得到候选异常通信号码之后,还可以通过人工电话核实进行可疑号码标记,或者现场核实,或者跟目前已有的记录好的诈骗大数据库信息进行比对,以判断出候选异常通信号码所属用户是否为真正的诈骗团伙成员。

本实施例中,通过提取候选异常通信号码的特征信息,将特征信息输入预先训练的通信号码识别模型,得到候选异常通信号码的异常概率,在异常概率大于预设概率的情况下,将候选异常通信号码所属用户确认为已知异常通信号码所属用户的异常团伙。这样,利用预先训练的通信号码识别模型,从二次筛选后的范围较小的候选异常通信号码中,自动判断出哪些候选异常通信号码为已知异常通信号码所属用户的异常团伙,整个过程无需通过人工对已知异常通信号码的关联通信号码进行一一判断,有利于进一步提高异常团伙识别效率。

在一个实施例中,如图8所示,上述步骤S101,在根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新之前,还包括获取已知异常通信号码的历史通话记录信息的步骤,具体包括如下步骤:步骤S801,获取与已知异常通信号码对应的通信数据。

步骤S802,从通信数据中,筛选出已知异常通信号码在过去预设时间段的通话记录信息,作为历史通话记录信息。

其中,通信数据是指与已知异常通信号码相关的数据信息,比如通信号码的历史通话记录信息、通信号码的状态信息等。

其中,过去预设时间段是指预先设定的历史时间段。在实际场景中,过去预设时间段指的是过去一个月。

具体地,服务器从存储有多个通信号码对应的通信数据的数据库中,获取与已知异常通信号码对应的通信数据;对异常通信号码对应的通信数据进行时间信息划分,得到通信数据的时间信息划分结果;根据通信数据的时间信息划分结果,筛选出已知异常通信号码在过去预设时间段内的通话记录信息,作为已知异常通信号码的历史通话记录信息。

本实施例中,通过获取与已知异常通信号码对应的通信数据,从通信数据中,筛选出已知异常通信号码在过去预设时间段的通话记录信息,作为历史通话记录信息;这样,由于已知异常通信号码在过去预设时间段的历史通话记录信息,是跟进行异常团伙识别比较相关的数据,通过仅获取已知异常通信号码在过去预设时间段的历史通话记录信息,无需获取已知异常通信号码的过去所有时间段的历史通话记录信息,可以进一步降低异常团伙识别所要处理的数据量,从而提高了异常团伙识别效率。

在一个实施例中,如图9所示,提供了另一种异常团伙识别方法,以该方法应用于服务器进行举例说明,包括以下步骤:

步骤S901,获取多个通信号码的历史通话记录信息;对每个通信号码的历史通话记录信息进行解析,得到每个通信号码的关联通信号码;根据每个通信号码和每个通信号码的关联通信号码,构建得到通话关系图。

步骤S902,获取与已知异常通信号码对应的通信数据;从通信数据中,筛选出已知异常通信号码在过去预设时间段的通话记录信息,作为历史通话记录信息。

步骤S903,从历史通话记录信息中,提取出已知异常通信号码的关联通信号码,以及已知异常通信号码与关联通信号码之间的通话关系。

步骤S904,按照已知异常通信号码与关联通信号码之间的通话关系,将已知异常通信号码与关联通信号码,添加至通话关系图中,得到更新后通话关系图。

步骤S905,从更新后通话关系图中,确定出与已知异常通信号码关联的通信号码的关联通信号码数量,作为通信号码的中心度评分。

步骤S906,按照中心度评分,对通信号码进行排序,得到排序后的通信号码;从排序后的通信号码中,筛选出中心度评分靠前的N个通信号码,作为初始异常通信号码;N为大于或者等于2的正整数。

步骤S907,根据初始异常通信号码和已知异常通信号码,对更新后通话关系图进行环路遍历,得到环路遍历结果;环路遍历结果用于表示初始异常通信号码和已知异常通信号码是否构成通话关系环路。

步骤S908,根据环路遍历结果,从初始异常通信号码中,筛选出与已知异常通信号码构成通话关系环路的通信号码;将筛选出的通信号码,确认为候选异常通信号码。

步骤S909,提取候选异常通信号码的特征信息;将特征信息输入预先训练的通信号码识别模型,得到候选异常通信号码的异常概率。

步骤S910,在异常概率大于预设概率的情况下,将候选异常通信号码所属用户确认为已知异常通信号码所属用户的异常团伙。

上述异常团伙识别方法,先获取多个通信号码的历史通话记录信息,对每个通信号码的历史通话记录信息进行解析,得到每个通信号码的关联通信号码,根据每个通信号码和每个通信号码的关联通信号码,构建得到通话关系图;再获取与已知异常通信号码对应的通信数据,从通信数据中筛选出已知异常通信号码在过去预设时间段的通话记录信息,作为历史通话记录信息;然后从历史通话记录信息中,提取出已知异常通信号码的关联通信号码,以及已知异常通信号码与关联通信号码之间的通话关系;接着按照已知异常通信号码与关联通信号码之间的通话关系,将已知异常通信号码与关联通信号码,添加至通话关系图中,得到更新后通话关系图;然后从更新后通话关系图中,确定出与已知异常通信号码关联的通信号码的关联通信号码数量,作为通信号码的中心度评分;接着按照中心度评分,对通信号码进行排序,得到排序后的通信号码,从排序后的通信号码中,筛选出中心度评分靠前的N个通信号码,作为初始异常通信号码,其中N为大于或者等于2的正整数;然后根据初始异常通信号码和已知异常通信号码,对更新后通话关系图进行环路遍历,得到环路遍历结果;接着根据环路遍历结果,从初始异常通信号码中,筛选出与已知异常通信号码构成通话关系环路的通信号码,将筛选出的通信号码,确认为与已知异常通信号码关联的候选异常通信号码;然后提取候选异常通信号码的特征信息,将特征信息输入预先训练的通信号码识别模型,得到候选异常通信号码的异常概率;最后,在异常概率大于预设概率的情况下,将候选异常通信号码所属用户确认为已知异常通信号码所属用户的异常团伙。这样,在进行异常团伙识别时,先获取已知异常通信号码的历史通话记录信息,并利用这些历史通话记录信息,对通话关系图进行更新,从更新后通话关系图中,获取与已知异常通信号码关联的通信号码,再对与已知异常通信号码关联的通信号码进行两次筛选,即先从与已知异常通信号码关联的通信号码中,筛选出中心度评分满足预设评分条件的通信号码,然后从第一次筛选得到的通信号码中,再次筛选出在更新后通话关系图中与已知异常通信号码构成通话关系环路的通信号码,并对第二次筛选得到的通信号码进行识别,得到对应的识别结果。该技术通过获取已知异常通信号码关联的通信号码,再借助更新后通话关系图对其进行中心度评分以及环路判断的二次筛选过程,有利于自动筛选出可能为异常团伙的用户的通信号码,使得后续仅需要对这些筛选出的通信号码进行识别,无需通过人工对每个通信号码进行一一排查,从而减少了通信号码的排查范围,有利于简化异常团伙识别过程,进而提高了异常团伙的识别效率。

在一个实施例中,为了更清晰阐明本申请实施例提供的异常团伙识别方法,以下以一个具体的实施例对该异常团伙识别方法进行具体说明。在一个实施例中,如图10所示,本申请还提供了一种基于图数据库技术的电信团伙诈骗检测方法,通过高性能图数据库技术,并配合出入度中心性算法与环路自图发现算法两种图计算方法,有利于精准地识别出电信诈骗团伙成员。具体包括如下内容:

1、服务器接收到诈骗可疑电话号码,将该诈骗可疑电话号码定义为节点A。

2、服务器获取该节点A的通话记录信息,根据该节点A的通话记录信息,构建通话关系三元组结构化数据。

3、服务器将该三元组结构化数据导入至图数据库(比如Neo4J),对原图数据库中的通话关系图进行更新。

4、服务器运行出入度中心性算法,从图数据库中的更新后通话关系图中,获取与该节点A存在通话关系的其余节点,根据其余节点的出度与入度的总和,确定其余节点的中心度评分,将其余节点的中心度评分从高到低进行排序。通过排序得到的中心度评分靠前的若干节点(比如前5个节点),即为高通量风险节点;剩下的节点为正常无风险节点。

5、服务器将节点A作为环路必须节点,循环选定一个高通量风险节点,作为第二个必须节点,例如节点B。服务器执行环路自图发现算法,通过执行全图遍历,在图数据库中识别出节点A与节点B是否存在特殊的连通环路网络结构,检测环路形态。

6、如果节点A与节点B参与形成环路,则服务器确认节点B有极大可能为诈骗节点A的团伙,需要迅速进行优先核查,否则就降低节点B的核查等级,不做优先排查。

上述实施例,该技术通过获取已知异常通信号码的关联的通信号码,再借助图数据库技术对其进行出入度中心性算法以及环路自图发现算法的二次筛选过程,有利于自动筛选出可能为异常团伙的用户的通信号码,使得后续仅需要对这些筛选出的通信号码进行识别,无需通过人工对每个通信号码进行一一排查,从而减少了通信号码的排查范围,有利于简化异常团伙识别过程,进而提高了异常团伙的识别效率。同时,能够发现传统方法很难发现的规模型风险,能有效且明确地区分正常和异常高风险节点,做到对高风险节点迅速升级核查力度,进而提高了电信诈骗团伙的识别效率。

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的异常团伙识别方法的异常团伙识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个异常团伙识别装置实施例中的具体限定可以参见上文中对于异常团伙识别方法的限定,在此不再赘述。

在一个实施例中,如图11所示,提供了一种异常团伙识别装置,包括:关系图更新模块1101、第一筛选模块1102、第二筛选模块1103和结果确定模块1104,其中:

关系图更新模块1101,用于根据已知异常通信号码的历史通话记录信息,对通话关系图进行更新。

第一筛选模块1102,用于从更新后通话关系图中与已知异常通信号码关联的通信号码中,确定出初始异常通信号码。

第二筛选模块1103,用于基于更新后通话关系图,从初始异常通信号码中,确定出候选异常通信号码。

结果确定模块1104,用于对候选异常通信号码进行识别,得到对应的识别结果。

在一个实施例中,第一筛选模块1102,还用于从更新后通话关系图中,确定出与已知异常通信号码关联的通信号码的关联通信号码数量,作为通信号码的中心度评分;按照中心度评分,对通信号码进行排序,得到排序后的通信号码;从排序后的通信号码中,筛选出中心度评分靠前的N个通信号码,作为初始异常通信号码;N为大于或者等于2的正整数。

在一个实施例中,第二筛选模块1103,还用于根据初始异常通信号码和已知异常通信号码,对更新后通话关系图进行环路遍历,得到环路遍历结果;环路遍历结果用于表示初始异常通信号码和已知异常通信号码是否构成通话关系环路;根据环路遍历结果,从初始异常通信号码中,筛选出与已知异常通信号码构成通话关系环路的通信号码;将筛选出的通信号码,确认为候选异常通信号码。

在一个实施例中,关系图更新模块1101,还用于从历史通话记录信息中,提取出已知异常通信号码的关联通信号码,以及已知异常通信号码与关联通信号码之间的通话关系;按照已知异常通信号码与关联通信号码之间的通话关系,将已知异常通信号码与关联通信号码,添加至通话关系图中,得到更新后通话关系图。

在一个实施例中,异常团伙识别装置还包括关系图构建模块,用于获取多个通信号码的历史通话记录信息;对每个通信号码的历史通话记录信息进行解析,得到每个通信号码的关联通信号码;根据每个通信号码和每个通信号码的关联通信号码,构建得到通话关系图。

在一个实施例中,结果确定模块1104,还用于提取候选异常通信号码的特征信息;将特征信息输入预先训练的通信号码识别模型,得到候选异常通信号码的异常概率;在异常概率大于预设概率的情况下,将候选异常通信号码所属用户确认为已知异常通信号码所属用户的异常团伙。

在一个实施例中,异常团伙识别装置还包括信息筛选模块,用于获取与已知异常通信号码对应的通信数据;从通信数据中,筛选出已知异常通信号码在过去预设时间段的通话记录信息,作为历史通话记录信息。

上述异常团伙识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储通话记录信息、通话关系图、识别结果等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常团伙识别方法。

本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 可疑团伙识别方法、装置、设备及计算机可读存储介质
  • 声纹识别方法、装置、计算机设备和计算机可读存储介质
  • 异常用户的识别方法及装置、存储介质、电子设备
  • 双层车牌识别方法、装置、计算机设备及存储介质
  • 人脸识别方法、装置、计算机设备及存储介质
  • 团伙案件识别方法、装置、计算机设备、存储介质和产品
  • 团伙识别方法、装置、设备及计算机可读存储介质
技术分类

06120116458577