掌桥专利:专业的专利平台
掌桥专利
首页

欺诈用户集中区域的预测方法、装置、设备及存储介质

文献发布时间:2023-06-19 12:13:22


欺诈用户集中区域的预测方法、装置、设备及存储介质

技术领域

本发明涉及大数据领域,尤其涉及一种欺诈用户集中区域的预测方法、装置、设备及存储介质。

背景技术

随着互联网行业的不断发展,在相同的流畅网络体验情况下,网络安全逐渐成为了最重视的一环。用户在使用计算机网络的过程中,存在将用户信息上传至互联网的情况,例如:通过PC端办理个人信用借贷业务时,业务平台通常会收集用户身份信息、银行卡信息、个人征信等维度对用户进行审核。而在此过程中,职业欺诈用户往往用虚假信息骗取贷款,如:伪造交易记录、伪造通话记录、制造用户个人信息及良好信用等。一旦存在欺诈用户成功欺骗过业务系统情况,业务系统的安全性将不能保证,造成更大的损失,因此合理对欺诈用户进行监控或对待检测用户进行预测应是给予高度重视的。

目前对欺诈用户出现范围识别的过程中,数据分析模型较为单一,对现有的欺诈用户名单进行欺诈用户集中区域预测的准确率低下,增加了被欺诈用户攻击的风险。

发明内容

本发明提供了一种欺诈用户集中区域的预测方法、装置、设备及存储介质,用于提高对现有的欺诈用户名单进行欺诈用户集中区域预测的准确率,降低被欺诈用户攻击的风险。

本发明第一方面提供了一种欺诈用户集中区域的预测方法,包括:获取欺诈用户名单,通过基于移动位置服务获取所述欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;将所述多个欺诈用户的网格点轨迹输入至预置神经网络中,基于所述预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,所述预置关联数值用于指示网格点轨迹之间的预测关联性;连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将所述多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;基于空间聚类模型对所述多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域。

可选的,在本发明第一方面的第一种实现方式中,所述获取欺诈用户名单,通过基于移动位置服务获取所述欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹包括:获取欺诈用户名单,通过基于移动位置服务获取所述欺诈用户名单中每个欺诈用户的欺诈用户数据,所述欺诈用户数据包括欺诈用户的位置信息、停留时刻以及停留时段;将每个欺诈用户的位置信息映射在初始网格化地图中,在所述初始网格化地图中确定每个欺诈用户的位置信息,得到网格化地图;筛选出每个欺诈用户的所述停留时段小于停留阈值的目标时段,在所述网格化地图中将所述目标时段对应的欺诈用户的位置信息剔除,在网格化地图中得到多个欺诈用户的网格点轨迹。

可选的,在本发明第一方面的第二种实现方式中,所述将所述多个欺诈用户的网格点轨迹输入至预置神经网络中,基于所述预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,所述预置关联数值用于指示网格点轨迹之间的预测关联性包括:分别将每个欺诈用户的网格点轨迹按照预置时刻间隔点划分为前期网格点轨迹和后期网格点轨迹;将多个欺诈用户中的每个欺诈用户的所述前期网格点轨迹输分别入至初始神经网络中,利用所述初始神经网络和预置关联数值对所述前期网格点轨迹进行训练,生成预置神经网络,所述初始神经网络用于对所述前期网格点轨迹进行训练;将所述后期网络点轨迹输入至所述预置神经网络中,利用所述预置神经网络对所述后期网络点轨迹进行预测,生成每个欺诈用户的预测轨迹。

可选的,在本发明第一方面的第三种实现方式中,所述将多个欺诈用户中的每个欺诈用户的所述前期网格点轨迹输分别入至初始神经网络中,利用所述初始神经网络和预置关联数值对所述前期网格点轨迹进行训练,生成预置神经网络,所述初始神经网络用于对所述前期网格点轨迹进行训练包括:将多个欺诈用户中的每个欺诈用户的前期网格点轨迹划分为待训练网格点轨迹和待测试网格点轨迹;在多个欺诈用户中获取目标欺诈用户的所述目标待训练网格点轨迹的目标停留时刻,并按照所述目标停留时刻的时间顺序将所述目标欺诈用户的所述目标停留时刻和对应的目标待训练网格点轨迹输入至初始神经网络中;在所述初始神经网络中,利用预置关联数值确定所述目标待训练网格点轨迹之间的预测转化间隔数据;在所述初始神经网络中,通过所述预测转化间隔数据对所述目标待训练网格点轨迹进行训练,并利用所述目标欺诈用户的目标待测试网格点轨迹对初始神经网络进行验证,得到基础神经网络;获取其他欺诈用户的其他待训练网格点轨迹的其他停留时刻,将所述其他停留时刻和对应的其他待训练网格点轨迹输入至所述基础神经网络中,对所述基础神经网络进行调整,生成预置神经网络,所述其他欺诈用户为多个欺诈用户中除所述目标欺诈用户之外的欺诈用户。

可选的,在本发明第一方面的第四种实现方式中,所述连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹并将所述多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围包括:连接每个欺诈用户的网络点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹;获取所述多个欺诈用户的行进轨迹中目标行进轨迹上的多个行进位置网格点,并将所述目标行进轨迹上的多个行进位置网格点输入至时空聚类模型中,利用所述时空聚类模型在多个行进位置网格点中随机选取一个目标行进位置网格点,判断所述目标行进位置网格点是否符合预置核心判定规则;若所述目标行进位置网格点符合预置核心判定规则,则将所述目标行进位置网格点确定为核心行进位置网格点,并在所述核心行进位置网格点上建立一个范围集合,若所述目标行进位置网格点不符合预置核心判定规则,则将所述目标行进位置网络点确定为外围行进位置网络点;根据所述预置核心判定规则遍历其他行进位置网格点,直到确定另一个核心行进位置网格点并建立另一个范围集合,所述其他行进位置网格点为多个行进位置网格点中除所述目标行进位置网格点之外的行进位置网格点;在多个行进位置网格点中,将与所述核心行进位置网格点呈密度直达或呈密度可达的行进位置网格点确定为关联行进位置网格点,并将所述关联行进位置网格点添加至对应的范围集合内,直到遍历目标行进轨迹上的所有行进位置网格点,将多个范围集合确定为目标行进轨迹对应的欺诈用户的行进范围;将其他行进轨迹的多个行进位置网格点输入至所述时空聚类模型中,确定所述其他行进轨迹对应的欺诈用户的行进范围,对所述目标行进轨迹对应的欺诈用户的行进范围和所述其他行进轨迹对应的欺诈用户的行进范围进行整合,得到每个欺诈用户的行进范围。

可选的,在本发明第一方面的第五种实现方式中,在所述基于空间聚类模型对所述多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域之后,所述欺诈用户集中区域的预测方法还包括:获取待检测用户、待检测用户数据以及待检测用户的行进轨迹,将所述待检测用户数据以及所述待检测用户的行进轨迹分别与欺诈用户的欺诈用户集中区域以及欺诈用户的行进范围进行比对,确定所述待检测用户的行为属性,并根据所述待检测用户的行为属性确定风险解决方案。

可选的,在本发明第一方面的第六种实现方式中,所述获取待检测用户、待检测用户数据以及待检测用户的行进轨迹,将所述待检测用户数据以及所述待检测用户的行进轨迹分别与欺诈用户的欺诈用户集中区域以及欺诈用户的行进范围进行比对,确定所述待检测用户的行为属性,并根据所述待检测用户的行为属性确定风险解决方案包括:获取待检测用户、待检测用户数据以及待检测用户的行进轨迹;将所述待检测用户的行进轨迹与欺诈用户集中区域进行比对,确定所述待检测用户与所述欺诈用户之间的相似判定结果,所述相似判定结果用于指示所述待检测用户为欺诈用户或所述待检测用户为非欺诈用户;将所述待检测用户的行进轨迹和待检测用户数据分别与欺诈用户的行进轨迹和欺诈用户数据进行对比,确定所述待检测用户与所述欺诈用户之间的交集判定结果,所述交集判定结果用于指示所述待检测用户与所述欺诈用户无交集或所述待检测用户与所述欺诈用户有交集;基于所述待检测用户与所述欺诈用户之间的所述相似判定结果以及所述交集判定结果确定待检测用户的行为属性,并根据所述待检测用户的行为属性确定风险解决方案。

本发明第二方面提供了一种欺诈用户集中区域的预测装置,包括:映射模块,用于获取欺诈用户名单,通过基于移动位置服务获取所述欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;预测模块,用于将所述多个欺诈用户的网格点轨迹输入至预置神经网络中,基于所述预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,所述预置关联数值用于指示网格点轨迹之间的预测关联性;生成模块,用于连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将所述多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;确定模块,用于基于空间聚类模型对所述多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域。

可选的,在本发明第二方面的第一种实现方式中,所述映射模块具体用于:获取欺诈用户名单,通过基于移动位置服务获取所述欺诈用户名单中每个欺诈用户的欺诈用户数据,所述欺诈用户数据包括欺诈用户的位置信息、停留时刻以及停留时段;将每个欺诈用户的位置信息映射在初始网格化地图中,在所述初始网格化地图中确定每个欺诈用户的位置信息,得到网格化地图;筛选出每个欺诈用户的所述停留时段小于停留阈值的目标时段,在所述网格化地图中将所述目标时段对应的欺诈用户的位置信息剔除,在网格化地图中得到多个欺诈用户的网格点轨迹。

可选的,在本发明第二方面的第二种实现方式中,所述预测模块包括:划分单元,用于分别将每个欺诈用户的网格点轨迹按照预置时刻间隔点划分为前期网格点轨迹和后期网格点轨迹;训练单元,用于将多个欺诈用户中的每个欺诈用户的所述前期网格点轨迹输分别入至初始神经网络中,利用所述初始神经网络和预置关联数值对所述前期网格点轨迹进行训练,生成预置神经网络,所述初始神经网络用于对所述前期网格点轨迹进行训练;预测单元,用于将所述后期网络点轨迹输入至所述预置神经网络中,利用所述预置神经网络对所述后期网络点轨迹进行预测,生成每个欺诈用户的预测轨迹。

可选的,在本发明第二方面的第三种实现方式中,所述训练单元具体用于:将多个欺诈用户中的每个欺诈用户的前期网格点轨迹划分为待训练网格点轨迹和待测试网格点轨迹;在多个欺诈用户中获取目标欺诈用户的所述目标待训练网格点轨迹的目标停留时刻,并按照所述目标停留时刻的时间顺序将所述目标欺诈用户的所述目标停留时刻和对应的目标待训练网格点轨迹输入至初始神经网络中;在所述初始神经网络中,利用预置关联数值确定所述目标待训练网格点轨迹之间的预测转化间隔数据;在所述初始神经网络中,通过所述预测转化间隔数据对所述目标待训练网格点轨迹进行训练,并利用所述目标欺诈用户的目标待测试网格点轨迹对初始神经网络进行验证,得到基础神经网络;获取其他欺诈用户的其他待训练网格点轨迹的其他停留时刻,将所述其他停留时刻和对应的其他待训练网格点轨迹输入至所述基础神经网络中,对所述基础神经网络进行调整,生成预置神经网络,所述其他欺诈用户为多个欺诈用户中除所述目标欺诈用户之外的欺诈用户。

可选的,在本发明第二方面的第四种实现方式中,所述生成模块具体用于:连接每个欺诈用户的网络点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹;获取所述多个欺诈用户的行进轨迹中目标行进轨迹上的多个行进位置网格点,并将所述目标行进轨迹上的多个行进位置网格点输入至时空聚类模型中,利用所述时空聚类模型在多个行进位置网格点中随机选取一个目标行进位置网格点,判断所述目标行进位置网格点是否符合预置核心判定规则;若所述目标行进位置网格点符合预置核心判定规则,则将所述目标行进位置网格点确定为核心行进位置网格点,并在所述核心行进位置网格点上建立一个范围集合,若所述目标行进位置网格点不符合预置核心判定规则,则将所述目标行进位置网络点确定为外围行进位置网络点;根据所述预置核心判定规则遍历其他行进位置网格点,直到确定另一个核心行进位置网格点并建立另一个范围集合,所述其他行进位置网格点为多个行进位置网格点中除所述目标行进位置网格点之外的行进位置网格点;在多个行进位置网格点中,将与所述核心行进位置网格点呈密度直达或呈密度可达的行进位置网格点确定为关联行进位置网格点,并将所述关联行进位置网格点添加至对应的范围集合内,直到遍历目标行进轨迹上的所有行进位置网格点,将多个范围集合确定为目标行进轨迹对应的欺诈用户的行进范围;将其他行进轨迹的多个行进位置网格点输入至所述时空聚类模型中,确定所述其他行进轨迹对应的欺诈用户的行进范围,对所述目标行进轨迹对应的欺诈用户的行进范围和所述其他行进轨迹对应的欺诈用户的行进范围进行整合,得到每个欺诈用户的行进范围。

可选的,在本发明第二方面的第五种实现方式中,所述欺诈用户集中区域的预测装置还包括:解决模块,用于获取待检测用户、待检测用户数据以及待检测用户的行进轨迹,将所述待检测用户数据以及所述待检测用户的行进轨迹分别与欺诈用户的欺诈用户集中区域以及欺诈用户的行进范围进行比对,确定所述待检测用户的行为属性,并根据所述待检测用户的行为属性确定风险解决方案。

可选的,在本发明第二方面的第六种实现方式中,所述解决模块具体用于:获取待检测用户、待检测用户数据以及待检测用户的行进轨迹;将所述待检测用户的行进轨迹与欺诈用户集中区域进行比对,确定所述待检测用户与所述欺诈用户之间的相似判定结果,所述相似判定结果用于指示所述待检测用户为欺诈用户或所述待检测用户为非欺诈用户;将所述待检测用户的行进轨迹和待检测用户数据分别与欺诈用户的行进轨迹和欺诈用户数据进行对比,确定所述待检测用户与所述欺诈用户之间的交集判定结果,所述交集判定结果用于指示所述待检测用户与所述欺诈用户无交集或所述待检测用户与所述欺诈用户有交集;基于所述待检测用户与所述欺诈用户之间的所述相似判定结果以及所述交集判定结果确定待检测用户的行为属性,并根据所述待检测用户的行为属性确定风险解决方案。

本发明第三方面提供了一种欺诈用户集中区域的预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述欺诈用户集中区域的预测设备执行上述的欺诈用户集中区域的预测方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的欺诈用户集中区域的预测方法。

本发明提供的技术方案中,获取欺诈用户名单,通过基于移动位置服务获取所述欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;将所述多个欺诈用户的网格点轨迹输入至预置神经网络中,基于所述预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,所述预置关联数值用于指示网格点轨迹之间的预测关联性;连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将所述多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;基于空间聚类模型对所述多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域。本发明实施例中,通过基于移动位置服务获取欺诈用户的欺诈用户数据,并将欺诈用户数据映射至网格化地图中,确定欺诈用户的网格点轨迹,依次利用预置神经网络和时空聚类模型对欺诈用户的网格点轨迹进行预测,确定欺诈用户集中区域。提高了对现有的欺诈用户名单进行欺诈用户集中区域预测的准确率,降低了被欺诈用户攻击的风险。

附图说明

图1为本发明实施例中欺诈用户集中区域的预测方法的一个实施例示意图;

图2为本发明实施例中欺诈用户集中区域的预测方法的另一个实施例示意图;

图3为本发明实施例中欺诈用户集中区域的预测装置的一个实施例示意图;

图4为本发明实施例中欺诈用户集中区域的预测装置的另一个实施例示意图;

图5为本发明实施例中欺诈用户集中区域的预测设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种欺诈用户集中区域的预测方法、装置、设备及存储介质,用于提高对现有的欺诈用户名单进行欺诈用户集中区域预测的准确率,降低被欺诈用户攻击的风险。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中欺诈用户集中区域的预测方法的一个实施例包括:

101、获取欺诈用户名单,通过基于移动位置服务获取欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;

可以理解的是,本发明的执行主体可以为欺诈用户集中区域的预测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

在对欺诈用户集中区域进行预测之前,首先服务器需要获取欺诈用户名单、每个欺诈用户的欺诈用户数据和网格化地图。这里的欺诈用户名单是业务平台对于曾经进入平台黑名单或被曾经被识别为欺诈的用户的名单记录。每个欺诈用户的欺诈数据是通过基于移动位置服务(location based service,LBS)获取的,LBS是指通过信号运营商的无线电通讯网络或外部定位方式,获取移动终端用户的位置信息,在GIS平台的支持下,为用户提供相应服务的一种增值业务。LBS不仅可以确定移动设备或用户所在的地理位置,还可以提供与位置相关的各类信息服务,具体可以为用户喜好、用户消费水平、用户工作环境、用户出行规律、用户人际网络等信息,并通过这些信息建立丰富的用户画像。在本申请中,通过LBS获取到的欺诈用户数据具体包括用户出现的位置信息(欺诈用户的位置信息,具体为地理位置的经纬度)、在某一位置出现的时刻(停留时刻)以及对应在该位置上的静止时长(停留时段)。这里的网格化地图是将地理位置划分成了一个个网格,每一个网格代表一个地理区域,且每一个网格携带了该网格的地理位置信息(经纬度信息)、边界信息、网格所在地名称、网格内兴趣点信息(point of interest,POI)等。上述信息在本申请中均为已知信息,具体信息的获取过程在此不再赘述。

在服务器获取了欺诈用户名单、每个欺诈用户的欺诈用户数据和网格化地图之后,需要将每个欺诈用户的欺诈用户数据映射至网格化地图中,在网格化地图中显示出每个欺诈用户的网格点轨迹。为进一步保证上述欺诈用户数据的私密和安全性,上述基本信息数据还可以存储于一区块链的节点中。

102、将多个欺诈用户的网格点轨迹输入至预置神经网络中,基于预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,预置关联数值用于指示网格点轨迹之间的预测关联性;

服务器在获取多个欺诈用户的网格点轨迹之后,需要利用预置神经网络预测每个欺诈用户的未来行进趋势,以此作为预测欺诈用户集中区域的基础数据。这里的预置神经网络为长短期记忆网络(long short-term memory,LSTM),是一种时间递归神经网络(RNN),LSTM网络中包括三个“门”,依次为“遗忘门”、“输入门”、“输出门”,通过上述三个“门”可以实现对输入数据的预测。需要说明的是,这里的预置关联数值用以指示输入预置神经网络中的数据之间的预测关联性。

103、连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;

服务器将每个欺诈用户的网格点轨迹和对应的预测轨迹连接起来以后,即可得到每个欺诈用户的行进轨迹。这时利用时空聚类模型对每个欺诈用户的行进轨迹进行预测,生成每个欺诈用户的行进范围,聚类模型的相似性度量主要包括网格点位置信息(经纬度)的距离以及在网格点位置出现的时间间隔,聚类的实现具体采用的是具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)。DBSCAN算法是一种基于密度的空间聚类算法,其将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,将簇定义为密度相连的点的最大集合。通过时空聚类模型可以预测每个欺诈用户的行进范围。

104、基于空间聚类模型对多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域。

需要说明的是,服务器在获取每个欺诈用户的行进范围之后,需要对多个欺诈用户的行进范围进行聚类,从而明确欺诈用户出现的集中区域。需要说明的是,对多个欺诈用户的行进范围进行聚类的过程中采用的是空间聚类模型,聚类模型的相似性度量主要包括网格点位置信息(经纬度)的距离,聚类的实现具体采用的是DBSCAN算法。在聚类过程中针对一个固定的时间间隔,检测在该时间间隔内各欺诈用户的行进范围,然后对这些行进范围进行聚类,获得该时间段的欺诈用户集中区域。进一步说明的是,具体的聚类过程与步骤103中所描述的过程相似,故不在此赘述。

请参阅图2,本发明实施例中欺诈用户集中区域的预测方法的另一个实施例包括:

201、获取欺诈用户名单,通过基于移动位置服务获取欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;

具体的,服务器获取欺诈用户名单,通过基于移动位置服务获取欺诈用户名单中每个欺诈用户的欺诈用户数据,欺诈用户数据包括欺诈用户的位置信息、停留时刻以及停留时段;服务器将每个欺诈用户的位置信息映射在初始网格化地图中,在初始网格化地图中确定每个欺诈用户的位置信息,得到网格化地图;服务器筛选出每个欺诈用户的停留时段小于停留阈值的目标时段,在网格化地图中将目标时段对应的欺诈用户的位置信息剔除,在网格化地图中得到多个欺诈用户的网格点轨迹。

需要说明的是,这里获取停留时刻是以小时为单位取整,用以获得用户在不同时间内(以小时为单位)曾经停留的网格点记录,即欺诈用户的欺诈用户数据。此外,这里的将停留阈值设定在30分钟至1小时之间,具体的停留阈值可以根据实际情况进行设定,设定的停留阈值越小,在网格化地图中显示的欺诈用户的位置信息越多,设定的停留阈值越大,在网格化地图中显示的欺诈用户的位置信息越少。

202、将多个欺诈用户的网格点轨迹输入至预置神经网络中,基于预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,预置关联数值用于指示网格点轨迹之间的预测关联性;

具体的,服务器分别将每个欺诈用户的网格点轨迹按照预置时刻间隔点划分为前期网格点轨迹和后期网格点轨迹;服务器将多个欺诈用户中的每个欺诈用户的前期网格点轨迹输分别入至初始神经网络中,利用初始神经网络和预置关联数值对前期网格点轨迹进行训练,生成预置神经网络,初始神经网络用于对前期网格点轨迹进行训练;服务器将后期网络点轨迹输入至预置神经网络中,利用预置神经网络对后期网络点轨迹进行预测,生成每个欺诈用户的预测轨迹。具体生成预置神经网络的过程如下:服务器将多个欺诈用户中的每个欺诈用户的前期网格点轨迹划分为待训练网格点轨迹和待测试网格点轨迹;服务器在多个欺诈用户中获取目标欺诈用户的目标待训练网格点轨迹的目标停留时刻,并按照目标停留时刻的时间顺序将目标欺诈用户的目标停留时刻和对应的目标待训练网格点轨迹输入至初始神经网络中;服务器在初始神经网络中,利用预置关联数值确定目标待训练网格点轨迹之间的预测转化间隔数据;服务器在初始神经网络中,通过预测转化间隔数据对目标待训练网格点轨迹进行训练,并利用目标欺诈用户的目标待测试网格点轨迹对初始神经网络进行验证,得到基础神经网络;服务器获取其他欺诈用户的其他待训练网格点轨迹的其他停留时刻,将其他停留时刻和对应的其他待训练网格点轨迹输入至基础神经网络中,对基础神经网络进行调整,生成预置神经网络,其他欺诈用户为多个欺诈用户中除目标欺诈用户之外的欺诈用户。

在对欺诈用户的前期网格点轨迹进行训练时,首先需要将前期网格点轨迹划分成待训练网格点轨迹和待测试网格点轨迹,待训练网格点轨迹用于输入至初始神经网络中并被初始神经网络训练,进而得到基础神经网络;待测试网格点轨迹用于对基础神经网络进行验证,使得最终得到预置神经网络更准确。在初始神经网络中,服务器需要确定在待训练网格点轨迹中,由哪几个数据预测后一个数据的值。举例说明:待训练网格点轨迹为1、2、3、4、5,预置关联数值为2,则由预置关联数值确定的预测转化间隔数据为:通过[1,2]预测[3]、通过[2,3]预测[4]、通过[3,4]预测[5]。

203、连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;

具体的,服务器连接每个欺诈用户的网络点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹;服务器获取多个欺诈用户的行进轨迹中目标行进轨迹上的多个行进位置网格点,并将目标行进轨迹上的多个行进位置网格点输入至时空聚类模型中,利用时空聚类模型在多个行进位置网格点中随机选取一个目标行进位置网格点,判断目标行进位置网格点是否符合预置核心判定规则;服务器若目标行进位置网格点符合预置核心判定规则,则将目标行进位置网格点确定为核心行进位置网格点,并在核心行进位置网格点上建立一个范围集合,若目标行进位置网格点不符合预置核心判定规则,则将目标行进位置网络点确定为外围行进位置网络点;服务器根据预置核心判定规则遍历其他行进位置网格点,直到确定另一个核心行进位置网格点并建立另一个范围集合,其他行进位置网格点为多个行进位置网格点中除目标行进位置网格点之外的行进位置网格点;服务器在多个行进位置网格点中,将与核心行进位置网格点呈密度直达或呈密度可达的行进位置网格点确定为关联行进位置网格点,并将关联行进位置网格点添加至对应的范围集合内,直到遍历目标行进轨迹上的所有行进位置网格点,将多个范围集合确定为目标行进轨迹对应的欺诈用户的行进范围;服务器将其他行进轨迹的多个行进位置网格点输入至时空聚类模型中,确定其他行进轨迹对应的欺诈用户的行进范围,对目标行进轨迹对应的欺诈用户的行进范围和其他行进轨迹对应的欺诈用户的行进范围进行整合,得到每个欺诈用户的行进范围。

需要说明的是,服务器首先判断一个行进位置网格点是否为核心行进位置网格点,这里利用的是预置核心判定规则对行进位置网格点进行判断,预置核心判定规则用于将邻域半径R内的行进位置网格点(样本点)的数量大于或等于核心点阈值的点确定为做核心行进位置网格点。当确定一个核心行进位置网格点之后,就可以以该核心行进位置网格点为中心以领域半径R为半径建立一个范围集合,该范围集合中包括至少核心点阈值数量的行进位置网格点。若目标行进位置网格点不符合预置核心判定规则,则将目标行进位置网络点确定为外围行进位置网络点。然后服务器在判断其他行进位置网格点,直到确定另一个核心行进位置网格点并建立另一个范围集合,并将与核心行进位置网格点呈密度直达或呈密度可达的行进位置网格点确定为关联行进位置网格点,并将关联行进位置网格点添加至范围集合内。进一步说明的是,这里的密度直达指的是:如果P为核心点,Q在P的R邻域内,那么称P到Q密度直达。这里的密度可达指的是如果存在核心点P2,P3,……,Pn,且P1到P2密度直达,P2到P3密度直达,……,P(n-1)到Pn密度直达,Pn到Q密度直达,那么称P1到Q密度可达。服务器遍历一个目标行进轨迹的所有行进位置网格点,会形成该目标行进轨迹对应的行进范围。因此,将多个行进轨迹输入至时空聚类模型中,可以生成多个欺诈用户对应的行进范围。

204、基于空间聚类模型对多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域;

进一步说明的是,此处过程与步骤104中所描述的过程相同,故不在此赘述。

205、获取待检测用户、待检测用户数据以及待检测用户的行进轨迹,将待检测用户数据以及待检测用户的行进轨迹分别与欺诈用户的欺诈用户集中区域以及欺诈用户的行进范围进行比对,确定待检测用户的行为属性,并根据待检测用户的行为属性确定风险解决方案。

具体的,服务器首先获取待检测用户、待检测用户数据以及待检测用户的行进轨迹。其次服务器统计待检测用户的行进轨迹在欺诈用户集中区域中的出现频次,根据统计结果可以检测出待检测用户在欺诈用户集中区域出现的频次以及出现的时间规律(如波动性是否较大)等。若待检测用户出现在欺诈用户集中区域的频率较高,出现时间较规律,则待检测用户有极大的可能性为历史欺诈用户之一,该待检测用户存在一定的风险。上述第一相似判定结果为待检测用户为欺诈用户或待检测用户为非欺诈用户。

然后服务器计算待检测用户的行进轨迹和欺诈用户的行进轨迹之间的相似度,这里计算两者相似度的计算方式有很多,可以为余弦相似度算法,也可以为欧几里得距离算法,在本申请中并不对计算相似度的算法进行限定。在计算两者相似度之后,可以根据相似度结果检测出待检测用户的行进轨迹与欺诈用户的行进轨迹之间的重合度,重合度越高(相似度越大),则待检测用户有极大的可能性为欺诈用户之一,该待检测用户存在一定的风险。上述第二相似判定结果为待检测用户为欺诈用户或待检测用户为非欺诈用户。

同理,服务器检测待检测用户与欺诈用户之间的交集判定结果也有两种检测方式。第一种检测方式中,服务器首先计算待检测用户的行进轨迹和欺诈用户的行进轨迹之间的第一相关度,这里计算两者之间的相关度所采用的计算方式有很多,可以为余弦相似度算法,也可以为欧几里得距离算法,在本申请中并不对计算相关度的算法进行限定。若第一相关度大于第一相关阈值,则说明待检测用户的行进轨迹和欺诈用户的行进轨迹之间的重合度较多,待检测用户有极大的可能性与欺诈用户有交集。第二种检测方式中,服务器还可以计算待检测用户数据和欺诈用户信息之间的第二相关度,可以将待检测用户数据和欺诈用户信息输入至现有的wifi模型、用户信息模型、消费模型等中,计算两者之间的相关度。若第二相关度大于第二相关阈值,则说明待检测用户有极大的可能性与欺诈用户有交集。上述第一交集判定结果和第二交集程度判定结果均指示待检测用户与欺诈用户无交集或待检测用户与欺诈用户有交集。

需要说明的是,当第一相似判定结果和第二相似判定结果中只要有一个判定结果为待检测用户为欺诈用户,就可以直接判定该待检测用户为欺诈用户,只有两个判定结果都为非欺诈用户,才能直接判定该待检测用户为非欺诈用户。同理,当第一交集判定结果和第二交集判定结果中只要有一个判定结果为待检测用户与欺诈用户有交集,就可以直接判定该待检测用户与欺诈用户存在交集,只有两个判定结果都为与欺诈用户无交集,才能直接判定该待检测用户与欺诈用户无交集。

服务器在明确待检测用户与欺诈用户之间的相似判定结果以及交集判定结果之后,会根据判定结果确定待检测用户的行为属性,明确待检测用户的属性,服务器将会对不同属性的待检测用户实施不同的风险解决方案。具体的,当服务器判定待检测用户为欺诈个人用户时,实施第一风险解决方案,第一风险解决方案可以为限制欺诈个人用户办理部分业务,对欺诈个人用户设立考察期,实时对欺诈个人用户的行进轨迹以及所办理的业务进行监控等。当服务器判定待检测用户为欺诈团体用户时,实施第二风险解决方案,第二风险解决方案可以为限制欺诈团体用户办理任何业务,同时根据欺诈团体用户的网格化点轨迹预测其他用户的行为属性,以欺诈团体用户为中心,进一步检测出与欺诈团体用户存在交集的其他用户,并实时监测欺诈团体用户,从而识别欺诈用户的集中区域。当服务器判定待检测用户为白名单用户时,实施第三风险解决方案,第三风险解决方案可以为不限制白名单用户办理任何业务。当服务器判定待检测用户为风险用户时,实施第四风险解决方案,第四风险解决方案可以为限制风险用户办理部分业务,对风险用户设立考察期,在考察期期间对风险用户进行行进轨迹的检测等。

本发明实施例中,通过基于移动位置服务获取欺诈用户的欺诈用户数据,并将欺诈用户数据映射至网格化地图中,确定欺诈用户的网格点轨迹,依次利用预置神经网络和时空聚类模型对欺诈用户的网格点轨迹进行预测,确定欺诈用户集中区域。提高了对现有的欺诈用户名单进行欺诈用户集中区域预测的准确率,降低了被欺诈用户攻击的风险。

上面对本发明实施例中欺诈用户集中区域的预测方法进行了描述,下面对本发明实施例中欺诈用户集中区域的预测装置进行描述,请参阅图3,本发明实施例中欺诈用户集中区域的预测装置一个实施例包括:映射模块301,用于获取欺诈用户名单,通过基于移动位置服务获取欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;预测模块302,用于将多个欺诈用户的网格点轨迹输入至预置神经网络中,基于预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,预置关联数值用于指示网格点轨迹之间的预测关联性;生成模块303,用于连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;确定模块304,用于基于空间聚类模型对多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域。

请参阅图4,本发明实施例中欺诈用户集中区域的预测装置的另一个实施例包括:映射模块301,用于获取欺诈用户名单,通过基于移动位置服务获取欺诈用户名单中每个欺诈用户的欺诈用户数据,并将每个欺诈用户数据映射至网格化地图中,得到多个欺诈用户的网格点轨迹;预测模块302,用于将多个欺诈用户的网格点轨迹输入至预置神经网络中,基于预置神经网络和预置关联数值生成每个欺诈用户的预测轨迹,预置关联数值用于指示网格点轨迹之间的预测关联性;生成模块303,用于连接每个欺诈用户的网格点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹,并将多个欺诈用户的行进轨迹输入至时空聚类模型中,生成每个欺诈用户的行进范围;确定模块304,用于基于空间聚类模型对多个欺诈用户的行进范围进行聚类,确定欺诈用户集中区域。

可选的,映射模块301具体用于:获取欺诈用户名单,通过基于移动位置服务获取欺诈用户名单中每个欺诈用户的欺诈用户数据,欺诈用户数据包括欺诈用户的位置信息、停留时刻以及停留时段;将每个欺诈用户的位置信息映射在初始网格化地图中,在初始网格化地图中确定每个欺诈用户的位置信息,得到网格化地图;筛选出每个欺诈用户的停留时段小于停留阈值的目标时段,在网格化地图中将目标时段对应的欺诈用户的位置信息剔除,在网格化地图中得到多个欺诈用户的网格点轨迹。

可选的,预测模块302包括:划分单元3021,用于分别将每个欺诈用户的网格点轨迹按照预置时刻间隔点划分为前期网格点轨迹和后期网格点轨迹;训练单元3022,用于将多个欺诈用户中的每个欺诈用户的前期网格点轨迹输分别入至初始神经网络中,利用初始神经网络和预置关联数值对前期网格点轨迹进行训练,生成预置神经网络,初始神经网络用于对前期网格点轨迹进行训练;预测单元3023,用于将后期网络点轨迹输入至预置神经网络中,利用预置神经网络对后期网络点轨迹进行预测,生成每个欺诈用户的预测轨迹。

可选的,训练单元3022具体用于:将多个欺诈用户中的每个欺诈用户的前期网格点轨迹划分为待训练网格点轨迹和待测试网格点轨迹;在多个欺诈用户中获取目标欺诈用户的目标待训练网格点轨迹的目标停留时刻,并按照目标停留时刻的时间顺序将目标欺诈用户的目标停留时刻和对应的目标待训练网格点轨迹输入至初始神经网络中;在初始神经网络中,利用预置关联数值确定目标待训练网格点轨迹之间的预测转化间隔数据;在初始神经网络中,通过预测转化间隔数据对目标待训练网格点轨迹进行训练,并利用目标欺诈用户的目标待测试网格点轨迹对初始神经网络进行验证,得到基础神经网络;获取其他欺诈用户的其他待训练网格点轨迹的其他停留时刻,将其他停留时刻和对应的其他待训练网格点轨迹输入至基础神经网络中,对基础神经网络进行调整,生成预置神经网络,其他欺诈用户为多个欺诈用户中除目标欺诈用户之外的欺诈用户。

可选的,生成模块303具体用于:连接每个欺诈用户的网络点轨迹和对应的预测轨迹,得到多个欺诈用户的行进轨迹;获取多个欺诈用户的行进轨迹中目标行进轨迹上的多个行进位置网格点,并将目标行进轨迹上的多个行进位置网格点输入至时空聚类模型中,利用时空聚类模型在多个行进位置网格点中随机选取一个目标行进位置网格点,判断目标行进位置网格点是否符合预置核心判定规则;若目标行进位置网格点符合预置核心判定规则,则将目标行进位置网格点确定为核心行进位置网格点,并在核心行进位置网格点上建立一个范围集合,若目标行进位置网格点不符合预置核心判定规则,则将目标行进位置网络点确定为外围行进位置网络点;根据预置核心判定规则遍历其他行进位置网格点,直到确定另一个核心行进位置网格点并建立另一个范围集合,其他行进位置网格点为多个行进位置网格点中除目标行进位置网格点之外的行进位置网格点;在多个行进位置网格点中,将与核心行进位置网格点呈密度直达或呈密度可达的行进位置网格点确定为关联行进位置网格点,并将关联行进位置网格点添加至对应的范围集合内,直到遍历目标行进轨迹上的所有行进位置网格点,将多个范围集合确定为目标行进轨迹对应的欺诈用户的行进范围;将其他行进轨迹的多个行进位置网格点输入至时空聚类模型中,确定其他行进轨迹对应的欺诈用户的行进范围,对目标行进轨迹对应的欺诈用户的行进范围和其他行进轨迹对应的欺诈用户的行进范围进行整合,得到每个欺诈用户的行进范围。

可选的,欺诈用户集中区域的预测装置还包括:解决模块305,用于获取待检测用户、待检测用户数据以及待检测用户的行进轨迹,将待检测用户数据以及待检测用户的行进轨迹分别与欺诈用户的欺诈用户集中区域以及欺诈用户的行进范围进行比对,确定待检测用户的行为属性,并根据待检测用户的行为属性确定风险解决方案。

可选的,解决模块305具体用于:获取待检测用户、待检测用户数据以及待检测用户的行进轨迹;将待检测用户的行进轨迹与欺诈用户集中区域进行比对,确定待检测用户与欺诈用户之间的相似判定结果,相似判定结果用于指示待检测用户为欺诈用户或待检测用户为非欺诈用户;将待检测用户的行进轨迹和待检测用户数据分别与欺诈用户的行进轨迹和欺诈用户数据进行对比,确定待检测用户与欺诈用户之间的交集判定结果,交集判定结果用于指示待检测用户与欺诈用户无交集或待检测用户与欺诈用户有交集;基于待检测用户与欺诈用户之间的相似判定结果以及交集判定结果确定待检测用户的行为属性,并根据待检测用户的行为属性确定风险解决方案。

本发明实施例中,通过基于移动位置服务获取欺诈用户的欺诈用户数据,并将欺诈用户数据映射至网格化地图中,确定欺诈用户的网格点轨迹,依次利用预置神经网络和时空聚类模型对欺诈用户的网格点轨迹进行预测,确定欺诈用户集中区域。提高了对现有的欺诈用户名单进行欺诈用户集中区域预测的准确率,降低了被欺诈用户攻击的风险。

图5是本发明实施例提供的一种欺诈用户集中区域的预测设备的结构示意图,该欺诈用户集中区域的预测设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对欺诈用户集中区域的预测设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在欺诈用户集中区域的预测设备500上执行存储介质530中的一系列指令操作。

欺诈用户集中区域的预测设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的欺诈用户集中区域的预测设备结构并不构成对欺诈用户集中区域的预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本发明还提供一种欺诈用户集中区域的预测设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述欺诈用户集中区域的预测方法的步骤。本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述欺诈用户集中区域的预测方法的步骤。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 欺诈用户集中区域的预测方法、装置、设备及存储介质
  • 欺诈用户集中区域的预测方法、装置、设备及存储介质
技术分类

06120113210724