掌桥专利:专业的专利平台
掌桥专利
首页

基于机器学习的真实用户识别方法、装置、设备及介质

文献发布时间:2023-06-19 16:09:34



技术领域

本申请涉及到人工智能技术领域,特别是涉及到一种基于机器学习的真实用户识别方法、装置、设备及介质。

背景技术

现有的身份识别技术采用基本信息进行身份识别,比如,刷脸、虹膜识别、证件识别、指纹识别等。因用户在另一个终端操作,就势必会有“空子”可以钻,导致容易被人钻漏洞,仅仅采用基本信息进行身份识别,无法判断在终端操作的人是否是真实用户,降低了真实用户识别的准确性,降低了数据安全。

发明内容

本申请的主要目的为提供一种基于机器学习的真实用户识别方法、装置、设备及介质,旨在解决现有技术采用基本信息进行身份识别,因用户在另一个终端操作,导致容易被人钻漏洞,降低了真实用户识别的准确性。

为了实现上述发明目的,本申请提出一种基于机器学习的真实用户识别方法,所述方法包括:

获取与目标身份标识对应的目标基本信息验证数据及目标行为数据集;

对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集;

对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集;

将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果,其中,所述分类预测模型是基于逻辑回归算法训练得到的模型;

根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果。

进一步的,所述对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集的步骤,包括:

将所述目标基本信息验证数据,按照所述验证类别进行划分,得到多个单验证类别验证数据集;

对指定单验证类别验证数据集中的每个验证数据进行评分,得到单验证数据评分,其中,所述指定单验证类别验证数据集是任一个所述单验证类别验证数据集;

对各个所述单验证数据评分进行筛选,得到所述指定单验证类别验证数据集对应的单验证类别评分;

将各个所述单验证类别评分作为所述单验证类别评分集。

进一步的,所述对各个所述单验证数据评分进行筛选,得到所述指定单验证类别验证数据集对应的单验证类别评分的步骤,包括:

获取与所述指定单验证类别验证数据集对应的第一综合类型;

当所述第一综合类型为最大值时,从各个所述单验证数据评分中找出值为最大的所述单验证数据评分作为所述指定单验证类别验证数据集对应的所述单验证类别评分;

当所述第一综合类型为加权求和时,根据与所述指定单验证类别验证数据集对应的权重数据,对各个所述单验证数据评分进行加权求和,得到所述指定单验证类别验证数据集对应的所述单验证类别评分。

进一步的,所述对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集的步骤,包括:

将所述目标行为数据集,按照所述行为类别进行划分,得到多个单行为类别行为数据集;

对指定单行为类别行为数据集中的每个行为数据进行评分,得到单行为数据评分,其中,所述指定单行为类别行为数据集是任一个所述单行为类别行为数据集;

对各个所述单行为数据评分进行筛选,得到所述指定单行为类别行为数据集对应的单行为类别评分;

将各个所述单行为类别评分作为所述单行为类别评分集。

进一步的,所述对各个所述单行为数据评分进行筛选,得到所述指定单行为类别行为数据集对应的单行为类别评分的步骤,包括:

获取与所述指定单行为类别行为数据集对应的第二综合类型;

当所述第二综合类型为最大值时,从各个所述单行为数据评分中找出值为最大的所述单行为数据评分作为所述指定单行为类别行为数据集对应的所述单行为类别评分;

当所述第二综合类型为加权求和时,根据与所述指定单行为类别行为数据集对应的权重数据,对各个所述单行为数据评分进行加权求和,得到所述指定单行为类别行为数据集对应的所述单行为类别评分。

进一步的,所述将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果的步骤之前,还包括:

获取多个训练样本和初始模型,其中,所述初始模型是基于逻辑回归算法得到的模型;

采用预设的划分比例,对各个所述训练样本进行划分,得到第一样本集、第二样本集和第三样本集;

采用所述第一样本集对所述初始模型进行训练,得到第一模型;

采用所述第二样本集对所述初始模型进行训练,得到第二模型;

采用所述第三样本集对所述初始模型进行训练,得到第三模型;

对所述第一模型的各个参数、所述第二模型的各个参数和所述第三模型的各个参数进行同一参数的平均值计算,得到目标参数集;

采用所述目标参数集,对所述初始模型的各个参数进行更新,得到所述分类预测模型。

进一步的,所述根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果的步骤,包括:

当所述真实用户概率预测结果大于所述概率阈值时,确定所述真实用户识别结果为真实用户;

当所述真实用户概率预测结果小于或等于所述概率阈值时,确定所述真实用户识别结果为非真实用户。

本申请还提出了一种基于机器学习的真实用户识别装置,所述装置包括:

数据获取模块,用于获取与目标身份标识对应的目标基本信息验证数据及目标行为数据集;

第一评分模块,用于对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集;

第二评分模块,用于对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集;

真实用户概率预测结果确定模块,用于将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果,其中,所述分类预测模型是基于逻辑回归算法训练得到的模型;

真实用户识别结果确定模块,用于根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果。

本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的基于机器学习的真实用户识别方法、装置、设备及介质,其中方法实现了基于目标基本信息验证数据及目标行为数据集进行真实用户概率预测,增加了用户特征,提高了真实用户识别的准确性;分类预测模型是基于逻辑回归算法训练得到的模型,提高了真实用户概率预测的准确性,进一步提高了真实用户识别的准确性;针对每个验证类别的评分和每个行为类别的评分,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

附图说明

图1为本申请一实施例的基于机器学习的真实用户识别方法的流程示意图;

图2为本申请一实施例的基于机器学习的真实用户识别装置的结构示意框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

参照图1,本申请实施例中提供一种基于机器学习的真实用户识别方法,所述方法包括:

S1:获取与目标身份标识对应的目标基本信息验证数据及目标行为数据集;

S2:对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集;

S3:对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集;

S4:将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果,其中,所述分类预测模型是基于逻辑回归算法训练得到的模型;

S5:根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果。

本实施例实现了基于目标基本信息验证数据及目标行为数据集进行真实用户概率预测,增加了用户特征,提高了真实用户识别的准确性;分类预测模型是基于逻辑回归算法训练得到的模型,提高了真实用户概率预测的准确性,进一步提高了真实用户识别的准确性;针对每个验证类别的评分和每个行为类别的评分,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

对于S1,可以获取用户输入的真实用户识别请求,也可以获取第三方应用系统发送的真实用户识别请求,还可以是实现本申请的程序根据预设条件触发的真实用户识别请求。比如,预设条件为申请使用功能A时发送真实用户识别请求。

真实用户识别请求,是识别进行操作的用户是否为真实用户的请求。

其中,将真实用户识别请求携带的身份标识作为目标身份标识。身份标识可以是用户账号、身份证号码等唯一标识一个用户的数据。

真实用户,是身份标识的真正拥有者。因用户在另一个终端操作,有可能是非真实用户盗用身份标识对应的账号进行操作。

其中,可以从本地数据库中获取与目标身份标识对应的基本信息验证数据作为目标基本信息验证数据,也可以第三方应用系统中获取与目标身份标识对应的基本信息验证数据作为目标基本信息验证数据,还可以获取用户输入的与目标身份标识对应的基本信息验证数据作为目标基本信息验证数据。

其中,可以从本地数据库中获取与目标身份标识对应的行为数据集作为目标行为数据集,也可以第三方应用系统中获取与目标身份标识对应的行为数据集作为目标行为数据集,还可以获取用户输入的与目标身份标识对应的行为数据集作为目标行为数据集。

可以理解的是,基本信息验证数据中的各个数据可以分布存储在一个或多个存储空间中。行为数据集中的各个行为数据可以分布存储在一个或多个存储空间中。

基本信息验证数据包括但不限于:移动通讯运营商认证记录、银行卡绑定记录、人脸识别记录、公安部实名认证记录、人工回访记录。

行为数据集包括但不限于:查询身份信息记录、查询订单信息记录、开通应用内钱包账号记录、查询客户权益记录、领取客户权益记录、使用客户权益记录、绑定车辆信息记录、购买产品记录、连续N天以上签到。

对于S2,每个验证类别可能对应多种验证方式,为了后续真实用户识别的准确性,因此需要针对每个验证类别进行评分,以去除噪声数据,因此,对所述目标基本信息验证数据进行每个验证类别的评分,将针对一个验证类别评分的结果作为单验证类别评分,将各个单验证类别评分作为单验证类别评分集。

对于S3,每个行为类别可能对应多种行为方式,为了后续真实用户识别的准确性,因此需要针对每个行为类别进行评分,以去除噪声数据,因此,对所述目标行为数据集进行每个行为类别的评分,将针对一个行为类别评分的结果作为单行为类别评分,将各个单行为类别评分作为单行为类别评分集。

对于S4,将所述单验证类别评分集和所述单行为类别评分集同时输入预设的分类预测模型进行真实用户概率预测,将预测得到的数据作为真实用户概率预测结果。

可以理解的是,真实用户概率预测结果是一个0到1的数值,可以等于0,也可以等于1。

其中,采用多个训练样本对基于逻辑回归算法得到的模型进行训练,将训练后的模型作为分类预测模型。所述训练样本包括:单验证类别评分样本集、单行为类别评分样本集和真实用户概率标定值。单验证类别评分样本集中包括多个验证类别的评分。单行为类别评分样本集中包括多个行为类别的评分。真实用户概率标定值,是针对同一身份标识的单验证类别评分样本集、单行为类别评分样本集进行是否真实用户的准确标定结果。当真实用户概率标定值为0时,意味着不是真实用户操作;当是真实用户概率标定值为1时,意味着是真实用户操作。

对于S5,若所述真实用户概率预测结果大于所述概率阈值,则确定所述真实用户识别结果为真实用户;若所述真实用户概率预测结果小于或等于所述概率阈值,则确定所述真实用户识别结果为非真实用户。

可选的,所述根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果的步骤之后,还包括:若所述真实用户识别结果为非真实用户,则将所述目标身份标识对应的账号进行退出登录处理,并且将所述目标身份标识对应的账号状态标注为异常。从而避免了损失的扩大。

在一个实施例中,上述对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集的步骤,包括:

S21:将所述目标基本信息验证数据,按照所述验证类别进行划分,得到多个单验证类别验证数据集;

S22:对指定单验证类别验证数据集中的每个验证数据进行评分,得到单验证数据评分,其中,所述指定单验证类别验证数据集是任一个所述单验证类别验证数据集;

S23:对各个所述单验证数据评分进行筛选,得到所述指定单验证类别验证数据集对应的单验证类别评分;

S24:将各个所述单验证类别评分作为所述单验证类别评分集。

本实施例通过将所述目标基本信息验证数据,按照所述验证类别进行划分,然后对划分的每个单验证类别验证数据集进行评分,从而去除噪声数据,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

对于S21,将所述目标基本信息验证数据,按照所述验证类别进行划分,将划分的每个集合作为一个单验证类别验证数据集。也就是说,单验证类别验证数据集中的验证数据是属于同一个验证类别的验证数据。

对于S22,将任一个所述单验证类别验证数据集作为所述指定单验证类别验证数据集;将指定单验证类别验证数据集中的每个验证数据,从预设的验证评分列表中进行验证数据查找,将查找到的验证数据在所述验证评分列表中对应的验证评分作为一个单验证数据评分。

验证评分列表包括:验证数据和验证评分。

对于S23,采用预设的第一筛选条件,对各个所述单验证数据评分进行筛选,将筛选得到的评分作为所述指定单验证类别验证数据集对应的单验证类别评分。

可选的,预设的第一筛选条件为最大值。也就是说,将各个所述单验证数据评分中的值为最大的所述单验证数据评分作为所述指定单验证类别验证数据集对应的单验证类别评分。

在一个实施例中,上述对各个所述单验证数据评分进行筛选,得到所述指定单验证类别验证数据集对应的单验证类别评分的步骤,包括:

S231:获取与所述指定单验证类别验证数据集对应的第一综合类型;

S232:当所述第一综合类型为最大值时,从各个所述单验证数据评分中找出值为最大的所述单验证数据评分作为所述指定单验证类别验证数据集对应的所述单验证类别评分;

S233:当所述第一综合类型为加权求和时,根据与所述指定单验证类别验证数据集对应的权重数据,对各个所述单验证数据评分进行加权求和,得到所述指定单验证类别验证数据集对应的所述单验证类别评分。

本实施例根据第一综合类型采用不同的筛选方式,满足了个性化的筛选要求,提高了单验证类别评分的准确性,进一步提高了真实用户识别的准确性。

对于S231,将所述指定单验证类别验证数据集对应的验证类别,从预设的验证类别映射表中进行验证类别查找,将查找到的验证类别在验证类别映射表中对应的综合类型作为第一综合类型。

验证类别映射表包括:验证类别和综合类型。综合类型的取值范围包括:最大值和加权求和。

对于S232,当所述第一综合类型为最大值时,意味着筛选最大值作为单验证类别评分,因此从各个所述单验证数据评分中找出值为最大的所述单验证数据评分,将找出的所述单验证数据评分作为所述指定单验证类别验证数据集对应的所述单验证类别评分。

对于S233,当所述第一综合类型为加权求和时,意味着将加权求和的结果作为单验证类别评分,因此,将所述指定单验证类别验证数据集对应的验证类别,从验证类别映射表中进行验证类别查找,采用查找到的验证类别在验证类别映射表中对应的权重数据,对各个所述单验证数据评分进行加权求和,将加权求和得到的数据作为所述指定单验证类别验证数据集对应的所述单验证类别评分。

在一个实施例中,上述对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集的步骤,包括:

S31:将所述目标行为数据集,按照所述行为类别进行划分,得到多个单行为类别行为数据集;

S32:对指定单行为类别行为数据集中的每个行为数据进行评分,得到单行为数据评分,其中,所述指定单行为类别行为数据集是任一个所述单行为类别行为数据集;

S33:对各个所述单行为数据评分进行筛选,得到所述指定单行为类别行为数据集对应的单行为类别评分;

S34:将各个所述单行为类别评分作为所述单行为类别评分集。

本实施例通过将所述目标行为数据集,按照所述行为类别进行划分,然后对划分的每个单行为类别行为数据集进行评分,从而去除噪声数据,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

对于S31,将所述目标行为数据集,按照所述行为类别进行划分,将划分的每个集合作为一个单行为类别行为数据集。也就是说,单行为类别行为数据集中的行为数据是属于同一个行为类别的行为数据。

对于S32,将任一个所述单行为类别行为数据集作为所述指定单行为类别行为数据集;将指定单行为类别行为数据集中的每个行为数据,从预设的行为评分列表中进行行为数据查找,将查找到的行为数据在所述行为评分列表中对应的行为评分作为一个单行为数据评分。

行为评分列表包括:行为数据和行为评分。

可选的,将指定行为数据输入与所述指定行为数据对应的行为数据评分模型进行评分,得到与所述指定行为数据对应的所述单行为数据评分,其中,所述指定行为数据是所述指定单行为类别行为数据集中的任一个行为数据。

可选的,所述行为数据评分模型是基于神经网络训练得到的评分模型。

可选的,所述行为数据评分模型还可以采用评分卡模型。

对于S33,采用预设的第二筛选条件,对各个所述单行为数据评分进行筛选,将筛选得到的评分作为所述指定单行为类别行为数据集对应的单行为类别评分。

可选的,预设的第二筛选条件为最大值。也就是说,将各个所述单行为数据评分中的值为最大的所述单行为数据评分作为所述指定单行为类别行为数据集对应的单行为类别评分。

在一个实施例中,上述对各个所述单行为数据评分进行筛选,得到所述指定单行为类别行为数据集对应的单行为类别评分的步骤,包括:

S331:获取与所述指定单行为类别行为数据集对应的第二综合类型;

S332:当所述第二综合类型为最大值时,从各个所述单行为数据评分中找出值为最大的所述单行为数据评分作为所述指定单行为类别行为数据集对应的所述单行为类别评分;

S333:当所述第二综合类型为加权求和时,根据与所述指定单行为类别行为数据集对应的权重数据,对各个所述单行为数据评分进行加权求和,得到所述指定单行为类别行为数据集对应的所述单行为类别评分。

本实施例根据第二综合类型采用不同的筛选方式,满足了个性化的筛选要求,提高了单行为类别评分的准确性,进一步提高了真实用户识别的准确性。

对于S331,将所述指定单行为类别行为数据集对应的行为类别,从预设的行为类别映射表中进行行为类别查找,将查找到的行为类别在行为类别映射表中对应的综合类型作为第二综合类型。

行为类别映射表包括:行为类别和综合类型。

对于S332,当所述第二综合类型为最大值时,意味着筛选最大值作为单行为类别评分,因此从各个所述单行为数据评分中找出值为最大的所述单行为数据评分,将找出的所述单行为数据评分作为所述指定单行为类别行为数据集对应的所述单行为类别评分。

对于S333,当所述第二综合类型为加权求和时,意味着将加权求和的结果作为单行为类别评分,因此,将所述指定单行为类别行为数据集对应的行为类别,从行为类别映射表中进行行为类别查找,采用查找到的行为类别在行为类别映射表中对应的权重数据,对各个所述单行为数据评分进行加权求和,将加权求和得到的数据作为所述指定单行为类别行为数据集对应的所述单行为类别评分。

在一个实施例中,上述将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果的步骤之前,还包括:

S41:获取多个训练样本和初始模型,其中,所述初始模型是基于逻辑回归算法得到的模型;

S42:采用预设的划分比例,对各个所述训练样本进行划分,得到第一样本集、第二样本集和第三样本集;

S43:采用所述第一样本集对所述初始模型进行训练,得到第一模型;

S44:采用所述第二样本集对所述初始模型进行训练,得到第二模型;

S45:采用所述第三样本集对所述初始模型进行训练,得到第三模型;

S46:对所述第一模型的各个参数、所述第二模型的各个参数和所述第三模型的各个参数进行同一参数的平均值计算,得到目标参数集;

S47:采用所述目标参数集,对所述初始模型的各个参数进行更新,得到所述分类预测模型。

本实施例采用第一样本集、第二样本集和第三样本集分别训练出模型,然后将训练出的三个模型的各个参数进行同一参数的平均值计算,将计算后的各个参数更新初始模型的各个参数,将更新后的初始模型作为分类预测模型,从而避免了采用多个训练样本同一个模型的精准度不高,提高了分类预测模型的鲁棒性,进一步提高了提高了真实用户概率预测的准确性。

对于S41,可以从本地数据库中获取多个训练样本和初始模型,也可以第三方应用系统中获取多个训练样本和初始模型,还可以获取用户输入的多个训练样本和初始模型。

对于S43,依次采用所述第一样本集中的每个所述训练样本对所述初始模型进行训练,将训练结束的所述初始模型作为所述第一模型。

可选的,依次并且循环采用所述第一样本集中的每个所述训练样本对所述初始模型进行训练,将训练结束的所述初始模型作为所述第一模型。依次并且循环,也就是说,采用遍历的方法,依次从所述第一样本集中获取所述训练样本对所述初始模型进行训练,若遍历完成,采用所述第一样本集训练后的所述初始模型还未收敛,则对所述第一样本集进行下一次遍历以继续对所述初始模型进行训练。

对于S44,依次采用所述第二样本集中的每个所述训练样本对所述初始模型进行训练,将训练结束的所述初始模型作为所述第二模型。

可选的,依次并且循环采用所述第二样本集中的每个所述训练样本对所述初始模型进行训练,将训练结束的所述初始模型作为所述第二模型。依次并且循环,也就是说,采用遍历的方法,依次从所述第二样本集中获取所述训练样本对所述初始模型进行训练,若遍历完成,采用所述第二样本集训练后的所述初始模型还未收敛,则对所述第二样本集进行下一次遍历以继续对所述初始模型进行训练。

对于S45,依次采用所述第三样本集中的每个所述训练样本对所述初始模型进行训练,将训练结束的所述初始模型作为所述第三模型。

可选的,依次并且循环采用所述第三样本集中的每个所述训练样本对所述初始模型进行训练,将训练结束的所述初始模型作为所述第三模型。依次并且循环,也就是说,采用遍历的方法,依次从所述第三样本集中获取所述训练样本对所述初始模型进行训练,若遍历完成,采用所述第三样本集训练后的所述初始模型还未收敛,则对所述第三样本集进行下一次遍历以继续对所述初始模型进行训练。

对于S46,对所述第一模型的各个参数、所述第二模型的各个参数和所述第三模型的各个参数进行同一参数的平均值计算,将计算得到的数据作为目标参数集。目标参数集中的参数数量和所述第一模型的参数数量相同,目标参数集中的参数数量和所述第二模型的参数数量相同,目标参数集中的参数数量和所述第三模型的参数数量相同。

对于S47,采用所述目标参数集,对所述初始模型的各个参数进行相同参数的替换更新,将完成替换更新的所述初始模型作为所述分类预测模型。

在一个实施例中,上述根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果的步骤,包括:

S51:当所述真实用户概率预测结果大于所述概率阈值时,确定所述真实用户识别结果为真实用户;

S52:当所述真实用户概率预测结果小于或等于所述概率阈值时,确定所述真实用户识别结果为非真实用户。

本实施例根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果,提高了真实用户识别结果准确性。

对于S51,当所述真实用户概率预测结果大于所述概率阈值时,意味着与目标身份标识对应的目标基本信息验证数据及目标行为数据集满足真实用户的认定要求,因此确定所述真实用户识别结果为真实用户。

对于S52,当所述真实用户概率预测结果小于或等于所述概率阈值时,意味着与目标身份标识对应的目标基本信息验证数据及目标行为数据集不满足真实用户的认定要求,因此确定所述真实用户识别结果为非真实用户。

参照图2,本申请还提出了一种基于机器学习的真实用户识别装置,所述装置包括:

数据获取模块100,用于获取与目标身份标识对应的目标基本信息验证数据及目标行为数据集;

第一评分模块200,用于对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集;

第二评分模块300,用于对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集;

真实用户概率预测结果确定模块400,用于将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果,其中,所述分类预测模型是基于逻辑回归算法训练得到的模型;

真实用户识别结果确定模块500,用于根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果。

本实施例实现了基于目标基本信息验证数据及目标行为数据集进行真实用户概率预测,增加了用户特征,提高了真实用户识别的准确性;分类预测模型是基于逻辑回归算法训练得到的模型,提高了真实用户概率预测的准确性,进一步提高了真实用户识别的准确性;针对每个验证类别的评分和每个行为类别的评分,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存基于机器学习的真实用户识别方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于机器学习的真实用户识别方法。所述基于机器学习的真实用户识别方法,包括:获取与目标身份标识对应的目标基本信息验证数据及目标行为数据集;对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集;对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集;将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果,其中,所述分类预测模型是基于逻辑回归算法训练得到的模型;根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果。

本实施例实现了基于目标基本信息验证数据及目标行为数据集进行真实用户概率预测,增加了用户特征,提高了真实用户识别的准确性;分类预测模型是基于逻辑回归算法训练得到的模型,提高了真实用户概率预测的准确性,进一步提高了真实用户识别的准确性;针对每个验证类别的评分和每个行为类别的评分,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于机器学习的真实用户识别方法,包括步骤:获取与目标身份标识对应的目标基本信息验证数据及目标行为数据集;对所述目标基本信息验证数据进行每个验证类别的评分,得到单验证类别评分集;对所述目标行为数据集进行每个行为类别的评分,得到单行为类别评分集;将所述单验证类别评分集和所述单行为类别评分集输入预设的分类预测模型进行真实用户概率预测,得到真实用户概率预测结果,其中,所述分类预测模型是基于逻辑回归算法训练得到的模型;根据所述真实用户概率预测结果和预设的概率阈值确定真实用户识别结果。

上述执行的基于机器学习的真实用户识别方法,实现了基于目标基本信息验证数据及目标行为数据集进行真实用户概率预测,增加了用户特征,提高了真实用户识别的准确性;分类预测模型是基于逻辑回归算法训练得到的模型,提高了真实用户概率预测的准确性,进一步提高了真实用户识别的准确性;针对每个验证类别的评分和每个行为类别的评分,减少了单个类别对评分结果的影响,进一步提高了真实用户识别的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

相关技术
  • 基于机器学习的真实用户识别方法、装置、设备及介质
  • 基于机器学习的音频识别方法及装置、设备、存储介质
技术分类

06120114723138