掌桥专利:专业的专利平台
掌桥专利
首页

目标用户的识别方法、装置、电子设备及计算机可读介质

文献发布时间:2023-06-19 16:09:34



技术领域

本申请涉及计算机信息处理领域,具体而言,涉及一种目标用户的识别方法、装置、电子设备及计算机可读介质。

背景技术

大多数互联网应用平台,通常会将互联网全量用户分为老用户和新用户两类。在互联网平台想进行产品推广的时候,会对老用户和新用户采用不同的触达方式和运营策略。考虑触达用户的成本,如何精准的识别目标客群是其中的一项关键任务。

以广告投放为例,现有广告投放方法为:互联网应用平台作为广告投放方生成人群定向包和人群排除包,广告平台基于自身为用户设置的用户定向标签和人群定向包向用户展示广告内容,广告平台不对人群排除包中的用户展示广告。广告投放方将广告展示的转化数据(用户点击、落地或者注册等数据)回传给广告平台,广告平台基于回传转化数据更新其自身的智能预估算法以便于进行下一次的广告投放。

对于广告投放方而言,人群定向包和人群排除包对广告转化数据具有极高的影响。但是现有技术中,由于用户经常在不用的平台中采用不同的用户名称,出于安全原因,广告平台也不会将用户关键信息共享给广告投放方使用,所以广告投放方在自研人群定向包和人群排除包时,仅能借助本地数据进行客群模型的建立。这种情况造成了广告投放方生成的人群定向包和人群排除包数据不准确,带来的广告投放效果也很有限。

因此,需要一种新的目标用户的识别方法、装置、电子设备及计算机可读介质。

在所述背景技术部分公开的上述信息仅用于加强对本申请的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

有鉴于此,本申请提供一种目标用户的识别方法、装置、电子设备及计算机可读介质,能够充分考虑到不同用户数据之间的特点,针对不用的用户数据使用不同的客户识别模型进行分析,从而对目标用户进行精确识别,保证系统数据安全和交易安全。

本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

根据本申请的一方面,提出一种目标用户的识别方法,该方法包括:获取待识别的用户数据;在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户。

可选地,还包括:还包括:通过第三方设备数据和本地用户数据生成多个训练样本集合;基于所述多个训练样本集合生成用户特征向量、第一设备特征向量、第二设备特征向量、用户特征学习向量;通过所述用户特征向量、所述第一设备特征向量对第一机器学习模型进行训练,生成所述第一客群识别模型;通过所述第二设备特征向量、所述用户特征学习向量对第二机器学习模型进行训练,生成所述第二客群识别模型。

可选地,通过第三方设备数据和本地用户数据生成多个训练样本集合,包括:获取多个第三方平台以设备标识作为标识的第三方设备数据;基于所述第三方设备数据生成设备筛选特征;获取以用户标识作为标识的本地用户数据;基于所述本地用户数据生成用户筛选特征;通过所述设备筛选特征和所述用户筛选特征对所述本地用户数据进行筛选以生成所述多个训练样本集合。

可选地,通过第三方设备数据和本地用户数据生成多个训练样本集合,还包括:提取所述本地用户数据中的设备标识;将本地用户数据的标识由用户标识映射为设备标识。

可选地,通过所述设备筛选特征和所述用户筛选特征对所述本地用户数据进行筛选以生成所述多个训练样本集合,包括:根据预设策略由本地用户数据中提取正样本用户数据和负样本用户数据;通过包含有用户筛选特征和设备筛选特征的正样本用户数据和负样本用户数据生成第一训练样本集合;通过包含有设备筛选特征且不包含有用户筛选特征的正样本用户数据和负样本用户数据生成第二训练样本集合。

可选地,基于所述多个训练样本集合生成用户特征向量、第一设备特征向量、第二设备特征向量、用户特征学习向量,包括:将所述第一训练样本集合中的用户筛选特征输入用户特征网络,生成所述用户特征向量;将所述第一训练样本集合中的设备筛选特征输入设备特征网络,生成所述第一设备特征向量;将所述第二训练样本集合中的设备筛选特征输入用户特征学习网络生成所述用户特征学习向量;将所述第二训练样本集合中的设备筛选特征输入设备特征网络生成所述第二设备特征向量。

可选地,还包括:通过所述第一训练样本集合和所述第二训练样本集合对初始特征网络模型进行训练;在训练过程中,当相似度的极大似然损失函数满足条件时,生成所述用户特征学习网络。

可选地,通过所述第一训练样本集合和所述第二训练样本集合对初始特征网络模型进行训练,包括:逐一将所述第一训练样本集合中的正样本用户数据和负样本用户数据输入用户特征网络,生成用户特征向量;逐一将所述第二训练样本集合中的正样本用户数据和负样本用户数据输入所述初始特征网络模型,生成用户特征学习向量;计算所述用户特征向量和所述用户特征学习向量之间的相似度。

可选地,将所述待识别的用户数据输入第一客群识别模型生成识别评分,包括:将所述待识别的用户数据分别输入用户特征网络和设备特征网络以生成用户特征向量和设备特征向量;将所述用户特征向量和所述设备特征向量输入所述第一客群识别模型以生成所述识别评分。

可选地,将所述待识别的用户数据输入第二客群识别模型生成识别评分,包括:将所述待识别的用户数据分别输入设备特征网络和用户特征学习模型以生成设备特征向量和用户特征学习向量;将所述设备特征向量和所述用户特征学习向量输入所述第二客群识别模型以生成所述识别评分。

根据本申请的一方面,提出一种目标用户的识别装置,该装置包括:用户模块,用于获取多个待识别用户数据;第一识别模块,用于在待识别的用户数据中包含用户筛选特征和设备筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;第二识别模块,用于在待识别的用户数据中不包含用户筛选特征仅包含设备筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;目标模块,用于在所述识别评分大于阈值时,将所述待识别用户数据对应的用户确定为目标用户。

根据本申请的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。

根据本申请的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。

根据本申请的目标用户的识别方法、装置、电子设备及计算机可读介质,通过获取待识别的用户数据;在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户的方式,能够充分考虑到不同用户数据之间的特点,针对不用的用户数据使用不同的客户识别模型进行分析,从而对目标用户进行精确识别,保证系统数据安全和交易安全。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。

附图说明

通过参照附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种目标用户的识别方法及装置的系统框图。

图2是根据一示例性实施例示出的一种目标用户的识别方法的流程图。

图3是根据另一示例性实施例示出的一种目标用户的识别方法的流程图。

图4是根据另一示例性实施例示出的一种目标用户的识别方法的示意图。

图5是根据另一示例性实施例示出的一种目标用户的识别方法的示意图。

图6是根据另一示例性实施例示出的一种目标用户的识别方法的流程图。

图7是根据一示例性实施例示出的一种目标用户的识别装置的框图。

图8是根据另一示例性实施例示出的一种目标用户的识别装置的框图。

图9是根据一示例性实施例示出的一种电子设备的框图。

图10是根据一示例性实施例示出的一种计算机可读介质的框图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本申请将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本申请概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的,因此不能用于限制本申请的保护范围。

图1是根据一示例性实施例示出的一种目标用户的识别方法及装置的系统框图。

如图1所示,系统架构10可以包括第三方服务器101、102、103,网络104和本地服务器105。网络104用以在第三方服务器101、102、103和本地服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

第三方服务器101、102、103可通过网络104与本地服务器105交互,以接收或发送用户数据等。第三方服务器101、102、103可以安支持各种客户端应用,例如互联网服务类应用、购物类应用、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等。

第三方服务器101、102、103可例如根据其平台登陆或者访问的用户生成第三方设备数据。第三方服务器101、102、103可例如将第三方设备数据传输给本地服务器105。

本地服务器105可例如通过第三方设备数据和本地用户数据生成多个训练样本集合;本地服务器105可例如基于所述多个训练样本集合生成用户特征向量、设备特征向量、用户特征学习向量;本地服务器105可例如通过所述用户特征向量、所述设备特征向量对第一机器学习模型进行训练,生成所述第一客群识别模型;本地服务器105可例如通过所述设备特征向量、所述用户特征学习向量对第二机器学习模型进行训练,生成所述第二客群识别模型。

本地服务器105可例如获取待识别的用户数据;本地服务器105可例如在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;本地服务器105可例如在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;本地服务器105可例如在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户。

本地服务器105可例如对互联网全量用户进行用户识别,以生成人群定向包和人群排除包。本地服务器105可例如通过目标用户生成人群定向包;本地服务器105还可例如将识别评分小于阈值的用户确定为黑名单用户,通过黑名单用户生成人群排除包。本地服务器105可例如将人群定向包和人群排除包发送给第三方服务器101、102、103以进行目标用户识别,还可进行广告投放。

第三方服务器101、102、103和本地服务器105均可以是一个实体的服务器,还可例如为多个服务器组成,需要说明的是,本申请实施例所提供的目标用户的识别方法可以由本地服务器105,相应地,目标用户的识别装置可以设置于本地服务器105。

图2是根据一示例性实施例示出的一种目标用户的识别方法的流程图。目标用户的识别方法20至少包括步骤S202至S208。

如图2所示,在S202中,获取待识别的用户数据。

在本申请实施例中,用户可为个人用户或者企业用户。用户数据可包括经过用户授权的用户基础信息,可例如为用户账号、用户标识、用户在互联网中的行为信息等,还可包括用户的终端设备的设备标识。

在S204中,在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分。其中,用户筛选特征可通过用户标识、设备标识、经用户授权的用户数据生成。

在一个实施例中,可将所述待识别的用户数据分别输入用户特征网络和设备特征网络以生成用户特征向量和设备特征向量;将所述用户特征向量和所述设备特征向量输入所述第一客群识别模型以生成所述识别评分。

在实际应用过程中,通过用户特征网络获取用户特征向量,通过设备特征网络获取设备特征向量,用户特征向量和设备特征向量输入训练完毕的第一客群识别模型,输出当前用户属于目标用户的概率。

其中,用户特征网络和设备特征网络均为用于提取用户特征的网络模型,可通过用户相关数据对特征网络训练生成,用户特征网络和设备特征网络、第一客群识别模型的具体训练和生成过程将在图3对应的实施例进行详细描述。

更具体的,可首先对用户数据进行数据清洗和数据融合,还可对用户数据进行变量缺失率分析与处理、异常值处理;还可将连续型变量离散化的用户数据进行WOE(Weightof Evidence证据权重)转化、离散型变量WOE(词向量)转化、文本变量加工处理、文本变量的word2vec处理等等,然后再输入用户特征网络和设备特征网络中进行计算,生成用户特征向量和设备特征向量。

在S206中,在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分。在实际应用中,经常会遇到没有用户特征,而仅有设备特征的用户数据,此时,可用第二客群识别模型进行计算。

在一个实施例中,可将所述待识别的用户数据分别输入设备特征网络和用户特征学习模型以生成设备特征向量和用户特征学习向量;将所述设备特征向量和所述用户特征学习向量输入所述第二客群识别模型以生成所述识别评分。

在实际应用过程中,通过用户特征学习网络获取用户特征学习向量,通过设备特征网络获取备特征数据,用户特征学习向量和设备特征向量输入训练完毕的第二客群识别模型,输出当前用户属于目标用户的概率。

其中,用户特征学习模型为用于由用户设备特征中提取用户特征的机器学习模型,可通过第三方数据对特征网络训练生成,第二客群模型的训练和生成过程将在图3对应的实施例进行详细描述。用户特征学习模型的训练生成过程将在图6对应的实施例中进行详细描述。

在S208中,在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户。在一个实施例中,还可将评分小于阈值的用户作为黑名单用户。

以上文的广告投放场景为例,可对互联网全量用户进行评分筛选,通过大于阈值的用户生成人群定向包,通过小于阈值的用户生成人群排除包。当然,人群定向包和人群排除包对应的阈值可根据实际情况进行调整,本色还能去不以此为限。

根据本申请的目标用户的识别方法,通过获取待识别的用户数据;在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户的方式,能够充分考虑到不同用户数据之间的特点,针对不用的用户数据使用不同的客户识别模型进行分析,从而对目标用户进行精确识别,保证系统数据安全和交易安全。

应清楚地理解,本申请描述了如何形成和使用特定示例,但本申请的原理不限于这些示例的任何细节。相反,基于本申请公开的内容的教导,这些原理能够应用于许多其它实施例。

图3是根据另一示例性实施例示出的一种目标用户的识别方法的流程图。图3所示的流程30对“第一客群识别模型和第二客群识别模型生成过程”的详细描述。

如图3所示,在S302中,通过第三方设备数据和本地用户数据生成多个训练样本集合。可例如,获取多个第三方平台以设备标识作为标识的第三方设备数据,第三方设备数据中包含以设备标识和其对应的第三方数据,不同的第三方平台提供的设备数据中包含不同的具体信息,广告平台可提供该设备标识对应的广告点击情况,用户授信平台可提供该设备标识对应的授信信息等。还可例如,基于所述第三方设备数据生成设备筛选特征;可通过对第三方设备数据的统计分析或者机器学习分析生成和设备标识对应的特征数据作为设备特征向量。

更具体的,第三方设备数据可包括:从广告平台RTA请求数据、自有产品广告的曝光和点击数据。

还可例如,获取以用户标识作为标识的本地用户数据,本地用户数据可包括经过用户授权的用户标识维度的属性和行为数据、用户标识和设备标识的映射数据、广告平台RTA设备id请求数据、已推广产品广告的曝光和点击数据中一者或者多者。

基于所述本地用户数据生成用户筛选特征,可通过对第本地用户数据的统计分析或者机器学习分析生成和用户标识对应的特征数据作为用户特征向量。

在一个实施例中,可通过所述设备筛选特征和所述用户筛选特征对所述本地用户数据进行筛选以生成所述多个训练样本集合。

在一个实施例中,还包括:提取所述本地用户数据中的设备标识;将本地用户数据的标识由用户标识映射为设备标识。更具体的,可提取本地用户数据中包含设备标识的数据,将这些本地用户数据用其对应的设备标识作为标识。将本地用户数据映射为设备标识,能够在后续样本训练的过程中,通过设备标识和第三方设备数据联合进行机器学习模型的训练。

通过将本地用户数据和第三方设备数据联合进行机器学习模型的训练方式能够将本地用户数据引入到第三方设备数据中,可以充分利用互联网应用平台的本地用户数据,提高针对于某一互联网应用平台的目标用户的识别能力。

其中,通过所述设备筛选特征和所述用户筛选特征对所述本地用户数据进行筛选以生成所述多个训练样本集合,包括:其中,可根据预设策略由本地用户数据中提取正样本用户数据和负样本用户数据。预设策略可根据目标用户的使用目的设置,如上文的实施例中,当目标用户的目的是广告投放时,可通过用户对该广告平台上广告的点击率、转化率生成正样本用户和负样本用户的判别条件。更具体的,可将点击过该广告平台的用户设定为正样本用户,将未点击过该广告平台的用户设定为负样本用户。

更具体的,通过包含有用户筛选特征和设备筛选特征的正样本用户数据和负样本用户数据生成第一训练样本集合;通过包含有设备筛选特征且不包含有用户筛选特征的正样本用户数据和负样本用户数据生成第二训练样本集合。

在S304中,基于所述多个训练样本集合生成用户特征向量、第一设备特征向量、第二设备特征向量、用户特征学习向量。

可将所述第一训练样本集合输入用户特征网络,生成所述用户特征向量;将所述第二训练样本集合输入设备特征网络,生成所述设备特征向量;将所述第四训练样本集合输入用户特征学习网络,生成所述用户特征学习向量。

其中,用户特征网络和设备特征网络均可通过满足条件的历史用户对特征网络训练生成。

在S306中,通过所述用户特征向量、所述第一设备特征向量对第一机器学习模型进行训练,生成所述第一客群识别模型。

在一个实施例中,如图4所示,将第一训练样本集合输入用户特征网络中,生成用户特征向量;将第二训练样本集合输入设备特征网络中,生成设备特征向量;将用户特征向量和设备特征向量同时输入到第一机器学习模型进行训练,第一机器学习模型可为分类任务网络模型,在训练过程中,当损失函数小于预设条件时,生成所述第一客群识别模型。

在S308中,通过所述第二设备特征向量、所述用户特征学习向量对第二机器学习模型进行训练,生成所述第二客群识别模型。在实际应用中,经常会遇到没有用户特征,而仅有设备特征的用户数据,此时,可用第二客群识别模型进行计算。

在一个实施例中,如图5所示,将第二训练样本集合输入用户特征学习网络中,生成用户特征学习向量;将第二训练样本集合输入设备特征网络中,生成设备特征向量;将用户特征学习向量和设备特征向量同时输入到第二机器学习模型进行训练,第二机器学习模型可为分类任务网络模型,在训练过程中,当损失函数小于预设条件时,生成所述第二客群识别模型。

在本申请的用户特征网络、设备特征网络、第一客群模型、第二客群模型的训练过程中,可通过如下方面进行模型训练。

具体的,针对每个样本训练集合,分别构建调整模型,将样本训练集合中的各个用户的用户数据输入所述调整模型,以得到预测标签,将所述预测标签与相应的真实的标签进行比对,判断预测标签与真实的标签是否一致,统计与真实的标签一致的预测标签的数量,并计算与真实的标签一致的预测标签的数量在所有预测标签的数量中的占比,若所述占比大于或等于预设占比值,则所述调整模型收敛,得到训练完成的用户特征网络或设备特征网络或第一客群模型或第二客群模型。

若所述占比小于所述预设占比值,则调整所述调整模型中的参数,通过调整后的调整模型重新预测各个对象的预测标签,直至所述占比大于或等于预设占比值。其中,调整所述调整模型中的参数的方法可以采用随机梯度下降算法、梯度下降算法或正规方程进行。

若调整所述调整模型的参数的次数超过预设次数时,可以更换构建调整模型所使用的模型,以提高模型训练效率。

图6是根据另一示例性实施例示出的一种目标用户的识别方法的流程图。图6所示的流程60是对“用户特征学习网络生成过程”的详细描述。

在S602中,逐一将所述第一训练样本集合中的正样本用户数据和负样本用户数据输入用户特征网络,生成用户特征向量;

在S604中,逐一将所述第二训练样本集合中的正样本用户数据和负样本用户数据输入所述初始特征网络模型,生成用户特征学习向量;

在S606中,计算所述用户特征向量和所述用户特征学习向量之间的相似度。

在一个实施例中,将用户特征网络输出的用户特征向量记为e1;将用户特征学习网络输出用户特征学习向量记为e2;

用户特征向量和用户特征学习向量之间的相似度可表示为:

sim(xi)=cos(e1(xi),e2(xi)),

其中,sim()为相似度函数,xi表示当前计算的正样本用户数据或负样本用户数据。

在S608中,当相似度的极大似然损失函数满足条件时,生成所述用户特征学习网络。

其中,极大似然损失函数可表示为:

其中,L为极大似然损失函数,sim()为相似度函数,xi表示当前计算的正样本用户数据或负样本用户数据。

本申请中,针对样本不同特征覆盖,使用不同网络结构的统一建模方法,同时学习用户特征学习任务和目标用户分类任务,可以有效提高目标用户识别的准确性。

本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本申请提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。

此外,需要注意的是,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。

图7是根据一示例性实施例示出的一种目标用户的识别装置的框图。如图7所示,目标用户的识别装置70包括:用户模块702,第一识别模块704,第二识别模块706,目标模块708。

用户模块702用于获取多个待识别用户数据;

第一识别模块704用于在待识别的用户数据中包含用户筛选特征和设备筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;

第二识别模块706用于在待识别的用户数据中不包含用户筛选特征仅包含设备筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;

目标模块708用于在所述识别评分大于阈值时,将所述待识别用户数据对应的用户确定为目标用户。

图8是根据另一示例性实施例示出的一种目标用户的识别装置的框图。如图8所示,目标用户的识别装置80包括:样本模块802,特征模块804,第一训练模块806,第二训练模块808。

样本模块802用于通过第三方设备数据和本地用户数据生成多个训练样本集合;

特征模块804用于基于所述多个训练样本集合生成用户特征向量、第一设备特征向量、第一设备特征向量、用户特征学习向量;

第一训练模块806用于通过所述用户特征向量、所述第一设备特征向量对第一机器学习模型进行训练,生成所述第一客群识别模型;

第二训练模块808用于通过所述第二设备特征向量、所述用户特征学习向量对第二机器学习模型进行训练,生成所述第二客群识别模型。

根据本申请的目标用户的识别装置,通过获取待识别的用户数据;在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户的方式,能够充分考虑到不同用户数据之间的特点,针对不用的用户数据使用不同的客户识别模型进行分析,从而对目标用户进行精确识别,保证系统数据安全和交易安全。

图9是根据一示例性实施例示出的一种电子设备的框图。

下面参照图9来描述根据本申请的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:至少一个处理单元910、至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930、显示单元940等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元910执行,使得所述处理单元910执行本说明书中的根据本申请各种示例性实施方式的步骤。例如,所述处理单元910可以执行如图2,图3,图6中所示的步骤。

所述存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(ROM)9203。

所述存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备900也可以与一个或多个外部设备900’(例如键盘、指向设备、蓝牙设备等)通信,使得用户能与该电子设备900交互的设备通信,和/或该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且,电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器960可以通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,如图10所示,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本申请实施方式的上述方法。

所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取待识别的用户数据;在待识别的用户数据中包含用户筛选特征时,将所述待识别的用户数据输入第一客群识别模型生成识别评分;在待识别的用户数据中不包含用户筛选特征时,将所述待识别的用户数据输入第二客群识别模型生成识别评分;在所述识别评分大于阈值时,将所述待识别的用户数据对应的用户确定为目标用户。该计算机可读介质还可实现如下功能:通过第三方设备数据和本地用户数据生成多个训练样本集合;基于所述多个训练样本集合生成用户特征向量、第一设备特征向量、第二设备特征向量、用户特征学习向量;通过所述用户特征向量、所述第一设备特征向量对第一机器学习模型进行训练,生成所述第一客群识别模型;通过所述第二设备特征向量、所述用户特征学习向量对第二机器学习模型进行训练,生成所述第二客群识别模型。

本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施例的方法。

以上具体地示出和描述了本申请的示例性实施例。应可理解的是,本申请不限于这里描述的详细结构、设置方式或实现方法;相反,本申请意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

相关技术
  • 目标用户的识别方法、装置、电子设备及计算机可读介质
  • 目标识别方法、装置、电子设备、计算机可读存储介质
技术分类

06120114721987