掌桥专利:专业的专利平台
掌桥专利
首页

资源推送数据处理方法、装置、计算机设备和存储介质

文献发布时间:2023-06-19 18:29:06


资源推送数据处理方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域,特别是涉及一种资源推送数据处理方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

在现今信息快速发展的时代,每个人都有其不同的资源数据搭配使用习惯,使得不同的资源数据使用之间存在着关联性。通过这些关联性去预测资源搭配的方式可以提高人们资源数据的使用率,从而增加人们的利益。

然而目前资源数据的发放方式不具有针对性,也未考虑不同资源数据使用之间的关联性,使得服务器没有发送资源数据的限制条件,进而导致服务器发送资源数据的压力大以及资源数据利用率低。

发明内容

基于此,有必要针对上述技术问题,提供一种能够获取不同资源数据之间的关联性的资源推送数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,提高了资源数据利用率。

一种资源推送数据处理方法。所述方法包括:

获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征;

基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别;

获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集;

对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系;

存储所述群体类别和对应的目标项关联关系,所述目标项关联关系用于向对应的群体类别推送关联的资源数据。

在其中一个实例中,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别包括:

将所述资源关联信息分为训练集和验证集;

计算各个所述资源关联特征对应的信息增益比;

选择各个所述资源关联特征对应的信息增益比最大的资源关联特征作为根节点划分特征,基于根节点划分特征对所述训练集进行分支操作,生成分支节点,且每个分支节点都有所述训练集中的样本;

计算每个分支节点中的资源关联特征对应的信息增益比,选择各个分支节点中信息增益比最大的资源关联特征作为各个分支节点的节点划分特征,基于所述节点划分特征对所述各个分支节点上的样本进行分支操作,生成新的分支节点;

重复计算每个分支节点中的资源关联特征对应的信息增益比,选择各个分支节点中信息增益比最大的资源关联特征作为各个分支节点的节点划分特征,基于所述节点划分特征对所述各个分支节点上的样本进行分支操作,生成新的分支节点的操作,直到每个样本都有了明确的分类,得到决策树集;

通过验证集对所述决策树集进行预测,获得目标决策树,基于目标决策树得到对象集合中各个对象对应的群体类别。

在其中一个实施例中,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集包括:

获取预设发生参数;

读取所述历史资源数据,将每个历史资源数据作为一个项,并将每个项作为一个一层候选项集,计算每个一层候选集的历史发生参数;

从一层候选项集中筛选出历史发生参数大于或等于预设发生参数的项集作为当前层频繁项集;

将所述当前层频繁项集中的各个项集组合生成下一层候选项集,计算每个所述下一层候选项集的历史发生参数,并进行预剪枝操作;

筛选预剪枝操作之后的下一层候选项集中历史发生参数大于或等于预设发生参数的项集作为下一层频繁项集;

返回所述将所述当前层频繁项集中的各个项集组合生成下一层候选项集,计算每个所述下一层候选项集的历史发生参数,并进行预剪枝操作的步骤,直到无法筛选出大于或等于预设发生参数的项集,得到目标频繁项集。

在其中一个实施例中,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系包括:

获取预设置信参数;

计算所述项关联关系的置信参数;

筛选所述项关联关系的置信参数大于或等于预设置信参数的项关联关系作为所述群体类别对应的目标项关联关系。

在其中一个实施例中,存储所述群体类别和对应的目标项关联关系之后还包括:

获取目标对象的资源关联信息,接收目标对象对应的终端展示所述资源数据的依据条件;

基于所述目标对象的资源关联信息,进行特征提取得到目标对象的资源关联特征;

基于所述目标对象的资源关联特征和资源关联信息,将目标对象进行群体分类,得到目标对象的目标群体类别;

基于所述目标对象的目标群体类别,获取目标对象的目标群体类别对应的目标项关联关系;

基于所述目标项关联关系和依据条件,获取目标对象所关联的目标资源数据,将所述目标资源数据发送到所述目标对象对应的终端。

在其中一个实施例中,基于所述目标项关联关系和依据条件,获取目标对象所关联的目标资源数据包括:

基于所述目标项关联关系获取所述目标对象对应的初始资源数据;

当所述依据条件是资源转化率时,计算所述初始资源数据中每个初始资源数据的转化率,并基于每个初始资源数据的转化率进行从大到小排序,将排序完成的初始资源数据作为所述目标资源数据;

当所述依据条件是资源使用频次时,对所述初始资源数据中每个初始资源数据对应的目标项关联关系的置信参数进行从大到小排序,将排序完成的初始资源数据作为所述目标资源数据。

一种资源推送数据处理装置,所述装置包括:

特征提取模块,用于获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征;

对象分类模块,用于基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别;

目标频繁项集获取模块,用于获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集;

目标项关联关系获取模块,用于对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系;

数据存储模块,用于存储所述群体类别和对应的目标项关联关系,所述目标项关联关系用于向对应的群体类别推送关联的资源数据。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征;

基于资源关联特征和资源关联信息,通过决策树将对象集合中的各个对象分为对应的群体类别;

获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集;

对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系;

存储群体类别和对应的目标项关联关系,目标项关联关系用于向对应的群体类别推送关联的资源数据。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下操作:

获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征;

基于资源关联特征和资源关联信息,通过决策树将对象集合中的各个对象分为对应的群体类别;

获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集;

对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系;

存储群体类别和对应的目标项关联关系,目标项关联关系用于向对应的群体类别推送关联的资源数据。

上述资源推送数据处理方法、装置、计算机设备和存储介质,通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于资源关联特征和资源关联信息,通过决策树将对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系,存储群体类别和对应的目标项关联关系,目标项关联关系用于向对应的群体类别推送关联的资源数据。通过服务器获取对象集合对应的资源关联信息,提取该资源关联信息的资源关联特征,并通过该资源关联特征对对象集合中每个对象进行群体类别分类,根据群体类别对应的历史资源数据找出历史资源数据之间的关联关系,从而使服务器根据不同资源数据使用之间的关联关系有针对性的发送资源数据到终端,减小了服务器发送数据的压力以及提高了资源的利用率。

一种资源数据接收方法,所述方法包括:

获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的;

展示所述资源数据。

一种资源数据接收装置,所述装置包括:

资源数据获取模块,用于获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的;

资源数据展示模块,用于展示所述资源数据。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的;

展示所述资源数据。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的;

展示所述资源数据。

上述资源数据接收方法、装置、计算机设备和存储介质,通过获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的,展示所述资源数据。通过服务器根据不同资源使用之间的关联关系从服务器获得推送的资源数据,并将资源数据根据依据条件展示到终端,从而有效的提高了资源的利用率,并减小了服务器发送资源数据的压力。

附图说明

图1为一个实施例中资源推送数据处理方法的应用环境图;

图2为一个实施例中资源推送数据处理方法的流程示意图;

图3为一个实施例中对象分类的流程示意图;

图4为一个实施例中目标频繁项集获取的流程示意图;

图5为一个实施例中目标频繁项集获取的算法流程示意图;

图6为一个实施例中目标项关联关系获取的流程示意图;

图7为一个实施例中数据存储的流程示意图;

图8为一个实施例中条件判断的流程示意图;

图9为一个实施例中资源数据接收方法的流程示意图;

图10为一个实施例中资源推送数据处理装置的结构框图;

图11为一个实施例中资源数据接收装置的结构框图;

图12为一个实施例中计算机设备的内部结构图;

图13为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的资源推送数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102用于获取并展示资源数据。服务器104用于获取资源关联信息,并对资源关联信息进行数据处理,分析出各类群体对应的资源关联信息中各种资源之间的关联关系。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种资源推送数据处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤S200,获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征。

其中,对象集合是指使用资源的各类社会群体的集合。资源关联信息是指各类社会群体中每个群体的数据信息。资源关联特征指对资源关联信息进行特征表示之后,选取出具有代表性的特征,将所述具有代表性的特征作为资源关联特征。资源关联特征包括对象集合的常规特征以及对象集合所对应的资源的专项特征。

具体地,在本资源推荐数据方法实施之前,需要将海量的各个对象相关的数据信息先存储到数据库中,基于Hadoop适合应用于大数据存储和大数据分析的应用、适合于服务器几千台到几万台的集群运行以及支持PB级的存储容量的特点,本资源推荐数据方法应用Hadoop进行数据存储和数据计算。当本资源推荐数据方法步入部署与实施进程时,就从数据库中获取对象集合对应的资源关联信息,对这些资源关联信息进行特征表示,然后选出具有代表性的资源关联特征作为后续进程执行的数据。

步骤S202,基于资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别。

其中,决策树是指一种监督学习,所谓监督学习就是给定一堆资源关联特征样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,所述分类器能够对新出现的对象给出正确的分类。分类器是数据挖掘中对样本进行分类的统称,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。

具体地,将在服务器对对象集合所对应的资源关联信息提取所得的资源关联特征作为构建决策树属性特征,资源关联信息作为决策树的输入数据。此外,在每次对决策树节点进行分支操作之前,都需要计算每个节点中每个资源关联特征的信息增益比,并选择每个节点中信息比最大的资源关联特征作为该节点的节点划分特征,直到每个节点中的样本数据都有了明确的分类。

步骤S204,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集。

其中,历史资源数据指对象集合中各个对象对应的使用资源的数据记录。候选项集指由对象集中每个对象对应的使用资源中各种资源搭配方式的集合。预设发生参数指由服务器定义的以任何方式使用资源所出现的固定概率值,用于作为各种资源使用概率的参考值,以挑选出使用概率比预设参数大或者相等的资源使用情况。候选项集的历史发生参数指对象集合中每个对象对应的使用资源中各种资源搭配使用所出现的概率。频繁项集指候选项集中历史发生参数大于或等于预设发生参数的集合,该频繁项集用于挖掘资源使用之间存在的关联规则,也就是资源使用之间存在的相关性。

具体的,服务器获取群体类别对应的历史资源数据,通过决策树对对象集合中各个对象进行群体类别区分,再从各个对象对应的群体类别的资源关联信息中选取资源使用的数据记录作为群体类别对应的历史资源数据,将历史资源数据中的每一个历史资源数据当做一个项,应用每一个项构成不同层次的候选项集,并计算每个层次中每个候选项集的历史发生参数,选取出历史发生参数大于或等于预设发生参数的项集作为对应层次的频繁项集。

步骤S206,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系。

其中,目标频繁项集指对应群体类别所对应的历史资源数据中各个历史资源数据中频繁使用的历史资源数据的集合。项关联关系指目标频繁项集中各个历史资源数据之间的关联性。项关联关系对应的置信参数指项关联关系中在一个或多个历史资源数据使用的条件下另外一个或多个历史资源数据也使用的条件概率。预设置信参数指服务器定义的一个或多个资源使用的条件下另外一个或多个资源也使用的条件概率固定值。目标项关联关系指项关联关系中置信度参数大于或等于预设置信参数的项关联关系。

具体地,服务器获取执行所得的群体类别对应的目标频繁项集对应的每一个非空真子集,此时对非空真子集进行筛选,剔除掉在获取目标频繁项集步骤之前就已经剔除过,而在目标频繁项集对应的非空真子集中又出现的集合。对剔除之后的非空真子集进行排列组合,计算每一个组合对应的置信参数,将每一个组合对应的置信参数与预设置信参数进行比对,选取比对结果中置信参数大于或等于预设置信参数的组合作为对应群体所对应的目标项关联关系。

步骤S208,存储所述群体类别和对应的目标项关联关系,所述目标项关联关系用于向对应的群体类别推送关联的资源数据。

具体地,服务器将执行所得的对象集合对应的群体类别和对应的目标项关联关系存储到数据库中,并对数据进行计算分析。

上述资源推送数据处理方法中,通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系,存储所述群体类别和对应的目标项关联关系,所述目标项关联关系用于向对应的群体类别推送关联的资源数据。通过服务器获取对象集合对应的资源关联信息,提取该资源关联信息的资源关联特征,并通过该资源关联特征对对象集合中每个对象进行群体类别分类,根据群体类别对应的历史资源数据找出历史资源数据之间的关联关系,从而使服务器根据不同资源数据使用之间的关联关系有针对性的发送资源数据到终端,减小了服务器发送数据的压力以及提高了资源的利用率。

在一个实施例中,所述方法需要多次访问历史资源数据,导致算法的效率低下,此外上述方法是串行算法,会产生大量的候选项集,使得运行缓慢。就这些问题进一步考虑,还可以采用改进的AprioriTip算法,构造Tip表存储数据库中在候选项集中的子集,通过扫描该Tip表,可以统计候选项集的支持度,进而确定频繁项集,当循环次数增加时,需要扫描的数量也相应的减少,从而提高了算法的效率。除此之外,还可以使用Hadoop对算法进行并行改造,将大规模数据集进行分片处理,在一台计算机中的不同虚拟机中设置多个节点,每个节点都执行Map和Reduce任务,从而减少了程序的执行时间。

其中,串行算法指算法步骤必须一步接着一步执行,不可同一时间执行的算法。支持度即历史发生参数。并行指在同一个时刻多个任务同时执行。Map任务主要用于过滤一些原始数据,Reduce任务主要用于处理Map任务过滤之后的数据。

在一个实施例中,如图3所示,步骤S202包括:

步骤S300,将所述和资源关联信息分为训练集和验证集。

具体地,将和资源关联信息按自定义比例分为训练集和验证集。训练集用于训练分类模型,拟合出多个分类器。然后通过验证集对多个分类器进行预测,获取最具有分类能力的分类模型。

步骤S302,计算各个所述资源关联特征对应的信息增益比。

其中,信息增益比是度量决策树生成过程中不断将数据集划分为纯度更高的数据集的特征选择准则。

具体地,在确定决策树根节点前,计算各个资源关联特征对应的信息增益比,为后续进程中训练集的初步划分提供数据。

步骤S304,选择各个所述资源关联特征对应的信息增益比最大的资源关联特征作为根节点划分特征,基于根节点划分特征对所述训练集进行分支操作,生成分支节点,且每个分支节点都有所述训练集中的样本。

其中,根节点划分特征指最具有分类能力的资源关联特征。分支操作指将决策树节点中的样本再划分的过程。分支节点指由节点再生出的节点。样本指对象集合中一个对象所对应的数据信息。

具体地,将各个分支节点中各个资源关联特征对应的信息增益比最大的资源关联特征作为根节点划分特征,对所述训练集进行分支操作后,完成训练集的初步划分。

步骤S306,计算每个分支节点中各个资源关联特征对应的信息增益比,选择各个分支节点中信息增益比最大的资源关联特征作为各个分支节点的节点划分特征,基于所述节点划分特征对所述各个分支节点上的样本进行分支操作,生成新的分支节点。

其中,节点划分特征指分支节点进行分支操作之前选取出来最具有该分支点分类能力的资源关联特征。

具体地,在各个样本还没有得到明确的分类之前,决策树中的分支节点每次需要在进行分支操作之前计算好各个分支节点中每个资源关联特征的信息增益比,然后选取各个分支节点中信息增益比最大的资源关联特征作为对应分支节点的节点划分特征,接着基于所述节点划分特征对对应分支节点上的样本进行划分并生成新的分支节点。

步骤S308,重复计算每个分支节点中各个资源关联特征对应的信息增益比,选择各个分支节点中信息增益比最大的资源关联特征作为各个分支节点的节点划分特征,基于所述节点划分特征对所述各个分支节点上的样本进行分支操作,生成新的分支节点的操作,直到每个样本都有了明确的分类,得到决策树集。

其中,决策树集指训练过程中构建的各个决策树的集合。

步骤S400,通过验证集对所述决策树集进行预测,获得目标决策树,基于目标决策树得到对象集合中各个对象对应的群体类别。

其中,目标决策树指训练过程中构建的各个决策树中最具有分类能力的决策树。

具体地,验证集用于评估训练得到的多种带着不同参数的决策树,然后根据决策树通过验证集的评估效果对决策树进行选择和调参,使得决策树分类效果在验证集达到最优,然后将该决策树作为目标决策树。

在本实施例中,将资源关联信息划分为训练集和验证集可以确保能够学习训练出具有更高准确率的决策树模型。训练集可以用来训练决策树模型的参数,验证集可以评估训练得到的多种不同决策树模型或者是带着不同参数的同一决策树模型的效果。决策树在基于训练集的学习训练以及验证集的预测下,提升了决策树的分类效果,使得最终获取的目标决策树具有较好的性能。

在一个实施例中,如图4所示,步骤S204包括:

步骤S402,获取预设发生参数。

具体地,根据资源数据情况自定义预设发生参数的值。

步骤S404,读取所述历史资源数据,将每个历史资源数据作为一个项,并将每个项作为一个一层候选项集,计算每个一层候选集的历史发生参数。

具体地,每一个历史资源数据都是该历史资源数据对应的群体类别所使用过的资源的记录,通过将每一个记录当做一个项,以数学量化的方式去分析每一个记录出现的概率,将该概率作为该历史资源数据的历史发生参数,为后续进程的执行提供数据。

步骤S406,从一层候选项集中筛选出历史发生参数大于或等于预设发生参数的项集作为当前层频繁项集。

具体地,一层级中有一个或多个候选项集,基于获取候选项集中频繁发生的历史资源数据的思想,将该层级下的候选项集中每一个项集的历史发生参数都与预设的发生参数进行对比,将依据对比的结果获得的项集作为一层频繁项集,为后续进程的执行提供数据。

步骤S408,将所述当前层频繁项集中的各个项集组合生成下一层候选项集,计算每个所述下一层候选项集的历史发生参数,并进行预剪枝操作。

其中,预剪枝指在从候选项集筛选出频繁项集之前,对候选项集中的每一个项集进行检查,若出现在该层级候选项集的子集中包含有之前层级候选项集生成过程中就剔除掉的项集,则将之前就剔除过而在此处又出现的项集剔除掉的操作。

具体地,将当前层级的频繁项集中的各个项集进行排列组合生成下一层级的候选项集,对该候选项集中每一个候选项集都进行检查评估,若出现前面层级的候选项集在生成过程中就剔除掉的项集存在于该层级候选项集的子集中,则剔除掉当前层级下的该候选项集。

步骤S500,筛选预剪枝操作之后的下一层候选项集中历史发生参数大于或等于预设发生参数的项集作为下一层频繁项集。

具体地,对预剪枝操作之后的候选项集进行再一次筛选,选出符合该层级下的频繁项集。

步骤S502,返回所述将所述当前层频繁项集中的各个项集组合生成下一层候选项集,计算每个所述下一层候选项集的历史发生参数,并进行预剪枝操作的步骤,直到无法筛选出大于或等于预设发生参数的项集,得到目标频繁项集。

具体地,在没有获得目标频繁项集之前,需要不断增加项集的层级数并计算每一层级下的候选项集的历史发生参数,直到找到目标项集为止。所述方法具体流程如图5所示,其中,数据D即历史资源数据,C_k即候选项集,L_k即频繁项集,k是用于计数的参数,k为多少则对应几层候选项集或几层频繁项集,输出规则即目标频繁项集。

在本实施例中,预设发生参数可以作为项集频繁发生的衡量依据。通过将候选项集层层递增的筛选出频繁项集的方式,确保了每一个项之间都进行了组合的情况,此外在组合并筛选的过程中以筛选出大于或等于预设发生参数的项集的条件,确保了最终获取到的目标频繁项集都符合条件准则,为资源转化率的提升奠定了基础。

在一个实施例中,如图6所示,步骤S206包括:

步骤S504,获取预设置信参数。

具体地,根据资源数据情况自定义预设置信参数的值。

步骤S506,计算所述项关联关系的置信参数。

具体地,每种项关联关系都有对应的置信参数,依据每种项关联关系的发生概率计算出每一种项关联关系的置信参数,为后续进程的执行提供依据。

步骤S508,筛选所述项关联关系的置信参数大于或等于预设置信参数的项关联关系作为所述群体类别对应的目标项关联关系。

具体地,目标项关联关系需要符合项关联关系的置信参数大于或等于预设置信参数,将计算获得的每一个项关联关系对应的置信参数与预设置信参数做对比,筛选出符合目标项关联关系条件的项关联关系作为目标项关联关系。

在本实施例中,预设置信参数可以作为项关联关系频繁发生的衡量依据。通过计算比对每一个项关联关系的置信参数,并筛选出大于或等于预设置信参数的项关联关系,使得服务器更加直观地知道了各项之间存在的关系,也就是各群体频繁做出的资源使用习惯,这在很大程度上可以提升资源的转化率,从而也能在一定程度上减小服务器发送资源数据时数据分析计算的压力。

在一个实施例中,如图7所示,在步骤S208之后还包括:

步骤S600,获取目标对象的资源关联信息,接收目标对象对应的终端展示所述资源数据的依据条件。

其中,目标对象指登录终端界面的用户,该用户包括新用户和旧用户。依据条件指终端接收由服务器发送来的资源数据时,资源数据中每一种资源数据在终端哪个为止进行展示的判断依据,该依据条件包括资源转化率和资源使用频次。

步骤S602,基于所述目标对象的资源关联信息,进行特征提取得到目标对象的资源关联特征。

具体地,目标对象在终端进行操作,目标对象对应的资源数据记录可能发生改变,服务器需要根据目标对象的资源数据重新处理,对目标对象的资源关联信息进行特征的提取,将提取出的资源关联特征作为后续进程执行的数据。

步骤S604,基于所述目标对象的资源关联特征和资源关联信息,将目标对象进行群体分类,得到目标对象的目标群体类别。

具体地,服务器对目标对象进行群体分类,将获取的群体类别作为后续进程的数据作进一步的数据分析。

步骤S606,基于所述目标对象的目标群体类别,获取目标对象的目标群体类别对应的目标项关联关系。

具体地,服务器自身已经存储有各类群体类别对应的目标项关联关系,当获取到目标对象的群体类别时,服务器即可根据存储的数据信息得到目标对象对应的目标项关联关系。

步骤S608,基于所述目标项关联关系和依据条件,获取目标对象所关联的目标资源数据,将所述目标资源数据发送到所述目标对象对应的终端。

其中,目标资源数据指在目标对象自身拥有的资源中筛选出的满足预设发生参数和预设置信度以及根据依据条件计算分析并排序完成的资源数据。

其中,依据条件服务器原本已经存储有,当终端将选择的依据条件发送给服务器时,服务器根据依据条件对资源数据进一步处理,然后再将处理好的资源数据发送到终端。

在本实施例中,服务器由于已存储有推送给群体类别对应的目标资源数据,因为在获取到目标对象相关数据之后,可以直接根据目标对象的群体类别给目标对象推送目标资源数据,这在很大程度上减轻了服务器对海量数据的分析计算所带来的压力。此外,服务器根据依据条件对目标资源数据进行分析计算,可以更加的方便目标对象做出对目标资源数据使用的选择,从而提高了目标资源数据的利用率。

在一个实施例中,如图8所示,步骤S608包括:

步骤S700,基于所述目标项关联关系获取所述目标对象对应的初始资源数据。

其中,初始资源数据指目标对象对应的目标项关联关系所对应的还没有进行其他处理的资源数据。

步骤S702,当所述依据条件是资源转化率时,计算所述初始资源数据中每个初始资源数据的转化率,并基于每个初始资源数据的转化率进行从大到小排序,将排序完成的初始资源数据作为所述目标资源数据。

其中,资源转化率指将资源数据转化为其他方面资源的比率。

步骤S704,当所述依据条件是资源使用频次时,对所述初始资源数据中每个初始资源数据对应的目标项关联关系的置信参数进行从大到小排序,将排序完成的初始资源数据作为所述目标资源数据。

其中,资源使用频次指资源数据使用的次数。

在本实施例中,依据条件的非单一性给目标对象提供了更多的选择,提高了目标对象的用户体验。此外,服务器根据依据条件对初始资源数据进行分析计算,将符合依据条件的目标资源数据推荐给目标对象,方便了目标对象对目标资源对象的选取,节省了目标对象选择的时间,很大程度上提高了资源数据的利用率,从而提高了服务器推送资源数据的效率以及减小了服务器推送资源数据的压力。

在一个实施例中,如图9所示,提供了一种资源数据接收方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

步骤S706,获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的。

步骤S708,展示所述资源数据。

具体地,终端接收由服务器发送来的资源数据,该资源数据展示到终端上。

上述资源数据接收方法、装置、计算机设备和存储介质,通过获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的,展示所述资源数据。通过服务器根据不同资源使用之间的关联关系从服务器获得推送的资源数据,并将资源数据根据依据条件展示到终端,从而有效的提高了资源的利用率,从而也减小了服务器发送资源数据的压力。

在一个实施例中,商家内部关于顾客的数据信息作为资源关联数据,对应的顾客作为对象集合。其中商家内部关于顾客的数据信息包括常规特征以及专项特征与顾客信贷情况高度相关的信息,其中常规特征包括顾客的基本信息、产品持有信息、交易信息和资产负债信息,专项特征与顾客信贷情况高度相关的信息包括借贷频率、借贷金额、分期信息等。本实施例先对资源关联数据进行特征提取的操作,得到资源关联特征,此处的资源关联特征即常规特征以及专项特征与顾客信贷情况高度相关的信息。基于资源关联特征和资源关联数据,通过决策树算法对顾客进行群体类别的分类,最终顾客可分为新兴城镇居民群体、高净值客户群体、学生群体等类别。接着选取出与每类顾客优惠券使用情况相关的数据作为顾客的历史资源数据,然后基于历史资源数据挖掘出历史资源数据之间的关联关系(即项关联关系),根据关联关系对不同的群体发放合理的优惠券组合,并基于关联关系对应的群体为目标对象(即新旧顾客)推荐适合他们选择使用的资源数据(即信贷优惠券),从而减小了他们对于优惠券的选择时间,提高了他们对优惠券的利用率,增加了商家的盈利。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的资源推送数据处理方法的资源推送数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个资源推送数据处理装置实施例中的具体限定可以参见上文中对于资源推送数据处理方法的限定,在此不再赘述。

在一个实施例中,如图10所示,提供了一种资源推送数据处理装置,包括:特征提取模块800、对象分类模块802、目标频繁项集获取模块804、目标项关联关系获取模块806和数据存储模块808,其中:

特征提取模块800,用于获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征。

对象分类模块802,用于基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别。

目标频繁项集获取模块804,用于获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集。

目标项关联关系获取模块806,用于对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果,得到群体类别对应的目标项关联关系。

数据存储模块808,用于存储所述群体类别和对应的目标项关联关系,所述目标项关联关系用于向对应的群体类别推送关联的资源数据。

在一个实例中,对象分类模块802包括:将所述资源关联特征分为训练集和验证集;计算所述训练集中各个资源关联特征对应的信息增益比;选择所述训练集中各个资源关联特征对应的信息增益比最大的资源关联特征作为根节点,基于根节点进行分支操作,生成分支节点;计算每个分支节点中各个资源关联特征对应的信息增益比,选择各个分支节点中信息增益比最大的资源关联特征作为各个分支节点的节点划分特征,基于所述节点划分特征进行分支操作,生成新的分支节点;重复所述计算每个分支节点中各个资源关联特征对应的信息增益比,选择各个分支节点中信息增益比最大的资源关联特征作为各个分支节点的节点划分特征,基于所述节点划分特征进行分支操作,生成新的分支节点,直到每个资源关联特征都有了明确的分类,得到决策树集;通过验证集对所述决策树集进行预测,获得目标决策树,基于目标决策树得到对象集合中各个对象对应的群体类别。

在一个实例中,目标频繁项集获取模块804包括:获取预设发生参数;读取所述历史资源数据,将每个历史资源数据作为一个项,并将每个项作为一个一层候选项集,计算每个一层候选集的历史发生参数;从一层候选项集中筛选出历史发生参数大于或等于预设发生参数的项集作为当前层频繁项集;将所述当前层频繁项集中的各个项集组合生成下一层候选项集,计算每个所述下一层候选项集的历史发生参数,并进行预剪枝操作;筛选预剪枝操作之后的下一层候选项集中历史发生参数大于或等于预设发生参数的项集作为下一层频繁项集;返回所述将所述当前层频繁项集中的各个项集组合生成下一层候选项集,计算每个所述下一层候选项集的历史发生参数,并进行预剪枝操作的步骤,直到无法筛选出大于或等于预设发生参数的项集,得到目标频繁项集。

在一个实例中,目标项关联关系获取模块806包括:获取预设置信参数;计算所述项关联关系的置信参数;筛选所述项关联关系的置信参数大于或等于预设置信参数的项关联关系作为所述群体类别对应的目标项关联关系。

在一个实例中,数据存储模块808之后还包括:获取目标对象的资源关联信息,接收目标对象对应的终端展示所述资源数据的依据条件;基于所述目标对象的资源关联信息,进行特征提取得到目标对象的资源关联特征;基于所述目标对象的资源关联特征和资源关联信息,将目标对象进行群体分类,得到目标对象的目标群体类别;基于所述目标对象的目标群体类别,获取目标对象的目标群体类别对应的目标项关联关系;基于所述目标项关联关系和依据条件,获取目标对象所关联的目标资源数据,将所述目标资源数据发送到所述目标对象对应的终端

在一个实施例中,如图11所示,提供了一种资源推送数据处理装置,包括:资源数据获取模块900和资源数据展示模块902,其中:

资源数据获取模块900,用于获取服务器推送的资源数据,所述资源数据是与对象标识对应的群体类别关联的;所述资源数据是服务器通过群体类别与对应的目标项关联关系确定的,所述群体类别对应的目标项关联关系是服务器通过获取对象集合对应的资源关联信息,进行特征提取得到对应资源关联特征,基于所述资源关联特征和资源关联信息,通过决策树将所述对象集合中的各个对象分为对应的群体类别,获取群体类别对应的历史资源数据,基于历史资源数据生成多个不同层次的候选项集,基于预设发生参数和每种不同层次的候选项集的历史发生参数的对比结果,对候选项集进行筛选得到群体类别对应的目标频繁项集,对群体类别对应的目标频繁项集所对应的每个非空真子集进行排列组合形成对应的项关联关系,基于项关联关系对应的置信参数和预设置信参数的对比结果得到的;

资源数据展示模块902,用于展示所述资源数据。

上述资源推送数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储资源数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种资源推送数据处理方法。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种资源推送数据处理方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图12和图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 虚拟资源数据处理方法、装置、计算机设备及存储介质
  • 产品数据推送方法、装置、计算机设备和存储介质
  • 产品数据推送方法、装置、计算机设备及存储介质
  • 数据推送方法、装置、计算机设备和可读存储介质
  • 数据处理方法、装置、计算机设备及计算机可读存储介质
  • 地点资源数据推送方法、装置、计算机设备和存储介质
  • 资源数据处理方法、装置、计算机可读存储介质和计算机设备
技术分类

06120115581927