掌桥专利:专业的专利平台
掌桥专利
首页

融合分类模型建立方法、营销转化率增益预测方法及系统

文献发布时间:2023-06-19 10:06:57


融合分类模型建立方法、营销转化率增益预测方法及系统

技术领域

本文涉及智能营销领域,尤其涉及一种融合分类模型建立方法、营销转化率增益预测方法及系统。

背景技术

在智能营销领域,如何衡量和预测营销活动带来的增量提升(Uplift),从而不把营销预算浪费在“本来就会转化”、“对营销无动于衷”和“营销负反馈”的那部分人身上,是智能营销算法最重要的挑战,急需要构建营销转化率增益预测模型,来提高营销活动的效果。现有的针对营销转化率增益建模的主流方法是,基于传统机器学习方法的差分响应的双模型方法,该方法主要是建立了两个分类模型:

(1)在营销(Treatment Group,记为G=T)样本上构建一个分类模型:P

(2)在对照(Control Group,记为G=C)样本上构建另一个分类模型:P

其中,X为用户的特征,Y为是否转化(即转化结果,转化例如为响应、购买等),P

Δ(X)=P(Y=1|X,G=T)-P(Y=1|X,G=C)=PT(Y=1|X)-P

其中,P(Y=1|X,G=T)表示用户X在营销组中转化的概率,P(Y=1|X,G=C)表示X在对照组中转换的概率,P

现有技术中差分响应的双模型方法存在如下缺点:

(1)差分响应的双模型通过两个模型预测值相减来确定营销转化率增益,两个独立模型分开训练容易产生累积误差,并且增量信号本身就是一个较小的值,对两个模型的准确度要求较高,否则误差容易被放大。另外,因营销活动中的转化率往往很低,正样本(转化成功的样本)比较少,与负样本(未转化的样本)相比,甚至会相差一个数量级以上,这将导致两个独立模型均面临正负样本不平衡的问题。

(2)采用传统机器学习方法,对特征工程要求严格,需要好的特征设计才能提高机器学习系统的性能。因传统机器学习方法往往需要手工做特征工程设计,存在效率低下的问题。而当今线上营销活动的频率高、需求变化快、数据量积累大、数据种类多,手工设计主要依靠设计者的先验知识,很难支持这样的复杂需求,同时也不能利用大数据的优势。另外,手工调参数的方式也存在参数数量十分有限的问题。

发明内容

本文用于解决现有技术中营销转化率增益的确定依赖两个分类模型,因分类模型的误差较大,因此存在预测不准确的问题,进而导致过投放,或少投放,从而引起部分用户体验差的问题。另外,现有分类模型的建立过程依据的正负样本存在不均衡的问题。

为了解决上述技术问题,本文的第一方面提供一种融合分类模型建立方法,包括:

确定营销活动的对照组及营销组中用户对营销活动关联产品的转化结果;

利用平衡样本用的预定转换规则,将所述转化结果转化为转换变量;

将所述对照组及营销组中用户的特征作为输入,用户的转换变量取值概率作为输出,采用深度学习的方法训练得到融合分类模型;

其中,转换变量取值包括第一取值和/或第二取值,第一取值表示所述营销组中用户转化结果为转化或所述对照组中用户转化结果为未转化,第二取值表示所述营销组中用户转化结果为未转化和/或所述对照组中用户转化结果为转化。

本文进一步实施例中,确定营销活动的对照组及营销组中用户对营销活动关联产品的转化结果之前,还包括:

根据营销活动特点,确定用户特征以及营销活动的对照组及营销组;

其中,所述对照组与所述营销组中用户的数量相同且用户的特征分布一致。

本文进一步实施例中,所述平衡样本用的预定转换规则包括利用如下公式表示的规则:

其中,Z表示转换变量,T表示营销组,C表示对照组,Y表示转化结果,G=T表示用户来自营销组,G=C表示用户来自对照组,Y=1表示转化结果为,Y=0表示转化结果为未转化,Z=1表示第一取值,Z=0表示第二取值。

本文进一步实施例中,将所述对照组及营销组中用户的特征作为输入,用户的转换变量取值概率作为输出,采用深度学习的方法训练得到融合分类模型,包括:

建立N层神经网络模型,其中,前N-1层采用ReLU函数,最后一层采用Sigmod激活函数;

初始化所述神经网络模型;

将对照组及营销组中用户的特征作为输入,用户的转换变量取值概率作为输出;

根据所述输入、输出及神经网络模型,构建损失函数;

根据所述损失函数,优化所述神经网络模型;

优化得到的神经网络模型即为所述融合分类模型。

本文的第二方面提供一种营销转化率增益预测方法,包括:

根据待营销活动特点,建立前述任一实施例方法得到的融合分类模型;

根据待分析用户特征及所述融合分类模型,计算得到待分析用户转换变量取值概率;

根据所述待分析用户转换变量取值的概率,计算得到营销转化率增益。

本文进一步实施例中,根据所述待分析用户转换变量取值概率,计算得到营销转化率增益,包括利用如下公式计算营销转化率增益:

Δ(X)=2×P(Z=1|X)-1;或

Δ(X)=1-2×P(Z=0|X);

其中,X表示待分析用户的特征,Z=1表示第一取值,P(Z=1|X)表示待分析用户转换变量为第一取值的概率,P(Z=0|X)表示待分析用户转换变量为第二取值的概率。

本文进一步实施例中,营销转化率增益方法还包括:

判断所述营销转化率增益是否大于0,若所述营销转化率增益大于0,则确定所述待分析用户为营销活动感兴趣用户,向待分析用户提供所述待营销活动。

本文的第三方面,还提供一种融合分类模型建立系统,包括:

分析模块,用于确定营销活动的对照组及营销组中用户对营销活动关联产品的转化结果;

数据转换加工模块,用于利用平衡样本用的预定转换规则,将所述转化结果转化为转换变量;

模型构建与训练模块,用于将所述对照组及营销组中用户的特征作为输入,用户的转换变量取值概率作为输出,采用深度学习的方法训练得到融合分类模型;

其中,转换变量取值包括第一取值和/或第二取值,第一取值表示所述营销组中用户转化结果为转化或所述对照组中用户转化结果为未转化,第二取值表示所述营销组中用户转化结果为未转化和/或所述对照组中用户转化结果为转化。

本文的第四方面,还提供一种营销转化率增益预测系统,包括:

分类模型建立模块,用于根据待营销活动特点,建立前述任一实施例所述的融合分类模型;

模型计算模块,用于根据待分析用户特征及所述融合分类模型,计算得到待分析用户转换变量取值概率;

增益计算模块,用于根据所述待分析用户转换变量取值概率,计算得到营销转化率增益。

本文的第五方面,还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述任一实施例所述的融合分类模型建立方法或营销转化率增益预测方法。

本文的第六方面,还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行计算机程序,所述计算机程序被处理器执行时实现前述任一实施例所述的融合分类模型建立方法或营销转化率增益预测方法。

本文提供的融合分类模型建立方法、营销转化率增益预测方法及系统,通过引入转换变量建立的融合分类模型,能够精确地确定营销转化率增益,进而实现对用户分类,后续只对营销活动感兴趣的用户投放营销活动,从而能够提高营销活动投放效率,减少对营销活动非感兴趣用户的骚扰,提高用户体验。还能够使对照组及营销组数据融合,避免双分类模型带来的误差放大。另外,引入转换变量还可以缓解正样本(营销活动转化的概率)及负样本(营销活动未转化的概率)不平衡的问题。

为让本文的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。

附图说明

为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本文实施例融合分类模型建立方法的第一流程图;

图2示出了本文实施例融合分类模型建立方法的第二流程图;

图3示出了本文实施例融合分类模型训练过程的流程图;

图4示出了本文实施例营销转化率增益预测方法的第一流程图;

图5示出了本文实施例营销转化率增益预测方法的第二流程图;

图6示出了本文实施例营销融合分类模型建立系统的结构图;

图7示出了本文实施例营销转化率增益预测系统的第一结构图;

图8示出了本文实施例营销转化率增益预测系统的第二结构图;

图9示出了本文具体实施例营销活动对象确定过程的流程图;

图10示出了本文实施例计算机设备的结构图。

附图符号说明:

600、数据采集模块;

610、分析模块;

620、数据转换加工模块;

630、模型构建与训练模块;

710、分类模型建立模块;

720、模型计算模块;

730、增益计算模块;

740、判断模块;

1002、计算机设备;

1004、处理器;

1006、存储器;

1008、驱动机构;

1010、输入/输出模块;

1012、输入设备;

1014、输出设备;

1016、呈现设备;

1018、图形用户接口;

1020、网络接口;

1022、通信链路;

1024、通信总线。

具体实施方式

下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。

现有技术中营销转化率增益通过如下公式确定:

Δ(X)=P

其中,Δ(X)表示营销转化率增益,P

P

营销活动的目的是为了在用户群中挑选出最合适的营销对象,对于营销对象,可以分为如下四类:

(1)因为营销活动而转化,该类用户对营销活动敏感,容易受到营销活动积极影响;

(2)转化但和营销活动无关,该类用户为自然转化,与营销活动无关;

(3)不转化并且对营销活动无动于衷;

(4)因营销活动而不转化或反而流失,该类用户容易受到营销活动的负面影响。

上述四类人中,第一类人是营销活动的目标人群,即感兴趣人群,第二、第三类人是营销不起作用的人群,对该类人群进行营销会浪费不必要的成本(unnecessary costs),第四类人是营销会有反作用的人群,对该类人群应当积极避免开展营销活动。

考虑到现有技术存在的上述技术缺陷及识别上述四类人群,本文的一实施例中,如图1所示,提供一种融合分类模型建立方法,包括:

步骤110,确定营销活动的对照组及营销组中用户对营销活动相关产品的转化结果;

步骤120,利用平衡样本用的预定转换规则,将转化结果转化为转换变量,其中,转换变量包括第一取值及第二取值,第一取值表示营销组中用户转化结果为转化或对照组中用户转化结果为未转化,第二取值表示营销组中用户转化结果为未转化和/或对照组中用户转化结果为转化;

步骤130,将对照组及营销组中用户的特征作为输入,对应用户的转换变量取值概率作为输出,采用深度学习的方法训练得到融合分类模型。其中,转换变量取值包括第一取值和/或第二取值,转换变量第一取值的概率与第二取值的概率加和为1。

详细的说,本文所述的营销活动可根据所应用业务场景而定,营销活动具体内容与应用业务场景不同而不同,以银行领域为例,涉及的营销活动例如为保险业务、理财产品推荐、线上线下消费活动等等,本文对营销活动具体为何不做限定。

本文提供的融合分类模型建立方法适用于同类型营销活动,对于不同类型的营销活动,需建立不同的融合分类模型。

上述步骤110中的转化结果可在营销活动对营销组用户提供预定时间段后确定,预定时间段例如为半年、一年等,具体可根据实际情况确定,本文对此不做限定。对照组及营销组中包含的用户根据营销活动特点确定,具体的,对照组用于比较营销活动的营销效果,对照组中用户未接受到营销活动的宣传,营销组用于实际产生营销效果,营销组中的用户有接收到营销活动的宣传。

本文所述的用户对营销活动的转化包括但不限于购买、响应营销活动,具体视营销内容而定,转化结果包括:转化及未转化,其中,具体实施时,可用1表示转化,用0表示未转化。例如,若营销组中的某一用户转化成功(例如购买、响应了营销活动关联的产品),则将该用户的转化结果设置为1,反之,若营销组中的某一用户未转化(例如未购买、未响应营销活动关联的产品),则将该用户的转化结果设置为0。再例如,若对照组中的某一用户在未受到营销的情况下仍转化成功,则将该用户的转化结果设置为1,反之,若对照组中的某一用户在未受到营销的情况下未转化,则将该用户的转化结果设置为0。

本文所述的平衡样本用的预定转换规则,用于平衡转换变量样本的均衡度及将对照组及营销组中的数据组合起来。凡是能够平衡样本用的规则,均可作为本文所述的平衡样本用的预定转换规则,本文对此不作具体限定。

本文建模时使用的用户特征可根据营销活动需求进行设定,以银行领域为例,用户特征包括属性量及统计量,其中,属性量包括但不限于年龄、属性、收入、工作类型等等,统计量包括但不限于历史消费额、历史转账、贷款金额等等,本文对用户特征的具体内容及个数不作限定。

本实施例提供的融合分类模型建立方法可以运行于智能终端及服务器,包括智能手机、平板电脑、台式计算机等,本文对具体实现方式不做限定。智能终端及服务器的配置要求不高,常规双核8GB RAM的配置即可实现。

本实施例通过引入转换变量建立的融合分类模型,能够直接对营销转化率增益进行计算,并能使对照组及营销组数据融合,避免双分类模型带来的误差放大,另外,引入转换变量还可以缓解正样本(营销活动转化的概率)及负样本(营销活动未转化的概率)不平衡的问题。

本文一实施例中,如图2所述,上述步骤110执行之前,还包括:步骤100,根据营销活动特点,确定用户特征以及营销活动的对照组及营销组。其中,对照组与营销组中用户的数量相同且用户的特征分布一致。

具体实施时,可通过分析历史营销活动涉及的用户的特征,建立用户特征与营销活动特点的匹配关系,根据营销活动特征及该匹配关系可快速地确定用户的特征。

营销组及对照组选定时,如果营销组及对照组用户特征分布不一致,则不满足营销策略与用户特征相互独立的假设(P(G|X)=P(G)),因此,营销组及对照组选定时可按照一定比例从所有用户数据中随机选择一定比例的用户组成对照组及用户组,或者营销组与对照组都先经过某个营销策略的筛选。

本实施例能够满足用户特征与营销策略(是否营销)的独立性,提高对照组的对照效果,提升融合分类模型的精度。同时,利用大数据分析确定用户特征,还可以避免复杂特征的设计。

本文一实施例中,为了便于计算及表示,平衡样本用的预定转换规则包括利用如下公式表示的规则:

其中,Z表示转换变量,T表示营销组,C表示对照组,Y表示转化结果,G=T表示用户来自营销组,G=C表示用户来自对照组,Y=1表示转化结果为转化,Y=0表示转化结果为未转化,Z=1表示第一取值,Z=0表示第二取值。

其它实施例中,对于上述转换规则中的具体数值还可由其它数字或字符替代,本文对此不作具体限定。

由上述转换规则可知,因转换变量Z的正样本(Z=1表示正样本)中,包含对照组中用户转化结果为未转化的样本,转换变量Z的负样本(Z=0表示正样本)中,包含营销组中未转化的样本,而未转化的样本往往占大部分,因此,转换变量Z的正负样本相对比较均衡。

依据上述规则,结合概率论可以推导出营销转化率增益的计算公式,具体的,假设干预策略G与用户相互独立,即G独立于用户特征XP(G|X)=P(G),则:

P(Z=1|X)=P(Z=1|X,G=T)×P(G=T)+P(Z=1|X,G=C)×P(G=C)

=P(Y=1|X,G=T)×P(G=T)+P(Y=0|X,G=C)×P(G=C)

=P

其中,P(Z=1|X)表示营销组中用户转化结果为转化及对照组中用户转化结果为未转化的概率,即Z=1的概率。P(Z=1|X,G=T)=P(Y=1|X,G=T)=(Y=1|X)表示营销组中用户转化结果为转化的概率,P(G=T)表示用户属于营销组的概率,P(Z=1|X,G=C)=P(Y=0|X,G=C)=P

通过营销组及对照组的设置可知,一般的营销组和对照组人数设置相等,P(G=T)=P(G=C)=0.5,即一个用户被分在营销组和被分在对照组的概率是相等的。在该假设下,(1)式可以改写为:

P(Z=1|X)=0.5×(P

=0.5×(P

(2)式两侧乘以2,可以推导出:

Δ(X)=P

其中,Δ(X)表示营销转化率增益,P(Z=1|X)表示营销组中用户转化结果为转化及对照组中用户转化结果为未转化的概率。

由(3)式可知,仅需要知道一个变量Z=1的概率,即直接对Z建模(相当于优化P(Z=1|X)),就能实现营销转化率增益的计算,而不用分别对营销组P

本文通过增加一个转换变量的方法,就能直接将营销组和对照组的用户数据合并来训练,使用一个模型建模,实现了数据层面和模型层面的打通。

本文一实施例中,为了便于线上部署及一步计算,可将融合分类模型与(3)式计算结果组合到一起组成营销转化率增益模型,将营销转化率增益模型作为一个整体进行线上部署。

为了验证营销转化率增益模型的效果,进一步实施例中,采用常规AUC(AreaUnder the Curve,ROC曲线下的面积)指标来评估营销转化率增益模型,若AUC结果不理想,可以返回步骤120调整平衡样本用的预定转换规则,直至AUC结果理想(例如达到设定值)为止。以如下平衡样本用的预定转换规则为例进行检验,测试集的AUC可达到0.72,该结果表明平衡样本用的预定转换规则选取恰当,营销转化率增益模型具有较高的准确性。

其中,Z表示转换变量,T表示营销组,C表示对照组,Y表示转化结果,G=T表示用户来自营销组,G=C表示用户来自对照组,Y=1表示转化,Y=0表示未转化,Z=1表示营销组中用户转化结果为转化及对照组中用户转化结果为未转化,Z=0表示营销组中用户转化结果为未转化和/或对照组中用户转化结果为转化。

本文一实施例中,如图3所述,上述步骤130将对照组及营销组中用户的特征作为输入,用户的转换变量取值概率作为输出,采用深度学习的方法训练得到融合分类模型,包括:

步骤310,建立N层神经网络模型,其中,前N-1层采用ReLU函数,最后一层采用Sigmod激活函数;

步骤320,初始化神经网络模型;

步骤330,将对照组及营销组中用户的特征作为输入,转换变量取值概率作为输出;

步骤340,根据输入、输出及神经网络模型,构建损失函数(Sigmoid crossentropy);

步骤350,根据损失函数,优化神经网络模型;

步骤360,优化得到的神经网络模型即为融合分类模型。

一具体实施方式中,经过调优,上述步骤310中建立的神经网络模型最终选择4层神经网络,前3层采用RuLU函数(Rectified Linear Unit,线性整流函数)。其它实施方式中,可根据需求设定神经网络模型的层数,本文对此不作限定。本实施例通过设置前N-3层为RuLU函数能够简化建模过程的计算,提高建模的计算速度,防止梯度消失,使网络具有稀疏性,减少过拟合。通过将最后一层设置为Sigmod激活函数能够便于求解,保证数据幅度。

一具体实施方式中,上述步骤320采用Kaiming均匀分布初始化神经网络模型。

一具体实施方式中,上述步骤330中,转换变量取值概率包括P(Z=1|X)和/或P(Z=0|X),其中,P(Z=1|X)表示营销组中用户转化结果为转化及对照组中用户转化结果为未转化的概率,P(Z=0|X)表示营销组中用户转化结果为未转化和/或对照组中用户转化结果为转化的概率。用户的特征可根据营销活动特点而定,同类型的营销活动的用户特征可以相同,本文对此不作限定。

上述步骤340中的损失函数例如为二分类交叉熵损失函数。本实施例通过将损失函数设置为二分类交叉熵损失函数,能够便于求导,提高数据求取速度。具体实施时,上述步骤340中,还可以选用其它类型的损失函数,本文对此不作限定。

一些实施方式中,上述步骤350可选用Adam(Adaptive moment estimation,自适应矩估计)优化器对神经网络模型进行优化,该优化方法能够加快高维度数据的拟合,不需要设置步长的衰减,得到的参数值比较稳定。其它实施方式中,还可选用随机梯度下降法SGD等算法,本文对此不作具体限定。

最终优化后的神经网络模型即为融合分类模型,该融合分类模型根据用户的特征,能够计算出转换变量取值的概率。根据转换变量取值的概率,结合上述(3)式,可以快速求得营销转化率增益。

本实施例具体实施时,可将步骤120分析得到的数据(包括用户特征及转化变量)划分为三份:训练集、验证集及测试集。例如训练集占60%,验证集占20%,测试集占20%。实施时,训练集、验证集及测试集还可以为其它占比,本文对此不作限定。

本文一实施例中,还提供一种营销转化率增益预测方法,如图4所述,包括:

步骤410,根据待营销活动特点,建立前述任一实施例所述融合分类模型建立方法建立的融合分类模型;

步骤420,根据待分析用户特征及融合分类模型,计算得到待分析用户转换变量取值概率;

步骤430,根据待分析用户转换变量取值的概率,计算营销转化率增益。

详细的说,步骤410建立融合分类模型的过程参见前述实施例,此处不再详述。

上述步骤420中,将待分析用户特征输入至融合分类模型中,融合分类模型会输出待分析用户转换变量取值概率。一实施方式中,若转换变量Z的取值为1及0,则转换变量取值概率为P(Z=1|X)及P(Z=0|X)。

本实施例能够精确地、高效地计算出营销转化率增益,为后续客户分类及确定营销活动对象提供基础。

本文一实施例中,上述步骤430中根据待分析用户转换变量取值的概率,计算营销转化率增益,包括利用如下公式计算营销转化率增益:

Δ(X)=2×P(Z=1|X)-1;

其中,X表示待分析用户的特征,Z=1表示第一取值,P(Z=1|X)表示待分析用户转换变量为第一取值的概率。

其它实施例中,还可对上述公式做如下变形:

Δ(X)=2×(1-P(Z=0|X))-1=1-2×P(Z=0|X);

其中,P(Z=0|X)表示待分析用户转换变量为第二取值的概率。通过P(Z=0|X)同样也可以计算得到营销转化率增益。

计算营销转化率增益的进一步目的是为了确定待分析用户的类型,是否向待分析用户开展营销活动,因此,本文一实施例中,如图5所述,除了包括上述步骤410至步骤430外,还包括:

步骤440,判断营销转化率增益是否大于0,若营销转化率增益大于0,则确定待分析用户为营销活动感兴趣用户,即待分析用户属于因为营销活动而转化的可能性较大,则向待分析用户提供待营销活动。

向用户提供待营销活动的方式例如为投放广告、发送短信等,本文对提供待营销活动的具体方式不做具体限定。

本实施例能够精确地确定营销活动感兴趣的受众人群,仅向转化可能性较大的用户提供待营销活动,能够提高营销活动的转化率,同时不对反感营销活动的用户造成干扰,提高用户体验。

基于同一发明构思,本文还提供一种融合分类模型建立系统及营销转化率增益预测系统,如下面的实施例所述。由于融合分类模型建立系统及营销转化率增益预测系统解决问题的原理与融合分类模型建立方法及营销转化率增益预测方法相似,因此融合分类模型建立系统及营销转化率增益预测系统的实施可以参见融合分类模型建立方法及营销转化率增益预测方法,重复之处不再赘述。

融合分类模型建立系统及营销转化率增益预测系统包括多个功能模块,均可以由专用或者通用芯片实现,还可以通过软件程序实现,本文对此不作限定。

具体的,如图6所示,营销融合分类模型建立系统,包括:

数据采集模块600,根据营销活动特点,确定用户特征以及选定营销活动的对照组及营销组,以使所述对照组与所述营销组中用户的数量相同且用户的特征分布一致

分析模块610,用于确定营销活动开展预定时间段后对照组及营销组中用户对营销活动的转化结果;

数据转换加工模块620,用于利用平衡样本用的预定转换规则,将所述转化结果转化为转换变量;

模型构建与训练模块630,用于将所述对照组及营销组中用户的特征作为输入,对应用户的转换变量取值概率作为输出,采用深度学习的方法训练得到融合分类模型;

其中,转换变量包括第一取值及第二取值,第一取值表示营销组中用户转化结果为转化或对照组中用户转化结果为未转化,第二取值表示营销组中用户转化结果为未转化和/或对照组中用户转化结果为转化。

一些具体实施方式中,数据转换加工模块620利用如下所示的平衡样本用的预定转换规则转换用户的转化结果:

其中,Z表示转换变量,T表示营销组,C表示对照组,Y表示转化结果,G=T表示用户来自营销组,G=C表示用户来自对照组,Y=1表示转化结果为转化,Y=0表示转化结果为未转化,Z=1表示营销组中用户转化结果为转化及所述对照组中用户转化结果为未转化,Z=0表示营销组中用户转化结果为未转化和/或所述对照组中用户转化结果为转化。

一些具体实施方式中,模型构建与训练模块630采用深度学习的方法训练得到融合分类模型的过程包括:建立N层神经网络模型,其中,前N-1层采用ReLU函数,最后一层采用Sigmod激活函数;初始化神经网络模型;将对照组及营销组中用户的特征作为输入,转换变量取值概率作为输出;根据输入、输出及神经网络模型,构建二分类交叉熵损失函数;根据二分类交叉熵损失函数,优化神经网络模型;优化得到的神经网络模型即为融合分类模型。

本实施例营销融合分类模型建立系统通过引入转换变量建立的融合分类模型,能够直接对用户营销转化率增益进行计算,并能使对照组及营销组数据融合,避免双分类模型带来的误差放大,另外,引入转换变量还可以缓解正样本(营销活动转化的概率)及负样本(营销活动未转化的概率)不平衡的问题。

如图7所示,营销转化率增益预测系统包括:

分类模型建立模块710,用于根据待营销活动特点,利用前述任一实施例所述的融合分类模型建立方法建立融合分类模型;

模型计算模块720,用于根据待分析用户特征及融合分类模型,计算得到待分析用户转换变量取值概率;

增益计算模块730,用于根据待分析用户转换变量取值的概率,计算营销转化率增益。

一具体实施方式中,增益计算模块730可利用如下公式计算营销转化率增益:

Δ(X)=2×P(Z=1|X)-1;或

Δ(X)=1-2×P(Z=0|X);

其中,X表示待分析用户,Z=1表示对照组中用户转化结果为接受营销产品及对照组中用户转化结果为不接受营销产品,P(Z=1|X)表示待分析用户转换变量为1的概率,P(Z=0|X)表示待分析用户转换变量为第二取值的概率。

本实施例能够精确地、高效地计算出营销转化率增益,为后续客户分类及确定营销活动对象提供基础。

进一步实施例中,如图8所示,营销转化率增益预测系统包括:还包括:

判断模块740,用于判断营销转化率增益是否大于0,若营销转化率增益大于0,则确定所述待分析用户为营销活动感兴趣用户,即认为待分析用户属于因为营销活动而转化的可能性较大,则向待分析用户提供待营销活动。

本实施例能够精确地确定营销活动的感兴趣的受众人群,仅向转化可能性较大的用户提供待营销活动,能够提高营销活动的转化率,同时不对反感营销活动的用户造成干扰,提高用户体验。

本文一具体实施例中,如图9所示,图9示出了本文具体实施例营销活动对象确定过程的流程图,具体的,营销活动对象确定过程包括:

步骤910,根据待营销活动特点,建立融合分类模型,具体的,融合分类模型建立过程包括:

(1)根据待营销活动特点,确定用户特征以及对照组及营销组,以使对照组与营销组中用户的数量相同且用户的特征分布一致;

(2)确定待营销活动的对照组及营销组中用户对营销活动的转化结果Y,其中,Y=1表示转化,Y=0表示不转化;

本步骤实施时,可通过待营销活动对营销组试营销一段时间后确定,还可以根据对照组及营销组中用户历史数据确定;

(3)利用如下规则,对转化结果进行转换,得到转换变量:

其中,Z表示转换变量,T表示营销组,C表示对照组,G=T表示用户来自营销组,G=C表示用户来自对照组,Y=1表示转化,Y=0表示未转化,Z=1表示所述营销组中用户转化结果为转化及所述对照组中用户转化结果为未转化,Z=0表示表示所述营销组中用户转化结果为未转化和/或所述对照组中用户转化结果为转化;

(4)将对照组及营销组中用户的特征作为输入,对应用户的转换变量Z=1的概率作为输出,采用深度学习的方法训练得到融合分类模型,训练过程参见前述实施例,此处不再详述;

步骤920,获取待分析用户数据,将每一待分析用户特征输入至融合分类模型中,计算得到待分析用户对应的转换变量Z=1的概率;

步骤930,根据各待分析用户对应的转换变量Z=1的概率,利用如下公式计算各待分析用户的营销转化率增益:

Δ(X)=2×P(Z=1|X)-1;

其中,X表示待分析用户,Z=1表示所述对照组中用户转化结果为接受营销产品及所述对照组中用户转化结果为不接受营销产品,P(Z=1|X)表示待分析用户转换变量为1的概率;

步骤940,判断各待分析用户的营销转化率增益Δ(X)是否大于0,若待分析用户的营销转化率增益大于0,则将该待分析用户划分为营销对象,若待分析用户的营销转化率增益小于0,则不对该待分析用户提供待营销活动,若待分析用户的营销转化率增益等于0,则可以向该用户提供待营销活动,也可以不向该用户提供待营销活动;

步骤950,对营销对象集合中的用户提供待营销活动。

本实施例能够实现如下技术效果:

(1)引入转换变量将问题转化为直接对营销分类建模的单模型,避免双模型差分带来的放大误差;

(2)利用深度学习方法建立融合分类模型,具有更强大的学习能力和高效的特征表达能力,可以针对新的应用从训练数据中很快学习到新的有效的特征表示;

在深度神经网络的方法上,特征表示和分类器联合优化,可以更大程度地发挥优化效果;

(3)通过引入转换变量,根据转换变量Z与转化结果Y的转换规则可知,Z的正负样本(Z=1为正,Z=0为负)比例十分接近,有效的避免了机器学习中样本不平衡的问题。

本文一实施例中,如图10所示,还提供一种计算机设备,计算机设备1002可以包括一个或多个处理器1004,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备1002还可以包括任何存储器1006,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储器1006可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备1002的固定或可移除部件。在一种情况下,当处理器1004执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备1002可以执行相关联指令的任一操作。计算机设备1002还包括用于与任何存储器交互的一个或多个驱动机构1008,诸如硬盘驱动机构、光盘驱动机构等。

计算机设备1002还可以包括输入/输出模块1010(I/O),其用于接收各种输入(经由输入设备1012)和用于提供各种输出(经由输出设备1014))。一个具体输出机构可以包括呈现设备1016和相关联的图形用户接口1018(GUI)。在其他实施例中,还可以不包括输入/输出模块1010(I/O)、输入设备1012以及输出设备1014,仅作为网络中的一台计算机设备。计算机设备1002还可以包括一个或多个网络接口1020,其用于经由一个或多个通信链路1022与其他设备交换数据。一个或多个通信总线1024将上文所描述的部件耦合在一起。

通信链路1022可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路1022可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。

本文一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前述任一实施例所述的融合分类模型建立方法或营销转化率增益预测方法。

本文一实施例中,还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行前述任一实施例所述的融合分类模型建立方法或营销转化率增益预测方法。

应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。

还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。

另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。

相关技术
  • 融合分类模型建立方法、营销转化率增益预测方法及系统
  • 一种基于多分类器融合模型的网络关系类型预测方法
技术分类

06120112422102