掌桥专利:专业的专利平台
掌桥专利
首页

联邦BN在留存用户多层归因行为特征中的识别与应用

文献发布时间:2024-04-18 19:59:31


联邦BN在留存用户多层归因行为特征中的识别与应用

技术领域

本发明涉及联邦BN,具体地,涉及联邦BN在留存用户多层归因行为特征中的识别与应用。

背景技术

这几年在航空领域应用了大量的人工智能技术,而人工智能技术的应用是基于数据的采集、处理和计算,所以对数据的采集有相当大的依赖。目前数据的采集和处理有以下两个角度的问题:

1)、数据孤岛问题:

大多数企业受制于有限的数据规模和良莠不齐的业务运营所产生的经营数据;此外,行业竞争、以及隐私保护等问题,也会导致不同系统之间数据难以共享、融合等问题的出现;而让这些数据割裂开来。

2)、隐私保护问题:

随着各种新型网络应用的不断涌现,如何合理收集和应用对应的用户数据,安全地进行传输、存储、处理,已经变得越来越重要。用户资料一旦泄露,将会引发社会的强烈谴责,甚至会引发严重的信任危机,甚至对也要负上相应的法律责任。

由于上面提到的数据孤岛和隐私保护是广泛存在的,而这两者之间的相互制衡正是对数据的广泛收集、共享、进一步应用及AI技术发展更是形成了各种制约。

同时,对于运营来说,AI模型的可解释性也至关重要。如果模型的支持和决策过程能够被解释和理解,那么可以更好地了解模型背后的决策逻辑,这不仅有利于对模型进行优化和改进;也便于帮助运营人员更好地进行精细化的分析和推测,如:帮助运营人员了解为什么某一个高价值顾客会做出特定的决策或行为,这些原因又是因为哪些因素引发导致,从而从本质上针对性地进行优化和改善,来进一步提升个性化的服务和体验。

发明内容

本发明鉴于上述需求,本发明引入一种在联邦学习应用框架下的可理解模型——联邦贝叶斯网络归因算法,其设计目标是:不仅能在,采用人工智能技术,进行留存用户预测,也能根据归因网络解释用户决策是由哪些原因导致,以及跟踪各个原因是由哪些因素相互影响而导致形成。

本发明提供了联邦BN在识别留存用户多层归因行为特征中的应用,其特征在于:将贝叶斯信任网络融合到横向联邦学习中。

本发明提供的一种留存用户多层归因行为特征的识别方法,将贝叶斯信任网络融合到横向联邦学习中,包含客户端和服务端之间的数据交互,其特征在于,包含如下步骤:

S1.统一和梳理服务端和客户端的数据规范完成维度排序;

S2.根据客户端局部数据源(此处及后部的局部数据源即指客户端的全部数据),训练形成本地贝叶斯信任网络模型(该模型的构建系采用现有的贝叶斯信任网络模型,采用Python3.6中有对应的软件包执行即可),并获得计算模型参数信息;

上述计算模型参数信息,包含网络结构信息;

上述网络结构信息,包含数据集变量间的图矩阵;

S3.各客户端将S2的计算模型参数信息反馈服务端;

S4.服务端根据网络结构信息构建集成后的贝叶斯网络图矩阵BN_G;

S5.将S4的贝叶斯网络图矩阵BN_G传送到各客户端;

S6.各客户端使用贝叶斯网络矩阵BN_G对应的贝叶斯信任网络图对本地局部数据进行网络训练,获得BN_GC的CPT表CPT_GCi、及CPT_Num_GCi,并传送服务端;

S7.服务端根据S6的数据,整合计算后得到CPT_ALL、CPT_Num_ALL,结合S4的贝叶斯网络矩阵BN_G对应的贝叶斯信任网络图,构建横向联邦贝叶斯信任网络模型。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

在S4中,贝叶斯网络矩阵BN_G的获取方法如下:

S4-1.待服务端收到所有客户端的网络结构信息后,按如下方式整合图矩阵:

S4.1.1.图矩阵的集成计算:按公式(1)集成计算图矩阵,得到BN_G_Ini;

其中:1≤p≤N

n:表示Client联邦结点数

Di:第i个联邦结点的局部样本数量,

M

Wi:为第i个Client结点的样本量

N

⊙:表示哈达玛积

S4.1.2.集成图矩阵的处理:设定阈值θ,若W[f1,f2]<θ,则设置W[f1,f2]=0;否则W[f1,f2]=1;

其中:θ>=0的值,f1,f2为矩阵中的某2个节点;

S4.1.3.矩阵中所有元素,均按S4.1.2步骤处理,得到集成后的贝叶斯网络矩阵BN_G。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

上述计算模型参数信息,还包含半压缩特征。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

在S3中,判断数据的保密级别,当密级超过阈值时,不传送半压缩特征。

关于该半压缩特征,在数据敏感程度要求不是那么高时,整合后主要做数据简要观测使用,即、用于形成脱敏用户身份的数据仿真,仿真数据服从于半压缩特征数据分布;

在数据敏感程度要求偏高时,也可不用该压缩特征。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

上述S4的服务端还根据半压缩特征进行集成计算,具体如下:

Feature_1,Num_f1

Feature_2,Numf2

…………

Featurer_f,Num_fr

…………

Feature_g,Num_fg

特征矩阵的集成计算:

每个特征的集成计算公式为:

其中:NUM_FR

Num_fr

Featurer:为{X1,X2,......Xn,Y}的离散化特征数据组合,形成的组合特征,

在服务器端进行整合计算。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

S7中,CPT_GC

其中:P1:留存概率

P0:流失概率

i:第i个联邦结点

f:第f个BN节点

r:CPT表中第r个特征。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

上述S1的维度排序的具体方法包含:

S1-1.服务端、客户端保持一致的维度顺序、维度名称;

S1-2.服务端、客户端各自形成维度映射表;

S1-3.将各个本地数据源的相同特征,按统一规则离散化。

本发明提供的一种留存用户多层归因行为特征的识别方法,其特征还在于:

还包括如下步骤:

S8.服务端将S7获得的各网络节点对应的CPT_ALL表下发到各客户端;

S9.各客户端使用服务端下发的横向联邦贝叶斯信任网络模型进行预测,并将预测评估指标和本地模型评估指标相比较,若横向联邦贝叶斯信任网络模型优于本地模型,则下次预测选择横向联邦贝叶斯信任网络模型;反之,则下次预测选择本地模型。

此外,本发明还提供了一种用于识别留存用户多层归因行为特征的设备,其特征在于:包含可读写模块;

上述可读写模块,运行基于如上任一的留存用户多层归因行为特征的识别方法制造的软件或程序,或以如上提及的留存用户多层归因行为特征的识别方法中的步骤顺序进行运行。

本发明的作用和效果:

本发明提供了基于用户留存的横向联邦贝叶斯信任网络模型。该模型引入了横向联邦学习思想,将贝叶斯信任网络模型融合进来。通过数据不分享、仅传送模型参数,确保数据安全和隐私保护的方式解决连锁店、或加盟店的子门店向总部的特征同步问题。

以贝叶斯信任网络图为导向,提供丰富化的信息,方便运营人员逐层选择、交互,结合实际情况细化分层,充分发挥运营人员特长,结合客群偏好,有的放矢地设计更吻合于客群偏好倾向的营销活动。

附图说明

图1:联邦网络结构图

图2:某航空购票平台的贝叶斯信任网络因果图

具体实施方式

本发明能够实施多种变更且能够具有各种实施例,因而要在附图中例示各特定实施例并对其进行说明。但这并不是要将本发明限定在特定的实施方式,而应当理解为包括落入本发明的思想以及技术范围的所有变更、等同物乃至替代物。

本次实施例采用包括各大航空公司购票数据的某航空购票平台的购票订单,进行联邦学习模拟,即:将5个区块数据源进行拆分,包括国航、东航、南航、海航等。

通过算法的联邦学习整合,设计形成将贝叶斯信任网络融合到横向联邦学习的实验。

联邦建模实施步骤:

步骤1:维度排序——形成服务端、客户端保持一致的维度顺序、维度名称;并各自形成维度映射表(含维度名称、对应的序号),各个本地数据源的相同特征,作按统一规则离散化。

第一轮集成:

步骤2:总部发出请求,客户端收到总部发出的请求后,根据客户端局部数据源,训练形成本地贝叶斯信任网络模型,并获得如下计算模型参数信息

2.1)网络结构信息:数据集变量间的图矩阵;

2.2)半压缩特征

步骤3:各客户端将根据本地数据源训练得到的如下模型参数信息,反馈给服务器

1)网络结构信息:数据集变量间的图矩阵;

2)若数据保密级别偏高,则不需要向服务器反馈半压缩特征;

若数据保密级别为普通,允许向服务器反馈半压缩特征;

步骤4:服务端集成

服务端在收到所有的Client端模型参数反馈后,按如下方式进行集成计算

4.1)待服务端收到所有客户端的2.1)信息后,按如下方式整合图矩阵

4.1.1)、图矩阵的集成计算:

其中:1≤p≤N

n:表示Client联邦结点数

Di:第i个联邦结点的局部样本数量,

M

Wi为第i个Client结点的样本量

N

⊙:表示哈达玛积

按公式(1)集成计算图矩阵,得到BN_G_Ini

BN_G_Ini:

4.1.2)、集成图矩阵的处理:

设定阈值θ

若W[f1,f2]<θ,则设置W[f1,f2]=0;

否则W[f1,f2]=1

其中:θ>=0的值

f1,f2为矩阵中的某2个节点

设定阈值θ=0.2后,上表中的黑色粗体字部分,W=1,其余为空(零为空)

4.1.3)、得到集成后的贝叶斯网络矩阵BN_G:

矩阵中所有元素,均按上述4.1.2步骤处理,得到集成后的贝叶斯网络矩阵BN_G(见下表),边的方向为行指向列。

BN_G:

4.2)待服务端收到所有客户端的2.2)信息后,按如下方式,服务器端计算整合半压缩特征,若数据保密级别偏高,这一步可以跳过。

半压缩特征集成计算

Feature_1,Num_f1

Feature_2,Numf2

…………

Featurer_f,Num_fr

…………

Feature_g,Num_fg

特征矩阵的集成计算:

每个特征的集成计算公式为:

其中:NUM_FR

Num_fr

Featurer:为{X1,X2,......Xn,Y}的离散化特征数据组合,形成的组合特征

在服务器端进行整合计算

第二轮集成:

步骤5:将服务器端全局图矩阵BN_G,下发到各客户端

步骤6:各Client端根据本地局部数据数据,使用BN_G网络进行网络训练,获得BN_GC的CPT表CPT_GC

步骤7:总部收到所有的CPT_GC

其中:

P1:留存概率

P0:流失概率

i:第i个联邦结点

f:第f个BN特征节点

r:CPT表中第r个成员特征

Num

如下为CPT_GC

……

联邦集成:

步骤4中集成计算而成的网络图矩阵,再结合CPT_ALL,构成横向联邦贝叶斯信任网络模型,

步骤8:总部将步骤7获得的各网络节点对应的CPT_ALL表下发到各Client端

步骤9:各客户端使用服务算下发的全局模型进行预测,并将预测评估指标和本地模型评估指标相比较,若全局模型优于本地模型,则下次预测选择全局模型;反之,则下次预测选择本地模型。

步骤10:模型应用

对于新数据样本,使用训练好的模型进行预测

1)模型预测:

a.将P(X

其中:全概率公式中每项都是以乘积的方式给出,

[1]对于全局预测,该积中的每一项元素,均指向全局CPT_ALL表的对应节点的条件概率表中的匹配元素;

[2]对于局部本地模型预测,该积中的每一项元素,均指向本地BN模型CPT_GC

对于测试数据、或新数据,使用已生成的模型按公式(4)进行匹配、计算,获得留存/流失预测概率,概率偏大的一方为预测结论,归一化后的概率为该结论对应的预测概率。

模型预测仿真模拟效果,见:表1:仿真计算模型评估

模型预测仿真模型评估表中,各样本划分比率如下:

80%为训练样本,20%为预测样本

可见:表1中全局联邦贝叶斯网络模型(模型整合)和全量贝叶斯网络模型(仿真:全量数据),评估结论相似,说明模型联邦整合后的效果未见损耗,而且评估效果略高于全量仿真数据训练得到的模型效果。

2)全局贝叶斯信任网络结构图应用

在本地将形成的贝叶斯信任网络的网络结点名称,根据本地维度映射表,将加密特征名还原成可是识别的真实特征名称后,供营销运营人员使用参考。

营销及应用设计:

贝叶斯信任网络因果图,不仅以网络图的形式梳理特征与目标之间的因果关系,还相对更加清晰地刻画出特征之间的相互影响,以及影响路径——这有助于根据可达的视角,与营销人员一起,围绕关键特征,对营销有帮助的归因特征进行识别和选择,并结合预测结论,有的放矢地开展营销策划。从而达到有助于营销的目的。

客户分群

从图2中,有4个箭头指向是否留存结点,分别表示大致有4个不同类型的客群,归纳如下:

1、机构

1.1)、企业、旅游机构

2、个人用户

2.1)、商务出行

2.2)、个人、家庭出游

2.3)、定期返乡

其中,虚框为大致核心归因的观察特征(细分客群),横线虚线为其父级特征的表现特征。

核心特征解读:企业用户的客户分布在不同区域,会出现同一天订购不同目的地的机票,会出现多航线、多航班特点;旅游机构针对固定旅游线路分批次组团旅游,则会出现单航线、多航班的行为特征;和个人或家庭出行相比对,企业、或旅游机构表现为同一天购票人数偏多、购票总价格偏大,而个人或居家出行的大多数情况集中去往相同目的地,聚焦会倾向选择单线路、单航班。

次核心特征解读:针对个人用户按购买机票的类型,又分为头等舱、商务舱、升级商务舱、经济舱;

应用样例1:企业、旅游机构

细化分层表详见:表2_企业、旅游机构细化分层样例

由表2_企业、旅游机构可知:对于企业、旅行机构特征偏好的用户而言,对于平均回购周期为5天之内的用户,留存用户主要集中在平均提前订购天数在3-15天的细分用户群,这两类行为模式的客群适于长期合作,因为对于短回购周期用户而言,提前订购时间越早,对该平台的熟悉程度相对更容易被淡化,而导致流失。

因此建议的运营策略为:对于企业、旅行机构特征偏好的用户,每购买一次发放下一次使用的优惠券,以便将这部分客群引导到留存的行为模式中。

根据公式:优惠券有效期=Max(最大平均提前订购天数,最大平均回购周期)得,推荐券设置15天有效期。

应用样例2:个人用户:如商务精英出行需求

个人用户大致界定:同一天购票满足单线路、单航班特征

细化分层表详见:表3_个人用户:如商务精英出行需求细化分层样例

对于有商务需求特征的用户,再根据最小间隔天数做更细化的客群细分,对于极易流失的有短期频繁出行需求的细分客群,在上表中灰色背景区域属于高留存行为模式,因此建议通过如下运营策略来提升客群留存率:

1、有(含)每日出行需求的用户

1)、若是单身、无孩子客群,则在购票后,激励其周末出游、和节假日旅、年度旅游、长假返乡;

2)、由于每日出行需求的用户,大多属于工作繁忙型,即使有孩子,也需要假期适当休息,为了客户体验,不推荐其周末出游,反而以推荐合作机构的子女教育类体验礼券作为促销视角,激励其每年少量的寒暑假亲子出游更为合适。

2、有短期间隔出行需求的用户

1)、若是单身、无孩子客群,则在购票后,激励其周末出游、和节假日旅游;

2)、若是有孩子的客群,则在购票后,引导其周末出游、和寒暑假、节假日旅行、或长假返乡。

以上虽然以实施例为中心进行了说明,但这只是例示而已,并不限定本发明,本领域普通技术人员清楚,在不逸出本实施例的本质特性的范围内能够进行以上并未例示的各种变形和应用。例如,实施例中所具体示出的各构成要素能够经变形而实施。而且,与这种变形和应用相关的各种不同点应当解释为包括在所附的权利要求书中所规定的本发明的范围。

技术分类

06120116522595