掌桥专利:专业的专利平台
掌桥专利
首页

一种融合滑窗相似图的运营商用户流失预测方法

文献发布时间:2023-06-19 19:28:50


一种融合滑窗相似图的运营商用户流失预测方法

技术领域

本发明涉及用户流失分类预测领域,尤其涉及一种融合滑窗相似图的运营商用户流失预测方法。

背景技术

伴随着运营商市场的成熟及人口红利的消失,运营商的新用户增长速度放缓,市场由增量转变为增量存量共同发展的模式,在此背景下维护好现有的客户,降低用户流失率凸显的尤为重要。

传统的用户流失预测方法特征单一且缺乏多视角的表征特征,缺少对用户行为、行为语义等信息抽取能力;另一方面,从模型角度分析,传统算法训练的流失预测模型缺乏深层特征表征能力,且多数特征依赖人工构造等,特征表达不够深层、全面。

本次具体涉及一种融合滑窗相似图的运营商用户流失预测方法,通过所训练的算法模型为用户行为数据赋能,以便运营人员针对不同的流失原因采取对应的挽回策略。

发明内容

本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种融合滑窗相似图的运营商用户流失预测方法。

为了实现上述目的,本发明采用了如下技术方案:

一种融合滑窗相似图的运营商用户流失预测方法,该流失预测方法具体步骤如下:

(1)预处理待输入的运营商用户数据以构成初始特征矩阵;

(2)定义或引入相关参数并构造不同行为特征的相似图矩阵;

(3)引入模拟退火法进行定义域内超参数的寻优;

(4)输入待训练特征矩阵并构建多视角融合特征;

(5)构建流失预测模型以预测运营商用户流失。

作为本发明的进一步方案,步骤(1)中所述运营商用户数据预处理具体步骤如下:

步骤一:定义用户行为特征及类别特征,并根据特征合理性对行为特征及类别型特征的零值、缺失值、未知值、异常值进行处理;

步骤二:对类别特征进行实体嵌入,再将类别特征映射到欧几里得空间,并优化实体嵌入过程的超参数以构成初始特征矩阵。

作为本发明的进一步方案,步骤(2)中所述相关参数具体包括滑动窗口步长F,top-k算法的k值、窗口初始大小W及(F,W)相关定义域以及引入的初始随机因子。

作为本发明的进一步方案,步骤(2)中所述相似图矩阵具体构建步骤如下:

步骤Ⅰ:计算定义的用户行为特征的欧氏距离,并通过计算出的欧式距离寻找其top-k的最近邻节点构建行为相似图以表征用户相似行为信息,并抽取相似用户的共性行为,最后将图信息作为特征直接引入;

步骤Ⅱ:利用滑窗来构造不同行为特征的相似图矩阵,之后窗口向初始特征矩阵的特征维度方向移动,特征维度跟随滑窗移动而降低,以保证生成的F张相似图所使用特征的多样性,每次移动均生成用户行为相似图,移动N次构造N维滑窗下的相似图特征矩阵,横向堆叠至原始特征矩阵。

作为本发明的进一步方案,步骤(4)中所述多视角融合特征具体构建步骤如下:

步骤①:将初始行为特征输入多尺度堆叠池化层,映射成隐式多尺度的特征并堆叠,再将行为相似图进行横向堆叠,之后融合M阶高低阶显示特征;

步骤②:将构造的所有特征映射到一维向量,输入到全连接层进行特征融合,最后输出融合后的融合特征。

作为本发明的进一步方案,步骤(5)中所述融合网络具体预测步骤如下:

第一步:将类别特征的embending部分进行向量拼接以获得初始特征的输入向量,并输入到特征构造模块,该模块通过MSSP、DCN两个模块构建特征,之后使用logloss作为模型的损失函数计算输出值与目标值之间的误差,并使用Adam算法作为模型的优化器进行权重更新;

第二步:当评价指标logloss值不在发生剧烈变化时或训练次数达到最大迭代次数上限N时,输出训练好的模型文件,调用训练好的流失预测模型,将MSSP、DCN两个模块所输出的特征通过特征映射层融合到同一维度,输入测试数据至模型,计算得到运营商用户流失预测的结果,根据预测结果评估模型性能。

相比于现有技术,本发明的有益效果在于:

该融合滑窗相似图的运营商用户流失预测方法首先将原始类别特征进行实体嵌入,以弱化稀疏数据下构造的滑窗特征对模型精确度的影响;然后定义滑动窗口参数及相似图等参数,继而移动窗口生成n组对应窗口下的用户行为相似图特征矩阵,并横向堆叠至初始特征;接着又构造了一种自动探索运营商用户显式深层特征的神经网络,通过多尺度、显示高低阶特征交叉保证特征表达的多样及全面性,可在付出极小参数代价的条件下,加快模型收敛速度,提高模型的可拓展性,并提高模型的准确率。同时,模型的时间复杂度较低,特征抽取能力更强大,保证了模型在用户流失预测场景下具有可执行性。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。

图1为本发明提出的一种融合滑窗相似图的运营商用户流失预测方法的流程框图;

图2为本发明提出的一种融合滑窗相似图的运营商用户流失预测方法的滑窗相似图特征矩阵示意图;

图3为本发明提出的一种融合滑窗相似图的运营商用户流失预测方法的预测算法流程图。

具体实施方式

参照图1-3,一种融合滑窗相似图的运营商用户流失预测方法,该流失预测方法具体步骤如下:

预处理待输入的运营商用户数据以构成初始特征矩阵。

具体的,定义用户行为特征及类别特征,并根据特征合理性对行为特征及类别型特征的零值、缺失值、未知值、异常值进行处理,对类别特征进行实体嵌入,再将类别特征映射到欧几里得空间,并优化实体嵌入过程的超参数以构成初始特征矩阵。

定义或引入相关参数并构造不同行为特征的相似图矩阵。

具体的,计算定义的用户行为特征的欧氏距离,并通过计算出的欧式距离寻找其top-k的最近邻节点构建行为相似图以表征用户相似行为信息,并抽取相似用户的共性行为,最后将图信息作为特征直接引入,利用滑窗来构造不同行为特征的相似图矩阵,之后窗口向初始特征矩阵的特征维度方向移动,特征维度跟随滑窗移动而降低,以保证生成的F张相似图所使用特征的多样性,每次移动均生成用户行为相似图,移动N次构造N维滑窗下的相似图特征矩阵,横向堆叠至原始特征矩阵。

需要进一步说明的是,相关参数具体包括滑动窗口步长F,top-k算法的k值、窗口初始大小W及(F,W)相关定义域以及引入的初始随机因子。

引入模拟退火法进行定义域内超参数的寻优。

输入待训练特征矩阵并构建多视角融合特征。

具体的,将初始行为特征输入多尺度堆叠池化层,映射成隐式多尺度的特征并堆叠,再将行为相似图进行横向堆叠,之后融合M阶高低阶显示特征,将构造的所有特征映射到一维向量,输入到全连接层进行特征融合,最后输出融合后的融合特征。

构建流失预测模型以预测运营商用户流失。

具体的,将类别特征的embending部分进行向量拼接以获得初始特征的输入向量,并输入到特征构造模块,该模块通过MSSP、DCN两个模块构建特征,之后使用logloss作为模型的损失函数计算输出值与目标值之间的误差,并使用Adam算法作为模型的优化器进行权重更新,当评价指标logloss值不在发生剧烈变化时或训练次数达到最大迭代次数上限N时,输出训练好的模型文件,调用训练好的流失预测模型,将MSSP、DCN两个模块所输出的特征通过特征映射层融合到同一维度,输入测试数据至模型,计算得到运营商用户流失预测的结果,根据预测结果评估模型性能。

需要进一步说明的是,Adam优化器使用β

此外,需要进一步说明的是,通过Multi-Scale-Stacking Pooling(MSSP)、DCN(Deep&Cross Network)对输入数据进行处理,以构建用户多方位的高阶特征;MSSP模块能够在不同视觉下构造多个观测器从深度、宽度两个角度双向生成融合多尺度特征,具备挖掘不同局部视觉中的高阶和低阶特征的能力;DCN组件则考虑了用户显式高低阶特征的作用,保证了提取特征的充分性。

技术分类

06120115919118