掌桥专利:专业的专利平台
掌桥专利
首页

一种用户价值的确定方法及系统

文献发布时间:2023-06-19 11:22:42


一种用户价值的确定方法及系统

技术领域

本发明涉及数据分析技术领域,具体涉及一种用户价值的确定方法及系统。

背景技术

随着互联网的发展,越来越多的用户倾向于通过网络在线课程进行学习,为向用户提供更好的服务,通常需要确定用户的用户价值。

目前确定用户价值的方式为:对用户的用户特征进行分析,进而根据分析结果确定用户的用户价值。但是,用户在使用网络在线课程的过程中会产生多种类型的特征数据,仅对用户特征进行分析而忽略其它类型的特征数据,会导致确定用户价值的准确率较低。

发明内容

有鉴于此,本发明实施例提供一种用户价值的确定方法及系统,以解决现有确定用户价值的方式的准确率较低等问题。

为实现上述目的,本发明实施例提供如下技术方案:

本发明实施例第一方面公开一种用户价值的确定方法,所述方法包括:

获取目标用户的常规特征和电话文本,所述常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,所述电话文本由所述目标用户与指定人员的电话沟通录音确定得到;

对所述常规特征进行预处理得到第一特征向量,以及对所述电话文本进行预处理得到第二特征;

将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,所述用户价值指示所述目标用户购买目标产品的概率,所述价值评估模型根据样本数据训练神经网络模型得到。

优选的,所述将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,包括:

将所述第一特征向量和所述第二特征输入所述价值评估模型;

利用所述价值评估模型中的长短期记忆LSTM层对所述第二特征进行处理,得到第三特征向量;

利用所述价值评估模型的拼接层,将所述第一特征向量和所述第三特征向量进行拼接,得到组合特征向量;

通过所述价值评估模型的中间层,对所述组合特征向量进行处理,得到所述目标用户的用户价值。

优选的,所述对所述常规特征进行预处理得到第一特征向量,包括:

对所述常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。

优选的,所述对所述电话文本进行预处理得到第二特征,包括:

对所述电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果;

利用预设的词向量模型将所述分词结果映射成向量,得到第二特征。

优选的,根据样本数据训练神经网络模型得到所述价值评估模型的过程,包括:

构建神经网络模型;

利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练所述神经网络模型直至所述神经网络模型收敛,得到价值评估模型,所述真实购买结果指示所述样本用户是否购买所述目标产品。

本发明实施例第二方面公开一种用户价值的确定系统,所述系统包括:

获取单元,用于获取目标用户的常规特征和电话文本,所述常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,所述电话文本由所述目标用户与指定人员的电话沟通录音确定得到;

预处理单元,用于对所述常规特征进行预处理得到第一特征向量,以及对所述电话文本进行预处理得到第二特征;

评估单元,用于将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,所述用户价值指示所述目标用户购买目标产品的概率,所述价值评估模型根据样本数据训练神经网络模型得到。

优选的,所述评估单元包括:

输入模块,用于将所述第一特征向量和所述第二特征输入所述价值评估模型;

处理模块,用于利用所述价值评估模型中的长短期记忆LSTM层对所述第二特征进行处理,得到第三特征向量;

拼接模块,用于利用所述价值评估模型的拼接层,将所述第一特征向量和所述第三特征向量进行拼接,得到组合特征向量;

评估模块,用于通过所述价值评估模型的中间层,对所述组合特征向量进行处理,得到所述目标用户的用户价值。

优选的,用于获取第一特征向量的所述预处理单元,具体用于:对所述常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。

优选的,用于获取第二特征的所述预处理单元,具体用于:对所述电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果,利用预设的词向量模型将所述分词结果映射成向量,得到第二特征。

优选的,用于训练得到价值评估模型的所述评估单元,具体用于:构建神经网络模型,利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练所述神经网络模型直至所述神经网络模型收敛,得到价值评估模型,所述真实购买结果指示所述样本用户是否购买所述目标产品。

基于上述本发明实施例提供的一种用户价值的确定方法及系统,该方法为:获取目标用户的常规特征和电话文本;对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征;将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值。在本方案中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种用户价值的确定方法的流程图;

图2为本发明实施例提供的将词映射为向量的示意图;

图3为本发明实施例提供的确定目标用户的用户价值的流程图;

图4为本发明实施例提供的一种用户价值的确定方法的另一流程图;

图5为本发明实施例提供的一种用户价值的确定系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

由背景技术可知,用户在使用网络在线课程的过程中会产生多种类型的特征数据,目前仅对用户特征进行分析而忽略其它类型的特征数据,会导致确定用户价值的准确率较低。

因此,本发明实施例提供一种用户价值的确定方法及系统,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,以提高确定用户价值的准确率。

参见图1,示出了本发明实施例提供的一种用户价值的确定方法的流程图,该确定方法包括:

步骤S101:获取目标用户的常规特征和电话文本。

需要说明的是,目标用户在使用提供网络在线课程(比如少儿英语网络在线课程)的客户端时,通常会产生相应的常规特征,该常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合。

其中,属性特征为目标用户的常规标签,比如:性别、年龄和所在城市。行为特征为目标用户在客户端的行为,比如:是否点击红包和是否浏览活动页面等行为。聚合特征为对前述属性特征和行为特征进行统计得到,比如:目标用户在过程一个月内浏览活动页面的次数,目标用户在前一周点击红包的次数。

可以理解的是,对于提供网络在线课程的在线教育行业而言,除了在客户端为目标用户提供相应的服务之外,还通常会通过电话为目标用户提供相应的服务,比如通过电话推销网络在线课程,又比如通过电话询问网络在线课程的体验情况。

也就是说,目标用户除了在使用客户端的过程中产生相应的常规特征,还会在与指定人员(比如销售人员或售后人员等)的电话沟通过程中产生相应的电话沟通录音,该电话沟通录音也能用于表征用户的某些特征。

故,将目标用户与指定人员的电话沟通录音转换成相应的电话文本。

在具体实现步骤S101的过程中,从客户端中获取目标用户的常规特征,以及获取目标用户与指定人员的电话沟通录音对应的电话文本。

步骤S102:对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征。

需要说明的是,在利用预设的价值评估模型处理目标用户的常规特征和电话文本之前,需对该常规特征和电话文本进行预处理转换成相应的特征向量。

在具体实现步骤S102的过程中,可以理解的是,常规特征中可能存在非法值和异常值,比如:若目标用户的年龄里包含中文字符,该年龄所包含的中文字符为非法值,若目标用户设置的年龄为200岁,则该年龄为异常值。常规特征中的非法值和异常值都需要去除。

故,对常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到

需要说明的是,通过one-hot编码将常规特征中的指定标签转换为对应的一维数组,比如:性别这一标签通常有“男”、“女”和“未知”这三个分类,将性别编码成“性别是否为男”、“性别是否为女”和“性别是否为未知”,若是则其编码为1,若不是则编码为0。

同理,目标用户的电话文本中可能存在异常字符和/或错别字,比如电话文本中存在诸如括号、分号和星号等异常字符,在将电话沟通录音转换为电话文本的过程中,某些专有词汇(比如AI课和试听课等词汇)存在较大的概率会转换错误,故而出现影响电话文本语意的错别字,需要去除电话文本中的异常字符,以及修复电话文本中的错别字。

故,对电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到相应的分词结果,利用预设的词向量模型将分词结果映射成向量,得到第二特征。

可以理解的是,在将分词结果映射成向量的过程中,分词结果中的每个词会被映射成256维(仅举例)的向量,如图2示出的将词映射为向量的示意图(仅用于举例)。

在图2中将“家长你好我是XX”进行分词处理后得到“家长”、“你好”、“我”、“是”和“XX”五个词,利用预先训练好的词典(即词向量模型),查表得到前述五个词的向量表示。

将分词结果映射成向量之后,最终得到

需要说明的是,上述所利用的词向量模型可根据word2vec算法训练得到。

步骤S103:将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值。

需要说明的是,用户价值指示目标用户购买目标产品(比如少儿英语在线网络课程)的概率,价值评估模型根据样本数据训练神经网络模型得到。

训练神经网络模型得到价值评估模型的过程为:

对于某一用户,如果用户购买了目标产品,则该用户的用户价值为1,如果用户没有购买目标产品,则该用户的用户价值为0,前述内容即为一个二分类预测问题,即预测用户是否购买目标产品。

在训练神经网络之前,从数据库中收集样本用户的常规特征、电话文本和真实购买结果,样本用户的真实购买结果即为用户label(只有0和1两种值),真实购买结果指示样本用户是否购买目标产品,1指示样本用户购买目标产品,0指示样本用户没有购买目标产品。

构建神经网络模型,将神经网络模型记为f(x;w),x表示特征,w为该神经网络模型的系数,设置该神经网络模型输出取值范围介于0至1的两个预测值,第一预测值指示用户购买目标产品的概率(即视为用户价值),第二预测值指示用户不购买目标产品的概率,选择如公式(1)示出的交叉熵损失函数。

在公式(1)中,n为样本用户的数量,y表示样本用户的真实购买结果,

利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练神经网络模型,通过随机梯度下降的调整该神经网络模型的系数w使该交叉熵损失函数尽量最小化,直至神经网络模型收敛,得到价值评估模型。

在具体实现步骤S103的过程中,将第一特征向量和第二特征输入价值评估模型中进行价值评估,得到目标用户的用户价值。可以理解的是,由上述内容可知,价值评估模型会输出第一预测值(用户购买目标产品的概率)和第二预测值(用户不购买目标产品的概率),选择第一预测值作为目标用户的用户价值,第一预测值的数值越大,即表示目标用户的用户价值越大。

在本发明实施例中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。

上述本发明实施例图1步骤S103中涉及的利用价值评估模型确定用户价值的过程,参见图3,示出了本发明实施例提供的确定目标用户的用户价值的流程图,包括以下步骤:

步骤S301:将第一特征向量和第二特征输入价值评估模型。

在具体实现步骤S301的过程中,分别将第一特征向量和第二特征输入价值评估模型的输入层中。

步骤S302:利用价值评估模型中的长短期记忆(Long Short-Term Memory,LSTM)层对第二特征进行处理,得到第三特征向量。

在具体实现步骤S302的过程中,将第一特征向量和第二特征输入价值评估模型的输入层之后,利用价值评估模型中的LSTM层将第二特征处理成一个高维的第三特征向量。

步骤S303:利用价值评估模型的拼接层,将第一特征向量和第三特征向量进行拼接,得到组合特征向量。

在具体实现步骤S303的过程中,通过价值评估模型的拼接层,将第一特征向量和第三特征向量进行拼接,得到相应维度的组合特征向量。

比如:假设第一特征向量为2048维的向量,第三特征向量为1024维的向量,则利用拼接层将第一特征向量和第三特征向量进行拼接,得到3072维的组合特征向量。

步骤S304:通过价值评估模型的中间层,对组合特征向量进行处理,得到目标用户的用户价值。

在具体实现步骤S304的过程中,将组合特征向量输入价值评估模型的中间层进行神经网络运算,得到第一预测值和第二预测值,将第一预测值作为目标用户的用户价值。

中间层进行神经网络运算的过程为:假设输入中间层的向量为

为更好解释说明上述本发明实施例图1和图3所涉及的内容,通过图4示出的一种用户价值的确定方法的另一流程图进行举例说明。

在图4中,分别对目标用户的常规特征和电话文本进行预处理,得到第一特征向量和第二特征,常规特征包括:属性特征、行为特征和聚合特征。

通过价值评估模型的第一输入层将第一特征向量输入值价值评估模型的拼接层,通过价值评估模型的第二输入层将第二特征输入价值评估模型的LSTM层,利用LSTM层对该第二特征进行处理得到第三特征向量,并将第三特征向量输入价值评估模型的拼接层。

利用价值评估模型的拼接层将第一特征向量和第三特征向量拼接成组合特征向量,将该组合特征向量输入价值评估模型的中间层进行神经网络运算,得到第一预测值和第二预测值,并通过价值评估模型的输出层输出该第一预测值和第二预测值,将第一预测值作为目标用户的用户价值。

在本发明实施例中,将第一特征向量和第二特征输入价值评估模型,利用LSTM层对第二特征进行处理得到第三特征向量,再利用拼接层组合第一特征向量和第三特征向量得到组合特征向量,最后利用中间层对组合特征向量进行神经网络运算得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。

与上述本发明实施例提供的一种用户价值的确定方法相对应,参见图5,本发明实施例还提供了一种用户价值的确定系统的结构框图,该确定系统包括:获取单元501、预处理单元502和评估单元503;

获取单元501,用于获取目标用户的常规特征和电话文本,常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,电话文本由目标用户与指定人员的电话沟通录音确定得到。

预处理单元502,用于对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征。

在具体实现中,用于获取第一特征向量的预处理单元502,具体用于:对常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。

在具体实现中,用于获取第二特征的预处理单元502,具体用于:对电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果,利用预设的词向量模型将分词结果映射成向量,得到第二特征。

评估单元503,用于将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值,用户价值指示目标用户购买目标产品的概率,价值评估模型根据样本数据训练神经网络模型得到。

在具体实现中,用于训练得到价值评估模型的评估单元503,具体用于:构建神经网络模型,利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练神经网络模型直至神经网络模型收敛,得到价值评估模型,真实购买结果指示样本用户是否购买所述目标产品。

在本发明实施例中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。

优选的,结合图5示出的内容,评估单元503包括输入模块、处理模块、拼接模块和评估模块,各个模块的执行原理如下:

输入模块,用于将第一特征向量和第二特征输入价值评估模型。

处理模块,用于利用价值评估模型中的LSTM层对第二特征进行处理,得到第三特征向量。

拼接模块,用于利用价值评估模型的拼接层,将第一特征向量和第三特征向量进行拼接,得到组合特征向量。

评估模块,用于通过价值评估模型的中间层,对组合特征向量进行处理,得到目标用户的用户价值。

在本发明实施例中,将第一特征向量和第二特征输入价值评估模型,利用LSTM层对第二特征进行处理得到第三特征向量,再利用拼接层组合第一特征向量和第三特征向量得到组合特征向量,最后利用中间层对组合特征向量进行神经网络运算得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。

综上所述,本发明实施例提供一种用户价值的确定方法及系统,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种用户价值的确定方法及系统
  • 一种基于缴费行为的电力用户价值分析方法及系统
技术分类

06120112899353