掌桥专利:专业的专利平台
掌桥专利
首页

用户价值聚类方法、装置、计算机设备和存储介质

文献发布时间:2023-06-19 11:29:13


用户价值聚类方法、装置、计算机设备和存储介质

技术领域

本申请涉及大数据技术领域,特别是涉及一种用户价值聚类方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术的发展,传统的线下业务逐渐转移到线上进行处理,使得线上的数据量变得越来越庞大。对于公司而言,如何对庞大的线上数据进行分析处理得到有效数据变得越来越重要。如公司可以通过对线上数据的分析,将用户划分为不同的级别,进而可以对不同级别的用户执行对应等级的业务活动,提高业务效率。

在传统的方法中,对单个用户分类的过程中,是根据固定的判断规则对单个用户进行判断,并未考虑该用户其他用户数据之间的关系,导致分类不准确。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高用户价值分类准确性的用户价值聚类方法、装置、计算机设备和存储介质。

一种用户价值聚类方法,方法包括:

获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据;

根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标;

确定当前交易指标、预测交易指标以及潜在交易指标的重要度;

根据重要度确定聚类指标;

根据聚类指标对各用户进行聚类,得到多种用户价值类别集。

一种用户价值聚类装置,装置包括:

获取模块,用于获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据;

指标确定模块,用于根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标;

相关度确定模块,用于确定当前交易指标、预测交易指标以及潜在交易指标的重要度;

聚类确定模块;根据重要度确定聚类指标;

聚类模块,用于根据聚类指标对各用户进行聚类,得到多种用户价值类别集。

上述用户价值聚类方法、装置、计算机设备和存储介质,获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据。然后根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标,实现了根据多个用户的用户数据确定多维的交易指标,使得交易指标的确定更加精准。然后确定当前交易指标、预测交易指标以及潜在交易指标的重要度,根据重要度确定聚类指标。根据聚类指标对各用户进行聚类,得到多种用户价值类别集。通过对多个用户数据进行数据分析,根据多个用户的特征确定多维度的交易指标,并根据多维度的交易指标特征进行用户聚类。对用户聚类的过程中综合考虑了多种数据,使得聚类结果更加符合该业务场景中所有用户的特征,从而使得用户聚类更加准确。

一种客服请求处理方法,客服请求处理方法包括:接收客服请求,客服请求携带有客服数据;根据客服数据,通过一种用户价值聚类方法计算得到客服价值类别集;获取与客服价值类别集对应的服务策略;根据服务策略对客服请求进行处理。

一种客服请求处理装置,所示装置包括:

接收模块,用于接收客服请求,客服请求携带有客服数据;

计算模块,用于根据客服数据,通过一种用户价值聚类方法计算得到客服价值类别集;

策略获取模块,用于获取与客服价值类别集对应的服务策略;

处理模块,用于根据服务策略对客服请求进行处理。

一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。

上述客服请求处理方法,根据多个用户数据确定的客服价值类别集,对当前的客服进行类别价值划分,得到当前客服的类别价值,并为对应类别的价值客服分配对应的服务策略,实现了自适应为对不同级别的客服自适应服务的效果。

附图说明

图1为一个实施例中用户价值聚类方法的应用环境图;

图2为一个实施例中用户价值聚类方法的流程示意图;

图3为一个实施例中提供的一种不同聚类数量对应的聚类畸变值变化折线图;

图4为一个实施例中提供的一种不同级别聚类中心的分布示意图;

图5为一个实施例中提供的一种用户价值聚类装置的结构框图;

图6为一个实施例中提供的一种客服请求处理装置的结构框图;

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的用户价值聚类方法,可以应用于如图1所示的应用环境中。其中,终端110通过网络与服务器120进行通信。服务器120获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据;服务器120根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标;确定当前交易指标、预测交易指标以及潜在交易指标的重要度;根据重要度确定聚类指标;根据聚类指标对各用户进行聚类,得到多种用户价值类别集。并将多种用户价值类别集推送至用户终端110,以使得用户终端110可以根据用户类别向用户推送对应类别的服务。其中,终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种用户价值聚类方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤S202,获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据。

其中,用户数据集中包括多个用户对应的用户数据。并且,用户数据可为历史一段时间内对应的数据。用户数据中可包括用户的属性信息、用户的历史交易数据、用户的历史行为信息等。可以理解,用户属性信息可以为用户的姓名、性别以及用户所在的地理位置等。用户的历史交易数据可以为用户在交易过程中产生的交易流水,如用户购买的产品、购买产品的频率、购买产品的价格等。用户的行为信息可以为用户在交易场景中或者在其他非交易场景中的行为,如用户的交易是否成功的行为等。

具体的,服务器从业务系统中爬取多个用户的用户数据,并生成用户数据集。进一步地,服务器还可以对爬取到的用户数据进行清洗处理,如去除用户数据中的错误数据或者不符合标准格式的数据等,以使得用户数据符合后续的数据处理要求,并提高对数据处理的准确度。以及服务器还可以对爬取到的用户数据进行归一化处理,以使得不同维度的数据之间能够进行数据计算。

步骤S204,根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标。

其中,当前交易指标是用户在当前时间段内对应的指标,并且当前交易指标的个数可以为一个或者多个。如当前交易指标可以包括用户对产品的现有购买间隔、现有购买频率、现有连续购买年限、现有保费以及现有利润等。

预测交易指标是未来时间段内对应的指标,并且预测交易指标的个数也可以为一个或者多个。可以理解,预测交易指标是与当前交易指标相对应的指标,在服务器中可以根据当前交易指标预测未来的交易指标。如预测交易指标可以为用户对产品的发展购买间隔、发展购买频率、发展连续购买年限、发展保费以及发展利润等。

具体的,在服务器中可以利用预先训练的指标预测模型得到预测交易指标,或者可以根据预先构建的指标预测公式得到预测交易指标。在此对预测交易指标的获取方式不做限制,只要可以根据历史交易指标得到预测交易指标即可。

潜在交易指标是在服务器中挖掘用户的潜在价值后得到的指标,并且潜在交易指标的个数可以为一个或者多个。可以理解,潜在交易指标可以是在用户的交易数据中未直接体现的数据,但是能够对用户的交易产生影响的数据。如潜在交易指标可以为用户的资产信息,一般用户资产越多对应的用户的交易可能性越大。如资产信息中可包括房产价值、车辆价值、月收入以及保费收入占比等。

具体的,服务器可以根据用户数据中的用户属性信息调取与用户相关的相关数据,根据相关数据确定用户的潜在交易指标。在一个实施例中,相关数据可以是用户在其他业务进程中的交易数据或者行为数据,并且根据相关数据可以对用户的未来行为进行预测,以确定用户的潜在价值。

在本步骤中,根据用户数据集中的多个用户的用户数据确定交易指标,而不是根据单一的用户数据确定用户指标,使得用户指标的获取更加全面,进而使得得到的用户指标更能全方位的表征大部分用户的用户特征,使得用户指标更具有普遍性以及更大的适用性。进而提高后续对用户进行价值聚类的准确性。

步骤S206,确定当前交易指标、预测交易指标以及潜在交易指标的重要度。

重要度用于表示各交易指标对于价值结果的重要程度(影响程度)。具体可以为当前交易指标、预测交易指标以及潜在交易指标分别对于价值结果的重要度。可以理解,交易指标对价值结果的重要度(影响程度)越大代表该交易指标在用户价值聚类过程中的作用越大。

本申请中的三个维度的交易指标,以及三个维度的交易指标中的子交易指标分别为:当前交易指标中的现有购买间隔、现有购买频率、现有连续购买年限、现有保费以及现有利润,以及预测交易指标中的发展购买间隔、发展购买频率、发展连续购买年限、发展保费以及发展利润,以及潜在交易指标中的房产价值、车辆价值、月收入以及保费收入占比。进一步地,服务器还对上述14个子交易指标中,精简存在明显共线性的指标变量,进而提高后续模型的训练速度,并且提升模型的准确性,降低过拟合的可能性。

具体的,服务器从当前交易指标、预测交易指标或者潜在交易指标中提取各子交易指标,然后计算各子交易指标的重要度,并根据重要度对应的数值大小确定聚类指标。在其中一个实施例中,各个子交易指标的重要度可以是预先确定的。具体的,服务器预先获取多个用户分别对应的用户数据,并将用户数据组成的数据集作为训练数据集,然后根据训练数据集确定子交易指标,并获取各用户对应的真实价值级别,分别计算各子交易指标相对于真实价值级别的重要度。进一步地,将各子交易指标与重要度对应存储至数据库。在具体确定用户价值类别集的过程中,可以直接从数据库中获取各子交易指标的重要度,进而根据重要度确定聚类指标,以及根据聚类指标将用户划分为多种用户价值类别集。

具体的,基于业务部门的先验经验,根据每个用户对应的用户数据对每个用户的价值进行人工评分得到用户价值级别y

进一步地,为了提高相关系数计算的精度,还可以在公式(1)中引入惩罚系数λ,具体的,对于每个子交易指标,其相关系数的计算过程如公式(2)所示。

其中,λ为人工设定的惩罚系数,当λ越大,即对高维特征的惩罚力度越大。

具体的,将每个用户的子交易指标带入上述公式(1)或者(2),可以求得各个子交易指标相对于价值结果的参数系数,其中参数系数的数值大小代表子交易指标对价值结果的重要度大小。进一步地,根据各子交易指标与其对应的参数系数(重要度)生成参数系数表并存储至服务器中。在具体计算用户价值时可以从服务器中获取预先存储的参数系数表,并从参数系数表中选取参数系数不为0的子交易指标,作为输入聚类模型k-means模型的聚类指标,或者,也可以选取参数系数大于预设值的子交易指标作为输入聚类模型的聚类指标,在本申请中不做限制。

在本步骤中,根据重要度的数值从当前交易指标、预测交易指标以及潜在交易指标中提取聚类指标,使得聚类指标之间的指标相关度较小,能够代表用户更多的信息,降低了指标之间的冗余。进而利用聚类指标对用户价值进行聚类,提高了用户价值聚类的效率以及准确率。

步骤S208,根据重要度确定聚类指标。

聚类指标是对用户进行价值聚类时对应的指标。可以理解,聚类指标是根据重要度从当前交易指标、预测交易指标以及潜在交易指标中提取到的至少一个的交易指标。并且不同的聚类指标之间指标相关度较小,不同的聚类指标能够在不同的方面表达用户信息。

步骤S210,根据聚类指标对各用户进行聚类,得到多种用户价值类别集。

用户价值类别集中包括多个级别的用户集。具体的,在服务器中根据每个用户的用户数据对每一个用户进行级别划分,并将不同级别的用户划分至不同的价值类别中,形成包括多个用户级别对应的用户价值类别集。

具体的,服务器根据每个用户对应的用户数据,从用户数据中提取各用户对应的聚类指标,根据各用户的聚类指标对用户进行聚类,得到每个用户的用户价值级别。并将从属于同一个用户价值级别的用户划分至同一个用户价值类别,进而根据多个用户价值类别形成用户价值类别集。

在本步骤中,对单个用户进行聚类的过程中,是利用根据用户数据集确定的聚类指标对单个用户进行聚类,在对用户聚类的过程中考虑了不同用户数据之间的相关性以及区别性,进而使得对用户聚类的准确度更高。

上述实施例中,获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据。然后根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标,通过根据多个用户的用户数据确定多维的交易指标,使得交易指标的确定更加精准。然后确定当前交易指标、预测交易指标以及潜在交易指标的重要度,根据重要度确定聚类指标。根据聚类指标对各用户进行聚类,得到多种用户价值类别集。通过对多个用户数据进行数据分析,根据多个用户的特征确定多维度的交易指标,并根据多维度的交易指标特征进行用户聚类。对用户聚类的过程中综合考虑了多种数据,使得聚类结果更加符合该业务场景中所有用户的特征,从而使得用户聚类更加准确。

在一个实施例中,根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标,包括:根据各用户数据确定用户的现有价值、发展价值以及潜在价值。从现有价值中提取当前交易指标,从发展价值中提取预测交易指标,从潜在价值中提取潜在交易指标。

其中,现有价值是用户对公司的现有价值(Customer Current value CCV),是用户在当前时间段内对应的价值。具体地,CCV是用户已发生的业务行为,即用户已购买的保单,并发生理赔业务时产生的价值。用户现有价值中包括当前交易指标,当前交易指标可用于衡量用户现有价值。如当前交易指标CCV_R代表现有购买间隔、CCV_F代表现有购买频率、CCV_C代表现有连续购买年限、CCV_M代表现有保费以及CCV_P代表现有利润。

在一个实施例中,在服务器中将用户窗口期名下的所有保单按照保险起期进行排序,取出用户最后一张购买的保单。用当前时间减去该保单的保险止期,得到用户的现有购买间隔(CCV_R)。在服务器中取出客户窗口期内办理业务中作为投保人的所有保单,并计算投保次数,以投保次数作为现有购买频率(CCV_F)。在服务器中取出用户窗口期内投保的所有保单,根据保险起期进行排序。通过后一张保单的止期E2与前一张保单的起期S1的差值来判断是否续保,如果E2-S1小于等于15,则判断为续保,否则,判断未续保。在用户所有连续投保的保单中,用最后一张保单的止期En减去第一张保单的起期S1,得到用户连续购买年限(CCV_C)。在服务器中取出用户窗口期内作为投保人产生的所有保单,对保单的签单保费求和得到用户的支付金额即现有保费(CCV_M)。在服务器中取出用户窗口期内的所有保单,求和计算总签单保费W,市场费用M,总赔款金额S。用总签单保费W减去市场费用M以及减去总赔款金额S,得到客户的净利润P即现有利润(CCV_P)。

发展价值用于表示用户对公司的发展价值(Customer Development value CDV),是用户在未来时间段内对应的价值。在一个实例中,发展价值CDV体现了用户在未来时间内创造价值的能力,可以在服务器中根据用户现在的交易水平,构建时序模型来预测客户未来几年内的交易水平。具体地,用户发展价值中包括预测交易指标,预测交易指标用于衡量用户发展价值。如预测交易指标CDV_R代表发展购买间隔、CDV_F代表发展购买频率、CDV_C代表发展连续购买年限、CDV_M代表发展保费以及CDV_P达标发展利润。

潜在价值是用户本身的潜在价值(Customer potential value CPV),是用户在未来时间段的可能具有的价值。在一个实施例中,用户本身有较大的购买潜力,但是在目标业务系统中的交易信息中无法体现出来,具体地可以根据用户的购买力指标来计算用户的潜在价值。用户潜在价值中包括潜在交易指标,潜在交易指标可用于衡量用户的潜在价值。具体的,潜在交易指标CPV_H代表房产价值、CPV_V代表车辆价值、CPV_I代表月收入、CPV_P代表保费收入占比。

进一步地,不同的交易指标之间因为数据类型的不同存在量纲差异,如用户支付金额M可能在数万元级别,连续投保年限C在五年以内,但是若根据得到的交易指标直接进行聚类,量纲较大的指标值会占更大的权重,从而影响最终结果的准确性。故而,在一个实施例中,服务器获取多维度的交易指标之后,还包括通过对交易指标进行标准化处理,以去除不同特征的交易指标之间的量纲差异。具体地,对于其中任意一个交易指标(当前交易指标、预测交易指标以及潜在交易指标),计算该交易指标的平均值μ,以及计算该交易指标的标准差σ,具体地,标准差σ的计算公式如式(3)所示。

对于每个交易指标x,通过公式(4)进行标准化处理。

通过公式(4)对交易指标进行标准化处理之后得到的数据符合标准正态分布,消除了不同交易指标本身的量纲差异,对聚类模型特征权重的影响,不仅提高了模型的准确率,也提升了聚类收敛的速度。

上述实施例中,在对用户聚类的过程中,从三个维度的指标(当前交易指标、预测交易指标以及潜在交易指标)描述用户的价值,并且三个维度中又包括多个指标表征各维度价值,使得对用户价值的衡量更加精准以及全面,提高对用户价值的分类准确性。

在一个实施例中,根据各用户数据确定用户的现有价值、发展价值以及潜在价值,包括:在计算线程中,根据各用户数据中的交易信息确定用户的现有价值;及,根据各用户数据中的资产信息确定用户的潜在价值;及,根据各用户数据构建预测模型,以根据预测模型确定用户的发展价值;根据聚类指标对各用户进行聚类,得到多种用户价值类别集,包括:在价值确定线程中,根据各用户的现有价值、发展价值以及潜在价值对各用户进行聚类,得到多种用户价值类别集;其中,计算线程与价值确定线程并行工作。

其中,交易信息是用户在交易过程中流水信息。如交易信息中可包括交易时间、交易金额、交易类型等。进一步地,还可以根据交易信息中的交易时间确定交易频率等。可以理解,由于交易信息是已经发生的交易行为对应的信息,故而可以根据交易信息确定用户的现有价值。

具体的,在计算线程中根据交易信息中的购买频率、连续购买年限、现有保费以及现有利润确定用户的现有价值。在一个实施例中,还可以根据多个用户在历史时间段内的多个交易时间对应的历史交易信息构建现有价值公式模型,然后将当前时间的交易信息带入现有价值公式模型中就可以获取用户的现有价值。在另一个实施例中,还可以根据多个用户在历史时间段内对应的多个历史交易信息训练机器学习模型,得到现有价值模型,并根据当前交易信息以及现有价值模型计算用户在当前时间对应的现有价值。在其他实施例中 ,还可以为交易信息中的每个当前交易指标分配当前指标权重,然后在计算线程中根据当前指标权重以及各当前交易指标计算用户的现有价值。

具体的,在计算线程中根据用户数据中的资产信息确定用户的潜在价值。在一个实施例中,可以根据多个用户的资产信息以及潜在价值训练机器学习模型,得到潜在价值确定模型,在具体实施中,可以根据当前用户的资产信息及潜在价值确定模型确定用户的潜在价值。在另一个实施例中,还可以根据多个用户的资产信息构建潜在价值公式模型,然后将当前用户的资产信息带入潜在价值公式模型中就可以获取当前用户的潜在价值。在一个实施例中,可以为资产信息中的每个潜在交易指标分配潜在指标权重,然后在服务器中的计算线程中根据潜在指标权重以及各潜在交易指标计算用户的潜在价值。

以及在服务器中的计算线程中根据各用户数据构建预测模型,以根据预测模型确定用户的发展价值。在一个实施例中,可以根据多个用户当前交易信息以及发展价值训练机器学习模型,得到预测价值确定模型,在具体实施中,可以根据当前用户的交易信息以及预测价值确定模型确定用户的发展价值。在另一个实施例中,还可以根据用户的交易信息构建预测价值公式模型,然后将用户的当前交易信息带入预测价值公式模型中就可以获取用户的发展价值。在一个实施例中,可以为交易信息中的每个当前交易指标分配发展指标权重,然后在计算线程中根据发展指标权重以及各当前交易指标计算用户的发展价值。

在服务器中的价值确定线程中,根据各用户的现有价值、发展价值以及潜在价值对各用户进行聚类,得到多种用户价值类别集;其中,计算线程与价值确定线程并行工作。

上述实施例中,在服务器中的多个线程中并行对用户数据进行处理,得到用户价值类别集。在计算线程中确定用户的多维度价值信息,在价值确定线程中根据用户的多维度价值信息确定用户的价值类别。通过多线程并行处理提高了对用户聚类的效率。并且,不同的线程之间并行处理用户不同阶段的数据,不同线程之间互不干扰,如在价值确定线程中对用户进行聚类的同时,在计算线程中还可以计算其他用户的价值信息,实现在不同的线程中同时对不同的用户分别进行聚类处理,极大地提高了对用户价值聚类的效率。

在一个实施例中,根据用户数据构建预测模型,以根据预测模型确定用户的发展价值,包括:从交易信息提取多个当前交易指标;获取当前交易指标对应的多个历史时间序列因子;各历史时间序列因子分别对应为不同的交易时间;获取各历史时间序列因子对应的因子权重;根据各历史时间序列因子以及各因子权重,构建每一个当前交易指标对应的指标预测模型,根据指标预测模型确定每一个当前交易指标对应的预测交易指标;根据每一个当前交易指标对应的预测交易指标,确定用户的发展价值。

其中,历史时间序列因子是多个历史交易时间内对应的数值。并且,每一个当前交易指标都分别对应多个历史时间序列因子。如现有购买间隔对应的多个历史时间序列因子是历史几年内对应的购买间隔,如过去一年购买产品的时间间隔为2个月、过去两年购买产品的时间间隔是4个月、过去三年购买产品的时间为3个月、过去四年购买产品的时间间隔为4个月等。可以理解,现有购买间隔对应的多个历史时间序列因子分别为2、4、3、4。进而可以根据历史多年的购买产品时间间隔确定购买间隔预测模型,以实现根据历史时间的数据预测当前时间的数据。

进一步地,服务器还用于获取每一个历史时间序列因子对应的因子权重,以利用因子权重对各历史时间序列因子进行调整,以更加适应真实的业务场景。具体地,可以按照各历史序列因子对应的交易时间设置各自对应的因子权重,如将交易时间与当前时间越接近的历史时间序列因子的权重因子设置为最大,将交易时间与当前时间间距越远的历史时间序列因子的权重因子设置为最小。

同理,对于现有购买频率、现有连续购买年限、现有保费以及现有利润的构建预测模型的方式参照构建购买检测预测模型的构建方式,在此不做赘述。

上述实施例中,根据各当前交易指标分别对应的历史时间序列因子,以及各历史序列因子对应的因子权重确定每个当前交易指标的指标预测模型。进而根据各当前交易指标的指标预测模型预测各当前交易指标的预测交易指标,并根据各预测交易指标确定用户的发展价值。在获取预测交易指标的过程中是通过各自对应的模型预测得到的,并根据各自对应的实际情况自适应利用因子权重对各历史时间序列因子进行调整,使得交易指标的获取更加精准。

在一个实施例中,方法还包括:对于每一个当前交易指标,获取当前交易指标对应的多个波动值;各波动值分别对应为不同的交易时间;获取各波动值对应的波动权重;根据各历史序列因子以及各因子权重,构建每一个当前交易指标对应的指标预测模型,以根据指标预测模型确定每一个当前交易指标对应的预测交易指标,包括:根据各历史序列因子、各因子权重、各波动值以及各波动权重,构建每一个当前交易指标对应的指标预测模型,以根据指标预测模型确定每一个当前交易指标对应的预测交易指标。

其中,波动值是在业务场景中对当前交易指标产生影响的数值。在具体的业务中,预测交易指标X

其中,X

具体的,可以将p和q的大小设定为预设范围内,如设定p和q均为小于等于3的数值,然后任意组合p和q的数值得到多个贝叶斯信息量BIC矩阵,并计算各个组合对应的贝叶斯信息量BIC矩阵的信息量,将信息量对应数值最小的贝叶斯信息量BIC矩阵中的p和q的数值提取为最终的数值,以完成p和q的定阶。

上述实施例中,实现了使用确定的p和q值建立每个当前交易指标对应的指标预测模型,分别基于用户历年来的现有价值,对用户的发展价值进行预测。并且,根据各历史序列因子、各因子权重、各波动值以及各波动权重,构建的每一个当前交易指标对应的指标预测模型,能够准确的描述一个用户在其行为模式下的发展价值。

在一个实施例中,根据聚类指标对各用户进行聚类,得到多种用户价值类别集,包括:预先设置聚类数量区间,聚类数量区间中包括多于一个的聚类数量;按照大小顺序依次从聚类数量区间中读取聚类数量,并基于各聚类数量执行对用户的聚类,得到各聚类数量对应的聚类畸变值,直至最新的聚类数量与前一个的聚类数量的聚类畸变值的差值小于预设值时,将最新的聚类数量提取为最佳聚类数量;根据最佳聚类数量对各用户进行聚类,得到多种用户价值类别集。

在一个实施例中,得到各聚类数量对应的聚类畸变值,包括:对于每一个聚类数量,获取根据聚类数量对用户进行聚类得到的多种用户价值类别集;对于每一个聚类数量,获取各用户价值类别集的价值中心点以及非中心点;对于每一个聚类数量,根据各价值中心点与非中心点之间的距离值,确定各用户价值类别集的畸变值,根据各用户价值类别集的畸变值得到聚类数量的聚类畸变值。

其中,聚类数量区间是包括多个聚类数量的集合。聚类畸变值是衡量聚类结果准确度的数值。

在一个实施例中,可以在服务器中利用k-means算法执行对用户价值的聚类。具体地,k-means算法作为一种非监督学习,需要在训练前人工确定聚类的群落数后,然后再开始训练。可以理解,对一个陌生的用户群体,用户类别分的越细,分类的准确性越高。但是分类的有效性会下降,无法体现不同用户之间的区分度。故而,在具体实施中,可以在服务器中预先设定聚类畸变值(SSE)作为成本函数来衡量各个聚类数量对应的畸变程度,对于每个聚类数量,畸变程度等于该类中心与其内部成员位置距离的平方和,具体地如公式(6)所示。

其中,

在其他实施例中,还可以首先在服务器中初始化聚类中心,并执行聚类算法。具体的可以通过初始的中心点彼此的距离尽可能的远,产生更好的模型。具体的步骤包括:步骤一、初始化一个空的集合M,用于存储选定的k个聚类中心的中心点。步骤二、从输入的样本中随机选择第一个中心点μ,并将其加入到集合M中。步骤三、对于集合M之外的任意样本点x,通过计算找到与其距离最小的样本d(x,M)。步骤四、使用加权概率分布来随机选择下一个中心点μ。重复步骤二和步骤三,直到选定k个中心点。步骤五、基于选定的中心点执行k-means算法。

在一个实施例中,方法还包括:获取各用户价值类别集对应的价值中心特征值;将各价值中心特征值转换为真实业务数据;根据真实业务数据对各用户价值类别集进行校验;将校验未通过的用户价值类别集去除,根据去除后剩余的数据得到多种用户价值类别集。

具体地,训练好聚类模型后,根据聚类模型对用户数据进行聚类,得到用户价值类别集。然后在服务器中获取各用户价值类别集对应的价值中心特征值,根据每个聚类中心的价值中心特征值可以近似估计该聚类的所有用户的特征。然后将价值中心特征值通过z-score算法逆向还原成业务的真实值,然后根据业务逻辑剔除明显不合规的异常数据。

在一个实施例中,将用户的当前交易指标中的RFCMP(当前交易指标CCV_R代表现有购买间隔、CCV_F代表现有购买频率、CCV_C代表现有连续购买年限、CCV_M代表现有保费以及CCV_P代表现有利润)五个维度的交易指标输入至预先训练好的聚类模型中,聚类得到不同类别的用户价值等级。如当将用户聚为7个类别时,每个类别的聚类中心的数据都代表从属于这个类别的数据特征。当发现有个别类别中的聚类中心的数据具有异常时,还可以通过逆向算法还原聚类中心的特征值得到业务真实值,以对业务真实值进行检验,提取其中的异常数据。

进一步地,根据聚类中心发现的异常聚类可包括:有时候一个代理人可能代表大量用户投保,故而聚类出来的是代理人的信息而不是关注的实际用户的信息,故而此时需要重新对数据处理,以得到用户的聚类信息而不是代理人的信息。或者,业务人员录入用户信息时可能录入错误,如可将保费为2万的数据误录入为2百万,进而导致该用户数据被单独聚为一类,此时该聚类也是异常聚类,也是需要重新校验的聚类数据。如表一所示,为聚类算法生成的聚类中心。

表一 聚类算法生成的聚类中心

从表一中可以看出,“-2914731.12”、“26247.68”、“5332.36”、“750.40”、“60654089.36”这几个数据属于几个异常的聚类中心,其中2类聚类中心的保费6000w元,3类聚类中心的投保次数为2w次,5类聚类中心的最后一次投保止期为-291w天,8类聚类中心的投保次数为5000次,9类聚类中心的投保次数为750次。经选取该聚类中心的具体用户,并返回业务系统查询,发现离群点中存在的问题包括:保单数据中存在信用保证险数据,该险种的保单为信贷公司以借款人的名义投保,且计算方式与正常保单不同,在计算中应该予以剔除。或者是部分险种,如乘坐交通工具意外伤害险,存在重复投保多张保单的情况,初步推测为分公司的做单方法。或者为经纪代理渠道承保的保单存在用一个人的身份信息为多个人投保的现象,会导致大量保单聚集在一个用户身份信息上。经查验后,确认2、3、5、8、9聚类中心为异常数据,所以在最后的结果中删除这些聚类中心。保留序号为0、1、4、6、7的聚类中心。

上述实施例中,事实证明聚类模型还有通过离群点检查异常数据的作用。在无法保证数据质量的情况下,可以通过聚类模型排除部分离群点。并对剩余的正常用户群的聚类进行重新编号,最后一共得到五类用户。进而提高了聚类结果的准确性。

在另一个实施例中,还包括在服务器中对聚类结果的语义化与图像化。具体的,通过将聚类算法生成的价值中心特征值,与该类价值中心特征值的平均值,中位数,分位数进行比较,转化成更直观的量化形容词,如很高,较高,偏低等。同时根据价值中心特征值与用户价值的对应关系,将聚类生成的用户编号转化成有业务含义的用户群名称,如:新进一般价值用户,中等价值用户,高价值用户,赔案流失用户,流失低价值用户等。

具体地,将各聚类中心对应的价值中心特征值与样本均值、中位数或者分位数进行比较,以获取不同聚类在整个样本中的水准,如聚类中心的保费均值是2万,整个用户样本对应的保费为3万,那么此时可将该聚类中心划分为保费较低的价值等级中。

在一个实施例中,对于每一个交易指标,可以将该交易指标的等级划分为4个不同的等级如Q1、Q2、Q3、及Q4。并且对于任何一个交易指标的数值x:若x小于等于Q1,则划分x极低;若x大于Q1,且x小于等于Q2,则划分x较低;若x大于Q2,且x小于等于Q3,则划分x中等;若x大于Q3,且x小于等于Q4,则划分x较高;若x大于等于Q4,则划分x极高。需要说明的是,对于一些业务上有特殊判定规则的交易指标,还可以增加其他相应的判断标准,在此不作限制。

在一个具体的实施例中,如表二所示提供了一种用户的价值中心特征值的表格示意图。如表三所示,提供了一种对表二中的数值进行语义化的表格示意图。

表二 用户的价值中心特征值

表三 用户的聚类中心语义化结果

上述实施例中,通过对用户聚类中心进行语义化展示,使得聚类结果更加直观。

在一个实施例中,获取用户数据集之后,还包括:对用户数据集中的数据进行预处理;预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

在实际的业务场景中,用户数据集中的用户数据存在录入不规范的情况,导致无法直接根据录入的用户数据执行用户的聚类计算。故而为了提高用户数据的有效性,需要在对用户进行聚类之前,对用户数据进行数据清洗。具体的,可以预先设置用户数据清洗规则对用户数据进行清洗处理。

在其中一个实施例中,数据清洗可包括对用户数据中的错误数据进行清洗。具体的,由于数据输入错误,不同来源数据引起的不同表示法,数据间的不一致等,导致现有的数据中存在这样或那样的脏数据,主要表现为:不合法值、录入不规范、不一致值以及数据重复等。数据清洗的作用包括去除不需要字段,或者格式内容清洗,或者填充空缺值,或者逻辑错误清洗,或者数据真实性验证等。

首先,将已确定的客户信息数据从Oracle抽取到hive平台上,输入提取要清洗的库表和数据,根据特定的规则做信息真实性校验,如身份证的省份检查,手机号的区段验证等,清洗出有真实有效的数据。在一个实施例中,数据清洗包括:1、对身份证号校验,具体地要求身份证号码的长度为15位或18位,要求身份证号码需要符合地区编码验证,要求身份证号码需要符合身份证日期验证,要求身份证号码需要符合身份证校验位判断,并且要求身份证号码不包含‘0000’等异常号。当判定身份证码不满意以上任何一个要求时,就将身份证号码置空。2、若用户与外勤人员将身份证号或手机号置为相同数值的,也将身份证号或手机号置空。3、姓名中只保留纯中文、纯字母和空格,将中英混合的数据剔除。4、手机号长度不等于11位的,非常规手机号,根据给出的规则进行校验,或号码包含‘000000’等非常规号,置空。5、姓名长度大于或等于3位,且含有“等人”字样,剔除。7、超过3位不同客户使用相同的身份证号与手机号,剔除。8、姓名含有“公司”,剔除。

在一个实施例中,数据清洗规则包括:a、清洗规则(准入规则):空值校验、null值校验、身份证号校验以及手机号校验等,当字段不符合配置的规则时,按规定的默认值赋予新值。当字段为空值‘’或null时,将其置换为字符串‘null’。而符合规则的值保持不变,最终每一条原始记录数据都将按照上述数据清洗规则,形成一条对应的新的数据记录,若该行数据有效,则进入下一步的ID打通,否则,将会被过滤。b、空值校验,判断字段值是否为空值,如是,则将字符串’null’给字段默认值。c、Null值校验,判断字段值是否为null值,如是,则将字符串’null’给字段默认值。d、身份证号校验,判断身份证号是否是合法,地区编码验证是否有效,身份证日期验证是否有效,身份证值最后一位判断,身份证长度判断。具体包括:当身份证的省份编码不正确,置空;当身份证的正则表达式判断不正确,置空;当身份证的校验位不正确,置空;当身份证包含“0000”,置空。

手机号校验,具体地,判断手机号是否合法,如手机号长度判断,空值判断,是否以1开头,是否为1111111111之类的异常号等。具体如下:当手机号长度不等于11,置空;当手机号不以1开头,置空;当手机号包含“000000”,置空;当手机号包含“11111111”,置空;当手机号包含“22222222”,置空;当手机号包含“33333333”,置空;当手机号包含“44444444”,置空;当手机号包含“55555555”,置空;当手机号包含“66666666”,置空;当手机号包含“77777777”,置空;当手机号包含“88888888”,置空;当手机号包含“99999999”,置空;当手机号包含“23456789”,置空;当手机号包含“12345678”,置空;当手机号包含“01234567”,置空;当手机号包含“34567890”,置空;当手机号包含“456789”,置空;当手机号包含“1380013800”,置空。

与代理人信息相同处理。具体地,代理人信息(姓名+证件号+手机号),当用户基础信息总表中的数据被判断不属于代理人,但使用了代理人信息,则将对应信息置空。

在一个实施例中,数据归一化的步骤包括:因为客户可能通过多种途径,多个入口触达,所以同一个客户在不同系统可能被打上了多个ID。还有用户多次办理业务时,因为提供信息的不同,也可能被认为是两个客户。在对客户价值进行分析时,要求能够收集到该客户在所有系统,所有时间段内的数据,需要进行ID归一化,将客户ID打通。具体地,数据打通规则包括:在服务器中获取用户基础信息数据汇总表,并为用户生成新的用户ID作为用户的唯一标识,放在第一个字段位置存到汇总表里, 一个客户ID对应多条记录数据,但一条记录仅属于一个客户ID。

ID打通:通过规定规则给每条数据都添加一个可以标识唯一标识该用户的字段,同时每条数据都会有个字段保留其在源表中的主键,以便回溯源表,最后将处理后的结果数据存到hive数据仓库中。具体地,目前作为标识用户的规则如下:姓名前两位 + 证件号码,确定一个用户;姓名 + 手机号,确定一个用户;证件号码 + 手机号,确定一个用户;姓名+ 银行卡号,确定一个用户;姓名 + 微信号 确定一个用户;手机号 + 银行卡号 确定一个用户;手机号 + 微信号,确定一个用户;姓名 + 设备ID,确定一个用户;手机号 + 设备ID,确定一个用户等。在此不作限制。

一种客服请求处理方法,客服请求处理方法包括:接收客服请求,客服请求携带有客服数据;根据客服数据,通过以上任意一个实施例中提供的一种用户价值聚类方法计算得到客服价值类别集;获取与客服价值类别集对应的服务策略;根据服务策略对客服请求进行处理。

在具体的应用场景中,可以对客服进行价值类别集分类,实现分配优质客服。并且服务策略可以是服务话术策略、或者是服务策略,或者是提高分配等级等。

进一步,可以依据表格对用户群体进行细分,得到多个级别的客服价值类别集。其中第1类用户群体:为新进一般价值客户。该类客户为初次投保的新客户,且客户的保单将在近期过期。针对这类客户,可以提供较好的服务并加强联系,看能否转化长期客户。2类用户群体:为中等价值客户。该类用户已经购买过数次产品,有一定的客户价值,且用户已经有一段时间未重新购买产品。针对这类客户,可以适当进行回访判断是否流失客户,并进行挽回。3类用户群体:为高价值客户。该类用户已经投保多年,且购买了较多产品,是核心客户。该用户的保单还有较长时间到期,可推断为长期保单的持有者,不轻易断保。针对这类客户,应该提供个性化的优质服务,提升客户体验。4类用户群体:为赔案流失客户。该类用户投保的次数略高于平均值,但是出现了巨额的赔款。根据最近保险止期可以发现用户已经一年以上没有进行投保了,可以初步判断为流失用户。这类客户是保险公司的高风险客户,且其中有可能存在欺诈,骗保的情况,应当后序的承保工作中加以注意。5类用户群体:为流失低价值客户。该类用户购买的产品较少,保费也相对较少。通过最近终保止期可以看出用户已经三年左右未投保了,可以判断为流失用户。

同时,如图4所示,图4为一个实施例中提供的一种不同级别聚类中心的分布示意图。具体地,在服务器中运用MinMaxScaler(数据归一化)的方法,将聚类中心特征值进行等比缩放,绘制成五维图,形象化的展示了单一聚类用户在RFCMP五个特征上的分布情况,和不同聚类用户的特征差异,便于业务人员了解客户属性。

在一个实施例中,为一个应用流程。具体地包括以下步骤:

1)选定窗口期,分别从承保系统和理赔系统采集窗口期客户的承保数据和理赔数据,清洗后加工成RFCMP五项指标。

2)粗略的确定k值,以肘法选择最适应客户数据的聚类群落数k。

3)用生成的客户RFCMP指标,反复迭代训练至聚类模型收敛。

4)将模型的聚类中心还原成真实业务数据,根据业务逻辑剔除离群点,不合规客户。

5)将剔除离群聚落后的模型保存。

6)将聚类算法的结果进行语义化和图像化,给予每个客户聚落一个具有业务含义的客户群名称。将每个客户的客户群名称作为客户的标签,保存在客户数据分析应用平台中。

7)通过客户标签进行差异化服务或者差异化理赔,每当有客户到达时,客服坐席可以通过客户数据分析平台查询其客户价值标签。以此标签作为参考,使用不同的话术和服务策略为用户提供个性化,有针对性的服务。

应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种用户价值聚类装置500,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:

获取模块502,用于获取用户数据集;用户数据集中包括多于一个的用户对应的用户数据;

指标确定模块504,用于根据各用户数据确定当前交易指标、预测交易指标以及潜在交易指标;

相关度确定模块506,用于确定当前交易指标、预测交易指标以及潜在交易指标的重要度;

聚类确定模块508,根据重要度确定聚类指标;

聚类模块510,用于根据聚类指标对各用户进行聚类,得到多种用户价值类别集。

在一个实施例中,指标确定模块504还用于根据各用户数据确定用户的现有价值、发展价值以及潜在价值;从现有价值中提取当前交易指标,从发展价值中提取预测交易指标,从潜在价值中提取潜在交易指标。

在一个实施例中,指标确定模块504还用于在计算线程中,根据各用户数据中的交易信息确定用户的现有价值;及,根据各用户数据中的资产信息确定用户的潜在价值;及,根据各用户数据构建预测模型,以根据预测模型确定用户的发展价值;聚类模块510还用于在价值确定线程中,根据各用户的现有价值、发展价值以及潜在价值对各用户进行聚类,得到多种用户价值类别集;其中,计算线程与价值确定线程并行工作。

在一个实施例中,指标确定模块504还用于从交易信息提取多个当前交易指标;获取当前交易指标对应的多个历史时间序列因子;各历史时间序列因子分别对应为不同的交易时间;获取各历史时间序列因子对应的因子权重;根据各历史时间序列因子以及各因子权重,构建每一个当前交易指标对应的指标预测模型,根据指标预测模型确定每一个当前交易指标对应的预测交易指标;根据每一个当前交易指标对应的预测交易指标,确定用户的发展价值。

在一个实施例中,用户价值聚类装置还包括权重确定模块512,该权重确定模块512用于对于每一个当前交易指标,获取当前交易指标对应的多个波动值;各波动值分别对应为不同的交易时间;获取各波动值对应的波动权重。指标确定模块504还用于根据各历史序列因子、各因子权重、各波动值以及各波动权重,构建每一个当前交易指标对应的指标预测模型,以根据指标预测模型确定每一个当前交易指标对应的预测交易指标。

在一个实施例中,聚类模块510还用于预先设置聚类数量区间,聚类数量区间中包括多于一个的聚类数量;按照大小顺序依次从聚类数量区间中读取聚类数量,并基于各聚类数量执行对用户的聚类,得到各聚类数量对应的聚类畸变值,直至最新的聚类数量与前一个的聚类数量的聚类畸变值的差值小于预设值时,将最新的聚类数量提取为最佳聚类数量;根据最佳聚类数量对各用户进行聚类,得到多种用户价值类别集。

在一个实施例中,聚类模块510还用于对于每一个聚类数量,获取根据聚类数量对用户进行聚类得到的多种用户价值类别集;对于每一个聚类数量,获取各用户价值类别集的价值中心点以及非中心点;对于每一个聚类数量,根据各价值中心点与非中心点之间的距离值,确定各用户价值类别集的畸变值,根据各用户价值类别集的畸变值得到聚类数量的聚类畸变值。

在一个实施例中,用户价值聚类装置还包括转换模块,该转换模块用于获取各用户价值类别集对应的价值中心特征值;将各价值中心特征值转换为真实业务数据;根据真实业务数据对各用户价值类别集进行校验;将校验未通过的用户价值类别集去除,根据去除后剩余的数据得到多种用户价值类别集。

在一个实施例中,用户价值聚类装置还包括预处理模块,该预处理模块用于对用户数据集中的数据进行预处理;预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

在一个实施例中,如图6所示,提供了一种客服请求处理装置600,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:

接收模块602,用于接收客服请求,客服请求携带有客服数据。

计算模块604,用于根据客服数据,通过一种用户价值聚类方法计算得到客服价值类别集。

策略获取模块606,用于获取与客服价值类别集对应的服务策略。

处理模块608,用于根据服务策略对客服请求进行处理。

关于用户价值聚类装置的具体限定可以参见上文中对于用户价值聚类方法的限定,在此不再赘述。上述用户价值聚类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户价值聚类方法。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种用户价值聚类方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取用户数据集;所述用户数据集中包括多于一个的用户对应的用户数据;根据各所述用户数据确定当前交易指标、预测交易指标以及潜在交易指标;确定所述当前交易指标、所述预测交易指标以及所述潜在交易指标的重要度;根据所述重要度确定聚类指标;根据所述聚类指标对各所述用户进行聚类,得到多种用户价值类别集。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各所述用户数据确定用户的现有价值、发展价值以及潜在价值;从所述现有价值中提取当前交易指标,从所述发展价值中提取预测交易指标,从所述潜在价值中提取潜在交易指标。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:在计算线程中,根据各所述用户数据中的交易信息确定用户的现有价值;及,根据各所述用户数据中的资产信息确定用户的潜在价值;及,根据各所述用户数据构建预测模型,以根据所述预测模型确定所述用户的发展价值。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:在价值确定线程中,根据各所述用户的所述现有价值、所述发展价值以及所述潜在价值对各所述用户进行聚类,得到多种用户价值类别集;其中,所述计算线程与所述价值确定线程并行工作。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:从所述交易信息提取多个当前交易指标;获取所述当前交易指标对应的多个历史时间序列因子;各所述历史时间序列因子分别对应为不同的交易时间;获取各所述历史时间序列因子对应的因子权重;根据各所述历史时间序列因子以及各所述因子权重,构建每一个所述当前交易指标对应的指标预测模型,根据所述指标预测模型确定每一个所述当前交易指标对应的预测交易指标;根据每一个所述当前交易指标对应的所述预测交易指标,确定所述用户的发展价值。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:对于每一个所述当前交易指标,获取所述当前交易指标对应的多个波动值;各所述波动值分别对应为不同的交易时间;获取各所述波动值对应的波动权重。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各所述历史序列因子、各所述因子权重、各所述波动值以及各所述波动权重,构建每一个所述当前交易指标对应的指标预测模型,以根据所述指标预测模型确定每一个所述当前交易指标对应的预测交易指标。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:预先设置聚类数量区间,所述聚类数量区间中包括多于一个的聚类数量;按照大小顺序依次从所述聚类数量区间中读取聚类数量,并基于各所述聚类数量执行对用户的聚类,得到各所述聚类数量对应的聚类畸变值,直至最新的所述聚类数量与前一个的所述聚类数量的所述聚类畸变值的差值小于预设值时,将最新的所述聚类数量提取为最佳聚类数量;根据所述最佳聚类数量对各所述用户进行聚类,得到多种用户价值类别集。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:对于每一个所述聚类数量,获取根据所述聚类数量对用户进行聚类得到的多种用户价值类别集;对于每一个所述聚类数量,获取各所述用户价值类别集的价值中心点以及非中心点;对于每一个所述聚类数量,根据各所述价值中心点与所述非中心点之间的距离值,确定各所述用户价值类别集的畸变值,根据各所述用户价值类别集的畸变值得到所述聚类数量的聚类畸变值。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:获取各所述用户价值类别集对应的价值中心特征值;将各所述价值中心特征值转换为真实业务数据;根据所述真实业务数据对各所述用户价值类别集进行校验;将校验未通过的用户价值类别集去除,根据去除后剩余的数据得到多种用户价值类别集。

在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:对所述用户数据集中的数据进行预处理;所述预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收客服请求,所述客服请求携带有客服数据;根据所述客服数据,通过上述所述的用户价值聚类方法计算得到客服价值类别集;获取与所述客服价值类别集对应的服务策略;根据所述服务策略对所述客服请求进行处理。

在其中一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取用户数据集;所述用户数据集中包括多于一个的用户对应的用户数据;根据各所述用户数据确定当前交易指标、预测交易指标以及潜在交易指标;确定所述当前交易指标、所述预测交易指标以及所述潜在交易指标的重要度;根据所述重要度确定聚类指标;根据所述聚类指标对各所述用户进行聚类,得到多种用户价值类别集。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各所述用户数据确定用户的现有价值、发展价值以及潜在价值;从所述现有价值中提取当前交易指标,从所述发展价值中提取预测交易指标,从所述潜在价值中提取潜在交易指标。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:在计算线程中,根据各所述用户数据中的交易信息确定用户的现有价值;及,根据各所述用户数据中的资产信息确定用户的潜在价值;及,根据各所述用户数据构建预测模型,以根据所述预测模型确定所述用户的发展价值。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:在价值确定线程中,根据各所述用户的所述现有价值、所述发展价值以及所述潜在价值对各所述用户进行聚类,得到多种用户价值类别集;其中,所述计算线程与所述价值确定线程并行工作。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:从所述交易信息提取多个当前交易指标;获取所述当前交易指标对应的多个历史时间序列因子;各所述历史时间序列因子分别对应为不同的交易时间;获取各所述历史时间序列因子对应的因子权重;根据各所述历史时间序列因子以及各所述因子权重,构建每一个所述当前交易指标对应的指标预测模型,根据所述指标预测模型确定每一个所述当前交易指标对应的预测交易指标;根据每一个所述当前交易指标对应的所述预测交易指标,确定所述用户的发展价值。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:对于每一个所述当前交易指标,获取所述当前交易指标对应的多个波动值;各所述波动值分别对应为不同的交易时间;获取各所述波动值对应的波动权重。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据各所述历史序列因子、各所述因子权重、各所述波动值以及各所述波动权重,构建每一个所述当前交易指标对应的指标预测模型,以根据所述指标预测模型确定每一个所述当前交易指标对应的预测交易指标。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:预先设置聚类数量区间,所述聚类数量区间中包括多于一个的聚类数量;按照大小顺序依次从所述聚类数量区间中读取聚类数量,并基于各所述聚类数量执行对用户的聚类,得到各所述聚类数量对应的聚类畸变值,直至最新的所述聚类数量与前一个的所述聚类数量的所述聚类畸变值的差值小于预设值时,将最新的所述聚类数量提取为最佳聚类数量;根据所述最佳聚类数量对各所述用户进行聚类,得到多种用户价值类别集。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:对于每一个所述聚类数量,获取根据所述聚类数量对用户进行聚类得到的多种用户价值类别集;对于每一个所述聚类数量,获取各所述用户价值类别集的价值中心点以及非中心点;对于每一个所述聚类数量,根据各所述价值中心点与所述非中心点之间的距离值,确定各所述用户价值类别集的畸变值,根据各所述用户价值类别集的畸变值得到所述聚类数量的聚类畸变值。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取各所述用户价值类别集对应的价值中心特征值;将各所述价值中心特征值转换为真实业务数据;根据所述真实业务数据对各所述用户价值类别集进行校验;将校验未通过的用户价值类别集去除,根据去除后剩余的数据得到多种用户价值类别集。

在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:对所述用户数据集中的数据进行预处理;所述预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

在其中一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收客服请求,所述客服请求携带有客服数据;根据所述客服数据,通过上述所述的用户价值聚类方法计算得到客服价值类别集;获取与所述客服价值类别集对应的服务策略;根据所述服务策略对所述客服请求进行处理。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 用户价值聚类方法、装置、计算机设备和存储介质
  • 用户价值预测方法、装置、电子设备和计算机存储介质
技术分类

06120112940163