掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、设备及存储介质

文献发布时间:2023-06-19 09:24:30


数据处理方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。

背景技术

随着金融企业行业市场趋于饱和,新客户的挖掘成本越来越高,而维护存量客户的成本远小于挖掘新客户的成本。因此,越来越多的金融企业将目光聚焦于存量客户,而如何经营存量客户,使其尽可能多的存量客户购买金融产品对于金融企业来说至关重要。

目前,对于处于高度活跃期的存量客户,客户经理会针对性服务。对于低活跃期的存量客户,通常采用电销的方式向其推销金融产品。但是,由于该类存量客户与企业金融产品之间的互动行为较少,导致对这类存量客户的需求了解的不准确。因此,为了解该类存量客户的需求,通常通过电销的方式接触该类存量客户。

但是,电销接触方式的覆盖度小、成本高,难以挖掘出具有需求的客户,影响坐席的业务量,从而导致坐席的工作效率低。

发明内容

本发明的主要目的在于提供一种数据处理方法、装置、设备及存储介质,旨在解决因对客户需求了解不准确而导致的业务人员业绩差,工作效率低的问题。

为实现上述目的,本发明提供一种数据处理方法,包括:

获取本地存储的客户的属性信息;

将所述客户的属性信息输入到目标业务的预设概率预估模型中,获得所述客户的预估概率,所述预估概率用于表示通过目标接触方式接触所述客户后,所述客户在预设时长内针对所述目标业务转化的概率;

若根据所述客户的预估概率,确定需通过目标接触方式进行接触所述客户,则向业务人员的终端发送接触提示信息,所述接触提示信息用于提示针对所述目标业务通过目标接触方式接触所述客户。

在一种具体实施方式中,

所述预设概率预估模型是根据第一训练样本集和第二训练样本集训练获得的;

所述第一训练样本集包含:通过目标接触方式接触的样本客户的属性信息、以所述目标接触方式接触所述样本客户的时间点以及第一标签,所述第一标签用于表示以所述目标接触方式接触所述样本客户的时间点起预设时长内是否针对所述目标产品转化;

所述第二训练样本集包含:未通过目标接触方式接触的样本客户的属性信息、预设时间点以及第二标签,所述第二标签用于表示以预设时间点起所述预设时长内是否针对所述目标产品转化。

在一种具体实施方式中,所述以所述目标接触方式接触所述样本客户的时间点与所述获取所述客户的属性信息的时间点之间的间隔时长大于或等于预设时长;

所述预设时间点与所述获取所述客户的属性信息的时间点之间的间隔时长大于或等于预设时长。

在一种具体实施方式中,所述将所述客户的第一特征输入到目标产品的预设概率预估模型中之前,还包括:

获取所述第一训练样本集和所述第二训练样本集;

根据所述第一训练样本集和所述第二训练样本集,训练初始的概率预估模型,获得所述预设概率预估模型。

在一种具体实施方式中,所述根据第一训练样本集和第二训练样本集,训练初始的概率预估模型,获得所述预设概率预估模型,包括:

根据所述第二训练样本集,训练所述初始的概率预估模型,获得中间预设概率预估模型;

根据所述第一训练样本集,训练所述中间预设概率预估模型,获得所述预设概率预估模型。

在一种具体实施方式中,获取所述第二训练样本集,包括:

在同一个预设时间点获取未通过目标接触方式接触的不同样本客户中每个样本客户的属性信息以及所述第二标签;或者,

在多个不同预设时间点分别获取未通过目标接触方式接触的同一样本客户的属性信息以及所述第二标签。

在一种具体实施方式中,还包括:

在对所述客户通过目标接触方式进行接触后,预设时长内所述客户针对所述目标产品未转化,则将所述客户作为第一训练样本集中的样本客户,获得更新后的第一训练样本集;

根据更新后的第一训练样本集,对所述预设概率预估模型进行优化。

在一种具体实施方式中,所述将所述客户作为第一训练样本集中的样本客户,获得更新后的第一训练样本集,包括:

将所述客户作为第一训练样本集中的多份样本客户,获得更新后的第一训练样本集。

在一种具体实施方式中,所述属性信息包括如下至少一项:所属的行业信息、名称、地址、提款信息。

本发明还提供一种数据处理装置,包括:

获取模块,用于获取本地存储的客户的属性信息;

预估模块,用于将客户的属性信息输入到目标业务的预设概率预估模型中,获得客户的预估概率,预估概率用于表示通过目标接触方式接触客户后,客户在预设时长内针对目标业务转化的概率;

确定模块,用于若根据客户的预估概率,确定需通过目标接触方式进行接触客户,则向业务人员的终端发送接触提示信息,接触提示信息用于提示针对目标业务通过目标接触方式接触客户。

本发明还提供一种电子设备,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现第一方面任一实施方式所述的数据处理方法的步骤。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一实施方式提供的数据处理方法的步骤。

本发明提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备实施第一方面任一项提供的数据处理方法。

本发明中,对于每个客户,获取每个客户的属性信息,将每个客户的属性信息输入到目标业务的预设概率预估模型中。由于客户的属性信息反映该客户的需求点,因此,通过预设概率预估模型对每个客户的属性信息进行分析,获得每个客户对目标业务的需求程度,根据需求程度给出每个客户的预估概率。根据客户的预估概率,若确定通过目标接触方式进行接触的至少一个客户,则向业务人员的终端发送接触提示信息,以对客户通过目标接触方式进行接触。因此,本实施例根据客户的属性信息以及预设概率预估模型快速且准确的确定出对目标业务有需求的客户,从而有针对性的对客户通过目标接触方式接触,提高了在对客户进行目标方式接触后,针对目标业务成功转化的效率。并且在尽可能减少通过目标接触方式接触的客户的数量的基础上,提高了针对目标产品成功转化的效率,还降低了接触成本,从而提高业务人员业绩,提高业务人员的工作效率。

附图说明

图1为本发明一实施例提供的一种应用场景示意图;

图2为本发明一实施例提供的一种数据处理方法的流程示意图;

图3为本发明一实施例提供的一种数据处理方法的框图;

图4为本发明一实施例提供的获取预设概率预估模型的方法流程图;

图5为本发明一实施例提供的预设概率预估模型训练框图;

图6为本发明一实施例提供的数据处理装置的结构示意图;

图7为本发明一实施例提供的电子设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1为本发明一实施例提供的一种应用场景示意图。对于低活跃期的存量客户,由于这些存量客户在最近一段时间内与企业之间的互动行为较少,因此,坐席无法确定低活跃期的存量客户的业务需求。为了了解低活跃期的存量客户的需求点,坐席通常通过电销方式接触低活跃期的存量客户,向低活跃期的存量客户介绍金融产品并了解他们的需求点。

例如如图1所示,存量客户的名单存储在数据库102中,服务器101从数据库102中获取存量客户的名单,采用随机分配或者根据经验将存量客户的名单发送到对应坐席的终端上,以使坐席根据名单中客户的信息对客户进行电销接触,从而促使存量客户对业务进行转化。

其中,现有技术中坐席在通过电销方式接触存量客户时,由于不了解存量客户的需求,只能盲目的向存量客户介绍产品,导致客户的转化率低,即影响坐席的业绩。因此,为了增加业务,坐席会尽可能的通过电销方式接触更多的存量客户,但是,坐席通过电销方式接触存量客户的数量是有限的,难以接触到每个存量客户,存量客户的覆盖率低,也影响存量客户的转化率,导致坐席的工作效率低。

为了解决上述问题中的至少一个问题,本发明实施例提供一种方案,将客户特征输入到预设概率预估模型中,预设概率预估模型根据每个客户的特征,确定每个客户的预估概率,所述预估概率用于表示通过目标接触方式接触每个客户后,该客户在预设时长内转化的概率,从而根据预估概率确定接下来通过目标接触方式接触的客户。由于客户特征是基于各种关于客户的信息和数据分析后获取的,可以反映客户的需求,因此,通过预设概率预估模型对客户特征的计算,可以快速、准确地获取客户需求,从而在通过目标方式接触客户时,为客户提供符合其需求的产品,提高客户转化率,从而提高坐席的工作效率。

下面结合附图,对本发明的一些实施方式作详细说明。在各实施例之间不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

图2为本发明一实施例提供的一种数据处理方法的流程示意图。本实施例中方法的执行主体可以为电子设备,例如计算机或服务器。本实施例中的方法可以通过软件、硬件或者软硬件结合的方式来实现。如图2所示,所述方法可以包括:

S201、获取本地存储的客户的属性信息。

在本步骤中,客户可以是个人,也可以是企业、团体组织等。下面,以客户为企业为例进行说明。

当客户接触过公司产品,并且,向公司提交过自身的属性信息后,公司的数据库中存储有这类客户的属性信息。

由于企业之前是公司的客户,因此,企业的信息存储在公司的数据库102中,当对这些企业进行电销接触时,服务器101从数据库102中获取客户的名单,其中,客户的名单上包括客户的属性信息。

其中,由于数据库中储存的客户的数量十分庞大,因此,可以每次从数据库中获取部分客户的名单,例如,随机获取数据库中的部分客户;或者,获取上一次接触该客户的时间与当前时间的时间间隔超过预设时间间隔的客户,本发明对此不限制。

获取到客户的名单后,获取客户的属性信息。可选的,属性信息包括如下至少一项:待筛选客户所属的行业信息、提款信息、基础信息。

对于行业信息,同一行业,由于其对应的社会领域相同,因此,当该行业对应的社会领域促进该行业发展时,处于同一行业中的相关企业也会得到发展。例如,在出现疫情时,会促进医药卫生领域相关企业的发展,例如,医疗器械制造企业、生产口罩的企业。因此,行业信息可以反应该行业的发展状况,继而通过企业行业信息,从行业维度确定企业的需求,从而为客户提供符合其需求的产品。

可选的,行业信息可以具体包括:企业的经营范围。对于具有相同经营范围的企业,或者经营同一类产品的不同企业,其生产产品的原料、销售、生产设备的购买渠道等所对应的供应链几乎相同。因此,对于具有相同经营范围的企业,或者经营同一类产品的不同企业,如果一家企业受到影响,其他企业受到影响的概率也会增加。

并且,对于具有相同供应链的不同企业,当供应链中的其中一个环节出现问题或者发展壮大时,可能会对整个供应链上的行业产生影响。例如,当口罩企业的生产量增加时,处于口罩生产供应链上的不同行业的企业的效益也会随之增加,例如,口罩原材料提供企业、口罩生产设备企业等。当口罩生产设备企业需要生产大量的设备时,其对应的原料供应企业也会随之发展,例如,配件生产企业,其中,配件生产企业又属于机械制造行业。因此,行业信息不仅可以反应该行业的发展状况,还可以反应与该行业相关的其他行业的信息,通过一个行业的行业信息,可以推测其他相关行业的发展状况,从而确定企业的需求。

可选的,行业信息还可以具体包括:企业的经营规模。企业的经营规模不同,其对风险的抵抗能力也不同,当然,在机遇来临时,其发展潜力也不同。因此,获取企业的经营规模,根据经营规模确定企业的抗风险能力或者发展潜力,从而确定企业的需求。

对于提款信息,可选的,提款信息可以包括以下至少一项:该企业已贷款的金额、贷款时间、已有贷款的申请时间、已有贷款的提款时间、已有贷款的还款信息、信用度。

通过提款信息,可以反应企业的历史经营状况,从而可以预测企业的需求以及还款能力等。

其中,相同行业或者说相同类型的企业以及主要供应商等,为了减少成本以及促进公司的发展,企业设置的区域会有一定的属性,例如,电子制造业,一般聚集在一定的区域。

并且,对于有些行业,由于行业的限制,其相关产业也聚集在一定的区域,例如,能源产业,具体的,例如,煤炭行业,其相关行业均设置在煤炭资源丰富的地区。

因此,同一区域的相关企业之间的发展会相互影响,因此,对于其中一家企业,通过该企业地址,可以获取该地址对应区域其他相关企业的需求,从而确定该企业的需求。

当企业在之前提交的信息中没有填写行业信息时,通过企业名称,可以分析获取企业的行业,经营范围。可选的,企业名称中会出现企业的地址信息,因此,通过企业名称也可以获取该企业的企业地址。

S202、将客户的属性信息输入到目标业务的预设概率预估模型中,获得客户的预估概率。

其中,预估概率用于表示通过目标接触方式接触客户后,客户在预设时长内针对目标业务转化的概率。

在本步骤中,以金融公司为例,目标业务例如可以是金融公司推出的理财产品、贷款产品等,本实施例以其中一款贷款业务为例进行说明。

目标接触方式是预先设置的接触方式,例如,邮件、电话、短信等方式。其中,本实施例以电话接触(即电销)的方式为例进行说明。

贷款业务的预设概率预估模型(以下称为预设概率预估模型)为预先针对该贷款业务,通过人工智能的方法训练模型获得的,用于计算在通过电销方式接触客户后,客户在预设时长内办理贷款业务的概率。因此,通过预设概率预估模型获得预估概率,可以提高预估效率和预估的准确性。

例如,针对其中一种贷款业务训练获得的预设概率预估模型,通过该预设概率预估模型,可以计算出通过电销方式接触客户后,客户在预设时长内进行贷款的概率。其中,预设概率预估模型的其中一种训练方法在图4中详细介绍。

预设时长为预先设置的用于评估客户是否办理贷款业务的时长,其值例如可以为一周、10天、30天等,在预设时长内客户办理贷款业务,都认为客户针对该贷款业务成功转化。

通过S201获取到每个客户的属性信息后,如图3所示,将客户的属性信息输入到预设概率预估模型中,预设概率预估模型对客户的属性信息进行分析计算,输出客户的预估概率。

可选的,S202的一种可能的实现方式为:每次将一个客户的属性信息输入到预设概率预估模型中,预设概率预估模型对该待筛选客户的特征进行分析计算,获取该待筛选客户的预估概率,然后,将另一个客户的属性信息输入到预设概率预估模型中。

可选的,S202的另一种可能的实现方式为:将所有客户的属性信息输入到预设概率预估模型内部中,预设概率预估模型内部分别对每个客户的属性信息进行分析计算,获取每个客户的预估概率。

对于业务人员来说,基于业绩需求,希望在接触客户后,客户能很快办理贷款业务,因此,预估概率为通过电销方式接触客户后,客户在预设时长内办理贷款业务的概率。

因此,可选的,在将客户的属性信息输入到预设概率预估模型时,还需要输入当前时间;或者,预设概率预估模型接收到客户的特征后,记录当前时间,并基于当前时间计算预估概率。其中,当前时间可以为当天的日期。

S203、若根据客户的预估概率,确定需通过目标接触方式进行接触客户,则向业务人员的终端发送接触提示信息。

其中,接触提示信息用于提示针对目标业务通过目标接触方式接触客户。

在本步骤中,获取到客户的预估概率后,根据每个客户的预估概率,确是否通过电销方式接触该客户,若确定通过电销方式接触该客户,则向业务人员的终端发送接触提示信息,以使业务人员通过电销方式接触该客户。其中,接触提示信息例如可以是客户的名单。

可选的,S203的一种实现方式为:根据每个客户的预估概率,确定客户中预估概率大于预设概率的客户,对预估概率大于预设概率的客户通过目标接触方式进行接触。

预设概率为预先设置的概率,用于确定是否有必要通过电销方式接触客户。当S202中通过预设概率预估模型计算获得的客户的预估概率大于该预设概率时,说明在通过电销方式接触该客户后,在预设时长内该客户办理贷款业务的可能性较大。

因此,获取每个客户的预估概率后,将每个客户的预估概率与预估概率记性比较,对预估概率大于预设概率的客户,通过电销方式进行接触。

可选的,S203的另一种实现方式为:根据每个客户的预估概率的大小,确定预估概率最大的前N个客户,对预估概率最大的前N个客户通过目标接触方式进行接触。其中,N为正整数。

例如,客户1-客户10的预估概率分别为:0.65、0.32、0.98、0.75、0.54、0.12、0.86、0.90、0.78、0.48,N为4,则通过电销方式进行接触的客户为:客户3、客户7、客户8以及客户9。

本实施例提供的数据处理方法,对于每个客户,获取每个客户的属性信息,将每个客户的属性信息输入到目标业务的预设概率预估模型中。由于客户的属性信息反映该客户的需求点,因此,通过预设概率预估模型对每个客户的属性信息进行分析,获得每个客户对目标业务的需求程度,根据需求程度给出每个客户的预估概率。根据客户的预估概率,若确定通过目标接触方式进行接触的至少一个客户,则向业务人员的终端发送接触提示信息,以对客户通过目标接触方式进行接触。因此,本实施例根据客户的属性信息以及预设概率预估模型快速且准确的确定出对目标业务有需求的客户,从而有针对性的对客户通过目标接触方式接触,提高了在对客户进行目标方式接触后,针对目标业务成功转化的效率。并且在尽可能减少通过目标接触方式接触的客户的数量的基础上,提高了针对目标产品成功转化的效率,还降低了接触成本,从而提高业务人员业绩,提高业务人员的工作效率。

图4为本发明一实施例提供的获取预设概率预估模型的方法流程图。如图4所示,本实施例的方法包括:

S401、获取第一训练样本集和第二训练样本集。

本步骤中,由于本发明是通过预设概率预估模型,预估通过目标接触方式接触客户后,客户在预设时长内针对目标产品转化的概率。因此,需要将通过目标方式接触过的客作为样本户,将样本客户的信息作为训练样本。

根据通过电销方式接触过的样本客户,获取每个样本客户的属性信息、以所述目标接触方式接触所述样本客户的时间点以及第一标签,从而获得训练样本集,即第一训练样本集。

其中,样本客户的属性信息包括以下至少一项:样本客户所属的行业信息、提款信息、样本客户的名称、样本客户的地址。以电销接触方式接触样本客户的时间例如可以为最近一次业务人员通过电销接触方式接触样本客户的日期,例如,业务人员2020年8月30日电话联系样本客户,则以电销接触方式接触样本客户的时间为2020年8月30日。

每个样本客户的标签用于表示以电销接触方式接触样本客户的时间点起,在预设时长内样本客户是否办理贷款业务。例如,业务人员2020年8月30日电话联系样本客户,业务人员将贷款产品介绍给样本客户,如果样本客户了解贷款产品后,以2020年8月30日为开始时间,在30天内办理贷款业务,则说明样本客户成功转化,此时,标签的值例如可以为1;否则,样本客户未成功转化,此时,标签的值例如可以为0。

可选的,由于通过电销方式接触的客户的数量有限,因此,获取到的通过电销方式接触的客户的属性信息较少,即通过第一训练样本集提取到的信息量较少。例如,电销方式接触到的行业较少,行业覆盖率低,难以挖掘出具有贷款意愿的行业。这样,训练获得的预设概率预估模型在计算预估概率时,模型质量差,准确性较低。因此,为了提高模型的质量,可以利用未通过电销接触方式接触的样本客户来弥补通过电销方式接触的客户的数量少的问题,即获取未通过电销接触方式接触的样本客户,根据未通过电销接触方式接触的样本客户,获得训练样本集,即第二训练样本集。

第二训练样本集中包括每个未通过电销接触方式接触的样本客户的属性信息、预设时间点以及第二标签。对于属性信息,其包括以下至少一项:样本客户所属的行业信息、样本客户的名称、样本客户的地址。

预设时间点为预先设置的时间点,可以为任一时间点,例如,下一个周一,或者当天所对应的日期等。

第二标签用于表示以预设时间点起,未通过电销方式接触过的样本客户在预设时长内是否办理贷款业务。例如,预设时间点为当天所对应的日期,则从当天开始,如果客户在预设时长内自己办理贷款业务,则说明样本客户成功转化,此时,标签的值例如可以为1;否则,样本客户未成功转化,此时,标签的值例如可以为0。一般的,预设时长为30天。

例如,对于未通过电销接触方式接触的样本客户,以2020年9月1日为预设时间点,也就是说2020年9月1日为开始时间,预设时长例如为30天。在2020年9月1日-2020年9月30日,业务人员没有对该样本客户通过电销接触方式接触的前提下,如果该样本客户在2020年9月1日-2020年9月30日中的任一天办理了贷款业务,则说明样本客户成功转化,此时,标签的值例如可以为1;否则,样本客户为成功转化,此时,标签的值例如可以为0。

可选的,由于预估概率对应的是通过电销接触方式接触待筛选客户后,待筛选客户在预设时长内办理贷款业务的概率。也就是说在通过电销方式接触客户后,需要经过预设时长才能否确定客户是否办理贷款业务。因此,以电销接触方式接触样本客户的时间点与获取客户的属性信息的时间点之间间隔的时长需要大于或等于预设时长。

例如,获取客户的属性信息的时间点为2020年9月1日,预设时长为30,则以电销接触方式接触样本客户的时间点最迟应该是2020年8月2日。如果选取的以电销接触方式接触样本客户的时间点为2020年8月2日之后的日期,例如,以电销接触方式接触样本客户的时间点为2020年8月4日,根据预设时长,在2020年9月1日时,还未到达预设时长,也就是说样本客户在2020年9月1日时还未购买产品,但是,样本客户在2020年9月2日或者2020年9月3日有可能会购买产品。因此,在2020年9月1日时还不确定该客户是否针对贷款产品进行贷款。因此,如果将2020年8月4日以电销接触方式接触客户作为样本客户,导致训练结果不准确,即通过预设概率预估模型获得的预估概率不准确。

可选的,同理可知,预设时间点与获取待筛选客户的第一特征的时间点之间间隔的时长需要大于或等于预设时长。

可选的,S401中获取第二训练样本集的可能的实现方式为:

在同一个预设时间点获取未通过目标接触方式接触的不同样本客户中每个样本客户的属性信息以及第二标签;或者,

在多个不同预设时间点分别获取未通过目标接触方式接触的同一样本客户的属性信息以及第二标签。

具体的,为了增加训练样本的数量,提高通过预设概率预估模型获取的预估概率的准确性,在获取第二训练样本集时,设置不同的预设时间点,分别获取与每个预设时间点对应的未通过电销方式接触的样本客户。例如,预设时间点可以为每周一,在第一个周一时,获取一次未通过电销方式接触的样本客户,在第二个周一时,获取一次未通过电销方式接触的样本客户,依次获取对每个周一对应的未通过电销方式接触的样本客户。

其中,对于同一未通过电销方式接触的样本客户,以其中一个周一为开始时间,在预设时长内可能没有针对贷款产品进行贷款,但是,在以下一个周一为开始时间,在预设时长内可能会针对贷款产品进行贷款。例如,对于一个未通过电销方式接触的样本客户,当以预设时间点2020年8月3日为开始时间,在30天内,即在2020年9月1日之前没有针对贷款产品进行贷款,但是,该样本客户在2020年9月4日针对贷款产品进行贷款,因此,当以预设时间点2020年8月10日为开始时间,在30天内,即在2020年9月8日之前针对贷款产品进行贷款。

需要说明的是,第二训练样本集中的所有预设时间点包含多个不同的时间点时,任意相邻两个预设时间点之间的间隔可以相同,也可以不同。例如,每隔固定时长获取不同的预设时间点,或者,根据需求选择不同的时间点作为预设时间点,本发明对此不限制。

S402、根据第一训练样本集和第二训练样本集,训练初始的概率预估模型,获得预设概率预估模型。

本步骤中,初始的概率预估模型例如为LGBM模型。

如图5所示,将第一训练样本集的属性信息、以所述目标接触方式接触所述样本客户的时间点以及第一标签,以及第二训练样本集的属性信息、预设时间点和第二标签输入到LGBM模型中,对LGBM模型进行训练,获得预设概率预估模型。

可选的,S402的一种可能的实现方式为:

S4021、根据第二训练样本集,训练初始的概率预估模型,获得中间预设概率预估模型;

本步骤中,由于未通过电销方式接触的样本客户的数量多于通过电销方式接触的样本客户的数量。因此,首先,将第二训练样本集中各样本客户的属性信息、预设时间点和第二标签输入到LGBM模型,对LGBM模型进行训练。

其中,训练时,对于每个样本客户,LGBM模型根据该样本客户的属性信息,计算样本客户未通过电销方式接触时在预设时长内是否办理贷款业务,将计算结果与该样本客户对应的第二标签进行比较,根据比较结果训练LGBM模型,获得中间预设概率预估模型。

S4022、根据第一训练样本集,训练中间预设概率预估模型,获得预设概率预估模型。

本步骤中,通过第二训练样本集训练获得的中间预设概率预估模型,可以用于预测未通过电销方式接触客户时,在预设时长内针对贷款产品进行贷款概率高的客户,而本发明需要获取的是通过电销方式接触客户后,在预设时长内针对贷款产品进行贷款概率高的客户。因此,对于中间预设概率预估模型,需要根据第一训练样本集进行训练优化,以使最终获得的预设概率预估模型计算获得的预估概率尽可能的准确。

其中,根据第一训练样本集中各样本客户,训练中间预设概率预估模型的具体实现方式可参考S4021,此处不再赘述。

可选的,在S402之后,方法还包括:

S403、在对客户通过目标接触方式进行接触后,预设时长内客户针对目标产品未转化,则将客户作为第一训练样本集中的样本客户,获得更新后的第一训练样本集。

本步骤中,通过预设概率预估模型获取的是客户的预估概率,因此,实际中,即使预估概率的值较大,通过电销方式接触该客户后,该客户也可能在预设时长内不办理贷款业务。因此,需要对预设概率预估模型进行持续的训练优化,提高模型的质量。例如,可以将根据预估概率确定的需通过电销接触方式进行接触的,但是在预设时长内没有办理贷款业务的客户添加到第一训练样本集中,作为第一训练样本集中的样本客户,获得更新后的第一训练样本。

例如,对于预估概率大于预设概率的客户,在2020年8月1日通过电销方式接触后,如果在到达2020年8月31日后仍然没有办理贷款业务,则将该客户作为第一训练样本集中的样本客户,对预设概率预估模型进行优化。

可选的,S403的一种可能的实现方式为:将客户作为第一训练样本集中的多份样本客户,获得更新后的第一训练样本集。

本步骤中,为了提高对预设概率预估模型训练优化后,预设概率预估模型的质量,对于实际转化结果与预估概率有差异的客户,将其作为多份样本客户添加至第一训练样本集中。即根据该客户的属性信息以及标签,多次训练优化预设概率预估模型,从而提高预设概率预估模型对客户的属性信息的分析处理能力,从而使获得的预估概率所反映的客户的转化情况与实际转化情况更一致。

S404、根据更新后的第一训练样本集,对预设概率预估模型进行优化。

本步骤中,在对预设概率预估模型进行优化时,针对每个样本客户,预设概率预估模型根据该样本客户的属性信息,计算该样本客户的预估概率。该预估概率与该样本客户的标签一致,例如,如果该样本客户的标签指示该样本客户电销方式接触后的预设时长内办理贷款业务,而根据该预估概率,可以说明该样本客户电销方式接触后的预设时长内办理贷款业务。或者,该预估概率与该样本客户的标签不一致,例如,如果该样本客户的标签指示该样本客户电销方式接触后的预设时长内没有办理贷款业务,而根据该预估概率,可以说明该样本客户电销方式接触后的预设时长内办理贷款业务。也就是说,预设概率预估模型输出的预估概率并不能与实际上客户是否办理贷款业务的真实情况之间存在差异。因此,通过预设概率预估模型输出的预估概率与实际上客户是否办理贷款业务的真实情况的差异对预设概率预估模型进行优化。

具体的,获取预设概率预估模型输出的预估概率与实际上客户是否办理贷款业务的真实情况之间的差异,根据差异和预设概率预估模型的损失函数确定损失值,根据损失值对预设概率预估模型进行优化。

其中,在对客户通过电销接触方式进行接触后,预设时长内客户没有办理贷款业务,说明预设概率预估模型预估的该客户的预估概率不准确,因此,将该客户作为样本客户对预设概率预估模型进行优化。

其中,为了提高预设概率预估模型的质量,提高这些样本客户的属性信息对预设概率预估模型的影响程度。因此,可以提高这些样本客户对应的损失值的权重,提高预设概率预估模型对客户的属性信息的分析处理能力,从而使获得的预估概率所反映的客户的转化情况与实际转化情况更一致。

需要说明的是,图4实施例中方法的执行主体可以与图2实施例中的执行主体为同一执行主体,或者为不同的执行主体,本发明对此不限制。

图6为本发明一实施例提供的数据处理装置的结构示意图。如图6所示,数据处理装置可以包括:

获取模块601,用于获取本地存储的客户的属性信息;

预估模块602,用于将客户的属性信息输入到目标业务的预设概率预估模型中,获得客户的预估概率,预估概率用于表示通过目标接触方式接触客户后,客户在预设时长内针对目标业务转化的概率;

确定模块603,用于若根据客户的预估概率,确定需通过目标接触方式进行接触客户,则向业务人员的终端发送接触提示信息,接触提示信息用于提示针对目标业务通过目标接触方式接触客户。

本实施例提供的数据处理装置,可以用于执行前述任一方法实施例提供的技术方案,其实现原理和技术效果类似,通过对客户进行筛选,获取通过目标方式接触后,在预设时长内针对目标业务转化率高的客户,对这些客户通过目标方式接触,减少通过目标方式接触的客户的数量的基础上,提高客户的转化率。

在一种可能的实现方式中,预设概率预估模型是根据第一训练样本集和第二训练样本集训练获得的;

第一训练样本集包含:通过目标接触方式接触的样本客户的属性信息、以目标接触方式接触样本客户的时间点以及第一标签,第一标签用于表示以目标接触方式接触样本客户的时间点起预设时长内是否针对目标产品转化;

第二训练样本集包含:未通过目标接触方式接触的样本客户的属性信息、预设时间点以及第二标签,第二标签用于表示以预设时间点起预设时长内是否针对目标产品转化。

在一种可能的实现方式中,以目标接触方式接触样本客户的时间点与获取客户的属性信息的时间点之间的间隔时长大于或等于预设时长;

预设时间点与获取客户的属性信息的时间点之间的间隔时长大于或等于预设时长。

在一种可能的实现方式中,数据处理装置还包括:训练模块604;

获取模块601,还用于获取第一训练样本集和第二训练样本集;

训练模块604,用于根据第一训练样本集和第二训练样本集,训练初始的概率预估模型,获得预设概率预估模型。

在一种可能的实现方式中,训练模块604根据第一训练样本集和第二训练样本集,训练初始的概率预估模型,获得预设概率预估模型时,具体用于:

根据第二训练样本集,训练初始的概率预估模型,获得中间预设概率预估模型;

根据第一训练样本集,训练中间预设概率预估模型,获得预设概率预估模型。

在一种可能的实现方式中,获取模块601获取第二训练样本集,具体用于:

在同一个预设时间点获取未通过目标接触方式接触的不同样本客户中每个样本客户的属性信息以及第二标签;或者,

在多个不同预设时间点分别获取未通过目标接触方式接触的同一样本客户的属性信息以及第二标签。

在一种可能的实现方式中,获取模块601,还用于:

在对客户通过目标接触方式进行接触后,预设时长内客户针对目标产品未转化,则将客户作为第一训练样本集中的样本客户,获得更新后的第一训练样本集;

训练模块604,还用于:

根据更新后的第一训练样本集,对预设概率预估模型进行优化。

在一种可能的实现方式中,获取模块601将客户作为第一训练样本集中的样本客户,获得更新后的第一训练样本集时,具体用于:

将客户作为第一训练样本集中的多份样本客户,获得更新后的第一训练样本集。

在一种可能的实现方式中,属性信息包括如下至少一项:所属的行业信息、名称、地址、提款信息。

前述任一实施例提供的数据处理装置,用于执行前述任一方法实施例的技术方案,其实现原理和技术效果类似,在此不再赘述。

图7为本发明一实施例提供的电子设备的结构示意图,如图7所示,该电子设备包括:存储器72、处理器71及存储在所述存储器72上并可在所述处理器71上运行的计算机程序,所述计算机程序被所述处理器71执行时实现前述任一方法实施例提供的数据处理方法的步骤。

可选的,电子设备还可以包括显示器73。

该电子设备的上述各个器件之间可以通过总线连接。

存储器72可以是单独的存储单元,也可以是集成在处理器71中的存储单元。处理器71的数量为一个或者多个。

在上述在电子设备的实现中,存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互,也就是存储器和处理器可以通过接口连接,也可以集成在一起。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(ProgrammableRead-Only Memory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。进一步地,上述存储器内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。

处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、图像处理器等,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任一方法实施例提供的数据处理方法的步骤

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 移动设备的数据处理方法、装置、存储介质和移动设备
  • 行驶设备的数据处理方法、装置、设备及存储介质
技术分类

06120112153204