掌桥专利:专业的专利平台
掌桥专利
首页

业务办理数量的预测方法、装置、设备及存储介质

文献发布时间:2024-04-18 20:00:50


业务办理数量的预测方法、装置、设备及存储介质

技术领域

本申请涉及通信技术领域,尤其涉及一种业务办理数量的预测方法、装置、设备及存储介质。

背景技术

在对用户进行业务营销的场景中,营业厅的业务办理效率对于业务营销起着至关重要的作用。为了提高营业厅的业务办理效率,减少用户排队等待时间,给用户更加优质的服务体验。需要提前预测的营业厅业务办理数量,并基于预测的营业厅业务办理数量对营业厅的业务资源进行优化。

相关技术中,主要是将营业厅的历史业务办理数据输入机器学习模型,预测营业厅的业务办理数量。但是,不同营业员的业务能力不同,营业厅中每天值班的营业员也可能不同,这样,预测营业厅的业务办理数量的准确率较低。

发明内容

本申请提供一种业务办理数量的预测方法、装置、设备及存储介质,以至少解决相关技术中预测营业厅的业务办理数量的准确率较低的技术问题。本申请的技术方案如下:

根据本申请实施例的第一方面,提供一种业务办理数量的预测方法,包括:获取第一预设时间段内的第一数据和第二数据;第一数据包括目标营业厅中每个营业员的业务数据,和/或,个人信息数据;第二数据包括目标营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项;将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据;将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量;将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。

在一种可能的实施方式中,上述业务数据包括:办理业务数量和办理业务时长;个人信息数据包括:每个营业员的绩效信息、每个营业员的工作年限、每个营业员的学历信息、每个营业员的岗位信息、每个营业员的岗位等级中的至少一项;访客信息包括:客户访问日期类型;归属区域的区域信息包括:目标营业厅所在区域的人流量、目标营业厅所在区域的公共交通信息、目标营业厅所在区域的消费水平、目标营业厅所在区域中除目标营业厅以外的其它营业厅的数量中的至少一项。

在一种可能的实施方式中,上述方法还包括:获取训练数据;训练数据包括第一训练数据、第二训练数据和第三训练数据;第一训练数据包括第二预设时间段内的多个营业员的业务数据,和/或,个人信息数据;第二训练数据包括第二预设时间段内的多个营业厅中,每个营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项;第三训练数据包括第一预测模型根据第三预设时间段的第一数据预测得到的每个营业员的业务办理能力数据;第三预设时间段位于第一预设时间段之前,第二时间段位于第三预设时间段之前;根据第一训练数据训练初始第一预测模型,直到初始第一预测模型中的超参数满足预设条件,以得到第一预测模型;第一预测模型包括:随机森林模型;以及,根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型;第二模型包括:门控循环单元GRU模型。

在一种可能的实施方式中,上述获取训练数据,包括:获取原始数据;对原始数据进行预处理,得到第一原始数据;对第一原始数据进行降维处理,得到训练数据。

在一种可能的实施方式中,上述对原始数据进行预处理,得到第一原始数据,包括:根据原始数据中的中位数,对原始数据中的缺失数据进行补齐处理;以及,对原始数据中的数值数据,进行归一化处理;以及,对原始数据中的非数值数据,进行标签编码处理,得到第一原始数据。

在一种可能的实施方式中,上述对第一原始数据进行降维处理,得到训练数据,包括:将第一原始数据中,与预设的冗余数据库中数据相同的第一冗余数据删除,得到第二原始数据;将第二原始数据输入到主成分分析算法中,得到第三原始数据;主成分分析算法用于将第二原始数据中冗余的线性数据删除;将第三原始数据输入到分布随机邻域嵌入算法中,得到训练数据;分布随机邻域嵌入算法用于将第三原始数据中冗余的非线性数据删除。

根据本申请实施例的第二方面,提供一种业务办理数量的预测装置,获取单元、输入单元和确定单元;获取单元,用于获取第一预设时间段内的第一数据和第二数据;第一数据包括目标营业厅中每个营业员的业务数据,和/或,个人信息数据;第二数据包括目标营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项;输入单元,用于将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据;输入单元,还用于将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量;确定单元,用于将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。

在一种可能的实施方式中,上述业务办理数量的预测装置中,业务数据包括:办理业务数量和办理业务时长;个人信息数据包括:每个营业员的绩效信息、每个营业员的工作年限、每个营业员的学历信息、每个营业员的岗位信息、每个营业员的岗位等级中的至少一项;访客信息包括:客户访问日期类型;归属区域的区域信息包括:目标营业厅所在区域的人流量、目标营业厅所在区域的公共交通信息、目标营业厅所在区域的消费水平、目标营业厅所在区域中除目标营业厅以外的其它营业厅的数量中的至少一项。

在一种可能的实施方式中,上述业务办理数量的预测装置中,还包括:训练单元;

获取单元,还用于获取训练数据;训练数据包括第一训练数据、第二训练数据和第三训练数据;第一训练数据包括第二预设时间段内的多个营业员的业务数据,和/或,个人信息数据;第二训练数据包括第二预设时间段内的多个营业厅中,每个营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项;第三训练数据包括第一预测模型根据第三预设时间段的第一数据预测得到的每个营业员的业务办理能力数据;第三预设时间段位于第一预设时间段之前,第二时间段位于第三预设时间段之前;训练单元,用于根据第一训练数据训练初始第一预测模型,直到初始第一预测模型中的超参数满足预设条件,以得到第一预测模型;第一预测模型包括:随机森林模型;以及,训练单元,还用于根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型;第二模型包括:门控循环单元GRU模型。

在一种可能的实施方式中,上述业务办理数量的预测装置中,获取单元,具体用于:获取原始数据;对原始数据进行预处理,得到第一原始数据;对第一原始数据进行降维处理,得到训练数据。

在一种可能的实施方式中,上述业务办理数量的预测装置中,获取单元,具体用于:根据原始数据中的中位数,对原始数据中的缺失数据进行补齐处理;以及,对原始数据中的数值数据,进行归一化处理;以及,对原始数据中的非数值数据,进行标签编码处理,得到第一原始数据。

在一种可能的实施方式中,上述业务办理数量的预测装置中,获取单元,具体用于:将第一原始数据中,与预设的冗余数据库中数据相同的第一冗余数据删除,得到第二原始数据;将第二原始数据输入到主成分分析算法中,得到第三原始数据;主成分分析算法用于将第二原始数据中冗余的线性数据删除;将第三原始数据输入到分布随机邻域嵌入算法中,得到训练数据;分布随机邻域嵌入算法用于将第三原始数据中冗余的非线性数据删除。

根据本申请实施例的第三方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现上述第一方面及其任一种可能的实施方式的方法。

根据本申请实施例的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面中及其任一种可能的实施方式的方法。

根据本申请实施例的第五方面,提供一种计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式的方法。

本申请的实施例提供的第一方面的技术方案至少带来以下有益效果:

本申请实施例提供的技术方案,通过获取第一预设时间段内的第一数据和第二数据,并将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据。将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量。进一步的,将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。这样,先确定出目标营业厅中每个营业员的业务办理能力数据,再根据每个营业员的业务办理能力数据和第二数据,确定出每个营业员的业务办理数量。根据目标营业厅中每个营业员的业务办理数量,预测得到目标营业厅的业务办理数量。不仅考虑了目标营业厅中不同营业员业务办理能力,还考虑到了目标营业厅的访客信息、位置信息和归宿区域的区域信息,可以提高预测目标营业厅的业务办理数量的准确率。

需要说明的是,第二方面至第五方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。

图1是根据一示例性实施例示出的一种业务办理数量的预测系统的结构示意图;

图2是根据一示例性实施例示出的一种业务办理数量的预测方法的流程图;

图3是根据一示例性实施例示出的又一种业务办理数量的预测方法的流程图;

图4是根据一示例性实施例示出的又一种业务办理数量的预测方法的流程图;

图5是根据一示例性实施例示出的一种业务办理数量的预测装置的框图;

图6是根据一示例性实施例示出的又一种业务办理数量的预测装置的框图;

图7是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在对本申请提供的资源部署方法进行详细介绍之前,先对本申请涉及的应用场景进行简单介绍。

在现实生活中,很多问题和事物的发展与时间发展变化存在关系,比如市场的潜力预测、销量预测、利率波动和收益率变化等。通常需要通过研究该问题或者事物过去发展的历史记录,得到其发展的规律。时间序列模型不需要建立因果关系模型,仅需要变量本身的数据就可以建模。在深度学习的领域中常用的时间序列模型分析方法有循环神经网络(Recurrent neural network,RNN)、长短期记忆(Long short-term memory,LSTM)、门控循环单元(Gate recurrent unit,GRU)等。

其中,RNN模型在序列太长时会发生梯度消失的问题,导致参数只能捕捉到局部关系,无法学习到长期关联,对序列前部的词记忆能力较弱,LSTM模型利用记忆通道在一定程度上缓解了RNN模型梯度消失、无法捕捉到长期关联的问题。但是LSTM模型参数量太大,GRU模型相比较LSTM模型内部结构进行了简化,在数据量不是很大的情况下,在一定程度上保证使用较少的参数来缓解梯度消失的问题,而且训练收敛速度更快,同时准确率也得到了提升。

在对用户进行业务营销的场景中,营业厅作为用户营销服务的核心阵地,它关乎于企业的名誉、利润,以及客户的切身利益,需要承担起稳盘托底的作用。营业厅的业务办理效率对于业务营销起着至关重要的作用。为了提高营业厅的业务办理效率,减少用户排队等待时间,给用户更加优质的服务体验。需要提前预测的营业厅业务办理数量,并基于预测的营业厅业务办理数量对营业厅的业务资源进行优化。

相关技术中,主要是将营业厅的历史业务办理数据输入机器学习模型,预测营业厅的业务办理数量。但是,不同营业员的业务能力不同,营业厅中每天值班的营业员也可能不同,这样,预测营业厅的业务办理数量的准确率较低。

在对本申请提供的业务办理数量的预测方法进行详细介绍之前,先对本申请涉及的实施环境(实施架构)进行简单介绍。

本申请实施例提供的业务办理数量的预测方法可以适用于业务办理数量的预测系统。图1示出了该业务办理数量的预测系统的一种结构示意图。如图1所示,业务办理数量的预测系统10包括营业厅数据的存储设备11和电子设备12。存储设备11与电子设备12采用有线或无线的连接方式连接。

电子设备12可以用于与存储设备11进行数据交互,例如,从存储设备11中获取第一预设时间段内的第一数据和第二数据;第一数据包括目标营业厅中每个营业员的业务数据,和/或,个人信息数据;第二数据包括目标营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项。

进一步的,电子设备12还用于将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据。

电子设备12还用于将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量。

电子设备12还用于将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。

可选的,该存储设备11和电子设备12均可以是物理机,例如:存储设备11和电子设备12可以为台式电脑,又称台式机或桌面机(desktop computer)、服务器,也可以为多个服务器组成的服务器群。

可选的,上述电子设备12也可以通过部署在物理机上的虚拟机(virtualmachine,VM),实现上述电子设备12所要实现的功能。

需要说明的,电子设备12和存储设备11可以为相互独立的设备,也可以集成于同一设备中,本申请对此不作具体限定。

当电子设备12和存储设备11集成于同一设备时,电子设备12和存储设备11之间的通信方式为该设备内部模块之间的通信。这种情况下,二者之间的通信流程与“电子设备12和存储设备11之间相互独立的情况下,二者之间的通信流程”相同。

在本申请提供的以下实施例中,本申请以电子设备12和存储设备11相互独立设置为例进行说明。

为了便于理解,以下结合附图对本申请提供的业务办理数量的预测方法进行具体介绍。

图2是根据一示例性实施例示出的一种业务办理数量的预测方法的流程图,该方法可以应用于电子设备,也可以应用于与电子设备连接或者位于电子设备内部的业务办理数量的预测装置。以下,以该方法应用于电子设备为例,对该方法进行说明,如图2所示,该业务办理数量的预测方法包括以下步骤:

S201、电子设备获取第一预设时间段内的第一数据和第二数据。

其中,第一数据包括目标营业厅中每个营业员的业务数据,和/或,个人信息数据。业务数据包括:办理业务数量和办理业务时长;个人信息数据包括:每个营业员的绩效信息、每个营业员的工作年限、每个营业员的学历信息、每个营业员的岗位信息、每个营业员的岗位等级中的至少一项。

第二数据包括目标营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项。访客信息包括:客户访问日期类型;归属区域的区域信息包括:目标营业厅所在区域的人流量、目标营业厅所在区域的公共交通信息、目标营业厅所在区域的消费水平、目标营业厅所在区域中除目标营业厅以外的其它营业厅的数量中的至少一项。

作为一种可能的实现方式,电子设备从存储营业员的数据库中获取到在第一预设时间段内的目标营业员的业务数据,和/或,个人信息数据。电子设备从存储营业厅的数据库中获取到在第一预设时间段内的第二数据。

示例性的,办理业务为为客户进行开户,办理业务数量为100,100为营业员历史办理业务的全部数量,办理业务时长为4分钟,4分钟为该营业员办理一个业务的时长。

营业员的绩效信息包括A级别、B级别、C级别和D级别,A级别、B级别、C级别和D级别的绩效依次变差。

营业员的岗位等级包括a等级、b等级、c等级和d等级,a等级、b等级、c等级和d等级的岗位等级依次变低。

客户访问类型包括客户访问当天是否为周末,以及是否为节假日。

目标营业厅所在区域的公共交通信息包括目标营业厅所在区域的公交数量、公交距离、地铁数量和地铁距离。

S202、电子设备将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据。

作为一种可能的实现方式,电子设备将第一数据输入到预先训练好的第一预测模型中,第一预设模型对第一数据进行处理计算,输出每个营业员的业务办理能力数据。

示例性的,业务办理能力数据可以为营业员每天可以完成办理业务的数量,也可以为营业员的业务办理能力评级。业务办理能力评级可以包括6个由低到高的级别。

S203、电子设备将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量。

作为一种可能的实现方式,电子设备将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,第二预测模型对第二数据和每个营业员的业务能力数据进行处理计算,输出与每个营业员一一对应的多个业务办理数量。

需要说明的,多个业务办理数量对应的多个营业员为目标营业厅中全部营业员。

S204、电子设备将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。

作为一种可能的实现方式,电子设备计算得到多个业务办理数量的和,并将多个业务办理数量的和,确定为预测目标营业厅的业务办理数量。

可以理解的,本申请实施例提供的技术方案,通过获取第一预设时间段内的第一数据和第二数据,并将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据。将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量。进一步的,将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。这样,先确定出目标营业厅中每个营业员的业务办理能力数据,再根据每个营业员的业务办理能力数据和第二数据,确定出每个营业员的业务办理数量。根据目标营业厅中每个营业员的业务办理数量,预测得到目标营业厅的业务办理数量。不仅考虑了目标营业厅中不同营业员业务办理能力,还考虑到了目标营业厅的访客信息、位置信息和归宿区域的区域信息,可以提高预测目标营业厅的业务办理数量的准确率。

在一些实施例中,为了能够训练得到第一预测模型和第二预测模型,如图3所示,本申请实施例提供的业务办理数量的预测方法,还包括以下步骤:

S301、电子设备获取训练数据。

其中,训练数据包括第一训练数据、第二训练数据和第三训练数据;第一训练数据包括第二预设时间段内的多个营业员的业务数据,和/或,个人信息数据;第二训练数据包括第二预设时间段内的多个营业厅中,每个营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项;第三训练数据包括第一预测模型根据第三预设时间段的第一数据预测得到的每个营业员的业务办理能力数据;第三预设时间段位于第一预设时间段之前,第二时间段位于第三预设时间段之前。

作为一种可能的实现方式,电子设备获取原始数据,并对原始数据进行预处理,得到第一原始数据。以及对第一原始数据进行降维处理,得到训练数据。

S302、电子设备根据第一训练数据训练初始第一预测模型,直到初始第一预测模型中的超参数满足预设条件,以得到第一预测模型。

其中,第一预测模型包括:随机森林模型。

作为一种可能的实现方式,电子设备根据第一训练数据训练初始第一预测模型,初始第一预测模型在训练的过程中,通过网格搜索或者随机搜索选择最佳的超参数,并将最佳的超参数作为第一预测模型中的超参数。

在实际应用过程中,电子设备还根据测试数据测试第一预测模型,若测试集数据预测的误差大于预设误差时,则重新调整第一模型中的超参数,并重新进行训练。

S303、以及,电子设备根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型。

其中,第二模型包括:门控循环单元GRU模型。

作为一种可能的实现方式,电子设备根据第二训练数据和第三训练数据训练初始第二预测模型。在每次训练初始第二预测模型完成后,电子设备根据测试数据测试每次训练初始第二预测模型完成的模型预测到的业务办理数量,与实际业务办理数量的差值。若差值小于预设差值,则电子设备将该模型确定为第二预测模型。

若差值大于或者等于预设差值,则电子设备重新训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型。

示例性的,电子设备根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于3,以得到第二预测模型。

可以理解的,本申请实施例提供的技术方案,通过获取训练数据,根据第一训练数据训练初始第一预测模型,直到初始第一预测模型中的超参数满足预设条件,以得到第一预测模型。以及,根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型。这样,提供了一种训练得到第一预测模型和第二预测模型的方法。并且,在训练得到第二预测模型时,门控循环单元GRU模型相比LSTM时序模型,可以减少模型的参数量,还可以避免训练过程中容易出现梯度消失的技术问题,还可以提高训练的收敛速度。

在一些实施例中,为了能够获取训练数据,如图4所示,本申请实施例提供的业务办理数量的预测方法中,上述S301具体包括以下步骤:

S401、电子设备获取原始数据。

示例性的,如下表1所示,电子设备获取到的原始数据如下表1所示:

表1原始数据

S402、电子设备对原始数据进行预处理,得到第一原始数据。

作为一种可能的实现方式,电子设备根据原始数据中的中位数,对原始数据中的缺失数据进行补齐处理。

以及,对原始数据中的数值数据,进行归一化处理。

以及,对原始数据中的非数值数据,进行标签编码处理,得到第一原始数据。

示例性的,电子设备获取到多个营业员的多个历史开户量,但是包括1个营业员的历史开户量为缺失数据,电子设备根据多个历史开户量的中位数,对缺失数据进行补齐处理。

电子设备将原始数据中的数值数据,放缩到0到1之间。

电子设备对原始数据中的非数值数据,使用标签编码(Label Encoder)对非数值类型信息进行编码,得到编码后的第一原始数据。

S403、电子设备对第一原始数据进行降维处理,得到训练数据。

作为一种可能的实现方式,电子设备将第一原始数据中,与预设的冗余数据库中数据相同的第一冗余数据删除,得到第二原始数据。

将第二原始数据输入到主成分分析算法中,得到第三原始数据。

将第三原始数据输入到分布随机邻域嵌入算法中,得到训练数据。

需要说明的,主成分分析算法用于将第二原始数据中冗余的线性数据删除。主成分分析算法用于选择具有最大方差的前k个特征向量的线性组合,实现线性降维功能。

分布随机邻域嵌入算法用于将第三原始数据中冗余的非线性数据删除。分布随机邻域嵌入算法用于最小化原始高维空间和低维空间的之间的概率分布之间的散度,实现非线性降维。

在实际应用过程中,预设的冗余数据库中存储领域知识,领域知识为预先确定出的第一冗余数据。

电子设备可以将上述冗余数据添加进上述的冗余数据库中,实现更新冗余数据库中的冗余数据功能,可以减少线性降维和非线性降维的计算量,可以提高运算效率。

电子设备可以先将第二原始数据输入到分布随机邻域嵌入算法中,得到第三原始数据。电子设备再将第三原始数据输入到主成分分析算法中,得到训练数据。

电子设备也可以先将第二原始数据输入到主成分分析算法中,得到第三原始数据。电子设备再将第三原始数据输入到分布随机邻域嵌入算法中,得到训练数据。

可以理解的,本申请实施例提供的技术方案,通过获取原始数据。对原始数据进行预处理,得到第一原始数据。对第一原始数据进行降维处理,得到训练数据。这样,对原始数据进行预处理,可以统一原始数据中的数据分布。对第一原始数据进行降维处理,可以将第一原始数据降低到更低的维度的同时,保留尽可能多的数据,可以降低训练得到第一预测模型和第二预测模型的训练时间,提高训练效率。

上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,业务办理数量的预测装置或电子设备包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法,示例性的对业务办理数量的预测装置或电子设备进行功能模块的划分,例如,业务办理数量的预测装置或电子设备可以包括对应各个功能划分的各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

例如,本申请实施例还提供两种业务办理数量的预测装置。

在一些实施例中,图5是根据一示例性实施例示出的一种业务办理数量的预测装置的框图。参照图5,该业务办理数量的预测装置500包括获取单元501、输入单元502和确定单元503。

获取单元501,用于获取第一预设时间段内的第一数据和第二数据;第一数据包括目标营业厅中每个营业员的业务数据,和/或,个人信息数据;第二数据包括目标营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项。

输入单元502,用于将第一数据输入到预先训练好的第一预测模型中,以预测得到每个营业员的业务办理能力数据。

输入单元502,还用于将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量。

确定单元503,用于将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。

可选的,如图5所示,业务数据包括:办理业务数量和办理业务时长;个人信息数据包括:每个营业员的绩效信息、每个营业员的工作年限、每个营业员的学历信息、每个营业员的岗位信息、每个营业员的岗位等级中的至少一项。

访客信息包括:客户访问日期类型;归属区域的区域信息包括:目标营业厅所在区域的人流量、目标营业厅所在区域的公共交通信息、目标营业厅所在区域的消费水平、目标营业厅所在区域中除目标营业厅以外的其它营业厅的数量中的至少一项。

可选的,如图5所示,本申请实施例提供的业务办理数量的预测装置500还包括:训练单元504。

获取单元501,还用于获取训练数据;训练数据包括第一训练数据、第二训练数据和第三训练数据;第一训练数据包括第二预设时间段内的多个营业员的业务数据,和/或,个人信息数据;第二训练数据包括第二预设时间段内的多个营业厅中,每个营业厅的访客信息、位置信息和归属区域的区域信息中的至少一项;第三训练数据包括第一预测模型根据第三预设时间段的第一数据预测得到的每个营业员的业务办理能力数据;第三预设时间段位于第一预设时间段之前,第二时间段位于第三预设时间段之前。

训练单元504,用于根据第一训练数据训练初始第一预测模型,直到初始第一预测模型中的超参数满足预设条件,以得到第一预测模型;第一预测模型包括:随机森林模型。

以及,训练单元504,还用于根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型;第二模型包括:门控循环单元GRU模型。

可选的,如图5所示,本申请实施例提供的获取单元501,具体用于:

获取原始数据。

对原始数据进行预处理,得到第一原始数据。

对第一原始数据进行降维处理,得到训练数据。

可选的,如图5所示,本申请实施例提供的获取单元501,具体用于:

根据原始数据中的中位数,对原始数据中的缺失数据进行补齐处理。

以及,对原始数据中的数值数据,进行归一化处理。

以及,对原始数据中的非数值数据,进行标签编码处理,得到第一原始数据。

可选的,如图5所示,本申请实施例提供的获取单元501,具体用于:

将第一原始数据中,与预设的冗余数据库中数据相同的第一冗余数据删除,得到第二原始数据。

将第二原始数据输入到主成分分析算法中,得到第三原始数据;主成分分析算法用于将第二原始数据中冗余的线性数据删除。

将第三原始数据输入到分布随机邻域嵌入算法中,得到训练数据;分布随机邻域嵌入算法用于将第三原始数据中冗余的非线性数据删除。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

在一些实施例中,图6是根据一示例性实施例示出的又一种业务办理数量的预测装置的框图。参照图6,该业务办理数量的预测装置600包括数据获取单元601、数据预处理单元602、特征降维单元603、第一预测模型训练单元604、第二预测模型训练单元605和预测单元606。

数据获取单元601用于获取原始数据和第一预设时间段内的第一数据和第二数据。

数据预处理单元602用于根据原始数据中的中位数,对原始数据中的缺失数据进行补齐处理;以及,对原始数据中的数值数据,进行归一化处理;以及,对原始数据中的非数值数据,进行标签编码处理,得到第一原始数据。

特征降维单元603用于将第一原始数据中,与预设的冗余数据库中数据相同的第一冗余数据删除,得到第二原始数据;将第二原始数据输入到主成分分析算法中,得到第三原始数据;主成分分析算法用于将第二原始数据中冗余的线性数据删除;将第三原始数据输入到分布随机邻域嵌入算法中,得到训练数据;分布随机邻域嵌入算法用于将第三原始数据中冗余的非线性数据删除。

第一预测模型训练单元604用于根据第一训练数据训练初始第一预测模型,直到初始第一预测模型中的超参数满足预设条件,以得到第一预测模型;第一预测模型包括:随机森林模型。

第二预测模型训练单元605用于根据第二训练数据和第三训练数据训练初始第二预测模型,直到初始第二预测模型预测到的业务办理数量,与实际业务办理数量的差值小于预设差值,以得到第二预测模型;第二模型包括:门控循环单元GRU模型。

预测单元606用于根据输入的第一数据,预测得到每个营业员的业务办理能力数据。将第二数据和每个营业员的业务办理能力数据,输入到预先训练好的第二预测模型中,以预测得到与每个营业员一一对应的多个业务办理数量;将多个业务办理数量之和,确定为预测目标营业厅的业务办理数量。

图7是根据一示例性实施例示出的一种电子设备的框图。如图7所示,电子设备700包括但不限于:处理器701和存储器702。

其中,上述的存储器702,用于存储上述处理器701的可执行指令。可以理解的是,上述处理器701被配置为执行指令,以实现上述实施例中的业务办理数量的预测方法。

需要说明的是,本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图7所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

处理器701是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器702内的软件程序和/或模块,以及调用存储在存储器702内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器701可包括一个或多个处理单元。可选的,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。

存储器702可用于存储软件程序以及各种数据。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能模块所需的应用程序(比如确定单元、处理单元等)等。此外,存储器702可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器702,上述指令可由电子设备700的处理器701执行以实现上述实施例中的业务办理数量的预测方法。

在实际实现时,图5中的获取单元501、输入单元502、确定单元503和训练单元504,以及图6中的数据获取单元601、数据预处理单元602、特征降维单元603、第一预测模型训练单元604、第二预测模型训练单元605和预测单元606的功能均可以由图7中的处理器701调用存储器702中存储的计算机程序实现。其具体的执行过程可参考上实施例中的业务办理数量的预测方法部分的描述,这里不再赘述。

可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,该非临时性计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存储存储器(Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,本申请实施例还提供了一种包括一条或多条指令的计算机程序产品,该一条或多条指令可以由电子设备的处理器701执行以完成上述实施例中的业务办理数量的预测方法。

需要说明的是,上述计算机可读存储介质中的指令或计算机程序产品中的一条或多条指令被电子设备的处理器执行时实现上述业务办理数量的预测方法实施例的各个过程,且能达到与上述业务办理数量的预测方法相同的技术效果,为避免重复,这里不再赘述。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全分类部或者部分功能。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全分类部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全分类部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全分类部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

技术分类

06120116545917