掌桥专利:专业的专利平台
掌桥专利
首页

一种任务指标数据预测方法和系统

文献发布时间:2023-06-19 09:57:26


一种任务指标数据预测方法和系统

技术领域

本说明书实施例涉及数据处理技术领域,特别涉及一种任务指标数据预测方法和系统。

背景技术

随着社会经济的发展,越来越多的店铺应运而生,例如,线上店铺和线下店铺。在店铺的实际运营过程中,为了完成目标任务,例如,提高销量和/或利润,需要针对不同的店铺下发与目标任务对应的指标数据,以基于该指标数据对店铺的员工进行绩效考核。因此,有必要提出一种任务指标数据预测方法和系统,准确的预测指标数据,提高目标任务的完成度。

发明内容

本说明书实施例的一个方面提供一种任务指标数据预测方法,所述方法包括:获取与目标任务相关的原始数据,所述原始数据至少包括历史特征数据和时间数据;对所述原始数据进行预处理,得到初始时间特征矩阵;判断所述初始时间特征矩阵是否包括缺失数据;若是,则基于所述初始时间特征矩阵,利用预先训练好的生成器得到填充所述缺失数据后的目标时间特征矩阵,所述生成器基于生成对抗网络训练得到;利用预先训练好的预测模型对所述目标时间特征矩阵进行处理,确定所述目标任务的预测指标数据。

本说明书实施例的一个方面提供一种任务指标数据预测系统,所述系统包括:原始数据获取模块,用于获取与目标任务相关的原始数据,所述原始数据至少包括历史特征数据和时间数据;预处理模块,用于对所述原始数据进行预处理,得到初始时间特征矩阵;判断模块,用于判断所述初始时间特征矩阵是否包括缺失数据;填充模块,用于在包括所述缺失数据的情况下,则基于所述初始时间特征矩阵,利用预先训练好的生成器得到填充所述缺失数据后的目标时间特征矩阵,所述生成器基于生成对抗网络训练得到;确定模块,用于利用预先训练好的预测模型对所述目标时间特征矩阵进行处理,确定所述目标任务的预测指标数据。

本说明书实施例的一个方面提供一种任务指标数据预测装置,所述装置包括处理器以及存储器,所述存储器用于存储指令,所述处理器用于执行所述指令,以实现如前任一项所述的任务指标数据预测方法对应的操作。

本说明书实施例的一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,所述计算机指令被处理器执行时,实现如前任一项所述的任务指标数据预测方法对应的操作。

本说明书实施例的一个方面提供一种用于填充缺失数据的生成器的训练方法,所述生成器基于生成对抗网络训练得到,所述生成对抗网络包括生成器和判别器,所述方法包括:获取包括有缺失数据的多个第一训练样本,每个第一训练样本至少包括第一样本历史特征数据和第一样本时间数据;每个第一训练样本与目标任务相关;基于所述多个第一训练样本和所述判别器,迭代更新所述生成器的参数以减小各第一训练样本对应的第一目标损失函数值,得到训练好的生成器。

本说明书实施例的一个方面提供一种用于填充缺失数据的生成器的训练系统,所述生成器基于生成对抗网络训练得到,所述生成对抗网络包括生成器和判别器,所述系统包括:第一训练样本获取模块,用于获取包括有缺失数据的多个第一训练样本,每个第一训练样本至少包括第一样本历史特征数据和第一样本时间数据;每个第一训练样本与目标任务相关;生成器训练模块,用于基于所述多个第一训练样本和所述判别器,迭代更新所述生成器的参数以减小各第一训练样本对应的第一目标损失函数值,得到训练好的生成器。

本说明书实施例的一个方面提供一种用于填充缺失数据的生成器的训练装置,所述装置包括处理器以及存储器,所述存储器用于存储指令,其特征在于,所述处理器用于执行所述指令,以实现如前任一项所述的用于填充缺失数据的生成器的训练方法对应的操作。

本说明书实施例的一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,所述计算机指令被处理器执行时,实现如前任一项所述的用于填充缺失数据的生成器的训练方法对应的操作。

本说明书实施例的一个方面提供一种用于预测目标任务的指标数据的预测模型的训练方法,所述方法包括:获取包含完整数据的多个携带有第二标签的第二训练样本,每个第二训练样本包括第二样本历史特征数据和第二样本时间数据;所述第二训练样本与目标任务相关,所述第二标签用于表征所述目标任务的指标数据;基于所述多个第二训练样本迭代更新初始预测模型的参数以减小各第二训练样本对应的第三目标损失函数值,得到训练好的预测模型;其中,各第二训练样本对应的第三目标损失函数值通过以下过程确定:通过所述初始预测模型处理所述第二训练样本,得到所述目标任务的预测指标数据;至少基于所述预测指标数据和所述第二标签之间的差异,确定所述第三目标损失函数值。

本说明书实施例的一个方面提供一种用于预测目标任务的指标数据的预测模型的训练系统,所述系统包括:第二训练样本获取模块,用于获取包含完整数据的多个携带有第二标签的第二训练样本,每个第二训练样本包括第二样本历史特征数据和第二样本时间数据;所述第二训练样本与目标任务相关,所述第二标签用于表征所述目标任务的指标数据;预测模型训练模块,用于基于所述多个第二训练样本迭代更新初始预测模型的参数以减小各第二训练样本对应的第三目标损失函数值,得到训练好的预测模型;其中,各第二训练样本对应的第三目标损失函数值通过以下过程确定:通过所述初始预测模型处理所述第二训练样本,得到所述目标任务的预测指标数据;至少基于所述预测指标数据和所述第二标签之间的差异,确定所述第三目标损失函数值。

本说明书实施例的一个方面提供一种任务指标数据预测装置,所述装置包括处理器以及存储器,所述存储器用于存储指令,所述处理器用于执行所述指令,以实现如前所述用于预测目标任务的指标数据的预测模型的训练方法对应的操作。

本说明书实施例的一个方面提供一种计算机可读存储介质,所述计算机指令被处理器执行时,实现如前所述的用于预测目标任务的指标数据的预测模型的训练方法对应的操作。

附图说明

本说明书将以示例性实施例的方式进一步描述,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:

图1是根据本说明书的一些实施例所示的任务指标数据预测系统的应用场景示意图;

图2是根据本说明书的一些实施例所示的任务指标数据预测方法的流程图;

图3是根据本说明书的一些实施例所示的确定目标时间特征矩阵的流程图;

图4是根据本说明书的一些实施例所示的用于填充缺失数据的生成器的训练方法的流程图;

图5是根据本说明书的一些实施例所示的确定第一目标损失函数值的流程图;

图6是根据本说明书的一些实施例所示的确定第一目标损失函数值的流程图;

图7是根据本说明书的一些实施例所示的用于填充缺失数据的生成器的训练方法的示意性流程图;

图8是根据本说明书的一些实施例所示的用于预测目标任务的指标数据的预测模型的训练方法的流程图;

图9是根据本说明书的一些实施例所示的任务指标数据预测系统的模块图;

图10是根据本说明书的一些实施例所示的用于填充缺失数据的生成器的训练系统的模块图;

图11是根据本说明书的一些实施例所示的用于预测目标任务的指标数据的预测模型的训练系统的模块图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。

图1是根据本说明书的一些实施例所示的任务指标数据预测系统的应用场景示意图。

如图1所示,任务指标数据预测系统100可以包括处理设备110、网络120以及用户终端130。

处理设备110可用于处理与预测任务指标数据相关联的信息和/或数据来执行在本说明书中揭示的一个或者多个功能。在一些实施例中,处理设备110可以用于获取与目标任务相关的原始数据。在一些实施例中,处理设备110可以对原始数据进行预处理,得到初始时间特征矩阵。在一些实施例中,处理设备110可以基于初始时间特征矩阵,利用预先训练好的生成器得到填充缺失数据后的目标时间特征矩阵。在一些实施例中,处理设备110可以利用预先训练好的预测模型对目标时间特征矩阵进行处理,确定目标任务的预测指标数据。

在一些实施例中,处理设备110可以包括一个或多个处理引擎(例如,单核心处理引擎或多核心处理器)。仅作为范例,处理设备110可以包括中央处理器(中央处理器)、特定应用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理单元(PPU)、数字信号处理器(DSP)、现场可程序门阵列(FPGA)、可程序逻辑装置(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等中的一种或多种组合。

网络120可以促进信息和/或数据的交换。在一些实施例中,任务指标数据预测系统100的一个或者多个组件(例如处理设备110、用户终端130)可以通过网络120传送信息至基于任务指标数据预测系统100的其他组件。例如,处理设备110可以通过网络120获取用户终端130存储的原始数据。又例如,用户终端130可以通过网络120获取处理设备110确定的目标任务的预测指标数据。在一些实施例中,网络120可以是任意形式的有线或者无线网络,或其任意组合。仅作为范例,网络120可以是有线网络、光纤网络、远程通信网络、内部网络、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、城域网(MAN)、广域网(WAN)、公共交换电话网络(PSTN)、蓝牙网络等中的一种或多种组合。

用户终端130可以是带有数据获取、存储和/或发送功能的设备。在一些实施例中,用户终端130可以包括但不限于移动设备130-1、平板电脑130-2、笔记本电脑130-3、台式电脑130-4等或其任意组合。示例性的,移动设备130-1可以包括但不限于智能手机、个人数码助理(Personal Digital Assistance,PDA)、掌上游戏机、智能手表、可穿戴设备、虚拟显示设备、显示增强设备等或其任意组合。

本说明书实施例所披露的技术方案可以应用于指标数据预测的场景。在一些实施例中,指标数据可以是目标任务的指标数据。例如,目标任务是提高店铺的销售量和/或利润,则指标数据可以是店铺的销售指标和/或利润指标。又例如,目标任务是提高某销售公司销售的产品的销售量和/或利润,则指标数据可以是该产品的销售指标和/或利润指标。仅作为示例,在一些场景中,可以通过将预测的指标数据下发至对应的任务执行者(例如,店铺的店长、公司的销售人员等),作为对任务执行者的绩效考核标准,提高最终的销售量和/或利润。

在一些实施例中,可以通过预测模型对获取的与目标任务相关的数据(例如,历史特征数据和时间数据)进行处理,得到预测的指标数据,其中,预测模型可以包括但不限于XGBoost模型、RNN模型或LSTM模型等。然而,当获取的数据中包含大量缺失数据时,该预测模型的预测效果差,导致预测的指标数据存在较大的偏差,使得最终的目标任务的完成度差。

因此,本说明书实施例披露了一种任务指标数据预测方法,利用预先训练好的生成器对获取的与目标任务相关的原始数据中包含的缺失数据进行填充,再利用预测模型进行指标数据的预测,不仅对缺失数据进行了准确填充,还提高了指标数据的预测准确性,从而提高目标任务的完成度。

以下结合附图,对本说明书所披露的技术方案进行详细阐述。

图2是根据本说明书的一些实施例所示的任务指标数据预测方法的流程图。如图2所示,该流程200包括以下步骤:

步骤202,获取与目标任务相关的原始数据,所述原始数据至少包括历史特征数据和时间数据。在一些实施例中,步骤202可以由原始数据获取模块810执行。

在一些实施例中,目标任务可以与预设对象的销量和/或利润相关,例如,目标任务可以是提高预设对象的销量和/或利润。在一些实施例中,预设对象可以根据实际需求进行具体设置。例如,预设对象可以是目标店铺、目标企业和/或目标厂家等。

在一些实施例中,原始数据可以是与目标任务相关的数据。对应的,原始数据可以是反映预设对象的销量和/或利润的数据。在一些实施例中,原始数据可以是反映在预设历史时间段内预设对象的销量和/或利润的数据。

在一些实施例中,原始数据至少包括历史特征数据和时间数据。在一些实施例中,历史特征数据可以是反映预设对象的销量和/或利润的数据。时间数据可以是反映预设历史时间段内产生的销量和/或利润所对应的时间。可以理解的,历史特征数据与时间数据具备对应关系。

如前所述,在一些实施例中,目标任务可以与目标店铺的销量和/或利润相关。对应的,历史特征数据可以包括以下数据中的一项或多项:目标店铺包括的目标对象的历史销售数据、目标店铺信息、目标对象信息、目标店铺的历史销售数据、目标店铺的历史利润数据、与目标店铺相关的其他店铺的历史销售数据、以及其他店铺的历史利润数据;时间数据可以包括以下数据中的一项或多项:日期信息、节假日信息以及工作日信息。

在一些实施例中,目标店铺包括的目标对象可以是目标店铺的管理者,例如,店长、销售经理、销售主管等。在一些实施例中,目标店铺包括的目标对象的历史销售数据可以包括:在预设历史时间段内目标对象单位时段销售的对象的属性信息、和/或在预设历史时间段内目标对象单位时段销售的对象的销售信息。

在一些实施例中,预设历史时间段可以根据实际需求进行具体设置,例如,过去的一个月、过去的一个季度、过去的一年等。在一些实施例中,单位时段可根据实际需求进行灵活设置。例如,每日、每周、每月等。

在一些实施例中,目标对象单位时段销售的对象的属性信息可以包括以下数据的一项或多项:目标对象每日销售的对象的品牌名称、品牌型号以及成本价格。目标对象单位时段销售的对象的销售信息可以包括:目标对象每日销售的对象的销售价格和/或数量。可以理解的,销售的对象与目标店铺相关,例如,目标店铺为从事车辆出租和/或车辆出售的店铺,则销售的对象为车辆。又例如,目标店铺为从事家具销售的店铺,则销售的对象为家具。

在一些实施例中,目标店铺信息可以包括以下数据的一项或多项:目标店铺的名称、目标店铺的地址、目标店铺的经营方式、目标店铺的从业人数以及目标店铺的开业时间等。

在一些实施例中,目标对象信息可以包括以下数据的一项或多项:目标对象的资质、目标对象的历史考核标准(例如,目标对象的历史指标数据)以及目标对象的从业时间等。

在一些实施例中,目标店铺的历史销售数据可以包括:在预设历史时间段内目标店铺销售的对象的属性信息、和/或在预设历史时间段内目标店铺销售的对象的销售信息。关于目标店铺销售的对象的属性信息和销售信息可参见上述陈述,在此不再赘述。

在一些实施例中,目标店铺的历史利润数据可以是在预设历史时间段内目标店铺所产生的利润信息。在一些实施例中,与目标店铺相关的其他店铺可以是与目标店铺属于相同公司经营的其他店铺或者与目标店铺属于同一类型的其他公司经营的店铺。示例地,以A公司经营的车辆出租店铺包括店铺1、店铺2以及店铺3,B公司经营的车辆出租店铺包括店铺4和店铺5为例,若目标店铺为店铺1,则其他店铺可以是店铺2和店铺3、或者可以是店铺4和店铺5。

与目标店铺相关的其他店铺的历史销售数据和其他店铺的历史利润数据可以分别参见目标店铺的历史销售数据和目标店铺的历史利润数据,在此不再赘述。

在一些实施例中,原始数据获取模块810可以从用户终端130或存储设备中获取与目标任务相关的原始数据。

步骤204,对所述原始数据进行预处理,得到初始时间特征矩阵。在一些实施例中,步骤204可以由预处理模块820执行。

在一些实施例中,初始时间特征矩阵可以是基于历史特征数据和时间数据生成的矩阵。例如,以时间数据为横坐标,以历史特征数据为纵坐标生成的矩阵。

在一些实施例中,预处理模块820可以对原始数据(即历史特征数据和时间数据)进行预处理,得到初始时间特征矩阵。在一些实施例中,预处理包括以下处理中的一种或多种:对历史特征数据进行归一化处理、对历史特征数据进行异常值处理、对时间数据进行分箱处理、基于节假日信息对时间数据进行编码处理、基于工作日信息对时间数据进行编码处理、对时间数据进行异常值处理、以及基于历史特征数据统计目标店铺的销量和利润。

在一些实施例中,对历史特征数据进行归一化处理可以是对历史特征数据中包括的价格数据进行归一化处理。例如,对成本价格和销售价格进行归一化处理。通过将价格数据进行归一化处理,可以将价格数据统一量纲,避免由于报价混乱,降低生成器和预测模型的预测准确性。

在一些实施例中,对历史特征数据进行异常值处理可以是对历史特征数据中包括的异常数据进行处理,其中,异常数据可以是指偏差超过预设范围的数据。预设范围可以根据实际需求进行具体设置。在一些实施例中,对异常数据进行处理可以包括:对异常数据进行填充(例如,用众数或均值等进行填充)或者将异常数据确定为空缺数据。

在一些实施例中,对时间数据进行分箱处理可以是将时间数据根据天、周或月进行分箱处理。例如,根据天、周或月将对应的历史特征数据划分到对应类别。在一些实施例中,基于节假日信息对时间数据进行编码处理可以是基于节假日信息对时间数据进行独热编码。例如,将节假日对应的时间数据用“1”标记,将非节假日对应的时间数据用“0”标记。

在一些实施例中,基于工作日信息对时间数据进行编码处理可以是基于工作日信息对时间数据进行独热编码。例如,将工作日对应的时间数据用“1”标记,将非工作日对应的时间数据用“0”标记。

在一些实施例中,对时间数据进行异常值处理可以是对历史特征数据包括的异常值(或异常数据)所对应的时间数据进行独热编码。例如,将异常值对应的时间数据用“1”标记,将非异常值对应的时间数据用“0”标记。本说明书实施例通过对时间数据进行编码处理,可以降低初始时间特征矩阵中包括的特征的相关性,提高生成器对缺失数据的预测效果。

在一些实施例中,基于历史特征数据统计目标店铺的销量和利润可以是统计目标店铺在预设历史时间段内的销量和利润。例如,过去一个月的销量和/或利润。又例如,过去一个季度的销量和/或利润。

步骤206,判断所述初始时间特征矩阵是否包括缺失数据。在一些实施例中,步骤206可以由判断模块830执行。

在一些实施例中,缺失数据可以表征初始时间特征矩阵中包括的历史特征数据在对应的时间数据上缺失。例如,初始时间特征矩阵A为:

则该初始时间特征矩阵A包括缺失数据,分别为特征值x

步骤208,若是,则基于所述初始时间特征矩阵,利用预先训练好的生成器得到填充所述缺失数据后的目标时间特征矩阵,所述生成器基于生成对抗网络训练得到。在一些实施例中,步骤208可以由填充模块840执行。

在一些实施例中,生成器可以是预先训练好的机器学习模型。在一些实施例中,生成器可以是双向循环神经网络模型(Bi-directional Recurrent Neural Network,Bi-RNN)。

在一些实施例中,生成器可以基于生成对抗网络训练得到。在一些实施例中,生成对抗网络可以包括生成器和判别器。训练好的生成器可以对存在缺失数据的初始时间特征矩阵进行处理,得到填充缺失数据后的目标时间特征矩阵。关于生成器的训练过程可以参见图4及其相关描述,在此不再赘述。

在一些实施例中,目标时间特征矩阵可以是对初始时间特征矩阵中的缺失数据进行填充后,得到的矩阵。关于确定目标时间特征矩阵的具体细节可以参见图3及其相关描述,在此不再赘述。

步骤210,利用预先训练好的预测模型对所述目标时间特征矩阵进行处理,确定所述目标任务的预测指标数据。

在一些实施例中,预测模型可以是预先训练好的机器学习模型。在一些实施例中,预测模型可以包括梯度提升模型(Extreme Gradient Boosting,XGBoost)、循环神经网络(Recurrent Neural Network,RNN)、或长短期记忆模型(Long-short Term Memory,LSTM)。训练好的预测模型可以对目标时间特征矩阵进行处理,确定目标任务的预测指标数据。关于预测模型的训练过程可以参见图7及其相关描述,在此不再赘述。

在一些实施例中,预测指标数据可以是与目标任务相关,例如,目标任务是提高店铺的销量和/或利润,则预测指标数据可以是预测的店铺销量指标和/或店铺利润指标。

本说明书实施例通过生成器对初始时间特征矩阵中包括的缺失数据进行准确填充,再将填充后的目标时间特征矩阵输入至预测模型进行指标数据的预测。避免预测模型对包含有缺失数据的时间特征数据直接进行处理,提高了预测模型的预测准确度,进而可以通过准确的指标数据辅助目标任务的完成,提高目标任务的完成度。例如,目标任务为提高店铺的销量和/或利润,则可以通过预测的销量指标和/或利润指标辅助确定店铺的店长的考核标准,进而通过该考核标准促进店长完成目标任务。

图3是根据本说明书的一些实施例所示的确定目标时间特征矩阵的流程图。如图3所示,该流程300可以包括步骤302、步骤304、以及步骤306。在一些实施例中,步骤302、步骤304、以及步骤306可以由填充模块840执行。

步骤302,对所述初始时间特征矩阵分别进行前向计算和后向计算,确定前向矩阵和后向矩阵。

在一些实施例中,前向计算可以是将初始时间特征矩阵的首列列向量作为起始方向,依次对初始时间特征矩阵中各个元素值进行计算。在一些实施例中,后向计算可以是将初始时间特征矩阵的最后一列列向量作为起始方向,依次对初始时间特征矩阵中各个元素值进行计算。

在一些实施例中,填充模块840可以进一步用于:将初始时间特征矩阵的首列列向量作为起始方向,依次计算初始时间特征矩阵中各个元素值与其最近邻元素值的距离,确定前向矩阵;以及将初始时间特征矩阵的最后一列列向量作为起始方向,依次计算初始时间特征矩阵中各个元素值与其最近邻元素值的距离,确定后向矩阵。

在一些实施例中,起始方向还可以是用于确定最近邻元素值的方向。在一些实施例中,计算初始时间特征矩阵中各个元素值与其最近邻元素值的距离可以是:计算初始时间特征矩阵中各个元素值与朝向起始方向所确定的最近邻元素值的距离。在一些实施例中,距离可以是横向距离。

示例地,仍以上述初始时间特征矩阵A:

为例,

当计算前向矩阵时,由于x

同理,计算得到的后向矩阵为:

步骤304,利用所述生成器基于所述前向矩阵和所述后向矩阵分别对所述初始时间特征矩阵包括的所述缺失数据进行填充,确定前向插值矩阵和后向插值矩阵。

在一些实施例中,前向插值矩阵可以是利用生成器基于前向矩阵对初始时间特征矩阵包括的缺失数据进行填充后,确定的矩阵。后向插值矩阵可以是利用生成器基于后向矩阵对初始时间特征矩阵包括的缺失数据进行填充后,确定的矩阵。

步骤306,对所述前向插值矩阵和所述后向插值矩阵进行加权运算,确定所述目标时间特征矩阵。

在一些实施例中,加权运算可以包括但不限于加权求平均运算。

图4是根据本说明书的一些实施例所示的用于填充缺失数据的生成器的训练方法的流程图。在一些实施例中,生成器可以基于生成对抗网络训练得到。其中,生成对抗网络包括生成器和判别器。如图4所示,该流程400可以包括以下步骤:

步骤402,获取包括有缺失数据的多个第一训练样本,每个第一训练样本至少包括第一样本历史特征数据和第一样本时间数据;每个第一训练样本与目标任务相关。在一些实施例中,步骤402可以由第一训练样本获取模块910执行。

在一些实施例中,第一训练样本可以是用于训练生成器的训练数据。在一些实施例中,第一训练样本与目标任务相关。关于目标任务的具体细节可以参见步骤202及其相关描述,在此不再赘述。

在一些实施例中,第一训练样本至少包括第一样本历史特征数据和第一样本时间数据。在一些实施例中,目标任务与样本店铺的销量和/或利润相关,第一样本历史特征数据包括以下数据中的一项或多项:样本店铺包括的样本对象的历史销售数据、样本店铺信息、样本对象信息、样本店铺的历史销售数据、样本店铺的历史利润数据、与样本店铺相关的其他店铺的历史销售数据、以及其他店铺的历史利润数据。在一些实施例中,第一样本时间数据包括以下数据中的一项或多项:日期信息、节假日信息、以及工作日信息。关于第一训练样本的具体细节可以参见上述步骤202及其相关描述,在此不再赘述。

步骤404,基于所述多个第一训练样本和所述判别器,迭代更新所述生成器的参数以减小各第一训练样本对应的第一目标损失函数值,得到训练好的生成器。在一些实施例中,步骤402可以由生成器训练模块920执行。

在一些实施例中,基于判别器迭代更新生成器的参数可以是指基于判别器对应的目标损失函数值(例如,第三目标损失函数值)迭代更新生成器的参数。

在生成器的训练过程中,生成器训练模块920会不断地基于多个第一训练样本和判别器对应的目标损失函数值更新生成器的参数,以得到训练好的生成器。具体的,生成器训练模块920会不断地调整生成器的参数,以减小各个第一训练样本对应的第一目标损失函数值,使得第一目标损失函数值满足预设条件。例如,第一目标损失函数值收敛,或第一目标损失函数值小于预设值。关于确定第一目标损失函数值的具体细节可以参见图5及其相关描述,在此不再赘述。

可以理解的,当第一目标损失函数满足预设条件时,生成器训练完成,得到训练好的生成器。训练好的生成器可以基于初始时间特征矩阵,得到填充缺失数据后的目标时间特征矩阵,即对原始数据中的缺失数据进行填充。

图5是根据本说明书的一些实施例所示的确定第一目标损失函数值的流程图。如图5所示,该流程500可以包括步骤502、步骤504、步骤506、步骤508、步骤510、以及步骤512。在一些实施例中,步骤502、步骤504、步骤506、步骤508、步骤510、以及步骤512可以由生成器训练模块920执行。

步骤502,对所述第一训练样本进行预处理,得到样本初始时间特征矩阵。

在一些实施例中,预处理可以包括以下处理中的一种或多种:对第一样本历史特征数据进行归一化处理、对第一样本历史特征数据进行异常值处理、对第一样本时间数据进行分箱处理、基于节假日信息对第一样本时间数据进行编码处理、基于工作日信息对第一样本时间数据进行编码处理、对第一样本时间数据进行异常值处理、以及基于第一样本历史特征数据统计样本店铺的销量和利润。关于步骤502和预处理的具体细节可以参见步骤204及其相关描述,在此不再赘述。

步骤504,对所述样本初始时间特征矩阵分别进行前向计算和后向计算,确定样本前向矩阵和样本后向矩阵。

在一些实施例中,对样本初始时间特征矩阵分别进行前向计算和后向计算,确定样本前向矩阵和样本后向矩阵,包括:将样本初始时间特征矩阵的首列列向量作为起始方向,依次计算样本初始时间特征矩阵中各个元素值与其最近邻元素值的距离,确定样本前向矩阵;以及将样本初始时间特征矩阵的最后一列列向量作为起始方向,依次计算样本初始时间特征矩阵中各个元素值与其最近邻元素值的距离,确定样本后向矩阵。关于步骤504的具体细节可以参见步骤302及其相关描述,在此不再赘述。

步骤506,利用所述生成器基于所述样本前向矩阵和所述样本后向矩阵分别对所述样本初始时间特征矩阵包括的所述缺失数据进行填充,确定样本前向插值矩阵和样本后向插值矩阵。

关于步骤506的具体细节可以参见步骤304及其相关描述,在此不再赘述。

步骤508,对所述样本前向插值矩阵和所述样本后向插值矩阵进行加权运算,确定样本目标时间特征矩阵。

关于步骤508的具体细节可以参见步骤306及其相关描述,在此不再赘述。

步骤510,利用所述判别器对所述样本目标时间特征矩阵进行处理,得到概率矩阵。

在一些实施例中,判别器可以是双向长短期记忆模型(Bi-directional Long-short Term Memory,Bi-LSTM)或基于Transformer的双向编码器表征(BidirectionalEncoder Representations from Transformers,BERT)等。在一些实施例中,概率矩阵可以用于表征样本目标时间特征矩阵包括的元素值属于真实数据的概率。在一些实施例中,真实数据可以是非填充数据,即非缺失数据。

步骤512,基于所述样本初始时间特征矩阵、所述样本目标时间特征矩阵、所述样本前向插值矩阵、所述样本后向插值矩阵、所述概率矩阵、以及用于表征所述样本初始时间特征矩阵的所述缺失数据和真实数据的第一标签,确定所述第一目标损失函数值。

在一些实施例中,第一标签可以用于表征样本初始时间特征矩阵的缺失数据和真实数据。如前所述,真实数据可以是非填充数据,即非缺失数据。在一些实施例中,可以将样本初始时间特征矩阵的缺失数据标记为0,将真实数据标记为1,得到第一标签。示例地,将上述初始时间特征矩阵A作为样本初始时间特征矩阵为例,则第一标签可以为:

在一些实施例中,第一目标损失函数值为生成器对应的目标损失函数值。关于确定第一目标损失函数值的具体细节可以参见图6及其相关描述,在此不再赘述。

图6是根据本说明书的一些实施例所示的确定第一目标损失函数值的流程图。如图6所示,该流程600可以包括步骤602、步骤604、步骤606以及步骤608。在一些实施例中,步骤602、步骤604、步骤606以及步骤608可以由生成器训练模块920执行。

步骤602,基于所述样本初始时间特征矩阵和所述样本目标时间特征矩阵的差异,确定第一损失函数值。

在一些实施例中,第一损失函数值可以用来评价样本初始时间特征矩阵和样本目标时间特征矩阵的差异。在一些实施例中,第一损失函数值可以包括但不限于交叉熵损失函数值、均方误差损失函数值、或指数损失函数值等。

步骤604,基于所述样本前向插值矩阵和所述样本后向插值矩阵的差异,确定第二损失函数值。

在一些实施例中,第二损失函数值可以是用来评价样本前向插值矩阵和样本后向插值矩阵的差异。在一些实施例中,第二损失函数值可以包括但不限于交叉熵损失函数值、均方误差损失函数值、或指数损失函数值等。

步骤606,基于所述概率矩阵和所述第一标签的差异,确定第三损失函数值。

在一些实施例中,第三损失函数值可以用来评价概率矩阵和第一标签的差异。在一些实施例中,第三损失函数值可以包括但不限于交叉熵损失函数值、均方误差损失函数值、或指数损失函数值等。

在一些实施例中,所述用于填充缺失数据的生成器的训练方法还包括:基于多个第一训练样本对应的第三损失函数值,迭代更新判别器的参数以减小各第一训练样本对应的第二目标损失函数值,得到训练好的判别器。

在判别器的训练过程中,判别器训练模块930会不断地基于多个第一训练样本对应的第三损失函数值更新判别器的参数,以得到训练好的判别器。具体的,判别器训练模块930会不断地调整判别器的参数,以减小各个第一训练样本对应的第二目标损失函数值,使得第二目标损失函数值满足预设条件。例如,第二目标损失函数值收敛,或第二目标损失函数值小于预设值。当第二目标损失函数满足预设条件时,判别器训练完成,得到训练好的判别器。

步骤608,至少基于所述第一损失函数值、所述第二损失函数值、以及所述第三损失函数值的和,确定所述第一目标损失函数值。

为了更加清楚完整的阐述生成器的训练方法,图7是根据本说明书的一些实施例所示的用于填充缺失数据的生成器的训练方法的示意性流程图。

如图7的流程700所示,生成器可以基于样本初始时间特征矩阵、样本前向矩阵和样本后向矩阵,得到样本前向插值矩阵和样本后向插值矩阵。样本前向插值矩阵和样本后向插值矩阵可以通过加权运算得到样本目标时间特征矩阵。

生成器的第一目标损失函数值包括由样本初始时间特征矩阵和样本目标时间特征矩阵确定的第一损失函数值、由样本前向插值矩阵和样本后向插值矩阵确定的第二损失函数值、以及由判别器输出的概率矩阵和第一标签确定的第三损失函数值。判别器的第二目标损失函数值包括由判别器输出的概率矩阵和第一标签确定的第三损失函数值。

本说明书实施例通过将第一损失函数值和第二损失函数值作为生成器的第一目标损失函数值的组成部分,随着生成器的不断训练,样本目标时间特征矩阵和样本初始时间特征矩阵越来越接近、样本前向插值矩阵和样本后向插值矩阵越来越接近,通过多个损失函数值联合训练生成器,可以提高训练得到的生成器的预测效果,提高了生成器对缺失数据的填充准确性。

同时,本说明书实施例基于生成对抗网络对生成器采用对抗训练的方式,得到训练好的生成器,即将判别器的第三损失函数值作为生成器的第一目标损失函数值的组成部分,通过该对抗训练的方式,使得生成器填充的缺失数据非常接近于真实数据,同时十分强大的判别器无法准确判断生成器填充的缺失数据的真实性,进一步提高了生成器对缺失数据的填充准确性。

图8是根据本说明书的一些实施例所示的用于预测目标任务的指标数据的预测模型的训练方法的流程图。如图8所示,该流程800可以包括如下步骤:

步骤802,获取包含完整数据的多个携带有第二标签的第二训练样本,每个第二训练样本包括第二样本历史特征数据和第二样本时间数据;所述第二训练样本与目标任务相关,所述第二标签用于表征所述目标任务的指标数据。在一些实施例中,步骤702可以由第二训练样本获取模块1010执行。

在一些实施例中,目标任务与样本店铺的销量和/或利润相关,第二样本历史特征数据包括以下数据中的一项或多项:样本店铺包括的样本对象的历史销售数据、样本店铺信息、样本对象信息、样本店铺的历史销售数据、样本店铺的历史利润数据、与样本店铺相关的其他店铺的历史销售数据、以及其他店铺的历史利润数据;第二样本时间数据包括以下数据中的一项或多项:日期信息、节假日信息、以及工作日信息。关于第二训练样本的具体细节可以参见步骤202及其相关描述,在此不再赘述。

在一些实施例中,第二标签用于表征目标任务的指标数据。例如,目标任务为提高样本店铺的销量和/或利润,则第二标签可以是样本店铺的销量指标和/或利润指标。

在一些实施例中,可以通过人工标注的方式对第二训练样本进行第二标签的标注。在一些实施例中,第二训练样本获取模块1010可以从处理设备110的存储设备中获取训练样本。

步骤804,基于所述多个第二训练样本迭代更新初始预测模型的参数以减小各第二训练样本对应的第三目标损失函数值,得到训练好的预测模型。在一些实施例中,步骤704可以由预测模型训练模块1020执行。

在预测模型的训练过程中,预测模型训练模块1020会不断地基于多个第二训练样本更新初始预测模型的参数。具体的,预测模型训练模块1020会不断地调整初始预测模型的参数,以减小各个第二训练样本对应的第三目标损失函数值,使得第三目标损失函数值满足预设条件。例如,第三目标损失函数值收敛,或第三目标损失函数值小于预设值。当第三目标损失函数满足预设条件时,模型训练完成,得到训练好的预测模型。训练好的预测模型可以基于不含有缺失数据的与目标任务相关的历史特征数据和时间数据,得到目标任务的预测指标数据。

在一些实施例中,各第二训练样本对应的第三目标损失函数值可以通过以下过程确定:通过初始预测模型处理第二训练样本,得到目标任务的预测指标数据,至少基于预测指标数据和第二标签之间的差异,确定第三目标损失函数。在一些实施例中,第三目标损失函数值可以包括但不限于交叉熵损失函数值、均方误差损失函数值、或指数损失函数值等。

图9是根据本说明书的一些实施例所示的任务指标数据预测系统的模块图。如图9所示,该任务指标数据预测系统900可以包括原始数据获取模块910、预处理模块920、判断模块930、填充模块940、以及确定模块950。

在一些实施例中,原始数据获取模块910可以用于获取与目标任务相关的原始数据,原始数据至少包括历史特征数据和时间数据。

在一些实施例中,预处理模块920可以用于对原始数据进行预处理,得到初始时间特征矩阵。

在一些实施例中,判断模块930可以用于判断初始时间特征矩阵是否包括缺失数据。

在一些实施例中,填充模块940可以用于在包括缺失数据的情况下,则基于初始时间特征矩阵,利用预先训练好的生成器得到填充缺失数据后的目标时间特征矩阵,生成器基于生成对抗网络训练得到。

在一些实施例中,确定模块950可以用于利用预先训练好的预测模型对目标时间特征矩阵进行处理,确定目标任务的预测指标数据。

图10是根据本说明书的一些实施例所示的用于填充缺失数据的生成器的训练系统的模块图。如图10所示,该生成器的训练系统1000可以包括第一训练样本获取模块1010、生成器训练模块1020以及判别器训练模块1030。

在一些实施例中,第一训练样本获取模块1010可以用于获取包括有缺失数据的多个第一训练样本,每个第一训练样本至少包括第一样本历史特征数据和第一样本时间数据;每个第一训练样本与目标任务相关。

在一些实施例中,生成器训练模块1020可以用于基于多个第一训练样本和判别器,迭代更新生成器的参数以减小各第一训练样本对应的第一目标损失函数值,得到训练好的生成器。

图11是根据本说明书的一些实施例所示的用于预测目标任务的指标数据的预测模型的训练系统的模块图。如图11所示,该预测模型的训练系统1100可以包括第二训练样本获取模块1110和预测模型训练模块1120。

在一些实施例中,第二训练样本获取模块1110可以用于获取包含完整数据的多个携带有第二标签的第二训练样本,每个第二训练样本包括第二样本历史特征数据和第二样本时间数据;第二训练样本与目标任务相关,第二标签用于表征目标任务的指标数据。

在一些实施例中,预测模型训练模块1120可以用于基于多个第二训练样本迭代更新初始预测模型的参数以减小各第二训练样本对应的第三目标损失函数值,得到训练好的预测模型;其中,各第二训练样本对应的第三目标损失函数值通过以下过程确定:通过初始预测模型处理第二训练样本,得到目标任务的预测指标数据;至少基于预测指标数据和第二标签之间的差异,确定第三目标损失函数值。

应当理解,上述系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。

需要注意的是,以上对于各个模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。诸如此类的变形,均在本说明书的保护范围之内。

本说明书实施例还提供一种任务指标数据预测装置,所述装置包括处理器以及存储器,所述存储器用于存储指令,所述处理器用于执行所述指令,以实现如前任一项所述的任务指标数据预测方法对应的操作。

本说明书实施例还提供一种计算机可读存储介质,所述存储介质存储计算机指令,所述计算机指令被处理器执行时,实现如前任一项所述的任务指标数据预测方法对应的操作。

本说明书实施例还提供一种用于填充缺失数据的生成器的训练装置,所述装置包括处理器以及存储器,所述存储器用于存储指令,所述处理器用于执行所述指令,以实现如前任一项所述的用于填充缺失数据的生成器的训练方法对应的操作。

本说明书实施例还提供一种计算机可读存储介质,所述存储介质存储计算机指令,所述计算机指令被处理器执行时,实现如前任一项所述的用于填充缺失数据的生成器的训练方法对应的操作。

本说明书实施例还提供一种用于预测目标任务的指标数据的预测模型的训练装置,所述装置包括处理器以及存储器,所述存储器用于存储指令,所述处理器用于执行所述指令,以实现如前所述用于预测目标任务的指标数据的预测模型的训练方法对应的操作。

本说明书实施例还提供一种计算机可读存储介质,所述存储介质存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求29所述的用于预测目标任务的指标数据的预测模型的训练方法对应的操作。

需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。

此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。

同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。

最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

相关技术
  • 一种任务指标数据预测方法和系统
  • 一种基于数据指标的市场行情预测方法和系统
技术分类

06120112359412