导航：首页> 医学或兽医学；卫生学>件量预测模型训练以及件量预测方法、装置和计算机设备

件量预测模型训练以及件量预测方法、装置和计算机设备

文献发布时间：2023-06-19 11:22:42

技术领域

本申请涉及计算机技术领域，特别是涉及一种件量预测模型训练以及件量预测方法、装置、计算机设备和存储介质。

背景技术

随着物流领域的发展，物流所需要运输的件量日益增多。而为了保证运输业务的平稳运行，现有大多数的物流公司均会开发预测模型，利用预测模型预先预测件量。传统的预测模型大多以依赖于历史件量数据的时序模型和机器学习模型为主。只有在预测目标具有较多历史数据的情况下，预测模型才会有较高的预测精度。

然而，高峰期的预测通常需要突变日的数据，所谓突变日，是指原本处于工作日而因为法定假日放假的日期，或原本为假期而调整为工作日的日期。这种突变情况在每一个节假日内均存在，是资源投入需要着重关注的时间点。但是这种突变日在全年中不足1％，即使使用5年以上的历史数据，也只能获得不足百级的数据样本，极容易造成预测模型的过拟合。因此，现有的预测模型并不适用于突变日件量的预测，降低了突变日的预测精度。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高预测精度的件量预测模型训练以及件量预测方法、装置、计算机设备和存储介质。

一种件量预测模型训练方法，所述方法包括：

获取业务区突变日的历史件量和所述业务区下各网点所述突变日的历史件量；

从各所述网点所述突变日的历史件量中，筛选与所述业务区突变日的历史件量的件量特征相似的网点所述突变日的历史件量，得到相似历史件量；

利用所述相似历史件量以及对应的突变日对预先构建的神经网络进行预训练，得到初始预测模型；其中，所述相似历史件量为所述突变日的标注结果；

利用所述业务区突变日的历史件量以及所述突变日对所述初始预测模型进行迁移训练，得到预测模型；其中，所述业务区突变日的历史件量为所述突变日的标注结果。

在其中一个实施例中，所述从各所述网点所述突变日的历史件量中，筛选与所述业务区突变日的历史件量相似的历史件量，得到相似历史件量，包括：

将所述业务区突变日的历史件量作为第一聚类点；

基于所述第一聚类点和聚类点阈值，对各所述网点所述突变日的历史件量进行聚类，得到聚类结果；

根据所述聚类结果，确定与所述业务区突变日的历史件量相似的网点突变日的历史件量，得到相似历史件量。

在其中一个实施例中，所述根据所述聚类结果，确定与所述业务区突变日的历史件量相似的历史件量，得到相似历史件量，包括：

根据所述聚类结果确定各所述网点所述突变日的历史件量与所述第一聚类点的第一距离；

基于所述第一距离，按照从近到远从各所述网点所述突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量；或

从所述聚类结果中确定所述第一聚类点的所属类，并确定所述所属类的聚类点，得到所属聚类点；

确定各所述网点所述突变日的历史件量与所述所属聚类点的第二距离；

基于所述第二距离，按照从近到远从各所述网点所述突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在其中一个实施例中，所述基于所述第一聚类点和聚类点阈值，对各所述网点所述突变日的历史件量进行聚类，得到聚类结果，包括：

根据各所述聚类点阈值分别确定对应的第二聚类点，将所述第一聚类点分别与各所述第二聚类点合并作为聚类中心；

基于各所述聚类中心，分别对各所述网点所述突变日的历史件量进行聚类，得到各所述聚类中心对应的聚类结果；

根据各所述聚类结果中各类的类间距离和类内距离，从所述聚类结果中确定最佳的聚类结果作为最终得到的聚类结果。

在其中一个实施例中，所述基于各所述聚类中心，分别对各所述网点所述突变日的历史件量进行聚类，得到各所述聚类中心对应的聚类结果，包括：

计算各所述网点所述突变日的历史件量与所述聚类中心中各聚类点的相似度；

根据所述相似度将各所述网点所述突变日的历史件量分配给所述聚类中心的各聚类点，得到初始聚类结果；

计算所述初始聚类结果中各类的历史件量的均值，得到新聚类点；

将各所述新聚类点合并作为聚类中心，返回分别计算各所述网点所述突变日的历史件量与所述聚类中心中各聚类点的相似度的步骤，直至满足聚类次数为止。

在其中一个实施例中，所述计算各所述网点所述突变日的历史件量与所述聚类中心中各聚类点的相似度，包括：

计算各所述网点所述突变日的历史件量与所述聚类中心中各聚类点的夹角余弦值；

将所述夹角余弦值作为各所述网点所述突变日的历史件量与所述聚类中心中各聚类点的相似度。

一种件量预测方法，所述方法包括：

获取待预测突变日；

调用上述任一项件量预测模型训练方法所述的预测模型，将所述待预测突变日输入至所述预测模型中，利用所述预测模型基于所述待预测突变日进行预测，得到所述待预测突变日的预测件量。

一种件量预测模型训练装置，所述装置包括：

获取模块，用于获取业务区突变日的历史件量和所述业务区下各网点所述突变日的历史件量；

筛选模块，用于从各所述网点所述突变日的历史件量中，筛选与所述业务区突变日的历史件量相似的历史件量，得到相似历史件量；

训练模块，用于利用所述业务区突变日的历史件量、以及所述相似日历史件量对预先构建好的神经网络进行迁移训练，将训练好的神经网络作为预测模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项件量预测模型训练方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项件量预测模型训练方法的步骤。

上述件量预测模型训练以及件量预测方法、装置、计算机设备和存储介质，预测模型是通过业务区突变日的历史件量、以及从业务区下各所属网点筛选得到的与业务区突变日的历史件量相似的历史件量进行迁移训练得到。该方法利用业务区和业务区对应网点的上下级的所属关系特性，筛选得到与业务区突变日历史件量相似的历史件量，增加突变日预测模型的训练样本数量，从而能够提高模型的表现能力，提升突变日件量的预测精度。

附图说明

图1为一个实施例中件量预测模型训练方法的应用环境图；

图2为一个实施例中件量预测模型训练方法的流程示意图；

图3为一个实施例中从各网点突变日的历史件量中，筛选与业务区突变日的历史件量相似的历史件量，得到相似历史件量步骤的流程示意图；

图4为一个实施例中件量预测模型训练装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的件量预测模型训练方法，可以应用于如图1所示的应用环境中。其中，终端102与服务器104通过网络进行通信。当终端102获取到业务区突变日的历史件量和业务区下各网点突变日的历史件量之后，可由终端102单独实现上述件量预测模型训练方法。也可以由终端102将业务区突变日的历史件量和业务区下各网点突变日的历史件量发送给服务器104，由服务器104单独实现上述件量预测模型训练方法。当终端102或服务器104训练得到预测模型之后，终端102或服务器104还可以将待预测突变日输入至训练好的预测模型中，利用训练好的预测模型基于待预测突变日进行预测，得到待预测突变日的预测件量。

具体地，以终端102为例，终端102获取业务区突变日的历史件量和业务区下各网点突变日的历史件量；终端102从各网点突变日的历史件量中，筛选与业务区突变日的历史件量相似的历史件量，得到相似历史件量；终端102利用相似历史件量以及对应的突变日对预先构建的神经网络进行预训练，得到初始预测模型；其中，相似历史件量为突变日的标注结果；终端102利用业务区突变日的历史件量以及突变日对初始预测模型进行迁移训练，得到预测模型；其中，业务区突变日的历史件量为突变日的标注结果。当训练得到预测模型之后，终端102获取待预测突变日，终端102调用训练好的预测模型，将待预测突变日输入至预测模型中，利用预测模型基于待预测突变日进行预测，得到待预测突变日的预测件量。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种件量预测模型训练方法，以该方法应用于图1中的终端为例进行说明，包括以下步骤：

步骤S202，获取业务区突变日的历史件量和业务区下各网点突变日的历史件量。

其中，业务区是指有快递业务的地区，例如直辖市、地级市以及县级市等地区。而网点是指属于业务区，在业务区的辖区范围内的快递网点，例如快递营业点、快递操作点等。以业务齐是深圳市为例，那么深圳市下的所有快递网点为深圳市这一业务区所属下的网点。突变日是指原本处于工作日而因为法定假日放假的日期，或原本为假期而调整为工作日的日期。

具体地，当终端根据用户的指示需要进行突变日件量的预测模型训练时，首先需要获取对应的训练数据。终端获取的训练数据可以是用户通过与终端连接的输入设备上传得到，也可以是终端与其他网络设备通信接收得到。本实施例中的训练数据即为业务区突变日的历史件量和该业务区下的网点的突变日历史变量。

步骤S204，从各网点突变日的历史件量中，筛选与业务区突变日的历史件量的件量特征相似的网点突变日的历史件量，得到相似历史件量。

具体地，当终端获取到业务区突变日的历史件量和业务区下各网点突变日的历史件量之后，通过计算各网点突变日的历史件量与业务区突变日的历史件量的相似度，确定与相似历史件量。相似历史件量可以理解为是与业务区突变日的历史件量具有相似数据规律的网点突变日的历史件量。相似度的计算可采用任意一种方法，例如，通过DTW(DynamicTime Warping，动态时间归整)算法或皮尔逊相关系数中任意一种方法计算得到与业务区的突变日历史计量相关程度较高的网点的突变量历史件量，得到相似历史件量。

步骤S206，利用相似历史件量以及对应的突变日对预先构建的神经网络进行预训练，得到初始预测模型；其中，相似历史件量为所述突变日的标注结果；

步骤S208，利用业务区突变日的历史件量以及突变日对初始预测模型进行迁移训练，得到预测模型；其中，业务区突变日的历史件量为突变日的标注结果。

在物流行业中，业务区与其辖区范围内的网点具有上下级的层级关系。业务区下各网点的收件量之和与派件量之和理论上是等于该业务区的收件量和派件量。业务区的件量很大程度上由业务区内业务量较大的网点决定，网点件量的均值及其波动模式很大程度上反应了业务区整体的件量均值和波动模式。因此，可以认为网点件量除均值外，其统计规律与上级业务区的件量相似。而由于均值变化又是线性运算，因此本实施例通过筛选到的与目标域数据(业务区突变日的历史件量)相似的下级数据，并且采用下级数据作为源域数据迁移至目标域，训练得到的模型效果会比采用同级数据作为源域数据更好。

具体地，当得到相似历史件量之后，将相似历史件量作为突变日的标注结果输入神经网络中进行训练。利用相似历史件量调整神经网络中各层网络的权重，得到初始预测模型。然后，在将业务区突变日的历史件量输入至训练好的初始预测模型中，同时需要将初始预测模型中前N-1层网络的权重冻结固定，N是指初始预测模型的网络总层数。固定N-1层，相当于重新训练初始预测模型的输出层，使得输出层的权值仅作线性变换。最后将训练后的初始预测模型作为最终得到的预测模型。在本实施例中，神经网络优选为长短期记忆网络(Long Short-Term Memory，LSTM网络)。

上述件量预测模型方法，预测模型是通过业务区突变日的历史件量、以及从业务区下各所属网点筛选得到的与业务区突变日的历史件量相似的历史件量进行迁移训练得到。该方法利用业务区和业务区对应网点的上下级的所属关系特性，筛选得到与业务区突变日历史件量相似的历史件量，增加突变日预测模型的训练样本数量，从而能够提高模型的表现能力，提升突变日件量的预测精度。

在一个实施例中，如图3所示，从各网点突变日的历史件量中，筛选与业务区突变日的历史件量相似的历史件量，得到相似历史件量，包括以下步骤：

步骤S302，将业务区突变日的历史件量作为第一聚类点。

步骤S304，基于第一聚类点和聚类点阈值，对各网点突变日的历史件量进行聚类，得到聚类结果。

其中，聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程，聚类点是聚类的中心点。在本实施例中，第一聚类点为业务区突变日的历史件量。通过将业务区突变日的历史件量作为聚类点，能够更好的利用聚类中心找到与业务区突变日的历史件量的同类数据，从而得到相似历史数据。聚类点阈值是预设的聚类点的数量，由于已经有第一聚类点，因此可以根据聚类点阈值确定剩下的聚类点。在本实施例中，聚类方法优选K均值聚类算法，所以预设的聚类点阈值可以理解为K值。

具体地，将业务区突变日的历史件量作为第一聚类点之后，获取预设的聚类点阈值。K均值聚类算法根据聚类点阈值从各网点突变日的历史件量中确定剩余聚类点数。例如，聚类点阈值为4，则K均值聚类算法根据聚类点阈值4从各网点突变日的历史件量中选取3个网点突变日的历史件量作为剩余的3个聚类点。然后，K均值聚类算法将确定的4个聚类点作为聚类中心，为聚类中心基准对不是聚类点的突变日历史件量进行数据分配，完成聚类。以一个突变日历史件量为例，通过计算该突变日历史件量与各聚类点的相似度，选择与其最相似的聚类点并将其分配给最相似的聚类点，完成该突变日历史件量的分配。而当所有的突变日历史件量均被分配完成时，得到聚类结果。突变日历史件量与聚类点的相似度计算可采用任意一种方法，例如夹角余弦值和欧式距离等。由于夹角余弦值可以消除量纲影响，因此本实施例相似度的计算优选夹角余弦值。

步骤S306，根据聚类结果，确定与业务区突变日的历史件量的件量特征相似的网点突变日的历史件量，得到相似历史件量。

具体地，当得到聚类结果，也就是所有的网点突变日的历史件量均被分配给不同的聚类点之后，根据聚类结果选取与第一聚类点(业务区突变日的历史件量)邻近的网点突变日的历史件量作为相似历史件量。由于第一聚类点是业务区突变日的历史件量，通过聚类之后，其周边均是与业务区突变日的历史件量相似的网点突变日的历史件量。所以选择的与其邻近的网点突变日的历史件量就是与业务区的最为相似的相似历史件量。在本实施例中，通过聚类的方法并且将业务区突变日的历史件量作为聚类中心从而确定相似历史件量，能够提高相似历史件量选择的准确性。

在一个实施例中，根据聚类结果，确定与业务区突变日的历史件量相似的历史件量，得到相似历史件量，具体包括：根据聚类结果确定各网点突变日的历史件量与第一聚类点的第一距离；基于第一距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

具体地，第一距离是聚类之后，在聚类结果中各网点突变日的历史件量与第一聚类点(业务区突变日的历史件量)的空间距离。预设数据量是预先设定所需相似历史件量的数值，可根据实际情况进行设定。当得到聚类结果之后，从聚类结果中确定当前第一聚类点的位置、以及其他网点突变日的历史件量的位置。然后，根据第一聚类点的位置和其他网点突变日的历史件量的位置之间的空间距离的远近，从近到远选择预设数量的网点突变日的历史件量作为相似历史件量。位置可以是空间坐标值，第一距离可以是根据坐标值计算得到的欧氏距离。在本实施例中，通过在聚类结果中选择与业务区突变日的历史件量邻近的网点突变日的历史件量，从而准确得到相似历史件量。

在另一个实施例中，根据聚类结果，确定与业务区突变日的历史件量相似的历史件量，得到相似历史件量，包括：从聚类结果中确定第一聚类点的所属类，并确定所属类的聚类点，得到所属聚类点；确定各网点突变日的历史件量与所属聚类点的第二距离；基于第二距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

具体地，第二距离是聚类之后，各网点突变日的历史件量与第一聚类点的所属类的聚类点的空间距离。预设数据量是预先设定所需相似历史件量的数值，可根据实际情况进行设定。在聚类过程中，随着聚类点的变更，最终的聚类结果中第一聚类点可能已经不是一类数据的聚类点了。因此，除了直接计算第一距离之外，还可以从聚类结果中确定第一聚类点的所属类。所属类可以理解为经过聚类之后，业务区突变日的历史件量被分配所在的类。然后，获取所属类的聚类点，得到所属聚类点。确定所属聚类点的位置以及其他网点突变日的历史件量的位置。根据所属聚类点的位置和其他网点突变日的历史件量的位置之间的空间距离的远近，从近到远选择预设数量的网点突变日的历史件量作为相似历史件量。位置同样可以是空间坐标值，第二距离同样可以是根据坐标值计算得到的欧氏距离。在本实施例中，通过在聚类结果中选择与业务区突变日的历史件量所属类的聚类点的邻近的网点突变日的历史件量，从而准确得到相似历史件量。

在一个实施例中，基于第一聚类点和聚类点阈值，对各网点突变日的历史件量进行聚类，得到聚类结果，包括：根据各聚类点阈值分别确定对应的第二聚类点，将第一聚类点分别与各第二聚类点合并作为聚类中心；基于各聚类中心，分别对各网点突变日的历史件量进行聚类，得到各聚类中心对应的聚类结果；根据各聚类结果中各类的类间距离和类内距离，从聚类结果中确定最佳的聚类结果作为最终得到的聚类结果。

其中，第二聚类点是指根据聚类点阈值确定的剩余聚类点的总称。聚类中心包括所有的聚类点。类间距离是聚类之后，类与类之间的空间距离。类内距离是聚类之后，被分为一类的数据中各数据之间的空间距离。在本实施例中，类内距离即是分为一类的突变日历史件量之间的空间距离。

具体地，当聚类点阈值包括多个值时，例如聚类点阈值的范围时2-100时，即需要根据该范围内不同的值分别进行聚类。然后从不同的值对应的聚类结果中选取得到最佳的聚类结果。首先根据聚类点阈值确定对应的第二聚类点，当聚类点阈值为2时，第二聚类点中只有1个剩余聚类点，K均值聚类算法从各网点突变日的历史件量中确定一个网点突变日的历史件量作为第二聚类点。当聚类点阈值为100时，第二聚类点中包括99个剩余聚类点。K均值聚类算法从各网点突变日的历史件量中确定99个网点突变日的历史件量作为第二聚类点。根据聚类点阈值的范围可以确定对应的第二聚类点之后，将确定的第二聚类点分别与第一聚类点合并组成聚类所需的聚类中心。所得到的聚类中心的数量应当与聚类点阈值的数量相等。然后，基于各聚类中心对不是聚类点的网点突变日的历史件量进行聚类，得到各聚类中心对应的多个聚类结果。

当得到多个聚类结果之后，计算各聚类结果中各类的类间距离和类内距离，选择类内距离最小且类间距离最大的聚类结果为最佳的聚类结果。类间距离和类内聚类同样可以通过欧氏距离公式计算得到。例如，聚类点阈值的范围是2-4，则可以得到2、3和4这三个聚类点阈值。根据这三个聚类点阈值可以确定三个对应的第二聚类点，从而得到三个对应的聚类中心以及对应的三个聚类结果。当根据类间距离和类内距离确定聚类点阈值为3对应的聚类结果为最佳聚类结果，那么加上第一聚类点，对应的聚类中心一共是4个聚类点，最终得到聚类结果就是包括4类。在本实施例中，通过对给定的多个聚类点阈值对应的聚类结果进行筛选，得到最佳聚类结果，提高选取相似历史件量的准确性。

在一个实施例中，基于各聚类中心，分别对各网点突变日的历史件量进行聚类，得到各聚类中心对应的聚类结果，包括：计算各网点突变日的历史件量与聚类中心中各聚类点的相似度；根据相似度将各网点突变日的历史件量分配给聚类中心的各聚类点，得到初始聚类结果；计算初始聚类结果中各类的历史件量的均值，得到新聚类点；将各新聚类点合并作为聚类中心，返回分别计算各网点突变日的历史件量与聚类中心中各聚类点的相似度的步骤，直至满足聚类次数为止。

具体地，基于聚类中心进行聚类时，首先计算各网点突变日的历史件量与聚类中心各聚类点的相似度。根据相似度确定与当前被计算的网点突变日的历史件量最为相似的聚类点，并且将当前被计算的网点突变日的历史件量分配给最为相似的聚类点。当所有的网点突变日的历史件量被分配完成之后，判断本次聚类之后是否已经满足预设的聚类次数。若预设的聚类次数为3次，而本次聚类是第一次聚类，那么则可以确定本次聚类结束之后是还未满足预设的聚类次数的。因此，通过本次聚类结束之后得到的聚类结果，计算得到新的聚类点再次进行聚类。在聚类结果中确定属于同一类的突变日历史件量，然后计算属于同一类的各突变日历史件量的平均值，得到新的聚类点，从而将得到新的聚类点作为新的聚类中心。当得到新的聚类中心之后，基于新的聚类中心继续进行聚类，直到当前的聚类次数达到预设的聚类次数，停止聚类得到聚类结果。

例如，假设预设的聚类次数为3次，以及第一聚类点和第二聚类点组成的聚类中心中包括三个聚类点，表示为三个聚类点1。当首次聚类时，基于聚类中心中这三个聚类点1进行聚类，得到的聚类结果中包括三类，表示为第一个三类。然后，分别计算这第一个三类中各突变日历史件量的平均值，得到三个平均值。三个平均值对应的突变日历史件量为新的三个聚类点，表示为三个聚类点2。基于三个聚类点2进行第二次聚类，得到的聚类结果中同样包括三类，表示为第二个三类。最后，计算这第二个三类中各突变日历史件量的平均值，得到三个平均值，这三个平均值对应的突变日历史件量表示为三个聚类点3。基于三个聚类点3进行第三次聚类，得到聚类结果。由于基于三个聚类点3进行的聚类的次数已经是第三次，满足预设的聚类次数3，因此第三次得到聚类结果之后停止聚类，获取第三次聚类的聚类结果。应当理解的是，由于将业务区的突变日历史次数作为第一聚类点，因此第一次聚类时，聚类中心是包括业务区突变日的历史件量这一聚类点的。而当随着聚类点的更新，聚类中心可能就不包括业务区突变日的历史件量这一聚类点了。在本实施例中，通过迭代聚类能够达到最佳的聚类效果。

在一个实施例中，各网点突变日的历史件量与聚类中心中各聚类点的相似度，可以通过计算各网点突变日的历史件量与聚类中心中各聚类点的夹角余弦值；将夹角余弦值作为各网点突变日的历史件量与聚类中心中各聚类点的相似度。在本实施例中，通过计算网点突变日的历史件量与聚类中心中各聚类点的夹角余弦值来评估二者的相似性，可以消除量纲影响，提高准确率。

在一个实施例中，提供一种件量预测方法，具体包括：获取待预测突变日；调用训练好的预测模型，将待预测突变日输入至预测模型中，利用预测模型基于待预测突变日进行预测，得到待预测突变日的预测件量。

具体地，待预测突变日是指需要进行件量预测的突变日。例如，需要预测5月1日的件量，那么将5月1日作为预测模型的输入，从而得到5月1日的预测件量。

应该理解的是，虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种件量预测模型训练装置，包括：获取模块402、筛选模块404、训练模块406和预测模块408，其中：

获取模块402，用于获取业务区突变日的历史件量和业务区下各网点突变日的历史件量。

筛选模块404，用于从各网点突变日的历史件量中，筛选与业务区突变日的历史件量的件量特征相似的网点突变日的历史件量，得到相似历史件量。

训练模块406，用于利用相似历史件量以及对应的突变日对预先构建的神经网络进行预训练，得到初始预测模型；其中，相似历史件量为突变日的标注结果；

训练模块406还用于利用业务区突变日的历史件量以及突变日对初始预测模型进行迁移训练，得到预测模型；其中，业务区突变日的历史件量为突变日的标注结果。

在一个实施例中，筛选模块404还用于将业务区突变日的历史件量作为第一聚类点；基于第一聚类点和聚类点阈值，对各网点突变日的历史件量进行聚类，得到聚类结果；根据聚类结果，确定与业务区突变日的历史件量的件量特征相似网点突变日的历史件量，得到相似历史件量。

在一个实施例中，筛选模块404还用于根据聚类结果确定各网点突变日的历史件量与第一聚类点的第一距离；基于第一距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在一个实施例中，筛选模块404还用于从聚类结果中确定第一聚类点的所属类，并确定所属类的聚类点，得到所属聚类点；确定各网点突变日的历史件量与所属聚类点的第二距离；基于第二距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在一个实施例中，筛选模块404还用于根据各聚类点阈值分别确定对应的第二聚类点，将第一聚类点分别与各第二聚类点合并作为聚类中心；基于各聚类中心，分别对各网点突变日的历史件量进行聚类，得到各聚类中心对应的聚类结果；根据各聚类结果中各类的类间距离和类内距离，从聚类结果中确定最佳的聚类结果作为最终得到的聚类结果。

在一个实施例中，筛选模块404还用于计算各网点突变日的历史件量与聚类中心中各聚类点的相似度；根据相似度将各网点突变日的历史件量分配给聚类中心的各聚类点，得到初始聚类结果；计算初始聚类结果中各类的历史件量的均值，得到新聚类点；将各新聚类点合并作为聚类中心，返回分别计算各网点突变日的历史件量与聚类中心中各聚类点的相似度的步骤，直至满足聚类次数为止。

在一个实施例中，筛选模块404还用于计算各网点突变日的历史件量与聚类中心中各聚类点的夹角余弦值；将夹角余弦值作为各网点突变日的历史件量与聚类中心中各聚类点的相似度。

在一个实施例中，训练模块406还用于利用相似历史件量对预先构建好的神经网络进行初始训练，将训练好的神经网络作为初始预测模型；将初始预测模型中的预设层数的权重进行固定，将业务区突变日的历史件量输入至已固定权重的初始预测模型中，利用业务区突变日的历史件量对初始预测模型进行迁移训练，得到预测模型。

在一个实施例中，预测模块408，用于获取待预测突变日；调用训练好的预测模型，将待预测突变日输入至预测模型中，利用预测模型基于待预测突变日进行预测，得到待预测突变日的预测件量。

关于件量预测模型训练装置的具体限定可以参见上文中对于件量预测模型训练方法的限定，在此不再赘述。上述件量预测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种件量预测模型训练方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

获取业务区突变日的历史件量和业务区下各网点突变日的历史件量；

从各网点突变日的历史件量中，筛选与业务区突变日的历史件量的件量特征相似的网点突变日的历史件量，得到相似历史件量；

利用相似历史件量以及对应的突变日对预先构建的神经网络进行预训练，得到初始预测模型；其中，相似历史件量为突变日的标注结果；利用业务区突变日的历史件量以及突变日对初始预测模型进行迁移训练，得到预测模型；其中，业务区突变日的历史件量为突变日的标注结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：将业务区突变日的历史件量作为第一聚类点；基于第一聚类点和聚类点阈值，对各网点突变日的历史件量进行聚类，得到聚类结果；根据聚类结果，确定与业务区突变日的历史件量的件量特征相似网点突变日历史件量，得到相似历史件量。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据聚类结果确定各网点突变日的历史件量与第一聚类点的第一距离；基于第一距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：从聚类结果中确定第一聚类点的所属类，并确定所属类的聚类点，得到所属聚类点；确定各网点突变日的历史件量与所属聚类点的第二距离；基于第二距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据各聚类点阈值分别确定对应的第二聚类点，将第一聚类点分别与各第二聚类点合并作为聚类中心；基于各聚类中心，分别对各网点突变日的历史件量进行聚类，得到各聚类中心对应的聚类结果；根据各聚类结果中各类的类间距离和类内距离，从聚类结果中确定最佳的聚类结果作为最终得到的聚类结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：计算各网点突变日的历史件量与聚类中心中各聚类点的相似度；根据相似度将各网点突变日的历史件量分配给聚类中心的各聚类点，得到初始聚类结果；计算初始聚类结果中各类的历史件量的均值，得到新聚类点；将各新聚类点合并作为聚类中心，返回分别计算各网点突变日的历史件量与聚类中心中各聚类点的相似度的步骤，直至满足聚类次数为止。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：计算各网点突变日的历史件量与聚类中心中各聚类点的夹角余弦值；将夹角余弦值作为各网点突变日的历史件量与聚类中心中各聚类点的相似度。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：利用相似历史件量对预先构建好的神经网络进行初始训练，将训练好的神经网络作为初始预测模型；将初始预测模型中的预设层数的权重进行固定，将业务区突变日的历史件量输入至已固定权重的初始预测模型中，利用业务区突变日的历史件量对初始预测模型进行迁移训练，得到预测模型。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取待预测突变日；调用训练好的预测模型，将待预测突变日输入至预测模型中，利用预测模型基于待预测突变日进行预测，得到待预测突变日的预测件量。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

获取业务区突变日的历史件量和业务区下各网点突变日的历史件量；

从各网点突变日的历史件量中，筛选与业务区突变日的历史件量的件量特征相似的网点突变日的历史件量，得到相似历史件量；

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：将业务区突变日的历史件量作为第一聚类点；基于第一聚类点和聚类点阈值，对各网点突变日的历史件量进行聚类，得到聚类结果；根据聚类结果，确定与业务区突变日的历史件量的件量特征相似网点突变日历史件量，得到相似历史件量。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据聚类结果确定各网点突变日的历史件量与第一聚类点的第一距离；基于第一距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：从聚类结果中确定第一聚类点的所属类，并确定所属类的聚类点，得到所属聚类点；确定各网点突变日的历史件量与所属聚类点的第二距离；基于第二距离，按照从近到远从各网点突变日的历史件量中选择预设数量的突变日历史件量作为相似历史件量。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据各聚类点阈值分别确定对应的第二聚类点，将第一聚类点分别与各第二聚类点合并作为聚类中心；基于各聚类中心，分别对各网点突变日的历史件量进行聚类，得到各聚类中心对应的聚类结果；根据各聚类结果中各类的类间距离和类内距离，从聚类结果中确定最佳的聚类结果作为最终得到的聚类结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：计算各网点突变日的历史件量与聚类中心中各聚类点的相似度；根据相似度将各网点突变日的历史件量分配给聚类中心的各聚类点，得到初始聚类结果；计算初始聚类结果中各类的历史件量的均值，得到新聚类点；将各新聚类点合并作为聚类中心，返回分别计算各网点突变日的历史件量与聚类中心中各聚类点的相似度的步骤，直至满足聚类次数为止。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：计算各网点突变日的历史件量与聚类中心中各聚类点的夹角余弦值；将夹角余弦值作为各网点突变日的历史件量与聚类中心中各聚类点的相似度。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：利用相似历史件量对预先构建好的神经网络进行初始训练，将训练好的神经网络作为初始预测模型；将初始预测模型中的预设层数的权重进行固定，将业务区突变日的历史件量输入至已固定权重的初始预测模型中，利用业务区突变日的历史件量对初始预测模型进行迁移训练，得到预测模型。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取待预测突变日；调用训练好的预测模型，将待预测突变日输入至预测模型中，利用预测模型基于待预测突变日进行预测，得到待预测突变日的预测件量。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：李思文;盛夏;史玉成;张莹莹;谢宇昕;王俊杰;
专利申请人：顺丰科技有限公司;

上一篇：一种资源配置方法、上报方法及设备
下一篇：自通断传输组件、球囊及用于肩关节的假体