路径预测网络训练、订单处理方法及装置

文献发布时间：2023-06-19 09:40:06

技术领域

本申请涉及计算机技术领域，具体涉及一种路径预测网络训练方法、装置及设备。本申请同时涉及一种订单处理方法、装置及设备。

背景技术

路径规划算法是物流行业中至关重要的一环。基于路径规划算法拟合每个配送资源的推荐路径，可以使得物流调度系统选取较优的订单-配送资源组合，从而实现全局路径尽可能短且超时率尽可能低的调度目标。

现有技术中可采用深度学习算法进行路径规划，有以下三种方式：一是利用端到端的深度学习求解方法直接学习问题到解的映射。但是存在难以处理复杂约束的问题。二是通过反复迭代优化路径，学习问题和子问题解的映射。但是难以准确的拟合出全局较优的路径规划。三是将求解器嵌入端到端的系统中。但是不适用于配送环境复杂、取送点分布变化较大的组合优化问题。同时，现有的路径规划算法从运筹优化的角度去求解路径，得到的路径可能在数学计算上较短，但往往容易忽视每个骑手的偏好路径。

因此，需要解决的问题是提供合理的路径预测算法以更准确地获得配送资源的推荐路径，从而得到较优的订单-配送资源组合结果。

发明内容

本申请实施例提供的路径预测网络训练方法以及订单处理方法，提供合理的路径预测算法，更准确地获得配送资源的推荐路径以及较优的订单-配送资源组合结果。

本申请实施例提供一种路径预测网络训练方法，所述路径预测网络包含编码网络及解码网络，所述方法包括：获得待处理的订单配送信息；从待处理的订单配送信息中提取第一输入数据，将第一输入数据输入编码网络得到第一特征数据；根据第一特征数据生成第二输入数据，将第二输入数据输入解码网络得到第二特征数据，所述第二特征数据用于确定配送资源的推荐取送序列；使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第二特征数据进行短路连接处理，根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络。

可选的，所述使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第二特征数据进行短路连接处理，包括：使用第一输入数据与第一特征数据的比值对第一特征数据进行自适应调整，将第一输入数据与自适应调整后的第一特征数据进行短路加和处理；和/或，使用第二输入数据与第二特征数据的比值对第二特征数据进行自适应调整，将第二输入数据与自适应调整后的第二特征数据进行短路加和处理。

可选的，还包括：获取预设的第一截断条件，根据第一截断条件以及第一输入数据与第一特征数据的比值，对第一特征数据进行自适应调整；和/或，获取预设的第二截断条件，根据第二截断条件以及第二输入数据与第二特征数据的比值，对第二特征数据进行自适应调整。

可选的，所述根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络，包括：获取配送资源的真实取送序列；使用真实取送序列对推荐取送序列进行监督，训练得到目标路径预测网络。

可选的，所述使用真实取送序列对推荐取送序列进行监督，训练得到目标路径预测网络，包括：计算真实取送序列与推荐取送序列之间的肯德尔等级相关系数；根据肯德尔等级相关系数训练路径预测网络；如果推荐取送序列与真实取送序列之间的序数关联度满足预设关联条件，则训练完成；否则，将真实取送序列与推荐取送序列之差反向输入编码网络和/或解码网络，继续训练路径预测网络。

可选的，所述将第一输入数据输入编码网络得到第一特征数据，包括：将第一输入数据输入编码网络得到当前状态下的一组嵌入向量，作为所述第一特征数据；所述根据第一特征数据生成第二输入数据，包括：对所述嵌入向量取平均值得到用于表征嵌入向量的图形结构的图嵌入向量；将所述嵌入向量以及所述图嵌入向量分别作为所述第二输入数据；或者，将所述嵌入向量以及所述图嵌入向量进行向量连接处理，得到第二输入数据。

可选的，所述将第一输入数据输入编码网络得到第一特征数据，包括：确定编码网络的每个注意力头和第一输入数据的余弦相似度，作为所述每个注意力头的权重；使用每个注意力头的权重更新对应的注意力头，对更新后的注意力头进行向量拼接，将拼接后的结果与第一权重矩阵相乘得到第一特征数据。

可选的，所述将第二输入数据输入解码网络得到第二特征数据，包括：确定解码网络的每个注意力头和第二输入数据的余弦相似度，作为所述每个注意力头的权重；使用每个注意力头的权重更新对应的注意力头，对更新后的注意力头进行向量拼接，将拼接后的结果与第二权重矩阵相乘得到第二特征数据。

可选的，所述待处理的订单配送信息，包括：配送订单的数据、配送资源的信息及配送对象的关联信息；所述从待处理的订单配送信息中提取第一输入数据，包括：从配送订单的数据中获取配送对象的提取位置及配送目的位置；从配送资源的信息中获取配送资源的起始位置、配送资源与提取位置之间的第一距离、配送资源与配送目的位置之间的第二距离；从配送对象的关联信息中获取配送对象的配备时间；根据提取位置、配送目的位置、配送资源的起始位置、第一距离、第二距离以及配备时间，生成所述第一输入数据。

本申请实施例还提供一种订单处理方法，包括：将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列；根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序；按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源；其中，所述路径预测网络为权利要求1至9任一项所述的路径预测网络。

可选的，所述将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列，包括：获得配送资源的当前位置以及当前未完成配送的配送订单数据；根据配送资源的当前未完成配送的配送订单数据获得第一配送对象的配送信息，根据待分派订单的数据获得第二配送对象的配送信息；将配送资源的当前位置、第一配送对象的配送信息以及第二配送对象的配送信息，输入路径预测网络，得到配送资源的推荐取送序列；其中，所述配送信息，包括配送对象的下述至少一种信息：提取位置、配送目的位置、配备时间及配送时间、配送资源的当前位置与提取位置之间的第一距离、配送资源的当前位置与配送目的位置之间的第二距离；所述配送资源的推荐取送序列，包括针对配送资源推荐的去往下述位置的顺序：第一配送对象的提取位置、第一配送对象的配送目的位置、第二配送对象的提取位置、第二配送对象的配送目的位置。

可选的，所述根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序，包括：根据配送资源的推荐取送序列确定配送资源的路径长度和/或超时率；确定路径长度满足预设长度条件和/或超时率满足预设超时率条件的候选配送资源；根据候选配送资源的路径长度排序和/或超时率排序确定所述优先级排序。

可选的，所述按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源，包括：将所述待分派订单的数据发送给所述候选配送资源；根据接收的候选配送资源的接单请求，从所述候选配送资源中确定所述目标配送资源，向所述目标配送资源提供所述推荐取送序列的信息。

本申请实施例还提供一种路径预测网络训练装置，所述路径预测网络包含编码网络及解码网络，所述装置包括：信息获得单元，用于获得待处理的订单配送信息；特征提取单元，用于从待处理的订单配送信息中提取第一输入数据，将第一输入数据输入编码网络得到第一特征数据；路径预测单元，用于根据第一特征数据生成第二输入数据，将第二输入数据输入解码网络得到第二特征数据，所述第二特征数据用于确定配送资源的推荐取送序列；训练单元，用于使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第一特征数据进行短路连接处理，根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络。

本申请实施例还提供一种订单处理装置，包括：路径预测单元，用于将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列；排序单元，用于根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序；分派单元，用于按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源；其中，所述路径预测网络为上述任一路径预测网络或目标路径预测网络。

本申请实施例还提供一种电子设备，包括：存储器，以及处理器；所述存储器用于存储计算机程序，所述计算机程序被所述处理器运行后，执行本申请实施例提供的所述方法。

本申请实施例还提供一种存储设备，存储有计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

与现有技术相比，本申请具有以下优点：

本申请实施例提供的一种路径预测网络训练方法、装置及设备，通过从待处理的订单配送信息中提取第一输入数据，将第一输入数据输入编码网络得到第一特征数据；根据第一特征数据生成第二输入数据，将第二输入数据输入解码网络得到用于确定配送资源的推荐取送序列的第二特征数据；使用第一输入数据与第一特征数据进行短路连接处理，该短路连接处理在每经过一次编码网络计算均执行一次，和/或，使用第二输入数据与第二特征数据进行短路连接处理，该短路连接处理在每经过一次解码网络计算均执行一次；根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络。将路径预测网络中的编码网络和/或解码网络中加入短路连接处理，能够保持编码及解码机制输出的稳定性，提高了路径预测网络输出的推荐取送序列的准确度以及路径预测算法的精度。进一步，路径预测网络中通过真实取送序列监督推荐取送序列，学习了配送资源的路径偏好信息，因而能获得尽可能真实的路径预测结果。

本申请实施例提供的一种订单处理方法、装置及设备，通过将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列；根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序；按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源。由于路径预测网络得到每个配送资源执行配送任务的推荐路径信息，同时路径预测网络的训练过程中学习了每个配送资源的偏好路径信息，因此可以从全局更准确地选取较佳的订单-配送资源组合，将订单匹配给更为合适的配送资源。

附图说明

图1是本申请实施例提供的方法的系统结构示意图；

图2是本申请第一实施例提供的路径预测网络训练方法的处理流程图；

图3是本申请第一实施例提供的混合MHA网络的网络结构示意图；

图4是本申请第一实施例提供的自适应短路连接机制的示意图；

图5是本申请第一实施例提供的在具有不同分布的数据集上路径预测网络与基线模型的训练对比效果示意图；

图6是本申请第二实施例提供的订单处理方法的处理流程图；

图7是本申请第三实施例提供的路径预测网络训练装置示意图；

图8是本申请第四实施例提供的订单处理装置示意图；

图9是本申请提供的电子设备示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

本申请实施例提供一种路径预测网络训练方法、装置、电子设备及存储设备。本申请实施例提供一种订单处理方法、装置、电子设备及存储设备。在下面的实施例中逐一进行说明。

为便于理解，首先给出本申请实施例提供的方法的系统结构。请参考图1，图中所示的路径预测网络包括：MHA编码网络101、MHA解码网络102以及各自的自适应短路连接103。

路径预测网络为基于MHA机制(Multi Head Attention，多头注意力)构建的神经网络，用于根据待处理的订单配送信息学习得到目标路径预测网络。路径预测网络通过拟合每个配送资源执行一组订单配送任务的推荐路径，从而根据每个配送资源的推荐路径确定合适的订单-配送资源组合，将订单匹配给合适的配送资源(如骑手、自动配送设施等)。拟合得到的配送资源的推荐路径，为每个配送资源执行当前所有配送任务的推荐取送序列。每个配送资源的当前所有配送任务为包含待分派订单对应的配送任务在内的所有当前未完成的配送任务。其中，推荐取送序列为每个配送资源的配送任务中包含的提取位置及目的位置的排序序列。基于MHA机制构建的神经网络，根据前一个状态学习得到的要关注的信息及当前输入信息，并行计算每个注意力头的每次当前状态，计算效率比较高。

图1中所示的MHA编码网络以及MHA解码网络分别包括至少一个多头注意力机制层。MHA编码网络为采用嵌入编码(embedding)方式将输入的离散序列转变为连续向量。MHA解码网络用于将编码网络生成的向量转换为输出序列。路径预测网络的第一输入数据为根据待处理的订单配送信息提取的训练数据；路径预测网络输出的推荐取送序列为学习过程中每次计算得到的、每个配送资源去往配送对象提取位置及配送位置的排序。MHA编码网络和/或MHA解码网络可以加入自适应短路连接机制。所谓短路连接(skip connections)，是指将输出表述为输入和输入的一个非线性变换的线性叠加，如图1所示，MHA编码网络可以看作是对第一输入数据进行的非线性变换，与第一输入数据进行线性叠加后得到的结果作为MHA编码网络的最终输出。同理，MHA解码网络可以看作是对其输入进行的非线性变换，与其输入进行线性叠加后得到的结果作为MHA解码网络输出的特征数据，路径预测网络使用该特征数据确定输出的推荐取送序列。所谓自适应短路连接，是指根据MHA网络的输入信息对输出响应进行自适应调整后，再与MHA网络的输入信息进行线性叠加，将叠加后的结果作为MHA网络的最终输出响应；其中，MHA网络指MHA编码网络和/或MHA解码网络。加入短路连接可以解决在较深网络中的梯度爆炸和梯度消失问题，加入自适应调整可以使得路径预测网络模型的输出更稳定。进一步，路径预测网络还包括监督模块，监督模块用于根据配送资源的真实取送序列对推荐取送序列进行监督训练，将真实取送序列与推荐取送序列之差反向输入编码网络和/或解码网络。

以下结合图2至图5对本申请第一实施例提供的路径预测网络训练方法进行说明。图2所示的路径预测网络训练方法，所述路径预测网络包括编码网络及解码网络，所述方法包括：步骤S201至步骤S204。

步骤S201，获得待处理的订单配送信息。

本实施例中，路径预测网络为基于MHA机制构建的包括编码-解码网络结构的神经网络模型，用于拟合将待分派订单分派给配送资源后配送资源的推荐取送序列。所谓取送序列为每个配送资源的配送任务中包含的提取位置及目的位置的排序序列，用于表征每个配送资源配送路径。编码网络及解码网络均可包含多个注意力头。优选的，编码网络为基于MHA机制的MHA编码网络，解码网络为基于MHA机制的MHA解码网络。MHA编码网络可包含至少一个多头注意力层。MHA解码网络可包含至少一个多头注意力层。

本步骤为获取用于训练路径预测网络的训练数据集。具体使用历史订单配送信息作为训练数据集。所述获得待处理的订单配送信息，为获得历史订单配送信息。实施时，所述待处理的订单配送信息，包括：配送订单的数据、配送资源的信息及配送对象的关联信息；例如，配送订单的数据为外卖订单，如取餐地址、送餐地址、取餐时间、送餐时间等；配送资源的信息为骑手信息，如骑手位置信息、骑手已接单信息；配送对象的关联信息包含提供配送对象的商家的信息、配送对象的配备时间等。后续步骤从待处理的订单配送信息中提取第一输入数据，第一输入数据为用于训练所述路径预测网络的训练数据。

步骤S202，从待处理的订单配送信息中提取第一输入数据，将第一输入数据输入编码网络得到第一特征数据。

本步骤为获取路径预测网络中编码网络的输入信息及输出响应。实施时，所述待处理的订单配送信息，包括：配送订单的数据、配送资源的信息及配送对象的关联信息；所述从待处理的订单配送信息中提取第一输入数据，包括：从配送订单的数据中获取配送对象的提取位置及配送目的位置；从配送资源的信息中获取配送资源的起始位置、配送资源与提取位置之间的第一距离、配送资源与配送目的位置之间的第二距离；从配送对象的关联信息中获取配送对象的配备时间；根据提取位置、配送目的位置、配送资源的起始位置、第一距离、第二距离以及配备时间，生成所述第一输入数据。将第一输入数据输入编码网络，编码网络学习得到的输出响应为第一特征数据。

本实施例中，也可以对第一输入数据进行旋转和/或平移等数据增强处理，将增强处理后的数据输入编码网络，以便增加数据的多样性，从而可以更好拟合真实配送场景的数据分布。使用数据增强处理后的训练数据训练路径预测网络，得到的目标路径预测网络在分布不同的数据集上的泛化性能较好，鲁棒性更好。因此，尤其适用于外卖场景的配送路径拟合，外卖场景中区域配送环境复杂，订单的配送对象提取位置及目的位置的分布具有多样性。

本实施例中，编码网络具体可采用引入混合MHA机制的网络结构，即单独计算编码网络中的每个不同注意力头，从而将不同维度上的信息在一个学习到的偏好基础上联合起来，使得路径预测网络学习到的知识更有针对性。本实施例中，学习到的偏好为每个配送资源的偏好路径。具体通过使用每个配送资源的真实取送序列对路径预测网络输出的推荐取送序列进行监督，比较得到的真实取送序列与推荐取送序列之间的差值反向输入到编码网络和/或解码网络，形成负反馈，从而学习到每个配送资源的路径偏好信息。

一个实施方式中，所述编码网络为引入混合机制的混合MHA网络结构，包含多个注意力头；编码网络的每个注意力头的更新及第一特征数据的计算包括下述处理：确定编码网络的每个注意力头和第一输入数据的余弦相似度，作为所述每个注意力头的权重；使用每个注意力头的权重更新对应的注意力头，对更新后的注意力头进行向量拼接，将拼接后的结果与第一权重矩阵相乘得到第一特征数据。请参考图3，图中示出的引入混合机制的混合MHA网络结构中，包括：多个不同注意力头H1,H2,...,Hn，每个不同注意力头分别和混合MHA网络的输入x求余弦相似度，得到C1,C2,...,Cn；将该余弦相似度作为每个注意力头的权值与对应的注意力头相乘得到更新的注意力头H'1,H'2,...,H'n。当混合MHA网络为编码网络时，图中的Wout为第一权重矩阵，初始值可以是生成的随机矩阵，在网络训练过程中进行学习更新。

本实施例中，编码网络的输入信息为第一输入数据，其输出响应为学习得到的嵌入向量(即embedding后的向量)，进一步，由所述嵌入向量取平均值得到图嵌入向量，图嵌入向量表征了嵌入向量的图形结构，也可视为编码网络的输出响应。即，将嵌入向量和/或图嵌入向量作为所述第一特征数据。

步骤S203，根据第一特征数据生成第二输入数据，将第二输入数据输入解码网络得到第二特征数据，所述第二特征数据用于确定配送资源的推荐取送序列。

本步骤为生成解码网络的输入信息以及得到解码网络的输出响应，解码网络的输出响应为第二特征数据，其用于确定配送资源的推荐取送序列。

本实施例中，具体包括：将第一输入数据输入编码网络得到当前状态下的一组嵌入向量，作为所述第一特征数据；对所述嵌入向量取平均值得到用于表征嵌入向量的图形结构的图嵌入向量；将所述嵌入向量以及所述图嵌入向量分别作为所述第二输入数据；或者，将所述嵌入向量以及所述图嵌入向量进行向量连接处理，得到第二输入数据。其中，所述嵌入向量，为通过编码网络进行embedding编码后得到的向量。将所述嵌入向量相加然后除以向量个数从而得到平均值作为图嵌入向量。

本实施例中，与编码网络相似，解码网络具体可采用引入混合MHA机制的网络结构，单独计算编码网络中的每个不同注意力头，从而将不同维度上的信息在一个学习到的偏好基础上联合起来，使得路径预测网络学习到的知识更有针对性。本实施例中，通过使用每个配送资源的真实取送序列对路径预测网络输出的推荐取送序列进行监督，从而学习到每个配送资源的路径偏好信息。一个实施方式中，基于混合MHA网络结构的解码网络，包含多个注意力头；解码网络的每个注意力头的更新及推荐取送序列的计算包括下述处理：确定解码网络的每个注意力头和第二输入数据的余弦相似度，作为所述每个注意力头的权重；使用每个注意力头的权重更新对应的注意力头，对更新后的注意力头进行向量拼接，将拼接后的结果与第二权重矩阵相乘得到第二特征数据；路径预测网络使用第二特征数据确定配送资源的推荐取送序列。请参考图3，当图中所示的混合MHA网络为解码网络时，图中的Wout为第二权重矩阵，初始值可以是生成的随机矩阵，在网络训练过程中进行学习更新。解码网络的每个注意力头的更新及输出的第二特征数据的计算类似图3所示的混合MHA网络结构中的计算处理，此处不再赘述。

步骤S204，使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第二特征数据进行短路连接处理，根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络。

本步骤为训练得到目标路径预测网络。编码网络和/或解码网络可加入自适应调整和/或短路连接机制。所谓自适应调整，是指以网络的输入信息对其输出响应进行自适应调整。所谓短路连接，是指将网络的输入信息与其输出响应进行短路连接，一般为短路加和。当然，自适应调整及短路连接，可以单独加入编码网络和/或解码网络，也可以同时加入编码网络和/或解码网络。

以混合MHA网络为例说明自适应短路连接机制。以混合MHA网络的输入信息对其输出响应进行自适应调整，将输入信息与自适应调整后的输出进行线性叠加，将叠加结果作为混合MHA网络的输出响应。加入短路连接可以解决在较深网络中的梯度爆炸和梯度消失问题，加入自适应调整可以使得路径预测网络模型的输出更稳定。请参考图4，图中以混合MHA网络(及Mixture of MHA)为例示出了自适应短路连接机制，包括：确定混合MHA的输入x和输出f(x)的比值ratio，当比值ratio过大或者过小时进行截断；用更新后的ratio值调整f(x)，得到自适应的输出f(x)；将f(x)与x做一个短路连接的加和，加和结果为混合MHA网络的输出响应，从而实现了短路连接的自适应控制，即自适应短路连接。例如，当ratio>2时，将用于调整f(x)的值设置为2；将ratio<0.5，将用于调整f(x)的值设置为0.5。所述混合MHA网络为编码网络和/或解码网络。当混合MHA网络为编码网络时，其输入信息为第一输入数据，其输出响应为第一特征数据。当混合MHA网络为解码网络时，其输入信息为第二输入数据，其输出响应为第二特征数据；第二特征数据用于路径预测网络计算配送资源的配送任务中提取位置及配送目的位置的概率，路径预测网络根据所述概率进行排序得到配送资源的推荐取送序列。

本实施例中，在编码网络及解码网络中的至少一个网络中引入短路连接机制，即：使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第二特征数据进行短路连接处理。进一步，在编码网络及解码网络中的至少一个网络中引入自适应调整。编码网络中的短路连接处理和/或自适应调整，每经过一次编码网络计算均执行一次；解码网络中的短路连接处理和/或自适应调整，每经过一次解码网络计算均执行一次。引入短路连接及自适应调整控制使得输出响应更稳定，从而加速模型收敛，并提高算法精度。具体包括下述处理：

使用第一输入数据与第一特征数据的比值对第一特征数据进行自适应调整，将第一输入数据与自适应调整后的第一特征数据进行短路加和处理；和/或，

使用第二输入数据与第二特征数据的比值对第二特征数据进行自适应调整，将第二输入数据与自适应调整后的第二特征数据进行短路加和处理。

其中，可以根据预设的截断条件以及输入信息与输出响应的比值，对编码网络和/或解码网络的输出响应进行自适应调整，具体包括：

获取预设的第一截断条件，根据第一截断条件以及第一输入数据与第一特征数据的比值，对第一特征数据进行自适应调整；和/或，

获取预设的第二截断条件，根据第二截断条件以及第二输入数据与第二特征数据的比值，对第二特征数据进行自适应调整。

当编码网络输出的嵌入向量以及图嵌入向量分别作为第二输入数据时，可使用嵌入向量以及图嵌入向量至少之一对解码网络的输出响应(即第二特征数据)进行自适应短路连接。

本实施例中，使用配送资源的真实取送序列进行监督，促使路径预测网络学习到配送资源的偏好路径信息。具体包括：获取配送资源的真实取送序列；使用真实取送序列对推荐取送序列进行监督，训练得到目标路径预测网络。其中，所述使用真实取送序列对推荐取送序列进行监督，训练得到目标路径预测网络，包括：计算真实取送序列与推荐取送序列之间的肯德尔等级相关系数；根据肯德尔等级相关系数训练路径预测网络；如果推荐取送序列与真实取送序列之间的序数关联度满足预设关联条件，则训练完成；否则，将真实取送序列与推荐取送序列之差反向输入编码网络和/或解码网络，继续训练路径预测网络。至此，得到目标路径预测网络。德尔等级相关系数为用于测量两个序列之间的序数关联的统计量。通过将真实取送序列与推荐取送序列之间的差值作为反向输入信息输入到编码网络和/或解码网络，可以将历史配送路径信息作为监督编码到网络中，从而使得路径预测网络学习到配送资源的路径偏好信息，更准确地预测配送资源可能选择的路径。具体的，所述反向输入信息在各网络的输入侧的引入点可以为短路连接处理时的输入侧连接点之前，也可以在该输入侧连接点之后，不作约束。

请参考图5，图中示出了在具有不同分布的数据集上配送路径预测网络与基线模型的训练对比效果，图中线条1为baseline(基线)模型在具有不同分布的训练数据集上的训练曲线；线条2为引入自适应短路连接机制的路径预测网络在具有不同分布的训练数据集上的训练曲线；图中的U(x,y)为表示x到y的均匀分布的训练数据集；图5的各曲线图中的纵坐标cost为代价函数的值，横坐标为训练epoch，1个epoch为使用训练数据集中的全部样本训练一次。从中可以看出，本实施例提供的路径预测网络在具有不同分布的训练数据集上的泛化性能较好，并且训练cost更稳定，鲁棒性更好。

本实施例提供的路径预测网络可用于配送调度系统，以全局较优的视角统筹区域内的订单和配送资源，将订单匹配给合适的配送资源，高效地完成订单的配送任务。所述路径预测网络中根据第二特征数据最终输出每个配送资源的推荐取送序列，具体的，根据第二特征数据用于计算配送资源的配送任务中提取位置及配送目的位置的概率，根据概率进行排序得到配送资源的推荐取送序列，即得到每个配送资源的路径规划。所述推荐取送序列能够表征一个配送资源执行一组订单配送任务的效果，因而可用于选取效果较佳的订单-配送资源组合，进行派单决策。比如获得新订单后，使用路径预测网络计算针对该新订单所有备选骑手接到该订单后的推荐取送序列，该推荐取送序列为基于学习到对应骑手的路径偏好信息得到的推荐路径，因此可以逼近接单骑手接单后的真实路径，从而提供可靠的派单决策依据。

需要说明的是，在不冲突的情况下，在本实施例和本申请的其他实施例中给出的特征可以相互组合，并且步骤S201和S202或类似用语不限定步骤必须先后执行。

至此，对本实施例提供的方法进行了说明，所述方法通过从待处理的订单配送信息中提取第一输入数据，将第一输入数据输入编码网络得到第一特征数据；根据第一特征数据生成第二输入数据，将第二输入数据输入解码网络得到用于确定配送资源的推荐取送序列的第二特征数据；使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第二特征数据进行短路连接处理，根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络。将路径预测网络中的编码网络和/或解码网络中加入短路连接处理，该短路连接处理在每经过一次其所在网络的计算均执行一次，能够保持编码及解码机制输出的稳定性，提高了路径预测网络输出的推荐取送序列的准确度以及路径预测算法的精度。进一步，路径预测网络中通过真实取送序列监督推荐取送序列，学习了配送资源的路径偏好信息，因而能获得尽可能真实的路径预测结果。

第二实施例以上述系统结构及实施例为基础，第二实施例提供一种订单处理方法。以下结合图6进行说明。图6所示的订单处理方法，包括：步骤S601至步骤S603。

步骤S601，将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列。

本实施例中，所述路径预测网络为上述系统结构及实施例中给出的任一路径预测网络及目标路径预测网络。路径预测网络结构及训练请参见上文，不再一一赘述。

本步骤中待分派订单可为新生成的待指定配送资源的订单。配送资源信息为每个备选的配送资源的信息。使用所述路径预测网络针对每个配送资源如果被指定待分派订单后的推荐取送序列进行拟合，由于路径预测网络基于学习到的每个配送资源的路径偏好信息学习新派单后的推荐取送序列，因此可以逼近接单配送资源接单后的真实路径。根据推荐取送序列可以选取出路径尽可能短、超时率尽可能低的效果较佳的订单-配送资源组合进行派单。

本实施例中，所述将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列，包括：

获得配送资源的当前位置以及当前未完成配送的配送订单数据；

根据配送资源的当前未完成配送的配送订单数据获得第一配送对象的配送信息，根据待分派订单的数据获得第二配送对象的配送信息；

将配送资源的当前位置、第一配送对象的配送信息以及第二配送对象的配送信息，输入路径预测网络，得到配送资源的推荐取送序列；

其中，所述配送信息，包括配送对象的下述至少一种信息：提取位置、配送目的位置、配备时间及配送时间、配送资源的当前位置与提取位置之间的第一距离、配送资源的当前位置与配送目的位置之间的第二距离；

所述配送资源的推荐取送序列，包括针对配送资源推荐的去往下述位置的顺序：第一配送对象的提取位置、第一配送对象的配送目的位置、第二配送对象的提取位置、第二配送对象的配送目的位置。

步骤S602，根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序。

本步骤为确定订单-配送资源组合的优先级排序。具体包括下述处理：根据配送资源的推荐取送序列确定配送资源的路径长度和/或超时率；确定路径长度满足预设长度条件和/或超时率满足预设超时率条件的候选配送资源；根据候选配送资源的路径长度排序和/或超时率排序确定所述优先级排序。步骤S603，按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源。

本步骤为确定目标配送资源，具体包括下述处理：将所述待分派订单的数据发送给所述候选配送资源；根据接收的候选配送资源的接单请求，从所述候选配送资源中确定所述目标配送资源，向所述目标配送资源提供所述推荐取送序列的信息。即，根据骑手的接单请求派单，并将推荐路径发送给接单骑手。

本实施例提供的订单处理方法，以全局较优的视角统筹区域内的订单和配送资源，将订单匹配给合适的配送资源，从而高效地完成订单的配送任务。

至此，对本实施例提供的方法进行了说明，所述方法通过将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列；根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序；按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源。由于路径预测网络得到每个配送资源执行配送任务的推荐路径信息，同时路径预测网络的训练过程中学习了每个配送资源的偏好路径信息，因此可以从全局更准确地选取较佳的订单-配送资源组合，将订单匹配给更为合适的配送资源。

第三实施例与第一实施例对应，本申请第三实施例提供一种路径预测网络训练装置。所述路径预测网络包含编码网络及解码网络，以下结合图7对所述装置进行说明。图7所示的路径预测网络训练装置，包括：

信息获得单元701，用于获得待处理的订单配送信息；

特征提取单元702，用于从待处理的订单配送信息中提取第一输入数据，将第一输入数据输入编码网络得到第一特征数据；

路径预测单元703，用于根据第一特征数据生成第二输入数据，将第二输入数据输入解码网络得到第二特征数据，所述第二特征数据用于确定配送资源的推荐取送序列；

训练单元704，用于使用第一输入数据与第一特征数据进行短路连接处理，和/或，使用第二输入数据与第二特征数据进行短路连接处理，根据短路连接处理的结果信息训练路径预测网络，得到目标路径预测网络。

可选的，所述训练单元704具体用于：使用第一输入数据与第一特征数据的比值对第一特征数据进行自适应调整，将第一输入数据与自适应调整后的第一特征数据进行短路加和处理；和/或，使用第二输入数据与第二特征数据的比值对推荐取送序列进行自适应调整，将第二输入数据与自适应调整后的第二特征数据进行短路加和处理。

可选的，所述训练单元704具体用于：获取预设的第一截断条件，根据第一截断条件以及第一输入数据与第一特征数据的比值，对第一特征数据进行自适应调整；和/或，获取预设的第二截断条件，根据第二截断条件以及第二输入数据与第二特征数据的比值，对第二特征数据进行自适应调整。

可选的，所述训练单元704具体用于：获取配送资源的真实取送序列；使用真实取送序列对推荐取送序列进行监督，训练得到目标路径预测网络。

可选的，所述训练单元704具体用于计算真实取送序列与推荐取送序列之间的肯德尔等级相关系数；根据肯德尔等级相关系数训练路径预测网络；如果推荐取送序列与真实取送序列之间的序数关联度满足预设关联条件，则训练完成；否则，将真实取送序列与推荐取送序列之差反向输入编码网络和/或解码网络，继续训练路径预测网络。

可选的，所述特征提取单元702具体用于：将第一输入数据输入编码网络得到当前状态下的一组嵌入向量，作为所述第一特征数据；所述路径预测单元703具体用于：对所述嵌入向量取平均值得到用于表征嵌入向量的图形结构的图嵌入向量；将所述嵌入向量以及所述图嵌入向量分别作为所述第二输入数据；或者，将所述嵌入向量以及所述图嵌入向量进行向量连接处理，得到第二输入数据。

可选的，所述特征提取单元702具体用于：确定编码网络的每个注意力头和第一输入数据的余弦相似度，作为所述每个注意力头的权重；使用每个注意力头的权重更新对应的注意力头，对更新后的注意力头进行向量拼接，将拼接后的结果与第一权重矩阵相乘得到第一特征数据。

可选的，所述路径预测单元703具体用于：确定解码网络的每个注意力头和第二输入数据的余弦相似度，作为所述每个注意力头的权重；使用每个注意力头的权重更新对应的注意力头，对更新后的注意力头进行向量拼接，将拼接后的结果与第二权重矩阵相乘得到第二特征数据。

可选的，所述待处理的订单配送信息，包括：配送订单的数据、配送资源的信息及配送对象的关联信息；

所述特征提取单元702具体用于：从配送订单的数据中获取配送对象的提取位置及配送目的位置；从配送资源的信息中获取配送资源的起始位置、配送资源与提取位置之间的第一距离、配送资源与配送目的位置之间的第二距离；从配送对象的关联信息中获取配送对象的配备时间；根据提取位置、配送目的位置、配送资源的起始位置、第一距离、第二距离以及配备时间，生成所述第一输入数据。

第四实施例与第二实施例对应，本申请第四实施例提供一种订单处理装置。以下结合图8对所述装置进行说明。图8所示的订单处理装置，包括：

路径预测单元801，用于将待分派订单的数据以及配送资源的信息输入路径预测网络，得到配送资源的推荐取送序列；

排序单元802，用于根据配送资源的推荐取送序列，确定待分派订单对应的订单-配送资源组合的优先级排序；

分派单元803，用于按照订单-配送资源组合的优先级排序，确定用于配送所述待分派订单的目标配送资源；

其中，所述路径预测网络为上述任一路径预测网络或目标路径预测网络。

可选的，所述路径预测单元801具体用于：获得配送资源的当前位置以及当前未完成配送的配送订单数据；根据配送资源的当前未完成配送的配送订单数据获得第一配送对象的配送信息，根据待分派订单的数据获得第二配送对象的配送信息；将配送资源的当前位置、第一配送对象的配送信息以及第二配送对象的配送信息，输入路径预测网络，得到配送资源的推荐取送序列；

可选的，所述排序单元802具体用于：根据配送资源的推荐取送序列确定配送资源的路径长度和/或超时率；确定路径长度满足预设长度条件和/或超时率满足预设超时率条件的候选配送资源；根据候选配送资源的路径长度排序和/或超时率排序确定所述优先级排序。

可选的，所述分派单元803具体用于：将所述待分派订单的数据发送给所述候选配送资源；根据接收的候选配送资源的接单请求，从所述候选配送资源中确定所述目标配送资源，向所述目标配送资源提供所述推荐取送序列的信息。

以上述实施例为基础，本申请第五实施例提供一种电子设备，相关的部分请参见上述实施例的对应说明即可。请参考图9，图9所示的电子设备包括存储器901和处理器902。所述存储器存储有计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

以上述实施例为基础，本申请第十实施例提供一种存储设备，相关的部分请参见上述实施例的对应说明即可。所述存储设备的示意图类似图9。所述存储设备存储有计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

2、本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张皓;朱麟;余维;
专利申请人：拉扎斯网络科技(上海)有限公司;

上一篇：一种标注样本确定方法、装置、机器可读介质及设备
下一篇：基于区块链的数据处理方法、装置、服务器及存储介质