掌桥专利:专业的专利平台
掌桥专利
首页

流量预测方法、装置、计算机设备和存储介质

文献发布时间:2024-04-18 19:58:53


流量预测方法、装置、计算机设备和存储介质

技术领域

本申请涉及共享单车车辆调度技术领域,特别是涉及一种流量预测方法、装置、计算机设备和存储介质。

背景技术

随着共享单车技术的发展,共享单车已成为城市中的一项重要出行交通工具,共享单车车辆调度通过智能算法和数据分析,合理安排共享单车的分布和调配,以提高车辆利用率和满足用户需求。

传统方法中,可以使用一阶马尔可夫链对各个车站的车流量进行预测。具体的,根据车站状态数据(或车辆状态数据)确定每个共享单车中的转移概率,并生成状态转移矩阵,基于车站状态(或车辆状态)和转移概率矩阵对各个车站的流量进行预测,以辅助车辆调度的决策。

然而,传统方法对于车站间的车辆流转情况的预测中,由于车辆的流转受到多种因素的影响,导致传统使用一阶马尔可夫链的流量预测方法对各车站的流量预测的准确率较低。

发明内容

基于此,有必要针对上述技术问题,提供一种流量预测方法、装置、计算机设备和存储介质。

第一方面,本申请提供了一种流量预测方法,包括:

获取目标区域内各区块对应的特征数据;

根据所述特征数据和车辆流转预测模型,得到每个预设时段下所述各区块内每个车站的车辆流转数据;

基于所述特征数据、所述车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个所述预设时段下的目标转移概率矩阵;

基于多阶马尔可夫算法对每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵进行处理,得到所述目标时段的每个所述车站的车辆流量结果;所述预设时段包括所述目标时段;所述车辆流量结果用于辅助车辆调度决策。

在其中一个实施例中,所述特征数据包含区块特征、时段特征和交叉特征,所述车辆流转预测模型为梯度提升树模型;所述根据所述特征数据和车辆流转预测模型,得到每个预设时段下所述各区块内每个车站的车辆流转数据,包括:

根据所述梯度提升树模型对所述区块特征、所述时段特征和所述交叉特征进行特征提取,得到特征向量;

基于所述梯度提升树模型和所述特征向量,得到每个所述预设时段下所述各区块内每个所述车站的所述车辆流转数据。

在其中一个实施例中,所述基于所述特征数据、所述车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个所述预设时段下的目标转移概率矩阵,包括:

获取初始时刻的每个所述车站包含的初始车辆数量;所述初始时刻为第一个所述预设时段;

根据所述初始车辆数量与每个所述预设时段的所述车辆流转数据,得到每个所述预设时段的车辆数量;

基于所述特征数据、每个所述预设时段的车辆数量和第一转移概率预测模型,得到第一转移概率矩阵,并基于所述特征数据、每个所述预设时段的车辆数量和第二转移概率预测模型,得到第二转移概率矩阵;

根据预设周期内的历史车辆流转数据,确定所述预设时段对应的第三转移概率矩阵;

对所述第一转移概率矩阵、所述第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个所述预设时段下每个所述车站的目标转移概率矩阵。

在其中一个实施例中,所述根据预设周期内的历史车辆流转数据,确定所述预设时段对应的第三转移概率矩阵,包括:

获取预设周期内相同特征下的所述预设时段的历史车辆流转数据;

根据所述历史车辆流转数据计算所述预设时段的每个所述车站的历史车辆流转概率;

根据每个所述车站的所述历史车辆流转概率构建第三转移概率矩阵。

在其中一个实施例中,所述对所述第一转移概率矩阵、所述第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个所述预设时段下每个所述车站的目标转移概率矩阵,包括:

根据所述特征数据构建测试样本;

将所述测试样本分别输入至所述第一转移概率预测模型和所述第二转移概率预测模型,得到第一准确率和第二准确率;

获取第三转移概率矩阵对应的加权系数,并基于所述加权系数以及所述第一准确率和所述第二准确率,确定所述第一转移概率预测模型对应的第一权重系数和所述第二转移概率预测模型对应的第二权重系数;

基于所述第一权重系数、所述第二权重系数和预设权重系数分别对所述第一转移概率矩阵、所述第二转移概率矩阵和所述第三转移概率矩阵进行加权平均,得到每个所述预设时段下每个所述车站的目标转移概率矩阵。

在其中一个实施例中,所述基于所述特征数据、所述车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个所述预设时段下的目标转移概率矩阵之前,所述方法还包括:

获取样本特征数据;

将所述样本特征数据中所述预设时段的所述车站对应的区块特征数据、时段特征数据和交叉特征数据,以及每个所述车站的所述车辆数量作为训练样本,并将所述历史特征数据中所述预设时段的每个所述车站与其他车站间的转移概率作为所述训练样本对应的样本标签;

通过所述训练样本以及所述训练样本对应的样本标签,分别对待训练的第一转移概率预测模型和待训练的第二转移概率预测模型进行训练,得到训练完成的第一转移概率预测模型和训练完成的第二转移概率预测模型。

在其中一个实施例中,所述根据每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到所述目标时段的每个所述车站的车辆流量结果,包括:

根据每个所述预设时段的车辆数量确定每个所述预设时段的车站状态矩阵;

基于多阶马尔可夫算法、每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到目标时段的每个所述车站的车辆流量结果。

第二方面,本申请还提供了一种流量预测装置,包括:

第一获取模块,用于获取目标区域内各区块对应的特征数据;

第一预测模块,用于根据所述特征数据和车辆流转预测模型,得到每个预设时段下所述各区块内每个车站的车辆流转数据;

第二预测模块,用于基于多阶马尔可夫算法对每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵进行处理,确定每个所述预设时段下的目标转移概率矩阵;

车辆流量确定模块,用于根据每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到所述目标时段的每个所述车站的车辆流量结果;所述预设时段包括所述目标时段;所述车辆流量结果用于辅助车辆调度决策。

在其中一个实施例中,所述第一预测模块具体用于:

根据所述梯度提升树模型对所述区块特征、所述时段特征和所述交叉特征进行特征提取,得到特征向量;

基于所述梯度提升树模型和所述特征向量,得到每个所述预设时段下所述各区块内每个所述车站的所述车辆流转数据。

在其中一个实施例中,所述第二预测模块具体用于:

获取初始时刻的每个所述车站包含的初始车辆数量;所述初始时刻为第一个所述预设时段;

根据所述初始车辆数量与每个所述预设时段的所述车辆流转数据,得到每个所述预设时段的车辆数量;

基于所述特征数据、每个所述预设时段的车辆数量和第一转移概率预测模型,得到第一转移概率矩阵,并基于所述特征数据、每个所述预设时段的车辆数量和第二转移概率预测模型,得到第二转移概率矩阵;

根据预设周期内的历史车辆流转数据,确定所述预设时段对应的第三转移概率矩阵;

对所述第一转移概率矩阵、所述第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个所述预设时段下每个所述车站的目标转移概率矩阵。

在其中一个实施例中,所述第二预测模块具体用于:

获取预设周期内相同特征下的所述预设时段的历史车辆流转数据;

根据所述历史车辆流转数据计算所述预设时段的每个所述车站的历史车辆流转概率;

根据每个所述车站的所述历史车辆流转概率构建第三转移概率矩阵。

在其中一个实施例中,所述第二预测模块具体用于:

根据所述特征数据构建测试样本;

将所述测试样本分别输入至所述第一转移概率预测模型和所述第二转移概率预测模型,得到第一准确率和第二准确率;

获取第三转移概率矩阵对应的加权系数,并基于所述加权系数以及所述第一准确率和所述第二准确率,确定所述第一转移概率预测模型对应的第一权重系数和所述第二转移概率预测模型对应的第二权重系数;

基于所述第一权重系数、所述第二权重系数和预设权重系数分别对所述第一转移概率矩阵、所述第二转移概率矩阵和所述第三转移概率矩阵进行加权平均,得到每个所述预设时段下每个所述车站的目标转移概率矩阵。

在其中一个实施例中,所述装置还包括:

第二获取模块,用于获取样本特征数据;

确定模块,用于将所述样本特征数据中所述预设时段的所述车站对应的区块特征数据、时段特征数据和交叉特征数据,以及每个所述车站的所述车辆数量作为训练样本,并将所述历史特征数据中所述预设时段的每个所述车站与其他车站间的转移概率作为所述训练样本对应的样本标签;

训练模块,用于通过所述训练样本以及所述训练样本对应的样本标签,分别对待训练的第一转移概率预测模型和待训练的第二转移概率预测模型进行训练,得到训练完成的第一转移概率预测模型和训练完成的第二转移概率预测模型。

在其中一个实施例中,所述车辆流量确定模块具体用于:

根据每个所述预设时段的车辆数量确定每个所述预设时段的车站状态矩阵;

基于多阶马尔可夫算法、每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到目标时段的每个所述车站的车辆流量结果。

第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取目标区域内各区块对应的特征数据;

根据所述特征数据和车辆流转预测模型,得到每个预设时段下所述各区块内每个车站的车辆流转数据;

基于所述特征数据、所述车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个所述预设时段下的目标转移概率矩阵;

根据每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到所述目标时段的每个所述车站的车辆流量结果;所述预设时段包括所述目标时段;所述车辆流量结果用于辅助车辆调度决策。

第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取目标区域内各区块对应的特征数据;

根据所述特征数据和车辆流转预测模型,得到每个预设时段下所述各区块内每个车站的车辆流转数据;

基于所述特征数据、所述车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个所述预设时段下的目标转移概率矩阵;

根据每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到所述目标时段的每个所述车站的车辆流量结果;所述预设时段包括所述目标时段;所述车辆流量结果用于辅助车辆调度决策。

第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

获取目标区域内各区块对应的特征数据;

根据所述特征数据和车辆流转预测模型,得到每个预设时段下所述各区块内每个车站的车辆流转数据;

基于所述特征数据、所述车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个所述预设时段下的目标转移概率矩阵;

根据每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵,得到所述目标时段的每个所述车站的车辆流量结果;所述预设时段包括所述目标时段;所述车辆流量结果用于辅助车辆调度决策。

上述流量预测方法、装置、计算机设备和存储介质,通过车辆流转预测模型,确定每个车站的车辆流转数据,并根据第一转移概率预测模型和第二转移概率预测模型得到目标转移概率矩阵,通过多种类型的转移概率预测模型考虑了多种因素对车辆流转的影响,提高单个预测模型得到的预测结果的精细化程度,并通过第一转移概率预测模型和第二转移概率预测模型得到目标转移概率矩阵,可以降低单个预测模型带来的误差,最终通过多阶马尔可夫算法对每个预设时段的目标转移概率矩阵和目标时段的车站状态矩阵进行处理,实现对目标时段中每个车站的车辆流量进行预测,可以提高车辆流量结果预测的准确度。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一个实施例中流量预测方法的流程示意图;

图2为一个实施例中预测车辆流转数据的方法的流程示意图;

图3为一个实施例中确定第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵的方法的流程示意图;

图4为一个实施例中第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵的示意图;

图5为一个实施例中确定第三转移概率矩阵的详细方法的流程示意图;

图6为一个实施例中确定目标转移概率矩阵的方法的流程示意图;

图7为一个实施例中构建训练样本和样本标签的方法的流程示意图;

图8为一个实施例中确定车辆流量结果的方法的流程示意图;

图9为一个实施例中流量预测装置的结构框图;

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种流量预测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:

步骤102,获取目标区域内各区块对应的特征数据。

本申请实施例中,目标区域可以为城市区域,也可以为城市区域中提供共享单车服务的区域,区块可以为H3区块(Uber H3,一种针对地球的空间划分和空间索引系统),也可以为根据用户的行为特征,针对用户出行自定义设置的共享单车服务区块或共享单车调度区块。例如,终端可以获取目标区域以及目标区域中各区块的经纬度坐标。

进而,终端可以通过共享单车平台数据库、公共数据库、第三方数据供应商等途径获取目标区域内各区块内各车站对应的特征数据。例如,终端可以根据所选择的数据源,通过API(Application Programming Interface,应用程序接口)、数据请求的方式,从数据源获取目标区域内各区块对应的特征数据。该特征数据用于反映在不同维度的特征下用户使用共享单车行为的特征。

步骤104,根据特征数据和车辆流转预测模型,得到每个预设时段下各区块内每个车站的车辆流转数据。

本申请实施例中,预设时段可以以小时为单位,并将预先设置好的几个小时作为预测的时间段。由于第一转移概率预测模型和第二转移概率预测模型所需的参数是未来预设时段的车辆流转数据,而未来的数据不能直接获取到,因此,本申请实施例中通过车辆流转预测模型对未来预设时段的车辆流转数据进行预测,进而得到未来每个预设时段的车站对应的车辆流转数据。具体的,终端获取到的目标区域内各区块对应的特征数据也可以是每个小时内的特征数据,并通过车辆流转预测模型,针对每个车站,利用每个车站对应的特征数据进行车辆流转数据的预测,得到每个小时中各区块内每个车站的车辆流转数据。车辆流转数据表征每个小时内,每个车站的车辆流入流出情况。其中,车辆流转预测模型可以为时间序列分析、机器学习模型等。

步骤106,基于特征数据、车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个预设时段下的目标转移概率矩阵。

本申请实施例中,目标转移概率矩阵为多阶马尔可夫链中的参数,表征每个车站中的车辆流入和/或流出至其他车站的概率,可以通过目标转移概率矩阵对车站的车辆流量结果进行预测。因此,对于目标转移概率矩阵需要进行准确估计,终端可以基于每个车站对应的特征数据和已经预测得到的车辆流转数据,输入至第一转移概率预测模型和第二转移概率预测模型中,并根据第一转移概率预测模型和第二转移概率预测模型的输出结果进行计算,最终得到每个预设时段下的目标转移概率矩阵,通过每个预设时段下每个车站的转移概率矩阵可以对车站的车辆流量结果进行进一步预测。

步骤108,基于多阶马尔可夫算法对每个预设时段的目标转移概率矩阵和目标时段的车站状态矩阵进行处理,得到目标时段的每个车站的车辆流量结果。

其中,预设时段包括目标时段。

其中,车辆流量结果用于辅助车辆调度决策。

本申请实施例中,车站状态矩阵为多阶马尔可夫链中的状态空间矩阵,终端可以根据共享单车平台的数据库中得到目标区域内每个车站的状态,从而构建车站状态矩阵,例如,城市A包含多个车站,终端可以根据当前时刻每个车站中包含的车辆数量构建车站状态矩阵。基于当前时刻每个车站的状态矩阵与每个预设时段的目标转移概率矩阵,终端可以根据多阶马尔可夫算法,最终得到目标时段下每个车站的车辆流入流出结果,作为车站的车辆流量结果。其中,多阶马尔可夫算法也称为多阶马尔可夫链或多阶马尔可夫模型,该多阶马尔可夫算法可以为多阶非平稳马尔可夫算法,或其他形式的多阶马尔可夫算法,本申请实施例对于多阶马尔可夫算法不做限定。

可选的,终端在确定出初始目标时段的车辆流量结果之后,还可以根据多阶马尔可夫算法对初始时段之后的下一预设时段的目标转移概率进行计算,即无需使用前述转移概率预测模型(即第一转移概率预测模型和第二转移概率预测模型)对下一预设时段的转移概率矩阵进行预测,直接通过多阶马尔可夫算法计算得到,直至下一预设时段为目标时段,然后,基于得到的目标时段之前的每个预设时段的目标转移概率矩阵和该目标时段的车站状态空间对车辆流量进行预测。

可选的,终端可以根据当前时刻的车站状态矩阵,根据多阶马尔可夫算法分别计算每个预设时段的车辆流量结果,直至得到目标时段的车辆流量结果。

上述流量预测方法中,通过车辆流转预测模型,确定每个车站的车辆流转数据,并根据第一转移概率预测模型和第二转移概率预测模型得到目标转移概率矩阵,通过多种类型的转移概率预测模型考虑了多种因素对车辆流转的影响,提高单个预测模型得到的预测结果的精细化程度,并通过第一转移概率预测模型和第二转移概率预测模型得到目标转移概率矩阵,可以降低单个预测模型带来的误差,最终通过多阶马尔可夫算法对每个预设时段的目标转移概率矩阵和目标时段的车站状态矩阵进行处理,实现对目标时段中每个车站的车辆流量进行预测,可以提高车辆流量结果预测的准确度。

在其中一个实施例中,特征数据包含区块特征、时段特征和交叉特征,车辆流转预测模型为梯度提升树模型;第一预测模型和第二预测模型的输入为每个时段中每个车站的车辆数量的存量,在使用第一预测模型和第二预测模型进行预测之前,需要计算每个车站的车辆存量,如图2所示,步骤104根据特征数据和车辆流转预测模型,得到每个预设时段下各区块内每个车站的车辆流转数据,包括:

步骤202,根据梯度提升树模型对区块特征、时段特征和交叉特征进行特征提取,得到特征向量。

其中,区块特征可以包括区块面积、POI(Point of Interest,兴趣点)、AOI(AreaOf Interest,兴趣区域)、路网、热力值、人口(数量、分布)、人流量、车流量、海拔、是否存在车站、POI数量、POI权重和、重要POI类型、路网数量、路网交点、网路等级等。时段特征包括是否为高峰、能见度、温度、降雨量、是否降雨、压强、风速、风力、风向、相对湿度、体感温度、云量、实时天气和PM2.5(Particulate Matter 2.5可入肺颗粒物)浓度等。交叉特征为区块-时段交叉特征,可以包括当前骑入车辆数量、骑出车辆数量,同区块前一预设时段和后一预设时段的骑入数量、骑出数量,近七天同一预设时段的骑入数量的最大值、最小值、平均值和中位数,近四周同一工作日相同预设时段的最大值、最小值、平均值和中位数,实时订单数量,实时人流量,相同预设时段的当前区块所在H3区块的车辆流量,交通状况,交通状况对应的路段数等。

本申请实施例中,梯度提升树模型可以为XGBoost模型,终端在目标区域中各区块的特征数据中,提取区块特征、时段特征和交叉特征,并将该区块特征、时段特征和交叉特征进行特征拼接,可选的,终端还可以对特征数据进行标准化处理或降维操作,最终得到每个区块中每个车站对应的特征向量。

步骤204,基于梯度提升树模型和特征向量,得到每个预设时段下各区块内每个车站的车辆流转数据。

本申请实施例中,终端根据XGBoost模型训练中已经学习到的策略,在应用过程中,基于当前时刻获取到的未来预设时段的特征数据,对未来每个预设时段中可能存在的车辆流转情况进行预测,得到每个预设时段中各车站的车辆流转数据。

针对XGBoost模型的训练过程,终端将每个区块的特征数据作为训练样本,将每个特征数据对应的历史车辆流转数据作为样本标签。在每一轮针对训练样本的迭代中,XGBoost根据上一轮的预测结果和训练样本的样本标签之间的差异(即残差),训练出一颗新的决策树,以进一步改进模型的预测能力,在迭代的过程中,通过限制每棵树的复杂度(例如树的最大深度、节点分裂的最小增益等)以及引入正则化项(例如L1、L2正则化)来控制模型的复杂度,并通过梯度下降法来优化模型。根据当前模型的预测结果,计算损失函数的梯度,并利用梯度更新模型参数,以最小化损失函数。直至XGBoost模型的损失函数满足预设的训练条件,得到训练完成的XGBoost模型。

本实施例中,通过梯度提升树模型对每个车站对应的包含多种维度特征的特征数据进行预测处理,可以得到每个预设时段的车辆流转数据,进而提高后针对每个预设时段的目标转移概率矩阵的预测准确度。

在其中一个实施例中,在得到所有车站在每个时段中的车辆转移数据后,终端可以基于该车辆转移数据对每个车站的每个时段的目标转移概率矩阵进行预测,其中,目标转移概率矩阵的计算过程如图3所示,步骤106基于特征数据、车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个预设时段下的目标转移概率矩阵,包括:

步骤302,获取初始时刻的每个车站包含的初始车辆数量。

其中,初始时刻为第一个预设时段。

本申请实施例中,在应用过程中,初始时刻可以为当前时刻,因此,终端可以直接根据共享单车服务平台获取当前时段的每个车站的车辆数量,作为初始车辆数量。

步骤304,根据初始车辆数量与每个预设时段的车辆流转数据,得到每个预设时段的车辆数量。

本申请实施例中,终端根据初始时刻的下一预设时段的车辆流转数据,可以得到下一预设时段中每个车站对应的车辆数量,直至得到每个预设时段中每个车站对应的车辆数量。例如,车站S1的初始车辆数量为5,初始时刻1:00,则下一预设时段为1:00至2:00,该预设时段的车辆流转数据为流出5辆共享单车,流入2辆共享单车,则预设时段为1:00至2:00的车辆数量为2(5-5+2);预设时段为2:00至3:00的车辆流转数据为流入4辆共享单车,流出2辆共享单车,则2:00至3:00的预设时段对应的车站S1的车辆数量为4(5-5+2-2+4)。

步骤306,基于特征数据、每个预设时段的车辆数量和第一转移概率预测模型,得到第一转移概率矩阵,并基于特征数据、每个预设时段的车辆数量和第二转移概率预测模型,得到第二转移概率矩阵。

其中,第一转移概率预测模型可以为逻辑归回模型,第二转移概率预测模型可以为树模型。

本申请实施例中,终端将特征数据和每个预设时段的车辆数量分别输入值第一转移概率预测模型和第二转移概率预测模型中,通过第一转移概率矩阵和第二转移概率矩阵分别得到每个时段中各车站对应的第一转移概率矩阵和第二转移概率矩阵。其中,车站的预设时段的车辆数量为核心特征。

可选的,特征数据可以基于树模型对特征数据中每个类型的特征的选择确定,具体的,树模型中的特征选择是指在每个节点分裂时选择的最佳特征来进行数据分割,在决策树中包含信息增益、增益率等,基于树模型可以选择出针对转移概率矩阵进行预测的最佳特征数据,因此,终端可以首选使用树模型对特征数据进行数据处理,筛选出重要特征,并在使用逻辑回归模型进行预测时,可以使用筛选出的重要特征进行数据处理,实现对特征数据的筛选和降维。

步骤308,根据预设周期内的历史车辆流转数据,确定预设时段对应的第三转移概率矩阵。

本申请实施例中,预设周期可以为历史一个月内的历史车辆流转数据,根据统计的历史车辆流转数据计算历史一个月每天的预设时段对应的流转概率矩阵,并通过该一个月内每天的预设时段的流转概率矩阵的平均值,得到当前的日期预设时段对应的第三转移概率矩阵。

步骤310,对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个预设时段下每个车站的目标转移概率矩阵。

本申请实施例中,终端可以根据预设的加权系数,对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,如图4所示,图4为第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵以及确定目标转移概率矩阵中元素值的示意图。其中,对于权重的选择,可以根据专家知识、历史数据分析等方面的指标来进行判断。

本实施例中,通过第一转移概率预测模型和第二转移概率预测模型得到第一转移概率矩阵和第二转移概率矩阵,可以提高该第一转移概率矩阵和第二转移概率矩阵对于车辆流转情况的描述准确率,在结合预设周期内的历史车辆流转数据得到第三转移概率矩阵,并基于第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵的加权平均得到目标转移概率矩阵,可以进一步提高目标转移概率矩阵的准确性,进而提高对车辆流量结果进行预测的准确性。

在其中一个实施例中,第三转移概率矩阵的计算为滑动均值策略,即不使用模型对其进行预测,而是根据历史数据中的每个车站的车辆数量和车辆流转数据进行计算,如图5所示,步骤308根据预设周期内的历史车辆流转数据,确定预设时段对应的第三转移概率矩阵,包括:

步骤502,获取预设周期内相同特征下的预设时段的历史车辆流转数据。

本申请实施例中,预设周期内相同特征下的预设时段可以为一个月内相同星期或休息日、工作日属性的日期中预设时段的历史车辆流转数据,例如,当前日期为星期六,终端可以获取当前日期的前一个月内每个星期六内预设时段的车辆流转数据,或者每个休息日(节假日)的车辆流转数据。

步骤504,根据历史车辆流转数据计算预设时段的每个车站的历史车辆流转概率。

本申请实施例中,终端根据历史车辆流转数据可以得到在历史数据中,预设时段的每个车站中的共享单车流出至其他车站的数量和每个车站中原始存在的车辆数量,进而得到每个车站的历史车辆流转概率。

步骤506,根据每个车站的历史车辆流转概率构建第三转移概率矩阵。

本申请实施例中,终端根据每个车站的历史车辆流转概率构建第三转移概率矩阵,其中,第三转移概率矩阵中的每个元素的坐标表征共享单车的流出车站和流入车站,每个元素的值表征车辆转移的概率,可以通过流出车站的车辆数量和流入至其他车站的车辆数量的比值得到。

本实施例中,通过历史车辆流转数据计算得到历史车辆流转概率,并构建第三转移概率矩阵,可以将与当前日期具有相同特征的预设时段的历史车辆流转特征作为计算目标转移概率矩阵的一项,考虑了历史已经存在的车辆流转概率的特征,使得目标转移概率矩阵的计算因素更加全面,进而提高目标转移概率矩阵的准确率。

在其中一个实施例中,如图6所示,步骤310对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个预设时段下每个车站的目标转移概率矩阵,包括:

步骤602,根据特征数据构建测试样本。

本申请实施例中,终端可以根据第一转移概率预测模型和第二转移概率预测模型输出结果的准确率确定该第一转移概率矩阵的加权系数和第二转移概率矩阵的加权系数。因此,终端可以根据历史特征数据构建测试样本,并将历史特征数据对应的转移概率作为测试标签,已验证训练完成的第一转移概率矩阵和第二转移概率矩阵的准确率。

步骤604,将测试样本分别输入至第一转移概率预测模型和第二转移概率预测模型,得到第一准确率和第二准确率。

本申请实施例中,终端根据概率矩阵的可信度或准确性来确定权重值,使得较可靠的概率矩阵可能会被赋予较高的权重,而较不可靠的概率矩阵可能会被赋予较低的权重。

终端将每个测试样本分别输入至第一转移概率预测模型和第二转移概率预测模型,通过第一转移概率预测模型和第二转移概率预测模型分别对该测试样本进行数据处理,将预测输出值与真实标签进行比较,计算预测正确的样本数量,得到第一准确率,并基于相同的原理,计算第二转移概率模型对应的第二准确率。通过不同模型算法的数据处理可以得到不同的准确率。

步骤606,获取第三转移概率矩阵对应的加权系数,并基于加权系数以及第一准确率和第二准确率,确定第一转移概率预测模型对应的第一权重系数和第二转移概率预测模型对应的第二权重系数。

本申请实施例中,由于第三转移概率矩阵是由历史数据直接进行计算得到的,因此,第三转移概率矩阵的加权系数可以为预设加权系数,可选的,若第一转移概率预测模型和第二转移概率预测模型的准确率较高时,也可以适应性降低第三转移概率矩阵的加权系数。

第三转移概率矩阵的加权系数与第一权重系数和第二权重系数的总和为1,则终端可以在已计算第三转移概率矩阵的加权系数的基础上,基于第一准确率和第二准确率确定第一权重系数和第二权重系数。作为一个可选的实施例,终端可以将第一准确率在第一准确率和第二准确率之和的占比作为第一权重系数的比例,将第二准确率在第一准确率和第二准确率之和的占比作为第二加权系数的比例。例如,第三转移概率矩阵的加权系数为预设的0.2,第一准确率为75%,第二准确率为85%,则第一准确率在在第一准确率和第二准确率之和的占比为46.88%(75%/160%),即第一权重系数的占比;第二准确率在在第一准确率和第二准确率之和的占比为53.12%(85%/160%),即第二权重系数的占比,则在以计算第三转移概率矩阵的加权系数的基础上,剩余加权系数为0.8,因此,可以计算出第一权重系数为0.425,第二权重系数为0.375。

步骤608,基于第一权重系数、第二权重系数和预设权重系数分别对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个预设时段下每个车站的目标转移概率矩阵。

本申请实施例中,终端基于已经计算出的表征第一转移概率矩阵的第一权重系数、表征第二转移概率矩阵的第二权重系数和表征第三转移概率矩阵的预设权重系数,对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到加权平均结果,将该加权平均结果作为目标转移概率矩阵,进而得到每个预设时段下的每个车站的目标转移概率矩阵。

本实施例中,根据第一转移概率预测模型的模型输出的第一准确率和第二转移概率预测模型的模型输出的第二准确率确定第一权重系数和第二权重系数,可以增大高准确率的模型输出结果在目标转移概率矩阵中的占比并进行加权平均,可以提高目标转移概率矩阵的准确率。

在其中一个实施例中,在使用第一预测模型和第二预测模型进行预测之前,需要对该第一预测模型和第二预测模型进行训练,训练过程如图7所示,步骤106基于特征数据、车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个预设时段下的目标转移概率矩阵之前,该方法还包括:

步骤702,获取样本特征数据。

本申请实施例中,终端可以根据共享单车平台数据库、公共数据库、第三方数据供应商等途径中的历史数据中获取样本特征数据。

可选的,终端还可以在样本特征数据中选择验证集,用于对第一转移概率预测模型和第二转移概率预测模型的评估。

步骤704,将样本特征数据中预设时段的车站对应的区块特征数据、时段特征数据和交叉特征数据,以及每个车站的车辆数量作为训练样本,并将历史特征数据中预设时段的每个车站与其他车站间的转移概率作为训练样本对应的样本标签。

本申请实施例中,终端将车辆数量作为训练样本,将样本特征数据中的区块特征数据、时段特征数据和交叉特征数据作为训练样本的特征,并将历史特征数据中预设时段的每个车站与其他车站间的转移概率作为训练样本对应的样本标签,用于对未训练的第一转移概率预测模型和第二转移概率预测模型进行训练。

步骤706,通过训练样本以及训练样本对应的样本标签,分别对待训练的第一转移概率预测模型和待训练的第二转移概率预测模型进行训练,得到训练完成的第一转移概率预测模型和训练完成的第二转移概率预测模型。

本申请实施例中,终端使用训练样本作为输入,训练样本对应的样本标签作为输出,训练第一转移概率预测模型和第二转移概率预测模型,通过反向传播算法和优化算法(例如梯度下降)来更新该第一转移概率预测模型和第二转移概率预测模型的模型参数。具体的,终端通过第一转移概率预测模型和第二转移概率预测模型分别对训练样本进行数据处理,并分别得到第一转移概率预测模型输出的第一训练结果和第二转移概率预测模型输出的第二训练结果,基于第一训练结果和第二训练结果分别计算第一转移概率预测模型的第一损失和第二转移概率预测模型的第二损失,重复迭代上述训练过程,直至满足预设的迭代条件,例如,第一损失和第二损失均满足预设的迭代条件,或迭代的次数满足预设的迭代条件。最终,终端将满足预设的迭代条件的第一转移概率预测模型和第二转移概率预测模型作为训练完成的第一转移概率预测模型和寻来你完成的第二转移概率预测模型。

可选的,终端可以使用验证集评估训练好的第一转移概率预测模型的性能。例如,终端可以计算预测结果与实际标签之间的差异(均方误差、交叉熵等),或使用其他常见的评估指标(准确率、精确率、召回率等)。终端可以根据评估结果,对第一转移概率预测模型和第二转移概率预测模型进行调优和改进,例如,可以尝试不同的超参数的组合,并进行交叉验证等技术来选择最佳的第一转移概率预测模型和第二转移概率预测模型。

本实施例中,通过对第一转移概率预测模型和第二转移概率预测模型进行训练,得到训练完成的第一转移概率预测模型和训练完成的第二转移概率预测模型,可以提高针对第一转移概率矩阵和第二转移概率矩阵进行预测的准确率,进而提高目标转移概率矩阵的准确率。

在其中一个实施例中,如图8所示,步骤108基于多阶马尔可夫算法对每个所述预设时段的所述目标转移概率矩阵和目标时段的车站状态矩阵进行处理,得到目标时段的每个车站的车辆流量结果,包括:

步骤802,根据每个预设时段的车辆数量确定每个预设时段的车站状态空间。

本申请实施例中,终端可以基于步骤304得到车辆数量,根据每个预设时段车辆数量构建每个预设时段的各车站的车站状态空间,其中,车站状态空间中的每个元素为每个车站的车辆数量。

步骤804,基于多阶马尔可夫算法、每个预设时段的目标转移概率矩阵和目标时段的车站状态矩阵,得到目标时段的每个车站的车辆流量结果。

本申请实施例中,终端基于转移概率矩阵和当前时段的车站状态,可以使用多阶马尔可夫链进行建模,描述车站状态的变化过程,并通过迭代使用转移概率矩阵,可以得到目标时段的每个车站的车辆流量结果。

本实施例中,通过使用准确率较高的目标转移概率矩阵和目标时段的车站状态空间得到目标时段的每个车站的车辆流量结果,可以提高计算车辆流量结果的准确率。

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的流量预测方法的流量预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个流量预测装置实施例中的具体限定可以参见上文中对于流量预测方法的限定,在此不再赘述。

在一个示例性的实施例中,如图9所示,提供了一种流量预测装置900,包括:第一获取模块901、第一预测模块902、第二预测模块903和车辆流量确定模块904,其中:

第一获取模块901,用于获取目标区域内各区块对应的特征数据;

第一预测模块902,用于根据特征数据和车辆流转预测模型,得到每个预设时段下各区块内每个车站的车辆流转数据;

第二预测模块903,用于基于特征数据、车辆流转数据、第一转移概率预测模型和第二转移概率预测模型,确定每个预设时段下的目标转移概率矩阵;

车辆流量确定模块904,用于基于多阶马尔可夫算法对每个预设时段的目标转移概率矩阵和目标时段的车站状态矩阵进行处理,得到目标时段的每个车站的车辆流量结果;预设时段包括目标时段;车辆流量结果用于辅助车辆调度决策。

在其中一个实施例中,第一预测模块902具体用于:

根据梯度提升树模型对区块特征、时段特征和交叉特征进行特征提取,得到特征向量;

基于梯度提升树模型和特征向量,得到每个预设时段下各区块内每个车站的车辆流转数据。

在其中一个实施例中,第二预测模块903具体用于:

获取初始时刻的每个车站包含的初始车辆数量;初始时刻为第一个预设时段;

根据初始车辆数量与每个预设时段的车辆流转数据,得到每个预设时段的车辆数量;

基于特征数据、每个预设时段的车辆数量和第一转移概率预测模型,得到第一转移概率矩阵,并基于特征数据、每个预设时段的车辆数量和第二转移概率预测模型,得到第二转移概率矩阵;

根据预设周期内的历史车辆流转数据,确定预设时段对应的第三转移概率矩阵;

对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个预设时段下每个车站的目标转移概率矩阵。

在其中一个实施例中,第二预测模块903具体用于:

获取预设周期内相同特征下的预设时段的历史车辆流转数据;

根据历史车辆流转数据计算预设时段的每个车站的历史车辆流转概率;

根据每个车站的历史车辆流转概率构建第三转移概率矩阵。

在其中一个实施例中,第二预测模块903具体用于:

根据特征数据构建测试样本;

将测试样本分别输入至第一转移概率预测模型和第二转移概率预测模型,得到第一准确率和第二准确率;

获取第三转移概率矩阵对应的加权系数,并基于加权系数以及第一准确率和第二准确率,确定第一转移概率预测模型对应的第一权重系数和第二转移概率预测模型对应的第二权重系数;

基于第一权重系数、第二权重系数和预设权重系数分别对第一转移概率矩阵、第二转移概率矩阵和第三转移概率矩阵进行加权平均,得到每个预设时段下每个车站的目标转移概率矩阵。

在其中一个实施例中,该装置900还包括:

第二获取模块,用于获取样本特征数据;

确定模块,用于将样本特征数据中预设时段的车站对应的区块特征数据、时段特征数据和交叉特征数据,以及每个车站的车辆数量作为训练样本,并将历史特征数据中预设时段的每个车站与其他车站间的转移概率作为训练样本对应的样本标签;

训练模块,用于通过训练样本以及训练样本对应的样本标签,分别对待训练的第一转移概率预测模型和待训练的第二转移概率预测模型进行训练,得到训练完成的第一转移概率预测模型和训练完成的第二转移概率预测模型。

在其中一个实施例中,车辆流量确定模块904具体用于:

根据每个预设时段的车辆数量确定每个预设时段的车站状态矩阵;

基于多阶马尔可夫算法、每个预设时段的目标转移概率矩阵和目标时段的车站状态矩阵,得到目标时段的每个车站的车辆流量结果。

上述流量预测装置900中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储特征数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种流量预测方法。

本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random AccessMemory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 交通流量预测方法、装置、计算机设备及存储介质
  • 流量调配方法、装置、计算机设备及计算机可读存储介质
  • 网络流量的监控方法、装置、计算机设备及存储介质
  • 跨地域出口流量调配方法、装置、计算机设备及存储介质
  • 在线数据流量计费方法、装置、设备及计算机存储介质
  • 用户流量预测方法、装置、计算机设备和存储介质
  • 车流量预测方法、装置、计算机设备和存储介质
技术分类

06120116510005