掌桥专利:专业的专利平台
掌桥专利
首页

一种基于图卷积神经网络的城市交通流量时空预测方案

文献发布时间:2023-06-19 10:11:51


一种基于图卷积神经网络的城市交通流量时空预测方案

技术领域

本发明涉及智慧交通领域,尤其是涉及一种基于图卷积神经网络的城市交通流量时空预测方案。

背景技术

交通预测是智能交通系统中的关键部分,是实现交通规划、交通管理和交通控制的重要手段。准确的交通流量预测信息可以为交通管理者提供及时的交通决策依据,更好地管理城市交通,提高道路运营效率,同时也可以让驾驶员提前了解交通情况,及时改变路线,选择合理的交通道路,节省出行时间,进而减少交通拥堵情况的出现。另外,还可以在一定程度上减少环境污染,提高交通安全。因此,城市流量预测是城市交通系统中举足轻重的一部分。

然而,由于实际道路中复杂的时间和空间依赖关系,以及路口监控设备的有限性,时空交通流量依然存在着许多挑战。在空间依赖方面,城市的拓扑结构决定了路口之间的依赖关系,上游路口的交通流量输出直接影响下游路口的流量输入,下游路口的交通流量也会到达上游路口。由于相邻路口的流量之间的相互影响,其流量变化也有相似性。在时间依赖方面,交通流量随着时间动态变化,主要表现为周期性。例如,路口某时刻的流量值与之前某些时间周期的流量可能存在一定的规律。另外,路口受到前面时刻的交通状态的影响也较大。

现有解决交通流量预测的方法很多,其中一部分方法只考虑了时间相关性,如ARIMA模型,卡尔曼滤波器,支持向量机,k近邻模型,贝叶斯网络以及部分神经网络,仅仅考虑了交通流量随时间的动态变化,但是忽略了路口之间的空间依赖性,因此不能非常准确地预测交通流量。为了挖掘流量的空间特征,有的研究人员引入了卷积神经网络,但是,卷积神经网络主要使用于欧几里得结构的数据,比如图像结构。这些模型并不使用于复杂的城市路网结构的情况,因此在本质上不能很好地描述空间依赖性。

公开号为CN110264709A的中国发明专利公开了一种基于图卷积网络的道路的交通流量的预测方法,基于历史流量数据和城市路网信息,利用GCN网络和LSTM网络综合道路的交通流量数据的空间特征和时间特征得到下一时间段的道路的交通流量数据的预测值。但是,在实际使用时,某些路口由于地理位置以及设备的有限性,往往无法获取其历史流量数据,也就谈不上根据历史流量预测交通流量数据了。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于图卷积神经网络的城市交通流量时空预测方案,首先通过构建和训练ST-GCN网络模型,得到有历史流量数据路口的预测流量,再通过自定义的Adjacent-Similar算法,对于无历史流量数据的路口,根据其相邻路口的预测流量得到其预测流量,对于“孤岛”路口,寻找与其相似路口,并用相似路口的预测流量作为该路口的预测流量,为无历史流量数据路口的流量预测提供了新的解决思路。

本发明的目的可以通过以下技术方案来实现:

一种基于图卷积神经网络的城市交通流量时空预测方案,包括以下步骤:

S1:获取城市路网拓扑结构图G,将所有路口记为未预测路口,并标记其中的A类路口、B类路口和C类路口,所述A类路口为有历史流量数据的路口,所述B类路口为自身无历史流量数据但相邻路口中包含A类路口的路口,所述C类路口为自身无历史流量数据且相邻路口中不包含A类路口的路口;

S2:获取每个A类路口的历史流量数据,构建基于GCN网络和GRU网络的ST-GCN网络模型,根据城市路网拓扑结构图G和每个A类路口的历史流量数据对ST-GCN网络模型进行训练,得到第一流量预测模型;

S3:基于第一流量预测模型得到每个A类路口的预测流量,并将所有A类路口记为已预测路口;

S4:对于所有的B类路口,分别获取各个B类路口的所有相邻路口中A类路口的预测流量,使用自定义的Adjacent算法得到所有B类路口的预测流量,并将所有B类路口记为已预测路口;

S5:对于所有的C类路口,分别获取各个C类路口的所有相邻路口中B类路口的预测流量,使用自定义的Adjacent算法得到所有C类路口的预测流量,并将所有C类路口记为已预测路口;

S6:遍历城市路网拓扑结构图G,若所有路口均为已预测路口,则执行步骤S7,否则,将未被预测的路口标记为D类路口,使用自定义的Similar算法得到所有D类路口的预测流量;

S7:获取待预测时刻,输出所有路口在待预测时刻的预测流量。

进一步的,所述历史流量数据包括时间点信息、地理位置信息和流量信息。

进一步的,所述步骤S2包括以下步骤:

S21:基于城市路网拓扑结构图G构建城市路口邻接矩阵,基于城市路网拓扑结构图G和历史流量数据构建A类路口的流量特征矩阵;

S22:构建基于GCN图卷积网络和GRU门控循环单元的ST-GCN网络模型,基于城市路口邻接矩阵和流量特征矩阵,通过图卷积操作提取得到A类路口的历史流量数据的空间特征信息,将空间特征信息输入门控循环单元,提取路口的历史流量数据的时间特征信息;

S23:综合所述路口的历史流量数据的空间特征信息和时间特征信息得到路口的流量预测值;

S25:将流量预测值与真实流量值比较,将比较结果作为评价指标,调整ST-GCN网络模型的参数,重复步骤S22,直至得到满足精度要求的第一流量预测模型。

更进一步的,所述步骤S23中,还包括提取天气特征信息、节假日特征信息等其他特征信息,综合所述路口的历史流量数据的空间特征信息、时间特征信息、天气特征信息和节假日特征信息等其他特征信息得到路口的流量预测值。

进一步的,所述步骤S4包括以下步骤:

S41:分别获取所有未预测的B类路口的相邻路口属性,所述相邻路口属性包括该B类路口的相邻路口的数量N和相邻路口中已预测路口的数量NY;

S42:分别计算各个未预测的B类路口的得分S

其中,NumB_j表示第j个B类路口的相邻路口的数量,NumB_j

S43:选取得分最大的未预测的B类路口,计算该B类路口的相邻路口中各个已预测路口到该B类路口所需的时间;

S44:获取该B类路口的相邻路口中各个已预测路口的在不同时刻的预测流量,根据各个已预测路口到该B类路口所需的时间和各个已预测路口的预测流量,得到该B类路口的部分流量

其中,

S45:根据该B类路口的部分流量

其中,

S46:将该B类路口记为已预测路口;

S47:若所有B类路口均为已预测路口,则执行步骤S5,否则,执行步骤S41。

进一步的,所述步骤S5包括以下步骤:

S51:分别获取所有未预测的C类路口的相邻路口属性,所述相邻路口属性包括该C类路口的相邻路口的数量M和相邻路口中已预测路口的数量MY;

S52:分别计算各个未预测的C类路口的得分S

其中,NumC_k表示第k个C类路口的相邻路口的数量,NumC_k

S53:选取得分最大的未预测的C类路口,计算该C类路口的相邻路口中各个已预测路口到该C类路口所需的时间;

S54:获取该C类路口的相邻路口中各个已预测路口的在不同时刻的预测流量,根据各个已预测路口到该C类路口所需的时间和各个已预测路口的预测流量,得到该C类路口的部分流量

其中,

S55:根据该C类路口的部分流量

其中,

S56:将该C类路口记为已预测路口;

S57:若所有C类路口均为已预测路口,则执行步骤S6,否则,执行步骤S51。

更进一步的,一个路口到另一个路口所需时间的计算具体为:获取两个路口之间的出租车轨迹,跟踪出租车的轨迹,根据出租车轨迹计算得到一个路口到另一个路口所需的时间。

进一步的,所述步骤S6包括以下步骤:

S61:遍历城市路网拓扑结构图G,若所有路口均为已预测路口,则执行步骤S7,否则,将未预测路口标记为D类路口,执行步骤S62;

S62:获取城市的出租车轨迹,得到所有D类路口和所有A类路口的出租车流量;

S63:选取一个D类路口,自所有A类路口中选取一个与该D类路口的出租车流量最相似的A类路口作为该D类路口的最相似路口;

S64:获取最相似路口的预测流量作为该D类路口的预测流量,将该D类路口记为已预测路口;

S65:若所有D类路口均为已预测路口,则执行步骤S7,否则,执行步骤S63。

更进一步的,所述步骤S62具体为:获取时间段T内城市的出租车轨迹,对时间段T切片,记录T1时刻各个D类路口和各个A类路口的出租车流量、记录T2时刻各个D类路口和各个A类路口的出租车流量、…、记录Tr时刻各个D类路口和各个A类路口的出租车流量,得到各个D类路口和各个A类路口的流量点,所述流量点具体为:(f

更进一步的,所述步骤S63具体为:获取该D类路口的流量点,计算该D类路口的流量点与所有A类路口的流量点之间的欧几里得距离,选取欧几里得距离最小的A类路口作为该D类路口的最相似路口。

与现有技术相比,本发明具有以下有益效果:

(1)首先通过构建和训练ST-GCN网络模型,得到有历史流量数据路口的预测流量,再通过自定义的Adjacent-Similar算法,对于无历史流量数据的路口,根据其相邻路口的预测流量得到其预测流量,对于“孤岛”路口,寻找与其相似路口,并用相似路口的预测流量作为该路口的预测流量,为无历史流量数据路口的流量预测提供了新的解决思路。

(2)使用ST-GCN网络模型预测有历史流量数据的路口时,综合考虑空间依赖、时间依赖和节日、天气等其他影响因素,使用了GCN图卷积网络和GRU门控循环单元,相较于传统的预测算法,预测结果更加精准,且速度更快。

(3)对于无历史流量数据路口,使用出租车流量代替实际流量,通过Adjacent-Similar算法,近似得到无历史流量数据路口的预测流量,虽然存在一定误差,但是一定程度上解决了因路口无监控设备导致的流量数据缺失,提升了预测效果。

附图说明

图1为本发明的流程示意图;

图2为实施例中ST-GCN单元结构图;

图3为实施例中GRU模型结构;

图4为实施例中ST-GCN网络整体结构图;

图5为实施例中Adjacent-Similar算法的流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1:

一种基于图卷积神经网络的城市交通流量时空预测方案,如图1所示,包括以下步骤:

S1:获取城市路网拓扑结构图G,将所有路口记为未预测路口,并标记其中的A类路口、B类路口和C类路口,所述A类路口为有历史流量数据的路口,所述B类路口为自身无历史流量数据但相邻路口中包含A类路口的路口,所述C类路口为自身无历史流量数据且相邻路口中不包含A类路口的路口;

S2:获取每个A类路口的历史流量数据,构建基于GCN网络和GRU网络的ST-GCN网络模型,根据城市路网拓扑结构图G和每个A类路口的历史流量数据对ST-GCN网络模型进行训练,得到第一流量预测模型;

S3:基于第一流量预测模型得到每个A类路口的预测流量,并将所有A类路口记为已预测路口;

S4:对于所有的B类路口,分别获取各个B类路口的所有相邻路口中A类路口的预测流量,使用自定义的Adjacent算法得到所有B类路口的预测流量,并将所有B类路口记为已预测路口;

S5:对于所有的C类路口,分别获取各个C类路口的所有相邻路口中B类路口的预测流量,使用自定义的Adjacent算法得到所有C类路口的预测流量,并将所有C类路口记为已预测路口;

S6:遍历城市路网拓扑结构图G,若所有路口均为已预测路口,则执行步骤S7,否则,将未被预测的路口标记为D类路口,使用自定义的Similar算法得到所有D类路口的预测流量;

S7:获取待预测时刻,输出所有路口在待预测时刻的预测流量。

步骤S2包括以下步骤:

S21:基于城市路网拓扑结构图G构建城市路口邻接矩阵,基于城市路网拓扑结构图G和历史流量数据构建A类路口的流量特征矩阵,历史流量数据包括时间点信息、地理位置信息和流量信息。

S22:构建基于GCN图卷积网络和GRU门控循环单元的ST-GCN网络模型,基于城市路口邻接矩阵和流量特征矩阵,通过图卷积操作提取得到A类路口的历史流量数据的空间特征信息,将空间特征信息输入门控循环单元,提取路口的历史流量数据的时间特征信息;

S23:提取天气特征信息、节假日特征信息,再综合路口的历史流量数据的空间特征信息、时间特征信息以及天气特征信息、节假日特征信息得到下一时间段的路口的流量预测值。

S25:将流量预测值与真实流量值比较,将比较结果作为评价指标,调整ST-GCN网络模型的参数,重复步骤S22,直至得到满足精度要求的第一流量预测模型。

对于A类路口,在空间依赖性方面,使用图卷积网络(GCN:Graph ConvolutionalNetwork)进行建模。图卷积网络借助于图的拉普拉斯矩阵的特征值和特征向量来研究图的性质。网络的每一个卷积层的传播规则如下:

其中,σ表示激活函数,H

图卷积网络的每一层通过邻接矩阵A和特征矩阵H

在时间依赖性方面,历史流量具有周期性,因此,路口在t时刻的流量X

其中,X

使用门控循环单元(GRU:Gated Recurrent Unit)来捕捉时间序列中时间步距离较大的依赖关系,它通过可以学习的门来控制信息的流动,引入了重置门和更新门的概念,从而修改了循环神经网络中隐藏状态的计算方式。

除了时间依赖性因素以及空间依赖性因素,路口交通流量还会受到天气状况、节假日等因素影响,如城市举办的活动、交通规定等,因此将其他影响因素也作为特征加入网络。根据一天的平均温度以及天气状况对每天的天气进行编码;根据是否为工作日对日期进行编码,若为工作日则将节假日信息记为1,若为休息日则将节假日信息记为0。

具体的,本实施例以青岛市的交通数据流为例,包括100个A类路口在9月1日到9月20日的20天流量数据,自早上7点至晚上7点,统计每个路口每5分钟经过的车流量,得到144×100的矩阵,每行数据表示在该时刻各个A类路口的流量,每列数据表示该A类路口在不同时刻的流量,再将20天的流量数据综合,最后得到2880×100的矩阵。

对于100个A类路口构建邻接矩阵。根据城市网络拓扑结构图,若路口i与路口j相邻,且车辆可以从路口i至路口j,则邻接矩阵A

先构建ST-GCN Cell单元,ST-GCN Cell单元的结构如图2所示,对一天的所有流量数据来说,首先对数据进行图卷积操作,得到空间依赖关系,再将图卷积后的结果根据门控循环单元更新当前状态,获得新的状态和输出。

再构建以ST-GCN Cell为单元的GRU模型结构,如图3所示。以时间间隔l

再构建ST-GCN网络,如图4所示,输入数据为三个时间间隔的时间依赖性流量特征以及天气、节假日等其他影响因素。对于三个时间间隔的时间依赖性流量特征,构建相同结构的三个门控循环单元,将三个结果相加,并通过激活函数,将所得的结果与其他影响因素相加,再通过激活函数,得到最后结果。

为评估模型的准确性,采用均方根误差RMSE(Root Mean Squard Error)和均方误差MSE(Mean Squared Error)来评估结果误差。评估预测值y

其中,y

均方根误差RMSE和均方误差MAE值越小,表示预测结果误差越小。表1给出了使用不同模型对100个A类路口进行流量预测的误差对比结果。

表1 不同模型误差比较

表1中给出了本申请使用的ST-GCN网络模型与其他网络模型的误差对比结果,对比了历史平均模型(HA)、差分整合移动平均自回归模型(ARIMA)、卷积神经网络(CNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)、图卷积网络(GCN),可以看出,与其他的几种模型相比,本申请构建的ST-GCN模型的预测误差均小于其他模型结果。

在空间依赖方面,与LSTM和GRU方法对比,取相同周期的时间序列,即在时间依赖上与本模型相同,不考虑城市拓扑结构,因此LSTM和GRU并未挖掘路口之间的空间依赖性。LSTM和GRU模型的RMSE误差分别是32.08和31.09,ST-GCN的误差为23.14,可以发现,当ST-GCN与只有时间依赖的GRU相比,均方根误差减少了7.95,与LSTM相比,误差也减小了8.94。因此可以看出,与只有时间依赖的模型相比,ST-GCN由于引进了图卷积网络,获得路口之间的空间关系,因此在空间依赖方面取得了较好的效果。

在时间依赖方面,与GCN模型对比,两种模型采取相同的图卷积模型进行空间依赖处理,在时间依赖方面,GCN模型不考虑时间序列的周期性特征,即未挖掘历史流量的时间依赖关系。最终根据实验结果可以得到,GCN的RMSE误差为43.21,ST-GCN的误差比GCN减少了20.07。因此可以看出,与只有空间依赖的模型相比,ST-GCN由于考虑了时间序列的周期性,充分挖掘历史流量序列中的时间依赖关系,因此在时间依赖方面取得了较好的效果。因此,ST-GCN模型在挖掘路口历史流量的时空依赖关系中,有着较好的效果。

对于有历史流量的A类路口,可以根据上述步骤得到其预测流量,对于无历史流量的B类路口、C类路口,其流量预测是通过本申请自定义的Adjacent-Similar算法进行的,流程图如图5所示。Adjacent算法即根据相邻路口的预测流量推算得到本路口的预测流量,Similar算法即寻找到一个与本路口流量最相似的路口,将该路口的预测流量作为本路口的预测流量。

本实施例中,根据100个A类路口的预测流量,结合Adjacent算法与Similar算法,对35个无历史流量数据的路口在9月21日至24日的流量进行了预测。

首先使用自定义的Adjacent算法对B类路口进行预测,B类为自身无历史流量数据但相邻路口有历史流量数据的路口,步骤S4中包括以下步骤:

S41:分别获取所有未预测的B类路口的相邻路口属性,相邻路口属性包括该B类路口的相邻路口的数量N和相邻路口中已预测路口的数量NY;

S42:分别计算各个未预测的B类路口的得分S

其中,NumB_j表示第j个B类路口的相邻路口的数量,NumB_j

S43:选取得分最大的未预测的B类路口,计算该B类路口的相邻路口中各个已预测路口到该B类路口所需的时间;

步骤S43中,各个相邻路口到该B类路口所需的时间计算具体为:获取该B类路口与所有相邻路口之间的出租车轨迹,跟踪出租车的轨迹,分别根据出租车轨迹计算得到各个相邻路口到该B类路口所需的时间。

出租车轨迹数据集是青岛市9月1日到20日的部分出租车GPS数据,记录出租车的每个时刻经纬度,根据出租车速度以及轨迹数据,可以近似获得两个路口之间的距离。

S44:获取该B类路口的相邻路口中各个已预测路口的在不同时刻的预测流量,根据各个已预测路口到该B类路口所需的时间和各个已预测路口的预测流量,得到该B类路口的部分流量

其中,

S45:根据该B类路口的部分流量

其中,

S46:将该B类路口记为已预测路口;

S47:若所有B类路口均为已预测路口,则执行步骤S5,否则,执行步骤S41。

再使用自定义的Adjacent算法对C类路口进行预测,C类路口为自身无历史流量数据且相邻路口无历史流量数据的路口,步骤S5包括以下步骤:

S51:分别获取所有未预测的C类路口的相邻路口属性,相邻路口属性包括该C类路口的相邻路口的数量M和相邻路口中已预测路口的数量MY;

S52:分别计算各个未预测的C类路口的得分S

其中,NumC_k表示第k个C类路口的相邻路口的数量,NumC_k

S53:选取得分最大的未预测的C类路口,计算该C类路口的相邻路口中各个已预测路口到该C类路口所需的时间;

同样的,步骤S53中,各个相邻路口到该C类路口所需的时间计算具体为:获取该C类路口与所有相邻路口之间的出租车轨迹,跟踪出租车的轨迹,分别根据出租车轨迹计算得到各个相邻路口到该C类路口所需的时间。

出租车轨迹数据集是青岛市9月1日到20日的部分出租车GPS数据,记录出租车的每个时刻经纬度,根据出租车速度以及轨迹数据,可以近似获得两个路口之间的距离。

S54:获取该C类路口的相邻路口中各个已预测路口的在不同时刻的预测流量,根据各个已预测路口到该C类路口所需的时间和各个已预测路口的预测流量,得到该C类路口的部分流量

其中,

S55:根据该C类路口的部分流量

其中,

S56:将该C类路口记为已预测路口;

S57:若所有C类路口均为已预测路口,则执行步骤S6,否则,执行步骤S51。

完成B类路口和C类路口的流量预测后,如果仍存在路口未被预测,则该类路口为“孤岛”路口,记为D类路口,使用自定义的Similar算法对该类路口进行预测。

步骤S6包括以下步骤:

S61:遍历城市路网拓扑结构图G,若所有路口均为已预测路口,则执行步骤S7,否则,将未预测路口标记为D类路口,执行步骤S62;

S62:获取城市的出租车轨迹,得到所有D类路口和所有A类路口的出租车流量;

出租车轨迹数据集是青岛市9月1日到20日的部分出租车GPS数据,记录出租车的每个时刻经纬度,根据出租车轨迹数据,可以近似各个路口的流量。

步骤S62具体为:获取时间段T内城市的出租车轨迹,对时间段T切片,记录T1时刻各个D类路口和各个A类路口的出租车流量、记录T2时刻各个D类路口和各个A类路口的出租车流量、…、记录Tr时刻各个D类路口和各个A类路口的出租车流量,得到各个D类路口和各个A类路口的流量点,所述流量点具体为:(f

本实施例中,将20天的出租车流量数据切片,获取第1天、第2天、…、第20天各个D类路口和各个A类路口的出租车流量,得到流量点(f

S63:选取一个D类路口,自所有A类路口中选取一个与该D类路口的出租车流量最相似的A类路口作为该D类路口的最相似路口;

步骤S63具体为:获取该D类路口的流量点,计算该D类路口的流量点与所有A类路口的流量点之间的欧几里得距离,选取欧几里得距离最小的A类路口作为该D类路口的最相似路口。

S64:获取最相似路口的预测流量作为该D类路口的预测流量,将该D类路口记为已预测路口;

S65:若所有D类路口均为已预测路口,则执行步骤S7,否则,执行步骤S63。

S7:获取待预测时刻,输出所有路口在待预测时刻的预测流量。

本实施例中,待预测时刻为9月21日至24日,输出所有路口在待预测时刻的预测流量。

Adjacent算法根据相邻路口的预测流量得到待预测的无历史流量数据路口的预测流量,误差最小,符合车流量实际流动情况。首先根据出租车轨迹数据近似得到待预测路口与其相邻的已预测路口之间的距离,此距离用车辆经过时间定义,因此可以推断,其相邻的已预测路口的对应方向的车辆经过此距离后可以到达待预测路口。因此可以计算出待预测路口自其相邻已预测路口方向涌入的流量,最终相加可以得到部分流量。而对于待预测路口的相邻路口中的未预测路口,通过近似比例划分对流量进行比例增加,得到总流量。

Similar算法主要根据出租车轨迹数据,比较路口之间的流量相似性。对于某个待预测路口,比较其二十天的出租车流量数据与其他有历史流量数据路口的出租车流量数据的误差,根据误差进行排序,找出误差最小的路口,作为该未预测路口的最相似路口,使用最相似路口的预测流量作为待预测路口的预测流量。

表2中给出了仅使用Adjacent算法预测无历史流量数据路口、仅使用Similar算法预测无历史流量数据路口和使用Adjacent-Similar算法对无历史流量数据路口的预测结果的误差,使用均方根误差RMSE(Root Mean Squard Error)和均方误差MSE(Mean SquaredError)来评估结果误差。

表2 Adjacent-Similar算法预测结果

自表2中可以看出,综合使用Adjacent-Similar算法的预测结果相比于单独使用Adjacent算法或Similar算法的预测结果更准确。

由于已知历史流量路口的局限性以及实际城市路口结构的复杂性,对无历史流量路口的流量计算存在一定的误差。但是在逻辑上符合车流量实际流动情况,为无历史流量数据的路口提供了流量预测的解决思路。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

相关技术
  • 一种基于图卷积神经网络的城市交通流量时空预测方案
  • 一种基于图卷积神经网络的城市交通流量时空预测方案
技术分类

06120112454823