掌桥专利:专业的专利平台
掌桥专利
首页

一种基于多视图时空图卷积网络的交通流预测方法

文献发布时间:2023-06-19 19:27:02


一种基于多视图时空图卷积网络的交通流预测方法

技术领域

本发明属于交通流预测领域,涉及一种基于多视图时空图卷积网络的交通流预测方法。该预测方法利用图卷积神经网络和卷积神经网络实现交通流的预测。

背景技术

随着传感器技术的发展,交通数据呈现出爆炸性增长的趋势,交通系统正式进入了交通大数据时代。智能交通系统就是利用交通大数据对城市交通进行控制。近年来,在深度学习技术的支持下,智能交通系统已经取得了极大的成功,作为智能交通系统基本构成之一的交通流预测也吸引了越来越多研究者的关注。交通数据中的变化模式随时间和空间的改变而改变,观测点处的交通流量不仅会受到历史交通流量的影响,还会受到周边观测点的流量影响,如何合适的处理这些影响因素是实现精准交通流预测的重大挑战之一。

随着深度学习的兴起,卷积神经网络、图卷积网络等深度学习模型被用于挖掘交通数据中复杂的空间依赖关系,而在处理交通数据中的时间依赖关系时,主要是利用循环神经网络等模型。虽然现有的深度学习模型已经实现了在交通流预测任务中较好的预测结果,但是仍然存在着一些问题。传统交通流预测的方法通常利用邻接矩阵对道路的空间依赖关系进行描述,例如MTGNN在捕获空间依赖关系时使用自适应邻接矩阵,然而自适应邻接矩阵往往反映的是道路中的局部空间依赖,忽略了道路中全局空间依赖。在真实世界里,路段之间可能会因为区域功能而存在额外的空间关系(如住宅和工作区域会存在密切的联系)。为了更好的捕获路网中的局部空间依赖和全局空间依赖,解决MTGNN模型中所存在的问题,本发明提出了一种基于多视图的时空图卷积网络模型MVSTGCN。

发明内容

本发明针对路网上的交通流预测问题,提出了一种基于多视图时空图卷积网络的交通流预测方法,进行交通流预测。具体来说,本发明为一种新的时空特征提取方法,空间维度上通过从多角度考虑道路观测点间的交互关系,实现复杂的空间依赖关系提取,时间维度上使用门控时间卷积模块来提取时间依赖关系。为了降低多角度提取空间依赖关系造成的数据冗余,提高模型的鲁棒性,引入了特征分离思想,最后在两个真实交通数据集上进行了大量的实验,验证了所设计的网络的可行性和有效性。

本发明的技术方案如下:

一种基于多视图时空图卷积网络的交通流预测方法,其特征在于,所述预测方法包括以下内容:

S1.获取交通数据集并构建路网的静态图邻接矩阵A

S2.获取趋势相似图邻接矩阵A

S3.构建MVSTGCN模型:

所述MVSTGCN模型包括输出模块和若干串联的时空特征提取层,通过堆叠多层时空特征提取层获取到不同尺度下的时空特征,当前时空特征提取层的输出作为下一时空特征提取层的输入,同时当前时空特征提取层的输出被记录进输出模块,当所有时空特征提取层都提取到时空特征后,由输出模块给出预测结果;

每个时空特征提取层包括门控时间卷积模块和多视图图卷积模块串联的结构,多视图图卷积模块用于空间特征提取,门控时间卷积模块用于时间特征提取;

所述门控时间卷积模块的输入为经线性转换层处理后的交通数据,门控时间卷积模块的输出连接多视图图卷积模块,同时静态图邻接矩阵A

所述输出模块包括不少于两个的全连接层(FC),输出模块的激活函数为ELU;

S4.利用交通数据集训练MVSTGCN模型,最终获得用于交通流预测的MVSTGCN模型。

所述步骤S1的具体过程是:

S11.获取路网的图结构信息G=(V,E),V={v

S12.获取该路网的交通数据,并进行数据清洗;

S13.对清洗后的交通数据进行时间片划分,一个时间片内所有观测点的交通数据对应一个特征矩阵X

S14.对时间片的数据进行堆叠,得到最终的交通数据集X=[X

所述门控时间卷积模块的计算过程为公式(2):

Z=Tanh(TCN(X′))*σ(TCN(X′))(2)

其中:TCN表示空洞因果卷积网络;X′表示经过线性转换层处理后的交通数据的特征矩阵;Z表示门控时间卷积模块的输出;Tanh和σ分别代表Tanh和Sigmoid激活函数;*表示元素乘法;

所述输出模块包括两个的全连接层(FC),对不同尺度下的时空特征进行非线性变换,得到最终的预测结果。

所述多视图图卷积模块由三个多尺度图卷积网络和一个聚合层构成,利用三个多尺度图卷积网络MS-GCN分别提取到静态图特有空间特征、趋势相似图特有空间特征和图上的公共空间特征;运算过程的公式表达为:

Q

Q

Q

Q

其中:MS-GCN1,MS-GCN2和MS-GCN3代表三个多尺度图卷积网络;Z表示门控时间卷积模块的输出;A

所述多尺度图卷积网络的公式表示为式(6):

其中θ

获得到空间特征后,将获得到的空间特征进行拼接操作,然后将拼接后得到的特征向量输入到聚合层进行特征聚合,计算过程为公式(11):

Q’=Agg(Concat(Q

其中:Concat表示向量拼接操作;Agg表示特征聚合操作,Q′为多视图图卷积模块的输出,所述聚合层为全连接层或者通道注意力。

所述MVSTGCN模型的总损失L为多视图图卷积模块的损失函数L

其中:S表示预测的时间步长;N表示观测点的个数;D表示要预测特征的维度,交通流预测任务中D固定为1,表示流量特征;

多视图图卷积模块的损失函数L

L

其中α和β代表超参数,L

所述S2中,采用动态时间扭曲算法(DTW)来计算观测点两两之间数据序列的相似性,并构建成趋势相似矩阵Sim,Sim

然后使用阈值函数来选择连通关系,当Sim

或者设置top K的值,选择趋势相似矩阵同一行中的Sim

动态时间扭曲算法(DTW)中需要设置限制DTW在寻找对齐关系时的搜索步长。

本发明还保护一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序适用于被计算机加载时执行所述的基于多视图时空图卷积网络的交通流预测方法。

与现有技术相比,本发明的有益效果是:

本发明利用深度卷积神经网络的算法,设计了一种多视图时空图卷积网络进行交通流预测。该方法以路网上的交通数据、静态图邻接矩阵和趋势相似图邻接矩阵作为输入,通过交替进行时间特征和空间特征提取,然后使用输出模块进行特征融合,实现了交通流的精准预测。与实施例中预测精度最好的STG-NCDE相比,本发明在真实交通数据集PeMS03、PeMS08上取得了更优的预测性能。具体而言,在PeMS03数据集中,其中MAE降低了5.33%、MAPE降低了3.91%、RMSE降低了6.34%;在PeMS08数据集上,MAE降低了1.49%,MAPE降低了1.51%,RMSE降低了1.57%(三个评价指标的值越小越好)。

本发明实现了从不同角度对道路中的空间依赖关系进行提取,实现从全局角度和局部角度进行空间依赖关系的捕获,提出多视图时空图卷积网络,实现交通流预测。通过从不同的角度对道路观测点中的依赖关系进行建模,然后利用多视图图卷积模块提取空间特征,以增加模块捕获空间依赖的能力,提高模型的预测性能。

本发明提出多视图时空图卷积网络,对潜在的空间依赖关系进行提取,可以加强预测的效果。本发明中的门控时间卷积模块,主要是由两个空洞因果卷积网络构成,分别由不同的激活函数激活,结构简单,并且计算过程中没有依赖关系,可以实现并行计算,具有训练时间短、不会产生误差累加的优点。

附图说明

图1空洞因果卷积网络TCN的结构示意图。

图2门控时间卷积模块的结构示意图。

图3多尺度图卷积网络的结构示意图。

图4多视图图卷积模块的结构示意图。

图5MVSTGCN模型的结构示意图。

图6单步预测MAE对比结果图。

图7单步预测MAPE对比结果图。

图8单步预测RMSE对比结果图。

具体实施方式

为使本发明的技术方案更加清楚,下面结合附图对本发明做进一步阐述。

本发明通过多视图图卷积模块提取交通数据中潜在的空间依赖特征,使用门控时间卷积模块提取交通数据中潜在的时间依赖特征,交替进行时间和空间依赖特征提取,获得不同尺度下的时空依赖关系,将不同尺度下的时空依赖关系输入到输出模块中进行非线性数据转换,最终获得预测结果。多尺度图卷积网络基于邻接矩阵进行消息传递,实现空间特征的捕获;多视图图卷积模块由3个多尺度图卷积网络构成,分别基于邻接矩阵对交通数据提取特有空间特征和公共空间特征,并起到特征分离的作用,邻接矩阵反映的是空间依赖关系;输出模块由若干全连接层和激活函数构成,用来对输入的时空特征进行非线性数据转换。

本发明按以下步骤具体实现:

第一步,通过爬虫脚本或者交管部门提供的API接口获取某一区域的交通数据,对获得的交通数据进行预处理工作,然后构建成交通数据集;

对路网进行表示:交通流预测问题是典型的多元时间序列预测问题,其目的是通过历史交通流数据来预测未来一段时间内的交通流,本发明利用无向图G=(V,E)表示路网,其中V是路网中观测点的集合,N=|V|代表路网中观测点的个数,E定义为边的集合,体现的是观测点间的连通性或者距离,A∈R

不同时刻路网中各个观测点处的交通数据构成交通数据集。

路网,指的是在一定区域内,由各种道路组成的相互联络、交织成网状分布的道路系统。在进行交通预测任务时,都会先选定要进行交通预测的区域,区域上各个道路及道路之间连通关系就是路网,然后路网中进行交通数据统计的位置称为观测点,通过路网可以得到观测点间的连接关系,然后用静态图邻接矩阵A

第二步,确定模型的输入和输出:对于交通流预测任务来说,模型的输入是N个观测点在过去T个时间步的历史交通数据X

交通流预测是利用过去T个时间步的交通数据预测未来S个时间步的交通数据,历史数据截止到t时刻,所以输出是从t+1时刻开始。

第三步:将交通数据集进行划分,并对数据进行标准化:按照常用的比例划分标准,60%的数据用于训练,20%的数据用于验证,20%的数据用于测试,并对数据使用Z-Score方法进行标准化,并分别记为Temp

第四步:构建MVSTGCN模型,即多视图时空图卷积网络模型:

所述MVSTGCN模型包括输出模块和若干串联的时空特征提取层,通过堆叠多层时空特征提取层可以获取到不同尺度下的时空特征,当前时空特征提取层的输出作为下一时空特征提取层的输入,同时当前时空特征提取层的输出被记录进输出模块,当所有时空特征提取层都提取到时空特征后,由输出模块给出预测结果;

每个时空特征提取层包括门控时间卷积模块和多视图图卷积模块串联的结构,多视图图卷积模块用于空间特征提取,门控时间卷积模块用于时间特征提取;

所述门控时间卷积模块的输入为经线性转换层处理后的交通数据,门控时间卷积模块的输出连接多视图图卷积模块,同时静态图邻接矩阵A

所述输出模块包括不少于两个的全连接层(FC),输出模块的激活函数为ELU,通过对不同尺度下的时空特征进行非线性变换,得到最终的预测结果。

MVSTGCN模型整体结构如图5所示。图5中的A

为了捕获交通数据中的时间依赖关系,本发明采用门控时间卷积模块进行时间特征提取。所述门控时间卷积模块(参见图2)由两个空洞因果卷积网络TCN构成,二者结构相同,两个空洞因果卷积网络分别由Tanh和Sigmoid激活函数激活,Tanh激活函数的作用是对空洞因果卷积网络的输出进行滤波,Sigmoid激活函数起到门控的作用,用来控制信息传递到下一层的比例。空洞卷积可以保证模型在参数量较小的情况下处理足够长的序列,因果卷积保证了模型不会看到未来的信息。最终门控时间卷积模块的计算过程为:

Z=Tanh(TCN(X′))*σ(TCN(X′))(2)

其中:TCN表示空洞因果卷积网络;X′表示输入经过线性转换层处理后的交通数据的特征矩阵;Z表示门控时间卷积模块的输出;Tanh和σ分别代表Tanh和Sigmoid激活函数;*表示元素乘法。

空洞因果卷积网络的结构如图1所示。图1中的每一行代表当前层的输入,以输入层为例,当输入长度为8的序列时,使用尺寸大小为2,空洞率为1的一维空洞因果卷积核进行特征提取,则提取到的数据为倒数第二层的后七个位置,第一个位置是填充位,实际构建时不需要,第三层前三个位置是填充位,为使图片看上去简洁,忽略了部分连接关系,例如倒数第二行第三列的圆形会和倒数第一行的第二列和第三列有连接关系,这里省略这种连接关系。因果卷积指的是连接都只存在于当前位置及之前部分位置,可以防止看到未来的数据。空洞率代表了每个卷积核在处理序列时,处理位置跳跃的范围再加1,输出层为第一行,在第二行中,由于使用了尺寸大小为2,空洞率为4的空洞因果卷积核,所以输出层仅接收第8列和第4列数据的计算结果,第5到第7列数据被忽略。每一个位置的计算公式为:

为了捕获交通数据中潜在空间依赖关系,设计了一种多视图图卷积模块。图卷积网络将传统的卷积神经网络从欧几里得空间数据推广到非欧几里得结构的图中,能够实现图上的消息传递,进而实现空间依赖关系的提取,在此基础上,将传统的图卷积方法进行延伸,捕获多视图的信息,多视图图卷积模块通过静态图和趋势相似图来进行观测点特征的聚合,多视图图卷积模块在提取空间依赖关系时,将单个视图(邻接矩阵)上的空间依赖关系分解成为公共空间特征和特有空间特征,然后使用通道注意力机制对所获得的所有空间特征进行信息加权,最终获得到语义丰富的空间特征。所述多视图图卷积模块的流程如下:

(1)构建趋势相似图:基于观测点间的流量变化趋势相似度,构建趋势相似图,具体过程如下:分别计算观测点两两之间的距离,由于不同观测点的交互具有时滞,因此常用的余弦相似度、欧氏距离度量法均不能很好的将时间序列对齐。本实施例中通过使用动态时间扭曲算法(DTW)来计算观测点两两之间的距离。动态时间扭曲算法允许跨时间步进行关系对齐,可以较好的处理时滞关系导致的序列不一致问题的距离计算。动态时间扭曲算法使用动态规划思想来计算序列间的最小距离。所用的动态规划转移方程表示为:

γ(w,h)=dis(q

式中γ(w,h)代表了从观测点v

使用以上算法计算出观测点序列间的最小距离,构成趋势相似矩阵Sim,然后使用阈值函数来选择连通关系,当Sim

通常的距离度量方法大多使用余弦相似度、欧氏距离,此处采用DTW是为了实现跨时间步的关系对齐,因为交通数据从空间上的变化来看具有时滞关系。传统的DTW在计算序列的距离时,时间复杂度是O(n

本实施例中优选限制了DTW在寻找对齐关系时的搜索步长,例如向后寻找12个时间步,这样复杂度将减少到O(n),因为交通序列观测点的交互都是发生在有限时间范围内,所以限制搜索的步长不会影响最终的性能,具体的搜索步长需通过实验选择,具体问题具体分析。

道路中第i个观测点和第j个观测点序列的最小距离,假设两个观测点的时间序列长度均为12,则Sim

还可以根据需要选择趋势相似矩阵同一行中的Sim

(2)构建多尺度图卷积网络MS-GCN:基于给定的邻接矩阵A和特征矩阵Z,使用图卷积网络GCN对特征矩阵Z进行空间特征提取,在图卷积网络的每一个图卷积层中利用注意力模块获得根据当前层所含信息量的大小所赋予的不同的权重因子,图卷积网络层的运算过程用公式表示为:

H

H

其中H

其中θ

(3)构建多视图图卷积模块:在多尺度图卷积网络的基础上,构建多视图图卷积模块,多视图图卷积模块的结构如图4所示。具体而言,多视图图卷积模块由三个多尺度图卷积网络和一个聚合层构成。三个多尺度图卷积网络MS-GCN分别实现对静态图特有空间特征、趋势相似图特有空间特征和图上的公共空间特征的提取。运算过程的公式表达为:

Q

Q

Q

Q

其中:MS-GCN1,MS-GCN2和MS-GCN3代表前面提到的三个多尺度图卷积网络;Z表示门控时间卷积模块处理后的交通数据构成的特征矩阵;A

获得到空间特征后,将获得到的空间特征进行拼接操作,然后将拼接后得到的特征向量输入到聚合层进行特征聚合,计算过程的公式定义如下:

Q′=Agg(Concat(Q

其中:Concat表示向量拼接操作;Agg表示特征聚合操作,具体的实现可以使用全连接层或者通道注意力代替。

(4)损失函数设置:为了保证以上三个多尺度图卷积网络MS-GCN具有特征分离的作用,需要定义对应的损失函数,保证模型的学习结果。令Q

上述的公式同样可以用来度量空间特有信息和空间公共信息之间的差异性,特有信息和共有信息应该具有不一样的信息表征,因此两个矩阵之间应具有很大的差异性,使用Q′

最终多视图图卷积模块的损失函数L

L

其中α和β代表超参数,用来控制当前损失函数对模型参数的影响程度,L

第五步:训练模型参数:根据Temp

(1)对训练集X

(2)时空特征提取层首先利用门控时间卷积模块对输入进行时间特征提取,得到时间特征Z,然后多视图图卷积模块基于趋势相似图邻接矩阵A

(3)将时空特征Q′

(4)重复(2)(3)步骤,直到数据经过所有的时空特征提取层;

(5)再将变量Skip输入到输出模块中,输出模块的输出结果即为模型的预测结果

(6)利用预测结果

其中:S表示预测的时间步长;N表示观测点的个数;D表示要预测特征的维度,交通流预测任务中D固定为1,表示流量特征;t表示第t个时间片;s表示预测的第s个时间片;

(7)利用反向传播算法对模型的参数进行更新。

第六步:验证模型性能:将验证集X

第七步:重复第五步和第七步,直到验证集上的预测损失L

第八步:测试MVSTGCN模型的预测性能:将测试集X

(1)MVSTGCN模型整体性能评估

本发明在PeMS03和PeMS08两个真实交通流数据集上进行了实验。数据集的详细信息如表1所示。两个数据集均以5分钟作为一个时间步长。

表1:数据集信息

通过在真实数据集上的对比实验验证了本发明提出的基于多视图时空图卷积网络的交通流预测方法的有效性和准确性,实验结果如表2所示。

将本发明与其他的基准方法进行了对比:包括FC-LSTM、DCRNN、STGCN、ASTGCN、STG2Seq、Graph Wavenet、STSGCN、STFGNN、ZGCNETS和STG-NCDE(提到的基准方法均为已发表文献中模型的英文简写),并且采用三种度量指标进行评估,包括平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE。以上三个度量指标的值均为越小越好,对应的计算公式如下:

其中:y

从表2中可以发现,MVSTGCN模型的预测性能在两个数据集上的三个指标均优于其他基线模型。MVSTGCN通过多角度的空间依赖关系提取,可以获得语义更加丰富的空间特征模型,使得模型由更好的预测性能。

表2:MVSTGCN和基准模型的性能对比结果

为了进一步验证MVSTGCN的性能,选择在PeMS08数据集上与最先进的两个模型ZGCNETS、STG-NCDE进行单步预测误差比较,并将实验对比结果绘制成折线图。MAE、MAPE和RMSE的单步预测结果如图6-图8所示。

(2)为了评估和了解本发明提出的MVSTGCN模型中关键组成部分的效果和性能,在PeMS03数据集上进行了消融研究,将MVSTGCN的变体进行命名,表示如下:

·MVSTGCN/w.o.R:仅使用静态图邻接矩阵,没有多视图图卷积模块,有普通图卷积网络,不考虑其他角度构建的依赖关系。

·MVSTGCN/w.o.C:在单一邻接矩阵的基础上,使用多尺度图卷积网络代替原始的图卷积网络,即在MVSTGCN/w.o.R基础上将普通图卷积网络中增加注意力模块,形成多尺度图卷积网络。

·MVSTGCN/w.o.D:使用静态图邻接矩阵和趋势相似图进行空间依赖提取,不包括图4中的共享参数部分,即只有两个MS-GCN。

消融实验结果如表3所示。

表3:消融实验

实验结果表明,多视图图卷积模块、多尺度图卷积网络和特征分离思想对于MVSTGCN的性能都是至关重要的。趋势相似图和静态图上的空间特征融合证明了多视图特征提取的有效性,多尺度图卷积网络可以对模型的中间输出进行动态权重调整,起到自适应的作用。本发明MVSTGCN模型达到了较好的交通流预测结果。

本发明未述及之处适用于现有技术。

相关技术
  • 一种基于注意力时空图卷积网络的空域交通流量预测方法
  • 一种基于时空图卷积网络的公共交通流量预测方法
技术分类

06120115918480