掌桥专利:专业的专利平台
掌桥专利
首页

基于多时序卷积门控图神经网络的交通流预测方法及系统

文献发布时间:2024-04-18 19:58:53


基于多时序卷积门控图神经网络的交通流预测方法及系统

技术领域

本发明属于交通技术领域,主要应用于城市路网交通流的预测,具体涉及一种基于多时序卷积门控图神经网络的交通流预测方法及系统。

背景技术

由于日益增长的交通需求量与有限的交通供应之间不平衡,交通拥堵已成为一个普遍存在的城市问题。为有效应对该挑战,智能交通系统(ITS)已经成为重要的解决途径。而作为ITS的关键模块之一,实时准确的交通流预测能够为交通管理部门实施交通控制和可靠交通诱导提供科学依据。

目前用于交通流预测的方法有很多,通过分析发现现有的交通流预测方法通常只考虑与预测时间点邻近的时空序列,难以充分挖掘长序列数据中的时空周期性。因此,如何提高交通流预测模型的准确度是当前研究热点,提出一种有效的改进措施来提升交通流预测模型的精度至关重要。

发明内容

发明目的:针对上述问题,本发明在分析现有工作的基础上,提出一种多时序卷积门控图神经网络模型(MTCGGN),该模型结合GCN、GRU、MTCN以及注意力机制来提高交通流预测性能。首先,将原始序列划分为邻近序列和周期序列。对于邻近序列利用GCN对路网交通流数据进行训练,以提取路网的空间特征,结合GRU来提取邻近序列的时间特征,并将两个网络组成图卷积门控网络,构成短期时空特征提取模块;其次,为捕获长序列历史数据中的周期特征,采用基于改进TCN的MTCN来学习多个时间序列之间的依赖关系,构建一个多时序时空特征提取模块。此外,使用独热编码构建外部特征提取模块。最后,使用注意力融合输出模块,来融合路网时空特征和外部因素特征,得到MTCGGN预测模型。本发明通过对邻近序列和周期序列时空特征的深入挖掘,有效实现了对城市路网交通流时空特征的提取和分析。

技术方案:一种基于多时序卷积门控图神经网络的交通流预测方法及系统,所述方法包括如下步骤:

利用图卷积神经网络(GCN)和门控循环单元(GRU)构建图卷积门控单元(GGCN),以此捕获路网交通流数据中邻近序列的短期时空特征;

利用多时序卷积网络(MTCN)学习路网交通流数据中周期序列中多个时间序列之间的依赖关系,提取周期序列的多时序时空特征;

将外部环境影响因素按类别分别进行独热编码,构成外部影响因素序列,利用FC网络提取外部影响因素序列的外部因素特征;

使用注意力机制融合短期时空特征、多时序时空特征和外部因素特征,并输出最终预测值。

优选的:采用抽取关键帧的方法从交通流数据集中抽取邻近序列和周期序列。

优选的:多时序卷积网络包括多个并行堆叠的TCN网络,每个TCN网络内部通过使用因果卷积和扩张卷积来处理一个输入通道的数据,用来学习多个时间序列之间的依赖关系。

优选的,外部环境影响因素包括天气和节假日,天气状况划分为五个类别:晴天、多云、有雾、小雨和大雨,节假日分为两个类别:工作日和节假期。

优选的,FC网络设置两层全连接层,使用Sigmoid激活函数,并将输出值扩展至与路网交通流数据相同的尺寸。

优选的,首先采用注意力机制将短期时空特征和多时序时空特征融合,得到路网时空特征,再利用注意力机制将路网时空特征与外部因素特征融合以增强多时序时空特征的外部环境感知能力。

优选的,使用Log-Cosh损失函数衡量路网检测点平均速度的真实值与预测值的误差,并利用Adam优化算法对模型参数进行优化。

本发明还提供一种基于多时序卷积门控图神经网络的交通流预测系统,包括:

短期时空特征提取模块,用于提取邻近序列的短期时空特征;

长期时间特征提取模块,用于提取周期序列的多时序时空特征;

外部因素特征模块,用于提取外部环境影响因素序列的外部因素特征;

注意力融合输出模块,用于融合短期时空特征提取模块、多时序时空特征和外部因素特征,并输出最终预测值。

有益结果:MTCGGN的预测性能优于现有基于时空特征挖掘的图卷积网络。与属性增强时空图卷积网络(AST-GCN)、时间图卷积网络(T-GCN)和扩散卷积循环神经网络(DCRNN)相比,MTCGGN的均方根误差(RMSE)分别降低2.49%、4.96%和10.89%。

附图说明

图1是GGCN模块架构图;

图2是GRU的模型框图;

图3是TCN的流程图;

图4是MTCN的结构图;

图5是MTCGGN网络结构图;

图6是MTCGGN模型预测的可视化结果图;

图7是多步预测MAE和RMSE柱状图;

图8是消融实验柱状图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

本发明提出的一种基于多时序卷积门控图神经网络的交通流预测方法,包括以下步骤:

步骤1)将原始序列划分为邻近序列和周期序列。利用图卷积神经网络(GCN)和门控循环单元(GRU)设计出图卷积门控单元(GGCN),以此捕获邻近序列的短期时空特征;

假设第i时刻的路网交通流数据帧为R(i),则交通流数据集抽取规则如下:1)邻近序列,Recent(i)={R(i-T

GGCN模块由图卷积网络和门控循环单元组成,GGCN模块架构图如图1所示:其中,X=[X

(1)图卷积网络的计算过程如下:

GCN的目标是提取拓扑图的空间特征,实现这个目标通常有两种途径:一是基于顶点域的卷积,二是基于频域或谱域的卷积。后者利用图拉普拉斯矩阵的特征值和特征向量推广定义图上的傅里叶变换,并由此定义图的卷积操作。

图拉普拉斯矩阵的定义为:

L=D-A

其中,A表示图的邻接矩阵,D是图的度矩阵。Thomas Kip等人基于二阶Chebyshev多项式推导出新的且应用最为广泛的GCN形式。由Chebyshev的递归定义可知:

其中,T

为准确预测节点交通流,考虑该节点及相邻节点的影响,使用多次图卷积运算来捕捉更远节点的影响。设切比雪夫多项式的阶数为2,化简后得到图卷积公式:

在神经网络中图卷积变换公式如下:

其中,

(2)门控循环单元的计算过程如下:

GRU是一种常见的循环神经网络变体,它吸取了LSTM长期时间特征提取的优点并提高了计算效率。与LSTM三种门结构不同,GRU仅使用更新门和重置门,更新门负责调节模型在多大程度上保留历史信息,重置门负责调控历史信息对当前隐藏状态的影响程度。图2为门控循环单元的模型框图。

设x

其中,运算符号⊙表示哈达玛积;z

r

其中,W

步骤2)利用多时序卷积网络(MTCN)对周期序列进行深度挖掘,提取出长期时间特征,进一步强化短期时空特征,从而形成多时序时空特征;

MTCN的基本思想是将多个TCN并行堆叠,每个TCN处理一个输入通道的数据,用来学习多个时间序列之间的依赖关系。TCN是一种基于一维卷积神经网络的模型。相较于传统循环神经网络模型,TCN无需维护长期的状态信息,在处理长序列时能够捕捉更长的时间依赖且能够避免梯度爆炸和梯度消失问题。此外,TCN模型中的卷积操作具有并行计算的优势,使得模型训练和计算速度更快,其流程如图3所示。

MTCN利用因果卷积和扩张卷积来对长序列数据进行特征提取和变换。因果卷积可以保持历史数据之间的先后关系,在时间轴方向上保持数据特征时序的一致性,而扩张卷积结构的扩大则可以使感受野学习到更大范围的上下文信息,因此能够更好地处理长序列周期数据。以tt时刻为例,TCN计算过程如下:

设长历史序列X=[X

由此得膨胀卷积的感知野大小为(I-1)d+1,此时调节感知野的大小可以通过增大I或者d来实现。

图4展示出MTCN的基本结构图,从图中可以看出,MTCN加强了当前值与之前时刻输入值之间的时序关系,从而能够更好的捕获长序列历史数据的周期特征。

步骤3)考虑到交通流易受天气和节假日等外部因素影响,设计了基于独热编码的外部特征提取模块,以提高多时序时空特征的外部环境感知能力。

独热(One-hot)编码用于将非数值型的类别数据转换为数值型数据。该方法使用q位向量来对Q个状态进行编码,其中每个状态都有一个由0和1组成的独立二进制向量表示。因此,对于具有Q个状态的集合Q={Q

使用One-hot编码的方法对天气和节假日这两个变量进行数值化处理。将天气状况划分为五个类别:晴天、多云、有雾、小雨和大雨,每一个类别都对应一个唯一的独热编码。因此具有5个状态的天气集合为Q={Q

将节假日状况分为两个类别:工作日和节假期。因此具有2个状态的节假日集合为Q={Q

FC网络的输入数据包含天气和节假日信息,使用One-hot编码对外部因素进行表征,并对输入数据进行归一化。设置两层全连接层,使用Sigmoid激活函数,并将输出值扩展至与X相同的尺寸。

步骤4)使用注意力融合输出模块,来融合路网时空特征和外部因素特征,并输出最终预测值。

路网里每个检测点的交通流都受时间属性中的邻近性和周期性影响,但不同检测点受影响程度各不相同。为此,本发明利用注意力机制来融合模型的短期时空特征提取模块和多时序时空特征提取模块如下所示:

X

其中,α

同理,最后将融合后的时空特征X

其中,α

Log-Cosh损失函数可以更好地处理交通流数据中的异常值和噪声,提高模型的鲁棒性和稳定性。因此,本发明使用Log-Cosh损失函数衡量路网检测点平均速度的真实值X与预测值

综上所述,为进一步挖掘交通流长序列的时空特性,本发明提出MTCGGN模型,其总体架构如图5所示。该模型由4个主要部分组成:1)短期时空特征提取模块,用于处理邻近序列。该模块利用GCN提取路网空间特征,结合GRU提取邻近序列时间特征。2)多时序时空特征提取模块,用于处理周期序列。该模块利用MTCN捕获长序列历史数据的周期特征。3)外部特征提取模块,用于处理外部因素。该模块采用独热编码对天气和节假日进行表征,并设置两层全连接层来提取外部特征。4)注意力融合输出模块,用于融合时空特征和外部因素特征。该模块首先将邻近序列时空特征和长序列历史数据的周期特征融合,得到路网时空特征,再融合外部特征以增强多时序时空特征的外部环境感知能力。

步骤5)利用某市区的真实交通流数据集进行实验,并与多个基准模型进行比较。

为验证模型的性能,使用某市区的路网数据进行实验,将检测点每15分钟的平均速度作为模型的输入参数,通过对比实验和消融实验,验证该模型的可行性。该交通数据集共包含156条路段,每15分钟统计每条道路上的平均速度,时间范围2015年1月1日至2015年1月31日,共计31天数据。在进行模型评估和结果计算时,选择k折交叉验证作为数据集划分方式,采用交叉验证重复10次,取均值作为结果。基于TensorFlow深度学习框架搭建实验程序,将数据集进行处理后输入模型训练。参数设置:批处理大小为64,训练轮次为3000,学习率为0.001,GCN层数为3,GRU单元数为64,MTCN膨胀率为1、2、4和8。

如表1所示,在某市区的真实交通流数据集中,MTCGGN模型相比其它基准模型具有更好的预测性能,且三种评价指标都显示MTCGGN模型具有最准确的预测结果。以RMSE为评价指标,MTCGGN模型相比DCRNN、T-GCN和AST-GCN模型分别降低10.89%、4.96%和2.49%。

表1不同模型预测的性能比较

为更直观地对比基于时空特征挖掘的模型预测性能,使用DCRNN、T-GCN、AST-GCN与本发明提出的MTCGGN模型对路网中编号为90217的路段进行预测,2015年1月26日至2015年1月31日模型预测的可视化结果如图6所示。从图中可以看出,MTCGGN模型的数据拟合效果最好,且能够检测高峰时段的开始和结束,模型的预测结果与真实速度的变化趋势最相似。实验结果表明,本发明提出的模型在拟合效果上均优于现有模型,取得了很好的预测效果。

此外,为进一步测试模型的预测效果,本发明进行多步预测,即利用上一步的预测结果预测下一步,比较四种模型随着预测步长的增加其性能的变化情况。以15min为单个时间步,预测步长从15min增至60min,实验结果如图7所示。从图中可以看出,随着预测时长的逐步增大,预测难度越来越大,模型误差整体呈上升趋势。本发明提出的MTCGGN与其它模型相比在中长期预测中取得较好的预测结果。随着预测时长的增大,MTCGGN相比AST-GCN模型预测误差增长更加缓慢,这是因为前者融合交通流数据集中的邻近特性和历史周期特性,对数据的时间维度信息挖掘的更为充分,因而在中长期预测中显现出更大的优势。

为进一步分析MTCGGN模型的性能,使用不同的模块组合为:1)MTCGGN_ggcn:只含有周期特征提取模块和外部因素模块;2)MTCGGN_mtcn:只含有时空特征提取模块;3)MTCGGN_fc:只含有时空特征提取模块和周期特征提取模块。将这三个变体模型与MTCGGN模型进行消融实验分析。由图8所示,MTCGGN的MAE和RMSE值均小于MTCGGN_ggcn、MTCGGN_mtcn和MTCGGN_fc,这说明时空提取模块和周期提取模块以及外部因素提取模块,能够较好的提取交通流以及外部因素的特征。

针对现有预测方法大多考虑与预测时间点相邻序列的时空特征,难以提取交通流长序列的时空周期性特征的问题。本发明在分析现有工作的基础上,提出一种多时序卷积门控图神经网络模型(MTCGGN),该模型结合GCN、GRU、MTCN以及注意力机制来提高交通流预测性能。首先,将原始序列划分为邻近序列和周期序列。对于邻近序列利用GCN对路网交通流数据进行训练,以提取路网的空间特征,结合GRU来提取邻近序列的时间特征,并将两个网络组成图卷积门控单元,构成时空特征提取模块;其次,为捕获长序列历史数据中的周期特征,采用基于改进TCN的MTCN来学习多个时间序列之间的依赖关系,构建一个多时序时空特征提取模块。此外,使用独热编码构建外部特征提取模块。最后,使用注意力融合输出模块,来融合路网时空特征和外部因素特征,得到MTCGGN预测模型。利用某市区的真实交通流数据集进行了验证,实验结果表明,MTCGGN模型的性能明显优于其它模型,可以应用于实际路网,提高交通路网的通行效率。

技术分类

06120116506545