基于STNR模型的交通流量预测方法及系统
文献发布时间:2024-04-18 19:54:45
技术领域
本发明涉及智能交通技术领域,尤其涉及一种基于STNR模型的交通流量预测方法及系统。
背景技术
随着社会的不断发展,城市中机动车的数量越来越多,伴随而来的交通拥堵现象也越来越严重。为此很多国家通过发展智能交通系统(IntelligentTransportationSystem,ITS)解决交通拥堵问题,通过ITS的决策和引导来解决此类问题,而快速准确的交通流预测则是ITS作出决策和引导的关键。
智能交通系统(ITS)中的交通信息采集系统通过采用路边采集单元进行信息(如:车流量、车辆速度等)采集,信息处理分析系统则是使用所采集的数据进行分析处理,信息发布系统通过统计分析整理之后给民众提供最佳路径,避免交通拥堵,缓解交通压力。而现在的信息分析处理部分都是利用车流量预测来达到目的,所以如何得到精准的预测信息成为智能交通系统的关键一步。
Zhao等人提出了一种基于LSTM的交通流数据预测方法(Hamilton W,Ying Z,Leskovec J.Inductive representation learning on large graphs[C]Advances inNeural Information Processing Systems.2017:1024-1034.),利用LSTM提取交通流数据的时间特征,得到交通流数据的时间趋势。该方法只能学习时间特性,无法提取交通流数据的空间特征,加之数据分析不全面,导致车流量预测不准确。
吴等人提出了一种包含CNN模块和LSTM模块的混合式深度学习框架(Wu,H.Tan,Short-term traffic flow forecasting with spatial-temporal correlation in ahybrid deep learning framework.2016.),分别使用CNN模块和LSTM模块提取数据的不同特征。CNN模块提取相邻区域交通流数据的空间特征。LSTM模块提取交通流数据的时间特征。最后,将CNN模块和LSTM模块提取的特征结合起来进行交通流数据预测。
北方工业大学的周明综合考虑了时域和空间,提出了一种基于路网关联性的长时段记忆网络(RNC-LSTM)(周明.基于路网时空信息的短时交通流预测方法研究[D].北方工业大学,2020.),通过抽象路网结构计算关联系数矩阵获取交通数据的时空特征输入,最后融合构建预测系统对交通流进行短期预测。
然而由于交通流量信息数据规模庞大、时空依赖性强、社会相关性明显等特征,导致交通流量预测的时延和准确率难以保证。这是因为,现在的交通流预测方法要么以城市道路流在空间上相邻路段交通流作为自变量,利用历史时序数据建立预测模型,或者以时间维度变化上的变化作为自变量,采用现在最流行的智能学习算法进行预测模拟,缺乏将时间空间两个维度同步的研究分析,因此难以实现可靠、实时、准确的城市道路交通状况的预测。
发明内容
本发明提供了一种基于STNR模型的交通流量预测方法及系统,提高交通流预测的准确性。
本发明的技术方案如下:
一种基于STNR模型的交通流量预测方法,包括:
将目标路段的历史交通流量数据按时间顺序进行排序,并划分为长期数据和短期数据,获得训练集;
构建交通流量预测模型,将长期数据和短期数据作为交通流量预测模型的输入,训练所述的交通流量预测模型;所述的交通流量预测模型包括全连接层、长短期处理模块、时空卷积模块和多层感知器模块;所述的全连接层分别提取长、短期数据的长、短期时间特征;所述的长短期处理模块通过注意力机制融合长、短期时间特征,并输出给所述的时空卷积模块;所述的时空卷积模块捕捉输入的时间依赖和空间依赖,并输出给所述的多层感知器模块,通过所述的多层感知器模块获得预测结果;
采集当前时刻目标路段的交通流量数据,并输入至训练好的交通流量预测模型中,预测未来时段的交通流量。
优选的,将目标路段每隔5分钟的交通流量数值提取出来作为交通流量时间序列,判断交通流量时间序列是否为平稳时间序列,如果为平稳时间序列则直接构造训练集,若不为平稳时间训练则对其进行差分,利用差分后的数据构造训练集。
若时间序列是连续的,则该时间序列是平稳时间序列。
交通流量数据具有时间属性,即日周期依赖和周周期依赖。
优选的,所述的短期数据为预测当天的交通流量数据,长期数据为除短期数据外的历史观测数据。
短期数据X
其中,T
长期数据X
其中,
通过全连接层分别提取长、短期数据的长、短期时间特征,可表示为:
Z
Z
其中,FC表示全连接层;ReLU表示ReLU函数;w
优选的,所述的长短期处理模块包括时间卷积网络单元和长短期融合单元;通过时间卷积网络单元捕捉长期数据的时间特征,长短期融合单元采用注意力机制融合长期时间特征和短期时间特征。
通过时间卷积网络单元捕捉长期数据的时间特征可表示为:
F
其中,
采用注意力机制融合长期时间特征和短期时间特征,包括:
将
其中,F是非线性激活函数;
分别将得到的注意力向量和输入相乘,然后融合乘积结果,得到:
其中,⊙
进一步优选的,所述的时间卷积网络为空洞卷积网络。
道路网络中的交通状况通常表现出明显的时空相关性,本发明通过时空卷积模块来有效地捕获交通流量的空间依懒性和时间依赖性。
优选的,所述的时空卷积模块包括门控循环单元(GRU)和图卷积单元(GCN);所述的门控循环单元以融合时间特征为输入,其输出F
优选的,多层感知器模块由两个具有线性变换的ReLU堆叠层组成。
给定G
X′=W
其中,W
训练所述的交通流量预测模型时,使用平均绝对误差(MAE)作为训练目标:
Y
本发明还公开了一种基于STNR模型的交通流量预测系统,包括上述构建并训练好的交通流量预测模型;采集当前时刻目标路段的交通流量数据,并输入至所述的交通流量预测系统中,获得未来时段的交通流量预测结果。
与现有技术相比,本发明的有益效果为:
1)本发明结合了长期数据与短期数据,并在设计长短期处理模块的同时考虑了交通数据的长短周期依赖关系,极大提高了时间层面上的预测准确率。
2)本发明结合了时间、空间两个维度,并提出了时空卷积模块来有效地对这些相关性进行建模,有效的捕捉了任何路段的空间依赖性和任何时间间隔的时间依赖性。
附图说明
图1为模型结构示意图,其中(a)为STRN模型的总体结构示意图,(b)为长短期数据处理模块结构示意图,(c)为时空卷积模块结构示意图;
图2为门控循环单元的结构示意图。
具体实施方式
本发明技术方案的基本内容如图1所示,STRN(短时递归网络,Short TemporalRecurrent Network)模型主要由四个模块组成,分别是全连接层、长短期处理模块、时空卷积模块和MLP。首先,将历史观测值处理为长期数据和短期数据作为模型输入。然后,将两个处理后的输入通过一个长短期处理模块来对数据的长短期特征进行建模。之后,通过时空卷积模块来建模时空依赖关系。最后,输出由多层感知器融合得到预测结果。
本发明提供了一个优选的实施例,一种基于STNR模型的交通流量预测系统,包括以下步骤:
1)数据准备
本方案的模型训练采用的是RFID数据集,首先要对数据进行预处理,将缺失数据和重复数据进行清理,选择一段路段按时间顺序进行排序,并划分为长期数据和短期数据,短期数据为预测当天的数据,其余的为长期数据,数据的内容包括交通流速度,单位是公里/小时。将路段每隔5分钟的车流量数值提取出来作为车流量时间序列,判断车流量时间序列是否是平稳(若时间序列是连续的则为平稳)时间序列,如果是平稳序列则可直接构造数据集,若不平稳则对其进行差分,利用差分后的数据构造数据集,得到预测车流量值时进行相应的逆变换并以7:1:2的比例划分为训练集,验证集和测试集。最后将数据输入模型之前对数据进行归一化处理,以便于模型训练,得到更好的结果。
2)模型搭建
2.1全连接层(FC)
流量数据具有时间属性,即日周期依赖和周周期依赖。为了预测今天某个时刻的交通流量,模型除了学习最近的数据外,还需要学习过去几天的时刻数据。因此,我们在设计长短期处理模块的同时考虑了交通数据的长短周期依赖关系。长短期处理模块的具体执行流程说明如下。
将模型的短期输入表示为:
其中T
将模型的长期输入表示为:
其中
Z
Z
其中w
2.2长短期处理模块
由于交通数据集具有复杂的时间属性,交通预测任务具有挑战性。我们设计了一个长期短期数据处理模块来模拟交通数据的长期和短期时间属性。长短期数据处理模块如图1中的(b)所示。首先,我们通过时间卷积网络处理更复杂的长期数据,然后将结果与短期数据融合。请注意,我们通过注意力分数融合了长期和短期数据。
S1.长期时间卷积网络(TCN)
由于长期数据比较复杂,我们首先采用TCN来学习长期数据的时间属性。TCN使用空洞卷积来动态捕获数据的时间属性。空洞卷积可以有效缓解RNN中梯度消失和梯度爆炸的问题。
对于一维输入序列x
其中d是膨胀系数,k是卷积核大小,x
F
其中
S2.长短期融合
STRN采用注意力模块来融合长期时间特征和短期时间特征。给定
其中F是非线性激活函数,
其中λ
其中⊙
2.3时空卷积模块
道路网络中的交通状况通常表现出明显的时空相关性,因此我们提出了时空卷积模块来有效地对这些相关性进行建模。如图1中的(c)所示,时空卷积模块由一个门控循环单元(GRU)和一个图卷积层(GCN)组成。为了捕捉任何路段的空间依赖性和任何时间间隔的时间依赖性,我们设计了具有多层的模型。
S1.门控循环单元(GRU)
交通网络的时间相关性是交通预测的关键因素。交通预测面临的时间相关性挑战与时间序列预测类似,因此交通预测中的时间序列数据可以参考处理序列的模型进行处理。目前,用于处理序列数据的最广泛使用的模型是循环神经网络(RNN)。然而,传统的递归神经网络在处理时序数据方面存在局限性。
GRU和LSTM是RNN的变体,但GRU的参数较少,因此在处理相同任务时效率更高。GRU的结构如图2所示。GRU中的每个隐藏层都可以通过重置门r
r
其中g
z
当前隐藏层h
S2.图卷积网络(GCN)
在路网中,路段之间的交通状况通常表现出复杂的空间相关性。路段的交通状况受到其他因素的影响,并且影响是高度动态的。我们利用GCN来捕捉这种复杂的空间相关性。对于给定的顶点v
其中X
其中E
2.4多层感知器(MLP)
我们将时空卷积模块的输出馈送到MLP层以获得预测结果。MLP层由两个具有线性变换的ReLU堆叠层组成。MLP层合成聚合的节点特征以进行节点级预测。
给定G
X′=W
其中W
Y
3)模型训练
将步骤1)中划分好的训练集和验证集输入到步骤2)中搭建好的模型中,进行模型训练。
4)模型测试
将1)中划分好的测试集输入到3)中训练好的模型中,对模型的性能进行测试,测试指标采用均方误差(Mean Squared Error,MSE),均方误差是反映估计量与被估计量之间差异程度的一种度量,预测准确率越高则均方误差越小,反之则越大。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
- 基于改进Transformer模型的交通流量长时预测方法及系统
- 一种基于交通流矩阵组合模型的交通流量预测方法