掌桥专利:专业的专利平台
掌桥专利
首页

一种轨道交通长时客流预测方法和系统

文献发布时间:2024-04-18 20:00:50


一种轨道交通长时客流预测方法和系统

技术领域

本发明涉及城市轨道交通大数据和人工智能技术领域,尤其涉及一种基于遍历关联历史信息机制的轨道交通长时客流预测方法和系统。

背景技术

随着城市人口和汽车保有量的增加,城市交通拥堵问题日益严重,导致人们出行效率低下和环境污染严重等问题。城市轨道交通作为城市交通网络的骨干,已经成为了人们出行和通勤的首要选择,但是高峰期的地铁客流急剧增加,给城市轨道交通的运营管理、人们的出行安全等都带来巨大挑战。准确的轨道交通客流预测可以帮助相应的管理部门更加合理的制定运营方案和计划,并可以针对性的、有效的对站点进出站客流提前进行引导,对保障轨道交通安全、高效、智能的运营和管理具有十分重要的意义。

随着人工智能、数据采集技术和数据存储技术等的发展,目前已有相关研究人员针对城市轨道交通客流的短时预测(预测时间小于30分钟)问题,使用图卷积神经网络与LSTM等深度学习方法来构造轨道交通客流的短时预测模型。但是,目前的相关研究存在以下几个明显的不足:

(1)历史特征挖掘不充分

现有的针对轨道交通客流的预测模型中,往往使用同一天预测时刻之前的历史信息作为模型输入,没有充分的利用好轨道交通客流的周期性和规律性特征;尤其是在长时多步预测中,由于不同预测时刻对应的关联历史信息是不相同的,现有的研究只给定了初始的静态历史数据,并不能充分挖掘历史数据中的有用信息,导致误差累积严重,预测效果不尽如人意。

(2)短时预测的应用价值有限

现有的相关研究大多局限于轨道交通的短时客流预测,但是,短时客流预测一方面不足以给地铁运营管理部门提供足够的准备时间,另一方面短时客流预测不足以给出行者提供足够的出行规划参考,因此,数小时级别的长时客流预测具有更大的实际应用价值。

(3)现有的时空特征预测模型复杂度高

现有的基于图注意力等机制的深度学习模型,往往需要大量时间对模型进行训练,所消耗的计算资源大,由于没能充分利用历史数据中的有用信息,因此预测效果也难以得到明显提高。

因此,基于上述背景,针对城市轨道交通的长时客流预测问题,本发明提出了一种全新的模型和方法,实现了对城市轨道交通客流的准确长时预测。

发明内容

本发明基于上述背景问题,提出了一种基于遍历关联历史信息机制的轨道交通长时客流预测模型和方法。采用基于顺序的多步预测机制,通过在预测过程中动态更新不同预测时刻对应的关联历史特征,并基于多图卷积网络和多层叠加的门控扩展卷积网络来对不同预测时刻的地铁客流进行预测,实现了高精度的城市轨道交通客流长时预测。

本发明提供的技术方案为种基于遍历关联历史信息机制的轨道交通长时客流预测模型和方法,具体包括以下步骤:

S1:利用轨道交通网络的站点连接关系得到邻接矩阵,通过对邻接矩阵进行行归一化得到邻接图,然后使用动态时间归整DTW方法计算得到对应的相似图,由单位矩阵直接转换得到单位图,进一步通过图卷积运算构造GCN模块;

S2:通过将输入与GCN模块的输出进行连接,得到STFCN模块的输入数据;

S3:基于3个STFCN cell所构造的多层叠加门控卷积模块,实现对输入到STFCN模块中的时空特征进行捕捉,其中,STFCN cell-1中的卷积核大小随层数的增加递减,STFCNcell-2和STFCN cell-3中的卷积核大小为2,且固定不变;

S4:将STFCN模块运算得到的结果输出到全连接层FC中,经过非线性激活函数ReLU得到对应的预测输出值;

S5:将上一步的预测值与当前的输入H

进一步地,所述S1中,邻接图通过邻接矩阵进行行归一化得到;相似图取具有最高相似度的前几个数据进行行归一化得到,其他未取到的数据在相似图中置为0;单位图通过直接转换单位矩阵得到。

进一步地,所述S2中,输入H

其中,

进一步地,所述S3中,不同层对应的卷积核组合不同,使得客流的时空数据中的信息可以得到更加充分的融合和提取,其中STFCN cell-2和STFCN cell-3的卷积核大小保持不变,且都设定为2,使进行卷积运算时padding对结果的影响最小,同时保持输入输出的序列长度不变,STFCN cell-1的卷积核尺寸设定可按以下公式进行计算:

k

其中k

同时,在多层叠加的门控卷积运算中,使用了扩展因果卷积和门控运算,扩展因子为d

其中,

进一步地,所述S4中,STFCN模块的输出先是输入到FC模块中,再使用ReLU激活函数处理,使用ReLU放在最后的原因是客流数据都为正数,ReLU可以将小于0的数据进行筛除,上述对于模型的输出可以用下述公式表示:

其中,

进一步地,所述S5中,有如下历史信息需要更新:

(1)模型的输入的关联历史信息H

(2)将模型计算得到的

(3)

(4)以H

(5)在训练模型的过程中,上述(1)-(4)为一次迭代过程,在对所有数据进行计算后,将进行下一次迭代过程,在迭代过程中不断优化模型参数,最终使模型的预测效果达到一定的稳定状态后停止迭代,模型训练完后即可使用模型进行城市轨道交通客流的长时预测。

进一步地,历史客流数据的时间粒度为15分钟,即预测的时间范围是以15分钟为基本单位的,通过对每个15分钟的客流数据进行预测,多个15分钟累加,即可得到数小时级别的地铁客流长时预测结果。

进一步地,模型在训练过程中,使用Adam optimizer对模型参数进行优化。

相比现有技术,本发明的技术方案具有以下优点:

1、本发明提出了一种新的城市轨道交通长时客流预测框架,通过采用顺序遍历的机制来动态更新在多步预测过程中不同预测时刻对应的关联历史特征,从而充分利用了历史数据中的有用信息,有效地减小了误差的累计,实现了高精度的轨道交通长时客流预测。

2、本发明提出了一种新的预测模型,该模型可以充分融合所输入的历史数据,有效捕捉轨道交通客流的时空特征,从而得到准确的客流预测值。

3、本发明可以扩展到其他数据类型的长时预测中,具有可拓展性强、预测效果好的突出优点。

4、通过实验验证,所提出的模型和方法能够获得高精度的轨道交通长时预测客流,与现有模型相比,随着预测时间跨度的增加,所提出的网络的优越性更大。本发明对提高城市轨道交通的运营效率和管理水平十分有益,同时也能为建设智慧城市和智慧交通提供重要的数据支撑。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。

图1为本发明中的总体框架图。

图2为本发明的总体框架图的展开图。

图3为本发明的预测模型框架图。

图4示出根据本发明实施例的轨道交通长时客流预测系统的构成图。

图5示出了本发明一实施例所提供的一种电子设备的结构示意图。

图6示出了本发明一实施例所提供的一种存储介质的示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

本发明公开了一种轨道交通长时客流预测方法和系统,基于遍历关联历史信息机制,其基于城市轨道交通AFC大数据,利用先进的深度学习方法实现对轨道交通客流的高精度长时预测。具体为:基于多步预测中采用的迭代框架,通过动态地构建不同预测时刻的关联历史特征来动态学习和充分挖掘有价值的历史信息,以减小在长时预测过程中的误差累积,在此基础上提出了一个动态相关特征学习网络,通过整合多图卷积网络和叠加的因果卷积网络来动态捕捉轨道交通中客流的时空关联性,有效解决了现有的预测模型中预测精度随着预测时间范围的扩大而迅速恶化的问题。通过实验验证,本发明与现有模型相比,随着预测时间跨度的增加,所提出的网络的优越性更大。

参考图1-3所示,本发明提供了一种基于遍历关联历史信息机制的轨道交通长时客流预测模型和方法,具体实施步骤包括:

1、数据准备。对轨道交通网络的AFC(Auto Fare Collection)数据进行预处理,以S分钟为基本时间粒度,将轨道交通中不同站点的进出站客流以S分钟为基本单位进行数据的统计,得到每间隔S分钟所有站点的进出站客流数据;时间粒度S可以根据实际需要进行不同的设定,本实施例中S设定为15分钟。

2、模型搭建。

S1:利用轨道交通网络的站点连接关系得到邻接矩阵,通过对邻接矩阵进行行归一化得到邻接图;使用动态时间归整DTW(Dynamic Time Warping,动态时间归整)方法计算得到对应的相似图,相似图取具有最高相似度的前几个数据(本实施例中取相似度最高的5个站点)进行行归一化得到,其他未取到的数据在相似图中置为0;单位图通过直接转换单位矩阵得到。将上述三个图,通过图卷积运算构造GCN(Graph Convolution Network图卷积神经网络)模块;

S2:通过将输入与GCN模块的输出进行连接,输入H

其中,

S3:基于3个STFCN cell(神经元)所构造的多层叠加门控卷积模块,实现对输入到STFCN模块中的时空特征进行捕捉,不同层对应的卷积核组合不同,使得客流的时空数据中的信息可以得到更加充分的融合和提取,其中,STFCN cell-1中的卷积核大小随层数的增加递减,STFCN cell-2和STFCN cell-3中的卷积核大小为2,且固定不变,使进行卷积运算时padding对结果的影响最小,同时保持输入输出的序列长度不变;STFCN cell-1的卷积核尺寸设定可按以下公式进行计算:

k

其中k

同时,在多层叠加的门控卷积运算中,使用了扩展因果卷积和门控运算,扩展因子为d

其中,

S4:将STFCN模块运算得到的结果输出到全连接层FC中,经过非线性激活函数ReLU得到对应的预测输出值;

在步骤S4中,STFCN模块的输出先是输入到FC模块中,再使用ReLU激活函数处理,使用ReLU放在最后的原因是客流数据都为正数,ReLU可以将小于0的数据进行筛除,上述对于模型的输出可以用下述公式表示:

其中,

S5:将上一步的预测值与当前的输入H

(1)模型的输入的关联历史信息H

(2)将模型计算得到的

(3)

(4)以H

3、模型训练。

在训练模型的过程中,上述(1)-(4)为一次迭代过程,在对所有数据进行计算后,将进行下一次迭代过程,在迭代过程中不断优化模型参数,最终使模型的预测效果达到一定的稳定状态后停止迭代,模型训练完后即可使用模型进行城市轨道交通客流的长时预测。

本实施例中,我们采用了上海地铁数据集(Shanghai metro)和北京地铁数据集(Beijing metro)作为数据来源。首先,根据2中的模型搭建步骤搭建好预测模型。其次,根据模型的输入要求,将输入数据划分为对应的历史特征组合,并将数据划以一定比例分为训练集、验证集和测试集,本实施例中训练集、验证集和测试集的比例为7:1:2。之后,进行训练参数的设定,本实施例中,学习率lr设定为0.001,batch size设定为64。

模型在训练过程中,使用Adam optimizer对模型参数进行优化。

4、模型测试结果对比。

模型训练后,将对应的测试数据输入到模型中,即可得到对应的预测结果。为了说明本发明的有效性,本发明进行了一系列的实验验证,选取了在现阶段交通流预测领域广泛使用的基线模型与最先进的模型进行对照实验。包括:HA,MLP,GCN,GRU,LSTM,Bi-GRU,Bi-LSTM,ST-GCN,AGCRN,DCRNN,和MTGNN。选取三个常用的评价指标来对预测结果进行评价,分别为RMSE、MAE和WMAPE:

其中,n为测时点的数目,y

使用过去12个时间步的历史数据来预测将来的12个时间步(3小时)的客流,分别得到在上海地铁数据和北京地铁数据上的实验结果。本实施例使用的硬件平台为:IntelCore i7-12700F处理器,NVIDIA GeForce3060Ti;软件平台为:Windows10,Pytorch,Python。

表1:上海地铁数据实验结果

表2:北京地铁数据实验结果

可以看出,本发明所提出预测模型在上海地铁数据和北京地铁数据上都取得了非常大有优势,大大提高了轨道交通客流长时预测的准确性。

申请实施例提供了一种轨道交通长时客流预测系统,该系统用于执行上述实施例所述的轨道交通长时客流预测方法,如图4所示,该系统包括:

GCN构造单元401,利用轨道交通网络的站点连接关系得到邻接矩阵,通过对邻接矩阵进行行归一化得到邻接图,然后使用动态时间归整方法计算得到对应的相似图,由单位矩阵直接转换得到单位图,进一步通过图卷积运算构造GCN模块;

输入获取单元402,通过将输入与GCN模块的输出进行连接,得到STFCN模块的输入数据;

时空特征捕捉单元403,基于3个STFCN神经元所构造的多层叠加门控卷积模块,对输入到STFCN模块中的时空特征进行捕捉;

预测输出单元404,将STFCN模块运算得到的结果输出到全连接层中,经过非线性激活函数ReLU得到对应的预测输出值;

客流预测单元405,将所述预测输出值与当前的输入,加入新的历史信息后构造下一个预测时刻的输入,从而在不同预测时刻对输入数据进行更新,进而预测下一个时刻的客流。

本发明的上述实施例提供的轨道交通长时客流预测系统与本发明实施例提供的轨道交通长时客流预测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。

本发明实施方式还提供一种与前述实施方式所提供的轨道交通长时客流预测方法对应的电子设备,以执行上轨道交通长时客流预测方法。本发明实施例不做限定。

请参考图5,其示出了本发明的一些实施方式所提供的一种电子设备的示意图。如图5所示,所述电子设备20包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本发明前述任一实施方式所提供的轨道交通长时客流预测方法。

其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。

总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本发明实施例任一实施方式揭示的所述轨道交通长时客流预测方法可以应用于处理器200中,或者由处理器200实现。

处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。

本发明实施例提供的电子设备与本发明实施例提供的轨道交通长时客流预测方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。

本发明实施方式还提供一种与前述实施方式所提供的轨道交通长时客流预测方法对应的计算机可读存储介质,请参考图6,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的轨道交通长时客流预测方法。

需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。

本发明的上述实施例提供的计算机可读存储介质与本发明实施例提供的轨道交通长时客流预测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。

需要说明的是:

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备有固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的虚拟机的创建系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者系统程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干系统的单元权利要求中,这些系统中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

技术分类

06120116541789