掌桥专利:专业的专利平台
掌桥专利
首页

一种基于数据驱动的轨道交通新线接入客流预测方法

文献发布时间:2023-06-19 11:44:10


一种基于数据驱动的轨道交通新线接入客流预测方法

技术领域

本申请涉及道路交通技术领域,特别是涉及一种基于数据驱动的轨道交通新线接入客流预测方法。

背景技术

城市轨道交通建设成本髙,建设周期长,一个城市难以一次性建成大规模的轨道交通网,因此各个城市发展轨道交通都伴随着路网逐渐扩大的过程。每当新线(新线指的是新开通的轨道交通线)接入线网投入运营后,新线接入会改变原有城市轨道交通线网的拓扑结构,同时站点密度的增加使出行者存在邻近站点的多样选择,从而影响出行者的出行选择行为,客流在线网上的分布也随之发生改变。为了更好地掌握线网客流规律、制定合理的轨道服务运营计划、提高线网运作效率以及为轨道交通需求管理措施制定提供数据支持,预测新线接入后的客流必不可少。

新线由于缺少本线的历史数据,不能通过历史同期数据进行规律分析预测。现阶段针对预测新线接入的客流通常采用基于出行的四阶段预测模型方法,该方法按照交通生成预测、交通分布预测、交通方式划分预测和交通分配四个阶段来分析城市现状和未来的交通状况,是目前交通规划领域运用最广的方法。然而,该方法存在调查成本大、预测精度低的问题。

发明内容

基于此,有必要针对上述技术问题,提供一种能够解决调查成本大、预测精度低的问题的基于数据驱动的轨道交通新线接入客流预测方法。

一种基于数据驱动的轨道交通新线接入客流预测方法,所述方法包括:

获取目标轨道站点的轨道交通站点特性数据和轨道交通站点客流数据;

对所述轨道交通站点特性数据进行量化处理,获得所述目标轨道站点的站点特性量化指标;

对所述轨道交通站点客流数据进行统计分析,获得所述目标轨道站点的站点客流特征指标;

以所述站点特性量化指标为自变量集合,以所述站点客流特征指标为因变量集合,构建客流总量预测模型和客流波动形态预测模型;

采用回归分析的方法对所述客流总量预测模型和所述客流波动形态预测模型进行参数标定,确定预测模型标定的参数;

所述客流总量预测模型和所述客流波动形态预测模型根据所述预测模型标定的参数进行预测,获得所述目标轨道站点的客流总量和波动形态。

在其中一个实施例中,所述对所述轨道交通站点特性数据进行量化处理,获得所述目标轨道站点的站点特性量化指标的步骤,包括:

根据所述轨道交通站点特性数据中的土地利用相关数据进行量化,获得所述目标轨道站点的吸引范围活力度指标;

根据所述轨道交通站点特性数据中的站点接续设计相关数据进行量化,获得所述目标轨道站点的公交换乘指标、共享单车换乘指标和机动车停放点指标;

根据所述轨道交通站点特性数据中的站点可达性相关数据进行量化,获得所述目标轨道站点的站间可达性指标和站域可达性指标;

其中,所述吸引范围活力度指标、所述公交换乘指标、所述共享单车换乘指标、所述机动车停放点指标、所述站间可达性指标和所述站域可达性指标构成所述站点特性量化指标。

在其中一个实施例中,所述根据所述轨道交通站点特性数据中的土地利用相关数据进行量化的公式为:

其中,目标轨道站点影响范围内共k类POI,P

在其中一个实施例中,所述根据所述轨道交通站点特性数据中的站点可达性相关数据进行量化,获得站间可达性指标和站域可达性指标的步骤,包括:

从所述轨道交通站点特性数据中的站点可达性相关数据中,获取轨道交通线网图和街道网络;

通过对所述轨道交通线网图进行凸空间分割,将轨道交通线网图转化为以所述目标轨道站点为核心的站点拓扑图;

基于所述站点拓扑图进行空间形态分析,获得所述目标轨道站点的集成度和选择度;

将所述集成度和所述选择度进行加权平均,获得所述目标轨道站点的站间可达性指标;

基于轴线分割方法将所述街道网络抽象为轴线构成的空间系统;

基于空间系统的轴线关系,计算与所述目标轨道站点直接相连的街道的全局集成度平均值,以及所述目标轨道站点站域所有街道600米半径的局部集成度平均值,获得全局集成度平均值与局部集成度平均值;

将所述全局集成度平均值与所述局部集成度平均值进行加权平均,获得所述目标轨道站点的站域可达性的指标。

在其中一个实施例中,所述对所述轨道交通站点客流数据进行统计分析,获得所述目标轨道站点的站点客流特征指标的步骤,包括:

对所述轨道交通站点客流数据进行数据清洗和数据变换,获得轨道站点时间序列数据;

根据所述轨道站点时间序列数据进行统计分析,获得所述目标轨道站点的结构特征数据和形态特征数据;

所述结构特征数据和所述形态特征数据作为站点客流特征指标。

在其中一个实施例中,所述以所述站点特性量化指标为自变量集合,以所述站点客流特征指标为因变量集合,构建客流总量预测模型和客流波动形态预测模型的步骤,包括:

以所述站点特性量化指标为自变量集合,以所述站点客流特征指标为因变量集合,分析因变量集合和自变量集合之间的相关性,获得相关性分析结果;

根据所述相关性分析结果,构建客流基本预测模型、客流总量趋势变化模型和客流波动形态预测模型;

对所述客流基本预测模型和所述客流总量趋势变化模型进行融合,获得客流总量预测模型。

在其中一个实施例中,所述客流基本预测模型为:

其中,h

在其中一个实施例中,所述客流总量趋势变化模型为:

其中,

在其中一个实施例中,所述客流总量预测模型为:

其中,Q

在其中一个实施例中,所述客流波动形态预测模型为:

DV

其中,DV

上述基于数据驱动的轨道交通新线接入客流预测方法,通过获取目标轨道站点的轨道交通站点特性数据和轨道交通站点客流数据;对轨道交通站点特性数据进行量化处理,获得目标轨道站点的站点特性量化指标;对轨道交通站点客流数据进行统计分析,获得目标轨道站点的站点客流特征指标;以站点特性量化指标为自变量集合,以站点客流特征指标为因变量集合,构建客流总量预测模型和客流波动形态预测模型;采用回归分析的方法对客流总量预测模型和客流波动形态预测模型进行参数标定,确定预测模型标定的参数;客流总量预测模型和客流波动形态预测模型根据预测模型标定的参数进行预测,获得目标轨道站点的客流总量和波动形态,无需进行繁琐的数据调研,可操作性更强,而且站点客流总量与波动形态是基于既有站点的历史数据,根据轨道交通客流规律的影响因素预测出来的,具有更强的理论依据和较高的精度,解决了调查成本大、预测精度低的问题。

附图说明

图1为一个实施例中基于数据驱动的轨道交通新线接入客流预测方法的流程示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种基于数据驱动的轨道交通新线接入客流预测方法,包括以下步骤:

步骤S220,获取目标轨道站点的轨道交通站点特性数据和轨道交通站点客流数据。

其中,目标轨道站点是被预测的轨道交通站点。轨道交通站点特性数据包括土地利用相关数据、站点接续设计相关数据和站点可达性相关数据等。土地利用相关数据包括轨道交通站点影响范围内各类POI的数量等数据;站点接续设计相关数据包括轨道交通站点影响范围内公交站点数量、轨道交通站点影响范围内共享单车停放点数量、轨道交通站点影响范围内的机动车停车场数量和轨道交通站点影响范围内机动车停车场距离出站口的最近距离等数据;站点可达性相关数据包括轨道交通线网图、街道网络等数据。轨道交通站点客流数据是目标轨道站点的轨道客流刷卡数据。

步骤S240,对轨道交通站点特性数据进行量化处理,获得目标轨道站点的站点特性量化指标。

其中,站点特性量化指标来自于目标轨道站点周边土地利用、站点接续设计及站点可达性,包括目标轨道站点的吸引范围活力度指标P、公交换乘指标T

在一个实施例中,对轨道交通站点特性数据进行量化处理,获得目标轨道站点的站点特性量化指标的步骤,包括:

根据轨道交通站点特性数据中的土地利用相关数据进行量化,获得目标轨道站点的吸引范围活力度指标;根据轨道交通站点特性数据中的站点接续设计相关数据进行量化,获得目标轨道站点的公交换乘指标、共享单车换乘指标和机动车停放点指标;根据轨道交通站点特性数据中的站点可达性相关数据进行量化,获得目标轨道站点的站间可达性指标和站域可达性指标;其中,目标轨道站点的吸引范围活力度指标、公交换乘指标、共享单车换乘指标、机动车停放点指标、站间可达性指标和站域可达性指标构成站点特性量化指标。

其中,针对目标轨道站点的周边土地利用,选取目标轨道站点影响范围内各类POI的数量作为目标轨道站点的吸引范围活力度指标。具体地,目标轨道站点的吸引范围活力度指标根据目标轨道站点周边较大范围内的POI信息确定,可以结合地图导航服务供应商提供的API开放平台,获取以各类POI数据(类型、经纬度)为目标的数据,如通过数据爬取对目标轨道站点的周边较大范围内的POI信息进行收集,并在后期的数据预处理中对非站点影响范围内的POI数据进行筛选、去除。

针对目标轨道站点的接续设计,选取公交换乘指标、共享单车换乘指标和机动车停放点指标以表征目标轨道站点的接续设计对站点客流的影响。公交换乘指标是基于目标轨道站点影响范围内公交站点数量确定,公交换乘指标表示为T

在一个实施例中,根据轨道交通站点特性数据中的土地利用相关数据进行量化的公式为:

其中,目标轨道站点影响范围内共k类POI,P

在一个实施例中,根据轨道交通站点特性数据中的站点可达性相关数据进行量化,获得目标轨道站点的站间可达性指标和站域可达性指标的步骤,包括:从轨道交通站点特性数据中的站点可达性相关数据中,获取轨道交通线网图和街道网络;通过对轨道交通线网图进行凸空间分割,将轨道交通线网图转化为以目标轨道站点为核心的站点拓扑图;基于站点拓扑图进行空间形态分析,获得目标轨道站点的集成度和选择度;将集成度和选择度进行加权平均,获得目标轨道站点的站间可达性指标;基于轴线分割方法将街道网络抽象为轴线构成的空间系统;基于空间系统的轴线关系,计算与目标轨道站点直接相连的街道的全局集成度平均值,以及站域所有街道600米半径的局部集成度平均值,获得全局集成度平均值与局部集成度平均值;将全局集成度平均值与局部集成度平均值进行加权平均,作为度量目标轨道站点的站域可达性的指标。

其中,针对站点可达性,选取站间可达性指标与站域可达性指标对目标轨道站点的可达性进行综合表征。站间可达性指标首先获取轨道交通线网图,将轨道交通线网图中的各轨道交通站点视作凸空间,轨道交通站点间的线路区间抽象为凸空间之间的连接关系,对轨道交通线网图进行凸空间分割,凸空间分割完成后,将轨道交通线网图转化为以目标轨道站点为核心的站点拓扑图,用圆圈代表站点,用短线代表线路区间,然后根据站点拓扑图进行空间形态分析,获得空间形态变量,空间形态变量包括集成度I和选择度C。

集成度:对目标轨道站点在整体轨道线网中通往其他轨道交通站点的最短拓扑步数加总取反,并剔除线网规模干扰和对称性干扰,得到目标轨道站点的集成度,目标轨道站点的集成度表示为I

其中,n是轨道交通线网站点总个数,L

选择度:在轨道交通线网中排除目标轨道站点的前提下,依次选取剩余的各轨道交通站点作为起点,记为O

式中,C

将集成度和选择度进行加权平均,作为度量目标轨道站点的站间可达性的指标。

站域可达性:首先基于轴线分割方法,将街道网络抽象为由这些轴线构成的空间系统,即:用最少且最长的轴线覆盖整个街道网络,形成由轴线构成的空间系统,其中每条轴线相当于一个节点;其次,计算与目标轨道站点直接相连的街道的全局集成度平均值。计算公式如下:

其中,I

再次,计算目标轨道站点站域所有街道600米半径的局部集成度平均值。计算公式如下:

其中,I

最后,以与目标轨道站点直接相连街道的全局集成度平均值和目标轨道站点站域所有街道600米半径的局部集成度平均值进行加权平均,作为度量目标轨道站点的站域可达性的指标。

步骤S260,对轨道交通站点客流数据进行统计分析,获得目标轨道站点的站点客流特征指标。

在一个实施例中,对轨道交通站点客流数据进行统计分析,获得目标轨道站点的站点客流特征指标的步骤,包括:对轨道交通站点客流数据进行数据清洗和数据变换,获得轨道站点时间序列数据;根据轨道站点时间序列数据进行统计分析,获得目标轨道站点的结构特征数据和形态特征数据;结构特征数据和形态特征数据作为目标轨道站点的站点客流特征指标。

其中,对轨道交通站点客流数据进行数据清洗和数据变换的数据,具体地:对于轨道交通站点客流数据中的包含的其他数据记录,可结合其数据内容增加相应的字段,或者直接从刷卡数据中进行删除,结合轨道客流刷卡数据特性,对轨道交通站点客流数据进行数据清洗,获得清洗后的轨道交通站点客流数据。数据清洗主要包括去除缺省值和矛盾值两类,具体的清洗规则为:去除进站时间、进站站点ID、出站时间、出站站点ED四个字段中存在缺省值的数据记录;核实进出站时间,对站间停留时间高于4小时(这个时间,可参考各地区地铁最高停留时间限制修改)或少于2分钟(即地铁最短一站行驶时间,该时间可参考各地区地铁最短一站行驶时间修改)的数据进行去除,以排除恶意逃票、乞讨等非正常乘车停留行为。对清洗后的轨道交通站点客流数据进行数据变换,获得轨道站点时间序列数据,数据变换是对不同时间段的时间进行标识,并创建客流统计点,在此基础上以小时为单位生成各站点客流时间序列数据表,该以小时为单位生成各站点客流时间序列数据表中的数据即为轨道站点时间序列数据。

针对轨道交通站点刷卡数据进行数据挖掘,即通过统计分析,获得目标轨道站点客流的结构特征数据和形态特征数据。

如表1所示,结构特征数据包括站点时均客流量均值、小时客流方差、站点全日客流波动偏度和站点全日客流峰度等,其中,站点时均客流量对站点全日客流总量进行描述;小时客流方差对站点全日各小时客流均衡度进行描述;站点全日客流波动偏度对站点全口客流分布的对称性进行描述;站点全日客流峰度对站点全日客流分布的陡缓程度进行描述;形态特征数据包括客流峰值数与峰谷突变值等。其中,客流峰值数描述了站点全日客流高峰数量,峰谷突变值描述了站点全日客流峰谷变化是否可导。

表1.目标轨道站点的站点客流特征指标

对目标轨道站点的全日客流总量进行统计,计算全日单个工作时内的目标轨道站点的客流量得到目标轨道站点的站点时均客流量,目标轨道站点的站点时均客流量表示为

其中,Q

计算目标轨道站点的小时客流方差衡量目标轨道站点全日各小时客流分布情况:

其中,σ

计算目标轨道站点的全日客流波动偏度对目标轨道站点的全日客流分布的对称性进行描述:

其中,σ是站点小时客流标准差,S为目标轨道站点的全日客流波动偏度。

计算目标轨道站点的全日客流峰度对目标轨道站点的全日客流时间序列取值分布的陡缓程度进行描述:

其中,K为目标轨道站点的全日客流峰度,σ是站点小时客流标准差。

对目标轨道站点的客流峰值数F及峰谷突变值B进行统计衡量目标轨道站点的客流波动形态:以时间为横坐标(单位为小时)、小时进出站客流量为纵坐标,绘制目标轨道站点的小时进出站客流分布形态曲线,从中统计客流峰值数及峰谷突变值。

步骤S280,以站点特性量化指标为自变量集合,以站点客流特征指标为因变量集合,构建客流总量预测模型和客流波动形态预测模型。

在一个实施例中,以站点特性量化指标为自变量集合,以站点客流特征指标为因变量集合,构建客流总量预测模型和客流波动形态预测模型的步骤,包括:

以站点特性量化指标为自变量集合,以站点客流特征指标为因变量集合,分析因变量集合和自变量集合之间的相关性,获得相关性分析结果;根据相关性分析结果,构建客流基本预测模型、客流总量趋势变化模型和客流波动形态预测模型;对客流基本预测模型和客流总量趋势变化模型进行融合,获得客流总量预测模型。

其中,结构特征数据与形态特征数据作为因变量集合DV,其中,DV

根据因变量集合DV和自变量集合IV进行自变量相关性分析,自变量相关性分析包括两部分,即:分析站点特性量化指标(自变量IV集合)与站点客流基本总量(h

构建的客流基本预测模型为:

其中,h

考虑到由于城市人口的增长导致的轨道客流总量的增长,设置城市五年的GDP平均增长率作为平均增长系数,客流总量趋势变化模型如下:

其中,

综合考虑客流基本预测模型和客流总量趋势变化模型,得到最终的客流总量预测模型:

其中,Q

构建客流波动形态预测模型为:

DV

其中,DV

步骤S300,采用回归分析的方法对客流总量预测模型和客流波动形态预测模型进行参数标定,确定预测模型标定的参数。

其中,采用回归分析的方法对对客流总量预测模型和客流波动形态预测模型进行相应的参数标定,其中,用于训练的自变量集合为对应于历史客流数据的既有轨道线网的站点特性量化指标。用于训练的因变量集合为既有轨道线网历史数据对应的站点客流特征。具体包括两部分内容:对自变量集合IV与因变量DV

步骤S320,客流总量预测模型和客流波动形态预测模型根据预测模型标定的参数进行预测,获得目标轨道站点的客流总量和波动形态。

其中,预测集自变量为新线投入运营后的站点特性量化指标。用于预测的因变量集合为新线投入运营后的目标轨道站点的客流总量以及客流波动形态。

上述基于数据驱动的轨道交通新线接入客流预测方法,通过获取目标轨道站点的轨道交通站点特性数据和轨道交通站点客流数据;对轨道交通站点特性数据进行量化处理,获得目标轨道站点的站点特性量化指标;对轨道交通站点客流数据进行统计分析,获得目标轨道站点的站点客流特征指标;以站点特性量化指标为自变量集合,以站点客流特征指标为因变量集合,构建客流总量预测模型和客流波动形态预测模型;采用回归分析的方法对客流总量预测模型和客流波动形态预测模型进行参数标定,确定预测模型标定的参数;客流总量预测模型和客流波动形态预测模型根据预测模型标定的参数进行预测,获得目标轨道站点的客流总量和波动形态,无需进行繁琐的数据调研,可操作性更强,而且站点客流总量与波动形态是基于既有站点的历史数据,根据轨道交通客流规律的影响因素预测出来的,具有更强的理论依据和较高的精度。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 一种基于数据驱动的轨道交通新线接入客流预测方法
  • 一种成网条件下城市轨道交通新线接入客流预测方法
技术分类

06120113033666