基于出行链解析的多层次轨道交通换乘客流提取方法
文献发布时间:2023-06-19 19:30:30
技术领域
本发明属于多层次轨道交通建设运营技术领域,具体涉及基于出行链解析的多层次轨道交通换乘客流提取方法。
背景技术
换乘客流特征提取是进行多层次轨道交通网络布局、换乘枢纽设计及多种运输方式衔接组织方案制定的基础数据,通常包括换乘客流总量、分方式换乘客流量、高峰小时换乘客流量等,目前主要以传统的人工调查法和交通设备采集法为主。
传统人工调查方法获取数据信息一般采用人工观测计数统计或抽样旅客出行问卷调查;交通设备采集技术一般需要在主要观测点进行施工建设,架设装备设施,如感应线圈、视频检测器等。既有方法对人力、物力、财力消耗较大,成本要求很高、调查周期时间长,覆盖率较低,采集能力有限,因此很难大规模应用。
近年来,随着信息化技术的快速发展,手机作为一种携带便捷的通讯设备已经在国民之中快速普及。通过手机终端产生的信令数据和基站位置即可定位使用者的当前位置,还原个体在时间维度、空间纬度上的出行链路信息,这些海量数据为乘客出行链解析和换乘客流提取提供了新的技术手段。相较于传统的换乘客流提取方法,手机信令数据具有覆盖范围广、数据稳定可靠、样本量大、成本低的优势,如何在海量手机信令数据中快速、有效提取乘客出行链,进而确定枢纽站的换乘客流对多层次轨道交通衔接优化具有重要意义。
因此,有必要基于手机信令数据结构,在手机信令数据采集、清洗基础上解析乘客出行链,进而设计换乘客流总量、分方式换乘客流量、高峰小时换乘客流量等多层次轨道交通换乘客流特征提取技术方法。
发明内容
为了弥补现有技术的不足,本发明提供基于出行链解析的多层次轨道交通换乘客流提取方法,通过采集研究范围内的旅客手机信令数据,在数据清洗的基础上解析乘客出行链,进而设计换乘客流总量、分方式换乘客流量、高峰小时换乘客流量等多层次轨道交通换乘客流特征提取技术,从而低成本、快速、广覆盖、多样化获取多层次轨道交通换乘客流特征。
为了实现上述目的,本发明所采用的技术方案为:
基于出行链解析的多层次轨道交通换乘客流提取方法,其特征在于:包括如下步骤:
步骤一:数据提取与清洗
根据多层次轨道交通网络布局选择沿线范围基站,采集研究区域内相关时段旅客的手机信令数据;在此基础上,对手机信令数据进行预处理,包括多层次轨道交通网络基站数据库构建和手机信令数据清洗;
步骤二:出行链解析及检验
基于手机信令数据识别旅客出行链,包括进站识别、途径线路识别、换乘识别、出站识别4个步骤;在此基础上,根据空间和时间有效性标准检验生成的出行链是否有效;
步骤三,换乘客流提取:
在识别旅客完整出行链后,提取多层次轨道交通换乘客流特征。
进一步,所述步骤一具体包括:
步骤1:根据出行链解析需求特点,需要采集研究范围内的手机信令数据,如表1所示;
表1手机信令数据收集表
步骤2:手机信令数据清洗,包括无效冗余数据过滤、乒乓切换异常数据的处理、漂移数据的清洗;
步骤3:多层次轨道交通基站数据库构建
基于GIS确定轨道交通沿线经纬度,并以轨道交通沿线1公里半径为范围筛选轨道交通沿线的信号基站,建立多层次轨道交通基站数据库,数据库需要的字段信息如表2所示;
表2多层次轨道交通基站数据库字段信息
其中,L表示该基站的LAC编号;C表示该基站的CellD编号;Line表示该基站所在的线路;Station表示该基站所在的车站;Type表示该基站所属的轨道交通类型,干线铁路用T表示,城际铁路用C表示,市域铁路用B表示,城市轨道交通用S表示。
进一步,所述步骤二出行链解析及检验具体包括:
步骤1:手机信令数据时间排序
根据EMSI依次提取某出行者的出行记录P,依据Times信息将单个用户一天信令数据按时间先后的顺序进行排序P
步骤2:建立出行链数据记录文件,用于记录出行者完整的出行信息,步骤记录格式如表3所示;
表3出行链信息记录表
其中,Time记录此出行行为的开始时间;Position记录所处的位置,用基站数据库中的Line或者Station填充;Behavior记录旅客的行为,旅客进站Behavior=Enter,旅客乘车Behavior=Riding,旅客换乘Behavior=Transfer,旅客出站Behavior=Arrival,填充内容的确定根据步骤3-6确定;
步骤3:进站识别
排序后的信令数据进行迭代分析判断,当首次出现信令P
步骤4,途径线路识别
依次搜索P
步骤5:换乘识别
依次搜索P
步骤6:离站识别
依次搜索P
步骤7:有效性检验
多层次轨道交通网络的出行路径有效性的检验包括两个内容:一是空间有效性检验,指一次轨道交通出行路径完整性检验;二是时间有效性检验,指一次轨道交通出行过程耗费的时间不超过规定阈值。
进一步,所述步骤三换乘客流提取具体包括:
步骤1:换乘客流量
一定时期某轨道交通枢纽的换乘客流量可根据出行链信息记录文件中Behavior=Transfer确定,车站在t到t+Δt的换乘客流量为K
其中,λ
步骤2:分方式换乘客流量
分方式换乘客流量统计来不不同方式的换乘客流量,可根据收集的手机信令数据的Position和Behavior确定,车站i在t到t+Δt的来自某线路Line
步骤3:高峰小时换乘客流量
高峰小时换乘客流量是统计换乘站点在高峰小时的换乘客流数量,
本发明的有益效果:
本发明利用手机信令数据具有样本量大、空间覆盖范围广、实时动态性强的特点,采集手机与基站交互的定位数据和多层次轨道交通网络沿线基站信息,在数据清洗的基础上,精确识别手机用户的出行链,从而为多层次轨道交通换乘客流提取提供多维度、多时段的研究数据,与传统方法相比,其成本低廉、操作方便、获取快速,可实施性高,完全可以满足多层次轨道交通换乘客流研究精度要求。
附图说明
图1是本发明多层次轨道交通换乘客流提取技术流程图;
图2是旅客出行链解析技术路线图;
图3是西安北站分方向换乘客流量;
图4是西安北站分小时换乘客流量。
具体实施方式
下面结合具体实施方式对本发明进行详细的说明。
本发明的基于出行链解析的多层次轨道交通换乘客流提取方法主要包括手机信令数据提取与清洗、出行链解析、换乘客流提取三个步骤,如图1所示。
数据提取与清洗:根据多层次轨道交通网络布局选择沿线范围基站,采集研究区域内相关时段旅客的手机信令数据;在此基础上,对手机信令数据进行预处理,主要包括多层次轨道交通网络基站数据库构建和手机信令数据清洗。
数据清洗:即基于信令数据识别旅客出行链,包括进站识别、途径线路识别、换乘识别、出站识别等4个步骤;在此基础上,根据空间和时间有效性标准检验生成的出行链是否有效。
客流特征提取:在识别旅客完整出行链后,提取多层次轨道交通换乘客流特征,包括车站换乘客流总量、分方式换乘客流量、高峰小时换乘客流量等。
本发明包括如下步骤:
步骤一:数据提取与清洗,具体包括:
1)数据采集
根据轨道交通网络采集收集信令数据和轨道交通沿线的基站信息,信息采集内容如表1所示:
表1数据采集
2)手机信令数据清洗,包括无效冗余数据过滤、乒乓切换异常数据的处理、漂移数据的清洗;
无效冗余数据过滤:手机信令数据更新频率较高,触发事件类型丰富,导致用户处于静止状态或者不构成出行的小范围活动状态时,会产生多条位于同一基站处的信令数据,需要将此类数据精简为到达和离开两条数据;
乒乓切换异常数据的处理:手机会和周边信号场最强的基站建立联系,不同基站信号强度可能会出现瞬时的摇摆,使得手机信号短时间内在基站之间发生切换现象,对此类数据进行合并处理;
漂移数据的清洗:所谓的漂移数据是指手机信号突然切换到较远的基站并在一定时间又切换回来的数据,通过计算相邻基站之间的距离以及切换速度来判断漂移数据,并对此类数据进行剔除;
3)多层次轨道交通基站数据库(Database,DB)构建
基于GIS确定轨道交通沿线经纬度,并以轨道交通沿线1公里半径为范围筛选轨道交通沿线的信号基站,建立多层次轨道交通基站数据库;按照轨道交通分类层次,分别构建干线铁路、城际铁路、市域铁路、城市轨道交通数据库;数据库需要的字段信息如表2所示;
表2多层次轨道交通基站数据库字段信息
其中,L表示该基站的LAC编号;C表示该基站的CellD编号;Line表示该基站所在的线路;Station表示该基站所在的车站;Type表示该基站所属的轨道交通类型,干线铁路用T表示,城际铁路用C表示,市域铁路用B表示,城市轨道交通用S表示;
步骤二:出行链解析及检验
基于手机信令数据识别旅客出行链,包括进站识别、途径线路识别、换乘识别、出站识别4个步骤;在此基础上,根据空间和时间有效性标准检验生成的出行链是否有效;如图2所示,具体包括:
1)手机信令数据时间排序
根据EMSI依次提取某出行者的出行记录P,依据Times信息将单个用户一天信令数据按时间先后的顺序进行排序P
2)建立出行链数据记录文件,用于记录出行者完整的出行信息,主要包括EMSI,Time,Position,Behavior等字段,步骤记录格式如表3所示;步骤1中提取的EMSI信息记录于相应字段,其他字段信息填充转入步骤3-6。
表3出行链信息记录表
其中,Time记录此出行行为的开始时间;Position记录所处的位置,用基站数据库中的Line或者Station填充;Behavior记录旅客的行为,旅客进站Behavior=Enter,旅客乘车Behavior=Riding,旅客换乘Behavior=Transfer,旅客出站Behavior=Arrival,填充内容的确定根据步骤3-6确定;
3)进站识别
排序后的信令数据进行迭代分析判断,当首次出现信令P
4)途径线路识别
依次搜索P
5)换乘识别
依次搜索P
6)离站识别
依次搜索P
7)有效性检验
多层次轨道交通网络的出行路径有效性的检验包括两个内容:一是空间有效性检验,指一次轨道交通出行路径完整性检验;二是时间有效性检验,指一次轨道交通出行过程耗费的时间不超过规定阈值。
步骤三,换乘客流提取:
在识别旅客完整出行链后,提取多层次轨道交通换乘客流特征,包括车站换乘客流总量、分方式换乘客流量、高峰小时换乘客流量等;具体包括:
1)换乘客流量
一定时期某轨道交通枢纽的换乘客流量可根据出行链信息记录文件中Behavior=Transfer确定,车站在t到t+Δt的换乘客流量为K
其中,λ
2)分方式换乘客流量
分方式换乘客流量统计来不不同方式的换乘客流量,可根据收集的手机信令数据的Position和Behavior确定,车站i在t到t+Δt的来自某线路Line
其中,
3)高峰小时换乘客流量
高峰小时换乘客流量是统计换乘站点在高峰小时的换乘客流数量,
下面以西安北站进行实例分析
步骤一:数据提取及清洗
本案例信令数据采集运营商为中国联通,采集时间跨度为2019年2月4日零时至2月10日24时,包含整个春节假期,信令采集基站覆盖范围为西安北站候车厅,采集数据共177466条数据,部分数据及字段如表4所示。
表4手机信令数据示例表
经过数据清洗后剩余157461条数据,表5节选自清洗后的信令数据;
表5用户EMSI“1563”信令数据节选
步骤二:出行链解析
提取某用户的所有信令信息,按照依次按照“进站识别”、“途径线路识别”、“换乘识别”、“出站识别”确定乘客的出行链,表6展示了某EMSI为“1457”的出行链识别信息。
表6用户EMSI为“1457”的出行链信息
/>
步骤三:换乘客流提取
通过筛选包含某特定车站为换乘车站为的出行链信息,提取其换乘客流总量,分交通方式和时段统计换乘客流量,确定关键换乘方式和高峰小时。图3是西安北站分换乘方向的换乘客流量,图4是西安北站分小时换乘客流量。
本发明的内容不限于实施例所列举,本领域普通技术人员通过阅读本发明说明书而对本发明技术方案采取的任何等效的变换,均为本发明的权利要求所涵盖。
- 基于乘客出行信息的轨道交通客流预测方法和系统
- 基于乘客出行信息的轨道交通客流预测方法和系统