一种多源交通数据换乘模式估测方法及计算机可读介质
文献发布时间:2024-04-18 19:57:31
技术领域
本发明属于地理信息科学领域,尤其涉及一种多源交通数据换乘模式估测方法及计算机可读介质。
背景技术
随着我国飞速发展,各一线二线大城市人口日益庞大,工种也日益多样,催生了大量种类丰富的、种间强差异、种内强相似的人群出行模式,其中有一种较少被特别研究、但客观大量存在的出行模式——需要长时间长距离通勤的出行模式,该出行模式下的人群往往需要辗转于各类公共交通工具之间,通勤出行十分耗时耗力。这样的需要换乘交通工具进行长时间长距离通勤的人群往往不在少数,而关于换乘行为的提取,国内外有少部分学者已做了关于换乘行为提取的模型研究。但是大部分模型在数据考量、阈值选取、规则构建、现实意义、结果表现上都或多或少有所欠缺。同时,大部分模型都忽略了大数据本身区别于其他数据的最基本特征——海量,大数据本身就有强烈的规律,而之前国内外的大部分模型大多使用人为预设条件和阈值来提取换乘行为,使得结果并不那么贴合现实,其算法思想迁移性也不强,不能被广泛应用。
因此,急需一种适用于所有的大数据,能够从数据本身中挖掘正确的阈值,能够在不同城市数据间迁移使用的、与人为预设没有关联的换乘行为识别算法。
发明内容
为了解决上述技术问题,本发明提出了一种多源交通数据换乘模式估测方法及计算机可读介质。
本发明方法的技术方案为一种多源交通数据换乘模式估测方法,包含以下步骤:
步骤1:获取多个公交站点的经度坐标、纬度坐标,根据每个公交站点的经度坐标、纬度坐标通过欧氏距离计算,得到任意两个公交站点之间的欧式距离,在每个公交站点与剩余多个公交站点的欧式距离中筛选得到每个公交站点的最小的两个欧式距离,通过所有公交站点的最小的两个欧式距离构建公交站点欧式距离序列,将公交站点欧式距离序列进行升序排序得到公交站点欧式距离升序序列,将公交站点欧式距离升序序列根据四分点位法计算公交站点九五分位的距离,以作为公交与公交换乘的距离阈值;
步骤2:获取多个地铁站点的经度坐标、纬度坐标和每个公交站点的经度、纬度坐标,根据每个地铁站点和每个公交站点的经度坐标、纬度坐标通过欧氏距离计算,得到任意两个地铁站点和公交站点之间的欧式距离,在每个地铁站点与所有公交站点的欧氏距离中筛选的到每个地铁站点的最小的两个欧氏距离,通过所有地铁站点的最小的两个欧式距离构建地铁站点邻近的公交站点欧氏距离序列,将地铁站点欧氏距离序列进行升序排序得到地铁站点欧氏距离升序序列,将地铁站点欧氏距离升序序列根据四分点位法计算地铁站点九五分位的距离,以作为地铁与公交换乘的距离阈值;
步骤3:获取多个公交站点的经度坐标、纬度坐标和每个地铁站点的经度、纬度坐标,根据每个公交站点和每个地铁站点的经度坐标、纬度坐标通过欧氏距离计算,得到任意两个公交站点和地铁站点之间的欧式距离,在每个公交站点与所有地铁站点的欧氏距离中筛选的到每个公交站点的最小的两个欧氏距离,并筛选小于距离阈值的欧氏距离构建公交站点临近地铁站点的欧氏距离序列,将公交站点欧氏距离序列进行升序排序得到公交站点欧氏距离升序序列,将公交站点欧氏距离升序序列根据四分点位法计算公交站点九五分位的距离,以作为公交与地铁换乘的距离阈值;
步骤4:获取某一天多个一卡通卡号的多条交易数据;
步骤5:计算每个一卡通卡号的当前交易数据的交易时间与下一条交易数据的交易时间的差值,根据当前交易数据的下车站点序号对应的经度坐标、维度坐标与下一条交易数据的上车站点序号对应的经度坐标、维度坐标计算每个一卡通卡号的当前交易数据的换乘点经纬度距离,构建每个一卡通卡号的每条交易数据的换乘类型;
步骤6:获取每个一卡通卡号的当前交易数据的换乘类型对应的距离阈值、每个一卡通卡号的当前交易数据的换乘点经纬度距离,根据距离阈值判断在每个一卡通卡号的多条交易数据中对当前交易数据、下一条交易数据进行筛选,构建每个一卡通卡号的换乘备选交易数据集合,并获取每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的交易时间的差值;
步骤7:结合所有一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的交易时间的差值依次计算短换乘时间阈值、中换乘时间下限、中换乘时间上限、长换乘时间阈值,通过阈值筛选分类得到每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的换乘模式;
作为优选,步骤4所述多个一卡通卡号的交易数据,定义如下:
Data
k∈[1,K],p∈[1,N
其中,Data_All
type
若type
若type
作为优选,步骤5所述计算每个一卡通卡号的当前交易数据的交易时间与下一条交易数据的交易时间的差值,具体如下:
t
k∈[1,K],p∈[1,N
其中,t
步骤5所述计算每个一卡通卡号的当前交易数据的换乘点经纬度距离,具体如下:
若type
若type
若type
若type
其中,type
将第k个一卡通卡号的第p条交易数据的下车站点的经度坐标、纬度坐标与第k个一卡通卡号的第p+1条交易数据的上车站点的经度坐标、纬度坐标通过欧式距离计算,得到第k个一卡通卡号的第p条交易数据的换乘点经纬度距离,定义为:S
步骤5所述每个一卡通卡号的每条交易数据的换乘类型,具体如下:
若type
若type
若type
若type
其中,TRANSFER_TYPE
作为优选,步骤6所述获取每个一卡通卡号的当前交易数据的换乘类型对应的距离阈值,具体如下:
若TRANSFER_TYPE
若TRANSFER_TYPE
若TRANSFER_TYPE
若TRANSFER_TYPE
步骤6所述根据距离阈值判断在每个一卡通卡号的多条交易数据中对当前交易数据、下一条交易数据进行筛选,具体如下:
当TRANSFER_TYPE
当TRANSFER_TYPE
当TRANSFER_TYPE
当TRANSFER_TYPE
步骤6所述每个一卡通卡号的换乘备选交易数据集合,具体定义如下:
k∈[1,K],j∈[1,M
其中,C
步骤6所述每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的交易时间的差值为:
作为优选,步骤7所述依次计算短换乘时间阈值、中换乘时间下限、中换乘时间上限、长换乘时间阈值,具体如下:
依次遍历C
其中,k∈[1,K],j∈[1,M
将交易时间差值序列进行升序排列,得到升序排列后交易时间差值序列;
设定交易时间差值下限、交易时间差值上限;
在交易时间差值下限与交易时间差值上限之间均匀等间隔划分为多个交易时间差值区间;
将升序排列后交易时间差值序列中每个升序排列后交易时间差值依次划分至对应的交易时间差值区间;
统计每个交易时间差值区间中升序排列后交易时间差值的数量,定义为F
其中,F
计算相邻交易时间差值区间之间的斜率,具体如下:
FA
n∈[1,L-1]
其中,FA
计算相邻交易时间差值区间之间的斜率的变化率,具体如下:
FB
n∈[2,L-1]
其中,FB
将FBn,n∈[2,L-1]按照从大到小进行降序排列,得到排序后相邻交易时间差值区间之间的斜率的变化率,定义为:
其中,
依次计算第m
从C
对
步骤7所述通过阈值判断分类得到每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的换乘模式,具体如下:
若
若
若
其中,T
本发明还提供了一种计算机可读介质,所述计算机可读介质存储电子设备执行的计算机程序,当所述计算机程序在电子设备上运行时,执行所述多源交通数据换乘模式估测方法的步骤。
本发明优点在于,可以自动地从交通大数据中提取换乘行为的距离和时间阈值,而后通过时间和距离双约束精准地提取并分类换乘行为,为后续对城市交通健康发展、城市活力研究等提供数据基础。
说明书附图
图1:本发明实施例的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。
本发明提供的方法可以在不同的数据中迁移使用,需要一定的人工判读。实例以北京市2015年4月1日星期三的数据为例对本发明的流程进行具体的阐述。
下面结合图1介绍本发明实施例的技术方案为一种多源交通数据换乘模式估测方法,具体如下:
如图1所示为本发明的方法流程图。
步骤1:获取多个公交站点的经度坐标、纬度坐标,根据每个公交站点的经度坐标、纬度坐标通过欧氏距离计算,得到任意两个公交站点之间的欧式距离,在每个公交站点与剩余多个公交站点的欧式距离中筛选得到每个公交站点的最小的两个欧式距离,通过所有公交站点的最小的两个欧式距离构建公交站点欧式距离序列,将公交站点欧式距离序列进行升序排序得到公交站点欧式距离升序序列,将公交站点欧式距离升序序列根据四分点位法计算公交站点九五分位的距离,以作为公交与公交换乘的距离阈值,T
步骤2:获取多个地铁站点的经度坐标、纬度坐标和每个公交站点的经度、纬度坐标,根据每个地铁站点和每个公交站点的经度坐标、纬度坐标通过欧氏距离计算,得到任意两个地铁站点和公交站点之间的欧式距离,在每个地铁站点与所有公交站点的欧氏距离中筛选的到每个地铁站点的最小的两个欧氏距离,通过所有地铁站点的最小的两个欧式距离构建地铁站点邻近的公交站点欧氏距离序列,将地铁站点欧氏距离序列进行升序排序得到地铁站点欧氏距离升序序列,将地铁站点欧氏距离升序序列根据四分点位法计算地铁站点九五分位的距离,以作为地铁与公交换乘的距离阈值,T
步骤3:获取多个公交站点的经度坐标、纬度坐标和每个地铁站点的经度、纬度坐标,根据每个公交站点和每个地铁站点的经度坐标、纬度坐标通过欧氏距离计算,得到任意两个公交站点和地铁站点之间的欧式距离,在每个公交站点与所有地铁站点的欧氏距离中筛选的到每个公交站点的最小的两个欧氏距离,并筛选小于距离阈值的欧氏距离构建公交站点临近地铁站点的欧氏距离序列,将公交站点欧氏距离序列进行升序排序得到公交站点欧氏距离升序序列,将公交站点欧氏距离升序序列根据四分点位法计算公交站点九五分位的距离,以作为公交与地铁换乘的距离阈值T
步骤4:获取某一天多个一卡通卡号的多条交易数据;
步骤4所述多个一卡通卡号的交易数据,定义如下:
Data
k∈[1,K],p∈[1,N
其中,Data_All
type
若type
若type
步骤5:计算每个一卡通卡号的当前交易数据的交易时间与下一条交易数据的交易时间的差值,根据当前交易数据的下车站点序号对应的经度坐标、维度坐标与下一条交易数据的上车站点序号对应的经度坐标、维度坐标计算每个一卡通卡号的当前交易数据的换乘点经纬度距离,构建每个一卡通卡号的每条交易数据的换乘类型;
步骤5所述计算每个一卡通卡号的当前交易数据的交易时间与下一条交易数据的交易时间的差值,具体如下:
t
k∈[1,K],p∈[1,N
其中,t
步骤5所述计算每个一卡通卡号的当前交易数据的换乘点经纬度距离,具体如下:
若type
若type
若type
若type
其中,type
将第k个一卡通卡号的第p条交易数据的下车站点的经度坐标、纬度坐标与第k个一卡通卡号的第p+1条交易数据的上车站点的经度坐标、纬度坐标通过欧式距离计算,得到第k个一卡通卡号的第p条交易数据的换乘点经纬度距离,定义为:S
步骤5所述每个一卡通卡号的每条交易数据的换乘类型,具体如下:
若type
若type
若type
若type
其中,TRANSFER_TYPE
步骤6:获取每个一卡通卡号的当前交易数据的换乘类型对应的距离阈值、每个一卡通卡号的当前交易数据的换乘点经纬度距离,根据距离阈值判断在每个一卡通卡号的多条交易数据中对当前交易数据、下一条交易数据进行筛选,构建每个一卡通卡号的换乘备选交易数据集合,并获取每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的交易时间的差值;
步骤6所述获取每个一卡通卡号的当前交易数据的换乘类型对应的距离阈值,具体如下:
若TRANSFER_TYPE
若TRANSFER_TYPE
若TRANSFER_TYPE
若TRANSFER_TYPE
步骤6所述根据距离阈值判断在每个一卡通卡号的多条交易数据中对当前交易数据、下一条交易数据进行筛选,具体如下:
当TRANSFER_TYPE
当TRANSFER_TYPE
当TRANSFER_TYPE
当TRANSFER_TYPE
步骤6所述每个一卡通卡号的换乘备选交易数据集合,具体定义如下:
k∈[1,K],j∈[1,M
其中,C
步骤6所述每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的交易时间的差值为:
步骤7:结合所有一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的交易时间的差值依次计算短换乘时间阈值、中换乘时间下限、中换乘时间上限、长换乘时间阈值,通过阈值筛选分类得到每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的换乘模式;
步骤7所述依次计算短换乘时间阈值、中换乘时间下限、中换乘时间上限、长换乘时间阈值,具体如下:
依次遍历C
其中,k∈[1,K],j∈[1,M
将交易时间差值序列进行升序排列,得到升序排列后交易时间差值序列;
设定交易时间差值下限为0、交易时间差值上限为1440;
在交易时间差值下限与交易时间差值上限之间均匀等间隔划分为多个交易时间差值区间,实例中划分为300份,即L=300;
将升序排列后交易时间差值序列中每个升序排列后交易时间差值依次划分至对应的交易时间差值区间;
统计每个交易时间差值区间中升序排列后交易时间差值的数量,定义为F
其中,F
计算相邻交易时间差值区间之间的斜率,具体如下:
FA
n∈[1,L-1]
其中,FA
计算相邻交易时间差值区间之间的斜率的变化率,具体如下:
FB
n∈[2,L-1]
其中,FB
将FB
其中,
依次计算第m
从C
对
步骤7所述通过阈值判断分类得到每个一卡通卡号的换乘备选交易数据集合中每条换乘备选交易数据的换乘模式,具体如下:
若
若
若
其中,T
本发明的具体实施例还提供了一种计算机可读介质。
所述计算机可读介质为服务器工作站;
所述服务器工作站存储电子设备执行的计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行本发明实施例的多源交通数据换乘模式估测方法的步骤。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
- 一种可回滚档案采集数据的导入方法、计算机装置及计算机可读存储介质
- 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
- 一种加密数据共享方法、服务器及计算机可读存储介质
- 一种数据采集系统定位方法、装置和计算机可读存储介质
- 一种元数据存储方法及计算机可读存储介质
- 一种基于交通OD数据的城市居民群体换乘模式发现系统及方法
- 一种基于交通OD数据的城市居民群体换乘模式发现系统及方法