掌桥专利:专业的专利平台
掌桥专利
首页

出行链获取方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 13:46:35


出行链获取方法、装置、电子设备及存储介质

技术领域

本发明涉及大数据技术领域,尤其涉及一种出行链获取方法、装置、电子设备及存储介质。

背景技术

近年来,在大数据背景下,通过对数据的分析识别个体出行链的研究应用越来越多,如基于手机信令数据、公共交通IC卡数据、浮动车数据等出行链识别方法,由于这些数据记录了详细的出行时间和位置信息,为进行出行起讫点识别、出行轨迹识别等提供了基础条件。

当前有关个体出行链识别的研究中,样本量不足导致出行链获取精度低,或者采用单纯的对不同交通方式的出行链进行叠加,导致出行链获取精度低。

发明内容

本发明实施例提供的一种出行链获取方法、装置、电子设备及存储介质,解决了现有技术中出行链的获取方式,导致出行链获取精度低的问题。

第一方面,本发明实施例提供了一种出行链获取方法,包括:

获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;

从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;

根据所述历史出行信息,确定所述目标出行信息对应的出行链。

可选的,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息,包括:

根据所述目标出行信息确定路段信息;

从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息。

可选的,所述根据所述目标出行信息确定路段信息,包括:

基于所述行程起点信息和行程终点信息,确定至少一个中间换乘点信息;

根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息。

可选的,所述从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息,包括:

根据所述历史信息中获取与所述行程起点信息、行程终点信息和行程时长匹配值大于或等于预设阈值的历史出行信息。

可选的,所述根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息之后,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息之前包括:

根据所述路段信息获取多种出行方式;

基于所述多种出行方式进行关联性分析生成预设出行链。

可选的,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息包括:

根据所述预设出行链与历史信息中的历史出行链进行关联性分析获取平均关联性概率;

根据预设关联性概率对所述平均关联性概率进行筛选,保留符合所述预设关联性概率的所述平均关联性概率;

获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息。

第二方面,本发明实施例还提供了一种出行链获取装置,包括:

获取模块,用于获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;

匹配模块,用于从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;

确定模块,用于根据所述历史出行信息,确定所述目标出行信息对应的出行链。

可选的,所述匹配模块包括:

第一匹配子模块,用于根据所述目标出行信息确定路段信息;

第二匹配子模块,用于从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息。

第三方面,本发明实施例还提供了一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上述任一项所述的出行链获取方法的步骤。

第四方面,本发明实施例还提供了一种计算机可读存储介质,所述可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现如上述任一项所述的出行链获取方法的步骤。

本发明实施例提供一种出行链获取方法、装置、电子设备及存储介质,包括:获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;根据所述历史出行信息,确定所述目标出行信息对应的出行链。本发明实施例提供的一种出行链获取方法,通过将用户的目标出行信息进行获取,与历史信息进行对比分析,从而准确确定出用户的出行链,实现了获取提高出行链获取精度的效果。

附图说明

图1为本发明实施例提供的一种出行链获取方法的方法流程图;

图2为本发明实施例提供的一种出行链获取装置的结构示意图;

图3为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。

下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的一种出行链获取方法进行详细地说明。

图1为本发明实施例提供的一种出行链获取方法的方法流程图,本实施例提供的一种出行链获取方法包括:

步骤101、获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息。

在本实施例中,出行链是指个人为完成一项或多项活动而在空间阐述位移,同时也可以表示为一定时间顺序的连接方式。结合出行链的传统定义,公共交通出行链是指出行者利用公共交通工具从出行起点到终点的过程,可以通过使用换乘点将一次完整的公共交通出行划分为多个出行阶段,每一出行阶段代表出行者使用一次公共交通工具。通过对公交出行链的识别,可以对乘客的通勤出行需求规律进行分析,通勤出行需求可以反映人们的出行特征和方式,是交通规划和运营管理的重要依据,是城市公交线网优化以及公交运营调度的基础;而路段的交通状况也是决定公交车运输速度及公交运营调度的重要指标,因此对出行需求规律和道路交通状况进行分析有助于提升早晚高峰通勤的服务水平。

本实施例中的目标出行信息包括用户出行的行程起点信息和行程终点信息,具体地,该行程起点信息和行程终点信息可以通过处理统计各类交通方式产生的出行数据获取,其中,多源交通出行数据包括但不限于:地面公交刷卡数据、轨道交通刷卡数据、公租自行车刷卡数据、地面公交线路和站点数据、轨道交通线路和站点数据、公租自行车位置数据等等。基于公共交通出行链的定义及分类,提出在不同出行模式下提取公共交通出行链的算法。该算法以公交IC卡刷卡数据、地铁刷卡数据、公租自行车刷卡数据,通过对不同出行模式下出行链的特点进行分析,判断公交与公交、公交与地铁、地铁与地铁、公交与自行车、地铁与自行车换乘的时空条件,并确定换乘阈值,本方法取30min为换乘阈值。

示例性的,基于出行链进行出行特征分析指标的提取和计算,包括乘客换乘特征分析。对于公交站点和线路数据的预处理,是通过静态表之间字段的联系进行数据匹配,从而将两个表之间的数据汇总为一个包含线路编号、站号、站名和站点经纬度的综合性地面公交基础数据表。以此为基础,在进行出行链提取时,根据时空判别条件确定公交与公交、公交和地铁、公交和自行车、地铁和自行车之间的换乘。

步骤102、从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息。

在本实施例中,历史信息为历史数据库中存储过的历史数据,该历史数据包括了步骤101中的多源交通出行数据,如地面公交刷卡数据、轨道交通刷卡数据、公租自行车刷卡数据、地面公交线路和站点数据、轨道交通线路和站点数据、公租自行车位置数据等等,通过对历史数据进行关联性分析计算,计算出相关性概率后,选择匹配值大于或等于预设阈值的历史出行信息作为强关联数据。

步骤103、根据所述历史出行信息,确定所述目标出行信息对应的出行链。

在本实施例中,根据步骤102中获取到的历史出行信息,通过连接各强关联ID,建立完整的用户ID关联关系,再逆向推导出相关用户出行信息从而建立完整出行链。示例性的,根据出行链提取算法,利用公交IC卡刷卡数据、地铁刷卡数据、公租自行车刷卡数据完成了不同时段不同出行模式的出行链提取,完成了288969313条出行链数据的提取,并分析了公交乘客的换乘特征。根据对出行链提取结果的统计分析,出行链出行方式类别包括无换乘出行、1次换乘、2次换乘、3次换乘,以及3次以上换乘出行。换乘方式包括地面公交—地面公交、地面公交—地铁、自行车—地面公交、自行车—地铁、自行车—地面公交—地铁等方式。

本发明实施例提供的一种出行链获取方法,包括:获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;根据所述历史出行信息,确定所述目标出行信息对应的出行链。本发明实施例提供的一种出行链获取方法,通过将用户的目标出行信息进行获取,与历史信息进行对比分析,从而准确确定出用户的出行链,实现了获取提高出行链获取精度的效果。

可选的,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息,包括:

根据所述目标出行信息确定路段信息;

从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息。

在本实施例中,目标出行信息包括用户出行的行程起点信息和行程终点信息,从而根据行程起点信息和行程终点信息可以获取到行程的各路段信息,示例性的,例如用于从A点出发前往B点,而A点和B点之间包括了C和D的换乘站,因此用户可以通过A-C-B或者通过A-D-B两种方式完成出行,因此A-C、C-B、A-D和D-B均为路段信息,在本实施例中以A点和B点为例进行说明,实际情况中可以存在更多种情况,需要根据实际情况进行分析。

可选的,所述根据所述目标出行信息确定路段信息,包括:

基于所述行程起点信息和行程终点信息,确定至少一个中间换乘点信息;

根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息。

在本实施例中,根据行程起点信息和行程终点信息确定路网区域内换乘枢纽地块k的位置,并得到换乘枢纽集合C,k∈C。该换乘枢纽地块k代表了中间换乘点信息,通过中间换乘点信息可以确定中间的路段信息。

可选的,所述从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息,包括:

根据所述历史信息中获取与所述行程起点信息、行程终点信息和行程时长匹配值大于或等于预设阈值的历史出行信息。

在本实施例中,通过历史信息中获取与所述行程起点信息、行程终点信息可以获取到行程时长,该行程时长为行程重点时刻减去行程起点信息获得,通过行程时间、行程起点信息和行程终点信息合并进行存储,继承原始数据中的ID与起终点位置信息与时间信息,从而可以对应生成出行表,该出行表包括了:交通方式、ID、行程开始时间、行程结束时间、起点坐标和终点坐标。

可选的,所述根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息之后,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息之前包括:

根据所述路段信息获取多种出行方式;

基于所述多种出行方式进行关联性分析生成预设出行链。

可选的,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息包括:

根据所述预设出行链与历史信息中的历史出行链进行关联性分析获取平均关联性概率;

根据预设关联性概率对所述平均关联性概率进行筛选,保留符合所述预设关联性概率的所述平均关联性概率;

获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息。

在本实施例中,通过路段信息可以获取到用户出行的多种出行方式,包括但不限于地面公交—地面公交、地面公交—地铁、自行车—地面公交、自行车—地铁、自行车—地面公交—地铁等等。具体地,在之前生成的出行表基础上将所有信息汇总形成交通方式ID与地理时空信息数据。将数据矩阵化,通过ID_n代表统计得到的每个交通方式产生的ID编号,每一行都记录了该ID编号出行链起终点的地理栅格编号与出行开始与结束的时间。将IC卡终点矩阵数据与其他交通方式的起点矩阵数据进行关联分析,通过卡方检验,剔除完全无关联的IC卡ID。

具体地,获取得到各ID关联性概率矩阵后继续进行处理,首先提取出关联性较强的IC卡ID和相关交通方式ID放置于强关联ID数据库中。然后删除关联概率为0的ID数据并保留剩余数据矩阵。对剩余的部分矩阵数据再次进行关联分析,在关联计算分析中,选取周二、周三、周四的正常天气历史出行数据按照进行相关性概率计算,并分别将关联性较强的ID数据存放到ID数据库中。计算基于多天历史数据的平均关联性概率,将置信度达到80%以上的强关联ID确定为关联关系。对公交、地铁、共享单车、出租车的历史出行数据重复进行以上动作,直到全部ID分析完毕。通过连接各强关联ID,建立完整的用户ID关联关系,再逆向推导出相关用户出行信息从而建立完整出行链。基于已知数据调整时间间隔、栅格阈值的取值,并综合考虑算力进行关联性分析,将不同交通方式的ID进行关联,得到OneID个体出行链。将手机信令数据与网约车、共享单车订单数据、公交车和地铁IC卡等多源数据融合,通过对多源数据进行时空关联分析,形成唯一ID,由oneID反向连接各数据源出行数据,从而获得全样、更加精准的个体出行链。

本实施例的方法基于多源数据时空融合计算的OneID个体出行链的识别方法,是一种集约可靠的获取各交通方式出行链及全量出行OD的信息采集方式,可在较短时间面向城市大范围推广应用。

本发明实施例提供的一种出行链获取方法,包括:获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;根据所述历史出行信息,确定所述目标出行信息对应的出行链。本发明实施例提供的一种出行链获取方法,通过将用户的目标出行信息进行获取,与历史信息进行对比分析,从而准确确定出用户的出行链,实现了获取提高出行链获取精度的效果。

参阅图2,图2为本发明实施例提供的一种出行链获取装置的结构示意图,本实施例提供的一种出行链获取装置200包括:

获取模块210,用于获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;

匹配模块220,用于从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;

确定模块230,用于根据所述历史出行信息,确定所述目标出行信息对应的出行链。

可选的,所述匹配模块220包括:

第一匹配子模块,用于根据所述目标出行信息确定路段信息;

第二匹配子模块,用于从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息。

可选的,第一匹配子模块包括:

第一匹配单元,用于基于所述行程起点信息和行程终点信息,确定至少一个中间换乘点信息;

第二匹配单元,用于根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息。

可选的,第二匹配子模块包括:

第三匹配单元,用于所述从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息,包括:

第四匹配单元,用于根据所述历史信息中获取与所述行程起点信息、行程终点信息和行程时长匹配值大于或等于预设阈值的历史出行信息。

可选的,还包括:

出行获取模块,用于根据所述路段信息获取多种出行方式;

出行生成模块,用于基于所述多种出行方式进行关联性分析生成预设出行链。

可选的,匹配模块220还包括:

第一分析子模块,用于根据所述预设出行链与历史信息中的历史出行链进行关联性分析获取平均关联性概率;

第二分析子模块,用于根据预设关联性概率对所述平均关联性概率进行筛选,保留符合所述预设关联性概率的所述平均关联性概率;

第三分析子模块,用于获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息。

本申请实施例提供的出行链的获取装置包括:获取模块,用于获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;匹配模块,用于从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;确定模块,用于根据所述历史出行信息,确定所述目标出行信息对应的出行链。本发明实施例提供的一种出行链获取方法,通过将用户的目标出行信息进行获取,与历史信息进行对比分析,从而准确确定出用户的出行链,实现了获取提高出行链获取精度的效果。

图3为本发明实施例提供的一种电子设备的结构示意图,如图3所示,该电子设备300包括存储器310、处理器320,电子设备300中处理器320的数量可以是一个或多个,图3中以一个处理器320为例;服务器中的存储器310、处理器320可以通过总线或其他方式连接,图3中以通过总线连接为例。

存储器310作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的出行链获取方法对应的程序指令/模块,处理器320通过运行存储在存储器310中的软件程序、指令以及模块,从而执行服务器/终端/服务器的各种功能应用以及数据处理,即实现上述的出行链获取方法。

其中,处理器320用于运行存储在存储器310中的计算机程序,实现如下步骤:

获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;

从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;

根据所述历史出行信息,确定所述目标出行信息对应的出行链。

可选的,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息,包括:

根据所述目标出行信息确定路段信息;

从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息。

可选的,所述根据所述目标出行信息确定路段信息,包括:

基于所述行程起点信息和行程终点信息,确定至少一个中间换乘点信息;

根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息。

可选的,所述从历史信息中获取与所述路段信息匹配值大于或等于预设阈值的历史出行信息,包括:

根据所述历史信息中获取与所述行程起点信息、行程终点信息和行程时长匹配值大于或等于预设阈值的历史出行信息。

可选的,所述根据所述行程起点信息、行程终点信息和至少一个中间换乘点信息,获得所述路段信息之后,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息之前包括:

根据所述路段信息获取多种出行方式;

基于所述多种出行方式进行关联性分析生成预设出行链。

可选的,所述从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息包括:

根据所述预设出行链与历史信息中的历史出行链进行关联性分析获取平均关联性概率;

根据预设关联性概率对所述平均关联性概率进行筛选,保留符合所述预设关联性概率的所述平均关联性概率;

获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息。

本申请实施例提供的电子设备用于执行以下方法,该方法包括:获取目标出行信息,所述目标出行信息包括行程起点信息和行程终点信息;从历史信息中获取与所述目标出行信息匹配值大于或等于预设阈值的历史出行信息;根据所述历史出行信息,确定所述目标出行信息对应的出行链。本发明实施例提供的一种出行链获取方法,通过将用户的目标出行信息进行获取,与历史信息进行对比分析,从而准确确定出用户的出行链,实现了获取提高出行链获取精度的效果。

本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现图1所述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络:包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

相关技术
  • 出行链获取方法、装置、电子设备及存储介质
  • 基于联盟链的数据获取方法、电子设备及计算机存储介质
技术分类

06120113807701