基于时间校准和遗传算法的公交OD计算方法及系统

文献发布时间：2023-06-19 11:32:36

技术领域

本发明涉及智能交通领域，具体来说，涉及基于时间校准和遗传算法的公交OD计算方法及系统。

背景技术

公交OD用于描述乘客上站区域和下站区域相互关系，对于交通堵塞、公交调度排班具有重要指导意义。其中OD中的O为ORIGIN，意为出行的出发地点，D为DESTINATION，意为出行的目的地。通过实际调查，现行的关联GPS的乘客刷卡时间普遍存在时间偏移，没有经过时间校准，当前站点的乘客刷卡时间，由于时间偏移，被匹配到当前站点的上一站点或下一站点的情况屡屡发生。以往公交OD的计算上下站点时候，没有考虑用户在不同时段会具有不同的上下站区域聚类情况，使得公交OD的计算具有一定误差。以往公交OD的聚类计算，要么采用固定聚类参数，要么采用暴力穷举法遍历所有可能的聚类算法的相关参数，来求取聚类结果，这样大幅增加了聚类的时间，延长了整体的OD计算时间。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明提出基于时间校准和遗传算法的公交OD计算方法及系统，以克服现有相关技术所存在的上述技术问题。

为此，本发明采用的具体技术方案如下：

根据本发明的一个方面，提供了基于时间校准和遗传算法的公交OD计算方法，该方法包括以下步骤：

S1、校准刷卡数据的时间偏移：获取车辆的进出站时间及乘客的刷卡时间，并对同一公交线路上所有乘客的刷卡时间进行偏移校准；

S2、获取乘客的上站站点：依据经过时间校准后的刷卡时间数据及公交到站后的出站时间数据，计算位于公交到站后出站时间区间内的刷卡数据，得到相应的上站站点；

S3、获取乘客的下站站点：若同一乘客当天刷卡次数大于等于两次，则利用两次刷卡的时间数据及公交到站出站的时间数据计算得到两次的上站站点，并将当前上站站点与下一上站站点相距预设值范围内的最近下游站点作为下站站点；

S4、获取用户的出行喜好：将乘客预设时间内的上下站点按照不同时间段进行聚类，利用预设的聚类算法得到对应的上站及下站区域，对当前上站站点与下一上站站点之间的距离不在预设值范围内的乘客，则通过该乘客过去预设时间内的历史聚类区域站点来进行匹配得到对应的下站站点；

S5、输出公交OD矩阵：利用获取的所述上站站点及下站站点的信息构建OD矩阵。

进一步的，所述S1中对同一公交线路上所有乘客的刷卡时间进行偏移校准包括以下步骤：

以偏移范围为正负5分钟，每次偏移2秒，车辆进出站时间内的刷卡数据的多少为评价指标；

把落于车辆进出站时间区间内最多刷卡数据对应的时间偏移及对应的公交线路号记录到数据库中，得到用于校准每条公交线路刷卡数据的时间校准表；

利用所述校准表对同一公交线路上所有乘客的刷卡时间进行偏移校准。

进一步的，所述S2中对于不在公交到站后出站时间区间内的刷卡数据，则计算站点进出站区间中心与刷卡数据的距离，距离最近的站点即为上站站点。

进一步的，所述S4中将乘客预设时间内的上下站点按照不同时间段进行聚类，得到对应的上站及下站区域具体包括以下步骤：

将一天24小时中每三个小时作为一个时间区间；

分别对每个区间对应的上站站点及下站站点进行聚类，获取上站区域id、上站站点列表、下站区域id及下站站点列表；

计算每个区域的区域中心，分别得到上站区域中心点及下站区域中心点，即得到用户出行区域的喜好表。

进一步的，所述通过该乘客过去预设时间内的历史聚类区域站点来进行匹配得到对应的下站站点具体包括以下步骤：

根据乘客的id及刷卡时间利用所述喜好表匹配得到对应的时段，并依据上站站点匹配得到上站站点列表对应的上站区域id；

根据上站区域id得到对应的下站站点列表，若上站站点当前线路的下游列表中的站点在下站站点列表中，则从中选取最近的站点为下站站点；

若上站站点当前线路的下游列表中的站点不在下站站点列表中，则依次计算下游列表中每个站点与下站区域中心点的经纬度距离，并选取距离最近的站点为下游站点。

进一步的，所述聚类算法为DBSCAN聚类算法，且该算法的参数主要包括聚类半径参数及最小聚类点个数。

进一步的，所述聚类算法中采用遗传算法对聚类半径参数及最小聚类点个数进行调整，该调整方法包括以下步骤：

采用遗传算法编码方式对所述聚类半径参数及最小聚类点个数进行编码；

对编码后的所述聚类半径参数及最小聚类点个数进行选择操作；

进行交叉、变异操作，并通过相关的评价函数获取更优的聚类半径参数及最小聚类点个数。

进一步的，所述遗传算法编码方式包含但不限于二进制编码法、浮点编码法及符号编码法。

进一步的，所述选择操作包含但不限于轮盘赌选择、随机竞争选择、最佳保留选择及无回放随机选择。

根据本发明的另一个方面，提供了基于时间校准和遗传算法的公交OD计算系统，该系统包括时间偏移校准模块、基于时段的上下车区域聚类模块及用户出行区域喜好记录模块；

其中，所述时间偏移校准模块用于对刷卡时间进行偏移校准；

所述基于时段的上下车区域聚类模块用于根据用户不同的出行时段的上下车站点，进行聚类识别上下车区域；

所述用户出行区域喜好记录模块用于对用户出行时段内上下站点的记录本发明的有益效果为：

1)、本发明采用的时间偏移校准模块，可以对刷卡时间进行偏移校准，使得刷卡时间落于车辆进出站的时间区间内，从而有效地防止了匹配到不正确站点情况的发生。

2)、本发明的基于时段的上下车区域聚类模块，依据用户在一天当中不同时段可能会出现不同的上下站区域行程，获取不同时段的上下站区域进行聚类，能够更精确的描述乘客的行程轨迹，从而得到更精确地OD矩阵。

3)、本发明所述的基于遗传算法调参的DBSCAN聚类，对DBSCAN的聚类半径参数和最小聚类点个数这两个参数，采用遗传算法对其进行编码、选择、交叉、变异进行调整，根据相关评价指标获取最优的参数，相比穷举法遍历DBSCAN聚类这两个参数，采用遗传算法调参能更快的时间获取最优的聚类半径参数和最小聚类点个数参数，从而获取更精确的聚类效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的基于时间校准和遗传算法的公交OD计算方法的流程示意图；

图2是根据本发明实施例的基于时间校准和遗传算法的公交OD计算方法中时间校准的原理示意图；

图3是根据本发明实施例的基于时间校准和遗传算法的公交OD计算方法中遗传算法调参DBSCAN聚类参数的流程示意图。

具体实施方式

为进一步说明各实施例，本发明提供有附图，这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理，配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点，图中的组件并未按比例绘制，而类似的组件符号通常用来表示类似的组件。

根据本发明的实施例，提供了基于时间校准和遗传算法的公交OD计算方法及系统。

现结合附图和具体实施方式对本发明进一步说明，如图1-3所示，根据本发明的一个实施例，提供了基于时间校准和遗传算法的公交OD计算方法，该方法包括以下步骤：

S1、校准刷卡数据的时间偏移：获取车辆的进出站时间及乘客的刷卡时间，车辆进站时间即下区间表示为t

其中，所述S1中对同一公交线路上所有乘客的刷卡时间进行偏移校准包括以下步骤：

以偏移范围为正负5分钟，每次偏移2秒，车辆进出站时间内的刷卡数据的多少D(K)为评价指标，把落于车辆进出站时间区间内最多刷卡数据D(K)＝∑k对应的时间偏移t

具体的，以上逻辑的优化函数可以表示为：

max D(k)＝∑k

约束条件可以表示：

-5×60≤t

利用所述校准表对同一公交线路上所有乘客的刷卡时间进行偏移校准。

S2、获取乘客的上站站点：依据经过时间校准后的刷卡时间数据t

对于不在公交到站出站时间区间内的刷卡数据，其上站站点s

S3、获取乘客的下站站点：若同一乘客当天刷卡次数小于两次，则通过S4来预测下站站点s

S4、获取用户的出行喜好：将乘客30天内的上下站点按照不同时间段进行聚类，利用预设的聚类算法得到对应的上站及下站区域，对当前上站站点与下一上站站点之间的距离不在2000米范围内的乘客(对于在S3中，如果不能找到符合条件的下站站点)，则通过该乘客过去30天内的历史聚类区域站点来进行匹配得到对应的下站站点；

为了更精确记录乘客的上站、下站轨迹，将一天24小时，每3个小时内对应的上站、下站点的数据分别做一次上站区域和下站区域的聚类。之后的下站识别中，会根据乘客的上站的时段找到对应时段的上、下站聚类区域，来匹配出下站站点。

具体的，将一天24小时中每三个小时作为一个时间区间；

分别对每个区间对应的上站站点及下站站点进行聚类，获取上站区域id、上站站点列表、下站区域id及下站站点列表；

计算每个区域的区域中心，分别得到上站区域中心点及下站区域中心点，即得到用户出行区域的喜好表，如下表所示：

对于在S3中，如果不能找到符合条件的下站站点，则通过上表匹配，先根据乘客的id及刷卡时间利用所述喜好表匹配得到对应的时段，并依据上站站点匹配得到上站站点列表对应的上站区域id；

再根据上站区域id找到对应的下站站点列表，若上站站点当前线路的下游列表中的站点在下站站点列表中，则从中选取最近的站点为下站站点；

若上站站点当前线路的下游列表中的站点不在下站站点列表中，则依次计算下游列表中每个站点与下站区域中心点的经纬度距离，并选取距离最近的站点为下游站点。其中，经纬度距离的公式如下：

min f

＝R*arcos[cos(Ys

约束条件为：

其中，down_station_list为下游站点列表，R为地球半径6371km，函数f

具体的，所述聚类算法为DBSCAN聚类算法(Density-Based Spatial Clusteringof Applications with Noise，为具有噪声的基于密度的聚类方法)，且该算法的参数主要包括聚类半径参数及最小聚类点个数。需要调试不同的参数值，才能获取最优的聚类结果，本发明中采用遗传算法对DBSCAN聚类算法的这两个参数进行调整，该调整方法包括以下步骤：

先采用遗传算法编码方式对所述聚类半径参数及最小聚类点个数进行编码；所述遗传算法编码方式一般由二进制编码法、浮点编码法及符号编码法，本实施例中，编码方式采用二进制编码。

再对编码后的所述聚类半径参数及最小聚类点个数进行选择操作；所述选择操作一般包括轮盘赌选择、随机竞争选择、最佳保留选择及无回放随机选择，本实施例中，选的是轮盘赌选择。

然后再进行交叉、变异操作，并通过相关的评价函数获取更优的聚类半径参数及最小聚类点个数。评价函数，通过机器学习框架sklearn框架内置的两个参数：每一个聚出的类仅包含一个类别的程度度量参数homogeneity和每一个类别被指向相同聚出的类的程度度量参数completeness，然后通过下式得到：

v＝2*(homogeneity*completeness)/(homogeneity+completeness)。

S5、输出公交OD矩阵：利用获取的所述上站站点及下站站点的信息构建OD矩阵。

根据本发明的另一个实施例，提供基于时间校准和遗传算法的公交OD计算系统，该系统包括时间偏移校准模块、基于时段的上下车区域聚类模块及用户出行区域喜好记录模块；

其中，所述时间偏移校准模块用于对刷卡时间进行偏移校准，具体的，利用偏移范围为正负5分钟，每次偏移2秒，算出刷卡时间落于进出站时间间隔的最大比例，最大程度的防止当前站的刷卡数据由于时间偏移被匹配到当前站点的上一站点或下一站点情况的发生；

所述基于时段的上下车区域聚类模块用于根据用户不同的出行时段的上下车站点，进行聚类识别上下车区域，具体的，依据是用户在一天当中的不同时段，由于不同的行程，出现不同的上下车区域，上下车区域为数个相邻的上下车站点聚类形成，从而更精确的记录用户一天当中的出行轨迹，为后续精确地OD计算打下基础；

所述用户出行区域喜好记录模块用于对用户出行时段内上下站点的记录。

综上所述，借助于本发明的上述技术方案，本发明采用的时间偏移校准模块，可以对刷卡时间进行偏移校准，使得刷卡时间落于车辆进出站的时间区间内，从而有效地防止了匹配到不正确站点情况的发生。

此外，本发明的基于时段的上下车区域聚类模块，依据用户在一天当中不同时段可能会出现不同的上下站区域行程，获取不同时段的上下站区域进行聚类，能够更精确的描述乘客的行程轨迹，从而得到更精确地OD矩阵。

此外，本发明所述的基于遗传算法调参的DBSCAN聚类，对DBSCAN的聚类半径参数和最小聚类点个数这两个参数，采用遗传算法对其进行编码、选择、交叉、变异进行调整，根据相关评价指标获取最优的参数，相比穷举法遍历DBSCAN聚类这两个参数，采用遗传算法调参能更快的时间获取最优的聚类半径参数和最小聚类点个数参数，从而获取更精确的聚类效果。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：罗剑锋;李百成;宁煌;吴名朝;
专利申请人：浩鲸云计算科技股份有限公司;

上一篇：一种太空能热水控制及余热利用耦合系统
下一篇：一种基于显微拉曼光谱的油菜茎秆核盘菌侵染微观检测方法