一种基于手机信令数据的旅游景点游客出行活动识别方法

文献发布时间：2023-06-19 11:44:10

技术领域

本发明涉及城市规划管理技术领域，尤其是涉及一种基于手机信令数据的旅游景点游客出行活动识别方法。

背景技术

如何方便居民的出行是城市交通规划的重要使命，及时掌握城市居民出行方式及其发展变化不仅可以及时了解城市当前交通结构状态同时对于日后涉及城市规划、交通管理等方面的发展也有着重要的参考价值。

传统居民出行方式数据获取的方法大多是基于调查问卷以及电话问询等，此类方法成本高、效率低、样本量小并且由于出行的隐私性导致的心理顾虑所以可信度不高。随着信息化时代的到来以及智能终端的普及，利用手机构建用户轨迹进而判别用户出行方式逐渐成为一种重要手段，利用手机中的相关传感器是最直接、精度最高的一种方法。

部分学者利用手机中的GPS或加速度计等模块提取定位数据，计算平均速度、加速度、速度中值等特征参数利用支持向量机、神经网络等机器学习算法和模糊推理等算法识别出行方式。但由于密闭空间的干扰以及需实时开启GPS模块，该方法无法对大规模人群长期的出行方式进行有效识别。

发明内容

针对现有技术存在的不足，本发明的目的是提供一种基于手机信令数据的旅游景点游客出行活动识别方法，其能够识别出到过特定旅游景区的手机用户，得到该用户完整的出行信息(出行起讫点，出行时间，出行方式)和活动信息(住宿、餐饮、游玩、其他)，提高基于手机信令的出行方式判断的准确度，采用手机信令数据同时结合导航数据的识别方法，将居民出行轨迹数据与导航数据聚类来进行轨迹相关性的分析，并且同时分析两类数据的时间关联性进而对居民出行方式进行更准确的判别。

本发明的上述发明目的是通过以下技术方案得以实现的：

一种基于手机信令数据的旅游景点游客出行活动识别方法，包括以下步骤：

S1，对特定旅游景区的游客进行识别，包括是否到过景区，并去除经常在景区出现的用户以及工作人员；

S2，通过用户在城市的出现特征判断游客的类型，分为本地游客与外地游客；

S3，通过有效出行段识别与出行方式识别对区域、信令特征、轨迹特征进行判断,从而识别出所述外地游客到达城市的方式，包括火车、飞机、大巴、自驾以及轮船；

S4，对游客的出行链进行划分；

S5，结合地块属性、驻留时间特征对游客的驻点活动信息进行识别。

本发明在一较佳示例中可以进一步配置为：在步骤S3中的所述有效出行段识别中，首先需要识别驻留区域，进而提取信令数据中的有效出行段；

在进行驻留区域识别之后根据结果分别将每两个驻留区域之间信令数据作为一次有效出行产生的信令数据，然后利用DBSCAN聚类算法结合导航数据，对一次出行的出行方式进行识别。

本发明在一较佳示例中可以进一步配置为：所述有效出行段包含本次出行的开始位置、开始时间、结束位置、结束时间和中间轨迹点信息。

本发明在一较佳示例中可以进一步配置为：所述驻留区域的识别包括以下步骤：

a、设定驻留范围距离阀值Smax与驻留范围最短时间阈值Tmin；

b、将第一条信令放入比较序列seq中，若第二条信令的位置与第一条信令的位置在设定的距离阀值Smax之内，将第二条信令也放入比较序列seq中,按照信令发生时间顺序将余下信令与seq中的每个信令依次进行判断；

若某条信令的位置与seq中任意一条信令的位置距离超过Smax,中断此次判断；

c、计算seq中最后一条信令与第一条信令的时间差，如果时间差值大于设定的最短时间阈值Tmin，则认为seq中信令位置区域为驻留区域，同样根据时间比例计算这些位置的驻留核心点坐标，用核心点坐标代表驻留区域；

如果时间差值小于设定的最短时间阀值Tmin，则这些信令位置区域不是驻留区域，释放seq中的信令数据，继续判断剩下的信令。

本发明在一较佳示例中可以进一步配置为：在步骤S3中，所述出行方式识别的方法包括基于DBSCAN算法的轨迹匹配方法与基于轨迹匹配度集合与时间关联的识别方法。

综上所述，本发明包括以下至少一种有益技术效果：

1.其能够识别出到过特定旅游景区的手机用户，得到该用户完整的出行信息(出行起讫点，出行时间，出行方式)和活动信息(住宿、餐饮、游玩、其他)，提高基于手机信令的出行方式判断的准确度，采用手机信令数据同时结合导航数据的识别方法，将居民出行轨迹数据与导航数据聚类来进行轨迹相关性的分析，并且同时分析两类数据的时间关联性进而对居民出行方式进行更准确的判别。

2.通过利用导航API请求不同出行方式的道路轨迹点数据，然后与信令中位置数据融合进行聚类分析，统计含有导航轨迹聚类簇中信令数据的个数，将其与全部信令数据的比值作为轨迹匹配度，根据设定的轨迹匹配度阈值，记录符合阈值的出行方式集合以及请求的导航线路信息，包括线路坐标数据、线路距离以及花费时间等，同时结合实际出行时间与导航线路时间，计算每条导航线路与实际出行的时间匹配度，从轨迹匹配度与时间匹配度两方面综合进行出行方式的识别。

附图说明

图1为本发明展示DBSCAN算法的轨迹匹配方法流程图。

图2为本发明展示基于轨迹匹配度集合与时间关联的出行方式识别流程图。

图3为本发明展示公交导航API获取的轨迹位置数据与用户A驻留点位置数据的空间分布图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

本发明公开的一种基于手机信令数据的旅游景点游客出行活动识别方法，包括以下步骤：

S1，对特定旅游景区的游客进行识别，包括是否到过景区，并去除经常在景区出现的用户以及工作人员；

S2，通过用户在城市的出现特征判断游客的类型，分为本地游客与外地游客；

S4，对游客的出行链进行划分；

S5，结合地块属性、驻留时间特征对游客的驻点活动信息进行识别。

在步骤S3中的所述有效出行段识别中，首先需要识别驻留区域，进而提取信令数据中的有效出行段；

本发明在一较佳示例中可以进一步配置为：所述有效出行段包含本次出行的开始位置、开始时间、结束位置、结束时间和中间轨迹点信息。

其中，所述驻留区域的识别包括以下步骤：

a、设定驻留范围距离阀值Smax与驻留范围最短时间阈值Tmin；

若某条信令的位置与seq中任意一条信令的位置距离超过Smax,中断此次判断；

c、计算seq中最后一条信令与第一条信令的时间差，如果时间差值大于设定的最短时间阈值Tmin，则认为seq中信令位置区域为驻留区域，同样根据时间比例计算这些位置的驻留核心点坐标，用核心点坐标代表驻留区域；如果时间差值小于设定的最短时间阀值Tmin，则这些信令位置区域不是驻留区域，释放seq中的信令数据，继续判断剩下的信令。

在步骤S3中，所述出行方式识别的方法包括基于DBSCAN算法的轨迹匹配方法与基于轨迹匹配度集合与时间关联的识别方法。

参照图1,所述基于DBSCAN算法的轨迹匹配方法包括以下步骤：

a)获取用户的某个有效出行段的信令数据集合signal

b)使用导航API请求从signal

假设获得的导航路线信息数据集合为NR＝{nr

c)将用户信令数据集合signal

统计子簇集合C

d)对导航路线信息数据集合NR中每个导航线路重复步骤c)，直到所有线路被分析完毕，得到各导航线路与此用户有效出行段的轨迹匹配度集合Rtra＝{Rtra

其中，参照图2，所述基于轨迹匹配度集合与时间关联的识别方法包括以下步骤：

a)对于轨迹匹配度集合Rtra中某个轨迹匹配比值R

b)对轨迹匹配度集合Rtra中的每条轨迹重复步骤a)，计算每条轨迹的时间匹配度Rtm

c)结合轨迹匹配度集合Rtra与时间匹配度集合Rtm，根据集合属性设定相应的权值K，利用公式计算出每种导航API请求的出行方式是实际出行方式的概率集合P＝{P

d)选取集合P中最大概率值P

为了对本发明的特征及其它相关特征作进一步详细说明，以便于同行业技术人员的理解，以下举例说明。

【步骤1】游客驻留区域识别，获得有效出行段：

选取河北石家庄一个小时的手机信令数据，数据主要包括：用户编号(msid)，信令发生时间(timestmap)，所在基站编号(lac_cell)，经度(lon)，纬度(lat)；

取一个用户(‘460013452211288’，下文以“用户A”表述)的信令数据作为分析样例，展开算法实施说明。

A.按照信令发生时间对用户A的信令进行排序，形成信令序列。

B.设定驻留范围距离阀值Smax为1000m与驻留范围最短时间阈值Tmin为180s。

C.将第一条信令放入比较序列seq中，若第二条信令的位置与第一条信令的位置在设定的距离阀值Smax之内，将第二条信令也放入比较序列seq中,按照信令发生时间顺序将余下信令与seq中的每个信令依次进行判断；若某条信令的位置与seq中任意一条信令的位置距离超过Smax,中断此次判断；用户A的第一次中断判断发生在第3条信令处，即前2条信令形成第一个停留区域序列seq1，以此进行其余停留区域的判断，得到全部的序列seq，累计5个seq。其中DIS为起终点的距离(米)，SEQ为序列的编号。

D.计算每个seq中最后一条信令与第一条信令的时间差，判断时间差值是否大于Tmin(180s)，满足条件则认为seq中信令位置区域为驻留区域，若不满足条件，则释放该seq的数据，继续判断。最终得到5个seq。其中TT_SUM为一个seq的时间差(秒)，TT为相邻两个位置点的时间差(秒)。

E.计算每个seq中时间比例最大的信令数据对应的经纬度，定义为该区域的驻留核心点。用户A序列seq1对应的核心驻留点即为第2条信令。保留核心驻留点对应的信令数据，形成用户A的驻留区域识别数据，数据内容包括用户编号MSID，信令发生时间TIMESTAMP，停留区域开始时间START_TIME，停留区域结束时间END_TIME，经度LON，纬度LAT，累计停留时间STAYTIME，序列序号SEQ。

F.分别将每两个驻留区域之间信令数据作为一次有效出行产生的信令数据。数据内容包括出行的开始位置(经度、纬度)、开始时间、结束位置(经度、纬度)、结束时间和停留点序号。

【步骤2】基于DBSCAN算法的轨迹匹配：

取用户A的一次有效出行数据作为分析样例，展开算法实施说明。其中seq＝1为signal

A.以用户A出行的起、终点、线路路径点以及不同种交通方式作为输入数据，请求导航API数据，得到导航线路数据，数据内容包括各类交通方式TRIP，经度LON，纬度LAT，相邻轨迹点的距离DIS，时耗TT。

B.合并导航线路数据与用户A有效出行数据，采用DBSCAN算法进行聚类分析，设定参数Eps＝1000m和MinPts＝3，得到聚类簇集C，每个集合用P进行区分，筛选出包含导航数据的子簇C

C.统计子簇集合C

【步骤3】基于轨迹匹配度集合与时间关联的识别：

A.输入不同交通方式导航API线路的时耗NRT

B.结合步骤2得到的轨迹匹配度集合Rtra与时间匹配度集合Rtm，根据集合属性设定相应的权值K＝0.5，计算实际出行方式的概率P，P

C.通过上述运算，用户A公交对应的出行方式概率P最大，为97.6％，即得到用户A本次有效出行的出行方式为公交。参照图3，其为公交导航API获取的轨迹位置数据与用户A驻留点位置数据的空间分布。

通过利用导航API请求不同出行方式的道路轨迹点数据，然后与信令中位置数据融合进行聚类分析，统计含有导航轨迹聚类簇中信令数据的个数，将其与全部信令数据的比值作为轨迹匹配度，根据设定的轨迹匹配度阈值，记录符合阈值的出行方式集合以及请求的导航线路信息，包括线路坐标数据、线路距离以及花费时间等，同时结合实际出行时间与导航线路时间，计算每条导航线路与实际出行的时间匹配度，从轨迹匹配度与时间匹配度两方面综合进行出行方式的识别。

本实施例的实施原理为：其能够识别出到过特定旅游景区的手机用户，得到该用户完整的出行信息(出行起讫点，出行时间，出行方式)和活动信息(住宿、餐饮、游玩、其他)，提高基于手机信令的出行方式判断的准确度，采用手机信令数据同时结合导航数据的识别方法，将居民出行轨迹数据与导航数据聚类来进行轨迹相关性的分析，并且同时分析两类数据的时间关联性进而对居民出行方式进行更准确的判别。

本具体实施方式的实施例均为本发明的较佳实施例，并非依此限制本发明的保护范围，故：凡依本发明的结构、形状、原理所做的等效变化，均应涵盖于本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：陈明威;王恒;陈梦瑶;
专利申请人：上海晨擎信息科技有限公司;

上一篇：一种富营养化河湖的底泥覆盖材料及其制备方法和使用方法
下一篇：一种从低浓度酸性废水中回收铜的方法