掌桥专利:专业的专利平台
掌桥专利
首页

一种用于弹性公交系统的城市出行用户画像体系构建方法

文献发布时间:2023-06-19 10:16:30


一种用于弹性公交系统的城市出行用户画像体系构建方法

技术领域

本发明涉及公共交通出行领域和交通大数据领域,尤其涉及一种用于弹性公交系统的城市出行用户画像体系构建方法。

背景技术

用户画像又称用户角色(Persona),是互联网营销的主要客户分类技术,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,几乎所有的互联网公司都会通过勾画目标用户,建立目标用户的全方位线索信息,进一步找出用户的兴趣点进行精准营销,利用数据挖掘寻求有用的信息和潜在的商业机会。

公共交通出行的用户画像目的和传统基于营销的用户画像目的不同,采集的技术手段也不一样。因此,需要一种针对于公共交通网络的用户画像体系构建方法。

发明内容

发明目的:本发明提出一种公共交通领域的用户画像体系构建方法,结合大数据技术、指标体系构建技术、交通工程领域知识、市场分析技术等多学科交叉知识,设计了适用于弹性公交系统的城市居民出行用户画像指标体系,解决了新兴出行方式下城市居民出行用户画像过程中定量分析和多维度指标不足的难题。

技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种用于弹性公交系统的城市出行用户画像体系构建方法,包括如下步骤:

1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区;

2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的出行记录,进行剔除,最终获取用户上下车时间和地点记录;

3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标;

4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签;

5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系。

进一步的,所述步骤1)的实施步骤为:

11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;

12)以公交站点为中心,对半径R米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径R米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;

w=TF*IDF

式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;

13)赋予公交站点功能属性,单一功能区或混合功能区:

当站点区域内的某一类POI占该区域所有POI的综合权重达到p%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;

当站点区域内所有类型的POI的综合权重均没有达到p%,则定义该站点区域为混合功能区,其属性由综合比例前n名的POI类型确定;

当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。

进一步的,所述步骤2)中的完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。

进一步的,所述步骤3)中多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。

进一步的,所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。

进一步的,所述步骤4)中出行指标标签化包括:用户事实标签以及用户模型标签;

所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。

进一步的,所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;

所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;

所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。

进一步的,所述步骤5)中的多级多粒度公交用户出行标签体系,即公交用户出行画像体系包括一级标签:用户基本信息、出行行为信息、公交使用信息;

51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;

52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;

53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。

有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:

本发明的用于公交网络的城市居民出行画像体系构建方法,弥补了用户画像中公共交通用户出行画像的研究空白。同时,本发明用于公交网络的城市居民出行画像体系构建方法是公共交通领域用于非集计用户个体出行特征的创新性应用,同时是用户画像在公交需求管理中的重要应用。

附图说明

图1是本发明的方法流程示意图;

图2是本发明的POI数据分类示意图。

具体实施方式

下面结合附图和实施例对本发明的技术方案作进一步的说明。

本发明所述的用于弹性公交系统的城市出行用户画像体系构建方法,流程如图1所示,具体实现包括以下步骤:

1)获取公交站点功能属性:基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;以公交站点为中心,对半径500米内各类POI数据,利用TF-IDF算法计算权重;赋予公交站点功能属性,单一功能区或混合功能区。

11)基于城市13类POI数据,根据城市用地分类标准对所有类别POI数据进行重新分类;13类POI数据包括有:餐饮服务、风景名胜、公共设施、公司企业、购物服务、科教文化服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及团体、住宿服务;重新分类后6类POI数据包括:居住用地、公共管理与服务用地、公共休闲服务用地、商业服务用地、工业用地、绿地与广场用地;

12)以公交站点为中心,对半径500米内各类POI数据,利用TF-IDF算法计算权重:将一条POI数据的类型标签视为一个单词,将以站点为中心、半径500米内的单位功能区所包含的所有POI数据视为一个文档,所有站点功能区包含的POI总和视为文档库;以单位功能区内部的POI类型种类、数量为输入,执行TF-IDF算法;计算每个单位区块中各POI的TF-IDF值,用该值表示POI的综合权重;

w=TF*IDF

式中,w为权重,TF表示POI类型出现频率,IDF表示逆向出现频率,N(x)为POI类型x在某公交站点出现的次数,N为某公交站点的POI总数,A为公交站点数,A(x)为公交站点包含POI类型x的数量;

13)赋予公交站点功能属性,单一功能区或混合功能区:

当站点区域内的某一类POI占该区域所有POI的综合权重达到50%及以上,则定义该站点区域为单一功能区,其属性由综合比例最高的POI类型确定;

当站点区域内所有类型的POI的综合权重均没有达到50%,则定义该站点区域为混合功能区,其属性由综合比例前2名的POI类型确定;

当站点区域内不包含任何POI类型,则通过计算相邻单元属性来确定站点功能属性。

2)基于弹性公交出行记录提取公交出行OD数据:结合弹性公交出行记录数据,基于大数据预处理技术,进行原始数据信息不完整记录的剔除,并筛选出行时长,出行距离不满足阈值的不合理出行记录,进行剔除,最终获取用户上下车时间和地点记录。

完整的弹性公交出行记录数据包括的字段有:公交卡用户唯一ID;上车时间;上车公交站点编号;下车时间;下车公交站点编号;对弹性公交出行记录数据清洗,剔除原始数据集中的信息不完整的数据。不合理出行记录指的是记录到的出行时长,出行距离不合理,包括以下几类:时长小于2分钟,大于1小时;距离小于1公里,大于30公里;距离时间比值大于60公里/小时,小于5公里/小时。

3)构建多级用户出行指标体系:基于完整弹性公交出行OD数据,匹配关联站点功能属性信息,并进行时空统计分析提取用户公交使用指标;关联用户基本信息,获取用户基本指标。

所述的多级用户出行指标体系包括一级指标:用户基本指标及公交出行指标;用户基本指标包括二级指标:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入;公交出行指标包括二级指标:站点出行频次、时间出行规律性、空间出行规律性、换乘公交比例、出行时长、出行距离、出行频率、家距离最近站点距离、弹性公交等待时间、弹性公交出行比例。

所述站点出行频次是指各个站点出行总次数;所述时间出行规律性是指每日各个时间段是否产生出行;所述空间出行规律性是指每日各个出行链是否产生出行;所述换乘公交比例是指换乘出行总次数;所述出行时长包括平均出行时长、最长出行时长;所述出行距离包括平均出行距离、最长出行距离;所述出行频率是指每日公交出行总次数;所述弹性公交等待时间包括平均等待时间、最长等待时间;所述弹性公交出行比例是指弹性公交出行总次数。

4)出行指标标签化:针对多级用户出行指标体系中的连续变量指标,进行离散处理,完成出行指标标签化,获得用户事实标签以及模型标签。

所述的用户事实标签包括:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平、居住地、工作地;所述的用户模型标签包括:娱乐出行程度、工作出行程度、偏好站点、偏好区域、时间出行规律性、空间出行规律性、换乘程度、换乘站点、弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点、家距离最近站点距离、最长出行时长、最长出行距离、公交使用强度、公交使用连续性。

所述的娱乐出行程度是指用地功能属性为娱乐属性的公交站点出行程度;所述的工作出行程度是指用地功能属性为工作属性的公交站点出行程度;所述的偏好站点是指出行次数高于所有使用站点平均水平的公交站点;所述的偏好区域是指出行次数高于所有到达交通小区平均水平的城市交通小区;所述的时间出行规律性:根据每日各个时间段是否产生出行;所述空间出行规律性:根据每日各个出行链是否产生出行;所述的换乘程度:根据换乘总次数占出行总次数的比例;所述的换乘站点:换乘次数高于所有站点平均水平的公交站点;所述的弹性公交等待时间:根据平均弹性公交等待时间;所述的弹性公交出行比例:根据弹性公交出行次数占出行总次数的比例;所述的弹性公交偏好站点:弹性公交出行高于所有站点平均水平的公交站点;所述的家距离最近站点距离:根据家距离最近站点距离;所述的最长出行时长:根据最长公交出行记录所消耗时长;最长出行距离:根据最长公交出行记录所行驶距离;公交使用强度:每日平均乘车次数;公交使用连续性:历史连续乘车天数平均值。

5)构建公交用户出行画像体系:基于指标分级的指标选取与体系搭建技术,分别从弹性公交用户属性、日常交通出行特征、和弹性公交使用特征三个方面,依次分解,并实现底层指标的标签化,构建多级多粒度公交用户出行标签体系,即公交用户出行画像体系,包括一级标签:用户基本信息、出行行为信息、公交使用信息。

51)用户基本信息中包括二级标签:基础标签及位置标签;二级基础标签包括三级标签:年龄、性别、职业、公交卡类型、是否在分析对象城市居住、收入水平;二级位置标签包括三级标签:居住地、工作地;

52)出行行为信息中包括二级标签:出行习惯、偏好出行、出行规律性;二级出行习惯包括三级标签:娱乐出行程度、工作出行程度;二级偏好出行包括三级标签:偏好站点、偏好区域;二级出行规律性包括三级标签:时间出行规律性、空间出行规律性;

53)公交使用信息中包括二级标签:换乘特性、弹性公交、公交便利度、公交容忍度、公交依赖度:二级换乘特性包括三级标签:换乘程度、换乘站点;二级弹性公交包括三级标签:弹性公交等待时间、弹性公交出行比例、弹性公交偏好站点;二级公交便利度包括三级标签:家距离最近站点距离;二级公交容忍度包括三级标签:最长出行时长、最长出行距离;二级公交依赖度包括三级标签:公交使用强度、公交使用连续性。本发明的公交用户出行指标体系,如表1所示。

表1

本发明的公交用户出行画像体系,如表2所示。

表2

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

相关技术
  • 一种用于弹性公交系统的城市出行用户画像体系构建方法
  • 用于智慧出行研判的公交车舒适度查询方法、系统及设备
技术分类

06120112479822