掌桥专利:专业的专利平台
掌桥专利
首页

基于时空大数据的城市区域功能识别模型及识别方法

文献发布时间:2023-06-19 13:45:04


基于时空大数据的城市区域功能识别模型及识别方法

技术领域

本发明属于数据挖掘和城市计算技术领域,涉及一种基于时空大数据的城市区域功能识别模型及识别方法。

背景技术

近年来,伴随智慧城市相关应用的普及,居民出行产生的大量实时、高精度、全覆盖的移动时空大数据,为城市区域功能识别的相关研究提供了有效的数据支撑。时空大数据驱动的分析方法弥补了传统的基于问卷调查、遥感影像数据的研究中存在的经济代价高,易受主观判断影响等缺陷;此外,移动时空大数据能够更加细粒度的描述人类活动与城市空间结构之间的密切关系,为有效分析人类活动,进行城市空间结构的研究提供了强有力的数据支撑。另一方面,深度学习(Deep Learning)技术在图像处理、辅助诊断等领域的成功应用,表明了深度学习对复杂问题建模和求解的能力,为智慧城市分析提供了良好的技术基础。

目前,有很多工作聚焦于结合居民移动时空大数据进行聚类,从而对城市区域的功能进行有效、及时的识别。通常是基于出行数据和兴趣点数据描述居民出行模式,进一步利用机器学习算法识别特定城市的区域功能,如Liu、Gao均以成都市出租车GPS轨迹数据和兴趣点数据(point of interest,POI)数据为基础,分别采用K近邻算法(KNN)、高斯混合模型(GMM)结合轨迹数据构成的时间序列数据实现城市用地功能的划分和识别(Liu X,YTian,Zhang X,et al.Identification of Urban Functional Regions in ChengduBased on Taxi Trajectory Time Series Data.//QingkeGao,Jianhong,etal.Identification of urban regions′ functions in Chengdu,China,based onvehicle trajectory data.)。上述现有研究表明了利用居民移动的时空数据进行城市功能区识别的有效性,但是在我国,多数城市具有高密度、土地利用混合度较高的发展特点,很少有单一纯粹的功能区,这也是我国现代城市规划理念中所不鼓励的。一方面,城市用地区域呈现出多种用地功能组合的特征。另一方面,存在随着时间的变化,用地区域所呈现的功能发生变化的现象。然而,目前的城市区域用地识别研究在功能聚集度上仍有待提高,特别是对于多种功能混合的地块(如商住混合楼所处的地块)仍无法做到更符合现实情况的精确识别。

此外,城市地块之间的空间相关性对于区域聚类和功能发现也十分重要。城市空间结构与居民出行活动相互影响,可以用来作为城市功能发现的研究基础。现有的一些考虑城市地块空间相关性的研究通常是把一座城市建模成为图结构,基于图论的方法进行分析。如Xu等提出一种基于复杂网络节点相似度的亲和度的计算方法,以衡量城市地块内部各类功能的密度分布情况(Yajing Xu,Gongfu L,Chao X,et al.Affinity-based humanmobility pattern for improved region function discovering),肖飞等提出一种区域模式图的构建算法,建立频繁出行模式子图挖掘算法发现区域模式图中频繁出现的移动模式,最终实现城市地块功能的发现(肖飞,王悦,梅逸男,等.基于出行模式子图的城市功能区域发现方法)。以上现有的基于图论的方法虽然描述了城市地块之间的关系,但未能充分有效的描述城市地块之间交互的时变特征,即在一天内不同的时间段下各个地块之间的关系不是固定不变的,比如早高峰时段工作区与住宅区之间的通勤人数相对于其他时刻更高,因此对应的关系相较于其他时刻更相关。

发明内容

针对现有技术中存在的城市地块功能识别聚集度不高的问题,特别是对于土地利用混合度较高的城市发展现象,提供一种基于时空大数据的城市区域功能识别模型及识别方法,该方法更符合我国城市发展特点的功能区识别。

为了实现上述目的,本发明采用如下技术方案予以解决:

一种基于时空大数据的城市区域功能识别模型及识别方法,具体包括以下步骤:

步骤1:根据城市路网和栅格法划分待研究城市地块,作为目标区域;

步骤2:构建动态时序图,生成动态时序图的节点特征和图邻接矩阵;

包括如下子步骤:

步骤21:将目标区域B内每个地块作为动态时序图的节点,生成每个地块B

步骤22:计算目标区域B内各节点在整数时间段t时v

定义整数时间段t对应的有向加权图G

其中,(B

步骤3:构建动态图表示学习模型GAT-GRU,得到训练好的GAT-GRU模型;

步骤4:将固定时间范围内的工作日早晚高峰、周末早晚高峰这四个时间段分别通过步骤3训练好的GAT-GRU模型计算,对模型输出的每个地块B

进一步的,所述步骤1包括如下子步骤:

步骤11,提取待研究城市的路网数据,根据路网数据确定行政区域E;其中, E={(lon

步骤12,应用栅格数据模型对行政区域E进行处理,得到地块集合Z;其中, Z={polygon

步骤13,将行政区域E与地块集合Z取交集,得到行政区域E内的地块集合B,作为目标区域B;其中,B={B

进一步的,所述步骤21包括如下子步骤:

步骤211,取目标区域B在固定时间范围T内的所有出租车订单,得到订单集合J;

其中,J={j

对于一条有效的出租车订单:j={lon

步骤212,利用下式对每一条订单进行时间段划分,即将该订单的t

t

步骤213,遍历订单集合J,对于每条订单,利用下式计算地块B

若(lon

若(lon

步骤214,遍历所有地块B

将每个地块B

进一步的,所述步骤3包括如下子步骤:

步骤31,通过GAT网络模型,设计基于加权图注意力网络的空间层表示模块,用来提取加权图中各节点的空间特征;

空间层表示模块具体设计过程将整数时间段t对应的有向加权图G

具体的,w

对于目标节点v

步骤32,通过GRU网络模型,设计基于循环神经网络的时间层表示模块;

对于每个节点v

步骤33,选择网络模型损失函数,重复迭代步骤31-32,对动态图表示学习模型GAT-GRU进行优化训练,得到训练好的GAT-GRU模型;

进一步的,所述步骤33中,选择如下式所示的损失函数:

其中,

进一步的,所述步骤4包括如下子步骤:

步骤41,将固定时间范围T分为工作日早高峰、工作日晚高峰、周末早高峰、周末晚高峰共四个时间段;将上述四个时间段分别通过步骤3得到的动态图表示学习模型 GAT-GRU进行计算,输出每个地块B

步骤42,将四个时间段下训练得到的有向加权图G

步骤43,对步骤42得到的所有节点的聚类结果,结合节点v

进一步的,所述步骤43中,采用WTF-IDF算法进行功能性语义标注。

相较于现有技术,本发明的技术效果如下:

1)面向我国城市密度大、功能复合性高的发展特点,通过构建动态时序图实现在时间上细粒度的进行功能区的聚类及识别,更加符合我国城市发展特点的功能区识别思路;

2)从时空交互作用的角度,构建深度学习模型提取时空特征,从而实现城市功能区的自动识别,为传统的城市功能区研究提出了一种新思路。

附图说明

图1是本发明中动态图表示学习的模型的结构示意图。

图2是实施例中目标区域的划分步骤示意图;其中,从左到右三个分图分别表示原始路网E、格栅化后的区域Z、研究区域B。

图3是实施例中研究结果的可视化图;其中,四个分图分别是四种工作模式下的可视化图。

图4是本发明的模型与相关工作(Liu,Gao)在城市功能纯度熵的对比图。

图5是实施例中本发明的方法在成都体育中心与高德地图分布的真实地理影像数据的对比验证图。其中,(a)为高德地图分布的真实地理影像数据;(b)为使用原始车流量数据在四种时间模式下的流量趋势图。

以下结合附图和具体实施方式对本发明进一步解释说明。

具体实施方式

本发明给出的基于时空大数据的城市区域功能识别模型及识别方法,具体包括以下步骤:

步骤1:根据城市路网和栅格法划分待研究城市地块,作为目标区域;

步骤11,提取待研究城市的路网数据,根据路网数据确定行政区域E(如图2(a)所示);其中,E={(lon

步骤12,应用栅格数据模型对行政区域E进行处理,得到地块集合Z(如图2(b)所示);其中,Z={polygon

步骤13,将行政区域E与地块集合Z取交集,得到行政区域E内的地块集合B,作为目标区域B(如图2(c)所示);其中,B={B

步骤2:构建动态时序图,生成动态时序图的节点特征和图邻接矩阵,用来融合目标区域B之间的空间和时间关系特征;具体包括如下子步骤:

步骤21:将目标区域B内每个地块作为动态时序图的节点,生成每个地块B

步骤211,取目标区域B在固定时间范围T内的所有出租车订单,得到订单集合J;

其中,J={j

具体的,对于一条有效的出租车订单:j={lon

步骤212,利用下式对每一条订单进行时间段划分,即将该订单的t

t

步骤213,遍历订单集合J,对于每条订单,利用下式计算地块B

若(lon

若(lon

步骤214,遍历所有地块B

将每个地块B

G={G

步骤22:计算目标区域B内各节点在整数时间段t时v

具体的,定义整数时间段t对应的有向加权图G

其中,(B

动态时序图又称为动态网络,其中图的结构会随着时间而演变,表现为在某个时间戳下会出现节点和边的动态增加、减少或属性的动态变化。考虑到在城市各地块内的出租车的上下车位置及流量也是动态变化的,如在不同的时间戳下某一地块区域内的人群会有不同的目的地需求,相应反映出的流量也会呈现不同的变化趋势。基于此,本发明借鉴时序图原理,对城市各地块内的出租车的时间、空间特征进行建模。

步骤3:设计动态图表示学习模型GAT-GRU,用来进一步发现各个节点B

步骤31,通过GAT网络模型(即加权图注意力网络),设计基于加权图注意力网络的空间层表示模块,用来提取加权图中各节点的空间特征;

空间层表示模块具体设计过程将整数时间段t对应的有向加权图G

具体的,w

进一步的,对于目标节点v

步骤31中,通过GAT网络模型自动学习不同邻居节点对目标节点的贡献度,从而得到目标节点在聚合邻居节点特征后的特征向量表示。

步骤32,通过GRU网络模型,设计基于循环神经网络的时间层表示模块;

经过步骤31后,每个整数时间段t都会输出对应有向加权图G

步骤33,以式5为网络模型损失函数,重复迭代步骤31-32,对动态图表示学习模型GAT-GRU进行优化训练,得到训练好的GAT-GRU模型;

在训练过程中,目标是对于每个节点v

其中,

步骤3中,针对城市功能区在不同时间段表现出的差异化属性,传统的静态图方法难以有效描述城市功能区的动态演变。本实施例中提出一种基于图注意力网络(GAT:GraphAttention Network)和门控循环单元网络(GRU:Gated Recurrent Unit)的动态图表示模型,用于表征不同时段城市功能区的动态演变规律。具体的,通过GAT网络获取某一时刻各个地块之间的空间结构信息,然后利用GRU网络获取某个地块的历史流量变化信息,通过动态图表示学习算法GAT-GRU实现提取城市每一个地块的空间、时间特征信息。

步骤4:对步骤3得到的每个地块B

步骤41,将固定时间范围T分为工作日早高峰、工作日晚高峰、周末早高峰、周末晚高峰共四个时间段;本实施例中,早高峰为7-9点,晚高峰为17-19点;将上述四个时间段,分别通过步骤3得到的动态图表示学习模型GAT-GRU训练,输出每个地块B

步骤42,将四个时间段下训练得到的有向加权图G

由于城市地块中的功能区缺乏真实的标签,因此本实施例应用典型的无监督算法k-means对步骤3基于动态图表示学习模型提取后的特征进行聚类。k-means聚类算法的基本思想是根据样本之间的相似性,将样本划分到不同的类别中,本实施例采用的相似度计算方法为欧式距离法。此外,聚类的效果受到聚类数k值的影响,本实施例通过簇惯性指数(within-cluster sum of squared errors,SSE)、轮廓系数(silhouette analysis,SH)两个指标进行最佳k值的选择。

步骤43,对步骤42得到的所有节点的聚类结果,结合节点v

优选的,采用WTF-IDF算法进行功能性语义标注。

实施例:

本实施例基于从数据开放平台中得到目标分析城市(四川省成都市)自2016 年11月1号至30号一个月的出租车订单数据,共7065936条,每条记录字段包括订单ID、订单开始和结束时间,以及订单ID对应的起点和终点经纬度。将订单记录中上下车位置按照经纬度匹配到对应城市地块后构建净输入流(订单结束数量-订单开始数量)作为该城市地块在某个时间点下的区域交通量数据。

本实施例的城市地块POI数据来源于高德开发者平台,爬取了2019年研究区域内13 种行业类别共约550000余个POI记录点,分类如表1所示。

表1 POI数据分类

本实施例在四种时间模式下(工作日早高峰T1、工作日晚高峰T2、周末早高峰T3、周末晚高峰T4)分别通过步骤41对相应的有向加权图G

表2不同时间模式下每类区域POI的WTF-IDF值

本实施例以成都市为目标城市进行了功能区域的识别分析,考虑到居民出行在工作日和周末的差异性以及每天早、晚高峰不同的出行需求,本实施例选取11月一个月内22个工作日早高峰(7-9点)、晚高峰(17-19点)以及8个休息日对应的时间段共四个时间模式分析对应的区域聚类结果,可视化结果如图3所示。由于城市功能随着居民流动的动态性也呈现出相应的改变,因此城市区域功能往往不是静止不变的,如果对于某些特定的区域进行静态分析,得到的结果往往是复合型功能,本发明的方法考虑了短时间下更好的捕捉每个时间段各区域所呈现出的特定的功能,进一步可以在时间维度上更细粒度的划分区域功能。为了说明此方法的有效性,引入城市区域功能纯度熵来分析区域功能聚集度,城市区域功能纯度熵计算公式7如下:

其中,Ent(C

通过计算熵值可以反映每一类区域的功能聚集度,熵值越小,表明对应该类区域POI 分布纯度越高,功能聚集度更强。图4结果为本发明的方法与研究同一座城市的工作(Liu, Gao)所提供的结果在城市区域功能纯度熵上进行的相应比较,其中max表示在所有类别区域中纯度熵最高的记录,min则表示在所有类别区域中纯度熵最低的记录。从图4可以看出,对于实际分布为多功能混合的区域中,本发明方法表现出最低的熵值,即区域聚集度最高。这是由于本方法充分考虑了不同时间模式下区域功能所呈现的动态性变化,因此识别的功能聚集度更高。对于功能偏向单一化的区域,由于Gao识别的结果中将″春熙路″所在区域划分为了单一类别,因此熵值最低,这是因为Gao中以流量特征进行聚类,″春熙路″所在区域的流量一直处于较高值,因此最终分为一类,而本模型在考虑流量的同时也考虑了跟其空间上相似的其他区域,所以可以在区域聚集度相对也很高的基础上对这类区域进行更好的聚类。

此外,为了检验本发明的方法在城市功能区动态识别上的效果,将实施例研究得到的识别结果与高德地图真实分布的POI数据及区域流量趋势图进行对比分析,实验结果表明,通过本方法能够对大部分随时间演变的功能分区进行有效的识别。图5是成都体育中心所在区域的高德地图真实数据点分布图和一个月内此区域在工作日、休息日每天的上下车订单记录趋势图。从高德地图分布来看,成都体育中心附近分布有很多政府办公机构(深色圆圈所示),同时著名的商业中心大楼富力中心也位于此区域。此外,该区域还分布有体育中心、艺术剧场、美术馆等大型的科教文化服务设施,结合这些设施的开放时间,可以初步表明此区域为典型的功能混合区,在不同时间模式下群体可能会处于不同的需求在这里活动。结合流量趋势图,在17点前此区域的下车量一直大于上车量,即一直为群体流入的状态,表明居民在白天会因为此区域的某些功能需求到达此地。在19点前工作日和休息日的流量趋势差别较为明显,工作日波动次数较多,产生许多极值,表现出更明显的通勤时间特征,因此更符合商业办公区的属性。而在休息日期间整体波动范围不大,早上流入量较低,到10点左右开始逐渐增加,且全天比较平稳,更符合居民在此处进行娱乐休闲的出行目的,结合POI的分布,表明在此种时间模式下该区域表现出文化娱乐区功能的概率更大,对应商业区的功能有所减弱。通过对POI分布与一天内流量趋势的结合分析,得到的结果与本模型只考虑早高峰、晚高峰(图5中前两条竖线间的区间、后两条竖线间的区间)的流量特征及空间交互特征的GAT-GRU方法发现出的功能演变情况基本一致。

基于以上的结果对比和验证分析,表明本发明提出的模型在细粒度识别城市功能区上的有效性。通过对城市用地功能的复合、时变特性进行有效识别,为城市规划研究人员全面理解城市区域结构属性,实现更细粒度的城市规划提供了有效信息,也为商业选址、交通流量预测等任务提供支持,最终为城市空间得到更合理高效的利用而服务。

技术分类

06120113792736