掌桥专利:专业的专利平台
掌桥专利
首页

一种基于时间权重聚类的职住地估计方法及装置

文献发布时间:2023-06-19 19:30:30


一种基于时间权重聚类的职住地估计方法及装置

技术领域

本发明涉及移动通信技术领域,尤其涉及一种基于时间权重聚类的职住地估计方法及装置。

背景技术

职住平衡的基本内涵是指在某一给定的地域范围内,居民中劳动者的数量和就业岗位的数量大致相等,即职工的数量与住户的数量大体保持平衡状态,大部分居民可以就近工作;通勤交通可采用步行、自行车或者其他的非机动车方式;即使是使用机动车,出行距离和时间也比较短,限定在一个合理的范围内,这样就有利于减少机动车尤其是小汽车的使用,从而减少交通拥堵和空气污染。

鉴于对于城市规划及交通规划的需要,需要掌握居民的职住分布,并且随着移动通信技术的不断发展,通过大规模通信确定用户的轨迹的技术手段已逐渐实现,因此,目前需要一种能够准确有效的通过手机信令数据与轨迹数据识别用户职住地的方法。

发明内容

针对现有技术中存在的问题,本发明实施例提供一种基于时间权重聚类的职住地估计方法及装置。

本发明实施例提供一种基于时间权重聚类的职住地估计方法,包括:

获取手机信令数据及用户的信令数据采集点,并根据所述手机信令数据获取对应的基站集合,根据所述信令数据采集点获取用户对应的移动轨迹数据;

根据所述基站集合获取基站对应的覆盖的城市区域,并将所述城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格;

获取用户在所述信令数据采集点进行数据采集时的时间点,并根据所述时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据所述网格停留时长及总停留时长计算轨迹网格对应的时长权重;

基于所述轨迹网格对应的时长权重,对所述轨迹网格进行聚类,得到用户的簇集合,所述聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛;

计算用户的簇集合中每个簇的累计停留时长,选取所述累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。

在其中一个实施例中,所述方法还包括:

根据所述信令数据采集点进行数据采集时的时间点将所述移动轨迹数据划分为休息轨迹数据及工作轨迹数据;

所述轨迹网格,包括:

休息轨迹网格及工作轨迹网格;

所述选取所述累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地,包括:

选取所述累计停留时长最长的簇的簇中心对应的休息轨迹网格作为用户的居住地;

选取所述累计停留时长最长的簇的簇中心对应的工作轨迹网格作为用户的工作地。

在其中一个实施例中,所述方法还包括:

根据用户的信令数据采集点确定用户对应的用户基站,根据所述用户基站的基站信息确定用户基站的覆盖范围;

将所述用户基站的覆盖范围连接,确定用户的移动轨迹范围,结合交通大数据中所述移动轨迹范围内的道路集合,确定用户的移动轨迹数据。

在其中一个实施例中,所述方法还包括:

结合交通大数据中所述移动轨迹范围内的道路集合,确定用户的移动轨迹数据集合;

基于所述信令数据采集点进行数据采集时的时间点,分别计算所述移动轨迹数据集合中各个移动轨迹在信令数据采集点的移动速度,并选取所述移动速度最稳定的移动轨迹作为用户的移动轨迹数据。

在其中一个实施例中,所述方法还包括:

获取所述簇集合中每个簇包含的轨迹网格;

结合所述网格停留时长,计算用户的簇集合中每个簇的累计停留时长。

本发明实施例提供一种基于时间权重聚类的职住地估计装置,包括:

获取模块,用于获取手机信令数据及用户的信令数据采集点,并根据所述手机信令数据获取对应的基站集合,根据所述信令数据采集点获取用户对应的移动轨迹数据;

网格化模块,用于根据所述基站集合获取基站对应的覆盖的城市区域,并将所述城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格;

计算模块,用于获取用户在所述信令数据采集点进行数据采集时的时间点,并根据所述时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据所述网格停留时长及总停留时长计算轨迹网格对应的时长权重;

聚类模块,用于基于所述轨迹网格对应的时长权重,对所述轨迹网格进行聚类,得到用户的簇集合,所述聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛;

选取模块,用于计算用户的簇集合中每个簇的累计停留时长,选取所述累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。

在其中一个实施例中,所述装置还包括:

划分模块,用于根据所述信令数据采集点进行数据采集时的时间点将所述移动轨迹数据划分为休息轨迹数据及工作轨迹数据;

第二选取模块,用于选取所述累计停留时长最长的簇的簇中心对应的休息轨迹网格作为用户的居住地;

第三选取模块,用于选取所述累计停留时长最长的簇的簇中心对应的工作轨迹网格作为用户的工作地。

在其中一个实施例中,所述装置还包括:

用户基站确定模块,用于根据用户的信令数据采集点确定用户对应的用户基站,根据所述用户基站的基站信息确定用户基站的覆盖范围;

轨迹确定模块,用于将所述用户基站的覆盖范围连接,确定用户的移动轨迹范围,结合交通大数据中所述移动轨迹范围内的道路集合,确定用户的移动轨迹数据。

本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于时间权重聚类的职住地估计方法的步骤。

本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于时间权重聚类的职住地估计方法的步骤。

本发明实施例提供的一种基于时间权重聚类的职住地估计方法及装置,获取手机信令数据及用户的信令数据采集点,并根据手机信令数据获取对应的基站集合,根据信令数据采集点获取用户对应的移动轨迹数据;根据基站集合获取基站对应的覆盖的城市区域,并将城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格;获取用户在信令数据采集点进行数据采集时的时间点,并根据时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据网格停留时长及总停留时长计算轨迹网格对应的时长权重;基于轨迹网格对应的时长权重,对轨迹网格进行聚类,得到用户的簇集合,聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛;计算用户的簇集合中每个簇的累计停留时长,选取累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。这样依托运营商手机信令位置信息数据,充分整合用户轨迹数据中的时间和空间信息,构建精确度更高的职住位置数据判断能力,相对于现有技术,能有效提高职住位置的准确度。职住位置估计方面,综合考虑了运营商基站定位系统输出的数据噪声问题,网格融合后,引入停留时长权重进行轨迹聚类估计用户职住位置,使估计结果更加准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种基于时间权重聚类的职住地估计方法的流程图;

图2为本发明实施例中一种基于时间权重聚类的职住地估计装置的结构图;

图3为本发明实施例中电子设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的一种基于时间权重聚类的职住地估计方法的流程示意图,如图1所示,本发明实施例提供了一种基于时间权重聚类的职住地估计方法,包括:

步骤S101,获取手机信令数据及用户的信令数据采集点,并根据所述手机信令数据获取对应的基站集合,根据所述信令数据采集点获取用户对应的移动轨迹数据。

具体地,手机信令数据为用户使用手机时,与基站通信时产生的数据,可以包括用户的各项数据、基站的各项数据等,而用户的信令数据采集点则为通信时对应的基站点,然后根据手机信令数据获取对应的基站集合,即将用户的各项数据结合基站的各项数据,确定城市区域内基站的集合,并根据采集到用户的信令数据的采集点获取用户对应的移动轨迹数据。

另外,根据用户的信令数据采集点可以确定用户进行信令数据采集时对应的用户基站,根据用户基站的基站信息确定用户基站的覆盖范围,然后将用户基站的覆盖范围连接,确定用户的移动轨迹范围,结合交通大数据中移动轨迹范围内的道路集合,确定用户最可能存在的道路作为用户的移动轨迹数据。

另外,结合交通大数据中所述移动轨迹范围内的道路集合,可以确定用户在移动轨迹范围内的的移动轨迹数据集合,然后基于信令数据采集点进行数据采集时的时间点,分别计算移动轨迹数据集合中各个移动轨迹在信令数据采集点的移动速度,并选取移动速度最稳定的移动轨迹作为用户的移动轨迹数据,这样能够获取最准确的用户的移动轨迹,减小基站漂移和切换等噪声的影响。

步骤S102,根据所述基站集合获取基站对应的覆盖的城市区域,并将所述城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格。

具体地,确定基站集合对应的覆盖的城市区域后,进一步的对城市区域进行网格化处理,其中,网格化处理可以比如将城市区域划分为50*50、100*100的各个网格,然后将网格化处理后的城市网格与用户的移动轨迹进行对比,根据对比结果确定用户的移动轨迹经过的城市网格,从而确定用户经过的轨迹网格。

步骤S103,获取用户在所述信令数据采集点进行数据采集时的时间点,并根据所述时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据所述网格停留时长及总停留时长计算轨迹网格对应的时长权重。

具体地,获取用户在信令数据采集点进行数据采集时的时间点,即用户在各个信令数据采集点与基站通信的时间点,根据时间点,结合用户轨迹网格与基站覆盖范围的对比结果,可以计算用户在每个轨迹网格中的网格停留时长,以及在轨迹首尾的时间点,计算用户在所有轨迹网格中的总停留时长,根据各个网格停留时长与总停留时长的比值,确定各个轨迹网格对应的时长权重。

步骤S104,基于所述轨迹网格对应的时长权重,对所述轨迹网格进行聚类,得到用户的簇集合,所述聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛。

具体地,可以通过停留时长权重因子的kmeans聚类方法设置聚类中心K,对当月的用户轨迹数据进行聚类,根据簇中对象的权重把每个对象赋给最相似的簇,不断迭代,直到权重不再变化。

步骤S105,计算用户的簇集合中每个簇的累计停留时长,选取所述累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。

具体地,计算用户在所述簇集合中每个簇的累积停留时长,其中,每个簇的累积停留时长可以通过获取簇集合中每个簇包含的轨迹网格,结合网格停留时长,计算用户的簇集合中每个簇的累计停留时长,选取累计停留时长最长的簇的簇中心所在的网格作为居住地或工作地。

另外,根据信令数据采集点进行数据采集时的时间点将移动轨迹数据划分为休息轨迹数据及工作轨迹数据,比如将早9点至晚6点采集到的移动轨迹数据划分为工作轨迹数据,晚6点至次日早9点采集到的移动轨迹数据划分为休息轨迹数据,然后将休息轨迹数据及工作轨迹数据与网格化处理后的城市网格进行数据处理,确定用户的休息轨迹网格及工作轨迹网格,然后选取累计停留时长最长的簇的簇中心对应的休息轨迹网格作为用户的居住地,选述累计停留时长最长的簇的簇中心对应的工作轨迹网格作为用户的工作地。

本发明实施例提供的一种基于时间权重聚类的职住地估计方法,获取手机信令数据及用户的信令数据采集点,并根据手机信令数据获取对应的基站集合,根据信令数据采集点获取用户对应的移动轨迹数据;根据基站集合获取基站对应的覆盖的城市区域,并将城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格;获取用户在信令数据采集点进行数据采集时的时间点,并根据时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据网格停留时长及总停留时长计算轨迹网格对应的时长权重;基于轨迹网格对应的时长权重,对轨迹网格进行聚类,得到用户的簇集合,聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛;计算用户的簇集合中每个簇的累计停留时长,选取累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。这样依托运营商手机信令位置信息数据,充分整合用户轨迹数据中的时间和空间信息,构建精确度更高的职住位置数据判断能力,相对于现有技术,能有效提高职住位置的准确度。职住位置估计方面,综合考虑了运营商基站定位系统输出的数据噪声问题,网格融合后,引入停留时长权重进行轨迹聚类估计用户职住位置,使估计结果更加准确。

图2为本发明实施例提供的一种基于时间权重聚类的职住地估计装置,包括:检测模块S201、选取模块S202、初始化模块,S203、第一添加模块S204、第二添加模块S205,其中:

获取模块S201,用于获取手机信令数据及用户的信令数据采集点,并根据所述手机信令数据获取对应的基站集合,根据所述信令数据采集点获取用户对应的移动轨迹数据。

网格化模块S202,用于根据所述基站集合获取基站对应的覆盖的城市区域,并将所述城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格。

计算模块S203,用于获取用户在所述信令数据采集点进行数据采集时的时间点,并根据所述时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据所述网格停留时长及总停留时长计算轨迹网格对应的时长权重。

聚类模块S204,用于基于所述轨迹网格对应的时长权重,对所述轨迹网格进行聚类,得到用户的簇集合,所述聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛。

选取模块S205,用于计算用户的簇集合中每个簇的累计停留时长,选取所述累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。

在其中一个实施例中,所述装置还包括:

划分模块,用于根据所述信令数据采集点进行数据采集时的时间点将所述移动轨迹数据划分为休息轨迹数据及工作轨迹数据。

第二选取模块,用于选取所述累计停留时长最长的簇的簇中心对应的休息轨迹网格作为用户的居住地。

第三选取模块,用于选取所述累计停留时长最长的簇的簇中心对应的工作轨迹网格作为用户的工作地。

在其中一个实施例中,所述装置还包括:

用户基站确定模块,用于根据用户的信令数据采集点确定用户对应的用户基站,根据所述用户基站的基站信息确定用户基站的覆盖范围。

轨迹确定模块,用于将所述用户基站的覆盖范围连接,确定用户的移动轨迹范围,结合交通大数据中所述移动轨迹范围内的道路集合,确定用户的移动轨迹数据。

关于基于时间权重聚类的职住地估计装置的具体限定可以参见上文中对于基于时间权重聚类的职住地估计方法的限定,在此不再赘述。上述基于时间权重聚类的职住地估计装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302、通信接口(Communications Interface)303和通信总线304,其中,处理器301,存储器302,通信接口303通过通信总线304完成相互间的通信。处理器301可以调用存储器302中的逻辑指令,以执行如下方法:获取手机信令数据及用户的信令数据采集点,并根据手机信令数据获取对应的基站集合,根据信令数据采集点获取用户对应的移动轨迹数据;根据基站集合获取基站对应的覆盖的城市区域,并将城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格;获取用户在信令数据采集点进行数据采集时的时间点,并根据时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据网格停留时长及总停留时长计算轨迹网格对应的时长权重;基于轨迹网格对应的时长权重,对轨迹网格进行聚类,得到用户的簇集合,聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛;计算用户的簇集合中每个簇的累计停留时长,选取累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。

此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:获取手机信令数据及用户的信令数据采集点,并根据手机信令数据获取对应的基站集合,根据信令数据采集点获取用户对应的移动轨迹数据;根据基站集合获取基站对应的覆盖的城市区域,并将城市区域进行网格化处理,并结合网格化处理后的城市网格以及移动轨迹数据,确定用户对应的轨迹网格;获取用户在信令数据采集点进行数据采集时的时间点,并根据时间点计算用户在每个轨迹网格中的网格停留时长以及在所有轨迹网格中的总停留时长,并根据网格停留时长及总停留时长计算轨迹网格对应的时长权重;基于轨迹网格对应的时长权重,对轨迹网格进行聚类,得到用户的簇集合,聚类包括:在聚类计算时基于簇中对象权重,将簇中对象赋给相似簇,迭代直至收敛;计算用户的簇集合中每个簇的累计停留时长,选取累计停留时长最长的簇的簇中心对应的轨迹网格作为用户的居住地或工作地。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 一种基于聚类分析的学术论文作者权重分析方法
  • 一种基于权重聚类的电站空预器堵灰监测方法
  • 基于手机信令数据的职住地识别方法、装置及存储介质
  • 一种职住地分布的解析方法、解析装置及可读存储介质
技术分类

06120115932860