掌桥专利:专业的专利平台
掌桥专利
首页

基于元学习的车辆OD点聚类方法、系统、装置及存储介质

文献发布时间:2023-06-19 09:32:16


基于元学习的车辆OD点聚类方法、系统、装置及存储介质

技术领域

本发明涉及车辆OD点聚类技术领域,尤其是涉及一种基于元学习的车辆OD点聚类方法、系统、装置及计算机可读存储介质。

背景技术

目前城市道路的交通拥堵造成了物流时耗长、消费者体验差等现象,现代物流的高速发展已经对城市交通系统提出越来越高的要求,可见解决城市交通问题的必然性和紧迫性;基于此,考虑到交通流量的主要来源是居民出行,对于居民出行特性的分析结果可以反映一个地区的基本交通状况。车辆OD点(起止点)是居民出行的重要特征,对车辆OD点聚类可为现代物流的智能决策提供了一定的参考,也可为解决城市拥堵提供新的视角,对交通规划和现代物流发展有着重要的意义;现有的车辆OD点聚类方案单一,对于多种不同类型的车辆OD点数据无法得到最佳的聚类结果。

发明内容

有鉴于此,本发明提供了一种基于元学习的车辆OD点聚类方法,用以解决现有技术中对于多种不同类型的车辆OD点数据无法得到最佳的聚类结果的技术问题。

本发明提供了一种基于元学习的车辆OD点聚类方法,包括以下步骤:

采集不同类型的GPS车辆OD点数据,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;

采集GPS车辆OD点数据,将采集的GPS车辆OD点数据划分为训练数据集和测试数据集,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器;

重新采集GPS车辆OD点数据,利用所述的元学习器获取所述GPS车辆OD点数据的对应的车辆OD点类型,利用该车辆OD点类型对应的最佳聚类方法对该GPS车辆OD点数据进行聚类,得到该GPS车辆OD点数据聚类的结果。

进一步地,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,使用不同的聚类算法分别对不同类型的GPS车辆OD点数据进行聚类,得到不同类型的GPS车辆OD点数据对应的聚类评价指标,根据不同类型GPS车辆OD点数据的聚类评价指标,获取不同类型GPS车辆OD点数据对应的最佳聚类算法。

进一步地,所述不同的聚类算法,具体包括,原型聚类算法、密度聚类算法及层次聚类算法。

进一步地,根据不同类型GPS车辆OD点数据的聚类评价指标,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,获取不同类型GPS车辆OD点数据,在不同的聚类算法聚类下得到的DBI值或DI值,根据所述DBI值或DI值,获取不同类型GPS车辆OD点数据对应的最佳聚类算法。

进一步地,根据所述DBI值,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,

比较不同类型GPS车辆OD点数据在不同的聚类算法聚类下得到的DBI值;若某种类型的GPS车辆OD点数据在某种类聚类算法聚类下得到的DBI值相比该类型的GPS车辆轨迹数据在其他种类聚类算法聚类下得到的DBI值都小,则该种类的聚类算法是该类型的GPS车辆OD点数据对应的最佳聚类算法。

进一步地,根据所述DI值,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,

比较不同类型GPS车辆OD点数据在不同的聚类算法聚类下得到的DI值;若某种类型的GPS车辆OD点数据在某种类聚类算法聚类下得到的DI值相比该类型的GPS车辆OD点数据在其他种类聚类算法聚类下得到的DI值都大,则该种类的聚类算法是该类型的GPS车辆OD点数据对应的最佳聚类算法。

进一步地,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器,具体包括,计算测试数据与各个训练数据之间的欧式距离,在测试数据中选取所述欧式距离最小的k个训练数据点,确定所述k个训练数据点所对应的车辆OD点类型的频率,返回频率最高的车辆OD点类型作为测试数据的预测分类。

本发明提供了一种根据上述任一技术方案所述的基于元学习的车辆OD点聚类方法的系统,包括最佳聚类算法获取模块、元学习器构建模块及OD点数据聚类结果获取模块;

所述最佳聚类算法获取模块,用于采集不同类型的GPS车辆OD点数据,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;

所述元学习器构建模块,用于采集GPS车辆OD点数据,将采集的GPS车辆OD点数据划分为训练数据集和测试数据集,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器;

所述OD点数据聚类结果获取模块,用于使所述的元学习器获取所述GPS车辆OD点数据的对应的车辆OD点类型,利用该车辆OD点类型对应的最佳聚类方法对该GPS车辆OD点数据进行聚类,得到该GPS车辆OD点数据聚类的结果。

本发明提供了一种基于元学习的车辆OD点聚类装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如上述任一技术方案所述的基于元学习的车辆OD点聚类方法。

本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机该程序被处理器执行时,实现如上述任一技术方案所述的基于元学习的车辆OD点聚类方法。

与现有技术相比,本发明的有益效果包括:通过采集不同类型的GPS车辆OD点数据,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;采集GPS车辆OD点数据,将采集的GPS车辆OD点数据划分为训练数据集和测试数据集,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器;重新采集GPS车辆OD点数据,利用所述的元学习器获取所述GPS车辆OD点数据的对应的车辆OD点类型,利用该车辆OD点类型对应的最佳聚类方法对该GPS车辆OD点数据进行聚类,得到该GPS车辆OD点数据聚类的结果;实现了对于多种不同类型的车辆OD点数据,均能得到最佳的聚类结果。

附图说明

图1为本发明提供的基于元学习的车辆OD点聚类方法的流程示意图;

图2为本发明提供的利用K-means算法得到的车辆OD点数据的聚类结果;

图3为本发明提供的利用AGNES算法得到的车辆OD点数据的聚类结果;

图4为本发明提供的利用dbscan算法得到车辆OD点数据的聚类结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例1

本发明实施例提供了一种基于元学习的车辆OD点聚类方法,所述方法的流程示意图,如图1所示,所述方法包括以下步骤:

S1、采集不同类型的GPS车辆OD点数据,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;

S2、采集GPS车辆OD点数据,将采集的GPS车辆OD点数据划分为训练数据集和测试数据集,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器;

S3、重新采集GPS车辆OD点数据,利用所述的元学习器获取所述GPS车辆OD点数据的对应的车辆OD点类型,利用该车辆OD点类型对应的最佳聚类方法对该GPS车辆OD点数据进行聚类,得到该GPS车辆OD点数据聚类的结果。

具体实施例时,在采集车辆的GPS轨迹数据时,通过车辆内置的GPS设备收集车辆的历史轨迹;对于车辆历史行驶的GPS轨迹数据,是由众多车辆的GPS设备采集的轨迹数据,形成的多条完整轨迹构成,数据一般包括记录车辆的车牌号、定位时间、经度、纬度、速度和方位角等信息。

优选的,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,使用不同的聚类算法分别对不同类型的GPS车辆OD点数据进行聚类,得到不同类型的GPS车辆OD点数据对应的聚类评价指标,根据不同类型GPS车辆OD点数据的聚类评价指标,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;

优选的,所述不同的聚类算法,具体包括,原型聚类算法、密度聚类算法及层次聚类算法;

需要说明的是,原型聚类也叫‘基于原型的聚类’,此类算法假设聚类结构能通过一组原型刻画,通常情形下,算法对原型进行初始化,然后对原型进行迭代求解,具体实施例可采用原型聚类中的K-means算法,K-means算法的目标是使同类中的样本更加相似,不同类中样本越不相似;密度聚类也叫‘基于密度的聚类’,此类算法假设聚类结构能通过样本分布的紧密程度确定;密度聚类算法从样本密度的角度来考察样本之间的可连续性,并基于可连接样本不断扩展聚类簇以获得最终的聚类结果,具体实施例时可采用密度聚类中的dbscan算法;层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构;数据集的划分可采用‘自底向上’的聚类策略,也可采用‘自顶向下’的分拆策略,具体实施例时可采用一种自底向上聚合策略的层次聚类方法AGNES;

优选的,根据不同类型GPS车辆OD点数据的聚类评价指标,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,获取不同类型GPS车辆OD点数据,在不同的聚类算法聚类下得到的DBI值或DI值,根据所述DBI值或DI值,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;

需要说明的是,聚类评价指标也分为内部和外部,因为对部分数据进行聚类,所以采用不利用参考模型直接考察聚类结果的内部指标作为评价指标,常用的有DBI、DI等,DBI值越小、DI值越大,代表聚类效果越好;

优选的,根据所述DBI值,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,

比较不同类型GPS车辆OD点数据在不同的聚类算法聚类下得到的DBI值;若某种类型的GPS车辆OD点数据在某种类聚类算法聚类下得到的DBI值相比该类型的GPS车辆轨迹数据在其他种类聚类算法聚类下得到的DBI值都小,则该种类的聚类算法是该类型的GPS车辆OD点数据对应的最佳聚类算法;

优选的,根据所述DI值,获取不同类型GPS车辆OD点数据对应的最佳聚类算法,具体包括,

比较不同类型GPS车辆OD点数据在不同的聚类算法聚类下得到的DI值;若某种类型的GPS车辆OD点数据在某种类聚类算法聚类下得到的DI值相比该类型的GPS车辆OD点数据在其他种类聚类算法聚类下得到的DI值都大,则该种类的聚类算法是该类型的GPS车辆OD点数据对应的最佳聚类算法;

优选的,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器,具体包括,计算测试数据与各个训练数据之间的欧式距离,在测试数据中选取所述欧式距离最小的k个训练数据点,确定所述k个训练数据点所对应的车辆OD点类型的频率,返回频率最高的车辆OD点类型作为测试数据的预测分类;k为正整数;

需要说明的是,为了让每一种车辆OD点数据都可以自适应选择最佳的组合进行聚类,这里采用元学习(Meta Learning)或者叫做“学会学习”,应用元学习器,对不同训练样本的输入元特征集X与目标特征集Y,进行训练,得出元学习器模型;常见的机器学习算法可作为元学习器模型的有:决策树(CART)、多层感知机(MLP)、K-最近邻(KNN)算法;本实施例采用KNN作为元学习器模型;

采用元学习的思想,建立KNN最近邻元学习器,对所有车辆OD点数据进行聚类算法推荐,对未知的车辆OD点,分类出车辆OD点的类型,针对不同类型的车辆OD点数据,选择最佳的聚类算法进行聚类,以最佳聚类算法来确定如何聚类,达到最佳聚类效果;

一个具体实施例中,利用所述K-means算法,得到的车辆OD点数据的聚类结果,如图2所示,利用所述AGNES算法,得到的车辆OD点数据的聚类结果,如图3所示,利用dbscan算法,得到车辆OD点数据的聚类结果,如图4所示。

实施例2

本发明实施例提供了一种基于元学习的车辆OD点聚类方法的系统,包括最佳聚类算法获取模块、元学习器构建模块及OD点数据聚类结果获取模块;

所述最佳聚类算法获取模块,用于采集不同类型的GPS车辆OD点数据,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;

所述元学习器构建模块,用于采集GPS车辆OD点数据,将采集的GPS车辆OD点数据划分为训练数据集和测试数据集,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器;

所述OD点数据聚类结果获取模块,用于使所述的元学习器获取所述GPS车辆OD点数据的对应的车辆OD点类型,利用该车辆OD点类型对应的最佳聚类方法对该GPS车辆OD点数据进行聚类,得到该GPS车辆OD点数据聚类的结果。

实施例3

本发明实施例提供了一种基于元学习的车辆OD点聚类装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如实施例1所述的基于元学习的车辆OD点聚类方法。

实施例4

一种计算机可读存储介质,其上存储有计算机程序,所述计算机该程序被处理器执行时,实现如实施例1所述的基于元学习的车辆OD点聚类方法。

本发明公开了一种基于元学习的车辆OD点聚类方法、系统、装置及计算机可读存储介质,通过采集不同类型的GPS车辆OD点数据,获取不同类型GPS车辆OD点数据对应的最佳聚类算法;采集GPS车辆OD点数据,将采集的GPS车辆OD点数据划分为训练数据集和测试数据集,利用所述训练数据集和测试数据集训练得到用于车辆OD点类型划分的元学习器;重新采集GPS车辆OD点数据,利用所述的元学习器获取所述GPS车辆OD点数据的对应的车辆OD点类型,利用该车辆OD点类型对应的最佳聚类方法对该GPS车辆OD点数据进行聚类,得到该GPS车辆OD点数据聚类的结果;实现了对于多种不同类型的车辆OD点数据,均能得到最佳的聚类结果;对不同类型的车辆OD点数据选择合适的聚类方法,有利于高效挖掘出城市热点区域。

以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。

相关技术
  • 基于元学习的车辆OD点聚类方法、系统、装置及存储介质
  • 基于元学习的法律案件风险点识别方法及系统
技术分类

06120112201639