掌桥专利:专业的专利平台
掌桥专利
首页

一种共享单车流量预测方法及系统

文献发布时间:2023-06-19 12:25:57


一种共享单车流量预测方法及系统

技术领域

本公开属于共享单车流量预测技术领域,尤其涉及一种共享单车流量预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。

共享单车是在“互联网+”和共享经济社会背景下产生的一种新型的自行车使用方式,它的出现很好的解决了居民出行解决“最后一公里”的问题,这一服务目前城市都已经十分普及。借助于共享单车系统,人们可以很容易地在共享单车公司提供的地点租借或归还自行车。共享单车服务的出现使得公共交通的利用率有了很大限度的提高,道路交通拥堵问题也得到了有效的缓解。

然而,共享单车在方便用户出行的同时,也存在一些影响客户骑行体验的不利因素。其中,最明显的不利因素是自行车站点在不同服务区域的分布不均匀所造成的使用不平衡。有些地区有借车需求的用户数比较多,需要站点提供的单车数量超出了站点的储备数量;有些地区因为地理位置的偏僻需要用车的用户数量很少,所以站点的单车就一直处于闲置状态,造成了资源的浪费。共享单车站点间供应不平衡的问题通常是由用户的出行方式所造成的:用户一般都是早晨从家中离开,到工作地点上班。这个时候位于居民区的自行车就会被过度使用;相反,位于工作地点的自行车在早上就会大量堆积,造成供应过剩。下午的情况则完全相反。两种情况都会导致自行车在城市不同时间不同站点的供应不平衡。为了解决这个问题,共享单车运营商会使用货车在各个站点之间源源不断地运输共享单车,人为进行调度来恢复共享单车系统的正常运营,这显然是一种费时费力、治标不治本的解决方案。

为此,国内外研究人员对于共享单车系统的使用量预测问题展开了长久而又深入的研究:Lin等人介绍了一个自行车共享策略设计问题,其中包括一个自行车车库存储系统和一个基于库存中心的模型。涉及设计工作的各个方面,如共享自行车系统的车站的数量和位置,自行车道的创建以及自行车出行路线的创建等,为城市交通吞吐量及其平衡与重新平衡策略找到了一个更好的解决方案。Y.Li,郑宇等人提出了一个分层预测模型来预测在未来的时间里自行车将被租用或退还的数量,它更侧重于在自行车共享系统中的宏观交通流量而不是微型旅行目的地和持续时间,这对分享自行车系统分析和出行预测的研究方法极其重要的参考价值。其文献中提出的预测模型首先将自行车站点采用GC和K-means进行双层聚类,然后利用基于多重相似性的推理模型来预测租借和返回的自行车数量。新的预测模型相比于不采用聚类方式的预测,在预测的准确率上有所提高。而GC或K-means聚类需要预先设置聚类的个数即K值,且聚类的效果依赖于初始中心值的选取,而初始中心值的设置具有一定的随机性,因此每次预测结果具有一定的偏差,结果不稳定。W.Jia,Y.Tan等人基于先前的工作将AP聚类与多相似度参考模型相结合来预测共享单车系统在未来时间内的借还数量,在聚类时并不需要指定聚类数,得到的结果相较于先前的研究更为稳定,但是受限于多相似度参考模型的局限性,预测精度仍有很大的提升空间。

发明人发现,现有方法虽然对于共享单车系统的使用量预测问题提供了大量的解决方案,但是仍然存在一系列的问题,尤其是现有方法无法对影响共享单车使用情况的特征进行有效的捕捉,导致城市未来时间共享单车各个站点的使用量的预测不合理、精确度不高的问题。

发明内容

本公开为了解决上述问题,提供了一种共享单车流量预测方法及系统,所述方案通过基于层次迭代的高斯混合聚类模型对共享单车站点进行聚类,引入了类与类之间的迁移趋势,得到的结果更加稳定且具有很好的鲁棒性;同时,利用空间重构后的共享单车站点更具有时间、空间相关性,可以很好的增加预测的精度。

根据本公开实施例的第一个方面,提供了一种共享单车流量预测方法,包括:

获取城市的共享单车站点信息、历史行程信息以及对应的气象数据;

基于所述共享单车站点信息以及历史行程信息,利用层次迭代的高斯混合聚类模型对站点进行聚类;

根据聚类结果,将城市区域划分为上下两层空间结构,对共享单车站点进行区域重构,获得每个共享单车站点区域借车还车矢量矩阵;

基于所述气象数据获得该城市气象特征矩阵;

将所述借车还车矢量矩阵和城市气象特征矩阵输入预训练的深度时空残差网络中,获得未来时间各个共享单车区域的借车数量和还车数量的预测结果。

进一步的,所述利用层次迭代的高斯混合聚类模型对站点进行聚类,具体包括:

利用共享单车站点信息,对共享单车站点采用高斯混合聚类方法进行聚类,得到多个初始类簇;

根据历史行程信息,计算各类簇两两之间的车辆转移数量,得到迁移趋势矩阵,对所述迁移趋势矩阵进行范数处理;

基于所述迁移趋势矩阵的范数和共享单车站点信息采用高斯混合聚类方法进行聚类,得到新的类簇,重复执行上述过程,直至新的聚类结果趋于稳定。

进一步的,所述将城市区域划分为上下两层空间结构,对共享单车站点进行区域重构,具体包括:将共享单车原始站点作为下层空间架构,将层次迭代聚类后的聚类中心所在的共享单车站点作为新的空间点,组成上层空间架构;下层空间包括所有的共享单车站点,上层空间只保留聚类中心所对应的共享单车站点。

根据本公开实施例的第二个方面,提供了一种共享单车流量预测系统,包括:

数据获取单元,其用于获取城市的共享单车站点信息、历史行程信息以及对应的气象数据;

聚类单元,其用于基于所述共享单车站点信息以及历史行程信息,利用层次迭代的高斯混合聚类模型对站点进行聚类;

区域重构单元,其用于根据聚类结果,将城市区域划分为上下两层空间结构,对共享单车站点进行区域重构,获得每个共享单车站点区域借车还车矢量矩阵;

气象特征获取单元,其用于基于所述气象数据获得该城市气象特征矩阵;

预测单元,其用于将所述借车还车矢量矩阵和城市气象特征矩阵输入预训练的深度时空残差网络中,获得未来时间各个共享单车区域的借车数量和还车数量的预测结果。

根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种共享单车流量预测方法。

根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种共享单车流量预测方法。

与现有技术相比,本公开的有益效果是:

本公开所述方案提出了一种基于高斯混合聚类-时空残差网络的共享单车流量预测模型,基于历史数据对未来时间城市共享单车站点的使用量进行预测。其核心的基于层次迭代的高斯混合聚类模型对共享单车站点进行聚类的思想与传统聚类方法相比,最大的不同是引入了类与类之间的迁移趋势,得到的结果更加稳定且具有很好的鲁棒性。此外,进行空间重构后的共享单车站点更具有时间、空间相关性,可以很好的增加预测的精度。同时,通过大量的实验证明了本公开所述方法的鲁棒性和稳定性。

本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1为本公开实施例一中所述的共享单车流量预测方法流程图;

图2为本公开实施例一中所述的基于层次迭代的高斯混合聚类示意图;

图3为本公开实施例一中所述的共享单车站点空间重构示意图。

具体实施方式

下面结合附图与实施例对本公开做进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。

实施例一:

本实施例的目的是提供一种共享单车流量预测方法。

为了克服现有技术的不足,本发明提供了一种基于高斯混合聚类-时空残差网络的共享单车流量预测模型,用来对未来时间城市内各个共享单车站点的使用量进行预测。首先我们提出了一个基于层次迭代的高斯混合聚类模型,用来共享单车站点进行聚类,使其划分成许多不同的区域。该模型在传统高斯混合聚类模型(仅考虑位置信息)基础上,引入了类与类之间的迁移趋势,通过进行一定次数的聚类迭代来得到稳定的聚类效果,具有很好的鲁棒性。其次,我们提出了一种空间层次架构划分方法,以先前得到的聚类结果为基础,将城市区域划分成了上下两层空间架构。具体来说,我们以共享单车的站点位置作为下层空间架构,对其空间位置进行批量重构,将层次迭代聚类后的聚类中心所在的站点作为新的空间点,即上层空间架构,这样一来既保留了空间位置的相对信息,又能维持中心信息之间的相互关联。在此基础上,我们使用深度时空残差网络(ST-ResNet)对城市未来时期共享单车区域(聚类中心形成的新的区域)的使用情况进行批量预测,根据时间连续性,周期性和趋势性,设计残差卷积单元建模交通流量特征,然后将三个残差网络进行动态聚合,再结合气象因素得到最终预测结果。如图1所示,一种共享单车流量预测方法,包括:

步骤1:获取城市的共享单车站点信息、历史行程信息以及对应的气象数据;

其中,所述站点信息包括车站的经纬度信息。历史行程信息包括每次出行的行程持续时间,出发时间,结束时间,出发车站ID,出发车站名称,出发车站纬度、经度,结束车站ID,结束车站名称,结束车站纬度、经度,单车ID,用户类型等。

步骤2:基于所述共享单车站点信息以及历史行程信息,利用层次迭代的高斯混合聚类模型对站点进行聚类;

其中,所述步骤2包括:

步骤2.1:根据地理位置对共享单车车站信息采用高斯混合聚类方法进行聚类,得到多个初始类簇;

步骤2.2:根据历史行程数据,计算各类簇两两之间的车辆转移数量,得到租出迁移趋势矩阵,对所述迁移趋势矩阵进行范数处理;

步骤2.3:基于租出迁移趋势矩阵的范数和地理位置采用高斯混合聚类方法进行聚类,得到新的类簇,重复执行步骤2.2-2.3,直至新的聚类结果趋于稳定。

步骤3:根据聚类结果,将城市区域划分为上下两层空间结构,对共享单车站点进行区域重构,获得每个共享单车站点区域借车还车矢量矩阵;

其中,所述步骤3具体包括:

根据聚类结果,对共享单车站点进行区域重构。以得到的聚类中心为中心,重新计算各个共享单车站点区域每小时的共享单车借车数量与还车数量,并基于所得结果生成一个二维矩阵;

步骤4:基于所述气象数据获得该城市气象特征矩阵;

其中,所述气象特征矩阵包括:天气,温度和风速,提取每小时天气特征值,使用0-1矩阵描述,定义四类天气(常见):晴天、雨天、雪天、雾天。矩阵行表示每小时的气象特征,矩阵列分为7列:小时戳(记录所属的小时)、晴天、雨天、雪天、雾天、温度值、风速值,如果这一小时发生这类天气则标注为1,否则为0。温度和风速我们使用数值描述,单位分别为摄氏度和英里(mph)。

步骤5:将所述借车还车矢量矩阵和城市气象特征矩阵输入预训练的深度时空残差网络中,获得未来时间各个共享单车区域的借车数量和还车数量的预测结果。

以下对高斯混合模型和高斯混合模型聚类进行简单说明:

(一)高斯混合模型

高斯混合模型(Gaussian Mixture Model,简称GMM)是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。在本章中,选择高斯混合模型来聚类共享单车站点,其中依据每个站点的特性进行的分类。每个GMM由K个Gaussian分布组成,每个Gaussian称为一个‘Component’,这些Component线性加成在一起就组成了GMM的概率密度函数,如公式(1)所示:

其中,GMM的K个Component对应了K个cluster,π

现在有N个数据点,并假设它们服从某个分布(记作p(x)),现在要确定里面的一组参数π

我们把这个乘积称为似然函数,通常单个点的概率都很小,许多很小的数字相乘起来在计算机里很容易造成浮点数下溢,因此对p(x)取对数,把乘积转换为加和,如公式(3)所示:

从而得到log-likelihood function。然后我们把这个函数最大化,即找到一组参数π

由于在对数函数里面又有加和,没法直接求导解方程的方法直接求出最大值,为了解决这个问题,本发明采取GMM中随机选点的办法:分成E步和M步两步,即EM算法。EM算法是一种从不完全数据或有数据丢失的数据集(存在隐含变量)中,求解概率模型参数的最大似然估计方法。E步利用隐藏变量的现有估计值,计算其最大似然估计值;M步最大化在E步上求得的最大似然值来计算参数的值;迭代直到收敛。

EM算法流程:

(1)估计数据由每个“Component”生成的概率(并不是每个“Component”被选中的概率):对于每个数据x

其中N(x

(2)通过最大似然估计可以通过求导,令参数=0来获得参数μ和Σ的值:

其中,

(3)重复迭代的前两个步骤,直到似然函数的值收敛。

(二)、高斯混合模型聚类

高斯混合模型聚类(Gaussian Mixture Model Cluster)是在高斯混合模型的基础上利用GMM生成数据样本的“逆过程”:给定聚类簇数K,通过给定的数据集,以某一种参数估计的方法,推导出每一个混合成分的参数(即均值向量)μ、协方差矩阵Σ和权重π,每一个多元高斯分布成分即对应于聚类后的一个簇。当参数估计过程完成后,对于每一个样本点,根据贝叶斯定理计算出其属于每一个簇的后验概率,并将样本划分到后验概率最大的簇上去。相对于K-means等直接给出样本点的簇划分的聚类方法,GMM这种给出样本点属于每个簇的概率的聚类方法,被称为软聚类(Soft Clustering)。

实施例二:

本实施例的目的是提供一种共享单车流量预测系统。

一种共享单车流量预测系统,包括:

数据获取单元,其用于获取城市的共享单车站点信息、历史行程信息以及对应的气象数据;

聚类单元,其用于基于所述共享单车站点信息以及历史行程信息,利用层次迭代的高斯混合聚类模型对站点进行聚类;

区域重构单元,其用于根据聚类结果,将城市区域划分为上下两层空间结构,对共享单车站点进行区域重构,获得每个共享单车站点区域借车还车矢量矩阵;

气象特征获取单元,其用于基于所述气象数据获得该城市气象特征矩阵;

预测单元,其用于将所述借车还车矢量矩阵和城市气象特征矩阵输入预训练的深度时空残差网络中,获得未来时间各个共享单车区域的借车数量和还车数量的预测结果。

进一步的,所述利用层次迭代的高斯混合聚类模型对站点进行聚类,具体包括:

利用共享单车站点信息,对共享单车站点采用高斯混合聚类方法进行聚类,得到多个初始类簇;

根据历史行程信息,计算各类簇两两之间的车辆转移数量,得到迁移趋势矩阵,对所述迁移趋势矩阵进行范数处理;

基于所述迁移趋势矩阵的范数和共享单车站点信息采用高斯混合聚类方法进行聚类,得到新的类簇,重复执行上述过程,直至新的聚类结果趋于稳定。

进一步的,所述将城市区域划分为上下两层空间结构,对共享单车站点进行区域重构,具体包括:将共享单车原始站点作为下层空间架构,将层次迭代聚类后的聚类中心所在的共享单车站点作为新的空间点,组成上层空间架构。下层空间包括所有的共享单车站点,上层空间只保留聚类中心所对应的共享单车站点,以得到的聚类中心为中心,重新计算各个共享单车站点区域预设时间段内的共享单车借车数量与还车数量,获得借车还车矢量矩阵。

在更多实施例中,还提供:

一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。

应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。

一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。

实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。

本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

上述实施例提供的一种共享单车流量预测方法及系统可以实现,具有广阔的应用前景。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

相关技术
  • 一种共享单车流量预测方法及系统
  • 基于站点行为分析的共享单车流量预测方法及系统
技术分类

06120113297864