掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据的交通状况预测方法及系统

文献发布时间:2023-06-19 10:29:05


一种基于大数据的交通状况预测方法及系统

技术领域

本发明涉及交通预测技术领域,具体的说是一种基于大数据的交通状况预测方法及系统。

背景技术

随着城市化发展,交通基础设施与汽车保有量之间的矛盾更加严峻,拥堵问题更加严重,不可避免地导致经济损失、出行时间耗费并加剧环境污染。交通拥堵的治理首在预防,根据道路的现有交通状态预测出短时间内的交通状态变化趋势,并对可能出现的拥堵现象进行预警;然后利用交通广播、微博等信息平台发出预警,疏导车辆合理选择行驶路线、加强秩序管理,以避免拥堵或缓解拥堵程度。因此,如何建立长效模型对交通拥堵进行及时预警是城市智能交通系统优化的研究热点。现有技术中也有很多的交通状况预测方法,这些方法大多基于交通流量利用诸如机器学习算法或者深度学习算法能复杂算法实现预测,这些方法普遍存在实现困难的问题。

发明内容

为了解决现有技术中的不足,本发明提供一种基于大数据的交通状况预测方法及系统,预测结果精确度高,并且简单易行。

为了实现上述目的,本发明采用的具体方案为:一种基于大数据的交通状况预测方法,包括如下步骤:

S1、获取基础数据,基础数据包括地图数据和车辆轨迹数据;

S2、在基础数据中添加时间标签,得到分析样本数据;

S3、基于分析样本数据生成初步预测结果;

S4、获取动态数据,动态数据包括交通中断数据;

S5、利用动态数据对初步预测结果进行优化得到优化预测结果;

S6、对优化预测结果进行误差修正,得到最终预测结果。

作为上述基于大数据的交通状况预测方法的进一步优化:S1中,地图数据由多个道路子数据组成,道路子数据的包括道路起点、道路终点和道路容量;

获取车辆轨迹数据的方法包括:

S11、获取车辆位置信息的读取权限;

S12、获取车辆在多个样本周期中的多个原始轨迹数据,原始轨迹数据由多个道路子数据组成;S13、从所有的原始轨迹数据中抽取所有的道路子数据,并且为每个道路子数据赋予一个位置权重得到位置样本数据;

S14、将所有位置样本数据组合成车辆轨迹数据。

作为上述基于大数据的交通状况预测方法的进一步优化:S2的具体方法包括:

S21、将二十四个小时平均分隔成多个时间片段;

S22、在每个位置样本数据中添加一个或者多个时间片段;

S23、对同一个位置样本数据中的所有时间片段进行聚合得到时间标签;

S24、将地图数据与添加过时间标签的车辆轨迹数据作为分析样本数据。

作为上述基于大数据的交通状况预测方法的进一步优化:S3的具体方法包括:

S31、基于S11中获取车辆位置信息的读取权限的成功率计算增量基准值;

S32、对地图进行区域划分得到多个预测区域,并且将地图数据映射到预测区域中;

S33、生成多个与预测区域一一对应的增量调节值;

S34、将所有的增量调节值逐一与增量基准值相融合得到多个增量实际值;

S35、根据车辆轨迹数据生成道路负载基准数据;

S36、将道路负载基准数据与增量实际值相加得到道路负载初始预测数据;

S37、将所有道路负载初始预测数据整合成初步预测结果。

作为上述基于大数据的交通状况预测方法的进一步优化:S35的具体方法包括:

S351、构建时间轴,时间轴将二十四个小时平均分成多个时间元,时间元的长度小于时间片段的长度;

S352、将时间标签映射到时间轴上;

S353、计算在一个时间元中道路子数据关联的所有车辆轨迹数据的数量,记为容量分析值;

S354、根据容量分析值和道路子数据中的道路容量计算道路负载基准数据。

作为上述基于大数据的交通状况预测方法的进一步优化:S4中,交通中断数据包括道路子数据和中断原因数据,中断原因数据为事故子数据和/或施工子数据,动态数据还包括天气数据。

作为上述基于大数据的交通状况预测方法的进一步优化:S5的具体方法包括:

S51、基于交通中断数据生成负载优化值;

S52、将负载优化值与道路负载初始预测数据相融合得到道路负载优化预测数据;

S53、将初步预测结果中的道路负载初始预测数据替换为道路负载优化预测数据;

S54、基于天气数据生成负载批处理值;

S55、利用负载批处理值对初步预测结果中的道路负载初始预测数据和道路负载优化预测数据进行批处理得到优化预测结果。

作为上述基于大数据的交通状况预测方法的进一步优化:S6的具体方法包括:

S61、基于道路子数据获取历史拥堵数据;

S62、基于历史拥堵数据生成误差修正值;

S63、利用误差修正值对优化预测结果进行误差修正,得到最终预测结果。

一种基于大数据的交通状况预测系统,用于执行上述的基于大数据的交通状况预测方法,所述系统包括:

数据传输机构,用于获取基础数据和动态数据,以及用于输出最终预测结果;

数据处理机构,用于生成分析样本数据、初步预测结果、优化预测结果和最终预测结果;

数据存储机构,用于存储基础数据和最终预测结果。

有益效果:本发明基于车辆的轨迹得到在目标时刻车辆出现在道路上的数量,并且通过与道路容量做对比判断是否会发生拥堵,此外还综合考虑了交通事故、施工以及天气等影响因素,从而保证了预测结果的精确度,与传统的通过计算实时交通流量的方式相比,更加简单易行。

附图说明

图1是本发明的流程图;

图2是具体实施方式中的地图示例图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,一种基于大数据的交通状况预测方法,包括S1至S6。

S1、获取基础数据,基础数据包括地图数据和车辆轨迹数据。

S1中,地图数据由多个道路子数据组成,道路子数据的包括道路起点、道路终点和道路容量。道路子数据可以表示为[c

S1中,获取车辆轨迹数据的方法包括S11至S14。

S11、获取车辆位置信息的读取权限。车辆位置信息的数据源可以是车载导航系统或者驾驶员的智能手机等设备,考虑到位置信息属于个人的敏感信息,因此首先获取车辆位置信息的读取权限,若获取成功则执行S12,若获取失败则终止。

S12、获取车辆在多个样本周期中的多个原始轨迹数据,原始轨迹数据由多个道路子数据组成。在城市交通中,车辆可以简单分为两类,分别是家用车辆和营运车辆,其中家用车辆主要用于日常通勤,其轨迹较为固定,营运车辆中的公共汽车因为线路固定,其轨迹也是固定的,另一方面,因为通勤时间和公共汽车的营运时间也是固定的,因此可以认为家用车辆和公共汽车总会在固定的时间出现在固定的道路上。需要说明的是,公共汽车的轨迹应当是唯一的,但是家用车辆不同,虽然家用车辆的轨迹较为固定,但是其轨迹不是唯一的,可能会存在多个轨迹,例如在图2中,当家用车辆Car

S13、从所有的原始轨迹数据中抽取所有的道路子数据,并且为每个道路子数据赋予一个位置权重得到位置样本数据。对于家用车辆来说,虽然可能对应有多个原始轨迹数据,但是在实际出行过程中选择每个轨迹的概率是不同的,例如在G

S14、将所有位置样本数据组合成车辆轨迹数据。车辆轨迹数据由多个具有轨迹权重的道路子数据组成,可以采用多元组的方式表示,例如Car

S2、在基础数据中添加时间标签,得到分析样本数据。具体地说,时间标签添加到车辆轨迹数据中。时间标签用于标识车辆按照车辆轨迹数据行驶时所处的时间。

S2的具体方法包括S21至S24。

S21、将二十四个小时平均分隔成多个时间片段。时间片段的数量越多,则时间标签的精确度越高,但是相应地会造成后续处理过程变复杂,在实际应用时,可以根据需求选择合适的时间片段的数量,具体地说,如果当地车辆保有量较大,或者道路通行能力较弱,更加容易出现拥堵时可以增加时间片段的数量,反之,如果当地的车辆保有量较小,或者道路通行能力较强,不容易出现拥堵时可以减少时间片段的数量,以降低方法的复杂度。例如在本实施例中,可以将24个小时平均分为480个时间片段,每个时间片段的长度为3分钟,时间片段表示为t

S22、在每个位置样本数据中添加一个或者多个时间片段。因为车辆在通过道路的过程中需要时间,所需要的时间长度与道路长度正相关,在位置样本数据中添加时间片段能够表征车辆在该位置样本数据对应的道路上的行进时间,同一时间段中位于同一道路上的车辆越多则越容易接近道路容量,进而更加容易出现拥堵。添加完时间片段后的位置样本数据可以表示为[c

S23、对同一个位置样本数据中的所有时间片段进行聚合得到时间标签。当一个位置样本数据中包含多个时间片段时,会导致难以记录和处理,因此需要将时间片段聚合成时间标签,以降低后续过程的复杂度。聚合后的时间标签可以表示为t

GJ

S24、将地图数据与添加过时间标签的车辆轨迹数据作为分析样本数据。

S3、基于分析样本数据生成初步预测结果。S3的具体方法包括S31至S37。

S31、基于S11中获取车辆位置信息的读取权限的成功率计算增量基准值。因为作为分析样本数据之一的车辆轨迹数据需要经过车辆授权之后才能够逐步得到,若未获得授权则意味着会丢失该车辆的车辆轨迹数据,这会直接影响预测结果的精确度,为了提升预测结果的精度度,需要考虑这部分未获得读取权限的车辆的干扰。增量基准值的计算方法为

S32、对地图进行区域划分得到多个预测区域,并且将地图数据映射到预测区域中。在城市中,不同区域出现拥堵的概率是不同的,同时不同区域对人的吸引力也是不同的,在日常通勤中,下班之后人们除了回家之外,还有可能去娱乐或者消费,因此,对于包含了大型商场或者娱乐中心的区域来说,除了应当考虑区域内正常通勤经过的车辆来说,还应当考虑从其它区域过来的车辆,因此需要进行预测区域的划分,以精确评估每个预测区域中可能出现的交通状况,进而提升整体预测结果的精确度。

S33、生成多个与预测区域一一对应的增量调节值。预测区域可以划分为多个类别,不同类别对应的增量调节值不同,例如,可以将预测区域划分为中央商务区、居民聚集区、工业集聚区、城乡过渡区和城郊乡村区,五类预测区域对应的增量调节值逐渐降低。增量调节值记为μ,并且μ<0.3。

S34、将所有的增量调节值逐一与增量基准值相融合得到多个增量实际值。具体的融合方法为

S35、根据车辆轨迹数据生成道路负载基准数据。S35的具体方法包括S351至S534。

S351、构建时间轴,时间轴将二十四个小时平均分成多个时间元,时间元的长度小于时间片段的长度。因为时间片段是为了形成与车辆相对应的车辆轨迹数据,其作用的对象为车辆本身,而时间元是为了产生交通预测结果,其作用的对象为城市整体的交通情况,因此对时间元的精度要求要高于对时间片段的精度要求,因此时间元的长度小于时间片段的长度,相应的时间元的数量大于时间片段的数量。

S352、将时间标签映射到时间轴上。因为时间片段的长度大于时间元的长度,所以时间标签映射到时间轴上的时候时间标签会对应于多个时间元。

S353、计算在一个时间元中道路子数据关联的所有车辆轨迹数据的数量,记为容量分析值。在同一时间,道路子数据关联的车辆轨迹数据的数量越多,则说明该道路子数据对应的道路上可能出现的车辆越多,也更加容易出现拥堵,因此一个时间元中道路子数据关联的所有车辆轨迹数据的数量记为容量分析值,容量分析值记为RF。

S354、根据容量分析值和道路子数据中的道路容量计算道路负载基准数据。道路负载基准数据的具体计算方法为

S36、将道路负载基准数据与增量实际值相加得到道路负载初始预测数据。即道路负载初始预测数据BDS=BDJ+θ。因为增量实际值包括了增量调节值和增量基准值,即包含了预测区域的类型以及未能成功获取位置信息读取权限的车辆可能产生的干扰这两种影响因素,因此道路负载初始预测数据应当大于道路负载基准数据,当BDS≥1时,说明道路上可能出现的车辆数量不小于道路容量,因此道路将会出现堵塞,而BDS越小,则说明道路上可能出现的车辆与道路容量之间的差距越大,就越不容易出现拥堵。

S37、将所有道路负载初始预测数据整合成初步预测结果。

S4、获取动态数据,动态数据包括交通中断数据。S4中,交通中断数据包括道路子数据和中断原因数据,中断原因数据为事故子数据和/或施工子数据,动态数据还包括天气数据。除了预测区域的类型以及未能成功获取位置信息读取权限的车辆可能产生的干扰这两种影响因素之外,在实际情况中,还会出现更多的可能导致出现堵塞的情况,其中交通中断和恶劣天气是最为常见的两种因素,因此本发明进一步考虑这两种因素,以进一步优化道路负载初始预测数据。具体地说,若出现恶劣天气,例如雨雪天气,则在多数道路上都会出现拥堵概率提升的情况,而交通中断只会导致部分道路出现拥堵的概率大幅度提升,其中事故子数据会导致道路短时间内出现拥堵概率大幅提升的情况,而施工子数据会导致道路长时间内出现拥堵概率大幅提升的情况。

S5、利用动态数据对初步预测结果进行优化得到优化预测结果。S5的具体方法包括S51至S55。

S51、基于交通中断数据生成负载优化值。当交通中断数据为事故子数据时,生成事故因子A,当交通中断数据为施工子数据时,生成施工因子C,负载优化值bd=A+C,其中若不存在事故子数据则A=0,若不存在施工子数据则C=0。

S52、将负载优化值与道路负载初始预测数据相融合得到道路负载优化预测数据。因为交通中断数据与道路是对应的,与其它道路之间无直接关联,因此将负载优化值bd添加到初步预测结果中对应的道路负载初步预测数据中即可。

S53、将初步预测结果中的道路负载初始预测数据替换为道路负载优化预测数据。

S54、基于天气数据生成负载批处理值。因为恶劣天气对交通的影响是全方位的,会作用在每个道路上,因此当出现恶劣天气时需要对初步预测结果中的所有数据进行统一批处理,负载批处理值记为W。

S55、利用负载批处理值对初步预测结果中的道路负载初始预测数据和道路负载优化预测数据进行批处理得到优化预测结果。具体地说,是将负载批处理值W添加到所有的道路负载初始预测数据和道路负载优化预测数据中,得到道路负载处理预测结果,然后将所有的道路负载处理预测结果整合为优化预测结果。

S6、对优化预测结果进行误差修正,得到最终预测结果。S6的具体方法包括S61至S63。优化预测结果已经覆盖了车辆因素、区域因素、事故因素、施工因素和天气因素等多种可能导致出现拥堵的因素,但是仍然可能存在误差,主要是理论预测与实际结果之间可能存在的偏差,为了消除这种偏差,进一步提升预测结果的精确度,需要再次对优化预测结果进行误差修正。

S61、基于道路子数据获取历史拥堵数据。历史拥堵数据与道路相对应,在获取到历史拥堵数据之后可以对优化预测结果中对应道路的道路负载初始预测数据或者道路负载优化预测数据进行误差修正。

S62、基于历史拥堵数据生成误差修正值。历史拥堵数据也可以采集多个样本周期内的拥堵数据,利用在多个样本周期内道路出现的历史拥堵数据的次数生成误差修正值F,误差修正值F的大小与历史拥堵数据的次数负相关。因为拥堵与道路是相对应的,因此误差修正值F也是与道路一一对应的。

S63、利用误差修正值对优化预测结果进行误差修正,得到最终预测结果。具体地说,是将误差修正值F与优化预测结果中对应的道路负载处理结果叠加得到道路负载修正预测结果,然后用道路负载修正预测结果替换掉优化预测结果中的道路负载处理预测而结果得到最终预测结果。

一种基于大数据的交通状况预测系统,用于执行上述的基于大数据的交通状况预测方法,系统包括数据传输机构、数据处理机构和数据存储机构。

数据传输机构,用于获取基础数据和动态数据,以及用于输出最终预测结果。

数据处理机构,用于生成分析样本数据、初步预测结果、优化预测结果和最终预测结果。

数据存储机构,用于存储基础数据和最终预测结果。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种基于大数据的交通状况预测方法及系统
  • 基于交通大数据的交通状况分析与预测方法、装置及系统
技术分类

06120112566956