掌桥专利:专业的专利平台
掌桥专利
首页

一种基于高速公路流水数据的拥堵识别方法及系统

文献发布时间:2023-06-19 18:34:06


一种基于高速公路流水数据的拥堵识别方法及系统

技术领域

本发明涉及交通管理领域,更具体,涉及一种基于高速公路收费站和门架流水数据的拥堵识别方法及系统。

背景技术

近年来,在高速公路网的不断新增和扩建的同时,机动车特别是中小客车保有量的迅猛增长,高速公路拥堵也愈发频繁发生,已成为影响交通安全、运行效率、交通能耗和碳排放以及社会经济健康发展的主要问题。有效识别高速公路拥堵情况,准确掌握高速公路交通运行状态,是对高速公路进行科学的交通管理控制以及建设规划的关键前提,对于改善高速公路拥堵状况、提升运行效率和交通安全具有重要意义。随着交通设施的智能化水平不断提高,收费站和ETC自动收费以及高速公路龙门架广泛普及应用,其采集到的海量流水数据中蕴含了丰富的交通运行信息,为高速公路的交通运行状态分析提供了丰富的数据来源。

关于高速公路的交通拥堵识别分析,现在的国内外研究和技术现状主要如下:

第一,交通拥堵识别算法方面。国内外学者对拥堵的检测识别算法做了大量研究,主要可以归纳为直接检测算法与间接识别算法两大类。直接检测算法随着检测设备的更新与图像识别技术的迅猛发展,基于各种视频图像识别技术对交通拥堵事件进行检测,该类算法可以从微观角度开展交通运行状态分析,但受数据采集质量与设备覆盖密度影响较大,成本较高。间接识别算法主要根据拥堵对交通流的影响来识别拥堵,该类算法有成本低、简单易行的优点;间接识别算法主要包括基于交通流模型的算法以及基于智能算法的算法,其中交通流模型中常用于拥堵识别的度量参数有道路交通流车辆速度、车辆密度、占有率、车流量和行程时间等,交通流模型的优点在于能理清交通流产生、分布和路径选择的因果关系,但部分交通流模型参数较多导致复杂度较高而拥堵识别;智能算法主要包括人工神经网络、模糊理论、聚类分析等,智能算法的优势在于能够从数据层面准确识别交通运行状态,但无法探究交通内部的运行机理。

第二,数据基础方面。目前被应用于高速公路拥堵识别分析的数据来源多样,主要包括车检器数据、GPS浮动车数据、视频数据、收费站流水数据、移动信令数据以及多源数据融合等类型。其中车检器数据、GPS浮动车数据、视频数据的数据来源局限性较大,存在覆盖范围窄和成本高的问题;收费站流水数据来源丰富,无需新增设备成本投入,但其仅提供起终点信息,数据颗粒度较粗,难以支持各个细分路段的分析;移动信令数据则存在数据样本采集难度大、样本覆盖度不足的缺点。近年来随着ETC系统技术的发展成熟,高速公路逐渐向分段式计费模式发展,ETC门架系统已广泛应用于高速公路,其生成的流水数据体量大、覆盖范围广、实时性强、准确率高,同时,数据的采集、分析及处理方便,为高速公路的拥堵识别分析提供了新的路径。

具体的技术情况如下:

(1)黄晓迪.福建省高速公路拥堵判断识别方法探究[J].福建交通科技,2022(2):102-110.的论文公开利用基于高速公路流量数据,提出结合公路服务水平、饱和度、运行速度、运行密度等4个指标判断高速公路运行状态,选取相应的权重计算综合度量指标,确定拥堵预警阈值;但该研究中各指标的权重都是直接人工设定,受主观因素影响较大,其可靠性有待考究。

(2)张腾月.基于收费数据的高速公路交通流状态识别研究[D].华南理工大学,2017.的论文公开了基于高速收费流水数据,分匝道和主线两部分对行程时间进行估算,并通过分时段分路段模型求取路段区间的交通流参数,最后设计了交通流相图来进行交通状态识别;但该研究中引入的模型假设较多,交通流参数大多为估算结果,研究成果的精确度不高。

(3)韩坤林.基于车检器及收费数据融合的高速公路异常状态识别研究[D].重庆大学,2014.的论文公开了在分析了交通状态参数对于交通异常状态反应灵敏度的基础上,对车检器数据和收费数据进行决策级融合,以判别高速公路的交通异常状态,算法融合了基于车检器数据与基于收费数据的判别结果,检测性能比单一数据源算法更好;但由于国内高速公路现有的检测设施布设稀疏,决策级融合算法判别逻辑较为简单,数据检测率有待提高。

(4)刘廷让.基于多源数据融合的高速公路路段交通拥堵检测方法研究[D].重庆大学,2020.的论文融合了车检器数据、收费数据、卡口数据、GPS浮动车数据等多源数据,首先分别根据各数据源提出了交通拥堵的检测算法,然后针对各数据源的检测结果进行决策级融合,以实现对高速公路路段拥堵的准确预测;该研究充分利用了多源数据之间的互补性,提高了拥堵检测的容错率,但由于数据来源较多,模型方法较为复杂,融合精度不高,不便于广泛投入实际应用。

发明内容

为了克服现有技术的不足,本发明首先提出一种基于高速公路流水数据的拥堵识别方法,该方法能够充分挖掘海量高速公路流水数据,有效识别高速公路的拥堵情况,掌握高速公路拥堵时空分布规律,为交通管理提供决策依据。

本发明还提出一种基于高速公路流水数据的拥堵识别系统。

本发明的具体技术方案为:

一种基于高速公路流水数据的拥堵识别方法,包括以下步骤:

S1:数据清洗与预处理;采集高速公路流水数据,并对采集的流水数据进行数据清洗与预处理;

S2:路段行程时间聚类;提取相邻ETC门架路段中满足通畅行驶的行程时间,实现对该路段的拥堵行程时间阈值的标定,进而形成全路段的不同等级拥堵的行程时间阈值经验库:

S3:路段拥堵判别;对于需要分析的目标时段及路段,提取其中所有小客车的行程时间样本,将该行程时间样本集的统计特征与目标路段对应的拥堵行程时间阈值进行对比得到目标路段拥堵结果;

S4:路段拥堵溯源分析;通过融合分析高速公路流水数据,结合路段交通运行状态和拥堵判别分析结果、车辆车牌号以及道路网络的地理信息,综合分析获得高速公路拥堵路段车辆的来源去向、分方向和分路径的车流量、路径选择偏好、车型、空间分布和时空演变规律的特征指标。

优选的,所述步骤S1的高速公路流水数据包括高速收费站的车辆进出收费站流水数据以及高速公路ETC门架系统对通行车辆记录产生的过车流水数据。

优选的,所述步骤S1数据清洗与预处理的具体过程为:

步骤1:异常及冗余数据剔除;针对车牌号识别错误、计费里程为0km的异常数据,以及同一车辆被同一门架检测多次产生的冗余数据,直接筛选出来进行剔除;

步骤2:错检数据修正;针对通过车辆被对向门架检测而产生的错检数据,将门架路段信息融入高速路网模型,根据高速路网模型中的门架路段拓扑关系梳理出对向门架对应关系以及门架路段序列,判断异常过车逻辑;对于被对向门架检测的错误数据,将其替换为正确的门架路段;

步骤3:漏检数据补充;针对通过车辆未被门架有效识别或数据异常导致的门架数据缺失,利用均值插补法进行补全;根据高速路网模型中的相邻门架对应逻辑关系以及门架路段序列,梳理出缺失的门架路段情况,对于相邻门架之间的通行时间,则统计同时段在相邻门架之间的路段所有同车型通行车辆的平均通行时间,依次倒推各个缺失门架的过车时间,从而对缺失门架数据进行补全。

优选的,所述步骤S2路段行程时间聚类的具体过程为:

①基于ETC门架高速公路路段提取目标路段对应的行程时间样本集合;

②在目标路段的行程时间样本集合中随机提取一条未访问样本,形成一个簇并将该样本标记为已访问;

③以递归的方式,遍历获取下一条未访问样本,并确认与当前各个簇的中心是否密度可达,即其该样本到簇中心的距离小于ε为密度可达;

④若存在密度可达的类则将该样本扩展这个簇的密度区域,若不存在与该样本密度可达的簇,则将这条样本形成一个新的簇;

⑤重复第③步直到集合中所有样本都访问过;对于每个簇,如果总样本数少于最小样本点数MinPts,则该簇中的样本标记为噪声,否则确认为一个有效聚类;

⑥将各个聚类中心点的样本平均值按大小排序,得到目标路段的不同拥堵等级对应的行程时间;

⑦按①至⑥步处理所有ETC门架路段的行程时间集合,形成全路段的不同等级拥堵的行程时间阈值经验库。

优选的,所述步骤S3路段拥堵判别的具体过程为:对于需要分析的目标时段及路段,提取其中所有小客车的行程时间样本,将该行程时间样本集的统计特征与目标路段对应的拥堵行程时间阈值进行对比得到目标路段拥堵结果;所述对比过程为:

(2)统计所有目标样本的行程时间均值,根据路段相应的拥堵行程时间阈值经验库,找出行程时间均值所对应的拥堵等级;(2)按照不同等级拥堵的行程时间阈值,对所有目标样本进行划分,找出划分样本量最多的拥堵等级;

综合上述两次对比判定结果,若两次判定结果一致,则直接将该结果作为分析目标对应的拥堵等级;若两次判定结果不一致,则取两次结果的中间值作为分析目标对应拥堵等级。

一种应用基于高速公路流水数据的拥堵识别方法的系统,包括:

数据清洗与预处理模块:采集高速公路流水数据,并对采集的流水数据进行数据清洗与预处理;

路段行程时间聚类模块:提取相邻ETC门架路段中满足通畅行驶的行程时间,实现对该路段的拥堵行程时间阈值的标定,进而形成全路段的不同等级拥堵的行程时间阈值经验库:

路段拥堵判别模块:对于需要分析的目标时段及路段,提取其中所有小客车的行程时间样本,将该行程时间样本集的统计特征与目标路段对应的拥堵行程时间阈值进行对比得到目标路段拥堵结果;

路段拥堵溯源分析模块:通过融合分析高速公路流水数据,结合路段交通运行状态和拥堵判别分析结果、车辆车牌号以及道路网络的地理信息,综合分析获得高速公路拥堵路段车辆的来源去向、分方向和分路径的车流量、路径选择偏好、车型、空间分布和时空演变规律的特征指标。

一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,所述处理器执行计算机程序时实现所述的基于高速公路流水数据的拥堵识别方法。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于高速公路流水数据的拥堵识别方法。

与现有技术相比,本发明的有益效果是:本发明基于高速公路收费站和门架流水数据融合分析,可全面获取高速路网上运行的所有车辆的出行信息,实现单个车辆级特征和路段级别的拥堵分析;结合交通流参数与智能算法的优势,通过提取不同车辆不同时段在路段上的行程时间集合,利用聚类方法分析得到各个路段的拥堵行程时间阈值,形成阈值经验库可供长期分析使用;根据目标时段路段上运行车辆的行程时间统计情况,基于行程时间阈值对路段拥堵情况进行判别,通过对各路段的全面分析可掌握高速公路拥堵的时空分布规律。

综上所述,本发明提出的基于高速公路收费站和门架流水数据的拥堵识别方法具有以下几个特点:

(1)数据易于获取,样本覆盖范围全面,分析准确度较高;

(2)具有数据驱动性,算法简易可行,普适性强;

(3)基于行程时间阈值判别拥堵,易于投入实际应用。

附图说明

图1为本发明的拥堵识别方法的流程框架图。

具体实施方式

下面结合附图1和具体实施方式对本发明作进一步描述。

本发明以海量高速公路收费站和ETC门架流水数据为基础,首先通过数据清洗及预处理流程,过滤掉错误及异常数据,并对缺漏数据进行补全。以收费站和ETC门架级路段为单位组织数据,提取所有车辆在各ETC门架路段上的行程时间集合。基于目标路段所有的行程时间样本统计来定义合适的参数特征,利用DBSCAN聚类算法,对目标ETC门架路段的行程时间集合进行聚类分析,根据聚类结果的类别特征对拥堵行程时间阈值进行标定。对于各个ETC门架路段进行以上聚类分析流程,形成各ETC门架路段的拥堵行程时间阈值经验库。对于目标时段路段,将路段对应行程时间阈值与目标行程时间样本集的统计特征进行对比分析,实现对任意时段的路段拥堵情况进行判别,从而掌握高速公路的拥堵时空分布特征。

高速公路流水数据主要包含两大类:一是高速收费站的车辆进出站流水数据;二是高速公路ETC门架系统对通行车辆记录产生的过车流水数据。为实现路段级别的精细化拥堵识别,本实施例主要采用收费站和ETC门架流水数据作为基础数据进行融合分析,收费站数据主要包括车辆信息(车牌号、车辆类型、进出站信息、通过时间、车货总重)、交易信息(支付类型、交易金额、计费里程);ETC门架数据主要包括车辆信息(车牌号、车辆类型、ETC门架路段、所在高速、通过时间等)和交易信息(通行介质、计费里程等)。由于高速ETC门架系统存在的不完善,采集到的ETC门架流水数据会出现出行漏检(过车时无识别)、错检(过车时被对向门架检测到)的情况。为了提高原始数据的质量,提升车辆出行信息获取的准确度,需要对原始数据进行以下数据清洗及预处理流程:

步骤1:异常及冗余数据剔除。针对车牌号识别错误、计费里程为0km等异常数据,以及同一车辆被同一ETC门架检测多次产生的冗余数据,直接筛选出来进行剔除。

步骤2:错检数据修正。针对通过车辆被对向ETC门架检测而产生的错检数据,将ETC门架路段信息融入高速路网模型,根据路网模型中的ETC门架路段拓扑关系梳理出对向ETC门架对应关系以及ETC门架路段序列,判断异常过车逻辑;对于被对向ETC门架检测的错误数据,将其替换为正确的ETC门架路段。

步骤3:漏检数据补充。针对通过车辆未被ETC门架有效识别或数据异常导致的门架数据缺失,利用均值插补法进行补全。根据高速路网模型中的相邻ETC门架对应逻辑关系以及ETC门架路段序列,梳理出缺失的门架路段情况,对于相邻门架之间的通行时间,则统计同时段在该路段(相邻门架之间)所有同车型通行车辆的平均通行时间,依次倒推各个缺失门架的过车时间,从而对缺失门架数据进行补全。

表1收费流水信息示意表

表2门架流水数据示例

路段行程时间是一个能反映路段交通运行状态的重要指标。基于ETC门架流水数据统计分析所有相邻ETC门架对之间所有小客车(货车运行速度差异较大,本次分析暂不考虑)的行程时间,得到相邻ETC门架路段在全天不同时段的行程时间集合;该集合中包含多个不同车辆样本在全天不同时段(包含高峰时段和空闲时段)的行程时间,存在较大的个体差异性。为科学准确地从中提取出用于判别交通拥堵的行程时间阈值,本实施例提出利用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法对行程时间集合进行聚类,提取其中满足大部分小客车通畅行驶(行程时间较短)的行程时间,从而实现对路段的拥堵行程时间阈值的标定。

DBSCAN算法是一基于密度的聚类算法,其基本原理是将高密度的样本记录分组到同一类,将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇。DBSCAN算法优点在于不需要定义聚类个数,可在噪声的空间数据库中发现任意形状的聚类,在聚类的同时发现异常点,对数据集中的异常点不敏感,聚类结果没有偏倚。DBSCAN算法根据区域点密度的不同来定义聚类集群,该算法包含两个全局参数:最大密度可达距离ε和最小样本点数MinPts。若在一个样本点周边距离为ε的范围内,有至少MinPts个样本点(密度足够高),那么这个点可以被标定为一个聚类中心点i

其中,

所有与聚类中心点i

其中,T

最小样本点数MinPts用于判别聚类类别的有效性,排除个别噪声数据干扰,该参数设置为:

MinPts=μ

其中,μ

利用DBSCAN算法进行路段行程时间聚类的具体流程如下:

①按门高速公路架路段提取相应的行程时间样本集合;

②对目标路段的行程时间集合中随机提取一条未访问样本,形成一个簇并将该样本标记为已访问;

③以递归的方式,遍历获取下一条未访问样本与当前各个簇的中心的是否密度可达(距离小于ε);

④若存在密度可达的类则将该样本扩展这个簇的密度区域,若不存在与该样本密度可达的簇,则将这条样本形成一个新的簇;

⑤重复第③步直到集合中所有样本都访问过;对于每个簇,如果总样本数少于MinPts,则该簇中的样本标记为噪声,否则确认为一个有效聚类;

⑥将各个聚类中心点的样本平均值按大小排序,得到目标路段的不同拥堵等级对应的行程时间;

⑦按1-6步处理所有门架路段的行程时间集合,形成全路段的不同等级拥堵的行程时间阈值经验库。

经过以上路段行程时间聚类流程,形成各路段分等级的拥堵行程时间阈值经验库可作为基础数据存储在数据库中,定期更新供长期使用,可支撑任意路段任意时段的路段交通运行状态和拥堵判别分析。对于需要分析的目标时段及路段,提取其中所有小客车的行程时间样本,将该行程时间样本集的统计特征与目标路段对应的拥堵行程时间阈值进行对比:一是统计所有目标样本的行程时间均值,根据路段相应的拥堵行程时间阈值经验库,找出行程时间均值所对应的拥堵等级;二是按照不同等级拥堵的行程时间阈值,对所有目标样本进行划分,找出划分样本量最多(众数)的拥堵等级。最后综合对比两次判定结果,若两次判定结果一致,则直接将该结果作为分析目标对应的拥堵等级;若两次判定结果不一致,则取两次结果的中间值作为分析目标对应拥堵等级。利用以上方法,可实现对任意时段任意路段的交通运行状态和拥堵等级判别,从而掌握高速公路的拥堵时空分布规律特征。

通过融合分析高速公路的收费站和门架流水数据,结合路段交通运行状态和拥堵判别分析、车辆车牌号以及道路网络的地理信息,可以综合分析高速公路拥堵路段车辆的来源去向、分方向和分路径的车流量、路径选择偏好、车型等特征指标、空间分布和时空演变规律,为解决高速公路的交通拥堵、路径诱导、交通规划和建设等都具有很强的参考意义。

(1)本实施例提出的的高速公路的运行状态和交通拥堵识别流程是根据基础数据情况以门架路段作为分析单元,实际应用时也可以根据数据情况进行不同尺度级别的路段拥堵判别。

(2)本发明的路段行程时间聚类步骤中,采用的是DBSCAN聚类算法,实际应用时也可采用其它适用的无监督聚类算法。

(3)本发明的路段行程时间聚类步骤中,是结合行程时间的统计分布特征定义了聚类的关键参数,实际应用时也可根据分析需求在合理范围内选用其它参数。

(4)本发明的路段拥堵判别步骤中,是通过对比目标路段行程时间统计特征和路段拥堵行程时间阈值,根据经验来判定拥堵,实际应用时也可定义其它合理的判别标准。

以上所述的本发明的实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。

相关技术
  • 一种基于视频特征的交通拥堵识别方法
  • 基于社团发现的路网拥堵区域动态识别方法及系统
  • 一种基于大数据的能源分析系统、方法及铝材锻造流水线
  • 一种基于多源数据的高速公路拥堵管控系统
  • 一种基于ETC系统数据的高速公路车辆速度异常识别方法
技术分类

06120115613337