掌桥专利:专业的专利平台
掌桥专利
首页

一种车辆城市行驶轨迹与行驶行为的聚类方法

文献发布时间:2023-06-19 16:04:54



技术领域

本发明涉及数据挖掘技术领域,尤其涉及一种车辆城市行驶轨迹与行驶行为的聚类方法。

背景技术

随着车载定位终端的普及和道路上采集设备的安装完善,城市中对不同种类车辆的管理和对交通的优化方法的细化成为了可能。车载定位的轨迹数据是附着时间与运动特征的空间点位,道路采集设备的轨迹数据是附着时间与图形特征的固定空间点位,综合两种信息可以基本描述出车辆的所有状态,可以分析推测出大量有关行为信息和人员信息。

对车辆轨迹的挖掘有助于对城市交通进行分类,以便根据不同类别分别进行诱导和管理,同时可以对于特定行驶特征进行及时的报警和锁定保证道路安全。对交通系统的规划管理和公安系统的预警和追踪有着极高的价值。

传统对于轨迹数据的聚类方法中,多关心对于整条轨迹的起止点的空间分布特征,其中起止点单纯以天为单位或者以单次行进做为单位划分并不能合理的突出某一行为的特征;其中关心的空间分布特征多以欧式距离作为衡量标准且因为海量轨迹量导致计算量巨大且不考虑到时间与运动特征,因此很难对行驶特征进行高效的提取。

发明内容

有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种车辆城市行驶轨迹与行驶行为的聚类方法,该方法在实用性上根据城市道路特点对轨迹进行了简化从而大大提高了计算效率,同时对传统的长度轨迹数据分析问题进行了合理分解从而得到更多的轨迹特征。该方法在计算上优化了编辑距离算法使得特定场景下距离计算更加准确。

为实现上述目的,本发明提供了一种车辆城市行驶轨迹与行驶行为的聚类方法,包括以下步骤:

步骤一、对轨迹简化再对转角点进行提取;

步骤二、对转角点进行聚类处理,并构建时空索引;

步骤三、使用步骤二得到的索引编译轨迹样本得到轨迹编码;

步骤四、定义轨迹编码的距离参数;

步骤五、在不同维度下对轨迹进行聚类分析。

进一步的,所述对轨迹简化再对转角点进行提取,具体包括:

S11、依据时间顺序连接样本车辆单日行驶轨迹使得点数据变为线数据,再使用道格拉斯普克法简化轨迹;所述道格拉斯普克法将待处理曲线的首末点连一条直线,求所有中间点与直线的距离,并找出最大距离值D

S12、对于简化后的轨迹点,依据时间顺序依次计算检查点与下个检查点形成线段的方向角,与上个检查点与检查点的方向角求差,方向角差大于转角阈值T

S13、对于未简化后的轨迹点,依据时间顺序检查每一个点,累加每个点与上一个点的速度变化差特征、方向变化差特征、两点距离特征,当遇到简化结果点时,将累加的数据存入转角点集N

进一步的,所述对转角点进行聚类处理,并构建时空索引,具体为:

S21、定义适合城市道路的扫描半径R,定义最小包含点数Pt

S22、使用四叉树法对转角点聚类集P

进一步的,所述使用步骤二得到的索引编译轨迹样本得到轨迹编码,具体为:

S31、对单条轨迹同样进行步骤一转角点提取将得到的转角点,根据空间索引I

S32、当点集N

进一步的,所述定义轨迹编码的距离参数,具体为:

S41、根据S31所得到的每条轨迹的编号字符串,计算轨迹间的编辑距离,计算两个字符串之间的编辑距离Edit Distance Edit

其中i、j分别为字符串a和字符串b的前i、j个字符,其中t的表达式为:

S42、根据S31所得到的每条轨迹的编号字符串,计算最长公共子串LCS,计算两个字符串之间的编辑距离最长公共子串LCS的方法为:

LCS

其中i、j分别为字符串a和字符串b的第i、j个字符;

S43、计算得到的最长公共子串,分割为单独的一条轨迹编号字符串,依据最长公共子串的编号取得S13得到的运动特征,计算速度距离D

S44、对步骤四所得的所有距离进行归一化处理;

进一步的,所述在不同维度下对轨迹进行聚类分析,具体为:

S51、在单纯计算轨迹聚类的场景下,使用步骤S41、S42得到的编辑距离进行基于密度的聚类;

S52、在识别驾驶员聚类的场景下,计算综合距离进行基于密度的聚类,其中综合距离计算方法为:

速度距离、方向距离、空间距离的方差分别为:

计算得到综合距离权重为:

综合距离计算得:

D=[Edit

本发明的有益效果是:

本发明的方法在实用性上根据城市道路特点对轨迹进行了简化从而大大提高了计算效率,同时对传统的长度轨迹数据分析问题进行了合理分解从而得到更多的轨迹特征。该方法在计算上优化了编辑距离算法使得特定场景下距离计算更加准确。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的概要方法流程图。

图2是本发明的具体方法流程图

具体实施方式

如图1、2所示,本发明提供了一种车辆城市行驶轨迹与行驶行为的聚类方法,包括以下步骤:

步骤一、对轨迹简化再对转角点进行提取;

步骤二、对转角点进行聚类处理,并构建时空索引;

步骤三、使用步骤二得到的索引编译轨迹样本得到轨迹编码;

步骤四、定义轨迹编码的距离参数;

步骤五、在不同维度下对轨迹进行聚类分析。

本实施例中,对轨迹简化再对转角点进行提取,具体包括:

S11、依据时间顺序连接样本车辆单日行驶轨迹使得点数据变为线数据,再使用道格拉斯普克法简化轨迹;道格拉斯普克法将待处理曲线的首末点连一条直线,求所有中间点与直线的距离,并找出最大距离值D

S12、对于简化后的轨迹点,依据时间顺序依次计算检查点与下个检查点形成线段的方向角,与上个检查点与检查点的方向角求差,方向角差大于转角阈值T

S13、对于未简化后的轨迹点,依据时间顺序检查每一个点,累加每个点与上一个点的速度变化差特征、方向变化差特征、两点距离特征,当遇到简化结果点时,将累加的数据存入转角点集N

本实施例中,对转角点进行聚类处理,并构建时空索引,具体为:

S21、定义适合城市道路的扫描半径R,定义最小包含点数Pt

S22、使用四叉树法对转角点聚类集P

本实施例中,使用步骤二得到的索引编译轨迹样本得到轨迹编码,具体为:

S31、对单条轨迹同样进行步骤一转角点提取将得到的转角点,根据空间索引I

S32、当点集N

本实施例中,定义轨迹编码的距离参数,具体为:

S41、根据S31所得到的每条轨迹的编号字符串,计算轨迹间的编辑距离,计算两个字符串之间的编辑距离Edit Distance Edit

其中i、j分别为字符串a和字符串b的前i、j个字符,其中t的表达式为:

S42、根据S31所得到的每条轨迹的编号字符串,计算最长公共子串LCS,计算两个字符串之间的编辑距离最长公共子串LCS的方法为:

LCS

其中i、j分别为字符串a和字符串b的第i、j个字符;

S43、计算得到的最长公共子串,分割为单独的一条轨迹编号字符串,依据最长公共子串的编号取得S13得到的运动特征,计算速度距离D

S44、对步骤四所得的所有距离进行归一化处理;

本实施例中,在不同维度下对轨迹进行聚类分析,具体为:

S51、在单纯计算轨迹聚类的场景下,使用步骤S41、S42得到的编辑距离进行基于密度的聚类;

S52、在识别驾驶员聚类的场景下,计算综合距离进行基于密度的聚类,其中综合距离计算方法为:

速度距离、方向距离、空间距离的方差分别为:

计算得到综合距离权重为:

综合距离计算得:

D=[Edit

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

相关技术
  • 一种车辆城市行驶轨迹与行驶行为的聚类方法
  • 一种基于车辆行驶轨迹数据的急减速驾驶行为判定方法
技术分类

06120114695236