掌桥专利:专业的专利平台
掌桥专利
首页

一种连续时空多源轨迹数据频繁模式识别方法及装置

文献发布时间:2024-04-18 19:58:21


一种连续时空多源轨迹数据频繁模式识别方法及装置

技术领域

本发明涉及目标轨迹数据处理技术,具体涉及一种连续时空多源轨迹数据频繁模式识别方法及装置。

背景技术

随着雷达技术和全球定位系统的快速发展, 多源轨迹数据能够被收集到,目标轨迹数据是目标最直接、最基础的信息数据,既包含了目标实时位置信息,也蕴含了目标的基本运动属性,是构建目标识别、意图分析模型的原始特征。面对多源轨迹数据,首要任务是实现实时轨迹数据关联融合,利用历史数据融合构建的频繁轨迹模板进行目标类型识别及意图分析。特别是在现代雷达侦察场景下,对于敌方的侦察、战势的推断、威胁的评估等都需要快速、精确地掌握目标的基础信息。

近年来,受雷达侦察应用的驱动,涌现出大量轨迹挖掘模式,包括序列模式、周期模式、伴随模式、频繁模式等。序列模式可以用于预测目标对象下一个航经的位置;在周期模式挖掘中,Li等提出分两步发现关于某些地点的周期模式,即首先使用傅立叶变换和自相关函数找到其中的周期,之后对不同时间的周期行为进行层次聚类;Zheng等使用聚类算法和Hausdorff距离,挖掘一类特殊的伴随模式,实现多目标的编队行为识别;Song等对民航航班轨迹数据进行了重采样,然后使用主成分分析和DBSCAN算法进行长轨迹聚类,最后将得到的聚类中心作为轨迹频繁模板,用于本已有的轨迹识别。

传统的频繁项挖掘识别主要是针对离散项,算法多采用Apriori算法,FP-growth算法,Prefixspan算法。这类算法通过统计的方式寻找样本集空间中的关联属性,但是在现实情况下,连续时空也存在很多的关联性,这些关联性可以作为后续的任务规划及任务调度的先验知识。尽管后来在Aprior算法上衍生出来的Prefixspan可以解决连续空间频繁项发现,但是,这种频繁项只是找出了空间上的关联性,缺失了时间关联性,表现为时间上的跳跃。此类现有技术存在以下至少三点需要解决的问题:

1、没有考虑时间序列,单纯将空间位置进行关联形成频繁项;

2、没有考虑空间连续性,频繁项呈跳跃关联;

3、需要足量样本,频繁项挖掘基于统计采样理论,对单一轨迹无法进行频繁子段挖掘。

发明内容

为解决上述相关现有技术不足,本发明提供一种连续时空多源轨迹数据频繁模式识别方法及装置,充分考虑数据多源性以及时空连续性,有效融合复杂轨迹类型,提高频繁轨迹挖掘效率,融合相似度明显提高,轨迹相似度达到93%以上。

为了实现本发明的目的,拟采用以下方案:

一种连续时空多源轨迹数据频繁模式识别方法,包括步骤:

对目标的多源轨迹数据进行轨迹聚类预处理以形成轨迹编码序列;

将轨迹编码序列按照时间域进行拼接得到时空轨迹数据;

从时空轨迹数据中找出频繁出现的序列模式作为轨迹分布的表示。

进一步,对目标的多源轨迹数据进行轨迹聚类预处理以形成编码序列包括步骤:

对目标的多源轨迹数据进行分段平滑滤波处理;

对平滑滤波处理后的轨迹数据进行粗分类划族;

将分类划族得到的轨迹族与空域信息族合并得到轨迹段;

对轨迹段采用基于密度顶点及距离联合的密度峰值聚类算法进行聚类;

对聚类形成的各个类族编码形成轨迹编码序列。

进一步,基于密度顶点及距离联合的密度峰值聚类算法如下:

假设聚类中心由若干局部密度值小于第一阈值的临近点包围,且它们与若干局部密度值大于等于第二阈值的大密度点之间均具有相对大的距离,所述相对大的距离大于临近点与聚类中心的距离,第二阈值大于等于第一阈值;

对于轨迹段的每一个临近点

,若

进一步,采用结合时间连续性的prefixspan算法,从时空轨迹数据中寻找频繁出现的序列模式,以提取频繁轨迹序列,其中,结合时间连续性的prefixspan算法如下:

假设时空轨迹数据组成的数据集

X

rsup

一条规则的置信度是一个事务包含

当conf(X→Y)≥

一种连续时空多源轨迹数据频繁模式识别装置,包括:

聚类处理模块,用于对目标的多源轨迹数据进行轨迹聚类预处理以形成轨迹编码序列;

时域拼接模块,用于将轨迹编码序列按照时间域进行拼接得到时空轨迹数据;

频繁识别模块,用于从时空轨迹数据中找出频繁出现的序列模式作为轨迹分布的表示。

进一步,聚类处理模块包括:

滤波单元,用于对目标的多源轨迹数据进行分段平滑滤波处理;

粗分类单元,用于对平滑滤波处理后的轨迹数据进行粗分类划族;

空域合并单元,用于将分类划族得到的轨迹族与空域信息族合并得到轨迹段;

聚类单元,用于对轨迹段采用基于密度顶点及距离联合的密度峰值聚类算法进行聚类;

编码单元,用于对聚类形成的各个类族编码形成轨迹编码序列。

本发明的有益效果:

现有技术的常规多源轨迹数据频繁模式识别算法缺乏时空关联,生成的频繁航迹对复杂盘旋轨迹段不敏感,无法识别;而本发明充分考虑数据多源性以及时空连续性,有效融合复杂轨迹类型,提高频繁轨迹挖掘效率,融合相似度明显提高,轨迹相似度达到93%以上;并且本发明的识别方具备一定的抗噪声干扰能力,可应用于雷达侦察领域数据规模大、轨迹模式难以确定场合下的敏感目标识别,以及实时比对侦察目标异常行为。

附图说明

图1示出了本申请实施例的识别方法流程图。

图2示出了本申请实施例的原始数据二维可视化示意图。

图3示出了本申请实施例的轨迹数据聚类粗划分主要类族示意图。

图4示出了本申请实施例的聚类识别生成异常轨迹示意图。

图5示出了本申请实施例的现有常规Prefixspan方法处理的频繁航迹示意图。

图6示出了本申请实施例的识别方法获得的第一组频繁航线示意图。

图7示出了本申请实施例的识别方法获得的第二组频繁航线示意图。

图8示出了本申请实施例的识别装置结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面结合附图对本发明的实施方式进行详细说明,但本发明所描述的实施例是本发明一部分实施例,而不是全部的实施例。

随着雷达定位技术的日益完善,多源轨迹数据的获取也越来越容易,这些繁杂的轨迹数据中蕴含着大量的航行运动属性及航行意图信息, 对这些轨迹数据进行深度挖掘变得至关重要。目标对象多源轨迹数据的频繁模式是在轨迹数据融合的基础上开展的二次信息挖掘,目的是生成目标航行的轨迹模板,提供目标类型识别及异常航行行为识别依据。

针对此,本申请实施例的一个方面,提供一种连续时空多源轨迹数据频繁模式识别方法,如图1所示,包括步骤:

S100、轨迹聚类预处理:对目标的多源历史轨迹数据进行轨迹聚类预处理以形成轨迹编码序列。

运动轨迹的分布模式是目标行为特征的重要表现方式之一,在许多目标侦察场合中通过对目标运动轨迹的分析就可以提取出目标的行为模式。然而在多源轨迹数据融合之前,需要将数据进行分组及异常数据滤波剔除、粗分划分。在没有标签数据引导情况下,需要采用无监督聚类算法进行数据预处理。目前国内外对此研究较深入的有基于轨迹之间不同距离度量方式的聚类分析方法、基于轨迹特征表示的聚类分析方法和基于轨迹分布建模的聚类分析方法等,这些方法大都需要度量不同轨迹之间的相似性并据此进行聚类。然而,不同目标的运动轨迹在长度和运动速度等方面都有差别,很难以一种非常自然的方式来度量它们之间的相似性。另外,当场景中目标的运动比较复杂时,很难对它们进行准确的聚类,聚类数目的确定也比较困难。这种随机性的运动也会影响到基于聚类的轨迹分析方法的效果。基于此,本实例采用如下详细过程来完成步骤S100:

S110、对目标的多源轨迹数据进行分段平滑滤波处理;

S120、对平滑滤波处理后的轨迹数据进行粗分类划族;

S130、将分类划族得到的轨迹族与空域信息族合并得到轨迹段;

S140、对轨迹段采用基于密度顶点及距离联合的密度峰值聚类算法进行聚类;

S150、对聚类形成的各个类族编码形成轨迹编码序列。

其中,在步骤S140中,基于密度顶点及距离联合的密度峰值聚类算法如下:

假设聚类中心由若干局部密度值小于第一阈值的临近点包围,且它们与若干局部密度值大于等于第二阈值的大密度点之间均具有相对大的距离,所述相对大的距离大于临近点与聚类中心的距离,第二阈值大于等于第一阈值;

对于轨迹段的每一个临近点

,若

S200、时域拼接处理:将轨迹编码序列按照时间域进行拼接得到时空轨迹数据:

具体的,是对轨迹编码序列赋予时间标签,或进行时间拼接映射,以将空域和时域结合,得到时空轨迹数据,如上表格,以便于后续对对同一时间、同一空域下的数据进行分析和训练输出频繁模型,该步骤也是后续时空频繁模式识别的关键步骤。

S300、频繁模式识别处理:从时空轨迹数据中找出频繁出现的序列模式作为轨迹分布的表示。

由于轨迹反映的是目标在监控场景中连续运动时的规律,因此在轨迹序列模式的挖掘中,鉴于提出的Prefixspan(Prefix projected Sequential pattern mining)算法是目前序列模式挖掘中性能较好的一种方法,使其能够用于连续的轨迹序列模式挖掘。但是,常规Prefixspan提取出的频繁序列在时间序列上存在跳跃,提取出的频繁项不具备时间上的连续性,因此,本申请实施例在常规Prefixspan的基础上结合时间连续性,来找出其中频繁出现的序列模式作为轨迹分布的表示,提取出的频繁项能更好地匹配真实时空数据。

采用结合时间连续性的Prefixspan算法,从时空轨迹数据中寻找频繁出现的序列模式,以提取频繁轨迹序列。本实例的改进后的prefixspan算法可以进行同一时间、同一空间、同一物体的频繁轨迹的判断。

具体,结合时间连续性的Prefixspan算法如下:

假设时空轨迹数据组成的数据集

X

rsup

一条规则的置信度是一个事务包含

当conf(X→Y)≥

最后将提取的频繁序列作为初始轨迹匹配融合为频繁轨迹模式识别模版。

本申请实施例的又一方面,提供一种连续时空多源轨迹数据频繁模式识别装置,如图8所示,包括聚类处理模块、时域拼接模块、频繁识别模块。

其中,聚类处理模块用于对目标的多源轨迹数据进行轨迹聚类预处理以形成轨迹编码序列;时域拼接模块用于将轨迹编码序列按照时间域进行拼接得到时空轨迹数据;频繁识别模块用于从时空轨迹数据中找出频繁出现的序列模式作为轨迹分布的表示。

具体的,聚类处理模块包括滤波单元、粗分类单元、空域合并单元、聚类单元、编码单元。其中,滤波单元用于对目标的多源轨迹数据进行分段平滑滤波处理;粗分类单元用于对平滑滤波处理后的轨迹数据进行粗分类划族;空域合并单元用于将分类划族得到的轨迹族与空域信息族合并得到轨迹段;聚类单元用于对轨迹段采用基于密度顶点及距离联合的密度峰值聚类算法进行聚类;编码单元,用于对聚类形成的各个类族编码形成轨迹编码序列。

其中,本实例的频繁识别模块采用结合时间连续性的Prefixspan算法,从时空轨迹数据中寻找频繁出现的序列模式,以提取频繁轨迹序列。

本申请实施例的另一方面,提供一种电子设备,包括:至少一个处理器和存储器;其中,所述存储器存储有计算机执行指令;在所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行前文实施例所述的连续时空多源轨迹数据频繁模式识别方法。

本申请实施例的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行前文实施例所述的连续时空多源轨迹数据频繁模式识别方法。

为了对比现有常规Prefixspan算法与本申请实施例的方法/装置/电子设备/计算机可读存储介质在连续序列上的效果差异,分别采用单序列测试样例与多序列测试样例进行计算,多测试样例以二维代表,横轴代表时间,纵轴代表一维空间。多维时序数据测试样例为S = [[4,3,4,0],[0,1,3,4,3,4,3,4,0,1]]。

表1示出了现有常规Prefixspan算法计算结果,其中,第一行为计算序列,第二行为频繁次数:

表2示出了本申请实施例的计算结果,其中,第一行为计算序列,第二行为频繁次数:

单序列测试样例为S = [0,1,3,4,3,4,3,4,0,1],现有常规Prefixspan算法的计算结果为空,没有计算结果。本申请实施例的计算结果如下表3:

通过表1、表2、表3对比可以发现:

1、现有常规Prefixspan算法的计算频繁项明显较多,且计算出的频繁项在原序列中不连续,比如440、44、30等在原序列中是间断的;

2、现有常规Prefixspan算法的频繁次数明显较少,比如34、43等;

3、现有常规Prefixspan算法对单序列无法计算结果;

4、本申请实施例不仅对于单序列可以形成计算结果,而也能计算出多维时序序列的准确结果。

实验数据验证:

实测数据采用ADS-B原始数据集,分别来自同一目标不同时间的轨迹数据,其可视化数据如图2所示,可以看出同一目标飞行轨迹形状多样,分布区域广,盘旋次数多,并且存在多条异常数据。

采用本申请实施例的方案对原始数据进行主要类族划分,结果如图3-图4所示。其中,图3表示原始数据的主要分布,图4是异常数据。

利用现有常规Prefixspan算法处理的频繁轨迹如图5所示,可以看出,常规Prefixspan算法处理后的融合航迹分段较多,而且缺失空间连续性,无法识别轨迹的盘旋模式。然而,在实际的侦察任务中,需要对某些转弯、盘旋的位置进行精确的定位,保证时空上的连续性。

利用本申请实施例的方案处理获得的频繁航线如图6和图7所示。

现有常规Prefixspan算法与本申请实施例的方案的频繁轨迹相似度对比如下,相似度计算公式采用轨迹Hausdorff距离公式:

可以看出,本申请实施例的方案,频繁轨迹平均相似度达到93.25%,而现有技术的常规多源轨迹数据频繁模式识别算法缺乏时空关联,生成的频繁航迹对复杂盘旋轨迹段不敏感,无法识别。本申请实施例基于时间连续性结合的频繁模式识别算法,结合密度峰值聚类算法,实现了时空关联的频繁模式提取算法,该算法充分考虑数据多源性以及时空连续性,提高了频繁轨迹挖掘效率及轨迹相似度,同时本申请实施例的处理中通过了平滑滤波,具备一定的抗噪声干扰能力;本方案可应用于雷达侦察领域数据规模大、轨迹模式难以确定场合下的敏感目标识别,以及实时比对侦察目标异常行为。

以上所述仅为本发明的优选实施例,并不表示是唯一的或是限制本发明。本领域技术人员应理解,在不脱离本发明的范围情况下,对本发明进行的各种改变或同等替换,均属于本发明保护的范围。

相关技术
  • 多源数据融合的移动轨迹生成模型的时空模式挖掘方法
  • 一种基于行车轨迹和视觉车道边线数据的路口识别方法及系统
  • 一种时空轨迹数据的频繁模式增量挖掘方法和电子设备
  • 基于多源时空轨迹数据的群体活动数据收集方法及系统
技术分类

06120116482655