掌桥专利:专业的专利平台
掌桥专利
首页

周期行为分析方法及装置

文献发布时间:2023-06-19 10:21:15


周期行为分析方法及装置

技术领域

本申请涉及数据处理技术领域,尤其涉及一种周期行为分析方法及装置。

背景技术

周期模式挖掘方法属于一种数据挖掘任务,在很多应用领域都会用到该挖掘方法,例如电力负荷时序数据的高峰期挖掘,发现这种周期可以避开高峰用电,减轻电厂的负担,再例如水文时序数据的水文变量周期挖掘,帮助预测未来年或月的水文变量的周期性,以对旱涝趋势进行预测。

目前,采用的是基于时间序列的周期模式挖掘,即先根据实践经验对要分析的历史数据进行一定的周期预判,然后将历史数据转化为时间序列,进而结合预判的周期和转化得到的时间序列分析出周期。

由于前述的时间序列是由单个维度的时间构成,对于包含地理空间和时间空间的时空轨迹并不适合采用基于时间序列的周期模式挖掘方法来分析周期规律。

发明内容

有鉴于此,本申请提供一种周期行为分析方法及装置,以解决目前采用的分析方法不适合挖掘时空轨迹的周期规律的问题。

根据本申请实施例的第一方面,提供一种周期行为分析方法,所述方法包括:

获取各个采集器在预设时间段内采集的指定对象的轨迹点,所述轨迹点包括采集器标识和采集时刻;

针对兴趣点位集中的每个兴趣点位,依据位于该兴趣点位的采集器采集的轨迹点确定指定对象出现在该兴趣点位的周期;

获取具有相同周期的目标兴趣点位,并按照该周期将所述预设时间段划分为多个片段;

依据位于目标兴趣点位的采集器采集的轨迹点,对所述多个片段进行分层聚类得到多种聚类结果,从所述多种聚类结果中选择符合预设条件的聚类结果;

依据选择的聚类结果确定指定对象出现在目标兴趣点位的周期行为信息。

根据本申请实施例的第二方面,提供一种周期行为分析装置,所述装置包括:

轨迹点获取模块,用于获取各个采集器在预设时间段内采集的指定对象的轨迹点,所述轨迹点包括采集器标识和采集时刻;

周期确定模块,用于针对兴趣点位集中的每个兴趣点位,依据位于该兴趣点位的采集器采集的轨迹点确定指定对象出现在该兴趣点位的周期;

片段划分模块,用于获取具有相同周期的目标兴趣点位,并按照该周期将所述预设时间段划分为多个片段;

聚类模块,用于依据位于目标兴趣点位的采集器采集的轨迹点,对所述多个片段进行分层聚类得到多种聚类结果,从所述多种聚类结果中选择符合预设条件的聚类结果;

行为确定模块,用于依据选择的聚类结果确定指定对象出现在目标兴趣点位的周期行为信息。

根据本申请实施例的第三方面,提供一种电子设备,所述设备包括可读存储介质和处理器;

其中,所述可读存储介质,用于存储机器可执行指令;

所述处理器,用于读取所述可读存储介质上的所述机器可执行指令,并执行所述指令以实现上述第一方面所述方法的步骤。

应用本申请实施例,通过在每个兴趣点位布设至少一个采集器,以采集出现在兴趣点位的对象并记录对象的轨迹点,在周期探索阶段,通过从这些轨迹点中自动提取出各兴趣点位的周期,避免进行周期间隔的预判,从而可提高后续周期行为分析的准确性。对于具有相同周期的目标兴趣点位,通过以该周期为间隔将采集轨迹的时间段划分为多个片段,并通过分层聚类将行为模式相近的片段聚成一类,以将相同周期的不同类别的行为模式剥离开,使得对象的周期行为体现更为清晰,避免出现交织影响的情况。

附图说明

图1为本申请根据一示例性实施例示出的一种周期行为分析方法的实施例流程图;

图2A为本申请根据一示例性实施例示出的另一种周期行为分析方法的实施例流程图;

图2B为本申请根据图2A所示实施例示出的一种轨迹示意图;

图2C为本申请根据图2A所示实施例示出的一种候选周期的数据分布对比示意图;

图3为本申请根据一示例性实施例示出的一种电子设备的硬件结构图;

图4为本申请根据一示例性实施例示出的一种周期行为分析装置的实施例结构图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

目前基于时间序列的周期模式挖掘方法,一方面是通过将历史数据转化为有时间单个纬度表示的时间序列来进行分析,这种方法忽略了地理空间维度,因此并不适用于时空轨迹的周期规律分析;另一方面,在分析前,需要进行周期预判,但在实际的场景下,周期间隔往往是未知的,对周期进行武断预判会导致周期规律的错误识别,并且实际场景中的轨迹会呈现多个周期行为交叉相互影响的情况,采用传统的基于时间序列的挖掘方法无法将不同的周期行为区分开,进而无法正确识别周期性的行为。

例如,从某一指定对象的轨迹数据中观测到,该指定对象每周三均会去体育馆锻炼,每周四会去图书馆看书,那么可以认为该指定对象对体育馆和图书馆的周期行为均有单位为一周的周期间隔,只是体育馆是每周三,图书馆是每周四。

由上述例子所述的场景,指定对象的轨迹就会呈现多个周期交叉相互影响的情况,采用传统的基于时间序列的挖掘方法是无法正确识别周期性行为的。

为解决上述问题,本申请提出一种周期行为分析方法,通过获取各个采集器在预设时间段内采集的指定对象的轨迹点(包括采集器标识和采集时刻),针对兴趣点位集中的每个兴趣点位,依据位于该兴趣点位的采集器采集的轨迹点确定指定对象出现在该兴趣点位的周期,获取具有相同周期的目标兴趣点位,并按照该周期将预设时间段划分为多个片段,然后依据位于目标兴趣点位的采集器采集的轨迹点,对多个片段进行分层聚类得到多种聚类结果,从多种聚类结果中选择符合预设条件的聚类结果,最后依据选择的聚类结果确定指定对象出现在目标兴趣点位的周期行为信息。

基于上述描述可知,通过在每个兴趣点位布设至少一个采集器,以采集出现在兴趣点位的对象并记录对象的轨迹点,在周期探索阶段,通过从这些轨迹点中自动提取出各兴趣点位的周期,避免进行周期间隔的预判,从而可提高后续周期行为分析的准确性。对于具有相同周期的目标兴趣点位,通过以该周期为间隔将采集轨迹的时间段划分为多个片段,并通过分层聚类将行为模式相近的片段聚成一类,以将相同周期的不同类别的行为模式剥离开,使得对象的周期行为体现更为清晰,避免出现交织影响的情况。

下面以具体实施例对本申请提出的周期行为分析方法进行详细阐述。

图1为本申请根据一示例性实施例示出的一种周期行为分析方法的实施例流程图,该方法可以应用在电子设备上,如图1所示,该周期行为分析方法包括如下步骤:

步骤101:获取各个采集器在预设时间段内采集的指定对象的轨迹点。

在一实施例中,布设在不同位置的采集器,会实时基于采集到的数据检测对象,若检测到,则记录对象的轨迹点。

其中,每个轨迹点包括采集器标识和采集时刻。采集器检测的对象可以是人、动物等。

示例性的,采集器标识可以是采集器布设的地点标识,地点标识的表示方式可以是带有一定语义信息的标识,例如,在园区场景下,采集器标识表示可以是食堂、西大门、办公楼10层等地点标识。

以采集器为摄像头,指定对象是人为例,预先在摄像头中存储所有要采集用户的脸部图,摄像头在监控过程中,会实时检测监控码流中是否存在与该脸部图匹配的图像,如果存在,则对应该脸部图的ID记录一个轨迹点,该轨迹点包括摄像头标识和图像的采集时刻。

基于此,当设备需要分析某指定对象的周期行为时,可以从各个采集器中获取在预设时间段内采集的该指定对象的ID对应的轨迹点。

其中,预设时间段的长度可以根据实际需求定义。假设需要分析某用户平时的行为模式,预设时间段可以定义为几个月或一年。

在本申请中,采集器除了摄像头之外,还可以是WIFI采集器、蓝牙采集器等其他类型采集器,对于WIFI采集器或蓝牙采集器,可以通过采集对象所携带的信号发射装置(如终端)发射信号,由采集器根据接收到的信号来记录对象的轨迹点。

步骤102:针对兴趣点位集中的每个兴趣点位,依据位于该兴趣点位的采集器采集的轨迹点确定指定对象出现在该兴趣点位的周期。

其中,所述兴趣点位用于表征一个地点,至少包含一个采集器。兴趣点位的周期用于表示指定对象出现在该兴趣点位的时间间隔。

兴趣点位集的示例如下:

C

C

C

由上述示例可知,兴趣点位集中有三个兴趣点位,分别为咖啡厅、公园、办公楼,其中,咖啡厅中布设有C

针对步骤102中提取兴趣点位的周期的过程,可以参见下述图2A所示实施例的描述,在此暂不详述。

步骤103:获取具有相同周期的目标兴趣点位,并按照该周期将所述预设时间段划分为多个片段。

其中,每个片段的时间跨度为周期T。假设预设时间段为5月1号~7月1号61天的时间段,周期为1天,那么可以划分成61个片段。

步骤104:依据位于目标兴趣点位的采集器采集的轨迹点,对所述多个片段进行分层聚类得到多种聚类结果。

在一实施例中,可以通过概率模型结构来表示指定对象的周期行为,进而基于概率模型结构对划分的片段进行分层聚类,以将相同周期的不同类别的行为模式剥离开。

分层聚类过程可以是:将该周期划分成多个相对时间戳,然后针对每个片段,依据位于目标兴趣点位的采集器在该片段内采集的轨迹点确定该片段的概率分布矩阵,并依据每个片段的概率分布矩阵对所述多个片段进行分层聚类,得到多种聚类结果。

其中,可以按照预设时间间隔将一个周期划分出多个相对时间戳,该预设时间间隔可以根据实际需求设置,例如,假设要分析的是用户平时的行为模式,每种类型的行为模式的周期间隔通常在小时级别以上,因此划分相对时间戳的时间间隔可以设置为1小时、2小时等。又例如,周期为1天,预设时间间隔为1小时,那么该周期可以划分出24个相对时间戳,分别为0点、1点、2点、3点......23点。

其中,每个片段的概率分布矩阵包括指定对象在每个相对时间戳下出现在每个目标兴趣点位的概率。

对于某一片段,可以先依据位于目标兴趣点位的采集器在该片段内采集的每个轨迹点的采集时刻与该片段的起始时刻之间的间隔时长确定每个轨迹点对应的相对时间戳,进而再依据每个轨迹点对应的相对时间戳,确定指定对象在每个相对时间戳下出现在每个目标兴趣点位的概率。

示例性的,假设周期为1天,该周期包含0点、1点、2点、3点......23点,24个相对时间戳,如果轨迹点的采集时刻与片段的起始时刻之间的间隔时长为5.2小时,那么其对应的相对时间戳为5点。

为了方便描述,下面先介绍概率分布矩阵的计算过程,然后再说明单个片段的概率分布矩阵的情况:

第一步:采用极大似然估计方式,估算指定对象在每个相对时间戳下出现在不同兴趣点位的概率分布向量为:P

其中,k表示相对时间戳,如果是0点~23点的24个相对时间戳,k取值范围可以是0~23;{0,1......d}为具有相同周期T的兴趣点位集合。

该概率分布向量满足

其中,I表示片段集合,|I|表示片段集合中片段的数量,

第二步:将第一步中的每个相对时间戳k的概率分布向量组成一个概率分布矩阵P=[P

假设,由周期T划分出K个相对时间戳,具有相同周期T的兴趣点位集合中兴趣点位的总数为D,则得到的概率分布矩阵包含K*D个概率。

基于上述描述可知,对于单个片段的概率分布矩阵,在计算指定对象每个相对时间戳下出现在每个目标兴趣点位的概率时,上述公式中片段集合I中只有该一个片段。

分层聚类的大概思想是:初始时,将每个片段归为一类,计算每两个类之间的相似度,并从中选择相似度最高的两个类再归为一类,再计算新生成的类与各个旧类之间的相似度,并从新计算的相似度和每两旧类的相似度中选择相似度最高的两个类再归为一类,依次类推,直至所有类都归为一类结束。

基于此,以两类之间的相似度为KL(Kullback-Leibler Distance)距离为例,下面介绍依据每个片段的概率分布矩阵对多个片段进行分层聚类的过程:

计算每两类的概率分布矩阵之间的KL距离,公式如下:

其中,k表示相对时间戳,K表示相对时间戳的数量,{0,1......d}表示具有相同周期T的兴趣点位集合,p(x

初始时,将每个片段归为一类,计算每两片段的概率分布矩阵之间的KL距离,从中选择KL距离最小的两片段再归为一类,得到一种聚类结果,再计算新生成类与各个旧类的概率分布矩阵之间的KL距离,并从新计算的KL距离和每两旧类的KL距离中选择KL距离最小的两个类再归为一类,依次类推,直至所有类都归为一类结束。

由此可见,在分层聚类过程中聚几次,最终就会得到几种聚类结果。另外,每聚一次,需要先依据位于目标兴趣点位的采集器在新生成类包含的片段内采集的轨迹点,确定该类的概率分布矩阵,然后再计算新生成类与各个旧类的概率分布矩阵之间的KL距离。

基于上述计算概率分布矩阵的过程,对于一个类包含多个片段的概率分布矩阵,在计算指定对象在每个相对时间戳下出现在目标兴趣点位的概率时,上述公式中的片段集合I为该类包含的片段。

需要说明的是,由于聚类需要依据两个概率分布矩阵之间的KL距离来进行判断,而当来自两个不同概率分布矩阵P与Q中的概率p(x

步骤105:从多种聚类结果中选择符合预设条件的聚类结果。

在一实施例中,可以通过针对每种聚类结果中的每个类,依据该类包含的片段的概率分布矩阵确定该类的错误率,然后针对每种聚类结果,依据该聚类结果中每个类的错误率,确定该聚类结果的错误率,并依据每种聚类结果的错误率,从所述多种聚类结果中选择符合预设条件的聚类结果。

其中,每个类的错误率计算公式如下,假设类C={I

其中,在第j个片段的概率分布矩阵中,

聚类结果的错误率计算公式如下:

其中,E(C

在本申请中,针对依据每种聚类结果的错误率,从所述多种聚类结果中选择符合预设条件的聚类结果的过程,可以通过从每种聚类结果的错误率中选择错误率下降最快的聚类结果作为符合预设条件的聚类结果。

其中,分层聚类的过程是类的数量逐渐减少的过程,直至所有类都聚为一个类,并且每次得到的聚类结果的错误率也是呈逐渐下降的趋势,如果某次得到的聚类结果的错误率相对前一次得到的聚类结果的错误率下降最快,表示该次得到的聚类结果最准确。从所有聚类结果的错误率中选择错误率下降最快的计算公式如下:

步骤106:依据选择的聚类结果确定指定对象出现在目标兴趣点位的周期行为信息。

在一实施例中,可以通过针对选择的聚类结果中的每个类,依据位于目标兴趣点位的采集器在该类包含的片段内采集的轨迹点,确定该类的概率分布矩阵,并将该类的概率分布矩阵确定为指定对象出现在目标兴趣点位的周期行为信息。

其中,该类的概率分布矩阵也是包括指定对象在每个相对时间戳下出现在每个目标兴趣点位的概率。该类的概率分布矩阵计算方式可以参见上述步骤104中有关分层聚类过程中的相关描述。

以分析学生的周期行为为例,假设兴趣点位有教学楼、体育馆、宿舍、家里,并且在这些兴趣点位中均布设有采集器,通过获取采集器在5月1号到7月1号这一时间段内采集的该学生的轨迹点,并依据这段时间的轨迹点进行周期提取,假设教学楼、体育馆、宿舍的周期均为1天,然后将这段时间按照周期1天的间隔划分为61个片段,又依据位于教学楼、体育馆、宿舍的轨迹点,对61个片段进行分层聚类,最终选择的符合条件的聚类结果中有两类:5月份和6月份中的工作日为一类,5月份和6月份中的周末为一类。

假设将周期1划分为0点、1点、2点、3点……23点,24个相对时间戳,对于5月份和6月份中的工作日这一类的概率分布矩阵中,包含该学生在每个相对时间戳下出现在教学楼、体育馆、宿舍三个地点的概率,例如,该学生在凌晨1点出现在宿舍的概率为99%,出现在教学楼概率为1%,出现在体育馆概率为0%;……;上午10点出现在宿舍的概率为15%,出现在教学楼概率为65%,出现在体育馆概率为20%;……;下午4点出现在宿舍的概率为10%,出现在教学楼概率为30%,出现在体育馆概率为60%;以此类推。由此可见,该学生在工作日的白天,一般上午常出现在教学楼,下午常出现在体育馆。

对于5月份和6月份中的周末这一类的概率分布矩阵中,也包含该学生在每个相对时间戳下出现在教学楼、体育馆、宿舍三个地点的概率,只是在不同的相对时间戳下出现在三个地点的概率与工作日的概率不同,例如,该学生在凌晨1点出现在宿舍的概率为100%,出现在教学楼概率为0%,出现在体育馆概率为0%;……;上午10点出现在宿舍的概率为70%,出现在教学楼概率为0%,出现在体育馆概率为30%;……;下午4点出现在宿舍概率为15%,出现在教学楼概率为0%,出现在体育馆概率为85%;以此类推。由此可见,该学生在周末的白天,一般上午常出现在宿舍,下午常出现在体育馆。

由上述例子可以发现,由于在不同类别的概率分布矩阵中,在同一相对时间戳下,出现在同样地点的概率存在很大的差异,因此不同类别的概率分布矩阵会体现不同的行为模式。

在本申请实施例中,通过获取各个采集器在预设时间段内采集的指定对象的轨迹点(包括采集器标识和采集时刻),针对兴趣点位集中的每个兴趣点位,依据位于该兴趣点位的采集器采集的轨迹点确定指定对象出现在该兴趣点位的周期,获取具有相同周期的目标兴趣点位,并按照该周期将预设时间段划分为多个片段,然后依据位于目标兴趣点位的采集器采集的轨迹点,对多个片段进行分层聚类得到多种聚类结果,从多种聚类结果中选择符合预设条件的聚类结果,最后依据选择的聚类结果确定指定对象出现在目标兴趣点位的周期行为信息。

基于上述描述可知,通过在每个兴趣点位布设至少一个采集器,以采集出现在兴趣点位的对象并记录对象的轨迹点,在周期探索阶段,通过从这些轨迹点中自动提取出各兴趣点位的周期,避免进行周期间隔的预判,从而可提高后续周期行为分析的准确性。对于具有相同周期的目标兴趣点位,通过以该周期为间隔将采集轨迹的时间段划分为多个片段,并通过分层聚类将行为模式相近的片段聚成一类,以将相同周期的不同类别的行为模式剥离开,使得对象的周期行为体现更为清晰,避免出现交织影响的情况。

图2A为本申请根据一示例性实施例示出的另一种周期行为分析方法的实施例流程图,基于上述图1所示实施例的基础上,本实施例以对步骤102中如何提取每个兴趣点位的周期为例进行示例性说明,下面以一个兴趣点位为例进行说明。如图2A所示,所述周期行为分析方法进一步包括:

步骤201:依据预设时间段的长度和预设周期粒度确定出多个候选周期。

在本申请中,用于采集数据的采集器的位置固定,从而采集的对象的轨迹点中的地理位置也就相对固定,不同于GPS上报对象轨迹点的采集方式。由于采集器设备本身的不足,有对象经过时会存在漏拍漏采的情况,因此每个对象对应的轨迹点中存在较为严重的数据缺失问题,进而通过传统的傅里叶变换或自相关函数方式无法准确地提取出周期。

基于此,可以先根据历史数据的时间长度和预设周期粒度取出所有的候选周期,然后再从候选周期中提取出正确的周期。

其中,预设周期粒度可以是小时、天、周、月等粒度,需要根据实际分析需求设置。

示例性的,假设历史数据的时间长度为5月1号到7月1号,如果预设周期粒度为1天,那么可以依次取出的候选周期有1天、2天、3天……61天;如果预设周期粒度为1周,那么可以依次取出的候选周期有1周、2周、3周、4周......8周。

在本申请中,为了提高周期提取效率,可以设置一个候选周期的最大数量,当取出的候选周期数量达到该最大数量时,停止候选周期提取。

步骤202:依据位于该兴趣点位的采集器采集的轨迹点的采集时刻确定每个候选周期的不平衡指数。

在一实施例中,针对每个候选周期,可以通过按照该候选周期将所述预设时间段划分为多个片段,并将该候选周期划分成多个相对时间戳,并针对位于该兴趣点位的采集器在每个片段内采集的每个轨迹点,依据该轨迹点的采集时刻与该片段的起始时刻之间的间隔时长确定该轨迹点对应的相对时间戳,然后统计每个相对时间戳对应的轨迹点的数量,并依据每个相对时间戳对应的轨迹点的数量确定该候选周期的不平衡指数。

其中,相对时间戳的划分方式可以参见上述步骤104的相关描述,即按照预设时间间隔将候选周期划分为多个相对时间戳,该预设时间间隔可以根据实际需求设置。不平衡指数用于表征在对应的候选周期下轨迹点的均匀分布程度,不平衡指数越大,表示轨迹点分布约不均匀。不平衡指数的计算公式如下:

其中,k表示在该候选周期下的相对时间戳的数量,c

示例性的,假设候选周期为1天,预设时间间隔为1小时,可以划分出0点、1点、2点、3点......23点,24个相对时间戳,图2B为一种示例性的轨迹示意图,仅示出了某一片段中从8点到20点之间的轨迹点。

步骤203:从每个候选周期的不平衡指数中选择最大不平衡指数,并将最大不平衡指数对应的候选周期作为该兴趣点位的周期。

在本申请中,对于属于某一兴趣点位的所有轨迹点,针对每个候选周期对应统计得到的每个相对时间戳对应的轨迹点的数量的分布,表征的是指定对象在该候选周期下出现在该兴趣点位的分布情况,如果该候选周期为正确的周期,则在该候选周期下出现在该兴趣点位的分布应呈现比较集中的分布,如果该候选周期为错误的周期,则在该候选周期下出现在该兴趣点位的分布会呈现比较均匀的分布。

如图2C中的(a)为一种正确候选周期的数据分布示意图,(b)为一种错误的候选周期的数据分布示意图。

由上述描述可知,最大不平衡指数对应的候选周期即为最准确的周期。

至此,完成上述图2A所示流程,通过计算每个候选周期的不平衡指数,以从候选周期中选出正确的周期。

图3为本申请根据一示例性实施例示出的一种电子设备的硬件结构图,该电子设备包括:通信接口301、处理器302、机器可读存储介质303和总线304;其中,通信接口301、处理器302和机器可读存储介质303通过总线304完成相互间的通信。处理器302通过读取并执行机器可读存储介质303中与周期行为模式分析方法的控制逻辑对应的机器可执行指令,可执行上文描述的周期行为模式分析方法,该方法的具体内容参见上述实施例,此处不再累述。

本申请中提到的机器可读存储介质303可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:易失存储器、非易失性存储器或者类似的存储介质。具体地,机器可读存储介质303可以是RAM(Radom Access Memory,随机存取存储器)、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、DVD等),或者类似的存储介质,或者它们的组合。

图4为本申请根据一示例性实施例示出的一种周期行为分析装置的实施例结构图,该装置可以应用在电子设备上,如图4所示,该周期行为分析装置包括:

轨迹点获取模块410,用于获取各个采集器在预设时间段内采集的指定对象的轨迹点,所述轨迹点包括采集器标识和采集时刻;

周期确定模块420,用于针对兴趣点位集中的每个兴趣点位,依据位于该兴趣点位的采集器采集的轨迹点确定指定对象出现在该兴趣点位的周期;

片段划分模块430,用于获取具有相同周期的目标兴趣点位,并按照该周期将所述预设时间段划分为多个片段;

聚类模块440,用于依据位于目标兴趣点位的采集器采集的轨迹点,对所述多个片段进行分层聚类得到多种聚类结果,从所述多种聚类结果中选择符合预设条件的聚类结果;

行为确定模块450,用于依据选择的聚类结果确定指定对象出现在目标兴趣点位的周期行为信息。

在一可选实现方式中,所述周期确定模块420,具体用于依据预设时间段的长度和预设周期粒度确定出多个候选周期;依据位于该兴趣点位的采集器采集的轨迹点的采集时刻确定每个候选周期的不平衡指数;从每个候选周期的不平衡指数中选择最大不平衡指数,并将最大不平衡指数对应的候选周期作为该兴趣点位的周期。

在一可选实现方式中,所述周期确定模块420,具体用于在依据位于该兴趣点位的采集器采集的轨迹点的采集时刻确定每个候选周期的不平衡指数过程中,针对每个候选周期,按照该候选周期将所述预设时间段划分为多个片段,并将该候选周期划分成多个相对时间戳;针对位于该兴趣点位的采集器在每个片段内采集的每个轨迹点,依据该轨迹点的采集时刻与该片段的起始时刻之间的间隔时长确定该轨迹点对应的相对时间戳;统计每个相对时间戳对应的轨迹点的数量,并依据每个相对时间戳对应的轨迹点的数量确定该候选周期的不平衡指数。

在一可选实现方式中,所述聚类模块440,具体用于在依据位于目标兴趣点位的采集器采集的轨迹点,对所述多个片段进行分层聚类得到多种聚类结果过程中,将该周期划分成多个相对时间戳;针对每个片段,依据位于目标兴趣点位的采集器在该片段内采集的轨迹点确定该片段的概率分布矩阵,所述概率分布矩阵包括指定对象在每个相对时间戳下出现在每个目标兴趣点位的概率;依据每个片段的概率分布矩阵对所述多个片段进行分层聚类,得到多种聚类结果。

在一可选实现方式中,所述聚类模块440,具体用于在从所述多种聚类结果中选择符合预设条件的聚类结果过程中,针对每种聚类结果中的每个类,依据该类包含的每个片段的概率分布矩阵确定该类的错误率;针对每种聚类结果,依据该聚类结果中每个类的错误率,确定该聚类结果的错误率;依据每种聚类结果的错误率,从所述多种聚类结果中选择符合预设条件的聚类结果。

在一可选实现方式中,所述行为确定模块450,具体用于针对选择的聚类结果中的每个类,依据位于目标兴趣点位的采集器在该类包含的片段内采集的轨迹点,确定该类的概率分布矩阵;将该类的概率分布矩阵确定为指定对象出现在目标兴趣点位的周期行为信息。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

相关技术
  • 周期行为分析方法及装置
  • 顾客行为分析装置、顾客行为分析系统和顾客行为分析方法
技术分类

06120112518251