一种伴随关系发现方法及装置

文献发布时间：2023-06-19 12:24:27

技术领域

本申请涉及大数据处理领域，并且更具体地，涉及一种伴随关系发现方法及装置。

背景技术

目前，伴随关系的发现具有广泛的应用场景。基于伴随关系可以发现团伙新成员。例如，辅助警察发现嫌疑团伙新成员。基于伴随关系还可以发现一人多号、一人多通讯设备。例如，发现嫌疑人的多个通讯设备。

现有的伴随关系发现方法，是基于图像识别的方法。其发现伴随关系的过程为：根据视频图像数据对人脸、人体进行跟踪分析，通过跟踪分析发现两个目标之间的伴随关系。一方面，上述方法容易出现较大误差，例如，由于天气或光线不佳(尤其是在夜间)，会导致人像识别不准确，进而导致伴随关系确定不准确。再例如，在被拍摄的目标人物的面部被遮挡的情况下，无法根据视频图像进行人脸识别、匹配。另一方面，上述方法需要进行全量数据的匹配，计算量较大。

发明内容

本申请提供了一种伴随关系发现方法及装置，以克服现有技术中存在的问题。

第一方面，提供了一种伴随关系发现方法，该方法包括：获取N个目标的行为轨迹，N为大于1的整数；将该N个目标的行为轨迹分成M组行为轨迹，每组行为轨迹中包括至少一个目标的行为轨迹，该每组行为轨迹对应一种行为模式，M为小于或等于N的正整数；根据该每组行为轨迹包括的目标的行为轨迹特征，确定每组行为轨迹对应的潜在伴随对；在该每组行为轨迹对应的潜在伴随对中确定伴随对，该伴随对中的两个目标存在伴随关系。

基于上述技术方案，可以基于目标的行为轨迹，更准确地发现目标的伴随关系。此外，根据目标的行为轨迹对目标进行分组后，在每组中确定对该组包括的潜在伴随对的方法、以及伴随关系的方法，可以降低数据分析的计算量、提高发现伴随关系的效率。

结合第一方面，在第一方面的某些实现方式中，在该每组行为轨迹对应的潜在伴随对中确定伴随对，包括：根据伴随关系判断方法，在该每组行为轨迹对应的潜在伴随对中确定伴随对；其中，该伴随关系判断方法为：基于空间距离的相似性分析方法，或，基于点数的相似性分析方法。

结合第一方面，在第一方面的某些实现方式中，根据目标的行为轨迹的时空统计数据，确定伴随关系判断方法。

基于上述技术方案，通过自适应目标的行为轨迹确定最优的相似性分析方法，可以提高基于大数据发现伴随关系的可靠性。

结合第一方面，在第一方面的某些实现方式中，该目标的行为轨迹特征包括以下特征中的任意一种或多种：该目标的行为轨迹包括的行为轨迹点的个数、该目标的行为轨迹对应的地块编号、该目标的行为轨迹的方向、该目标的速度。

结合第一方面，在第一方面的某些实现方式中，该潜在伴随对中的两个目标满足以下条件的任意一种或多种：行为轨迹点数的差小于第一阈值；具有相同的地块编号；方向夹角小于第二阈值；平均速度差与双方平均速度较小值的比值小于第三阈值；或者，速度区间有交集。

结合第一方面，在第一方面的某些实现方式中，该伴随关系用于确定团队新目标。

结合第一方面，在第一方面的某些实现方式中，该获取N个目标的行为轨迹，包括：

根据出行数据，获取该N个目标的行为轨迹，其中，该出行数据包括以下数据的任意一种或多种：信令数据、全球定位系统GPS数据、互联网协议IP数据、卡口过车数据、身份登记信息。

第二方面，提供了一种伴随关系发现装置，该装置包括：获取单元，用于获取N个目标的行为轨迹，N为大于1的整数；处理单元，将该N个目标的行为轨迹分成M组行为轨迹，每组行为轨迹中包括至少一个目标的行为轨迹，该每组行为轨迹对应一种行为模式，M为小于或等于N的正整数；该处理单元，还用于根据该每组行为轨迹包括的目标的行为轨迹特征，确定该每组行为轨迹对应的潜在伴随对；该处理单元，还用于在该每组行为轨迹对应的潜在伴随对中确定伴随对，该伴随对中的两个目标存在伴随关系。

基于上述技术方案，以基于目标的行为轨迹，更准确地发现目标的伴随关系。此外，根据目标的行为轨迹对目标进行分组后，在每组中确定对该组包括的潜在伴随对的方法、以及伴随关系的方法，可以降低数据分析的计算量、提高发现伴随关系的效率。

结合第二方面，在第二方面的某些实现方式中，该处理单元具体用于：根据伴随关系判断方法，在该每组行为轨迹对应的潜在伴随对中确定伴随对；其中，该伴随关系判断方法为：基于空间距离的相似性分析方法，或，基于点数的相似性分析方法。

结合第二方面，在第二方面的某些实现方式中，根据目标的行为轨迹的时空统计数据，确定伴随关系判断方法。

基于上述技术方案，通过自适应目标的行为轨迹确定最优的相似性分析方法，可以提高基于大数据发现伴随关系的可靠性。

结合第二方面，在第二方面的某些实现方式中，该目标的行为轨迹特征包括以下特征中的任意一种或多种：该目标的行为轨迹包括的行为轨迹点的个数、该目标的行为轨迹对应的地块编号、该目标的行为轨迹的方向、该目标的速度。

结合第二方面，在第二方面的某些实现方式中，该潜在伴随对中的两个目标满足以下条件的任意一种或多种：行为轨迹点数的差小于第一阈值；具有相同的地块编号；方向夹角小于第二阈值；平均速度差与双方平均速度较小值的比值小于第三阈值；或者，速度区间有交集。

结合第二方面，在第二方面的某些实现方式中，该伴随关系用于确定团队新目标。

结合第二方面，在第二方面的某些实现方式中，该处理单元具体用于：根据出行数据，获取该N个目标的行为轨迹，其中，该出行数据包括以下数据的任意一种或多种：信令数据、全球定位系统GPS数据、互联网协议IP数据、卡口过车数据、身份登记信息。

第三方面，提供了一种伴随关系发现装置，该装置包括存储器和处理器，

该存储器用于存储指令，该处理器用于读取该存储器中存储的指令，使得该伴随关系发现装置执行上述第一方面及第一方面的任意可能的实现方式中的方法。

可选的，所述处理器为一个或多个，所述存储器为一个或多个。

可选的，所述存储器与所述处理器集成在一起，或者所述存储器与处理器分离设置。

在具体实现过程中，存储器可以为非瞬时性(non-transitory)存储器，例如只读存储器(read only memory，ROM)，其可以与处理器集成在同一块芯片上，也可以分别设置在不同的芯片上，本申请实施例对存储器的类型以及存储器与处理器的设置方式不做限定。

第四方面，提供了一种计算机可读存储介质，用于存储计算机程序，该计算机程序包括用于执行上述第一方面及上述第一方面的任意可能的实现方式中的方法的指令。

第五方面，提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面及上述第一方面的任意可能的实现方式中的方法。

第六方面，提供了一种芯片，包括至少一个处理器和接口；所述至少一个所述处理器，用于调用并运行计算机程序，以使所述芯片执行上述第一方面及上述第一方面的任意可能的实现方式中的方法。

附图说明

图1是适用于本申请实施例提供的方法的系统100的示意性框图。

图2是本申请实施例提供的伴随关系发现方法200的示意性流程图。

图3是本申请实施例提供的根据目标的行为轨迹的分组方法300的示意性流程图。

图4是本申请实施例提供的根据目标的行为轨迹特征确定潜在伴随对的方法400的示意性流程图。

图5是本申请实施例提供的根据伴随关系确定团伙新成员的示意性框图。

图6是本申请实施例提供的伴随关系发现的装置600的示意性框图。

图7是本申请实施例提供的伴随关系发现的装置700的示意性框图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

图1示出了适用于本申请实施例提供的方法的系统100的示意性框图。

如图1所示，该系统100包括伴随关系发现系统110和服务器120。

伴随关系发现系统110，包括数据获取模块111、数据分析模块112、数据存储模块113、应用模块114。

数据获取模块111，可以提供统一的接口(例如，应用程序接口(applicationprogramming interface，API))，以便访问服务器120中的数据。

数据分析模块112，可以提供不同的数据分析方法，以便对数据获取模块111获取的数据进行分析。例如，对数据进行特征提取等。或者，对数据进行分类处理。

数据存储模块113，可以用于存储数据获取模块111获取的数据，也可以用于存储数据分析模块112的分析结果，还可以存储应用模块114的应用结果。

应用模块114，可以将数据分析模块112的分析结果应用于不同场景。例如，应用模块114，可以根据分析结果发现团伙的新成员。例如，应用模块114，可以根据分析结果发现冒用他人身份的违法行为。

服务器120，用于提供数据。例如，该数据可以包括以下任意一种或多种：包括信令数据、全球定位系统(global positioning system，GPS)数据、网际互连协议(internetprotocol，IP)接入数据、卡口过车数据、身份登记数据、其他数据。

在一种应用场景中，该服务器120可以是第三方设备(例如，GPS定位系统、网络设备)，由服务器120直接向伴随关系发现系统110提供数据。

在另一种应用场景中，该服务器120可以预先从第三方设备((例如，GPS定位系统、网络设备)获取数据后，并向伴随关系发现系统110提供该数据。

应理解，系统100仅为示意，并不对本申请提供的方法的应用场景构成任何限定。例如，伴随关系发现系统110中可以包括更多或更少的模块。例如，系统100中，还可以包括更多的服务器120。

下面，结合图2和图3，详细描述本申请实施例提供的伴随关系发现方法。

图2示出了本申请实施例提供的伴随关系发现方法200的示意性流程图。该方法200包括步骤210至步骤240，下面对这些步骤进行详细介绍。

步骤210，获取N个目标的行为轨迹，N为大于1的整数。

本申请实施例中，获取N个目标的行为轨迹，包括：根据N个目标的出行数据，获取该N个目标的行为轨迹。其中，该出行数据包括以下数据的任意一种或多种：信令数据、全球定位系统GPS数据、互联网协议IP数据、卡口过车数据、身份登记信息。

本申请实施例中，对获取的目标的出行数据的格式不作具体限定。

例如，当获取的目标的出行数据为GPS数据时，每个GPS数据的格式可以为：[011(硬件设备标识号(identity document，ID))，113.1111(硬件设备经度)，23.3333(基站纬度)，2019-09-24 09:01:03(时间)]。例如，当获取的目标的出行数据为信令数据时，每个信令数据的格式可以为：[13712341234(手机号)，113.1111(基站经度)，23.3333(基站纬度)，2019-09-24 09:01:03(时间)]。例如，当获取的目标的出行数据为IP接入数据时，每个IP接入数据的格式可以为：[SNWHAS(物理地址)，192.168.1.1(IP)，深圳市龙岗区XX路XX号(该IP对应的地址可由信息点(Point of Interest，POI)服务转换为经纬坐标),2019-09-2409:01:03(时间)]。例如，当获取的目标的出行数据为卡口过车数据时，每个卡口过车数据的格式可以为：[粤A5789HK(车牌)，3012572(卡口ID)，113.1111(卡口经度)，23.3333(卡口纬度)，2019-09-24 09:01:03(时间)]。例如，当获取的目标的出行数据为身份登记数据时，每个身份登记数据的格式可以为：[460468198807255678(身份证)，广州市白云大酒店(该IP对应的地址可由POI服务转换为经纬坐标)，2019-09-24 09:01:03(时间)]。

在本申请实施例中，根据出行数据，获得该N个目标的行为轨迹，包括：根据出行数据，获取该第i个目标对应的出行数据，根据该第i个目标对应的出行数据，获取该第i个目标的行为轨迹点，并根据该第i个目标的行为轨迹点获得该第i个目标的行为轨迹。其中，该第i个目标的行为轨迹中包括的行为轨迹点可以是按照时间顺序进行排列的。该第i个目标的行为轨迹包括该第i个目标的多个行为轨迹点。其中，N为大于1的整数，i为大于1且小于N的整数。

在本申请实施例中，对根据出行数据，获取该第i个目标对应的出行数据的方式不作具体限定，N为大于1的整数。

在一种可实现的方式中，可以根据出行数据的硬件设备标识号，获取每个目标的出行数据。

例如，数据表A中包括5个出行数据，分别为出行数据1、出行数据2、出行数据3、出行数据4、出行数据5。该出行数据的格式为GPS数据的格式，且这5个出行数据对应的ID分别为：101、110、102、110、101。目标1的GPS的ID号有101，目标2的GPS的ID号有102，目标3的GPS的ID号有110。因此，可以认为出行数据1和出行数据5为目标1的出行数据。可以认为出行数据3为目标2的出行数据。可以认为出行数据2和出行数据4为目标3的出行数据。

根据出行数据，获得该第i个目标的行为轨迹点，可以理解为，根据该第i个目标的出行数据中包括的经纬度位置信息和时间，确定该第i个目标的行为轨迹点。具体地，该第i个目标的出行数据对应的经纬度位置和时间，就是该第i个目标的行为轨迹点。

在一种可实现的方式中，根据第N个目标的出行数据，获得该第i个目标的行为轨迹。例如，根据目标#1随身携带的硬件设备标识号，在多个出行数据中获取了目标#1的3个出行数据，这三个出行数据分别对应目标#1的3个行为轨迹点，将这3个行为轨迹点按时间顺序依次聚合成该目标#1的行为轨迹。其中，该目标#1的行为轨迹可以通过如下方式表示：{ID，(x1，y1，t1),(x2，y2，t2)，(x3，y3，t3)}。其中，t1、t2、t3用于表示时间，且t1小于t2，t2小于t3。

步骤220，将该N个目标的行为轨迹分成M组行为轨迹，每组行为轨迹中包括至少一个目标的行为轨迹，该每组行为轨迹对应一种行为模式，M为小于或等于N的正整数。

在本申请实施例中，对将该N个目标的行为轨迹分成M组行为轨迹的分组方法不作具体限定。

在一种可实现的方式中，可以根据目标的运动特性对目标的行为轨迹进行分组。例如，基于目标的运动特性，可以将目标的行为轨迹分为以下三组：昼伏夜出组、规律的多点一线组、不间断运动组。这三组中的每一组表示目标的行为轨迹的一种行为模式。

在另一种可实现的方式中，可以基于地理特性对目标的行为轨迹进行分组。

作为示例非限定，可以根据目标的地理活动范围，对目标的行为轨迹进行分组。例如，将行为轨迹的任意两个行为轨迹点的距离的最大值超过j公里的目标分为一组，将行为轨迹的任意两个行为轨迹点的距离的最大值小于或等于j公里的目标分为一组。其中，j为大于0的数。

作为示例非限定，可以根据一段时间内目标的累计路程，对目标的行为轨迹进行分组。例如，统计每个目标在24小时内的累计路程，可以将累计路程大于15公里的目标分为一组，可以将累计路程小于3公里的目标分为一组，可以将累计路程大于3公里且小于15公里的目标分为一组公里的目标分为一组。

步骤230，根据该每组行为轨迹包括的目标的行为轨迹特征，确定该每组行为轨迹对应的潜在伴随对。

根据该每组行为轨迹包括的目标的行为轨迹特征，确定该每组行为轨迹对应的潜在伴随对，包括：根据目标的行为轨迹，并结合特征提取的方法，获得该目标的行为轨迹特征。并根据目标的行为轨迹特征，确定潜在伴随对。

在本申请实施例中，对特征提取的方法不作具体限定。例如，可以是主成分分析方法。例如，可以是尺度不变特征转换方法。

根据目标的行为轨迹特征，确定潜在伴随对，可以理解为，当两个目标的行为轨迹特征满足以下条件的任意一种或多种时，则认为这两个目标为潜在伴随对：

行为轨迹点数的差小于第一阈值；

具有相同的地块编号；

方向夹角小于第二阈值；

平均速度差与双方平均速度较小值的比值小于第三阈值；或者，

速度区间有交集。

本申请对第一阈值、第二阈值、第三阈值的大小，不作具体限定。例如，第一阈值、第二阈值、第三阈值的大小，可以根据N个目标的行为轨迹的具体的数据值进行设置。或者，第一阈值、第二阈值、第三阈值的大小，还可以根据人工经验进行设置。

还应理解，当两个目标的行为轨迹特征满足上述条件的任意一种或多种时，则认为这两个目标不是潜在伴随对。

在本申请实施例中，目标的行为轨迹特征包括以下特征中的任意一种或多种：该目标的行为轨迹包括的行为轨迹点的个数、该目标的行为轨迹对应的地块编号、该目标的行为轨迹的方向、该目标的速度。

可选的，在一些实施例中，可以根据该每组行为轨迹包括的目标的行为轨迹特征，确定该每组行为轨迹包括的候选潜在伴随对。并根据每组行为轨迹包括的候选潜在伴随对，确定该每组行为轨迹对应的潜在伴随对。

在一种可实现的方式中，该组包括k个目标的行为轨迹特征，则该组包括的候选潜在伴随对为

步骤240，在该每组行为轨迹对应的潜在伴随对中确定伴随对，该伴随对中的两个目标存在伴随关系。

在该每组行为轨迹对应的潜在伴随对中确定伴随对，该伴随对中的两个目标存在伴随关系，包括：根据伴随关系判断方法，在该每组行为轨迹对应的潜在伴随对中确定伴随对；

其中，该伴随关系判断方法为：基于空间距离的相似性分析方法，或者，基于点数的相似性分析方法。

可选的，在一些实施例中，可以根据潜在伴随对包括的目标的行为轨迹的时空统计数据，确定伴随关系判断方法。

本申请实施例中，对目标的行为轨迹的时空统计数据不作具体限定。例如，该时空统计数据可以是该目标的行为轨迹的跳变数据。或者，该时空统计数据可以是该目标的行为轨迹的运动速度的波动数据。

根据该潜在伴随对包括的目标的行为轨迹的时空统计数据，确定伴随关系判断方法，至少包括以下情况：

情况一：当潜在伴随对包括的每个目标的行为轨迹的时空统计数据均为高质量时，在此情况下，确定伴随关系判断方法为基于空间距离的相似性分析方法(例如，欧几里得算法、海明距离算法)。其中，空间上的两点距离越小，则两点代表的对象的特征差异性越小,相似性越大。

情况二：当潜在伴随对包括的每个目标的行为轨迹的时空统计数据均为低质量时，在此情况下，确定伴随关系判断方法为基于点数的相似性分析方法(例如，最长公共子序列算法)。因为低质量数据频发跳变，波动大，若使用基于空间距离的相似性分析方法，本来相似的轨迹，会因为极少数点跳变距离大而影响整体评分。

在本申请实施例中，对确定时空统计数据为高质量或低质量的方法不作具体限定。

在一种可实现的方式中，可以根据目标的行为轨迹数据的特性(例如，目标的行为轨迹是否频发跳变，目标的行为轨迹的速度是否波动大等)，确定时空统计数据为高质量或低质量。例如，当该目标的运动速度的方差小于a时，且该目标的行为轨迹跳变次数小于阈值T时，则该目标的数据为高质量数据。否则，该目标的数据为低质量数据。在本申请中对a和T的具体取值不作具体限定，a和T可以为预定义的值，也可以为固定值。

作为示例非限定，当潜在伴随对包括的目标的行为轨迹的时空统计数据均为高质量时，可以采用欧几里得算法对包括的目标进行相似性分析，获得的距离小于预定义的阈值时，则潜在伴随对包括的目标存在伴随关系。若获得的距离大于或等于预定义的阈值时，则潜在伴随对包括的目标不存在伴随关系。

作为示例非限定，当潜在伴随对包括的目标的行为轨迹的时空统计数据均为低质量时，可以采用最长公共子序列算法对潜在伴随对包括的目标进行相似性分析。若获得的最长公共子序列长度占轨迹整体长度的比例大于或等于预定义阈值时，则潜在伴随对包括的目标存在伴随关系。若获得的最长公共子序列长度占轨迹整体长度的比例小于预定义阈值时，则潜在伴随对包括的目标不存在伴随关系。

根据本申请实施例的方法确定的伴随关系，可以用于确定团队新目标。

作为示例非限定，图5示出了根据本申请实施例提供的伴随关系确定团伙新成员的示意性框图。如图5所示，假设已知嫌疑团伙包括成员A、成员B、成员C，根据图2中的方法200可以确定19933334444分别与成员A、成员B、成员C都存在伴随关系，故可以确定该19933334444为加入该嫌疑团伙的新成员。

作为示例非限定，根据伴随关系，还可以确定一人多号的行为。例如，在数据来源为信令数据的场景中，对于某一对伴随关系，若其伴随时长接近于双方轨迹持续时长的较小值。该对伴随关系升级为持续伴随，即这两个手机号为同一人所有。此外，基于一人多号的行为，并结合开户信息表，可以判断是否存在冒用他人身份开户的行为。例如，某个人拥有两个手机号，且这两个手机号对应的身份证不统一时，可以认为此人存在冒用他人身份开户的行为。

本申请提供的伴随关系发现方法，在没有视频图片数据输入的情况下，可以基于行为数据，确定目标的行为轨迹，发现目标的伴随关系。此外，根据目标的行为轨迹对目标进行分组后，在每组中确定对该组包括的潜在伴随对的方法、以及伴随关系的方法，可以降低数据分析的计算量、提高发现伴随关系的效率。

为了便于理解方法200中的步骤220，下面以“根据目标的运动特性将目标的行为轨迹分为以下三组：昼伏夜出组、规律的多点一线组、不间断运动组”为例，并结合图3，对步骤220的基于目标的行为轨迹的分组方法进行说明。

图3示出了本申请实施例提供的根据目标的行为轨迹的分组方法300的示意性流程图。如图3所示，该方法300包括步骤310至步骤330。应理解，图3仅为示意，并不对本申请构成任何限定。下面，对步骤310至步骤330进行详细介绍。

步骤310，遍历目标的行为轨迹，若该目标的行为轨迹在区域#1中有停留点，则将该目标归入不间断运动组；否则，继续执行步骤320。

在本申请实施例中，区域#1可以是预定义的区域，区域#1也可以是根据伴随关系的应用场景确定的区域。故本申请中对区域#1的大小不作具体限定。

在一种可实现的方式中，可通过如下方法，根据目标的行为轨迹，确定该目标的行为轨迹在区域#1中有停留点：当目标的行为轨迹包括的至少一个行为轨迹点#1在半径为r的区域#1内出现，且该行为轨迹点#1在区域#1内停留时间超过t，则可以认为该目标的行为轨迹在区域#1中有停留点。否则，可以认为该目标在区域#1中没有停留点。其中，r和t为大于或等于1的正整数。对r和t的单位不作具体限定。例如，r的单位可以是千米。或者，r的单位可以是米。例如，t的单位可以是小时。或者，t的单位可以是分钟。

其中，可以对该目标随身携带的通信设备进行GPS定位，根据获取的该通信设备的G PS定位数据确定该目标的行为轨迹点#1在区域#1内停留的时间t。

例如，假设目标A携带的通信设备的ID号为101。区域1为在半径为50米的圆形区域，且该区域1对应的经度范围为70°至90°，且该区域1对应的纬度范围为100°至120°。也就是说，若检测到目标A的ID号的经度范围为70°至90°之间，且目标A的ID号的纬度范围为100°至120°，可以认为目标A在区域1中。否则，认为目标A在不区域1中。根据GPS定位系统可以获得该目标A随身携带的通信设备101的GPS数据如下：(101，(65°，95°)，2019:12:20)、(101，(70°，101°)，2019:12:25)、(101，(82°，110°)，2019:12:26)、(101，(89°，120°)，2019:12:27)、(101，(95°，122°)，2019:12:29)。在此情况下，可以认为该目标A的行为轨迹#1在区域#1中停留了3分钟。

在本申请实施例中，该目标的行为轨迹在区域#1中有停留点，可以理解为，该目标的行为轨迹包括的一个或多个行为轨迹点在区域#1中有停留。

步骤320，确定该目标是否有夜间停留点，若该目标的行为轨迹在区域#1中有夜间停留点，则将该目标归入昼伏夜出组；否则，继续执行步骤330。

在本申请实施例中，对夜间的时间段不作具体限定。例如，夜间可以指当日下午6点到次日的早晨5点。例如，夜间可以指当日晚上8点到次日的早晨5点。例如，夜间可以指当日晚上10点到次日的早晨6点。

其中，遍历目标的行为轨迹，可以理解为，遍历步骤320获得的目标的行为轨迹。

遍历目标的行为轨迹，若发现目标在区域#1中有夜间停留点，执行步骤350。例如，经过步骤330确定目标在区域#1中存在停留点的情况下，且发现目标停留在区域#1的时间处于夜间，则执行步骤350。

遍历目标的行为轨迹，若没发现目标在区域#1中有夜间停留点，则确定该目标为昼伏夜出组。例如，经过步骤330确定目标在区域#1中存在停留点的情况下，且发现目标停留在区域#1的时间不处于夜间，则确定该目标为昼伏夜出组。

步骤330，确定该目标是否若干重复停留点，若该目标的行为轨迹在区域#1中有若干重复停留点，则将该目标归入不间断运动组；否则，将该目标归入多点一线组。

该目标在区域#1中存在若干重复停留点，可以理解为，每间隔T时间，该目标的行为轨迹包括p个行为轨迹点在区域#1中有停留。在此情况下，可以认为该目标的行为轨迹在区域#1中有若干重复停留点。其中，p可以为预定义的值，对p的大小步骤具体限定。

例如，目标A的行为轨迹包括行为轨迹点1、行为轨迹点2，且这两个行为轨迹点分别每间隔50分钟在区域#1中有停留。此时，可以认为若该目标A的行为轨迹在区域#1中有若干重复停留点。在此情况下，可以将该目标归入不间断运动组。

为了便于理解方法200中的步骤230，下面结合图4的实施例，对步骤230的方法进行介绍。

图4示出了本申请实施例提供的根据目标的行为轨迹特征确定潜在伴随对的方法400的示意性流程图。如图4所示，该方法400包括步骤410和步骤420。应理解，图4仅为示意，并不对本申请构成任何限定。下面，对步骤410和步骤420进行详细介绍。

本申请实施例，假设经过步骤220对N个目标的行为轨迹进行分组，获得M组行为轨迹。其中，有一组行为轨迹包括两个目标的行为轨迹，这两个目标分别为目标A、目标B。

步骤410，获取目标A和目标B的行为轨迹特征。

根据步骤210获得的目标A、目标B的行为轨迹，结合特征分析方法，可以获取目标A、目标B的行为轨迹特征。

本申请实施例对特征分析方法不作具体限定。例如，可以采用主成分分析法分别获取目标A、目标B的行为特征。或者，也可以采用线性分析方法分别获取目标A、目标B的行为特征。

在一种可现实的方式中，采用主成分分析法分别获取目标A、目标B的行为特征。获得目标A的行为轨迹特征包括目标运动的速度、目标运动的方向、目标的轨迹属性。获得目标B的行为轨迹特征包括目标运动的速度、目标运动的方向、目标的轨迹属性。

其中，目标的轨迹属性特征包括目标的行为轨迹点的个数、目标的行为轨迹所属地块的编号。目标的行为轨迹所属地块的编号可以根据GeoHash二进制编码获得。具体地，目标所处位置的经纬度信息经过GeoHash二进制编码后，将边长为d的地块内的所有经纬度坐标映射为同一地块编号。其中，d为大于或等于1的正整数。对d的单位不作具体限定。例如，d的单位可以为米，或者，千米。

其中，目标运动的方向特征可以理解为，目标的行为轨迹的第一个点到目标的行为轨迹的最后一个点所指的向量。例如，在以正东方向为r轴建立的极坐标系中，目标的行为轨迹所指的向量与r轴的夹角范围可以是[0,2π]。目标运动的速度特征包括目标运动额最高速度、目标运动的最低速度。

步骤420，根据目标A和目标B的行为轨迹特征，确定目标A和目标B是否为潜在伴随对。

根据目标A和目标B的行为轨迹特征，确定目标A和目标B是否为潜在伴随对，至少包括以下情况：

情况一：当目标A和目标B的行为轨迹点的个数的差小于第一阈值时，可以确定目标A和目标B为潜在伴随对。否则，可以确定目标A和目标B不是潜在伴随对。

情况二：当目标A和目标B的行为轨迹所在的地块编号相同时，可以确定目标A和目标B为潜在伴随对。否则，可以确定目标A和目标B不是潜在伴随对。

情况三：当目标A和目标B的行为轨迹的方向夹角小于第二阈值时，可以确定目标A和目标B为潜在伴随对。否则，可以确定目标A和目标B不是潜在伴随对。

情况四：当平均速度差与双方平均速度较小值的比值应小于第三阈值时，可以确定目标A和目标B为潜在伴随对。否则，可以确定目标A和目标B不是潜在伴随对。其中，平均速度差为目标#A的平均速度与目标#B的平均速度的差。

情况五：当目标A的速度区间和目标B的速度区间有交集时，可以确定目标A和目标B为潜在伴随对。否则，可以确定目标A和目标B不是潜在伴随对。其中，目标的速度区间可以是指[目标的最低速度，目标的最高速度]。

在本申请实施例中，第一阈值、第二阈值、第三阈值的大小，可以根据目标的出行数据包括的目标轨迹点的具体数据值进行设置。第一阈值、第二阈值、第三阈值的大小，还可以根据人工经验进行设置。也就是说，本申请对第一阈值、第二阈值、第三阈值的大小，不作具体限定。

需说明的是，根据目标A和目标B的行为轨迹特征，确定目标A和目标B是否为潜在伴随对时，可以执行上述情况一至情况五中的任意一种或多种方法。也就是说，根据步骤420确定的每个潜在伴随对包括的两个目标(例如，这两个目标分别为目标A和目标B)的行为轨迹特征满足以下条件中的任意一种或多种：

1)目标A和目标B的行为轨迹点的个数的差小于第一阈值；

2)目标A和目标B的行为轨迹所在的地块编号相同；

3)目标A和目标B的行为轨迹的方向夹角小于第二阈值；

4)平均速度差与双方平均速度较小值的比值应小于第三阈值，其中，平均速度差为目标#A的平均速度与目标#B的平均速度的差；

5)目标A的速度区间和目标B的速度区间有交集，其中目标的速度区间为[目标的最低速度，目标的最高速度]。

下面，结合图6和图7，详细描述适用于本申请实施例提供的伴随关系发现的装置。

图6示出了本申请实施例提供的伴随关系发现的装置600的示意性结构图。如图6所示，该数据挖掘方法的装置600包括获取单元610、处理单元620。

获取单元610，用于获取N个目标的行为轨迹，N为大于1的整数。

处理单元620，用于将该N个目标的行为轨迹分成M组行为轨迹，每组行为轨迹中包括至少一个目标的行为轨迹，该每组行为轨迹对应一种行为模式，M为小于或等于N的正整数；该处理单元620，还用于根据该每组行为轨迹包括的目标的行为轨迹特征，确定该每组行为轨迹对应的潜在伴随对。该处理单元620，还用于在该每组行为轨迹对应的潜在伴随对中确定伴随对，该伴随对中的两个目标存在伴随关系。

可选的，在一些实施例中，该处理单元具体用于：根据伴随关系判断方法，在该每组行为轨迹对应的潜在伴随对中确定伴随对；其中，该伴随关系判断方法为：基于空间距离的相似性分析方法，或，基于点数的相似性分析方法。

可选的，在一些实施例中，该目标的行为轨迹特征包括以下特征中的任意一种或多种：该目标的行为轨迹包括的行为轨迹点的个数、该目标的行为轨迹对应的地块编号、该目标的行为轨迹的方向、该目标的速度

可选的，在一些实施例中，该潜在伴随对中的两个目标满足以下条件的任意一种或多种：行为轨迹点数的差小于第一阈值；具有相同的地块编号；方向夹角小于第二阈值；平均速度差与双方平均速度较小值的比值小于第三阈值；或者，速度区间有交集。

可选的，在一些实施例中，该处理单元具体用于：根据出行数据，获取该N个目标的行为轨迹，其中，该出行数据包括以下数据的任意一种或多种：信令数据、全球定位系统GPS数据、互联网协议IP数据、卡口过车数据、身份登记信息。

可选的，在一些实施例中，该伴随关系用于确定团队新目标。

图7示出了本申请实施例提供的伴随关系发现的装置700的示意性结构图。如图7所示，该装置700包括：一个或多个处理器710，一个或多个存储器720，以及一个或多个通信接口730。其中，处理器710用于控制通信接口730收发信号，存储器720用于存储计算机程序，处理器710用于从存储器720中调用并运行计算机程序，使得通信装置10执行本申请的各方法实施例中由第一网络设备执行的处理和/或操作。

例如，处理器710可以集成了图6中的处理单元620的功能，通信接口730可以具有图6中所示的获取单元610的功能。具体可以参见图6中的详细说明，这里不再赘述。

可选的，上述各装置实施例中的存储器与处理器可以是物理上相互独立的单元，或者，存储器也可以和处理器集成在一起。

本申请实施例中的处理器可以是集成电路芯片，具有处理信号的能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。处理器可以是通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。本申请实施例公开的方法的步骤可以直接体现为硬件编码处理器执行完成，或者用编码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasablePROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambusRAM,DRRAM)。应注意，本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

在本说明书中使用的术语“单元”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件或执行中的软件。例如，部件可以是但不限于，在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示，在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中。部件可位于一个计算机上和/或分布在两个或更多个计算机之间。此外，这些部件可从上面存储有各种数据结构的各种计算机可读介质执行。部件可根据具有一个或多个数据分组(例如，来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据，例如，通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：徐宸;贾佳峰;曹莉;王工艺;李君伟;
专利申请人：华为技术有限公司;

上一篇：显示基板及其制作方法、显示装置
下一篇：一种轨道交通通信装置的多复合环境试验方法