掌桥专利:专业的专利平台
掌桥专利
首页

一种隐性特质人员的挖掘方法、系统、存储介质及设备

文献发布时间:2023-06-19 11:57:35


一种隐性特质人员的挖掘方法、系统、存储介质及设备

技术领域

本发明涉及大数据挖掘分析技术领域,特别涉及一种隐性特质人员的挖掘方法、系统、存储介质及设备。

背景技术

随着现代社会经济和网络的迅速发展,城市的前端感知设备不断完善,多个维度的海量数据汇聚到系统,这些数据拥有巨大的挖掘潜力。

在当前全面化的治安防控体系下,对于具有某些特定性质的人员(以下简称特质人员)的监管显得尤为重要,在监管这类人员的同时,挖掘具有此类特质的隐性人员有助于预防此类人员的蔓延。然而在这类挖掘工作中,如何判断素人是否具有隐性特质是挖掘的重点。

现有技术当中,一般通过基于物联感知系统的轨迹数据的判定隐性人员的算法,过于依赖连续性的感知数据,对离散型的数据无法分析,且比对逻辑较为复杂,算力成本相对偏高。

发明内容

基于此,本发明的目的是提供一种隐性特质人员挖掘的方法、系统、存储介质及设备,用于解决现有技术中判定隐性人员的算法过于依赖连续性的感知数据,对离散型的数据无法分析的技术问题。

本申请一方面提供一种隐性特质人员的挖掘方法,所述方法包括:

获取报警数据,报警数据包括报警信息以及时空数据,所述时空数据包括时间要素和空间要素,分别对所述时间要素和所述空间要素进行扩散,得到对应的时间范围和空间范围;

组装所述时间范围和所述空间范围,得出时空范围,在所述时空范围内对所述报警信息进行时空检索,获取在所述时空范围内的多条感知数据;根据所述感知数据获取目标实体主键,对所述目标实体主键内的实体进行档案查询,得出实体身份信息,通过所述实体身份信息获得实体对应标签的原始积分;

通过所述时空数据的时间偏移量和空间偏移量对所述目标实体主键内的实体进行积分计算,得出所述实体的隐性积分;

累计所述原始积分与所述隐性积分,得到最新积分;

判断所述最新积分是否满足标签积分阈值;

若是,则对所述实体打上标签,得到实体标签数据。

在其他可选实施例中,在得到实体标签数据的步骤之后包括:

根据最后更新时间过滤出长期不活跃的实体标签数据,对所述长期不活跃的实体标签数据进行减分,得到减分后的实体标签数据;

判断所述减分后的实体标签数据的积分值是否低于所述标签积分阈值;

若是,则去除所述减分后的实体标签数据对应实体的标签。

在其他可选实施例中,所述根据所述感知数据获取目标实体主键的步骤包括:

对多条所述感知数据进行分析,抽取实体主键;

过滤重复抓拍的实体,得到所述目标实体主键。

在其他可选实施例中,在获取报警数据的步骤之后还包括:

根据所述报警信息判断所述实体是否属于挖掘范畴;

若否,丢弃所述报警数据。

在其他可选实施例中,在累计所述原始积分与所述隐性积分,得到最新积分的步骤之后还包括:

将所述目标实体主键与标签主键进行组装;

判断所述最新积分是否存在积分维护池;

若否,将所述最新积分存入所述积分维护池。

在其他可选实施例中,在获取报警数据的步骤之前还包括:

移除所述积分维护池内的原有实体标签数据。

在其他可选实施例中,所述通过所述实体身份信息获得实体对应标签的原始积分的步骤之前还包括:

过滤原始积分满足标签积分阈值所对应的实体。

本申请另一方面提供一种隐性特质人员的挖掘系统,包括:

第一获取模块,用于获取报警数据,报警数据包括报警信息以及时空数据,所述时空数据包括时间要素和空间要素,分别对所述时间要素和所述空间要素进行扩散,得到对应的时间范围和空间范围;

第二获取模块,用于组装所述时间范围和所述空间范围,得出时空范围,在所述时空范围内对所述报警信息进行时空检索,获取在所述时空范围内的多条感知数据;根据所述感知数据获取目标实体主键,对所述目标实体主键内的实体进行档案查询,得出实体身份信息,通过所述实体身份信息获得实体对应标签的原始积分;

第三获取模块,用于通过所述时空数据的时间偏移量和空间偏移量对所述目标实体主键内的实体进行积分计算,得出所述实体的隐性积分;

累计模块,用于累计所述原始积分与所述隐性积分,得到最新积分;

第一判断模块,用于判断所述最新积分是否满足标签积分阈值;

第一执行模块,用于当所述最新积分满足标签积分阈值时,对所述实体打上标签,得到实体标签数据。

本申请另一方面还提供一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的方法。

本申请另一方面还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述的方法。

上述隐性特质人员的挖掘方法、系统、存储介质及设备,通过对报警数据的分析结合时空数据,从而达到对隐性实体的积分管理,最终通过打标的方式达成挖掘功能在业务系统中的体现,解决了现有技术中判定隐性人员的算法过于依赖连续性的感知数据,对离散型的数据无法分析的技术问题。

附图说明

图1为本发明的原理总图;

图2为本发明第一实施例中隐性特质人员的挖掘方法架构图;

图3为本发明第二实施例中隐性特质人员的挖掘方法架构图;

图4为本发明第二实施例中获取报警数据的步骤之后还包括的步骤图;

图5为本发明第二实施例中根据感知数据获取目标实体主键的步骤图;

图6为本发明第二实施例中得到最新积分的步骤之后还包括的步骤图;

图7为本发明第三实施例中隐性特质人员的挖掘系统的架构图;

图8为本发明第四实施例中计算机设备的原理架构图。

主要元件符号说明:

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

请参阅图1,本申请的大体结构依赖五个模块。数据接入模块100负责接入感知类数据;流程控制模块200顾名思义,负责积分挖掘的流程控制,作为任务的发起者和管理者;积分计算模块300受流程控制模块调度,基于数据存储模块中的特质人员的报警数据,对感知数据进行挖掘分析和积分计算;数据存储模块400内部包含云数据库和Redis缓存中间件,其主要存储报警数据、感知数据及隐性特质人员的积分和档案数据,档案数据中关联有业务标签信息;积分维护模块500负责定期执行积分维护任务,主要对长期不活跃的标签积分进行一个减分操作。

实施例一

请参阅图2,所示为本发明第一实施例中的隐性特质人员的挖掘方法,所述方法包括步骤S101至步骤S106:

S101、获取报警数据,报警数据包括报警信息以及时空数据,所述时空数据包括时间要素和空间要素,分别对所述时间要素和所述空间要素进行扩散,得到对应的时间范围和空间范围;

S102、组装所述时间范围和所述空间范围,得出时空范围,在所述时空范围内对所述报警信息进行时空检索,获取在所述时空范围内的多条感知数据;根据所述感知数据获取目标实体主键,对所述目标实体主键内的实体进行档案查询,得出实体身份信息,通过所述实体身份信息获得实体对应标签的原始积分;

S103、通过所述时空数据的时间偏移量和空间偏移量对所述目标实体主键内的实体进行积分计算,得出所述实体的隐性积分;

S104、累计所述原始积分与所述隐性积分,得到最新积分;

S105、判断所述最新积分是否满足标签积分阈值;

若是,则执行步骤S106;

若否,则继续轮询最新积分;

S106、对所述实体打上标签,得到实体标签数据。

在本申请中,对实体数据打上对应的标签,不同的特质人员对应不同的标签,从而实现对隐性特质人员的挖掘。

综上,本发明上述实施例当中的隐性特质人员的挖掘方法,通过对报警数据的分析结合时空数据,从而达到对隐性实体的积分管理,最终通过打标的方式达成挖掘功能在业务系统中的体现,解决了现有技术中判定隐性人员的算法过于依赖连续性的感知数据,对离散型的数据无法分析的技术问题。

实施例二

请参阅图3至图6,所示为本发明第二实施例中的隐性特质人员的挖掘方法,如图3所示,所述方法包括步骤S201至步骤S209:

S201、获取报警数据,报警数据包括报警信息以及时空数据,所述时空数据包括时间要素和空间要素,分别对所述时间要素和所述空间要素进行扩散,得到对应的时间范围和空间范围;

在本申请中,流程控制模块根据配置的任务调度周期,进行计算任务的发起。监听到任务调度的指令后,根据任务发起时携带的时间参数从数据存储模块查询报警信息。

请参阅图4,在获取报警数据的步骤之后还包括:

S2011、根据所述报警信息判断所述实体是否属于挖掘范畴;

若否,执行步骤S2012;

S2012、丢弃所述报警数据。

若是,则执行本挖掘方法。

在上述步骤中,从返回的报警信息中,抽取身份、时间、空间三要素的信息,并轮询从数据存储模块中解析各报警人员的标签信息,从而判断该人员报警是否属于挖掘范畴,是则对该条报警数据记录标签信息,如果该身份不属于任意敏感标签则丢弃数据。此时报警1:N敏感标签。

进一步的,经上述过滤完的报警信息后,继续轮询这批数据,并对其时间要素和空间要素根据任务发起时携带的扩散值进行扩散。时间扩散:例如报警时间为2020-05-0814:18:20,那么会对这个时间做±10S(具体数值受流程控制传参而定)的扩散操作,获取一个敏感的时间窗口;空间扩散:通过Redis缓存中间件的Georaiusbymember命令,获取报警点位为中心,20m(具体数值受流程控制传参而定)范围内的卡口点位的一个集合。

S202、组装所述时间范围和所述空间范围,得出时空范围,在所述时空范围内对所述报警信息进行时空检索,获取在所述时空范围内的多条感知数据;根据所述感知数据获取目标实体主键,对所述目标实体主键内的实体进行档案查询,得出实体身份信息,通过所述实体身份信息获得实体对应标签的原始积分;

在上述步骤中,获取到扩散完的时间和空间要素后,将其组装请求数据存储模块进行时空检索,查询出符合扩散时空范围内的所有抓拍以及感知数据。

请参阅图5,所述根据所述感知数据获取目标实体主键的步骤包括:

S2021、对多条所述感知数据进行分析,抽取实体主键;

S2022、过滤重复抓拍的实体,得到所述目标实体主键。

S203、通过所述时空数据的时间偏移量和空间偏移量对所述目标实体主键内的实体进行积分计算,得出所述实体的隐性积分;

S204、累计所述原始积分与所述隐性积分,得到最新积分;

请参阅图6,在累计所述原始积分与所述隐性积分,得到最新积分的步骤之后还包括:

S2041、将所述目标实体主键与标签主键进行组装;

S2042、判断所述最新积分是否存在积分维护池;

若否,则执行步骤S2043;

若是,则更新最新积分。

S2043、将所述最新积分存入所述积分维护池。

具体的,对查询得到的数据进行分析,抽取实体主键,过滤重复抓拍的实体, 然后对过滤得到的实体列表进行档案查询,得到身份信息,再分别通过各条时空数据的时间偏移量和空间偏移量进行积分判定。

查询该身份对应标签的既有积分,与上述计算得出的积分进行累计,得到最新积分,并在数据存储模块进行更新操作,然后将该实体主键和标签主键进行组装,请求积分维护模块的积分维护池信息,判断是否已存在积分维护池,如果不存在,则丢入池中。

轮询进行前述步骤,直到该时间段的扩散时空数据分析完为止。

S205、判断所述最新积分是否满足标签积分阈值;

若是,则执行步骤S206;

若否,则继续轮询最新积分;

S206、对所述实体打上标签,得到实体标签数据。

在本申请中,当对相应的实体打上标签时,此时,即对相关的隐性人员有了对应标签的标示,从而,便于挖掘出相关的隐性人员。

进一步的,在得到实体标签数据的步骤之后包括:

S207、根据最后更新时间过滤出长期不活跃的实体标签数据,对所述长期不活跃的实体标签数据进行减分,得到减分后的实体标签数据;

S208、判断所述减分后的实体标签数据的积分值是否低于所述标签积分阈值;

若是,则执行步骤S209;

若否,则保留所述减分后的实体标签数据对应实体的标签。

S209、去除所述减分后的实体标签数据对应实体的标签。

积分维护模块的工作流由定时任务发起(定时周期可配置),首先拉取积分维护池中实体-标签的组合数据(拉取则从池中移除)。

根据池中数据请求数据存储模块的积分表,并且过滤出已经满足标签积分阀值的实体-标签数据,并再次请求数据存储模块对档案进行打标操作,将该实体打上对应的标签。

做完打标操作以后,继续查询积分表,根据数据携带的最后更新时间可以过滤出长期不活跃的实体-标签数据,根据最后活跃时间对该实体对应的标签积分进行减分并更新至积分表。

比较上述中的减分前后的积分情况,判断是否跨越了标签积分阀值,如果是则请求数据存储模块进行对应标签删除。

在获取报警数据的步骤之前还包括:

移除所述积分维护池内的原有实体标签数据。

在上述步骤中,先移除池内原有的实体标签数据,有利于本申请得到的数据的准确性。

所述通过所述实体身份信息获得实体对应标签的原始积分的步骤之前还包括:

过滤原始积分满足标签积分阈值所对应的实体。

在上述步骤中,过滤原始积分满足标签积分阈值所对应的实体,除去了原始的已满足标签积分阈值所对应的实体,对本方法中实施的实体数据造成影响。

综上,本发明上述实施例当中的隐性特质人员的挖掘方法,通过对报警数据的分析结合时空数据,从而达到对隐性实体的积分管理,最终通过打标的方式达成挖掘功能在业务系统中的体现,解决了现有技术中判定隐性人员的算法过于依赖连续性的感知数据,对离散型的数据无法分析的技术问题。

实施例三

请参阅图7,所示为本发明第三实施例中的隐性特质人员的挖掘系统,包括:

第一获取模块11,用于获取报警数据,报警数据包括报警信息以及时空数据,所述时空数据包括时间要素和空间要素,分别对所述时间要素和所述空间要素进行扩散,得到对应的时间范围和空间范围;

第二获取模块12,用于组装所述时间范围和所述空间范围,得出时空范围,在所述时空范围内对所述报警信息进行时空检索,获取在所述时空范围内的多条感知数据;根据所述感知数据获取目标实体主键,对所述目标实体主键内的实体进行档案查询,得出实体身份信息,通过所述实体身份信息获得实体对应标签的原始积分;

第三获取模块13,用于通过所述时空数据的时间偏移量和空间偏移量对所述目标实体主键内的实体进行积分计算,得出所述实体的隐性积分;

累计模块14,用于累计所述原始积分与所述隐性积分,得到最新积分;

第一判断模块15,用于判断所述最新积分是否满足标签积分阈值;

第一执行模块16,用于当所述最新积分满足标签积分阈值时,对所述实体打上标签,得到实体标签数据。

进一步,在一些可选实施例中,第一获取模块之后包括:

减分模块,用于根据最后更新时间过滤出长期不活跃的实体标签数据,对所述长期不活跃的实体标签数据进行减分,得到减分后的实体标签数据;

第二判断模块,用于判断所述减分后的实体标签数据的积分值是否低于所述标签积分阈值;

第二执行模块,用于当所述减分后的实体标签数据的积分值低于所述标签积分阈值时,去除所述减分后的实体标签数据对应实体的标签。

进一步,在一些可选实施例中,第二获取模块包括:

抽取单元,用于对多条所述感知数据进行分析,抽取实体主键;

过滤单元,用于过滤重复抓拍的实体,得到所述目标实体主键。

进一步,在一些可选实施例中,第一获取模块之后还包括:

第三判断模块,用于根据所述报警信息判断所述实体是否属于挖掘范畴;

第三执行模块,用于当所述报警信息判断所述实体不属于挖掘范畴时,丢弃所述报警数据。

进一步,在一些可选实施例中,累计模块之后还包括:

组装模块,用于将所述目标实体主键与标签主键进行组装;

第四判断模块,用于判断所述最新积分是否存在积分维护池;

第四执行模块,用于当所述最新积分不存在积分维护池时,将所述最新积分存入所述积分维护池。

进一步,在一些可选实施例中,第一获取模块之前还包括:

移除模块,用于移除所述积分维护池内的原有实体标签数据。

进一步,在一些可选实施例中,第二获取模块之前还包括:

过滤模块,用于过滤原始积分满足标签积分阈值所对应的实体。

上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。

综上,本发明上述实施例当中的隐性特质人员的挖掘系统,通过对报警数据的分析结合时空数据,从而达到对隐性实体的积分管理,最终通过打标的方式达成挖掘功能在业务系统中的体现,解决了现有技术中判定隐性人员的算法过于依赖连续性的感知数据,对离散型的数据无法分析的技术问题。

本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现上述的数据处理方法。

实施例四

本发明还提供一种计算机设备,请参阅图8,所示为本发明第四实施例当中的数据处理设备,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,所述处理器执行所述程序时实现如上述的数据处理方法。

其中,处理器10在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。

其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是数据处理设备的内部存储单元,例如该数据处理设备的硬盘。存储器20在另一些实施例中也可以是数据处理设备的外部存储装置,例如数据处理设备上配备的插接式硬盘,智能存储卡 (Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器20还可以既包括数据处理设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储安装于数据处理设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。

需要指出的是,图8示出的结构并不构成对数据处理设备的限定,在其它实施例当中,该数据处理设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

综上,上述计算机设备,通过对报警数据的分析结合时空数据,从而达到对隐性实体的积分管理,最终通过打标的方式达成挖掘功能在业务系统中的体现,解决了现有技术中判定隐性人员的算法过于依赖连续性的感知数据,对离散型的数据无法分析的技术问题。

本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器 (RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

相关技术
  • 一种隐性特质人员的挖掘方法、系统、存储介质及设备
  • 一种基于时空轨迹的隐性关系挖掘方法、系统和终端
技术分类

06120113117215