掌桥专利:专业的专利平台
掌桥专利
首页

关联活跃度计算方法、装置、计算机设备及可读存储介质

文献发布时间:2023-06-19 09:24:30


关联活跃度计算方法、装置、计算机设备及可读存储介质

技术领域

本申请涉及互联网技术领域,特别是涉及关联活跃度计算方法、装置、计算机设备及计算机可读存储介质。

背景技术

互联网是虚拟的网络空间。自然人进入互联网不是以真实身份进入,而是以虚拟的身份进入。犯罪分子也不是以真实的身份实施犯罪,而是以虚拟的身份实施犯罪。因此,要对现实中的个人进行定罪处罚,必须证明网络虚拟身份和真实身份具有同一性。

近年来,我国全面推行网络实名制,一定程度上缓解了身份的认定问题。但是,互联网产业链已经形成。该条产业链上游就是身份、信息犯罪,如非法获取、提供公民个人信息犯罪、伪造、冒用身份信息等犯罪、伪造和冒用银行卡、信用卡等犯罪。以伪造以及冒用的身份进行犯罪是网络犯罪的真实样态,这拆解了虚拟身份的“实名”与实名所对应主体的真实联系,因为身份被冒用了。因此,认定实施网络犯罪的网络虚拟身份所对应的真实世界的真实身份成为实践中的难点和痛点。

实体ID关联关系问题是一个数据底层ID打通问题,为公安业务场景中的真实身份和虚拟身份打通提供技术支撑。现有技术一般使用关联次数来反映关联可信度,比如次数越多表示关联可信。上述基于关联次数来判断可信度直接且易于计算,但是实际情况是,关联关系的可信度和时间范围内活跃情况相关性很大,比如:一个人当前用的一个手机号一个月来时间活跃频繁,但是比较总共的关联次数不如之前的账号,那么这种情况下近一段时间内活跃频繁关联关系应该更可信。因此,单纯考虑关联次数判断关联可信度与实际情况并不能很准确的判断关联可信度。

发明内容

本申请实施例提供了一种关联活跃度计算方法、装置、计算机设备及计算机可读存储介质,本申请针对关联可信度的评估提出了一种关联活跃度计算模型,该模型考虑关联关系的可信度及其关联活跃衰减情况的关系,提高关联可信度评估的准确性。

第一方面,本申请实施例提供了一种关联活跃度计算方法,该方法包括:

数据获取步骤,用于获取一明细数据,所述明细数据表示目标时间范围内多个要素关联对明细信息;

关联活跃度模型构建步骤,用于分析所述明细数据在每一时间段的每一所述要素关联对的关联活跃频率及其关联活跃衰减情况,并构建一关联活跃度计算模型;

关联活跃度评分步骤,用于利用所述关联活跃度计算模型对所述明细数据进行计算,得到每一所述要素关联对的关联活跃度评分。

通过上述步骤,构建所述关联活跃度计算模型以实现关联关系可信度的评估,该计算模型同时考虑关联关系活跃频率及时间范围内的关联活跃衰减情况,提高关联关系活跃度判断的准确性,提供了一种更好的可信度评估方式。

在其中一些实施例中,所述关联活跃度模型构建步骤进一步包括:

关联活跃频率获取步骤,用于根据所述明细数据中每一所述要素关联对的关联次数计算得到每一时间段内的所述关联活跃频率;

时间衰减系数获取步骤,用于根据所述明细数据中不同时间段所述要素关联对的关联活跃衰减情况计算得到一时间衰减系数;

关联活跃度模型获取步骤,用于根据所述关联活跃频率与时间衰减系数构建所述关联活跃度计算模型。

在其中一些实施例中,所述关联活跃度模型构建步骤中,所述关联活跃度计算模型表示为:

其中,所述φ

在其中一些实施例中,所述时间衰减系数通过以时间段为周期计算关联活跃频率得到,所述时间衰减系数进一步表示为:

其中,θ为常数,Δt表示该时间段距离当前时间的周期长度,γ表示衰减强度,所述γ根据所述明细数据确定,μ

在其中一些实施例中,所述关联活跃频率用于统计每一时间段内要素关联对的活跃频率,所述关联活跃频率进一步表示为:

其中,所述TotalCounter用于表示所述时间段内要素关联对的关联次数,所述T用于表示所述时间段内时间长度。

在其中一些实施例中,1≤θ≤100,-10≤μ

在其中一些实施例中,所述关联活跃度评分通过对象包装后输出,所述输出数据格式为List集合和/或Json数据结构。

第二方面,本申请实施例提供了一种关联活跃度计算装置,包括:

数据获取模块,用于获取一明细数据,所述明细数据表示目标时间范围内多个要素关联对明细信息;

关联活跃度模型构建模块,用于分析所述明细数据在每一时间段的每一所述要素关联对的关联活跃频率及其关联活跃衰减情况,并构建一关联活跃度计算模型;

关联活跃度评分模块,用于利用所述关联活跃度计算模型对所述明细数据进行计算,得到每一所述要素关联对的关联活跃度评分。

通过上述结构,该装置构建所述关联活跃度计算模型,以实现关联关系可信度的评估,该计算模型同时考虑关联关系活跃频率及时间范围内的关联活跃衰减情况,提高关联关系活跃度判断的准确性,提供了一种更好的可信度评估方式。

在其中一些实施例中,所述关联活跃度模型构建模块进一步包括:

关联活跃频率获取模块,用于根据所述明细数据中每一所述要素关联对的关联次数计算得到每一时间段内的所述关联活跃频率;

时间衰减系数获取模块,用于根据所述明细数据中不同所述时间段所述要素关联对的关联活跃衰减情况计算得到一时间衰减系数;

关联活跃度模型获取模块,用于根据所述关联活跃频率与时间衰减系数构建所述关联活跃度计算模型。

在其中一些实施例中,所述关联活跃度模型构建模块中,所述关联活跃度计算模型表示为:

其中,所述φ

在其中一些实施例中,所述时间衰减系数通过以时间段为周期计算关联活跃频率得到,所述时间衰减系数进一步表示为:

其中,θ为常数,Δt表示该时间段距离当前时间的周期长度,γ表示衰减强度,所述γ根据所述明细数据确定,μ

在其中一些实施例中,所述关联活跃频率用于统计每一时间段内要素关联对的活跃频率,所述关联活跃频率进一步表示为:

其中,所述TotalCounter用于表示所述时间段内要素关联对的关联次数,所述T用于表示所述时间段内时间长度。

在其中一些实施例中,1≤θ≤100,-10≤μ

在其中一些实施例中,所述关联活跃度评分通过对象包装后输出,所述输出数据格式为List集合和/或Json数据结构。

第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的关联活跃度计算方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的关联活跃度计算方法。

相比于相关技术,本申请实施例提供的关联活跃度计算方法、装置、计算机设备及计算机可读存储介质,考虑到基于关联关系的可信度是和时间范围内活跃情况有相关关系,本申请实施例通过构建基于关联时间衰减的关联活跃度计算模型来刻画关联关系的可信度,所述可信度反映了关联关系的活跃度及其随着时间的变化趋势,大大提高了评估可信度的准确性,为用户提供了更好的评估结果。

本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的关联活跃度计算方法的流程示意图;

图2为根据本申请优选实施例的关联活跃度计算方法的衰减系数示意图;

图3是根据本申请实施例的关联活跃度计算装置的结构示意框图。

附图说明:

1、数据获取模块;2、关联活跃度模型构建模块;3、关联活跃度评分模块;

21、关联活跃频率获取模块;22、时间衰减系数获取模块;

23、关联活跃度模型获取模块。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。

除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。

本实施例提供了一种关联活跃度计算方法。图1是根据本申请实施例的关联活跃度计算方法的流程示意图,参考图1所示,该流程包括如下步骤:

数据获取步骤S1,用于获取一明细数据,明细数据表示目标时间范围内多个要素关联对明细信息;

关联活跃度模型构建步骤S2,用于分析明细数据在每一时间段的的每一所述要素关联对的关联活跃频率及其关联活跃衰减情况,并构建一关联活跃度计算模型;

关联活跃度评分步骤S3,用于利用所述关联活跃度计算模型对明细数据进行计算,得到每一所述要素关联对的关联活跃度评分,关联活跃度评分用于评估关联关系的可信度,关联活跃度评分通过对象包装后输出,输出数据格式为List集合和/或Json数据结构。

其中,关联活跃度模型构建步骤S2进一步包括:

关联活跃频率获取步骤S201,用于根据明细数据中每一所述要素关联对的关联次数计算得到每一时间段内的关联活跃频率;

时间衰减系数获取步骤S202,用于根据明细数据中不同时间段要素关联对的关联活跃衰减情况计算得到一时间衰减系数;

关联活跃度模型获取步骤S203,用于根据关联活跃频率与时间衰减系数构建关联活跃度计算模型。

通过上述步骤,构建关联活跃度计算模型以实现关联关系可信度的评估,该计算模型同时考虑关联关系活跃频率及时间范围内的关联活跃衰减情况,提高关联关系活跃度判断的准确性,提供了一种更好的可信度评估方式。

在其中一些实施例中,关联活跃度模型构建步骤S2中,关联活跃度计算模型如下公式(1)表示:

其中,φ

在其中一些实施例中,时间衰减系数通过以时间段为周期计算关联活跃频率得到,时间衰减系数如下公式(2)表示:

其中,θ为常数,Δt表示该时间段距离当前时间的周期长度,γ表示衰减强度,γ根据明细数据确定,μ

在其中一些实施例中,关联活跃频率用于统计每一时间段内要素关联对的活跃频率,关联活跃频率进一步表示为:

其中,TotalCounter用于表示时间段内要素关联对的关联次数,T用于表示时间段内时间长度。

下面通过优选实施例对本申请实施例进行描述和说明。

首先,通过步骤S1获取关联明细数据,本实施例的关联明细数据为6个月时间范围内的,以周为时间段长度计算,要素关联明细信息举例如下表所示:

表中,A要素与B要素为要素关联对,发生次数为统计时间中关联对出现的次数。

基于如上表的关联明细数据,通过步骤S2构建关联活跃度计算模型,

具体的,先通过步骤S201,根据明细数据每一要素关联对的关联次数计算得到关联活跃频率,举例而非限制,计算本实施例一周时间段内关联对A1、B1的关联次数,将统计得到的关联次数与时间段长度代入公式(3)得到关联活跃频率,T为7天,若实际数据统计的天数不足7天,以实际天数计算即可;

然后通过步骤S202计算时间衰减系数,同样以周为时间段统计基于每周最近采集时间作为时间点,计算与当前时间的次数差值情况,举例如下表所示:

表中,要素关联对A1、B1在本周统计得到的关联次数为10次,距离当前时间第一周的关联次数为20次,距离当前时间第二周的关联次数为15次……,依次通过计算得到半年内的关联次数,并带入公式(2)中计算第Δt周的衰减系数,图2为根据本申请优选实施例的关联活跃度计算方法的衰减系数示意图,图中横轴表示第Δt周,纵轴表示衰减系数,参考图2所示,当前周的衰减系数为1,第10周至第15周之间衰减系数快速减小,相应的,关联次数快速衰减。因此,根据图2所示可知,公式(2)可以准确表示关联关系随时间的变化情况;

最后,将上述步骤S201、步骤S202得到的关联活跃频率及其衰减系数代入公式(1)中,计算得到要素关联对的关联活跃度得分,具体数据输出举例如下表所示:

可将上述内容以一个对象包装单条内容,最终给的一个List集合或Json数据,以根据该活跃度得分完成关联可信度的评估。

需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。例如,图1中步骤S201与步骤S202可互换或同时进行。

本实施例还提供了一种关联活跃度计算装置,该装置用于实现上述实施例及优选实施方式。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本申请实施例的关联活跃度计算装置的结构框图,参考图3所示,该装置包括:

数据获取模块1,用于获取一明细数据,明细数据表示目标时间范围内多个要素关联对明细信息;

关联活跃度模型构建模块2,用于分析明细数据在每一时间段的每一要素关联对的关联活跃频率及其关联活跃衰减情况,并构建一关联活跃度计算模型;

关联活跃度评分模块3,用于利用关联活跃度计算模型对明细数据进行计算,得到每一要素关联对的关联活跃度评分;

其中,关联活跃度模型构建模块2进一步包括:

关联活跃频率获取模块21,用于根据明细数据中每一要素关联对的关联次数计算得到每一时间段内的关联活跃频率;

时间衰减系数获取模块22,用于根据明细数据中不同时间段要素关联对关联活跃衰减情况计算得到一时间衰减系数;

关联活跃度模型获取模块23,用于根据关联活跃频率与时间衰减系数构建关联活跃度计算模型。

具体的,上述关联活跃度计算模型表达式如上述公式(1),进一步的,时间衰减系数及关联活跃频率如上述公式(2)(3),在此不再赘述。

通过上述结构,该装置构建关联活跃度计算模型,以实现关联关系可信度的评估,该计算模型同时考虑关联关系活跃频率及时间范围内的关联活跃衰减情况,提高关联关系活跃度判断的准确性,提供了一种更好的可信度评估方式。

需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

另外,结合图1描述的本申请实施例关联活跃度计算方法可以由一种计算机设备来实现,该计算机设备包括处理器以及存储有计算机程序指令的存储器。其中,存储器可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器所执行的可能的计算机程序指令。处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种关联活跃度计算方法。

另外,结合上述实施例中的关联活跃度计算方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种关联活跃度计算方法。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 关联活跃度计算方法、装置、计算机设备及可读存储介质
  • 光照计算方法、装置、计算机设备及计算机可读存储介质
技术分类

06120112156875