掌桥专利:专业的专利平台
掌桥专利
首页

基于k桁架和平衡理论在符号网络中探测内聚子图的方法

文献发布时间:2023-06-19 09:38:30


基于k桁架和平衡理论在符号网络中探测内聚子图的方法

技术领域

本发明属于多媒体数据探测技术领域,尤其涉及一种基于k桁架和平衡理论在符号网络中探测内聚子图的方法。

背景技术

随着因特网和万维网技术的迅速发展,近年来,诸如脸书和推特之类的社交网络变得越来越流行。研究者对社交网络的研究兴趣不断增长,并且已经对探测内聚子图做出了很多努力。目前研究中已经提出了许多内聚子图模型,如k核、k式桁架和k团等。现有的大多数有关内聚子图探测的研究都集中在无符号图上,即将用户之间的所有联系都视为正向关系。但是,社交互动既涉及积极关系(例如朋友),也涉及消极关系(例如敌人)。忽略边缘的消极信息可能无法正确表征符号图中的子图。人际关系网络可用符号图来表示,其中积极关系用正号表示,消极关系用负号表示。在有关符号网络的分析中,平衡理论已经被广泛采用。在平衡理论中,许多发现都是基于平衡三角形的概念,它在符号网络分析中起着重要的作用。在符号网络中,如果三角形有奇数条正边,则三角形是平衡的。此外,在真实的社交网络中,建议的稳定的社区应当含有较少的不平衡三角形且联系紧密。然而,目前并没有能够很好的同时满足密度约束和平衡约束的模型。

发明内容

为了描述在有符号图上的内聚稳定子图,本发明在符号网络上提出了一种新的内聚子图模型,称为极大有符号k桁架,它满足三个条件:1)其中的任意一条边都被包含在至少(k-2)个三角形中;2)不包含任何不平衡三角形;3)是极大的,即任何它的超图都不是有符号k桁架。

极大有符号k桁架是一个平衡图,它其中包含的所有三角形都是平衡三角形,并且它是能找到的满足不包含不平衡三角形的规模极大的图。该模型有许多非常重要的应用,例如,在有符号的社交网络中,两人是否相互信任可以通过边上的正负来表示,含较少不信任关系的社区是更加稳定的。显然,一个紧密且稳定的社区是更加可信的。因此,本发明可以通过极大有符号k桁架模型鉴定社区是否值得信任。

本发明通过利用平衡三角形的属性来开发新的修剪方法,从而显著地过滤没有希望的候选者和边缘关系。此外,本发明开发了高效的极大有符号k桁架计算算法,简称为SKT算法,从而能在大型符号网络中更有效地找到平衡紧密的稳定团体。因此,基于k桁架模型和平衡理论在符号网络中探测内聚子图的方法的应用对信任社区鉴定起到至关重要的作用。

本发明解决其技术问题的技术方案具体如下:一种基于k桁架和平衡理论在符号网络中探测内聚子图的方法,该方法包括:

通过三种修剪策略过滤符号图G中不必要的点和边,包括:

引理1:对有符号k桁架中的任何边e∈G,包含该边e的平衡三角形的数量不少于(k-2);

引理2:对有符号k桁架中的不平衡三角形的边集合,删掉这个集合的某个子集能使k桁架中不存在不平衡三角形并且k桁架极大;

引理3:给定一组边的集合,将其定义为k支撑组g,g中每条边的平衡支撑数均等于(k-2),且g中的各边是等价的,即删除g中的任意一条边均会导致整个组g被移除;

通过极大有符号k桁架贪心启发算法在符号网络中迅速找到极大有符号k桁架,包括:

步骤一,根据引理1对符号图G进行过滤处理,得到正k桁架,即其中任意边的平衡支撑数不少于(k-2);

步骤二,在步骤一过滤后的图G中利用引理2对图G进行过滤得到可能会被删除的边的候选集合C;

步骤三,在步骤二得到的候选集合C上,基于引理3使用迭代算法得到k支撑组的集合§,并由原候选集合C中不属于任何支撑组的边,以及每个支撑组中的任意一条边组合成新的候选集合C’;

步骤四,针对步骤三得到的候选集合C’,计算C’中每一条边e被删除后会带走的G中的边集合F(e),基于贪心启发策略,每次选取带走的边数最少的边e*,即|F(e*)|最小,并删除e*和F(e*)得到更新之后的图G,直到符号图G中不存在不平衡三角形;

步骤五,输出极大有符号k桁架,即我们的目标探测子图。

进一步地,所述步骤一包括:根据引理1产生正k桁架以修剪一些没有希望的边,即迭代去除平衡支撑数少于(k-2)的边,直到所有边的平衡支撑数均不少于(k-2)

进一步地,所述步骤二包括:如果存在边e∈G,并且e属于非平衡三角形,将e加入候选集合C中。

进一步地,步骤三中迭代算法的具体实现过程包括以下子步骤:

(a)将id置为0,其中id为当前正在构建的k支撑组的序号;

(b)如果候选集合中存在为未被访问过的边执行(c)-(g),否则执行(h);

(c)从候选集合C中选取一条平衡支撑数等于(k-2)的且未被访问过的边e压入队列Q,并将其标记为已访问;

(d)从队列Q中弹出一条边记为e’,将它放入当前k支撑组g

(e)对于和边e’处于同一平衡三角形,并且平衡支撑数等于(k-2)且未被访问过的边记为e”,将e”压入到队列Q并将其标记为已访问;

(f)如果队列Q为空执行步骤(d)-(e),否则执行(g);

(g)将当前构造的k支撑组g

(h)返回k支撑组集合§;

本申请还提出了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方法。

本申请还提出了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述方法。

本发明的有益效果为:为了找到同时满足密度和平衡约束的团体(一种内聚子图),本发明提出了新颖的极大有符号k桁架模型。本发明通过该模型得到的社区具有很强的稳健性,并且可以对信任社区进行鉴定。考虑到平衡三角形和k桁架的属性,本发明提出新的修剪策略,从而更有效地缩减搜索空间。与此同时,本发明结合新的修剪策略开发了高效的SKT算法,从而能在大型符号网络中迅速找到极大有符号k桁架。因此,基于k桁架模型和平衡理论在符号网络中探测内聚子图的方法的应用对信任社区鉴定有着极大的效益。

附图说明

图1是本发明极大有符号k桁架探测方法流程图;

图2是原始有符号图示意图;

图3是对原始有符号图进行过滤操作的示意图;

图4-图8是在过滤后的图中生成1个极大有符号k桁架的示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

本申请提出的一种基于k桁架和平衡理论在符号网络中探测内聚子图的方法,该方法包括三种新颖的修剪策略和高效的极大有符号k桁架探测算法(简称SKT算法)。下面详细说每部分的实现过程。

所述的三种新颖的修剪策略是指过滤符号图G中不必要的点和边,从而显著缩减搜索空间,具体包括以下内容:

引理1:对有符号k桁架中的任何边e∈G,包含该边e的平衡三角形的数量不少于(k-2)。

证明:由有符号k桁架的定义易得该引理成立。

引理2:对有符号k桁架中的不平衡三角形的边集合,删掉这个集合的某个子集能使k桁架中不存在不平衡三角形并且k桁架极大。

证明:给定边的集合B

引理3:给定一组边的集合,将其定义为k支撑组g,g中每条边的平衡支撑数均等于(k-2),且g中的各边是等价的,即删除g中的任意一条边均会导致整个组g被移除。

证明:任何一条边的删除都会导致对应的三角形瓦解并且减少相关边的正支撑,k支撑组是一个边的集合,集合中的每条边平衡支撑数都等于(k-2);并且集合中的任意两条边都属于同一个平衡三角形或是可通过集合内的边所在的平衡三角形连接成一条路径,两条边位于路径两端;集合的任意一个超集合都不是k支撑组。显然当我们删除集合中任意一条边时,集合中所有剩余的边的平衡支撑数都会减少变成少于(k-2),基于有符号k桁架的概念,集合中所有边都会被移除,所以我们只需移除k支撑组中的一条边即可。因此,该引理得证。

所述的高效的极大有符号k桁架计算算法,基于以上三种新颖的修剪策略,具体包括以下步骤:

步骤一,对符号图G进行过滤处理:根据引理1对符号图G进行过滤处理,得到正k桁架,即其中任意边的平衡支撑数不少于(k-2);

步骤二,得到候选集合C:在步骤一过滤后的图G中利用引理2对图G进行过滤得到可能会被删除的边的候选集合C;

步骤三,对候选集合C进行过滤处理:在步骤二得到的候选集合C上,基于引理3使用迭代算法得到k支撑组的集合§,并由原候选集合C中不属于任何支撑组的边,以及每个支撑组中的任意一条边组合成新的候选集合C’;迭代算法的具体实现步骤如下:

(a)将id置为0,其中id为当前正在构建的k支撑组的序号;

(b)如果候选集合中存在为未被访问过的边执行(c)-(g),否则执行(h);

(c)从候选集合C中选取一条平衡支撑数等于(k-2)的且未被访问过的边e压入队列Q,并将其标记为已访问;

(d)从Q中弹出一条边记为e’,将它放入当前k支撑组g

(e)对于和边e’处于同一平衡三角形,并且平衡支撑数等于(k-2)且未被访问过的边记为e”,将e”压入到队列Q并将其标记为已访问。

(f)如果队列Q为空执行步骤(d)-(e),否则执行(g);

(g)将当前构造的k支撑组g

(h)返回k支撑组的集合§;

步骤四,针对步骤三得到的候选集合C’,计算C’中每一条边e被删除后会带走的G中的边集合F(e),基于贪心启发策略,每次选取带走的边数最少的边e*,即|F(e*)|最小,并删除e*和F(e*)得到更新之后的图G,直到符号图G中不存在不平衡三角形;

步骤五,输出极大有符号k桁架,即本发明寻找的内聚子图。

以下以图2所示原始有符号图为示例描述本发明实现效果:图3为步骤一过滤后的子图(引理1)。图4为步骤二过滤后的子图(引理2),将所有不平衡三角形的边放入候选集合C(线-点-线表示)。图5在过滤后的子图上和候选集合C的基础上,寻找k支撑组,得到k支撑组g

此外,本发明在三个真实世界的有符号网络上进行了广泛的实验,以评估所提出的方法的有效性和高效性。为了评估所提出方法的性能,我们通过改变参数k进行实验。本发明用算法消耗时间和极大有符号k桁架的规模分别来衡量所提出方法的有效性和效率。所有程序均在标准的c++中实现,所有实验均在配备Intel Xeon 3.2GHz CPU和32GB主内存的PC上进行。实验表明,本发明提出的结合高效修剪规则的SKT算法比基础的贪婪算法快了23倍。

以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

相关技术
  • 基于k桁架和平衡理论在符号网络中探测内聚子图的方法
  • 一种基于团簇属性和平衡理论在符号网络中挖掘内聚子图的方法
技术分类

06120112246578