掌桥专利:专业的专利平台
掌桥专利
首页

一种基于形式概念兴趣度的社交网络结构识别方法

文献发布时间:2023-06-19 09:38:30


一种基于形式概念兴趣度的社交网络结构识别方法

技术领域

本公开属于数据挖掘、社交网络分析、互联网技术领域,特别涉及一种基于形式概念兴趣度的社交网络结构识别方法。

背景技术

近年来,互联网技术的快速发展和智能终端的日益普及,推动了在线社交网络(Online Social Networks)的蓬勃发展。随着社交网络用户数量的不断增加,在产生大量的社交媒体数据的同时,社交网络结构变得越来越复杂化。识别网络中的关键结构不仅仅是对于理解结构的功能特性至关重要,同时在实践中也有着各种应用,如社会推荐,舆情监测和隐私保护等。因此,社交网络的结构识别,得到了学术界和工业界广泛的关注。

社交网络是由社会个体及其关系组成的复杂结构。可以将此类网络建模为图形G=(V,E),其中顶点集V包括社交网络中的用户,而边缘集E表示用户之间的关系。极大团(Maximal Clique)是网络中的典型内聚结构。它代表了社交网络中具有相同属性的最大群体,揭示了群体的共性。此外,大多数真实的网络通常都包含有凝聚力的社区(Community),在这些社区中,节点比网络的其余部分具有更高的连接性。桥(Bridge)通常位于两个或多个社区的边界,促进不同社区之间的信息交换。一些桥接节点称为结构洞(StructuralHole)在确保多个社区之间的通信方面有着相似的作用。

从社交网络中识别出内聚结构,以分析复杂拓扑结构,发现隐藏模式,可以更好地理解和预测社交网络;识别社交网络中的桥接结构,以研究信息传播,发现意见领袖,可以更好地应用于真实社交网络的场景。而形式概念分析(Formal Concept Analysis)是一种用于知识发现和可视化的强有力的数学工具。它以形式背景(Formal Context)作为输入提取知识,即概念(Concept)。一个概念由一个集合对(A,B)构成,其中A称为外延(extent),B称为内涵(intent)。目前形式概念技术已经被广泛应用于数据挖掘、社交网路分析等领域。但是,由于真实数据中通常含有大量的噪音数据,需要通过形式概念兴趣度(ConceptInterestingness)来提升知识提取质量和增强概念可读性。

发明内容

为了解决上述问题,本公开提供了一种基于形式概念兴趣度的识别社交网络多种子图结构的方法,包括如下步骤:

S100:将社交网络表示成修正后的邻接矩阵,并以此作为形式概念分析的输入;

S200:根据所述修正后的邻接矩阵生成全部概念并构造概念格;

S300:提取所述概念格中的概念并计算概念兴趣度,包括稳定值和散度;

S400:根据得到的稳定值和散度,确定提取规则并以此识别社交网络中的多种子图结构。

通过上述技术方案,本方法为了在同一框架下完成多种子图结构识别,同时拥有较高的识别准确率,提供了一种基于形式概念兴趣度的社交网络结构识别方法,能够在在完成多种结构识别的基础上,采用概念兴趣度措施中的稳定值(Stability)和散度(Separation)来提高社交网络中关键结构识别的准确率。

本方法的关键点是利用形式概念分析技术解决社交网络结构识别问题。与传统结构识别相比,本方法利用形式概念分析技术完备的概念兴趣度方法和强大的数据可视化特性,将社交网络中的关键结构与某种特殊概念巧妙地建立映射关系,从而实现在一个统一的框架下完成多个子图结构的识别任务,同时利用概念兴趣度提高了识别准确率。该思想具有完备的理论支撑。

附图说明

图1是本公开一个实施例中所提供的一种基于形式概念兴趣度的识别社交网络多种子图结构的方法的流程示意图;

图2是本公开一个实施例中社交网络G及其对应的形式背景K的示意图;

图3是本公开一个实施例中通过计算稳定值和散度来建立概念和关键结构之间映射关系的示意图;

图3(a)是本公开一个实施例中由社交网络的形式背景生成的概念格的示意图;

图4是本公开一个实施例中最终通过概念兴趣度确定的识别规则示意图。

具体实施方式

在一个实施例中,如图1所示,公开了提供了一种基于形式概念兴趣度的识别社交网络多种子图结构的方法,包括如下步骤:

S100:将社交网络表示成修正后的邻接矩阵,并以此作为形式概念分析的输入;

S200:根据所述修正后的邻接矩阵生成全部概念并构造概念格;

S300:提取所述概念格中的概念并计算概念兴趣度,包括稳定值和散度;

S400:根据得到的稳定值和散度,确定提取规则并以此识别社交网络中的多种子图结构。

就该实施例而言,本方法利用形式概念技术来识别社交网络中的子图结构,并通过两种概念兴趣度来提高识别的准确率。首先,本方法通过构造社交网络的形式背景,使得能够利用形式概念分析技术挖掘出某些子图结构;其次,本方法利用概念兴趣度中的稳定性和散度方法,进一步提高结构识别的准确率。总之,本方法是一种基于形式概念兴趣度的社交网络结构识别方法,在社交网络的背景下,能够更准确的识别其多种子图结构。

在另一个实施例中,所述步骤S100进一步包括如下子步骤:

S101:将社交网络表示成图的邻接矩阵;

S102:将所述邻接矩阵的主对角线赋值为1得到修正后的邻接矩阵,并以此作为形式概念技术的输入。

就该实施例而言,以社交网络G中的用户作为对象,其邻居节点及其自己本身作为属性,构造形式背景K(将社交网络G表示成修正的邻接矩阵,即形式背景K)。形式背景K实际上是一个正对角线全为1的邻接矩阵。如图2所示,该社交网络有7个用户,按S101,S102步骤得到形式背景K,该形式背景用‘×’表示1,用空格表示0。

在另一个实施例中,所述步骤S200进一步包括如下子步骤:

S201:遍历所述修正后的邻接矩阵,通过形式概念分析技术中的“上运算”和“下运算”,得到全部概念的“外延”和“内涵”;

S202:按照全部概念外延之间的偏序关系,构造概念格。

就该实施例而言,如图3(a)所示,由形式背景K得到13个概念,并按偏序关系构造格结构,称为概念格L。每个圆圈代表一个概念,概念上部标签代表该概念的内涵,下部标签代表该概念的外延。如概念({2,3,4,5},{4}),{2,3,4,5}为该概念的外延,{4}为该概念的内涵。

在另一个实施例中,所述步骤S300进一步包括:

对概念格中的每一个概念C=(A,B)计算稳定值Stab和散度Sep,这两种兴趣度的计算方式如下:

其中,A为外延,B为内涵,f()为“上运算”,g()为“下运算”。

就该实施例而言,计算概念格L中13个概念的稳定值Stab和散度Sep。

在另一个实施例中,所述步骤S400进一步包括如下子步骤:

S401:根据概念C=(A,B)的稳定值和散度,确定提取极大团,极大孤立团,桥和结构洞的识别规则,其中,A为外延,B为内涵;

S402:根据上述极大团的提取规则,在得到所有极大团后,确定社交网络社区结构的提取规则。

就该实施例而言,如图3所示,通过稳定值和散度,将概念和网络中的关键结构建立映射关系,从而确定如图4所示的提取规则。根据建立的映射关系,完成对社交网络结构的识别。社区结构的识别利用极大团融合策略,并通过稳定值和散度来加快融合。

在另一个实施例中,所述步骤S401中的识别规则具体如下:

若A=B,则C代表一个极大团;若A=B且Sep=1,Stab=1-1/2

在另一个实施例中,所述步骤S402中的识别规则具体如下:

S4021:将所述得到的所有的极大团按照Stab*Sep的大小降序排序,其中Stab为稳定值,Sep为散度;

S4022:若任意两个极大团C1和极大团C2满足判断条件C1∩C2≥min(|C1|,|C2|)-1,则将极大团C1和极大团C2相并融合为极大团C,其中,C=C1∪C2,在删除极大团C1和极大团C2的同时将极大团C并入极大团集合中;

S4023:重复步骤S4022直至不满足所述判断条件,最后所得结果为该社交网络的社区结构。

尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。

相关技术
  • 一种基于形式概念兴趣度的社交网络结构识别方法
  • 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置
技术分类

06120112243619