掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及安全技术领域,尤其涉及一种社交网络图的获取方法、系统和电子设备。

背景技术

如今,社交网络数据正在以成倍的速度增长,在现有的信息科学、信息传播、营销以及情感流等技术中均使用到了社交网络数据。然而,从用户的角度来看,社交网络数据中包含用户的敏感信息,敏感信息可理解为隐私信息,当基于社交网络数据生成社交网络图并发布时,通过攻击者攻击社交网络图。能过挖掘出这些敏感信息即隐私信息,进而造成不良的影响。因此,在社交网络图发布之前,如何对其进行一定的处理,使得用户的隐私得到有效的保护,成为该研究领域的一个重要课题。

目前已经有多种技术用来保护社交网络中的隐私,例如k-匿名技术、扰动算法、链接扰动、差分隐私等,但是存在缺陷,例如,1998年,Samarati和Sweeney提出了k-匿名技术,其主要思想是,对于发布数据表中的每个元组的准标识符属性值,都至少存在其他k-1个元组的准标识符属性值与其相同,k为大于1的正整数,使得攻击者无法通过多表链接分析识别出目标对象。但是,该方法假定了严格的攻击模型,很容易受到一致性攻击和基于背景知识的攻击。

Hey提出了一种扰动算法,通过用k条随机边来替代原社交网络图中的k条边序列。删除的边从图中存在的边空间中随机均匀取样,而插入的边从图中不存在的边空间中随机均匀取样。该方法虽然可以对网络中的链路进行保护,但是很容易破坏社交网络图的结构属性,很难用到实际应用中,并且扰动后社交网络图的隐私性较低。

发明内容

本发明所要解决的技术问题是针对现有技术的不足,提供了一种社交网络图的获取方法、系统和电子设备。

本发明的一种社交网络图的获取方法的技术方案如下:

根据多名预设用户的社交网络数据,构建无向图,其中,所述无向图中的节点表示预设用户,所述无向图中的任意两个节点之间的边表示该两个节点对应的两个预设用户之间存在社交关系;

对所述无向图进行社团划分得到多个子图,并生成每个子图的邻接矩阵;

根据每个子图的邻接矩阵和每个子图对应的第一预设高斯矩阵,计算每个子图的邻接矩阵的投影矩阵;

利用每个子图对应的第二预设高斯矩阵对每个投影矩阵进行扰动,得到每个投影矩阵对应的扰动后的投影矩阵;

将所有扰动后的投影矩阵进行结合,得到社交网络图。

本发明的一种社交网络图的获取方法的有益效果如下:

对多名预设用户对应的无向图进行社团划分得到多个子图,对每个子图添加高斯噪声进行扰动,解决了社交网络图中的隐私暴露问题,对于攻击者来说,即使获得社交网络图的全部信息以及原社交网络的相关背景知识,也无法攻击社交网络图,提升了社交网络图的隐私性和安全性,而且,保持了社交网络图的结构属性,提高了社交网络图的可用性。

在上述方案的基础上,本发明的一种社交网络图的获取方法还可以做如下改进。

进一步,计算任一子图的邻接矩阵的投影矩阵的过程,包括:

随机生成第i个子图对应的第一预设高斯矩阵P

根据第一公式计算第i个子图的邻接矩阵的投影矩阵A

进一步,得到任一投影矩阵对应的扰动后的投影矩阵的过程,包括:

随机生成第j个子图对应的第二预设高斯矩阵Q

根据第二公式计算第j个投影矩阵对应的扰动后的投影矩阵A′

进一步,所述对所述无向图进行社团划分得到多个子图,包括:

从所述无向图中获取所有的N阶完全图;

合并任意两个具有M个相同节点的五阶完全图,得到多个子图,其中,N>M,N和M均为正整数。

本发明的一种社交网络图的获取系统的技术方案如下:

包括构建模块、划分生成模块、投影矩阵计算模块、扰动模块和结合获取模块;

所述构建模块用于根据多名预设用户的社交网络数据,构建无向图,其中,所述无向图中的节点表示预设用户,所述无向图中的任意两个节点之间的边表示该两个节点对应的两个预设用户之间存在社交关系;

所述划分生成模块用于对所述无向图进行社团划分得到多个子图,并生成每个子图的邻接矩阵;

所述投影矩阵计算模块用于根据每个子图的邻接矩阵和每个子图对应的第一预设高斯矩阵,计算每个子图的邻接矩阵的投影矩阵;

所述扰动模块用于利用每个子图对应的第二预设高斯矩阵对每个投影矩阵进行扰动,得到每个投影矩阵对应的扰动后的投影矩阵;

所述结合获取模块用于将所有扰动后的投影矩阵进行结合,得到社交网络图。

本发明的一种社交网络图的获取系统的有益效果如下:

对多名预设用户对应的无向图进行社团划分得到多个子图,对每个子图添加高斯噪声进行扰动,解决了社交网络图中的隐私暴露问题,对于攻击者来说,即使获得社交网络图的全部信息以及原社交网络的相关背景知识,也无法攻击社交网络图,提升了社交网络图的隐私性和安全性,而且,保持了社交网络图的结构属性,提高了社交网络图的可用性。

在上述方案的基础上,本发明的一种社交网络图的获取系统还可以做如下改进。

进一步,所述投影矩阵计算模块具体用于:随机生成第i个子图对应的第一预设高斯矩阵P

根据第一公式计算第i个子图的邻接矩阵的投影矩阵A

进一步,所述扰动模块具体用于:

随机生成第j个子图对应的第二预设高斯矩阵Q

根据第二公式计算第j个投影矩阵对应的扰动后的投影矩阵A′

进一步,所述划分生成模块具体用于:

从所述无向图中获取所有的N阶完全图;

合并任意两个具有M个相同节点的五阶完全图,得到多个子图,其中,N>M,N和M均为正整数。

本发明的一种电子设备的技术方案如下:

包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现如上述任一项所述的一种社交网络图的获取方法的步骤。

附图说明

图1为本发明实施例的一种社交网络图的获取方法的流程示意图;

图2为无向图的示意图;

图3为本发明实施例的一种社交网络图的获取系统的结构示意图;

具体实施方式

如图1所示,本发明实施例的一种社交网络图的获取方法,包括如下步骤:

S1、根据多名预设用户的社交网络数据,构建无向图,其中,所述无向图中的节点表示预设用户,所述无向图中的任意两个节点之间的边表示该两个节点对应的两个预设用户之间存在社交关系;

S2、对所述无向图进行社团划分得到多个子图,并生成每个子图的邻接矩阵;

S3、根据每个子图的邻接矩阵和每个子图对应的第一预设高斯矩阵,计算每个子图的邻接矩阵的投影矩阵;

S4、利用每个子图对应的第二预设高斯矩阵对每个投影矩阵进行扰动,得到每个投影矩阵对应的扰动后的投影矩阵;

S5、将所有扰动后的投影矩阵进行结合,得到社交网络图。

对多名预设用户对应的无向图进行社团划分得到多个子图,对每个子图添加高斯噪声进行扰动,具体体现在S3和S4,解决了社交网络图中的隐私暴露问题,对于攻击者来说,即使获得社交网络图的全部信息以及原社交网络的相关背景知识,也无法攻击社交网络图,提升了社交网络图的隐私性和安全性,而且,保持了社交网络图的结构属性,提高了社交网络图的可用性。

其中,社交网络数据包括微信通讯数据、电话通讯数据、邮箱通讯数据等,微信通讯数据包括任意两名或多名预设用户通过微信进行沟通的记录,电话通讯数据包括任意两名预设用户通过电话进行沟通的记录,邮箱通讯数据包括任意两名或多名预设用户通过邮箱进行沟通的记录,那么:社交网络数据显示两名预设用户之间存在联系,则该两名预设用户之间存在社交关系,以此类推,构建出无向图。

以图2中的基于6名预设用户的社交网络数据所构建的无向图为例进行说明,具体地:

该无向图中包括6个节点,分别为第一节点、第二节点、第三节点、第四节点、第五节点和第六节点,无向图中的节点表示预设用户,那么,第一节点表示第一预设用户,第二节点表示第二预设用户,第三节点表示第三预设用户,第四节点表示第四预设用户,第五节点表示第五预设用户,第六节点表示第六预设用户,第一节点与第二节点之间的边表示第一预设用户与第二预设用户之间存在社交关系,第二节点与第五节点之间的边表示第二预设用户与第五预设用户之间存在社交关系等。

需要说明的一点是,无向图中的边的长短并不代表该边对应的两名预设用户之间的社交关系的紧密程度,而只表示这两名预设用户之间存在社交关系,若两个节点之间不存在边,则表示该两个节点对应的两名预设用户之间不存在社交关系。

其中,用G表示无向图,则无向图G可以表示为:G=(V,E),V表示无向图G中的所有节点,E表示无向图G中的所有边。

在实施例中,可以基于不同数量的预设用户的社交网络数据,构建无向图,例如,基于100名或500名预设用户的社交网络数据,构建100名或500名预设用户对应的无向图。

其中,S5中,包括:

S50、首先根据投影矩阵生成社交子图;

S51、从无向图G中选择一条未选过的边;

S52、判断所选边连接的两个节点是否属于同一个子图,若是,执行S53,否则,将该条边加入空图G

S53、判断无向图G中的边是否选完,若已选完,则执行步骤S54,否则,执行步骤S51。

S54,得到可发布的社交网络图G

较优地,在上述技术方案中,计算任一子图的邻接矩阵的投影矩阵的过程,包括:

S30、随机生成第i个子图对应的第一预设高斯矩阵P

S31、根据第一公式计算第i个子图的邻接矩阵的投影矩阵A

对每个子图的邻接矩阵重复执行S30和S31,得到每个子图的邻接矩阵的投影矩阵。

可以理解的是,每个子图对应的第一预设高斯矩阵可以相同,也可以不相同,根据实际情况确认。

较优地,在上述技术方案中,得到任一投影矩阵对应的扰动后的投影矩阵的过程,包括:

S40、随机生成第j个子图对应的第二预设高斯矩阵Q

S41、根据第二公式计算第j个投影矩阵对应的扰动后的投影矩阵A′

对每个投影矩阵重复执行S40和S41,得到每个投影矩阵对应的扰动后的投影矩阵。

可以理解的是,每个子图对应的子图对应的第二预设高斯矩阵可以相同,也可以不相同,根据实际情况确认。

较优地,在上述技术方案中,所述对所述无向图进行社团划分得到多个子图,包括:

S20、从所述无向图中获取所有的N阶完全图;

S21、合并任意两个具有M个相同节点的五阶完全图,得到多个子图,其中,N>M,N和M均为正整数。

以N=5,M=4为例进行说明,具体地:

S200、从所述无向图中获取所有的五阶完全图,具体地:

例如,包括1000个节点的无向图中获取所有的五阶完全图,其中,由于本申请中的完全图是从无向图中获取,那么,本申请的完全图可理解为一个简单的无向图,且完全图的定义为现有技术,从无向图中获取所有的五阶完全图的具体技术细节为本领域技术人员所悉知,在此不做赘述。

S201、合并任意两个具有4个相同节点的五阶完全图,得到多个子图,由此实现社团划分得到多个子图。

下面对本申请的一种社交网络图的获取方法以编程形式进行表述,具体地:

(1)构建无向图G,G=(V,E):其中,V表示无向图G中的所有节点,E表示无向图G中的所有边。其中节点代表社交网络中的用户,边代表社交网络中两个用户之间存在社交关系;

(2)对无向图G进行社团划分,得到包括所有子图的集合C;

(3)对无向图G中每个子图进行高斯噪声扰动,具体地:

①设置一个空图G

②从子图集合C中选择一个未选择过的子图;

③生成所选子图的邻接矩阵;

④随机生成两个高斯矩阵即第一高斯矩阵和第二高斯矩阵,P∈R

⑤利用高斯矩阵P,由A

⑥用高斯随机矩阵Q扰动A

⑦判断子图集合C中的子图是否选完,若已选完,则执行步骤⑧,否则执行步骤(2);

⑧将噪声扰动后的子图添加到G

⑨从无向图G中选择一条未选过的边;

⑩判断所选边连接的两个节点是否属于同一个子图,若是,则执行步骤

(4)得到扰动后的图G

本申请属于复杂网络安全技术领域,更进一步是一种基于随机矩阵的社交网络图发布方法,可以保障社交网络的隐私不被泄露,采用上述社交网络图发布方法,在社团内部进行噪声扰动,解决了社交网络中的隐私暴露问题。对于攻击者来说,即使获得发布图的全部信息以及原社交网络的相关背景知识,也无法攻击网络。本发明中,在噪声扰动前首先对社交网络进行了社团划分,解决了噪声扰动中对社交网络的社团结构的破坏问题,极大地提高了网络的可用性。

社交网络是一种复杂网络,因此具有诸多特性,其中有一项重要特性即社团结构。对于大规模网络而言,社团结构描述了网络成员的联系模式,即同一社团内部的成员联系非常紧密,而不同社团之间的成员联系很松散,网络中的大量成员可以划分到不同的社团中,因此这种社团结构是社交网络非常重要的结构属性,在保护其隐私的同时,也要尽可能地保持网络的社团结构。本发明在社团划分的基础上,对社团内部添加高斯噪声进行扰动,在保证网络中用户隐私的同时,有效保持社交网络的结构。

在上述各实施例中,虽然对步骤进行了编号S1、S2等,但只是本申请给出的具体实施例,本领域的技术人员可根据实际情况调整S1、S2等的执行顺序,此也在本发明的保护范围内,可以理解,在一些实施例中,可以包含如上述各实施方式中的部分或全部。

如图3所示,本发明实施例的一种社交网络图的获取系统200,包括构建模块210、划分生成模块220、投影矩阵计算模块230、扰动模块240和结合获取模块250;

所述构建模块210用于根据多名预设用户的社交网络数据,构建无向图,其中,所述无向图中的节点表示预设用户,所述无向图中的任意两个节点之间的边表示该两个节点对应的两个预设用户之间存在社交关系;

所述划分生成模块220用于对所述无向图进行社团划分得到多个子图,并生成每个子图的邻接矩阵;

所述投影矩阵计算模块230用于根据每个子图的邻接矩阵和每个子图对应的第一预设高斯矩阵,计算每个子图的邻接矩阵的投影矩阵;

所述扰动模块240用于利用每个子图对应的第二预设高斯矩阵对每个投影矩阵进行扰动,得到每个投影矩阵对应的扰动后的投影矩阵;

所述结合获取模块250用于将所有扰动后的投影矩阵进行结合,得到社交网络图。

对多名预设用户对应的无向图进行社团划分得到多个子图,对每个子图添加高斯噪声进行扰动,解决了社交网络图中的隐私暴露问题,对于攻击者来说,即使获得社交网络图的全部信息以及原社交网络的相关背景知识,也无法攻击社交网络图,提升了社交网络图的隐私性和安全性,而且,保持了社交网络图的结构属性,提高了社交网络图的可用性。

较优地,在上述技术方案中,所述投影矩阵计算模块230具体用于:随机生成第i个子图对应的第一预设高斯矩阵P

根据第一公式计算第i个子图的邻接矩阵的投影矩阵A

较优地,在上述技术方案中,所述扰动模块240具体用于:

随机生成第j个子图对应的第二预设高斯矩阵Q

根据第二公式计算第j个投影矩阵对应的扰动后的投影矩阵A′

较优地,在上述技术方案中,所述划分生成模块220具体用于:

从所述无向图中获取所有的N阶完全图;

合并任意两个具有M个相同节点的五阶完全图,得到多个子图,其中,N>M,N和M均为正整数。

上述关于本发明的一种社交网络图的获取系统200中的各参数和各个单元模块实现相应功能的步骤,可参考上文中关于一种社交网络图的获取方法的实施例中的各参数和步骤,在此不做赘述。

本发明实施例的一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现上述任一实施的一种社交网络图的获取方法的步骤。

其中,电子设备可以选用电脑、手机等,相对应地,其程序为电脑软件或手机APP等,且上述关于本发明的一种电子设备中的各参数和步骤,可参考上文中一种社交网络图的获取方法的实施例中的各参数和步骤,在此不做赘述。

所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。

因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM),只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 一种社交网络图的获取方法、系统和电子设备
  • 一种多标签社交网络图像的标注方法及系统
技术分类

06120113194041