掌桥专利:专业的专利平台
掌桥专利
首页

一种多视图社交网络社区发现方法、系统及设备

文献发布时间:2024-04-18 19:58:21


一种多视图社交网络社区发现方法、系统及设备

技术领域

本发明涉及社交网络数据分析领域,特别是涉及一种多视图社交网络社区发现方法、系统及设备。

背景技术

近年来,随着社交网络的相关技术迅速发展,人们的社交生活也相应的发生了改变,为用户带来了全新的体验,如社交网络的搜索、在线购物、社区服务等。与此同时,随着社交网络的信息化水平的提升,用户数据的规模不断扩大,其质量也不断提高,用户间的关系也呈现多元化例如:共同好友、共同兴趣爱好、多种交互行为等。这种大规模高质量的多视图用户数据为社交网络管理、用户行为分析和商业营销提供了更加立体视角和丰富的数据资源。将社交网络视为一个生态系统,了解用户的兴趣、习惯和行为对于社交网络的发展和用户体验的优化具有重要的意义。

在大数据时代,面对海量的数据资源,如何从中获取知识成为了最为重要的研究课题。多视图图聚类技术是一种基于无监督学习的方法,旨在发掘和揭示具有多个多视图的社交网络数据集本身潜在的结构与规律。多视图图聚类可用于社区发现。在社交网络中,多视图社区发现技术已经被广泛应用于客户关系管理、社区发现、用户行为分析和个性化推荐等领域。社区发现试图将社交网络用户数据集的样本划分为若干个互社区,以实现对用户的特征进行识别和分类,从而为社交网络管理和商业营销提供帮助。

数据挖掘技术的迅速发展为社交网络领域带来了新的机遇与挑战。社交网络上的用户数据是一类典型的多视图网络数据,包括用户的基本属性信息、社交关系、兴趣爱好、行为记录等,是宝贵的社交资源。之前,社交网络数据主要被用来实现推荐、广告等功能。随着多视图社区发现技术的飞速发展,可以根据社交网络上的用户数据和用户间的行为记录,对用户进行聚类,发现特定的用户群落,为后续的社交网络分析和推荐等提供数据支持和帮助。首先对数据进行预处理,将非结构化数据进行结构化处理后作为输入,进而对社交网络数据进行有效的多视图图聚类分析,实现用户群落识别和兴趣爱好群组发现。由于现有技术大多数未能根据多视图质量学习相对应权重,可能会导致质量较差的多视图影响最终的社区发现结果。

因此,在社交网络上,针对多视图网络数据,亟需提供一种具有鲁棒性和实用性的多视图社交网络社区发现方法或系统,能够实现稳定和准确的社交网络用户群落识别。

发明内容

本发明的目的是提供一种多视图社交网络社区发现方法、系统及设备,能够实现稳定和准确的社交网络用户群落识别。

为实现上述目的,本发明提供了如下方案:

一种多视图社交网络社区发现方法,包括:

获取多视图网络数据;所述多视图网络数据包括:基本属性信息、社交关系、共同兴趣爱好关系以及交互行为记录;

利用低通滤波器分别对多视图网络数据进行滤波处理,得到每一视图的平滑表示;

利用注意力机制融合机制对每一视图的平滑表示进行融合,得到融合表示;

利用学习权重对每一视图对应的拉普拉斯矩阵进行融合,得到融合的拉普拉斯矩阵;

根据融合表示和融合的拉普拉斯矩阵,采用训练好的基于注意力机制融合机制的MLP网络,确定嵌入表示;

对嵌入表示进行聚类得到最终的聚类结果,实现社交网络中的社区发现。

可选地,所述获取多视图网络数据,之后还包括:

对多视图网络数据进行预处理;预处理包括:填补缺失值以及剔除异常值;

将预处理后的基本属性信息表示为X矩阵形式;

将社交关系、共同兴趣爱好关系以及交互行为记录表示为邻接矩阵形式A

可选地,所述利用注意力机制融合机制对网络数据的平滑表示进行融合,得到融合表示,具体包括:

根据初始的权重确定初始的融合表示;

对初始的融合表示进行谱聚类,得到聚类结果P;

对平滑表示进行进行谱聚类得到聚类结果Q

根据聚类结果P和聚类结果Q

当当前更新后的权重与上一次更新后的权重的差值小于差值阈值时,利用当前更新后的权重确定融合表示;

当当前更新后的权重与上一次更新后的权重的差值不小于差值阈值时,返回所述根据初始的权重确定初始的融合表示的步骤,直至当前更新后的权重与上一次更新后的权重的差值小于差值阈值。

可选地,所述利用学习权重对每一视图对应的拉普拉斯矩阵进行融合,得到融合的拉普拉斯矩阵,具体包括:

利用公式

其中,

可选地,所述根据融合表示和融合的拉普拉斯矩阵,采用训练好的基于注意力机制融合机制的MLP网络,确定嵌入表示,具体包括:

对融合表示和融合的拉普拉斯矩阵进行融合;

将融合后的数据进行滤波,得到最终表示H

根据最终表示H

可选地,基于注意力机制融合机制的MLP网络的训练过程为:

根据嵌入表示Z构造训练集和损失函数;

通过Adam优化器更新MLP网络的参数以及学习权重。

一种多视图社交网络社区发现系统,包括:

多视图网络数据获取模块,用于获取多视图网络数据;所述多视图网络数据包括:基本属性信息、社交关系、共同兴趣爱好关系以及交互行为记录;

平滑表示确定模块,用于利用低通滤波器分别对多视图网络数据进行滤波处理,得到每一视图的平滑表示;

融合表示确定模块,用于利用注意力机制融合机制对每一视图的平滑表示进行融合,得到融合表示;

拉普拉斯矩阵融合模块,用于利用学习权重对每一视图对应的拉普拉斯矩阵进行融合,得到融合的拉普拉斯矩阵;

嵌入表示确定模块,用于根据融合表示和融合的拉普拉斯矩阵,采用训练好的基于注意力机制融合机制的MLP网络,确定嵌入表示;

社区发现模块,用于对嵌入表示进行聚类得到最终的聚类结果,实现社交网络中的社区发现。

一种多视图社交网络社区发现设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如所述的方法。

可选地,所述存储器为计算机可读存储介质。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明所提供的一种多视图社交网络社区发现方法、系统及设备,结合多视图网络数据与聚类分析算法,实现用户群落识别。在利用低通滤波器过滤高频噪声得到平滑表示,提高社交网络中社区识别的准确性和可靠性。在平滑表示融合阶段利用注意力机制融合各个视图的平滑表示得到拥有全部视图信息的融合表示。在拓扑融合阶段,根据融合表示和融合的拉普拉斯矩阵,采用训练好的基于注意力机制融合机制的MLP网络,确定嵌入表示,最终实现了较为稳定和准确的社交网络用户群落识别,为内容推送、广告推送等提供数据支持。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所提供的一种多视图社交网络社区发现方法流程示意图;

图2为本发明所提供的一种多视图社交网络社区发现方法原理示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种多视图社交网络社区发现方法、系统及设备,能够实现稳定和准确的社交网络用户群落识别。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1和图2所示,本发明所提供的一种多视图社交网络社区发现方法,包括:

S101,获取多视图网络数据;所述多视图网络数据包括但不限于:基本属性信息、社交关系、共同兴趣爱好关系以及交互行为记录;

之后还包括:

对多视图网络数据进行预处理;预处理包括:填补缺失值以及剔除异常值。

将预处理后的基本属性信息表示为X矩阵形式。

将社交关系、共同兴趣爱好关系以及交互行为记录表示为邻接矩阵形式A

S102,利用低通滤波器分别对多视图网络数据进行滤波处理,得到每一视图的平滑表示H

其中,I为单位矩阵,L

S103,利用注意力机制融合机制对每一视图的平滑表示H

S103具体包括:

根据初始的权重确定初始的融合表示。

对初始的融合表示进行谱聚类,得到聚类结果P,即Query。

对平滑表示进行进行谱聚类得到聚类结果Q

根据聚类结果P和聚类结果Q

其中,将Value设为1,score(Q

当当前更新后的权重与上一次更新后的权重的差值小于差值阈值时,即

其中,n为更新的次数。

当当前更新后的权重与上一次更新后的权重的差值不小于差值阈值时,返回所述根据初始的权重确定初始的融合表示的步骤,直至当前更新后的权重与上一次更新后的权重的差值小于差值阈值。

S104,利用学习权重对每一视图对应的拉普拉斯矩阵进行融合,得到融合的拉普拉斯矩阵。

S104具体包括:

利用公式

其中,

S105,根据融合表示和融合的拉普拉斯矩阵,采用训练好的基于注意力机制融合机制的MLP网络,确定嵌入表示。

S105具体包括:

对融合表示和融合的拉普拉斯矩阵进行融合。

将融合后的数据进行滤波,得到最终表示H

根据最终表示H

基于注意力机制融合机制的MLP网络的训练过程为:

根据嵌入表示Z构造训练集和损失函数;根据嵌入表示Z确定相似矩阵

通过Adam优化器更新MLP网络的参数以及学习权重。

S106,对嵌入表示进行聚类得到最终的聚类结果,实现社交网络中的社区发现。

得到的聚类结果,将用户分为几个簇,使得簇内相似性较高而簇间相似性较低,使得同一类用户在兴趣、爱好、所需物品等方面具有极高的相似度。在后续广告,短视频推送提时可结合同类中其他用户所感兴趣的信息,为用户提供精准推送。

对应上述方法,本发明还提供一种多视图社交网络社区发现系统,包括:

多视图网络数据获取模块,用于获取多视图网络数据;所述多视图网络数据包括:基本属性信息、社交关系、共同兴趣爱好关系以及交互行为记录。

平滑表示确定模块,用于利用低通滤波器分别对多视图网络数据进行滤波处理,得到每一视图的平滑表示。

融合表示确定模块,用于利用注意力机制融合机制对每一视图的平滑表示进行融合,得到融合表示。

拉普拉斯矩阵融合模块,用于利用学习权重对每一视图对应的拉普拉斯矩阵进行融合,得到融合的拉普拉斯矩阵。

嵌入表示确定模块,用于根据融合表示和融合的拉普拉斯矩阵,采用训练好的基于注意力机制融合机制的MLP网络,确定嵌入表示。

社区发现模块,用于对嵌入表示进行聚类得到最终的聚类结果,实现社交网络中的社区发现。

为了执行上述实施例对应的方法,以实现相应的功能和技术效果本发明还提供一种多视图社交网络社区发现设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现所述的方法。

所述存储器为计算机可读存储介质。

基于上述描述,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的计算机存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
  • 一种基于社区发现的社交网络影响力最大化方法及系统
  • 一种社交网络重叠社区发现系统及其方法
技术分类

06120116485185