掌桥专利:专业的专利平台
掌桥专利
首页

一种基于拉普拉斯秩约束的多元图聚类方法

文献发布时间:2023-06-19 19:30:30



技术领域

本发明属于信息技术领域,涉及一种基于拉普拉斯秩约束的多元图聚类方法。

背景技术

图聚类是探索大规模网络的一种常用方法,通常根据节点相关性将图划分为几个紧密连接的组件。它对于复杂网络的信息挖掘和特征探索具有重要意义,已广泛应用于社区发现、推荐系统、生物科学和三维姿态估计等许多应用领域。随着传感器的快速发展,同一组物体之间可以存在不同的关系,它们可以形成复杂的多个网络。例如,个体可以在社交网络中以不同的权重相互关联,比如商品交易和在线交流。城市位置可以通过不同的交通工具,如公共汽车、自行车、出租车等。因此,在同一组对象之间使用多种类型的关系进行图聚类,使用户能够更深入地了解对象之间的关系具有重要意义。例如,通过综合考虑多个平台上消费者之间的各种互动,然后针对共享共同消费偏好的消费者集,可以提高目标广告的效果。然而,传统的图聚类方法很难适合于多元图结构的聚合,因为它们只考虑单图特征或简单加权的多图特征,忽略了不同图内节点的不同局部相关性。一般来说,节点在多元图之间的连接总是不同的。因此,设计一种跨多元图综合考虑节点间不同局部相关性的图聚类方法是非常有需求的。

贝林格里奥等人的(M.Berlingerio,M.Coscia,and F.Giannotti,“Finding andcharacterizing communities in multidimensional networks”in 2011InternationalConference on Advances in Social Networks Analysis and Mining,2011,pp.490–494)计算了连接任意两个节点的维数,并对单维边进行了加权。Taylor等人(D.Taylor,S.Shai,N.Stanley,and P.J.Mucha“Enhanced detectability of community structurein multilayer networks through layer aggregation”,Physical review letters,vol.116,no.22,p.228301,June 2016)对邻接矩阵的项应用一个阈值,生成用于层聚合的非加权邻接矩阵。由于数据集并不总是均匀分布的,因此在许多应用场景中,多个特征对统一图的贡献相同是不合适的。

近年来,许多光谱聚类技术被研究同时学习个体特征的最优权值以获得期望的聚类结果,如灵活嵌入(Z.Li,F.Nie,X.Chang,L.Nie,H.Zhang,and Y.Yang,“Rankconstrained spectral clustering with flflexible embedding,”IEEE Transactionson Neural Networks and Learning Systems,vol.29,no.12,pp.6073–6082,2018)的秩约束SC,SC(Z.Li,F.Nie,X.Chang,Y.Yang,C.Zhang,and N.Sebe,“Dynamic affifinitygraph construction for spectral clustering using multiple features”IEEETransactions on Neural Networks and Learning Systems,vol.29,no.12,pp.6323–6332,2018.)的动态亲和图构建,以及自适应图学习模型(R.Zhou,X.Chang,L.Shi,Y.-D.Shen,Y.Yang,and F.Nie,“Person reidentifification via multi-feature fusionwith adaptive graph learning”IEEE Transactions on Neural Networks andLearning Systems,vol.31,no.5,pp.1592–1601,2020.)的多特征融合。这些方法的优点是能够从某些实体中捕获不同层的互补性,但是并没有同时考虑到不同图层间节点的关联特征和每个层的互补性。

发明内容

本发明的目的是针对现有技术的不足,提供一种基于拉普拉斯秩约束的多元图聚类方法。

为实现上述目的,本发明所采取的技术方案是:

步骤(1)利用图表征学习方法node2vec量化和表征多元图数据集中的每个图中节点的结构特征,并通过计算对应向量的欧式距离构建每个图的节点相似矩阵;利用k-最近邻方法,稀疏地表示每个图的节点相似矩阵,得到相似性特征增强的图相似矩阵。

进一步,具体方法如下:

对多元图数据集利用图表征学习方法node2vec将每个图中节点映射到向量空间,得到对应的嵌入向量,映射时向量基于节点间的关系和相邻节点;然后计算所有节点对应的嵌入向量间的欧氏距离,作为节点相似矩阵对应行列的元素,由此构建每个图的节点相似矩阵NRM;两个节点之间的欧氏距离小则对应的相关值大,欧氏距离大对应的相关值小,通过节点相似矩阵NRM表征和量化不同图内节点的相关性;为了增强节点的相关性和避免噪声,利用k-最近邻方法稀疏地表示每层图的节点相似矩阵,得到相似性特征增强的图相似矩阵。

步骤(2)设定每个图相似矩阵的初始化权重

步骤(3)依次迭代更新每个图相似矩阵的权重和融合特征矩阵,直到满足拉普拉斯秩约束或达到最大迭代次数,得到最终的多元图聚类结果。

进一步,具体方法如下:

设定优化问题

当w

当w

与现有技术相比,本发明的有益效果是:本发明构造了一个融合特征矩阵,并利用拉普拉斯秩约束迭代更新从融合特征图中生成最终多元图的聚类特征,不仅能表达多元关系,还能很好地保持多元图间节点的关联。本发明可以搭建可视化和交互界面,使用户能够直观地优化和评估多元图的聚类特征,并交互式地探索多元图聚类。

具体实施方式

一种基于拉普拉斯秩约束的多元图聚类方法,具体步骤如下:

步骤(1)利用图表征学习方法node2vec量化和表征多元图数据集中的每个图中节点的结构特征,并通过计算对应向量的欧式距离构建每个图的节点相似矩阵;利用k-最近邻方法,稀疏地表示每个图的节点相似矩阵,得到相似性特征增强的图相似矩阵。

进一步,具体方法如下:

对多元图数据集利用图表征学习方法node2vec将每个图中节点映射到向量空间,得到对应的嵌入向量,映射时向量基于节点间的关系和相邻节点;然后计算所有节点对应的嵌入向量间的欧氏距离,作为节点相似矩阵对应行列的元素,由此构建每个图的节点相似矩阵NRM;两个节点之间的欧氏距离小则对应的相关值大,欧氏距离大对应的相关值小,通过节点相似矩阵NRM表征和量化不同图内节点的相关性;为了增强节点的相关性和避免噪声,利用k-最近邻方法稀疏地表示每层图的节点相似矩阵,得到相似性特征增强的图相似矩阵。

步骤(2)设定每个图相似矩阵的初始化权重

步骤(3)依次迭代更新每个图相似矩阵的权重和融合特征矩阵,直到满足拉普拉斯秩约束或达到最大迭代次数,得到最终的多元图聚类结果。

在图论中,融合图矩阵的拉普拉斯矩阵

其中,n是图中的节点总数,c是指定的集群数。然而,因为/>

根据KyFan定理,可以将以上方程转换为一个优化问题,以最小化切边的权重,这更容易求解:

假设得到其他变量的情况下,通过增强拉格朗日乘子(ALM)方案对一个变量进行优化。然而由于目标函数中的所有变量都是耦合在一起的,因此很难求解上述方程。因此,我们引入了另一种迭代算法来解决这个问题。在实践中,首先初始化所有的变量,然后依次迭代更新以下三个子问题,直到满足秩约束或达到最大迭代次数。

最后,利用c个连通分量得到了学习到的统一图矩阵

每个图w

同样,当w

当w

使用三个数据集(CELE,MOSS,BIB)来评估聚类模型在多元关系集成和关联特征保存中的有效性,评估结果表明具有期望的有效性。

在得到图相似矩阵后,利用节点链图展示多元图的自然结构特征,并用散点图来可视化向量的投影,使得每个图的节点相关性在向量化空间中可视化地呈现,当指定聚类方案时,节点链接图和散点图会根据其聚类结果用不同颜色着色。

在数据视图中,依据成对图之间的边缘重叠和平均相关度构建热图,以热图中矩阵颜色的深浅来呈现投影视图中层相关性的高低。

每一种聚类的选择设置交互功能,当用户在控制面板中选中一个类时,不仅将选定聚类的图示附加到投影视图中,而且所有其他聚类将被显示为浅灰色以突出显示选定的聚类。

为视图中的每个节点设置交互功能,使得用户单击某个节点或帧化某些节点时,其他视图中的相应节点也被高亮显示。

在评估视图中设置下拉选择框交互,用户可以通过DF和DW的选择,查看不同聚类方法(DF)或不同权重(DW)的多元图的聚类结果指标对比。

相关技术
  • 一种基于势能熵的拉普拉斯中心性峰值数据聚类方法
  • 基于拉普拉斯秩约束的深度图像聚类方法
  • 基于拉普拉斯正则化和秩约束的多视图聚类方法
技术分类

06120115935838