掌桥专利:专业的专利平台
掌桥专利
首页

一种基于Motif的时序学术超图网络推理方法

文献发布时间:2024-04-18 20:01:55


一种基于Motif的时序学术超图网络推理方法

技术领域

本发明涉及学术网络数据处理技术领域,具体涉及一种基于Motif的时序学术超图网络推理方法。

背景技术

学术网络数据在当前的科学研究中扮演着重要的角色。学术网络包括学者之间的合作关系、引用关系、研究方向等,这些关系信息不仅可以帮助我们深入理解学科的发展趋势,也可以为学术资源的管理和科研合作提供有力支撑。例如对于科研机构的战略规划、学科建设、人才选拔等方面,科研机构可以利用学术数据进行分析和推理,发现其中隐藏的学术合作和研究趋势,以便进行战略规划和学科建设。此外,科研机构还可以对学者的研究成果进行全面的评估和排名,从而有针对性地选拔和培养科研人才。因此,如何高效准确的利用学术网络数据,从中挖掘出多维度特征是一个亟待解决的研究课题。

学术网络通常带有时间特征,而时序网络模型能有效的学习网络中的特征,从而学习到网络的演变规则。传统时序网络模型往往基于普通图进行建模,而普通图的节点关系无法体现高阶关系,例如合作者网络中的论文共同作者无法在基于二元关系的普通图中得以体现,并且传统的方法对网络结构信息的利用率不足,这些问题导致实际的网络模型缺失了一部分特征从而导致模型对网络学习不足、推理预测结果差等问题。

综上所述,急需一种基于Motif的时序学术超图网络推理方法以解决现有技术中存在的问题。

发明内容

本发明目的在于提供一种基于Motif的时序学术超图网络推理方法,具体技术方案如下:

一种基于Motif的时序学术超图网络推理方法,包括如下步骤:

步骤S1:构建时序学术网络图的超图:

采用离散快照图序列表示时序学术网络图,对于每一个具体的学术快照网络,采用Motif挖掘算法计算各个节点的各类Motif在网络中的数量,得到Motif数量,以节点和以该节点为顶点的Motif中的点形成超边,将快照转化为超图;

步骤S2:Motif特征嵌入和聚合:

获取学术快照网络中的Motif特征,将Motif特征输入神经网络,捕捉Motif特征和Motif数量之间的非线性关系,采用软注意力机制对全体节点的Motif进行处理,学习各个Motif嵌入权重,基于超图卷积方法聚合节点、Motif和超边,得到节点信息;

步骤S3:时序特征提取:

基于某一时刻节点的超边点集获取该时刻节点的特征矩阵,将该时刻节点的特征矩阵输入时序特征提取层,得到该时刻节点的时序特征最终表示,将所述时序特征最终表示和该节点的周边Motif嵌入聚合,得到时序特征提取层输出;

步骤S4:学术网络推理演绎:

采用特征解码器对时序特征提取层输出进行解码,输出最终的概率矩阵,基于概率矩阵和学术推理损失函数实现学术网络的推理演绎。

优选的,在步骤S1中,Motif存储结构的表达式如下:

其中,D

优选的,在步骤S2中,Motif特征表达式如下:

其中,

优选的,在步骤S2中,Motif特征和Motif数量之间的非线性关系采用下式表示:

其中,

优选的,在步骤S2中,Motif嵌入权重的表达式如下:

其中,

优选的,在步骤S2中,节点信息的表达式如下:

其中,X

优选的,在步骤S3中,获取时序特征最终表达的具体过程如下:

将该时刻节点的特征矩阵传入三个投影矩阵W

采用自注意力机制产生各个快照时间下的时序特征,按行求和自注意力结果,得到时序特征矩阵,表达式如下:

其中,

将所述时序特征矩阵输入神经网络,得到该时刻的时序特征最终表示,表达式如下:

优选的,在步骤S3中,时序特征提取层输出的表达式如下:

其中,I

优选的,在步骤S4中,最终的概率矩阵表达式如下:

P

其中,I(t)为t时刻全体节点的时序特征最终表示,w和b均为可学习参数;P

优选的,在步骤S4中,学术推理损失函数的表达式如下:

其中,Loss表示学术推理损失;A

应用本发明的技术方案,具有以下有益效果:

(1)本发明将Motif结构引入超图的构造中,解决了以往超图构造所导致的结构信息损失,优化了超图的表征方式,使得超图对图高阶关系的建模附带Motif所蕴含的结构特征与交互习惯特征。

(2)本发明将Motif嵌入融入超图卷积中,完善和优化了Motif的表征,使其对交节点互习惯等信息进行保留;优化了原始超图卷积的逻辑,使得信息传播的过程附带Motif特征,进而解决学习隐藏结构信息的缺点,增加卷积过程的信息量,提高推理的准确性。

除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明优选实施例中时序学术超图网络推理方法的步骤流程图;

图2是本发明优选实施例中Cora数据集的Motif种类示意图;

图3是无向图Motif(A)和有向图Motif(B)的结构示意图;

图4是异质网络和同质网络结构的示意图;

图5是Motifm

图6是引文网络的Motif种类示意图;

图7是引文网络的局部示意图。

具体实施方式

传统的时序学术网络建模通常是基于普通图的二元关系,但是实际上学术网络中关系通常不局限于二元,因此普通图难以表征学术网络中复杂的关系。采用超图对学术网络进行建模,并利用超图神经网络对时序以及节点信息进行聚合传播学习,可以有效的解决复杂关系表征以及时序网络链路预测的问题,但是一般超图将构建的超边内部的节点均视为连通的,即超边内部节点的结构无法很好地体现,这样在解决关系建模之后又出现了网络结构信息的缺失问题。

本发明针对学术网络的时变性,高阶交互的建模需求,提出了一种基于Motif的超图构建方法,将每个时间节点的学术网络快照进行超图构建,形成完整的时序学术网络超图。超图本身带有高阶的信息,但在其超边内部往往将节点结构忽视,利用Motif进行超边的构建,可以保证在超图构建时对节点结构信息的保留,这样在不丢失结构信息的前提下,将学术网络时序变化的复杂性转化为超图结构的简单性,为后续的特征提取和超图学习做准备。

以下结合附图对本发明的实施例进行详细说明,但是本发明可以根据权利要求限定和覆盖的多种不同方式实施。

实施例:

参见图1,本实施例公开了一种基于Motif的时序学术超图网络推理方法,包括如下步骤:

步骤S1:构建时序学术网络图的超图:

本实施例选择无向图引文网络数据集(具体是Cora数据集,其Motif种类如图2所示)进行推理演绎,采用离散快照图序列表示时序学术网络图,对于每一个具体的学术快照网络,采用Motif挖掘算法(本实施例采用现有技术中的Motif挖掘算法,该挖掘算法不是本实施例保护的内容,此处不详细赘述)计算各个节点的各类Motif在网络中的数量,得到Motif数量,以节点和以该节点为顶点的Motif中的点形成超边,将快照转化为超图;

具体的,Motif存储结构的表达式如下:

其中,D

步骤S2:Motif特征嵌入和聚合:

获取学术快照网络中的Motif特征,表达式如下:

其中,

将Motif特征输入神经网络,捕捉Motif特征和Motif数量之间的非线性关系,表达式如下:

其中,

采用软注意力机制对全体节点的Motif进行处理,学习各个Motif嵌入权重,表达式如下:

其中,

基于超图卷积方法聚合节点、Motif和超边,得到节点信息,表达式如下:

其中,X

步骤S3:时序特征提取:

基于某一时刻节点的超边点集获取该时刻节点的特征矩阵,将该时刻节点的特征矩阵输入时序特征提取层,得到该时刻节点的时序特征最终表示。

获取时序特征最终表达的具体过程如下:

将该时刻节点的特征矩阵传入三个投影矩阵W

需要说明的是,该时刻节点的特征矩阵表示如下:

X

采用自注意力机制产生各个快照时间下的时序特征,按行求和自注意力结果,得到时序特征矩阵,表达式如下:

其中,

将所述时序特征矩阵输入神经网络,得到该时刻的时序特征最终表示,表达式如下:

将所述时序特征最终表示和该节点的周边Motif嵌入聚合,得到时序特征提取层输出,表达式如下:

其中,I

步骤S4:学术网络推理演绎:

采用特征解码器对时序特征提取层输出进行解码,输出最终的概率矩阵,基于概率矩阵和学术推理损失函数实现学术网络的推理演绎。

最终的概率矩阵表达式如下:

P

其中,I(t)为t时刻全体节点的时序特征最终表示,w和b均为可学习参数;P

学术推理损失函数的表达式如下:

其中,Loss表示学术推理损失;A

需要说明的是,每个Motif都是针对于某一节点的独立子结构,每个节点均拥有N个不同或相同的Motif。

具体的,Motif结构的包括:

(1)通用Motif结构:

学术超图的构建依赖于Motif集合Μ={m

其中,有向图Motif类型总数在具体网络中是不固定的,具体而言:①如引文网络,网络中无回路时,m

(2)异质、同质网络结构:

如图4所示,在学术社交网络中,存在着同质网络和异质网络,合作者网络与引文网络均为同质网络,网络中均只存在一种关系和节点类型,而这两类网络组合形成异质网络,异质网络存在两种以上的节点类型和关系。

(3)异质、同质网络Motif结构:

这两类网络的Motif在结构上遵循图一的定义,但存在差别。具体而言,在三个节点固定的情况下,同质网络Motif由于边和节点的同质,各类Motif无其他衍生Motif;异质网络Motif由于节点关系可能存在不同,各类Motif存在其他衍生Motif,如图5所示,同质网络

本实施例中主要以引文网络为例进行详细介绍。

在引文网络中有大量作者之间论文的引用关系,这些引用关系通常以固定的Motif结构重复出现。由于引文网络为同质图、有向图,且由于论文发表存在时间先后,因此不存在循环引用和双向引用,所以存在于引文网络中的Motif结构如图6所示,箭头所指代表引用该论文的论文节点。

图7为引文网络局部图,包含部分Motif标注,以B1节点为主节点的Motif包括A1、B1、C1所形成的Motif m

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120116571324