掌桥专利:专业的专利平台
掌桥专利
首页

基于注意力图神经网络的隐藏社群属性获取方法与系统

文献发布时间:2023-06-19 13:45:04


基于注意力图神经网络的隐藏社群属性获取方法与系统

技术领域

本发明属于属性挖掘技术领域,更具体地,涉及一种基于注意力图神经网络的隐藏社群属性获取方法与系统。

背景技术

网络空间中的用户研究是当前互联网个性化推荐领域的重要任务之一,随着社交网络规模的不断扩张,网络空间中的用户属性信息具有稀疏性、碎片性和异构性等特点,这导致对于目标用户的某些隐藏社群属性信息的获取十分困难,从而难以进行下一步的分析与推荐工作。如何通过有效的技术手段来挖掘社交网络平台中的用户潜在或隐藏社群属性信息,对分析目标用户关于待推荐内容展示出的潜在偏好至关重要。

对于用户属性认知分析,现有研究采用的属性特征大多是轻量级的特征,所蕴含的信息不够丰富,对于目标用户的属性嵌入表征探索不足,往往仍然存在大量的信息可供挖掘。其次,现有研究产生的目标用户属性分类仍然过于简单,针对的往往是目标用户的性别、教育背景等较为简单的分类目标,对多种媒体内容信息融合方面的探索仍然十分缺乏,对目标用户的内容行为表征方法仍然存在着较大的可探索空间。

发明内容

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于注意力图神经网络的隐藏社群属性获取方法,融合目标用户发布的文本内容信息以及目标用户间的社交信息进行隐藏社群属性信息的获取,同时兼顾了社交网络目标产出内容与目标之间互动的信息挖掘。例如具有相同偏好并且互相关注的两个用户很有可能也会互相点赞或转发对方产生的媒体数据,从而形成紧密的目标连接关系。本发明实现跨空间目标属性信息的统一表征,更高效地挖掘网络空间中目标用户的隐藏社群属性信息,便于进一步的分析和推荐工作。

为实现上述目的,按照本发明的一个方面,提供了一种基于注意力图神经网络的隐藏社群属性获取方法,包括:

步骤S1:将用户社交媒体数据词汇库中的所有词汇通过词向量模型 Word2vec网络学习得到所有词的嵌入表征向量;

步骤S2:通过对用户社交媒体数据词汇的嵌入表征向量归一化加权,基于前向全连接网络的目标嵌入层得到目标用户的嵌入表征;

步骤S3:基于用户社交网络和社交活动信息生成目标用户的邻居用户的嵌入表征,根据邻居用户的嵌入表征计算权重社交矩阵;

步骤S4:根据权重社交矩阵训练社交热度加权的注意力图神经网络,并利用注意力图神经网络和目标用户的嵌入表征生成目标用户的隐藏社群属性分类结果。

本发明的一个实施例中,所述步骤S1包括:已知包含所有用户的社交媒体数据集合形成的用户社交媒体数据词汇库为

本发明的一个实施例中,所述步骤S2包括:得到所有词的嵌入表征向量E

本发明的一个实施例中,所述步骤S2具体为:对于目标用户u

本发明的一个实施例中,所述步骤S3包括:

对目标用户u

度量目标用户u

对每个用户重复上述过程,得到任意两个用户之间的邻接权重,不存在社交关系的用户之间h

将所有n个用户之间的邻接权重记录为权重社交矩阵A∈R

本发明的一个实施例中,所述对目标用户u

本发明的一个实施例中,所述度量目标用户u

本发明的一个实施例中,所述步骤S4中训练注意力图神经网络包括:

计算目标用户u

训练学习到a和W后,根据基于a和W计算的注意力系数α

训练前向传播网络,输入目标用户u

本发明的一个实施例中,所述action分别为关注、评论、点赞、转发四类,分别归一化权重为h(action=关注)=0.4、h(action=评论)=0.25、 h(action=点赞)=0.25、h(action=转发)=0.1。

按照本发明的另一方面,还提供了一种基于注意力图神经网络的隐藏社群属性获取系统,包括嵌入表征向量生成模块、目标用户嵌入表征生成模块、权重社交矩阵生成模块和目标用户属性分类模块,其中:

所述嵌入表征向量生成模块,用于将用户社交媒体数据词汇库中的所有词汇通过词向量模型Word2vec网络学习得到所有词的嵌入表征向量;

所述目标用户嵌入表征生成模块,用于对用户社交媒体数据词汇的嵌入表征向量归一化加权,基于前向全连接网络的目标嵌入层得到目标用户的嵌入表征;

所述权重社交矩阵生成模块,用于基于用户社交网络和社交活动信息生成目标用户的邻居用户的嵌入表征,根据邻居用户的嵌入表征计算权重社交矩阵;

所述目标用户属性分类模块,用于根据权重社交矩阵训练社交热度加权的注意力图神经网络,并利用注意力图神经网络和目标用户的嵌入表征生成目标用户的隐藏社群属性分类结果。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有如下有益效果:

(1)通过用户社交媒体数据和社交关系提取文本特征,能充分保留用户社交产出内容和网络社交互动中包含的用户社群属性特征,与通过分析难以分辨真伪的用户个人网络信息和和错综复杂的社交网络的传统方法相比,能更准确、高效地挖掘用户属性信息;

(2)训练注意力图神经网络来构建用户隐藏社群属性挖掘模型,通过将社交文本信息和互动信息相融合,相比侧重于分析用户社交网络的传统方法,更全面地对用户隐藏社群属性进行刻画,能够缓解数据的稀疏性问题;

(3)通过结合社交热度和邻居用户嵌入表征来计算用户之间的社交关系权重,将社交行为和用户个性特征均作为考虑社交权重的因素,突破了只考虑已存在的社交关系的限制,有助于尽可能全面地挖掘用户社群属性。

附图说明

图1是本发明提出的基于注意力图神经网络的隐藏社群属性获取方法的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

如图1所示,本发明公开了一种基于注意力图神经网络的隐藏社群属性获取方法,包括以下步骤:

步骤S1:将用户社交媒体数据词汇库中的所有词汇通过词向量模型Word2vec网络学习得到所有词的嵌入表征向量;

具体地,所述步骤S1包括:已知包含所有用户的社交媒体数据集合形成的用户社交媒体数据词汇库为

步骤S2:通过对用户社交媒体数据词汇的嵌入表征向量归一化加权,基于前向全连接网络的目标嵌入层得到目标用户的嵌入表征;

具体地,所述步骤S2包括:得到所有词的嵌入表征向量E

具体地,对于目标用户u

步骤S3:基于用户社交网络和社交活动信息生成目标用户的邻居用户的嵌入表征,根据邻居用户的嵌入表征计算权重社交矩阵;

具体地,所述步骤S3包括:对目标用户u

进一步度量目标用户u

步骤S4:根据权重社交矩阵训练社交热度加权的注意力图神经网络,并利用注意力图神经网络和目标用户的嵌入表征生成目标用户的隐藏社群属性分类结果。

具体地,所述步骤S4中注意力图神经网络包括:

首先计算目标用户u

e

其中,a和W是需要学习的参数,W是神经网络中的共享参数矩阵,a 为注意力计算函数,h

通过对e

其次,训练学习到a和W后,根据基于a和W计算的注意力系数α

最后,训练前向传播网络,输入目标用户u

以下结合一具体实施例说明本发明方法:

(1)应用Word2vec网络学习词的嵌入表征:

已知包含所有用户的社交媒体数据集合形成的词汇库为C=(c

以“吴某购买了电脑”“王某点赞了吴某”为例,其词汇库为[吴某,购买,电脑,王某,点赞],其f=5。应用Word2vec网络得到这条媒体数据每个词的嵌入表征(w

(2)基于前向全连接网络的目标嵌入层得到目标用户嵌入表征:

根据权利要求2中的所述得到每个词的嵌入表征(w

(3)基于用户社交网络和社交活动信息生成权重社交矩阵:

对目标用户之间的各种社交关系转化为权重参数。首先记录每个用户产生社交关系的邻居用户,这些用户存在关注、点赞、转发、评论等社交行为,记目标用户“吴某”的邻居用户集合为[u

进一步以目标用户“吴某”和其邻居用户之间的社交次数、社交行为的类别作为社交热度进行度量,记h

(4)训练社交热度加权的注意力图神经网络,生成目标用户的隐藏社群属性分类结果:

训练注意力图神经网络以完成将文本内容信息与目标用户社交信息融合的任务。首先计算用户i和邻居用户k之间的相似系数e

e

最后训练前向传播网络,输入目标用户u

进一步地,本发明还提供了一种基于注意力图神经网络的隐藏社群属性获取系统,包括嵌入表征向量生成模块、目标用户嵌入表征生成模块、权重社交矩阵生成模块和目标用户属性分类模块,其中:

所述嵌入表征向量生成模块,用于将用户社交媒体数据词汇库中的所有词汇通过词向量模型Word2vec网络学习得到所有词的嵌入表征向量;

所述目标用户嵌入表征生成模块,用于对用户社交媒体数据词汇的嵌入表征向量归一化加权,基于前向全连接网络的目标嵌入层得到目标用户的嵌入表征;

所述权重社交矩阵生成模块,用于基于用户社交网络和社交活动信息生成目标用户的邻居用户的嵌入表征,根据邻居用户的嵌入表征计算权重社交矩阵;

所述目标用户属性分类模块,用于根据权重社交矩阵训练社交热度加权的注意力图神经网络,并利用注意力图神经网络和目标用户的嵌入表征生成目标用户的隐藏社群属性分类结果。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术分类

06120113791177