掌桥专利:专业的专利平台
掌桥专利
首页

一种基于知识图谱和图卷积网络的推荐方法及其系统

文献发布时间:2023-06-19 11:05:16


一种基于知识图谱和图卷积网络的推荐方法及其系统

技术领域

本申请涉及大数据领域,具体地,涉及一种基于知识图谱和图卷积网络的推荐方法及其系统。

背景技术

现有技术中,推荐系统已经成为信息爆炸时代克服信息过载问题的最重要的方法,如何精准、快速地预测用户的爱好,推荐给用户最想要的物品,不仅是科学研究领域的重要研究课题,也逐渐成为现实生活中各种电子商务领域成败攸关的核心技术。在众多的推荐方法中,协同过滤方法从用户历史数据来预测用户偏好,具有有效性和普遍性,受到众多研究者的关注。但是,协同过滤方法无法建模辅助信息,例如物品属性、用户配置文件和上下文,因此在用户和物品交互很少的稀疏情况下表现不佳。基于协同过滤的方法同样遭遇到用户物品交互的稀疏性和冷启动的问题。

为了解决这些限制,研究人员通常在推荐系统中引入辅助信息,包括:社交网络,上下文信息,物品属性和图像信息。知识图谱是一个有向异构图,它由大量的实体和关系组成,包含了丰富的语义信息。具体的说,知识图谱的每条边和与其相连的两个结点,都可以使用三元组(头实体,关系,尾实体)的形式来表达,其中,与边相连的结点称为实体,这条边称为关系,它表示头实体和尾实体通过关系相连接,这个三元组也可以称为事实。由于知识图谱中天然包含了丰富的实体和事实,我们可以很自然地将知识图谱作为一种新型的辅助信息引入推荐系统,从而提高推荐系统的准确性、多样性、可解释性,当前已经成为了研究的热点。

将知识图谱与推荐系统相结合的方法通常有以下几种:(1)基于路径的推荐方法:这种方法是将知识图谱视为一个异构信息网络,然后构造用户和物品之间的元路径或元图特征,充分且直观地利用了知识图谱的网络结构,但是这类方法需要手动设计元路径或者元图,在实践中难以到达最优,同时,也无法在实体不属于同一个领域的场景(例如新闻推荐)中应用,因为我们无法为这样的场景预定义元路径或者元图。(2)基于嵌入的推荐方法:这种方法通常直接使用来自知识图谱的信息来丰富物品或用户的表示。大致可以将其分为两类:基于距离的翻译方法(例如:TransE,TrasR)和基于语义的匹配方法(例如:RECASL,DisMult),但是,这些方法在实体传播方面遭遇到了瓶颈。(3)混合的推荐方法:这种方法将基于路径的推荐方法和基于嵌入的推荐方法结合起来,通过整合实体和关系的语义表示和连接信息,充分利用知识图谱中的信息进行更好的推荐,它是基于嵌入传播的思想,在知识图谱中连接结构的指导下细化实体表示。尽管上述这些方法在推荐系统上取得了不错的成果,但是,由于知识图谱的异构性,充分发挥知识图谱内在的高阶语义信息,并探索与用户之间的关系特征仍然很有挑战性。

因此如何将现有的基于分层的方法和基于深度学习方法有效结合起来,得到准确有效的文本分类,依然是本领域技术人员急需要解决的关键问题。

发明内容

为达到上述目的,本申请提供了一种基于知识图谱和图卷积网络的推荐方法,具体包括以下步骤:获取用户的高阶嵌入表示;根据用户的高阶嵌入表示,进行物品嵌入表示的获取;根据获取的用户的高阶嵌入表示和物品嵌入表示,对用户进行预测。

如上的,其中,获取用户的高阶嵌入表示之前,获取用户与物品交互的行为;用户与物品交互的行为用矩阵Y∈R

其中,

如上的,其中,以用户物品交互矩阵Y作为输入,获取用户的高阶嵌入表示,具体包括以下子步骤:获取用户邻接图;获取用户特征图;根据用户邻接图和用户特征图,获取全部用户特征表示图;在全部用户特征表示图中,获取用户u的高阶嵌入表示。

如上的,其中,用户u的高阶嵌入表示u具体表示为:

其中,G

如上的,其中,根据用户的高阶嵌入表示,进行物品嵌入表示的获取,具体包括以下子步骤:确定物品表示输入层;构建知识图邻域传播层,根据物品表示输入层和知识图邻域传播层获取物品嵌入式表示。

如上的,其中,将用户u的嵌入表示和知识图谱的0层实体作为物品表示输入层。

如上的,其中,使用函数f来获取知识图谱的实体之间的不同关系r对用户的重要性,重要性f

其中·表示按元素相乘,r

如上的,其中,实体e的邻域聚合

u表示用户u的高阶嵌入表示,·表示内积,f

如上的,其中,将实体表示e及其邻域聚合

其中σ是sigmoid函数,Q

实体聚合

如上的,其中,在获得用户嵌入表示u和物品嵌入表示v之后,通过预测函数g来预测概率,概率预测具体表示为:

本申请具有以下有益效果:

(1)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,能够增强用户表示,并通过知识图谱中的不同关系权重聚合传播物品特征,从而探索用户的远程兴趣。

(2)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,其中推荐方法能够在一定程度上提高推荐系统的性能,在一定程度保证了用户兴趣的预测。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的一种基于知识图谱和图卷积网络的推荐方法流程图;

图2是根据本申请实施例提供的用户特征聚合过程示意图;

图3是根据本申请实施例提供的知识图谱邻域传播层示意图。

具体实施方式

下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

考虑到现有方法的局限性,本申请提出了基于知识图谱和图卷积网络的推荐方法及其系统,其中基于知识图谱和图卷积网络的推荐系统集合了知识图谱推荐算法和团卷积网络推荐算法,通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。

在本申请提供的推荐方法中,由于隐式反馈更能反映用户特点,因此利用隐式反馈来表示用户与物品交互的行为(例如点击,购买或评分)。具体用矩阵Y∈R

其中,

如果在用户物品交互矩阵Y中已经观察到用户物品交互,表示为1,代表用户潜在的兴趣来源,同样,如果用户物品之间未观察到交互,表示为0。

用户物品交互矩阵为推荐系统提供了用户直接的兴趣表示,进一步地,知识图谱能够为推荐系统引入丰富的语义关系,有助于更深层次地发现用户兴趣,其中知识图谱用符号

实施例一

如图1是本申请基于知识图谱和图卷积网络的推荐系统提供的推荐方法,具体包括以下子步骤:

步骤S110:获取用户的高阶嵌入表示。

其中,假设两个用户对同一个物品有交互,则表明这两个用户的相关性较高,因此用户相关性所占的权重较大。将用户物品交互特征构建为图,使用图卷积网络不断聚合用户特征,最终获得用户的高阶表示。

具体地,如图2所示,以用户物品交互矩阵Y∈R

步骤S1101:获取用户邻接图。

其中,在获取用户邻接图之前,还包括计算用户之间的相似性,具体使用一个函数g来计算用户u

其中→表示交互符号,代表用户u

步骤S1102:获取用户特征图。

将用户和物品之间观察到的交互作为用户特征,构建用户特征图

其中,

步骤S1103:根据用户邻接图和用户特征图,获取全部用户特征表示图。

其中为了更好的增强用户表示,使用分层传播卷积聚合的方法,以用户邻接图G

同时,为了更好的提取用户特征,使用权重矩阵W和偏置b来增强用户表示,使用函数f

其中,l为图卷积聚合层数,*代表矩阵的相乘,G

为了增强用户表示,使用激活函数sigmoid,f

其中,

步骤S1104:在全部用户特征表示图中,获取用户u的嵌入表示。

其中步骤S1103中得到了全部用户的特征表示图,为了获取用户u的特征,我们根据用户u的特定编号进行查找操作,得到用户u的高阶嵌入表示u具体表示为:

其中,G

进一步地,为了探索用户特征聚合的重要性,设置第一变体,具体为将图卷积网络部分去掉获取的用户特征表示作为第一变体,用户高阶嵌入表示

其中,

步骤S120:根据用户的高阶嵌入表示,进行物品嵌入表示的获取。

其中,如图3所示,将每个物品v与知识图谱中的实体e相对应,并通过实体e对应的关系在知识图谱上传播用户偏好。因此,物品表示的生成需要同时输入用户嵌入表示和知识图谱。然后利用注意力机制得到知识图谱中实体的不同关系r对用户兴趣的影响权重,将关系作为传播因子在固定数量的邻居上传播,最终形成物品嵌入表示。

步骤S120具体包括以下子步骤:

步骤S1201:确定物品表示输入层。

将用户u交互的物品,在知识图谱中对应为头实体,表示为

步骤S1202:构建知识图邻域传播层,根据物品表示输入层和知识图邻域传播层获取物品嵌入式表示。

知识图谱中的关系多种多样,有的实体所连接的关系可能达到几十条,但是,大部分关系对于用户兴趣的影响不大,因此,需要确定知识图谱的邻域传播层。

通过选择固定数量的关系来计算实体e的邻域,表示为

进一步地,在知识图谱中,实体e

其中·表示按元素相乘,r

·表示内积,u表示用户u的高阶嵌入表示,f

进一步地,将实体表示e及其邻域聚合

其中σ是sigmoid函数,Q

最终得到的实体聚合

进一步地,为了探索知识图谱中不同关系对邻域聚合的重要性,设置第二变体,第二变体具体为去掉注意力机制获取的物品嵌入表示,物品嵌入表示

其中,Q

步骤S130:根据获取的用户的高阶嵌入表示和物品嵌入表示,对用户进行预测。

具体地,在获得用户嵌入表示u和物品嵌入表示v之后,通过预测函数g来预测概率,概率预测具体表示为:

为了证明用户聚合的高阶表示有助于增强推荐系统的性能,将去掉图卷积网络生成的用户特征图

为了探索知识图谱中不同关系的重要性,将注意力机制生成的

进一步地,根据用户嵌入表示u和物品嵌入表示v得到的第三预测函数表示为:

g=σ(u·v)

其中,在获取上述预测函数后,还包括,对推荐系统进行评估,以验证不同参数对推荐系统的影响,例如在设置第一变体和第二变体后,推荐系统的性能是否受到了影响。具体根据准确率、精确率和召回率和排序能力这几类指标进行推荐系统的点击率评估(简称CTR)。

具体地,在每获取一次预测函数后,调用CTR函数,获取上述几类指标的具体数值,具体数值越大,则说明推荐系统的性能越好。理论上来讲,根据知识图谱和图卷积网络推荐系统的性能是最好的。

其中准确率(Accuracy,简称Acc)表示分类正确的样本数占样本总数的比例,该指标在需要向用户展示预测评分的系统中尤为重要,准确率具体表示为:

其中,TP表示样本的真实类别为正(样本的真实值),最后预测得到的结果也为正;FP表示样本的真实类别为正,最后预测得到的结果却为负;FN表示样本的真实类别为负,最后预测得到的结果却为正;TN表示样本的真实类别为负,最后预测得到的结果也为负。

使用精确率(Precision)和召回率(Recall)来衡量推荐系统的预测能力,精确率具体表示为:

其中,TP表示样本的真实类别为正,最后预测得到的结果也为正;FP表示样本的真实类别为正,最后预测得到的结果却为负;FN表示样本的真实类别为负,最后预测得到的结果却为正。

召回率具体表示为:

其中,TP表示样本的真实类别为正,最后预测得到的结果也为正;FP表示样本的真实类别为正,最后预测得到的结果却为负;FN表示样本的真实类别为负,最后预测得到的结果却为正。

但是,这两个指标往往只是代表了问题的一个方面,为了折中精确率和召回率的结果,引入了F1分数(F1-score),具体表示为:

在根据函数CTR评估中,不仅希望推荐系统给出是否点击的分类信息,更需要推荐系统给出准确的概率值作为排序的依据,这样能够综合考虑正实例和负实例,应对样本不均衡的情况。而AUC(Area Under Curve,ROC曲线下面积)就直观地反映了CTR的准确性(也就是CTR的排序能力)

其中,M,N分别表示正样本数和负样本数,pos表示正实例样本,

在对用户进行预测之后,需要设置损失函数来增强推荐算法的学习能力。遍历了所有的用户物品交互,采用负抽样策略,将用户观察到的交互视为正实例,未观察到的交互视为负实例。此外,设置最小化的损失函数以保证预测的准确率,损失函数包括:交叉熵损失,用户聚合损失和物品传播损失,损失函数

其中,σ是sigmoid函数,y

其中,本申请通过不同的数据集,以验证本申请提供的知识图谱和图卷积网络推荐系统的性能优于现有技术中推荐系统的性能,以及验证用户特征聚合和知识图谱中不同关系的权重对传播用户兴趣有着重要的意义。具体请见表1和表2。

具体地,本申请中采用了图书数据集和音乐数据集,其中图书数据集中包含了图书社区的278858个用户对271379个图书的来自于1149780个明确的评级,其中每个评级的范围是从1到10。音乐数据集包含来自指定音乐平台的2000名用户的音乐家的收听信息。

表1

通过表1,能够得出本申请提供的推荐方法相比于其他的方法可以在一定程度上提高推荐系统的性能。

表2

通过表2,能够得出用户表示高阶建模和知识图谱中不同关系的权重对传播用户兴趣有着重要的意义。具体为,去掉图卷积聚合层或注意力机制下的推荐方法中,推荐系统的性能较差,而基于知识图谱和图卷积网络的推荐方法中,推荐系统的性能更好。

本申请具有以下有益效果:

(2)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,能够增强用户表示,并通过知识图谱中的不同关系权重聚合传播物品特征,从而探索用户的远程兴趣。

(3)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,其中推荐方法能够在一定程度上提高推荐系统的性能,在一定程度保证了用户兴趣的预测。

虽然当前申请参考的示例被描述,其只是为了解释的目的而不是对本申请的限制,对实施方式的改变,增加和/或删除可以被做出而不脱离本申请的范围。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种基于知识图谱和图卷积网络的推荐方法及其系统
  • 一种基于知识图谱和图卷积网络的推荐方法及其系统
技术分类

06120112792858