掌桥专利:专业的专利平台
掌桥专利
首页

基于知识图谱的推荐方法、装置、计算机设备及存储介质

文献发布时间:2024-04-18 19:58:26


基于知识图谱的推荐方法、装置、计算机设备及存储介质

技术领域

本发明涉及知识图谱技术领域,尤其涉及一种基于知识图谱的推荐方法、装置、计算机设备及存储介质。

背景技术

开源社区中的软件资源十分丰富,但由于每个项目的信息都是由其拥有者进行管理和维护的,其中包含的数据依然符合互联网上原生资源“碎片化、无序”的特点,不同项目间的信息组织方式具有很大的差异性。

同时,这些杂乱的文本信息使得开发者和用户在进行搜索项目时,检索的结果往往不够准确,用户只能进行多次检索和反复查阅项目内容,导致需要耗费大量的浏览时间以及检索时间。

发明内容

基于此,有必要针对现有技术用户检索所需的项目时,检索的结果准确率较低的技术问题,提出了一种基于知识图谱的推荐方法、装置、计算机设备及存储介质。

第一方面,提供了一种基于知识图谱的推荐方法,所述方法包括:

获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间;

在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目;

根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目;

分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果。

第二方面,提供了一种基于知识图谱的推荐装置,所述装置包括:

获取模块,用于获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间;

挑选模块,用于在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目;

确定模块,用于根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目;

查询模块,用于分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果。

第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于知识图谱的推荐方法的步骤。

第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于知识图谱的推荐方法的步骤。

本发明提出的基于知识图谱的推荐方法,通过获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间,而后在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目,接着根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目,最后分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,能够根据目标用户的历史行为数据以及先前构建好的知识图谱,在知识图谱查询到符合用户近期需求的项目,得到推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

其中:

图1为一个实施例中基于知识图谱的推荐方法的应用环境图;

图2为一个实施例中基于知识图谱的推荐方法的流程图;

图3为一个实施例中基于知识图谱的推荐装置的结构框图;

图4为一个实施例中计算机设备的结构框图;

图5为另一个实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的基于知识图谱的推荐方法,可应用在如图1的应用环境中,其中,客户端110通过网络与服务端120进行通信。服务端120可以通过客户端110接收获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间,服务端120在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目,服务端120根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目,服务端120分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,能够根据目标用户的历史行为数据以及先前构建好的知识图谱,在知识图谱查询到符合用户近期需求的项目,得到推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。其中,客户端110可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。

请参阅图2所示,图2为本发明一实施例提供的基于知识图谱的推荐方法的一个流程示意图,包括如下步骤:

S101:获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间;

其中,历史行为数据是指目标用户在过去的时间保留下来的数据,所述浏览项目是指用户在过去时间浏览过的项目,所述浏览时间是指用户在过去时间浏览过的项目的时间,所述项目可以是开源项目托管平台上的各种软件项目。

所述历史行为数据可以包括浏览项目、浏览项目的浏览时间、浏览项目所属平台、浏览项目的内容信息以及浏览项目的基本信息,所述浏览项目的基本信息可以包括浏览项目的作者、浏览项目所使用的计算机设计语言,如所述计算机设计语言为C语言,所述C语言是一种计算机程序设计语言,它既具有高级语言的特点,又具有汇编语言的特点,C语言可以作为工作系统设计语言,用于编写系统应用程序,也可以作为应用程序设计语言,编写不依赖计算机硬件的应用程序。

知识图谱是指包含:各标准项目、每个标准项目的特征数据、不同标准项目的特征数据之间的关系的图谱。其中,所述关系可以是属于关系、组合关系、包含关系和因果关系。所述特征数据是指具有标准项目的代表性特征的数据,作为一示例,项目为“基于卷积神经网络的算法”,其特征数据可以是“卷积”以及“神经网络”。

S102:在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目;

作为一示例,在各个所述浏览项目各自对应的浏览时间中确定最晚的浏览时间,将所述最晚的浏览时间与预设的候选时长进行减法运算,得到所述预设时间。

具体地,在各个浏览项目中挑选出浏览时间晚于预设时间的每个浏览项目,作为候选项目,以将不晚于预设时间的每个浏览项目去除,得到更有推荐价值的候选项目。

S103:根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目;

其中,所述权重配置规则是指按照浏览时间从晚到早的顺序,给候选项目配置从高到低的权重,所述权重可以是0.1、0.5、0.4等数值。根据候选项目的浏览时间以及预设的权重配置规则,配置候选项目的权重。

作为一示例,候选项目有第一候选项目、第二候选项目、第三候选项目,分别对应的浏览时间为20时20分、20时18分、21时10分,则给第一候选项目配置第二权重、第二候选项目配置第三权重、第三候选项目配置第一权重,其中,第一权重大于第二权重,第二权重大于第三权重。

最后,根据每个候选项目的权重,从而在各个候选项目中确定出至少一个目标项目。作为一示例,将候选项目的权重大于预设权重数值的候选项目,作为目标项目。作为又一示例,按照候选项目的权重的从大到小的顺序,对候选项目进行排序,从而得到排序结果,在排序结果中将排序靠前的多个候选项目,作为目标项目,作为一示例,排序靠前可以具体设置为排序前三。

S104:分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果。

其中,所述项目标识可以是ID标识,还可以是数字标识或者字母标识。

在一种实现方式中,将目标项目的项目标识作为索引,在知识图谱中进行查询,从而得到用户期望浏览的项目,作为推荐结果。作为一示例,在得到推荐结果后,将所述推荐结果输出至终端设备进行显示,以将推荐结果展示给目标用户,使目标用户可以自由选择推荐结果中的项目,为用户提供高质量的推荐服务。

本实施例提出的基于知识图谱的推荐方法,通过获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间,而后在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目,接着根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目,最后分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,能够根据目标用户的历史行为数据以及先前构建好的知识图谱,在知识图谱查询到符合用户近期需求的项目,得到推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

一实施例中,所述分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,包括:

S201:在所述知识图谱中查询与所述目标项目的所述项目标识对应的标准项目作为第一项目,将所述第一项目在所述知识图谱中的每个特征数据作为第一特征数据;

在本实施例中,将所述目标项目的所述项目标识作为索引,在知识图谱中进行查询,从而在知识图谱中得到所述项目标识对应的标准项目,其中,所述标准项目是对各种网站或平台上获取的开源项目进行标准化操作后的项目。

将上述标准项目作为第一项目,而后将第一项目在知识图谱中的每个特征数据作为第一特征数据。需要说明的是,在知识图谱中的每个项目均有其对应的一个或者多个特征数据。

S202:将所述目标项目对应的各个所述第一特征数据各自对应的标签作为第一标签,在所述知识图谱中查询与所述第一标签存在关系的标签对应的标准项目,作为第二项目,并根据各个所述目标项目对应的各个所述第二项目确定所述推荐结果。

其中,标签可以是指特征数据所在的领域,还可以是特征数据的关键特征。

作为一示例,第一特征数据为“卷积神经网络”这个词,所述“卷积神经网络”对应的标签可以是关键特征,所述关键特征为“卷积”,所述卷积神经网络对应的标签还可以是特征数据所在的领域,所述领域可以是“模型训练”、“人工智能”、“机器学习”或者是“深度学习”等。

在一种实现方式中,通过人为标注或者是机器标注的方式,为每个特征数据进行标签的标注。

具体地,将目标项目对应的各个第一特征数据各自对应的标签作为第一标签,在知识图谱中查询与第一标签存在关系的标签对应的标准项目,作为第二项目,需要说明的是,存在关系是指,标签与标签之间存在关系,关系可以是包含、组合、属于、因果、交叉等关系。

最后,通过各个目标项目对应的各个第二项目,确定推荐结果。作为一示例,在各个第二项目随机挑选预设挑选数量的第二项目,作为推荐结果。

本实施例提出的基于知识图谱的推荐方法,通过在所述知识图谱中查询与所述目标项目的所述项目标识对应的标准项目作为第一项目,将所述第一项目在所述知识图谱中的每个特征数据作为第一特征数据,最后将所述目标项目对应的各个所述第一特征数据各自对应的标签作为第一标签,在所述知识图谱中查询与所述第一标签存在关系的标签对应的标准项目,作为第二项目,并根据各个所述目标项目对应的各个所述第二项目确定所述推荐结果,能够查询到与目标项目存在关系的各个第二项目,得到推荐结果,极大提高了推荐结果的深度以及广度,从而丰富推荐结果的同时,使用户搜索所需项目,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

一实施例中,所述将所述目标项目对应的各个所述第一特征数据各自对应的标签作为第一标签,在所述知识图谱中查询与所述第一标签存在关系的标签对应的标准项目,作为第二项目,并根据各个所述目标项目对应的各个所述第二项目确定所述推荐结果,包括:

S301:将各个所述第二项目添加至预设的存储器;

在本实施例中,通过预设的存储器,将第二项目进行存储。在一种实现方式中,将所述第二项目持久化存储至存储器中。作为一示例,第二项目还可以存储至预设的数据库中。

S302:若所述存储器中的所述第二项目的数量未超过预设数量,则将所述第二项目的在知识图谱中的各个特征数据对应的每个标签作为第二标签,在所述知识图谱中查询与所述第二标签存在关系的标签对应的标准项目,作为第三项目;

在本实施例中,首先,判断存储器中的第二项目的数量是否超过预设数量。而后,当存储器中的第二项目的数量未超过预设数量时,确定第二项目的在知识图谱中的各个特征数据,将上述特征数据对应的每个标签作为第二标签。接着,在知识图谱中查询与第二标签存在关系的标签对应的标准项目,作为第三项目。

S303:将所述第三项目作为第二项目,并返回执行所述将各个所述第二项目添加至预设的存储器的步骤;

在本实施例中,这意味着存储器中的第二项目的数量未超过预设数量,为了使得存储器中的第二项目的数量等于或者超过预设数量,将第三项目作为第二项目,从而跳转回将各个所述第二项目添加至预设的存储器的步骤;其中,返回执行所述将各个所述第二项目添加至预设的存储器的步骤,是指返回步骤S301并执行步骤S301。

S304:若所述存储器中的所述第二项目的数量超过预设数量,则根据所述存储器中的各个所述第二项目确定所述推荐结果。

在本实施例中,当存储器中的第二项目的数量超过预设数量,此时意味着已经获得到足够多且包含足够丰富的关系的第二项目,最后根据存储器中的各个第二项目确定推荐结果,实现了推荐结果的丰富。

作为一示例,在存储器中的各个第二项目中随机挑选预设的挑选数量的第二项目,作为推荐结果,所述挑选数量可以为10。

本实施例提出的基于知识图谱的推荐方法,通过将各个所述第二项目添加至预设的存储器,接着若所述存储器中的所述第二项目的数量未超过预设数量,则将所述第二项目的在所述知识图谱中的各个特征数据对应的每个标签作为第二标签,在所述知识图谱中查询与所述第二标签存在关系的标签对应的标准项目,作为第三项目,而后将所述第三项目作为第二项目,并返回执行所述将各个所述第二项目添加至预设的存储器的步骤,最后若所述存储器中的所述第二项目的数量超过预设数量,则根据所述存储器中的各个所述第二项目确定所述推荐结果,能够通过预设的存储器,增加第二项目的数量,从而丰富推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

一实施例中,所述分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,还包括:

S401:将每个所述候选项目的特征数据输入至训练好的行为分析模型中进行数据分析,得到预测结果,其中,所述行为分析模型是基于Wi de&Deep模型训练得到的模型;

其中,行为分析模型是基于Wi de&Deep模型训练得到的模型,Wi de&Deep模型是由单层的Wi de部分和多层的Deep部分组成的混合模型,其中,Wi de部分的主要作用是让模型具有较强的“记忆能力”,Deep部分的主要作用是让模型具有“泛化能力”。作为一示例,通过行为采集器,采集大量用户的行为数据,行为数据可以是用户过去浏览的多个项目的特征,根据行为数据构建用户对应的行为兴趣特征,将行为兴趣特征输入至Wi de&Deep模型进行训练。

具体地,将每个候选项目的特征数据输入至训练好的行为分析模型中进行数据分析,得到预测结果,其中,预测结果可以是预测用户所期望的项目。

S402:分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到查询结果;

在一种实现方式中,对于每个目标项目,分别根据每个目标项目的项目标识,在知识图谱中进行查询,得到目标项目对应一个或者多个项目,作为查询结果。

S403:根据所述预测结果和所述查询结果,确定所述推荐结果。

在本实施例中,作为一示例,将预测结果以及查询结果作为推荐结果。作为又一示例,在预测结果以及查询结果中随机筛选出第一预设数量的项目,作为推荐结果,其中,第一预设数量可以是20。作为又一示例,分别在预测结果以及查询结果中筛选出第二预设数量的项目,其中,第二预设数量可以是10.

本实施例提出的基于知识图谱的推荐方法,通过将每个所述候选项目的特征数据输入至训练好的行为分析模型中进行数据分析,得到预测结果,其中,所述行为分析模型是基于Wi de&Deep模型训练得到的模型,而后分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到查询结果,最后根据所述预测结果和所述查询结果,确定所述推荐结果,能够通过行为分析模型预测用户期望浏览的项目,得到预测结果,最后根据知识图谱中查询到查询结果以及预测结果得到推荐结果,提高了推荐结果的准确性,使得推荐结果更加符合用户期望,提高了用户的体验。

一实施例中,所述获取目标用户的历史行为数据以及知识图谱之前,包括:

S501:获取各个标准项目各自对应的项目信息,其中,所述项目信息包括项目简介以及项目标签;

其中,所述标准项目是对各种网站或平台上获取的开源项目进行标准化操作后的项目,标准化操作可以包括名称的标准化,项目标签是指标准项目本身自带的标签,既指标准项目在网站或平台上就已经存在的标签。

S502:对所述项目信息进行预处理,并对预处理后的所述项目信息进行关键词提取,得到每个所述标准项目的关键词集合;

在本实施例中,首先,对所述项目信息进行预处理,作为一示例,对于获得项目信息进行数据清洗,主要包括去除与项目无关的文字、标点符号、重复冗余的字符以及转义字符等,需要使用正则表达式对项目信息进行规划化处理,以提高项目信息的质量。接着,对预处理后的项目信息进行关键词提取,从而得到每个标准项目的关键词集合。

一实施例中,所述对预处理后的所述项目信息进行关键词提取,得到每个所述标准项目的关键词集合,包括:

S5021:对所述项目信息进行预处理,其中,所述预处理包括数据清洗和数据规划化处理;

S5022:采用ansj分词器,对预处理后的所述项目信息进行关键词提取,得到每个所述标准项目的关键词集合。

在本实施例中,对所述项目信息进行预处理后,采用自然语言处理领域中的ansj分词器对项目信息的简介描述以及项目简介以及项目标签进行关键词提取,ansj分词器是使用java语言进行编程实现的中文分词器,其中,java语言是是一种通用的,基于类的,面向对象的编程语言,java语言可以用于应用程序开发的计算平台。ansj分词器的内存分词速度可达到100万字/秒,文件分词速度达到30万字/秒,准确率达到96%以上。

本实施例提出的基于知识图谱的推荐方法,通过对所述项目信息进行预处理,其中,所述预处理包括数据清洗和数据规划化处理,最后采用ansj分词器,对预处理后的所述项目信息进行关键词提取,得到每个所述标准项目的关键词集合,能够通过预处理得到高质量的项目信息,利于通过ansj分词器对预处理后的项目信息进行分词,得到分词效果极佳的关键词集合。

S503:将每个所述关键词集合输入至训练好的自然语言处理深度模型中进行特征提取,得到每个所述关键词集合对应的各个向量矩阵,其中,所述自然语言处理深度模型是基于Word2Vec模型训练得到的模型;

其中,Word2Vec模型的文本聚类是一种有效解决提取的名词冗余、标签过多以及冷门词语处理等问题的模型,Word2Vec是典型的自然语言处理深度模型,由适应小样本的CBOW(连续词袋)模型和适合大型语料库的Skip-gram模型组成,其中Ski p-gram模型目标是通过最优化邻域保留的似然目标,来学习单词的连续特征表示。

在本实施例中,将每个关键词集合输入至训练好的自然语言处理深度模型中进行特征提取,得到自然语言处理深度模型输出的每个关键词集合对应的各个向量矩阵。作为一示例,每个关键词被转化为维度为1x400的向量矩阵。

S504:采用预设的谱聚类算法,对各个所述关键词集合对应的各个所述向量矩阵进行聚类,得到聚类矩阵;

在本实施例中,谱聚类算法可以采用基于超像素锚图二重降维的高光谱聚类算法,而后通过基于超像素锚图二重降维的高光谱聚类算法对各个关键词集合对应的各个向量矩阵进行聚类,从而得到聚类矩阵。

S505:将所述聚类矩阵输入至训练好的特征关联模型中进行基于关系的特征关联,得到所述知识图谱,其中,所述特征关联模型是基于依次连接的Bert模型、BGRU模型以及CRF模型训练得到的模型。

其中,Bert(Bidirectional Encoder Representation from Transformers)模型,Bert模型能生成深度的双向语言表征。BGRU(Bidirectional Gate Recurrent Unit)模型,CRF(条件随机场)模型。

在本实施例中,在得到聚类矩阵后,将聚类矩阵输入至训练好的特征关联模型中进行基于关系的特征关联,使得聚类矩阵中的每个特征数据与其他特征数据之间的关系得到确定,上述关系可以是包含关系、属于关系、组合关系、因果关系,从而得到所述知识图谱。

在一种实现方式中,当外界输入新的知识实体时,知识图谱应对新实体进行自动化的分类与信息抽取处理,从而不断扩展知识库规模与知识面。由于知识图谱构建步骤较多,面对少量、零散的新知识实体输入时,在每次处理时都要对新知识执行整套构建流程并不现实。知识图谱可嵌入TransG模型,TransG模型可以自动发现关系的语义集群,并利用多个关系分量的混合来转换实体对,可以解决一个关系存在多个语义的问题。知识图谱借助TransG模型构建自动化知识推理能力,对部分已有项目进行特征层面的学习,通过TransG模型知识推理的能力处理新输入项目并找出最相近的前若干个已有项目,有效应对新节点的输入,解决了知识图谱规模增长时新节点短期合理分类与正确推荐的难点,丰富了关联渠道,可以兼顾稳定性与灵活性。

本实施例提出的基于知识图谱的推荐方法,通过获取各个标准项目各自对应的项目信息,其中,所述项目信息包括项目简介以及项目标签,接着对所述项目信息进行预处理,并对预处理后的所述项目信息进行关键词提取,得到每个所述标准项目的关键词集合,而后将每个所述关键词集合输入至训练好的自然语言处理深度模型中进行特征提取,得到每个所述关键词集合对应的各个向量矩阵,其中,所述自然语言处理深度模型是基于Word2Vec模型训练得到的模型,然后采用预设的谱聚类算法,对各个所述关键词集合对应的各个所述向量矩阵进行聚类,得到聚类矩阵,最后将所述聚类矩阵输入至训练好的特征关联模型中进行基于关系的特征关联,得到所述知识图谱,其中,所述特征关联模型是基于依次连接的Bert模型、BGRU模型以及CRF模型训练得到的模型,能够通过预处理得到高质量的项目信息,利于通过ansj分词器对预处理后的项目信息进行分词,得到分词效果极佳的关键词集合,再将关键词集合输入至自然语言处理深度模型进行分词,再通过聚类表现优异的预设的谱聚类算法对分词后得到的向量矩阵进行聚类,从而得到聚类效果出色的聚类矩阵,而后通过该聚类矩阵输入至训练好的特征关联模型中,得到包含不同标准项目的特征数据之间的关系的知识图谱。

一实施例中,所述将所述聚类矩阵输入至训练好的特征关联模型中进行基于关系的特征关联,得到所述知识图谱,包括:

S5051:将所述聚类矩阵输入至训练好的特征关联模型的所述Bert模型中进行编码处理,得到编码数据;

S5052:将所述编码数据输入至训练好的特征关联模型的所述BGRU模型中进行关系预测,得到关系预测结果;

S5053:将所述关系预测结果输入至训练好的特征关联模型的所述CRF模型中对所述关系预测结果进行约束,得到知识图谱。

需要说明的是,在项目信息的处理上,由于特征数据大多数来源于杂乱无章的简介文字段落,因此基于上下文进行预测更加契合需求,更能准确理解项目个体信息。因此,将经过Bert模型编码后的编码数据输入至BGRU模型进行训练从而提高训练结果的准确率。

本实施例提出的基于知识图谱的推荐方法,通过将所述聚类矩阵输入至训练好的特征关联模型的所述Bert模型中进行编码处理,得到编码数据,接着将所述编码数据输入至训练好的特征关联模型的所述BGRU模型中进行关系预测,得到关系预测结果,最后将所述关系预测结果输入至训练好的特征关联模型的所述CRF模型中对所述关系预测结果进行约束,得到知识图谱,能够将聚类矩阵输入至特征关联模型中,得到包含不同标准项目的特征数据之间的关系的知识图谱。

请参阅图3所示,在一实施例中,提供一种基于知识图谱的推荐装置,所述装置包括:

获取模块10,用于获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间;

挑选模块20,用于在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目;

确定模块30,用于根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目;

查询模块40,用于分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果。

本实施例提出的基于知识图谱的推荐方法,通过获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间,而后在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目,接着根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目,最后分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,能够根据目标用户的历史行为数据以及先前构建好的知识图谱,在知识图谱查询到符合用户近期需求的项目,得到推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

一实施例中,所述查询模块40,还用于:在所述知识图谱中查询与所述目标项目的所述项目标识对应的标准项目作为第一项目,将所述第一项目在所述知识图谱中的每个特征数据作为第一特征数据;将所述目标项目对应的各个所述第一特征数据各自对应的标签作为第一标签,在所述知识图谱中查询与所述第一标签存在关系的标签对应的标准项目,作为第二项目,并根据各个所述目标项目对应的各个所述第二项目确定所述推荐结果。

一实施例中,所述查询模块40,还用于:将各个所述第二项目添加至预设的存储器;若所述存储器中的所述第二项目的数量未超过预设数量,则将所述第二项目的在所述知识图谱中的各个特征数据对应的每个标签作为第二标签,在所述知识图谱中查询与所述第二标签存在关系的标签对应的标准项目,作为第三项目;将所述第三项目作为第二项目,并返回执行所述将各个所述第二项目添加至预设的存储器的步骤;若所述存储器中的所述第二项目的数量超过预设数量,则根据所述存储器中的各个所述第二项目确定所述推荐结果。

一实施例中,所述查询模块40,还用于:将每个所述候选项目的特征数据输入至训练好的行为分析模型中进行数据分析,得到预测结果,其中,所述行为分析模型是基于Wide&Deep模型训练得到的模型;分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到查询结果;根据所述预测结果和所述查询结果,确定所述推荐结果。

一实施例中,所述基于知识图谱的推荐装置,还用于:获取各个标准项目各自对应的项目信息,其中,所述项目信息包括项目简介以及项目标签;对所述项目信息进行预处理,并对预处理后的所述项目信息进行关键词提取,得到每个所述标准项目的关键词集合;将每个所述关键词集合输入至训练好的自然语言处理深度模型中进行特征提取,得到每个所述关键词集合对应的各个向量矩阵,其中,所述自然语言处理深度模型是基于Word2Vec模型训练得到的模型;采用预设的谱聚类算法,对各个所述关键词集合对应的各个所述向量矩阵进行聚类,得到聚类矩阵;将所述聚类矩阵输入至训练好的特征关联模型中进行基于关系的特征关联,得到所述知识图谱,其中,所述特征关联模型是基于依次连接的Bert模型、BGRU模型以及CRF模型训练得到的模型。

一实施例中,所述基于知识图谱的推荐装置,还用于:将所述聚类矩阵输入至训练好的特征关联模型的所述Bert模型中进行编码处理,得到编码数据;将所述编码数据输入至训练好的特征关联模型的所述BGRU模型中进行关系预测,得到关系预测结果;将所述关系预测结果输入至训练好的特征关联模型的所述CRF模型中对所述关系预测结果进行约束,得到知识图谱。

一实施例中,所述基于知识图谱的推荐装置,还用于:对所述项目信息进行预处理,其中,所述预处理包括数据清洗和数据规划化处理;采用ansj分词器,对预处理后的所述项目信息进行关键词提取,得到每个标准项目的关键词集合。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于知识图谱的推荐方法服务端侧的功能或步骤。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于知识图谱的推荐方法的功能或步骤。

在一个实施例中,提出了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间;

在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目;

根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目;

分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果。

本实施例提出的基于知识图谱的推荐方法,通过获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间,而后在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目,接着根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目,最后分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,能够根据目标用户的历史行为数据以及先前构建好的知识图谱,在知识图谱查询到符合用户近期需求的项目,得到推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

在一个实施例中,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间;

在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目;

根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目;

分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果。

本实施例提出的基于知识图谱的推荐方法,通过获取目标用户的历史行为数据以及知识图谱,其中,所述历史行为数据包括各个浏览项目以及所述浏览项目的浏览时间,而后在各个所述浏览项目中挑选出所述浏览时间晚于预设时间的每个所述浏览项目,作为候选项目,接着根据所述候选项目的所述浏览时间以及预设的权重配置规则,配置所述候选项目的权重,并根据每个所述候选项目的权重,在各个所述候选项目中确定出至少一个目标项目,最后分别根据每个所述目标项目的项目标识,在所述知识图谱中进行查询,得到推荐结果,能够根据目标用户的历史行为数据以及先前构建好的知识图谱,在知识图谱查询到符合用户近期需求的项目,得到推荐结果,使得用户搜索所需项目时,可以根据推荐结果进行检索,从而提高检索效率以及准确率,节约检索的大量时间,提高用户体验。

需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

相关技术
  • 企业信息图谱构建方法、装置、计算机设备及存储介质
  • 房产图谱构建方法、装置、计算机设备及存储介质
  • 用于生成知识图谱的方法、装置、设备以及计算机可读存储介质
  • 构建企业关系图谱的方法、装置、计算机设备和存储介质
  • 知识图谱信息管理方法、装置、计算机设备及存储介质
  • 基于知识图谱的推荐方法、装置、计算机设备及存储介质
  • 基于知识图谱的产品推荐方法、装置、计算机设备及存储介质
技术分类

06120116489772