掌桥专利:专业的专利平台
掌桥专利
首页

知识点查询方法、装置、服务器、介质及产品

文献发布时间:2023-06-19 12:10:19


知识点查询方法、装置、服务器、介质及产品

技术领域

本申请涉及数据库技术领域,更具体的说,是涉及知识点查询方法、装置、服务器、介质及产品。

背景技术

可以基于用户输入的查询语句从知识库中搜索与查询语句相匹配的知识点;目前用户从知识库中检索得到知识点不准确。

发明内容

有鉴于此,本申请提供了一种知识点查询方法、装置、服务器、介质及产品。

本申请提供如下技术方案:

根据本公开实施例的第一方面,提供一种知识点查询方法,包括:

接收来自客户端的第一查询语句;

从所述第一查询语句中获得关键词;

从热点词库中获得与所述关键词的相关度大于或等于第一阈值的目标热搜词,所述热点词库包括多个热搜词,所述多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,所述目标用户账号与登陆所述客户端的用户账号具有关联关系;

从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点;

从所述热点知识库中获得与查询条件的相关度大于或等于第二阈值的第二知识点;所述热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,所述查询条件包括所述关键词和所述目标热搜词,或,所述查询条件包括所述目标热搜词;

发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

根据本公开实施例的第二方面,提供一种知识点查询装置,包括:

第一接收模块,用于接收来自客户端的第一查询语句;

第一获取模块,用于从所述第一查询语句中获得关键词;

第二获取模块,用于从热点词库中获得与所述关键词的相关度大于或等于第一阈值的目标热搜词,所述热点词库包括多个热搜词,所述多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,所述目标用户账号与登陆所述客户端的用户账号具有关联关系;

第三获取模块,用于从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点;

第四获取模块,用于从所述热点知识库中获得与查询条件的相关度大于或等于第二阈值的第二知识点;所述热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,所述查询条件包括所述关键词和所述目标热搜词,或,所述查询条件包括所述目标热搜词;

发送模块,用于发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

根据本公开实施例的第三方面,提供一种服务器,包括:

处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的知识点查询方法。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面所述的知识点查询方法。

根据本公开实施例的第五方面,提供一种一种计算机程序产品,可直接加载到计算机的内部存储器,例如第三方面所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现如第一方面所述的知识点查询方法。

经由上述的技术方案可知,本申请实施例提供的知识点查询方法中,接收来自客户端的第一查询语句,从第一查询语句中获得关键词,从热点词库中获得与关键词的相关度大于或等于第一阈值的目标热搜词,热点词库包括多个热搜词,多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,目标用户账号与登陆所述客户端的用户账号具有关联关系;将关键词以及目标热搜词作为查询条件,或,将目标热搜词作为查询条件,从热点知识库获得与查询条件的相关度大于或等于第二阈值的第二知识点;由于登陆客户端的用户账号与目标用户账号具有关联关系,因此,多个目标用户账号分别对应的已查询得到的相同知识点,很大概率为,登陆客户端的用户账号对应的用户需要查询的知识点;且由于热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,包含的知识点的数目较少,所以能够很快且准确的查询到第二知识点。避免了由于第一查询语句包含的关键词可能不准确,或,第一查询语句包含的关键词太少,导致检索结果不准确的情况。可以理解的是,热点知识库可能不包括第二知识点,为了避免这种情况,可以从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点;发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例涉及的硬件架构的结构图;

图2为本申请实施例提供的知识点查询方法的流程图;

图3为本申请实施例提供的知识点查询装置的结构图;

图4是根据一示例性实施例示出的一种用于服务器的装置的框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例提供了一种知识点查询方法、装置、服务器、介质及产品,在对本申请实施例提供的技术方案进行介绍之前,先对本申请实施例涉及的相关技术和硬件架构进行介绍。

首先,对本申请实施例涉及的相关技术进行介绍。

相关技术中,知识库包括多个知识点。示例性的,多个知识点是通过拆分源文档得到的。不同知识点对应的源文档可能相同可能不同。

例如,源文档包括10个段落,示例性的,源文本被拆分为10个知识点,即每一个段落对应一个知识点;示例性的,源文档本拆分为5个知识点,一个知识点包括源文档中的一个或多个段落;示例性的,源文档被拆分为20个知识点,一个知识点包括一个段落中的一个或多个语句。

示例性的,知识点包括源文档;示例性的,知识点是基于其他知识点得到的。

示例性的,知识点的表示方式有多种,本申请实施例提供但不限于:链表、数组、结构体、表格中任一种。下面以表格为例对知识点的结构进行举例说明。

示例性的,相关技术中知识点的结构如表1所示。

表1相关技术中知识点的结构

示例性的,知识正文包括知识标题以及知识内容中任一个;示例性的,知识内容与知识标题相对应,例如,与知识标题“中银富登个人通知存款的存款期限”对应的知识内容可以为:个人通知存款不论实际存期多长,按存款人提前通知的期限长短划分为1天通知存款和7天通知存款两个品种。1天通知存款必须提前1天通知约定支取存款,7天通知存款则必须提前7天通知约定支取存款。1天通知存款和7天通知存款,客户必须提前1天或提前7天来到柜台预约支取登记。所谓转存是系统可以自动在到期日将本息转到客户的活期账户,但需要客户在每个周期(7天)都来柜台办理约定转存的业务。

示例性的,知识点包含的业务目录可以包括一级或多级目录,表1中是以业务目录包括两级目录为例进行说明的。

示例性的,知识点包含的业务目录用于指示知识点包含的知识正文的存储路径。示例性的,知识点包含的业务目录即为存储知识点的存储设备的名称和/或文件夹的名称。

示例性的,知识标题,可以是基于自然语言处理技术从知识内容文中得到的;示例性的,知识标题可以是从源文档中获得的。

示例性的,知识点包含的图谱标签是指知识正文的属性信息。示例性的,图谱标签包括:产品(知识正文的内容描述的产品)、所属银行(知识正文的内容针对哪个分行或哪个总行)、客户类型。示例性的,客户类型包括但不限于:个人客户、财富管理客户、普通客户、私人银行客户、中银理财客户等等。

示例性的,知识点包含的个性标签是由人工坐席添加的,人工坐席可以基于自己的对知识点的理解,对知识点进行标注,例如,表1中具有人工坐席的标识A的人工坐席标注了“富登特色定期存款”,下次具有人工坐席的标识A的人工坐席可以基于查询语句“富登特色定期存款”准确的搜索到表1所示的知识点。

需要说明的是,有时候人工坐席在查询的时候查询到所需的知识点,但是人工坐席对该知识点有一些自己的理解,或者对知识点有自己的称谓习惯,那么人工坐席可以人为将自己的理解添加到该知识点的个性标签中。这样就可以照顾到不同人工坐席的思维习惯,丰富知识的标注,从而加快知识查询的效率以及提升知识查询的准确率。

示例性的,对于同一知识点,不同人工坐席标注的个性标签可能不同,可能相同;由于人工坐席在搜索知识点之前,需要进行登陆,所以人工坐席的查询语句包括人工坐席的标识,因此,在通过个性标签检索知识点的过程中,不会受到其他人工坐席标注的个性标签的影响。

示例性的,知识点包含的管理属性是指管理该知识点的管理员的信息,例如,管理属性包括管理员所属部门以及管理员所属用户组。

表1中的知识点的结构仅为示例,并不对知识点的结构造成限定,例如,知识点可以包括:业务目录、知识正文、图谱标签、个性标签、管理属性中一个或多个字段。

示例性的,知识点还包括:知识正文的关键词。

示例性的,知识点还包括接收组,接收组包括能够查询得到该知识点的用户的标识。

示例性的,查询语句中的关键词可以包括属于业务目录、知识正文、图谱标签、个性标签、管理属性中一个或多个字段的关键词。在从知识库中检索与查询语句相关度大于或等于第一阈值的知识点的过程中,可以获得查询语句与知识点包含的业务目录、知识正文、图谱标签、个性标签、管理属性中一个或多个的相关度,以得到与查询语句相关度大于或等于第一阈值的知识点,并展示与查询语句相关度大于或等于第一阈值的知识点的链接。

相关技术中,在检索与查询语句相关度大于或等于第一阈值的知识点的过程中,用户输入的第一查询语句包含的关键词可能不全面,或者,不准确,使得得到的查询结果不准确。

例如,第一查询语句包含的关键词为关键词A和关键词B,假设用户需要查找的知识点包括关键词A、关键词B以及关键词C,由于第一查询语句包含的关键词不全面,使得查询结果比较宽泛,例如,查询结果中可能存在包括关键词A和关键词B,且不包括关键词C的知识点,使得用户无法快速准确的从查询结果中找到自己所需的知识点。

例如,第一查询语句包含的关键词为关键词A和关键词B,假设用户需要查找的知识点包括关键词A以及关键词B’,不包括关键词B;关键词B和关键词B’不同但相关度较高,通过第一查询语句可能无法得到用户所需的知识点。

其次,对本申请实施例涉及的硬件架构进行说明。

如图1所示,为本申请实施例涉及的硬件架构的结构图,该硬件架构包括:电子设备11、服务器12、热点词库13、原始知识库14以及热点知识库15。

示例性的,电子设备11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、笔记本电脑、平板电脑、掌上电脑、个人计算机、可穿戴设备、智能电视、PAD等。

示例性的,服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务器中心。服务器12可以包括处理器、存储器以及网络接口等。

应注意的是,图1仅仅是一种示例,电子设备的类型可以有多种,不限于图1中的计算机。

示例性的,电子设备11可以通过无线网络或有线网络与服务器12建立连接并通信。

示例性的,热点词库13、原始知识库14以及热点知识库15可以通过无线网络或有线网络与服务器12建立连接并通信。

示例性的,用户可以通过电子设备11输入第一查询语句。电子设备11可以将第一查询语句发送至服务器12。电子设备11可以显示服务器12反馈的查询结果。

示例性的,用户可以为人工坐席或客户。

示例性的,用户可以通过电子设备11展示的客户端的用户界面输入第一查询语句,该客户端可以为应用程序客户端或网页版客户端。

服务器12用于执行本申请实施例提供的知识点查询方法,并与热点词库13、原始知识库14以及热点知识库15进行交互。

示例性的,原始知识库14包括所有的知识点。

示例性的,热点词库13包括热搜词。

示例性的,热点知识库15包括包含热搜词的查询语句对应的命中知识点。

示例性的,热点词库13、原始知识库14以及热点知识库15可以位于服务器12,或者,热点词库13、原始知识库14以及热点知识库15独立于服务器12。

示例性的,热点词库13以及热点知识库15可以为同一知识库,也可以不同的知识库。

本领域技术人员应能理解上述电子设备和服务器仅为举例,其他现有的或今后可能出现的电子设备或服务器如可适用于本公开,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

下面结合硬件架构以及相关技术对本申请实施例提供的知识点查询方法进行说明。

如图2所示,为本申请实施例提供的知识点查询方法的流程图,该方法可以应用于图1所示的服务器中,该方法在实施过程中包括步骤S21至步骤S26。

步骤S21:接收来自客户端的第一查询语句。

示例性的,将当前待查询的查询语句称为第一查询语句,将已经查询过的查询语句称为第二查询语句。

步骤S22:从所述第一查询语句中获得关键词。

示例性的,从第一查询语句中获得的关键词的数目为一个或多个。

在一可选实施例中,第一查询语句可以为语音或文本。若第一查询语句为语音,需要将语音转换成文本。

可选的,本发明实施例提供但不限于以下获得第一查询语句包含的关键词的方法。

第一种获得第一查询语句包含的关键词的方法包括:

步骤A1:将第一查询语句进行划分,以得到多个词汇。

可选的,若查询语句为“客户购房的贷款合同”,那么,查询语句包含的词汇为:客户、购房、的、贷款合同。

步骤A2:根据预设规则,从多个词汇中获得关键词。

可选的,预设规则可以包括:去除步骤A1得到的多个词汇中属于停用词的词汇。假设停用词包括:的、得、了、吗、吧、在、中等等。那么,通过步骤A2得到的关键词包括:客户、购房、贷款合同。

第二种获得第一查询语句包含的关键词的方法包括:基于统计特征的关键词提取方法。

基于统计特征的关键词提取算法是利用第一查询语句中词语的统计信息抽取查询语句的关键词。

第三种获得第一查询语句包含的关键词的方法包括:基于词图模型的关键词提取算法,如,TextRank算法。

基于词图模型的关键词提取算法,首先要构建第一查询语句的语言网络图,然后对语言网络图进行分析,在语言网络图上寻找具有重要作用的词或者短语,这些短语就是第一查询语句的关键词。

第四种获得第一查询语句包含的关键词的方法包括:基于主题模型的关键词提取算法,如,LDA算法。

基于主题模型的关键词提取算法主要利用的是主题模型中关于主题分布的性质进行关键词提取。

步骤S23:从热点词库中获得与所述关键词的相关度大于或等于第一阈值的目标热搜词。

示例性的,第一阈值可以基于实际情况而定,这里不进行赘述。

所述热点词库包括多个热搜词,所述多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,所述目标用户账号与登陆所述客户端的用户账号具有关联关系。

示例性的,目标热搜词的数目为一个或多个。

示例性的,设定时间段的终止时间为当前时间,起始时间为当前时间+设定时间段;随着时间流逝,设定时间段的终止时间和起始时间在不断发生变化。

示例性的,与登陆所述客户端的用户账号具有关联关系的目标用户账号的数目为多个;示例性的,上述关联关系是指目标用户账号登陆的客户端与用户账号登陆的客户端使用的网络为同一无线局域网;示例性的,上述关联关系是指目标用户账号与用户账号具有相同的后缀,例如,@mmmm.com;示例的,上述关联关系是预先设置的,即上述关联关系是指目标用户账号与用户账号属于同一账号集合。

示例性的,具有关联关系的多个用户账号是指多个用户账号为同一企业申请的用户账号。

步骤S24:从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点。

示例性的,将从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的知识点称为第一知识点。示例性的,从原始知识库中得到的第一知识点的数目可以为一个或多个。

示例性的,原始知识库包括所有知识点。

示例性的,第二阈值可以基于实际情况而定,这里不再赘述。

步骤S25:从所述热点知识库中获得与查询条件的相关度大于或等于第二阈值的第二知识点;所述热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,所述查询条件包括所述关键词和所述目标热搜词,或,所述查询条件包括所述目标热搜词。

示例性的,将从热点知识库中获得与所述关键词的相关度大于或等于第二阈值的知识点称为第二知识点。示例性的,从热点知识库中得到的第二知识点的数目可以为一个或多个。

示例性的,由于登陆客户端的用户账号与目标用户账号具有关联关系,因此,多个目标用户账号分别对应的已查询得到的相同知识点,很大概率为,登陆客户端的用户账号对应的用户需要查询的知识点;且由于热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,包含的知识点的数目较少,所以能够很快且准确的查询到第二知识点。

若第一查询语句包含的关键词不全,在补充目标热搜词后,可以使得得到的第二知识点的范围缩小,提高了检索得到的第二知识点的准确性。若第一查询语句包含的关键词不对,则可以用目标热搜词替换该关键词,由于目标热搜词是准确的(因为已经基于目标热搜词检索得到了知识点),所以提高了检索得到的第二知识点的准确性。

步骤S26:发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

本申请实施例提供的知识点查询方法中,接收来自客户端的第一查询语句,从第一查询语句中获得关键词,从热点词库中获得与关键词的相关度大于或等于第一阈值的目标热搜词,热点词库包括多个热搜词,多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,目标用户账号与登陆所述客户端的用户账号具有关联关系;将关键词以及目标热搜词作为查询条件,或,将目标热搜词作为查询条件,从热点知识库获得与查询条件的相关度大于或等于第二阈值的第二知识点;由于登陆客户端的用户账号与目标用户账号具有关联关系,因此,多个目标用户账号分别对应的已查询得到的相同知识点,很大概率为,登陆客户端的用户账号对应的用户需要查询的知识点;且由于热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,包含的知识点的数目较少,所以能够很快且准确的查询到第二知识点。避免了由于第一查询语句包含的关键词可能不准确,或,第一查询语句包含的关键词太少,导致检索结果不准确的情况。可以理解的是,热点知识库可能不包括第二知识点,为了避免这种情况,可以从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点;发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

在一可选实现方式中,获取热点词库包含的热搜词的过程包括以下步骤B1至步骤B3。

步骤B1:获取与登陆所述客户端的用户账号具有关联关系的多个目标用户账号。

步骤B2:对于每一所述目标用户账号,获取具有所述目标用户账号的用户在预设时间段内输入的所述第二查询语句。

示例性的,可以按照企业的组织架构构建用户的关联关系。示例性的,属于同一企业的用户具有关联关系,示例性的,属于同一企业的同一部门的用户具有关联关系。

示例性的,可以搜集用户在日常工作中,发送的邮件、即时通讯、访问历史、检索历史等信息,提取用户的企业信息和部门信息,建立热点词库。

步骤B3:将多个所述目标用户账号分别对应的第二查询语句中,出现频率大于或等于第三阈值的关键词确定为所述热搜词。

示例性的,关键词的出现频率=包含该关键词的第二查询语句的数目/第二查询语句的总数目。

在一可选实现方式中,获取所述热点知识库包含的命中知识点的过程包括以下步骤C1至步骤C2。

步骤C1:从多个所述目标用户账号分别对应的第二查询语句的命中知识点中,获得包含热搜词的第二查询语句对应的命中知识点。

示例性的,获取所述第二查询语句的命中知识点的步骤包括:获取所述第二查询语句对应的查询结果,所述查询结果包括一个或多个知识点的链接;将所述查询结果中被点击链接的知识点或浏览时长大于或等于预设时长的知识点确定为所述命中知识点。

例如,第二查询语句为公积金申请流程,若查询结果包括:住房公积金贷款介绍的链接、住房公积金申请流程的链接、住房公积金贷款担保的链接、住房公积金贷款审批的链接、住房公积金贷款发放的链接、住房公积金贷款查询的链接,若用户点击了住房公积金申请流程的链接,则知识点“住房公积金申请流程”为命中知识点,若用户未点击其他知识点的链接,则其他知识点不是命中知识点。

示例性的,对于同一第二查询语句而言,该第二查询语句对应的查询结果中命中知识点的数目可能为一个或多个。

步骤C2:将包含热搜词的第二查询语句对应的命中结果存储至所述热点知识库。

在一可选实现方式中,步骤S26的实现方式包括以下步骤D1至步骤D2。

步骤D1:基于所述第一知识点与所述关键词的相关度以及所述第二知识点与所述关键词和所述目标关键词的相关度,对所述第一知识点与所述第二知识点进行排序,得到排序结果。

步骤D2:发送所述排序结果至所述客户端。

示例性的,从原始知识库得到的第一知识点的数目可以为一个或多个;从热点知识库中得到的第二知识点的数目可以为一个或多个。

从原始知识库中得到的第一知识点和从热点知识库得到的第二知识点可能具有相同的知识点,或,从原始知识库中得到的第一知识点和从热点知识库得到的第二知识点完全不同。

若从原始知识库中得到的第一知识点和从热点知识库得到的第二知识点具有相同的知识点,且相同的知识点为目标知识点,假设,目标知识点与关键词的相关度为第一相关度,目标知识点与查询条件的相关度为第二相关度,那么,目标知识点的最终相关度=max{第一相关度,第二相关度},或者,目标知识点的最终相关度=min{第一相关度,第二相关度},或者,目标知识点的最终相关度=第一相关度,或者,目标知识点的最终相关度=第二相关度,或者,目标知识点的最终相关度=权重1*第一相关度+权重2*第二相关度;权重1和权重2可以预先设置。

若从原始知识库中得到的第一知识点和从热点知识库得到的第二知识点具有不同的知识点,对于原始知识库包含但热点知识库不包含的知识点而言,该知识点的最终相关度即为该知识点与关键词的相关度;对于热点知识库包含但原始知识库不包含的知识点而言,该知识点的最终相关度即为该知识点与查询条件的相关度。

在步骤D1进行排序时,基于各知识点的最终相关度进行排序。

下面对知识点进行介绍。

在一可选实现方式中,知识点包括知识正文、所述知识正文位于源文档的位置、第一标识以及第二标识;所述第一标识为所述源文档中位于所述知识正文的前一知识正文对应的知识点的标识;所述第二标识为所述源文档中位于所述知识正文的下一知识正文对应的知识点的标识;所述源文档被拆分为多个知识正文。

本申请实施例中的知识点的结构与相关技术中知识点的结构不同。

示例性的,知识点的表示方式有多种,本申请实施例提供但不限于:链表、数组、结构体、表格中任一种。下面以表格为例对知识点的结构进行举例说明。示例性的,本申请实施例中知识点的结构如表2所示。

表2本申请实施例中知识点的结构

示例性的,知识点的标识,例如,第一标识和第二标识的表示方式有多种,例如,用字母、数字、特殊符号中的一个或多个进行表示,表2中是以第一标识和第二标识用数字表示为例进行说明。

示例性的,知识点的标识可以是随机分配的,不同知识点的标识不同;示例性的,知识点的标识与知识点包含的知识正文在源文档的位置有关。

例如,源文档包含的第3段落、第4段落和第5段落分别对应一个知识点,表2所示的知识点对应源文档包含的第4段落,所以“在源文档位置”为4;示例性的,源文档上下文索引包括第一标识以及第二标识,如表2中,第一标识为3,第二标识为5。

示例性的,知识点可以包括一个或多个第一标识。若知识点包括一个第一标识,示例性的,第一标识为源文档中位于知识点包含的知识正文的任一前一知识正文对应的知识点的标识。以源文档包含的每一段落分别对应一个知识点为例进行说明,若知识点A对应源文档的第1段、知识点B对应源文档的第2段、知识点C对应源文档的第3段、知识点D对应源文档的第4段、知识点E对应源文档的第5段,那么,知识点C包含的第一标识可以为知识点B的标识或知识点A的标识。示例性的,第一标识为源文档中位于知识点包含的知识正文的相邻的前一知识正文对应的知识点的标识。例如,知识点C包含的第一标识为知识点B的标识。

若知识点E包括多个第一标识,则具有多个第一标识的知识点包含的知识正文在源文档的位置是相邻的,且,与知识点E包含的知识正文相邻;例如,知识点E包含的多个第一标识分别为:知识点D的标识、知识点C的标识。

若知识点E包括多个第一标识,则具有多个第一标识的知识点包含的知识正文在源文档的位置可以不相邻,例如,知识点E包含的多个第一标识分别为:知识点C的标识以及知识点A的标识。

示例性的,知识点包含的第二标识的数目可以为一个或多个。对于第二标识的说明可以参见第一标识,这里不再赘述。

示例性的,知识点还包括:源文档的标识ID、源文档名称中至少一个。

综上,本申请实施例提供的知识点包含源文档上下文索引(即第一知识点和第二知识点),使得来源于同一源文档的多个知识点具有关联关系。

在一可选实现方式中,若用户在查询过程中,可以基于查询语句得到查询结果,客户端可以显示查询结果包含的知识点的链接;服务器响应于点击某个知识点的链接的操作,获取所述知识点包含的第一标识以及第二标识;发送所述知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文至所述客户端;即客户端在显示时不仅显示知识点包含的知识正文,还会显示具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文,所以若用户还具有查看知识点包含的知识正文的上一知识正文或下一知识正文的需求,则无需再次进行检索,减少了用户的检索次数,降低了检索的复杂度,使得用户检索速度更快。

示例性的,基于所述知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文生成一个文档,并将该文档发送至客户端。

知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文都是来源于同一源文档,示例性的,属于同一源文档的不同知识正文可能具有逻辑顺序关联,逻辑顺序关联为用户浏览知识正文的顺序。例如,从源文档拆分得到6个知识点,其中,基于6个知识点包含的知识正文在源文档中的位置依次为:知识1、知识点2、知识点3、知识点4、知识点5、知识点6;知识1、知识点2、知识点3、知识点4、知识点5、知识点6分别包含的知识正文依次为:住房公积金贷款介绍、住房公积金申请流程、住房公积金贷款担保、住房公积金贷款审批、住房公积金贷款发放、住房公积金贷款查询。即6个知识点包含的知识正文在语义上是相关联的。

示例性的,包含所述知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文的文档中各知识点的知识正文是按照逻辑顺序关联排序的。

在一可选实现方式中,知识点还包括关联知识点的关联标识。知识点包含的关联知识点的关联标识的数目可以为一个或多个。

本申请实施例中,对于任一知识点,将与知识点的相关度较高,且包含的知识正文和该知识点包含的知识正文不属于同一源文档的知识点称为关联知识点。具体得到关联知识点的第关联标识的步骤包括:对于每一知识点,获得与所述知识点相关度大于或等于第四阈值的关联知识点,所述关联知识点包含的知识正文与所述知识点包含的知识正文属于不同源文档。其中,所述知识点包括所述关联知识点的关联标识。

示例性的,第四阈值可以基于实际情况而定,这里不进行限定。

上述本申请公开的实施例中详细描述了方法,对于本申请的方法可采用多种形式的装置实现,因此本申请还公开了一种装置,下面给出具体的实施例进行详细说明。

如图3所示,为本申请实施例提供的知识点查询装置的结构图,该装置可以包括:第一接收模块31、第一获取模块32、第二获取模块33、第三获取模块34、第四获取模块35以及发送模块36,其中:

第一接收模块31,用于接收来自客户端的第一查询语句;

第一获取模块32,用于从所述第一查询语句中获得关键词;

第二获取模块33,用于从热点词库中获得与所述关键词的相关度大于或等于第一阈值的目标热搜词,所述热点词库包括多个热搜词,所述多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,所述目标用户账号与登陆所述客户端的用户账号具有关联关系;

第三获取模块34,用于从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点;

第四获取模块35,用于从热点知识库中获得与查询条件的相关度大于或等于第二阈值的第二知识点;所述热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,所述查询条件包括所述关键词和所述目标热搜词,或,所述查询条件包括所述目标热搜词;

发送模块36,用于发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

在一可选实现方式中,还包括:

第四获取模块,用于获取与登陆所述客户端的用户账号具有关联关系的多个目标用户账号;

第五获取模块,用于对于每一所述目标用户账号,获取具有所述目标用户账号的用户在预设时间段内输入的所述第二查询语句;

第一确定模块,用于将多个所述目标用户账号分别对应的第二查询语句中,出现频率大于或等于第三阈值的关键词确定为所述热搜词。

在一可选实现方式中,还包括:

第六获取模块,用于从多个所述目标用户账号分别对应的第二查询语句的命中知识点中,获得包含热搜词的第二查询语句对应的命中知识点;

存储模块,用于将包含热搜词的第二查询语句对应的命中结果存储至所述热点知识库。

在一可选实现方式中,还包括:

第六获取模块,用于从多个所述目标用户账号分别对应的第二查询语句的命中知识点中,获得包含热搜词的第二查询语句对应的命中知识点;

存储模块,用于将包含热搜词的第二查询语句对应的命中结果存储至所述热点知识库。

在一可选实现方式中,还包括:

第七获取模块,用于获取所述第二查询语句对应的查询结果,所述查询结果包括一个或多个知识点的链接;

第二确定模块,用于将所述查询结果中被点击链接的知识点或浏览时长大于或等于预设时长的知识点确定为所述命中知识点。

在一可选实现方式中,发送模块包括:

排序单元,用于基于所述第一知识点与所述关键词的相关度以及所述第二知识点与所述查询条件的相关度,对所述第一知识点与所述第二知识点进行排序,得到排序结果;

发送单元,用于发送所述排序结果至所述客户端。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种用于服务器的装置的框图。

服务器包括但不限于:处理器41、存储器42、网络接口43、I/O控制器44以及通信总线45。

需要说明的是,本领域技术人员可以理解,图4中示出的服务器的结构并不构成对服务器的限定,服务器可以包括比图4所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图4对服务器的各个构成部件进行具体的介绍:

处理器41是服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器42内的软件程序和/或模块,以及调用存储在存储器42内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。处理器41可包括一个或多个处理单元;示例性的,处理器41可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器41中。

处理器41可能是一个中央处理器(CentralProcessing Unit,CPU),或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;

存储器42可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM)421和只读存储器(Read-Only Memory,ROM)422,也可能还包括大容量存储设备423,例如至少1个磁盘存储器等。当然,该服务器还可能包括其他业务所需要的硬件。

其中,上述的存储器42,用于存储上述处理器41可执行指令。上述处理器41具有以下功能:接收来自客户端的第一查询语句;

从所述第一查询语句中获得关键词;

从热点词库中获得与所述关键词的相关度大于或等于第一阈值的目标热搜词,所述热点词库包括多个热搜词,所述多个热搜词是基于具有目标用户账号的用户在设定时间段内输入的第二查询语句包含的关键词得到的,所述目标用户账号与登陆所述客户端的用户账号具有关联关系;

从原始知识库中获得与所述关键词的相关度大于或等于第二阈值的第一知识点;

从所述热点知识库中获得与查询条件的相关度大于或等于第二阈值的第二知识点;所述热点知识库包括包含所述热搜词的所述第二查询语句对应的命中知识点,所述查询条件包括所述关键词和所述目标热搜词,或,所述查询条件包括所述目标热搜词;

发送所述第一知识点的链接以及所述第二知识点的链接至所述客户端。

处理器41、存储器42、网络接口43和I/O控制器44可以通过通信总线45相互连接,该通信总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。

在示例性实施例中,服务器可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述知识点查询方法。

在示例性实施例中,本公开实施例提供了一种包括指令的存储介质,例如包括指令的存储器42,上述指令可由服务器的处理器41执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机可读存储介质,可直接加载到计算机的内部存储器,例如上述存储器42中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述知识点查询方法任一实施例所示步骤。

在示例性实施例中,还提供一种计算机程序产品,可直接加载到计算机的内部存储器,例如所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述所述的知识点查询方法任一实施例所示步骤。

需要说明的是,本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 知识点查询方法、装置、服务器、介质及产品
  • 知识点的监控管理方法、装置、服务器、介质及产品
技术分类

06120113195401