掌桥专利:专业的专利平台
掌桥专利
首页

知识点之间的关联关系获取方法及装置

文献发布时间:2023-06-19 12:22:51


知识点之间的关联关系获取方法及装置

技术领域

本申请涉及数据库技术领域,更具体的说,是涉及知识点之间的关联关系获取方法及装置。

背景技术

可以基于用户输入的查询语句从知识库中搜索与查询语句相匹配的知识点;目前可能需要用户多次检索,即多次输入不同的查询语句才能够从知识库中搜索得到用户需要的多个知识点。

在申请人实现本发明创造性的过程中发现,由于知识库中各知识点比较孤立,导致用户从知识库中检索得到自己需要的多个知识点的时间较长,基于此,如何使得知识库包含的知识点之间不孤立是本领域技术人员急需解决的难题。

发明内容

有鉴于此,本申请提供了一种知识点之间的关联关系获取方法及装置。

本申请提供如下技术方案:

根据本公开实施例的第一方面,提供一种知识点之间的关联关系获取方法,包括:

获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点;

从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点;

从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句;

构建所述多个知识点之间的关联关系。

根据本公开实施例的第二方面,提供一种知识点之间的关联关系获取装置,包括:

第一获取模块,用于获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点;

第二获取模块,用于从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点;

第三获取模块,用于从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句;

构建模块,用于构建所述多个知识点之间的关联关系。

根据本公开实施例的第三方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的知识点查询方法。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面所述的知识点之间的关联关系获取方法。

根据本公开实施例的第五方面,提供一种计算机程序产品,可直接加载到计算机的内部存储器,例如上述第三方面所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现如第一方面所述的知识点之间的关联关系获取方法。

经由上述的技术方案可知,本申请提供的知识点之间的关联关系获取方法中,获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点;从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点;从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句;构建所述多个知识点之间的关联关系。从而建立了多个知识点之间的关联关系,使得知识点之间不再孤立。从而在用户查询过程中,若命中某个知识点,则可以展示与该知识点具有所述关联关系的知识点的链接,若用户需要查看与该知识点具有所述关联关系的知识点,则可以直接点击相应的链接,无需再次检索,所以减少用户的检索次数,降低检索时长以及检索的复杂度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例涉及的硬件架构的结构图;

图2为本申请实施例提供的知识点之间的关联关系获取方法的流程图;

图3为本申请实施例提供的显示知识正文的界面和显示问答区域的界面的关系示意图;

图4为本申请实施例提供的知识点之间的关联关系获取装置的结构图;

图5是根据一示例性实施例示出的一种用于服务器的装置的框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例提供了一种知识点之间的关联关系获取方法以及装置,在对本申请实施例提供的技术方案进行介绍之前,先对本申请实施例涉及的相关技术以及硬件架构进行说明。

首先,对本申请实施例涉及的相关技术进行介绍。

相关技术中,知识库包括多个知识点。

示例性的,多个知识点是通过拆分源文档得到的。不同知识点对应的源文档可能相同可能不同。

例如,源文档包括10个段落,示例性的,源文本被拆分为10个知识点,即每一个段落对应一个知识点;示例性的,源文档本拆分为5个知识点,一个知识点包括源文档中的一个或多个段落;示例性的,源文档被拆分为20个知识点,一个知识点包括一个段落中的一个或多个语句。

示例性的,知识点包括源文档;示例性的,知识点是基于其他知识点得到的。

示例性的,知识点的表示方式有多种,本申请实施例提供但不限于:链表、数组、结构体、表格中任一种。下面以表格为例对知识点的结构进行举例说明。

示例性的,相关技术中知识点的结构如表1所示。

表1相关技术中知识点的结构

示例性的,知识正文包括知识标题以及知识内容中任一个;示例性的,知识内容与知识标题相对应,例如,与知识标题“中银富登个人通知存款的存款期限”对应的知识内容可以为:个人通知存款不论实际存期多长,按存款人提前通知的期限长短划分为1天通知存款和7天通知存款两个品种。1天通知存款必须提前1天通知约定支取存款,7天通知存款则必须提前7天通知约定支取存款。1天通知存款和7天通知存款,客户必须提前1天或提前7天来到柜台预约支取登记。所谓转存是系统可以自动在到期日将本息转到客户的活期账户,但需要客户在每个周期(7天)都来柜台办理约定转存的业务。

示例性的,知识点包含的业务目录可以包括一级或多级目录,表1中是以业务目录包括两级目录为例进行说明的。

示例性的,知识点包含的业务目录用于指示知识点包含的知识正文的存储路径。示例性的,知识点包含的业务目录即为存储知识点的存储设备的名称和/或文件夹的名称。

示例性的,知识标题,可以是基于自然语言处理技术从知识内容文中得到的;示例性的,知识标题可以是从源文档中获得的。

示例性的,知识点包含的图谱标签是指知识正文的属性信息。示例性的,图谱标签包括:产品(知识正文的内容描述的产品)、所属银行(知识正文的内容针对哪个分行或哪个总行)、客户类型。示例性的,客户类型包括但不限于:个人客户、财富管理客户、普通客户、私人银行客户、中银理财客户等等。

示例性的,知识点包含的个性标签是由人工坐席添加的,人工坐席可以基于自己的对知识点的理解,对知识点进行标注,例如,表1中具有人工坐席的标识A的人工坐席标注了“富登特色定期存款”,下次具有人工坐席的标识A的人工坐席可以基于查询语句“富登特色定期存款”准确的搜索到表1所示的知识点。

需要说明的是,有时候人工坐席在查询的时候查询到所需的知识点,但是人工坐席对该知识点有一些自己的理解,或者对知识点有自己的称谓习惯,那么人工坐席可以人为将自己的理解添加到该知识点的个性标签中。这样就可以照顾到不同人工坐席的思维习惯,丰富知识的标注,从而加快知识查询的效率以及提升知识查询的准确率。

示例性的,对于同一知识点,不同人工坐席标注的个性标签可能不同,可能相同;由于人工坐席在搜索知识点之前,需要进行登陆,所以人工坐席的查询语句包括人工坐席的标识,因此,在通过个性标签检索知识点的过程中,不会受到其他人工坐席标注的个性标签的影响。

示例性的,知识点包含的管理属性是指管理该知识点的管理员的信息,例如,管理属性包括管理员所属部门以及管理员所属用户组。

表1中的知识点的结构仅为示例,并不对知识点的结构造成限定,例如,知识点可以包括:业务目录、知识正文、图谱标签、个性标签、管理属性中一个或多个字段。

示例性的,知识点还包括接收组,接收组包括能够查询得到该知识点的用户的标识。

相关技术中,查询语句中的关键词可以包括属于业务目录、知识正文、图谱标签、个性标签、管理属性中一个或多个字段的关键词。在从知识库中检索与查询语句相关度大于或等于第三阈值的知识点的过程中,可以获得查询语句与知识点包含的业务目录、知识正文、图谱标签、个性标签、管理属性中一个或多个的相关度,以得到与查询语句相关度大于或等于第三阈值的知识点,使得客户端可以展示与查询语句相关度大于或等于第三阈值的知识点的链接。

用户若需要查看某个知识点,则点击相应知识点的链接,从而可以展示该知识点包含的知识正文。但是若用户需要查看与该知识点具有关联关系的其他知识点,则需要再次进行检索,导致检索次数较多,检索时间较长。

其次,对本申请实施例涉及的硬件架构进行说明。

如图1所示,为本申请实施例涉及的硬件架构的结构图,该硬件架构包括:电子设备11、服务器12以及知识库13。

示例性的,电子设备11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、笔记本电脑、平板电脑、掌上电脑、个人计算机、可穿戴设备、智能电视、PAD等。

示例性的,服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务器中心。服务器12可以包括处理器、存储器以及网络接口等。

应注意的是,图1仅仅是一种示例,电子设备的类型可以有多种,不限于图1中的计算机。

示例性的,电子设备11可以通过无线网络或有线网络与服务器12建立连接并通信。

示例性的,知识库13可以通过无线网络或有线网络与服务器12建立连接并通信。

示例性的,用户可以通过电子设备11输入查询语句。电子设备11可以将查询语句发送至服务器12。电子设备11可以显示服务器12反馈的查询结果。用户可以通过电子设备11对查询结果中的知识点的链接进行操作,例如,点击操作;电子设备11可以显示服务器12反馈的响应知识点的链接点击操作,反馈的该知识点的知识正文。用户可以通过电子设备11浏览该知识点包含的知识正文。

综上,服务器12可以获得多个用户分别对应的查询语句、多个查询语句的查询时间、多个查询语句对应的查询结果以及用户对查询结果中知识点的操作。

示例性的,用户可以为人工坐席或客户。

示例性的,用户可以通过电子设备11展示的客户端的用户界面输入查询语句,该客户端可以为应用程序客户端或网页版客户端。

服务器12用于执行本申请实施例提供的知识点之间的关联关系获取方法,并与知识库13进行交互。

示例性的,存储知识点的知识库13可以位于服务器12,或者,知识库13独立于服务器12。

本领域技术人员应能理解上述电子设备和服务器仅为举例,其他现有的或今后可能出现的电子设备或服务器如可适用于本公开,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

下面结合硬件架构以及相关技术对本申请实施例提供的知识点之间的关联关系获取方法进行说明。

如图2所示,为本申请实施例提供的知识点之间的关联关系获取方法的流程图,该方法可以应用于图1所示的服务器中,该方法在实施过程中包括步骤S21至步骤S24。

步骤S21:获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点。

示例性的,查询结果可以包括一个或多个知识点的链接;“查询结果中满足预设条件的知识点”中预设条件可以包括以下至少一个:该知识点的链接被用户点击、该知识点的知识正文被用户浏览的时长大于或等于阈值A、该知识点的链接被打开的次数大于或等于阈值B。

下面以预设条件为该知识点的链接被用户点击为例进行说明。例如,查询语句为公积金申请流程,若查询结果包括:住房公积金贷款介绍的链接、住房公积金申请流程的链接、住房公积金贷款担保的链接、住房公积金贷款审批的链接、住房公积金贷款发放的链接、住房公积金贷款查询的链接,若用户点击了住房公积金申请流程的链接,则知识点“住房公积金申请流程”满足预设条件,若用户未点击其他知识点的链接,则其他知识点不满足预设条件。

示例性的,对于同一查询语句而言,该查询语句对应的查询结果中满足预设条件的知识点的数目可能为一个或多个。

步骤S22:从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点。

示例性的,用户在进行查询之前需要进行登陆,用户标识可以为用户账号。示例性的,用户在进行查询之前若未进行登陆,用户标识可以为用户使用的电子设备的设备标识。

步骤S22的实现方式有多种,本申请实施例提供但不限于以下两种。

第一种步骤S22的实现方式包括以下步骤A11至步骤A12。

步骤A11:从查询日志中获得多个用户标识分别对应的查询语句以及查询语句对应的知识点。

步骤A12:将对应同一用户标识的查询语句对应的知识点划分至同一查询组合。

示例性的,若从查询日志中获得以下内容:用户标识1、用户标识1输入的查询语句A、用户标识1输入的查询语句B、查询语句A对应的知识点A1以及知识点A2、查询语句B对应的知识点B1;用户标识2、用户标识2输入的查询语句C、用户标识2输入的查询语句D、查询语句C对应的知识点C1、查询语句D对应的知识点D1。那么,可以得到两个查询组合,分别为:{用户标识1、查询语句A对应的知识点A1、查询语句A对应的知识点A2、查询语句B对应的知识点B1},{用户标识2、查询语句C对应的知识点C1、查询语句D对应的知识点D1}。

第二种步骤S22的实现方式包括以下步骤A21至步骤A22。

步骤A21:对于任一用户标识,从所述查询日志中获得具有所述用户标识的用户输入的多个查询语句的查询时间。

在一可选实现方式中,可以从查询日志获得具有所述用户标识的用户输入的所有查询语句的查询时间。

在一可选实现方式中,由于用户的查询需求在不断发生变化,因此,对于任一用户标识,步骤A21可以从查询日志中获得在预设时间段内具有所述用户标识的用户输入的多个查询语句的查询时间。

示例性的,预设时间段的终止时间为当前时间,起始时间为当前时间+预设时间段。随着时间的流逝,预设时间段的终止时间和起始时间在不断发生变化。

步骤A22:将查询时间的差值小于或等于设定时间的多个查询语句分别对应的知识点划分至同一查询组合。

示例性的,同一用户标识对应的查询组合的数目可以为一个或多个。

示例性的,设定时间可以基于实际情况而定,这里不进行限定。

示例性的,若从查询日志中获得以下内容:用户标识1、用户标识1在查询时间1输入的查询语句A、用户标识1在查询时间2输入的查询语句B、查询语句A对应的知识点A1以及知识点A2、查询语句B对应的知识点B1;用户标识2、用户标识2在查询时间3输入的查询语句C、用户标识2在查询时间4输入的查询语句D、用户标识2在查询时间5输入的查询语句E、查询语句C对应的知识点C1、查询语句D对应的知识点D1、查询语句E对应知识点E1。

若查询时间1与查询时间2的差值小于或等于设定时间,则可以将查询语句A对应的知识点A1、查询语句A对应的知识点A2、查询语句B对应的知识点B1划分至同一查询组合,例如,得到查询组合{用户标识1、查询语句A对应的知识点A1、查询语句A对应的知识点A2、查询语句B对应的知识点B1}。若查询时间3早于查询时间4早于查询时间5,且查询时间3与查询时间4的差值大于设定时间,但是查询时间4与查询时间5的差值小于或等于设定时间,则可以将查询语句D对应的知识点D1、查询语句E对应知识点E1划分至同一查询组合,例如,得到查询组合{用户标识2、查询语句D对应的知识点D1、询语句E对应知识点E1}。

由于查询组合至少包括两个查询语句分别对应的知识点,所以查询语句C对应的知识点C1自己不能组成一个查询组合。

可以理解的是,若两个查询语句的查询时间间隔越小,说明两个查询语句之间的关联性可能越大,基于此,本申请实施例中,将查询时间的差值小于或等于设定时间的多个查询语句分别对应的知识点划分至同一查询组合。

步骤S23:从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句。

在一可选实现方式中,共现频率=包含所述多个知识点的查询组合的数目/所有查询组合的数目。

例如,步骤S22从查询日志中获得10万个查询组合,其中,有8万个查询组合都包括知识点A和知识点B,则知识点A和知识点B的共现频率=8万/10万。

在一可选实现方式中,共现频率=包含所述多个知识点的查询组合对应的用户标识的数目/所有查询组合对应的用户标识的数目。

例如,步骤S22从查询日志中获得10万个查询组合,10万个查询组合对应9万个用户标识,即有的用户标识对应多个查询组合,其中,有8万个查询组合都包括知识点A和知识点B,这8万个查询组合对应7万个用户标识,则知识点A和知识点B的共现频率=7万/9万。

步骤S24:构建所述多个知识点之间的关联关系。

在一可选实现方式中,多个知识点之间的关联关系没有顺序,例如,知识点A、知识点B以及知识点C之间具有关联关系,那么,与知识点A具有关联关系知识点的为知识点B和知识点C。与知识点B具有关联关系的知识点为知识点A和知识点C。

在一可选实现方式中,多个知识点之间的关联关系具有顺序,确定此关联关系的过程包括步骤B11至步骤B12。

步骤B11:基于多个查询组合中所述多个知识点分别对应的查询语句的查询时间,确定表征用户需要查看所述多个知识点的查看顺序。

示例性的,对于每一查询组合,将所述查询组合包含的所述多个知识点按照知识点对应的查询语句的查询时间由早到晚排序,得到该查询组合对应的所述多个知识点的排序顺序。

示例性的,若所述多个知识点分别为知识点A、知识点B以及知识点C,若一个查询组合包含的知识点A对应的查询语句的查询时间为时间1、知识点B对应的查询语句的查询时间为时间2、知识点C对应的查询语句的查询时间为时间3,且,时间1晚于时间2晚于时间3,则知识点A、知识点B以及知识点C的排序顺序为:知识点C、知识点B、知识点A。

可以理解的是,各查询组合对应的所述多个知识点的排序顺序可能不同,可能相同。若各查询组合对应的所述多个知识点的排序顺序相同,则查看顺序即为排序顺序。若各查询组合对应的所述多个知识点的排序顺序不完全相同,但大量查询组合对应的所述多个知识点的排序顺序相同,则以大量查询组合对应的所述多个知识点的排序顺序为查看顺序为准。

步骤B12:基于所述查看顺序,建立所述多个知识点的关联关系。

例如,若具有关联关系的多个知识点分别为:知识点A、知识点B以及知识点C,三个知识点的查看顺序依次为:知识点C、知识点B、知识点A。那么,与知识点C具有关联关系的知识点依次为:知识点B、知识点A;与知识点B具有关联关系的知识点依次为:知识点C、知识点A;与知识点A具有关联关系的知识点依次为:知识点C、知识点B。

本申请实施例提供的知识点之间的关联关系获取方法中,获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点;从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点;从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句;构建所述多个知识点之间的关联关系。从而建立了多个知识点之间的关联关系,使得知识点之间不再孤立。从而在用户查询过程中,若命中某个知识点,则可以展示与该知识点具有所述关联关系的知识点的链接,若用户需要查看与该知识点具有所述关联关系的知识点,则可以直接点击相应的链接,无需再次检索,所以减少用户的检索次数,降低检索时长以及检索的复杂度。

在一可选实现方式中,知识点包括知识正文、所述知识正文位于源文档的位置、第一标识以及第二标识;所述第一标识为所述源文档中位于所述知识正文的前一知识正文对应的知识点的标识;所述第二标识为所述源文档中位于所述知识正文的下一知识正文对应的知识点的标识;所述源文档被拆分为多个知识正文。所述知识点之间的关联关系获取方法还包括:对于任一所述知识点,将与所述知识点具有所述关联关系的知识点的第一关联标识添加至所述知识点;具有所述第一关联标识的知识点包含的知识正文与所述知识点包含的知识正文属于不同源文档。

本申请实施例中,对于每一知识点而言,与该知识点具有所述关联关系的知识点的标识称为第一关联标识。

本申请实施例中的知识点的结构与相关技术中知识点的结构不同。

示例性的,知识点的表示方式有多种,本申请实施例提供但不限于:链表、数组、结构体、表格中任一种。下面以表格为例对知识点的结构进行举例说明。示例性的,本申请实施例中知识点的结构如表2所示。

表2本申请实施例中知识点的结构

示例性的,知识点的标识,例如,第一标识和第二标识的表示方式有多种,例如,用字母、数字、特殊符号中的一个或多个进行表示,表2中是以第一标识和第二标识用数字表示为例进行说明。

示例性的,知识点的标识可以是随机分配的,不同知识点的标识不同;示例性的,知识点的标识与知识点包含的知识正文在源文档的位置有关。

例如,源文档包含的第3段落、第4段落和第5段落分别对应一个知识点,表2所示的知识点对应源文档包含的第4段落,所以“在源文档位置”为4;示例性的,源文档上下文索引包括第一标识以及第二标识,如表2中,第一标识为3,第二标识为5。

示例性的,知识点可以包括一个或多个第一标识。若知识点包括一个第一标识,示例性的,第一标识为源文档中位于知识点包含的知识正文的任一前一知识正文对应的知识点的标识。以源文档包含的每一段落分别对应一个知识点为例进行说明,若知识点A对应源文档的第1段、知识点B对应源文档的第2段、知识点C对应源文档的第3段、知识点D对应源文档的第4段、知识点E对应源文档的第5段,那么,知识点C包含的第一标识可以为知识点B的标识或知识点A的标识。示例性的,第一标识为源文档中位于知识点包含的知识正文的相邻的前一知识正文对应的知识点的标识。例如,知识点C包含的第一标识为知识点B的标识。

若知识点E包括多个第一标识,则具有多个第一标识的知识点包含的知识正文在源文档的位置是相邻的,且,与知识点E包含的知识正文相邻;例如,知识点E包含的多个第一标识分别为:知识点D的标识、知识点C的标识。

若知识点E包括多个第一标识,则具有多个第一标识的知识点包含的知识正文在源文档的位置可以不相邻,例如,知识点E包含的多个第一标识分别为:知识点C的标识以及知识点A的标识。

示例性的,知识点包含的第二标识的数目可以为一个或多个。对于第二标识的说明可以参见第一标识,这里不再赘述。

示例性的,知识点还包括:源文档的标识ID、源文档名称中至少一个。

综上,本申请实施例提供的知识点包含源文档上下文索引(即第一标识以及第二标识),使得来源于同一源文档的多个知识点具有关联。本申请实施例提供的知识点包含关联关系标识ID,使得来源于不同源文档的多个知识点具有关联。

示例性的,知识点包含的第一关联标识的数目可以为一个或多个。示例性的,若知识点包含的第一关联标识的数目为多个,若关联关系是基于查看顺序得到的,示例性的,知识点包括的多个第一关联标识是按照查看顺序依次存储的。如表2所示查看顺序依次为:具有第一关联标识1的知识点、具有第一关联标识2的知识点、具有第一关联标识3的知识点。

在一可选实现方式中,用户在查询过程中,可以基于查询语句得到查询结果,则客户端可以显示查询结果包含的知识点的链接;服务器响应于点击知识点A的链接的操作,获取所述知识点A包含的第一标识以及第二标识;将所述知识点A包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文发送至客户端。使得客户端在显示时不仅显示知识点A包含的知识正文,还会显示具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文,所以若用户还具有查看知识点A包含的知识正文的上一知识正文或下一知识正文的需求,则仅无需再次进行检索,减少了检索次数,降低了检索时间,降低了检索的复杂度,使得用户检索速度更快。

示例性的,基于所述知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文生成一个文档,并将该文档发送至客户端。

知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文都是来源于同一源文档,示例性的,属于同一源文档的不同知识正文可能具有逻辑顺序关联,逻辑顺序关联为用户浏览知识正文的顺序。例如,从源文档拆分得到6个知识点,其中,基于6个知识点包含的知识正文在源文档中的位置依次为:知识1、知识点2、知识点3、知识点4、知识点5、知识点6;知识1、知识点2、知识点3、知识点4、知识点5、知识点6分别包含的知识正文依次为:住房公积金贷款介绍、住房公积金申请流程、住房公积金贷款担保、住房公积金贷款审批、住房公积金贷款发放、住房公积金贷款查询。即6个知识点包含的知识正文在语义上是相关联的。

示例性的,包含所述知识点包含的知识正文、具有所述第一标识的知识点包含的知识正文以及具有所述第二标识的知识点包含的知识正文的文档中各知识点的知识正文是按照逻辑顺序关联排序的。

用户可能需要依次查看知识点1包含的“住房公积金贷款介绍”、知识点2包含的“住房公积金申请流程”、知识点3包含的“住房公积金贷款担保”。通过本申请实施例可以仅检索一次,得到知识点2后,即可查看上述3个知识点包含的知识正文。若通过相关技术,则需要检索3次才能够查看到上述3个知识点包含的知识正文。

下面对获取知识库存储的知识点的过程进行说明。获取知识点的过程包括以下步骤C11至步骤C13。

步骤C11:拆分所述源文档得到多个知识正文。

示例性的,源文档可以是各种格式的文件,例如可以是txt文件、word文件、PPT文件、excel文件等。

拆分源文档的方式有多种,本申请实施例提供但不限于以下两种。

第一种步骤C11的实现方式包括:根据知识拆分模板从源文档中获得多个知识正文。

示例性的,知识拆分模板可以根据需求预先设置。不同类型的知识正文对应的知识拆分模板不同,以提高知识点的获取效率,得到知识库。

示例性的,知识拆分模板的表现形式可以为数组、表格、链表等,示例性的,知识拆分模板包括表2所示的业务目录、知识正文、在源文档的位置、源文档标识ID、源文档上下文索引、图谱标签、个性标签、管理属性中一个或多个字段。示例性的,知识拆分模板还包含提取规则。

示例性的,提取规则可以基于源文档的结构设置,例如,源文档包括的内容已被设置大纲级别,提取规则可以为将大纲级别为正文文本的内容确定为知识内容,将位于知识内容前面且大纲级别为非正文内容(例如大纲级别为1级、2级或3级)的内容作为知识标题。

示例性的,知识点包含的业务目录可以与源文档的业务目录相同。

知识维护员和生产者通过知识调查、知识盘点的方式提出和建立知识需求,便于生产者按照知识拆分模板生产创建知识点。

示例性的,本申请实施例将大纲级别为非正文文本的内容称为标题。将大纲级别为正文文本的内容称为知识内容。

第二种步骤C11的实现方式包括:基于自然语言处理技术,拆分所述源文档得到多个知识正文。

示例性的,计算源文档中多个段落之间的相关度,将相关度大于或等于阈值A的段落确定为一个知识正文;将相关度小于阈值A的不同段落确定为不同知识正文。

示例性的,计算源文档中多个语句之间的相关度,将相关度大于或等于阈值A的语句确定为一个知识正文;将相关度小于阈值A的不同语句确定为不同知识正文。

步骤C12:为所述多个知识正文分配标识。

示例性的,可以随机为知识正文分配标识,该标识即为包含该知识正文的知识点的标识。

示例性的,可以基于知识正文位于源文档的位置,确定包含该知识正文的知识点的标识。

步骤C13:基于所述多个知识正文在所述源文档的位置,确定所述多个知识正文分别对应的所述第一标识以及所述第二标识,以形成所述多个知识正文分别对应的知识点。

在一可选实现方式中,知识点还包括关联知识点的第二关联标识。知识点包含的关联知识点的第二关联标识的数目可以为一个或多个。

本申请实施例中,对于任一知识点,将与知识点的相关度较高,且包含的知识正文和该知识点包含的知识正文不属于同一源文档的知识点称为关联知识点。具体得到关联知识点的第二关联标识的步骤包括:对于每一知识点,获得与所述知识点相关度大于或等于第二阈值的关联知识点,所述关联知识点包含的知识正文与所述知识点包含的知识正文属于不同源文档。其中,所述知识点包括所述关联知识点的第二关联标识。

示例性的,第二阈值可以基于实际情况而定,这里不进行限定。

在一可选实现方式中,还包括构建知识点和FAQ(Frequently Asked Questions,常见问题回答)的对应关系。建立的过程包括步骤D11至步骤D12。

步骤D11:对于每一所述知识点,从所述知识点包括的知识正文中获得问答对,所述问答对包括问题和所述问题对应的答案,所述问答对包含的答案属于所述知识正文。

示例性的,知识正文可以包括问题以及问题对应的答案。

示例性的,知识正文包含的问题具有预设符号,例如,“?”,因此可以基于预设符号从知识正文中得到问题;示例性的,可以从知识正文中筛选出与问题相匹配的语句或段落作为答案。

示例性的,知识正文可以包括答案,不包括问题;示例性的,可以提前设置问题集合,问题集合包括多个问题,从知识正文中获得问题集合包含的问题的答案。

示例性的,将问题和答案组成问答对。

步骤D12:构建所述知识点与所述问答对的对应关系。

综上,示例性的,本申请实施例中提及的知识库包含的知识点包括:业务目录、知识正文、在源文档位置、源文档标识ID、源文档上下文索引、关联关系标识ID、关联知识点ID(即第二关联标识)、图谱标签、个性标签、记忆标签、管理属性中的至少一个。使得知识库中各个知识点之间不再是孤立的,而是通过源文档上下文索引、关联关系标识ID、关联知识点ID中的一个或多个建立了关联,所以在对知识库中存储的知识点进行查询时可以缩短查询时间,降低检索次数。

下面对基于上述知识库查询知识点的过程进行说明。知识点查询方法包括以下步骤E11至步骤E14。

步骤E11:接收来自客户端的查询语句。

步骤E12:从知识库中获得与所述查询语句的相关度大于或等于第三阈值的多个目标知识点。

步骤E13:发送所述多个目标知识点分别对应的链接至所述客户端。

示例性的,客户端可以展示多个目标知识点分别对应的链接;用户可以对客户端展示的多个目标知识点分别对应的链接进行操作,例如点击操作。

步骤E14:响应于所述客户端反馈的点击所述多个目标知识点中第一目标知识点的链接的操作,发送所述第一目标知识点包含的知识正文以及与所述第一目标知识点具有所述关联关系的知识点的链接。

若用户需要查看与第一目标知识点具有关联关系的知识点,则无需再次检索,从而减少了检索次数。

示例性的,若知识点包含的第一关联标识的数目为多个,且关联关系是基于查看顺序确定的,则所述发送所述第一目标知识点包含的知识正文以及与所述第一目标知识点具有所述关联关系的知识点的链接步骤包括:基于所述第一目标知识点对应的查看顺序,生成链接信息,所述链接信息包含的与所述第一目标知识点具有所述关联关系的多个知识点按照所述第一目标知识点对应的查看顺序排序;发送所述链接信息至所述客户端。

由于查看顺序表征用户查看各个知识点的顺序,按照查看顺序展示与所述第一目标知识点具有关联关系的知识点的链接,更加符合用户的查看逻辑,用户按照展示的知识点的链接的顺序依次查看各知识点即可,无需人为排序。

在一可选实现方式中,还包括:响应于点击所述第一目标知识点的链接的操作,发送关联知识区域至所述客户端;其中,所述关联知识区域包括具有所述第一关联标识的知识点的链接、具有第二关联标识的知识点的链接、所述知识点包含的知识正文所属源文档的链接以及所述知识点包含的知识正文所属源文档被拆分得到的多个知识点的链接中的一个或多个。

用户可以从客户端展示的关联知识区域中点击相应链接从而能够查看相应知识。

在一可选实现方式中,还可以包括以下步骤F1至步骤F2。

步骤F1:响应于点击所述第一目标知识点的链接的操作,从预设的知识点与问答对的对应关系中,查询得到第一目标知识点对应的问答对、具有第一标识的知识点对应的问答对以及具有第二标识的知识点对应的问答对。

步骤F1中第一标识和第二标识为第一目标知识点包含的标识。

步骤F2:发送问答区域至所述客户端,所述问答区域包括所述知识点对应的问答对、具有所述第一标识的知识点对应的问答对以及具有所述第二标识的知识点对应的问答对。

示例性的,显示问答区域的界面与显示知识正文的界面可以为同一界面的不同区域,或,不同界面。

如图3所示,为本申请实施例提供的显示知识正文的界面和显示问答区域的界面的关系示意图。

图3中框31框出知识正文,显示知识正文的界面的名称为业务介绍,显示问答区域的界面的名称为常见问题。

在一可选实现方式中,还包括以下步骤G1至步骤G4。

步骤G1:基于所述知识点、具有所述第一标识的知识点以及具有所述第二标识的知识点,生成导航标识信息,所述导航标识信息包括与所述知识点包含的知识正文对应的第一导航标识、与具有所述第一标识的知识点包含的知识正文对应的第二导航标识、与具有所述第二标识的知识点包含的知识正文对应的第三导航标识。

示例性的,可以将知识正文包含的知识标题确定为该知识正文的导航标识;并建立导航标识与知识正文的对应关系。

步骤G2:响应于点击导航标识信息包含的目标导航标识的操作,发送所述导航标识信息至所述客户端。

步骤G3:接收来自所述客户端的点击导航标识信息包含的目标导航标识的第二点击操作。

步骤G4:响应于所述第二点击操作,控制所述客户端显示与所述目标导航标识对应的知识正文,所述目标导航标识为所述第一导航标识、所述第一导航标识和所述第三导航标识中任一个。

仍以图3为例,框32圈出的内容为导航标识信息;如图3所示,导航标识信息包括:介绍、优惠政策、咨询电话、办理网点以及办理流程;若用户需要查看优惠政策,则可以点击导航标识信息中的优惠政策,则会自动滚动优惠政策对应的正文内容。若用户需要查看咨询电话,则可以点击导航标识信息中的咨询电话,则会自动滚动咨询电话对应的正文内容。

在一可选实现方式中,知识点还可以包括:图谱标签、个性标签以及记忆标签中的一种或多种。

示例性的,图谱标签可以基于知识内容分析得到。

示例性的,个性标签是由人工坐席人为标记得到。

示例性的,记忆标签是由客户人为标记得到。

示例性的,记忆标签包括客户的声纹、指纹、身份证号、手机号等能够表征用户身份的信息。

示例性的,需要说明的是,在用户对知识库中的知识点进行查询时,如果用户查询到相应的知识点,则把该用户的信息(例如个人信息、声纹信息等)以及用户检索时输入查询语句添加该知识点的记忆标签中。这样,该用户以后再次查询时,就可以直接利用记忆标签检索到该部分知识点,加快了知识点的查询效率以及提升了知识点查询的准确率。

示例性的,查询语句可以为图片、视频、文本、EXCEL等任意格式的内容。

在一可选实现方式中,用户可能会随时对个性标签或记忆标签进行增加或修改或删除,可以实时对个性标签或记忆标签进行更新。

在一可选实现方式中,可以从查询日志中获得大量用户的查询方式,查询方式包括:通过个性标签查询、通过记忆标签查询、通过图谱标签查询;基于查询日志确定多个查询方式之间的潜在关系,例如,若大量用户使用图谱标签查询后,还会使用记忆标签查询;那么,则用户使用图谱标签查询的过程中,会提示用户是否使用记忆标签查询。示例性的,得到不同查询方式潜在关系的过程包括以下步骤F1至步骤F3。

步骤F1:获得多个用户分别对应的查询日志。

步骤F2:从多个用户分别对应的查询日志中,获得多个用户在设定时间段内使用的查询方式。

示例性的,设定时间段可以基于实际情况确定,这里不进行限定,例如可以为30分钟、1小时等。

步骤F3:若在设定时间段内使用相同的至少两种查询方式的用户的数目大于或等于第三阈值,确定第一种查询方式和第二种查询方式具有潜在关系。

上述本申请公开的实施例中详细描述了方法,对于本申请的方法可采用多种形式的装置实现,因此本申请还公开了一种装置,下面给出具体的实施例进行详细说明。

如图4所示,为本申请实施例提供的知识点之间的关联关系获取装置的结构图,该装置包括:第一获取模块41、第二获取模块42、第三获取模块43以及构建模块44,其中:

第一获取模块41,用于获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点;

第二获取模块42,用于从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点;

第三获取模块43,用于从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句;

构建模块44,用于构建所述多个知识点之间的关联关系。

在一可选实现方式中,第二获取模块包括:

第一获取单元,用于对于任一用户标识,从所述查询日志中获得具有所述用户标识的用户输入的多个查询语句的查询时间;

划分单元,用于将查询时间的差值小于或等于设定时间的多个查询语句分别对应的知识点划分至同一查询组合。

在一可选实现方式中,构建模块包括:

第一确定单元,用于基于多个查询组合中所述多个知识点分别对应的查询语句的查询时间,确定表征用户需要查看所述多个知识点的查看顺序;

建立单元,用于基于所述查看顺序,建立所述多个知识点的关联关系。

在一可选实现方式中,所述知识点包括知识正文、所述知识正文位于源文档的位置、第一标识以及第二标识;所述第一标识为所述源文档中位于所述知识正文的前一知识正文对应的知识点的标识;所述第二标识为所述源文档中位于所述知识正文的下一知识正文对应的知识点的标识;所述源文档被拆分为多个知识正文;还包括:

添加模块,用于对于任一所述知识点,将与所述知识点具有所述关联关系的知识点的第一关联标识添加至所述知识点;具有所述第一关联标识的知识点包含的知识正文与所述知识点包含的知识正文属于不同源文档。

在一可选实现方式中,还包括:

拆分模块,用于拆分所述源文档得到多个知识正文;

分配模块,用于为所述多个知识正文分配标识;

第一确定模块,用于基于所述多个知识正文在所述源文档的位置,确定所述多个知识正文分别对应的所述第一标识以及所述第二标识,以形成所述多个知识正文分别对应的知识点。

在一可选实现方式中,还包括:

第四获取模块,用于对于每一所述知识点,获得与所述知识点相关度大于或等于第二阈值的关联知识点,所述关联知识点包含的知识正文与所述知识点包含的知识正文属于不同源文档;

其中,所述知识点包括所述关联知识点的第二关联标识。

在一可选实现方式中,所述知识点还包括业务目录、图谱标签、个性标签以及记忆标签中的一种或多种;其中,所述业务目录用于指示所述知识点包含的知识正文的存储路径;所述图谱标签表征所述知识点包含的知识正文的属性信息;所述个性标签为人工坐席针对所述知识点描述的内容,所述记忆标签包括客户的身份信息和/或客户针对所述知识点的查询语句。

在一可选实现方式中,还包括:

接收模块,用于接收来自客户端的查询语句;

第五获取模块,用于从知识库中获得与所述查询语句的相关度大于或等于第三阈值的多个目标知识点;

第一发送模块,用于发送所述多个目标知识点分别对应的链接至所述客户端;

第二发送模块,用于响应于所述客户端反馈的点击所述多个目标知识点中第一目标知识点的链接的操作,发送所述第一目标知识点包含的知识正文以及与所述第一目标知识点具有所述关联关系的知识点的链接。

在一可选实现方式中,第二发送模块还包括:生成单元,用于基于所述第一目标知识点对应的查看顺序,生成链接信息,所述链接信息包含的与所述第一目标知识点具有所述关联关系的多个知识点按照所述第一目标知识点对应的查看顺序排序;发送单元,用于发送所述链接信息至所述客户端。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图5是根据一示例性实施例示出的一种用于服务器的装置的框图。

服务器包括但不限于:处理器51、存储器52、网络接口53、I/O控制器54以及通信总线55。

需要说明的是,本领域技术人员可以理解,图5中示出的服务器的结构并不构成对服务器的限定,服务器可以包括比图5所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图5对服务器的各个构成部件进行具体的介绍:

处理器51是服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器52内的软件程序和/或模块,以及调用存储在存储器52内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。处理器51可包括一个或多个处理单元;示例性的,处理器51可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器51中。

处理器51可能是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;

存储器52可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM)521和只读存储器(Read-Only Memory,ROM)522,也可能还包括大容量存储设备523,例如至少1个磁盘存储器等。当然,该服务器还可能包括其他业务所需要的硬件。

其中,上述的存储器52,用于存储上述处理器51可执行指令。上述处理器51具有以下功能:获取查询日志,所述查询日志包括多个用户分别输入的查询语句以及所述查询语句对应的知识点;所述查询语句对应的知识点为所述查询语句对应的查询结果中满足预设条件的知识点;

从所述查询日志中获得多个查询组合,所述查询组合包括用户标识以及具有所述用户标识的用户输入的多个查询语句分别对应的知识点;

从多个查询组合中获得共现频率大于或等于第一阈值的多个知识点,所述多个知识点中至少两个知识点对应不同的查询语句;

构建所述多个知识点之间的关联关系。

一个有线或无线网络接口53被配置为将服务器连接到网络。

处理器51、存储器52、网络接口53和I/O控制器54可以通过通信总线55相互连接,该通信总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。

在示例性实施例中,服务器可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述知识点之间的关联关系获取方法。

在示例性实施例中,本公开实施例提供了一种包括指令的存储介质,例如包括指令的存储器52,上述指令可由服务器的处理器51执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机可读存储介质,可直接加载到计算机的内部存储器,例如上述存储器52中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述知识点之间的关联关系获取方法任一实施例所示步骤。

在示例性实施例中,还提供一种计算机程序产品,可直接加载到计算机的内部存储器,例如所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述所述知识点之间的关联关系获取方法任一实施例所示步骤。

需要说明的是,本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 知识点之间的关联关系获取方法及装置
  • 一种获取用户语料中词语之间的关联关系的方法和系统
技术分类

06120113270135