掌桥专利:专业的专利平台
掌桥专利
首页

一种基于知识图谱的问答方法及装置、存储介质

文献发布时间:2023-06-19 09:27:35


一种基于知识图谱的问答方法及装置、存储介质

技术领域

本发明属于信息检索应用技术领域,具体涉及一种基于知识图谱的问答方法 及装置、存储介质。

背景技术

随着智能家居的快速发展,越来越多的家庭开始倾向配置智能家居设备,同 时,智能家居设备的种类和数量的增加,需要更多的客服回答用户在使用过程中 遇到的故障问题;

面对用户在使用智能家居设备的过程中遇到的大量的设备故障问题,如果使 用人工客服解决,由于人工客服的数量远远不够应对猛涨的设备故障问题,因此, 人工客服无法及时解决用户提出的各种问题,而且,一味地增加人工客服也会大 幅度增加企业的运营成本。

另外,可以使用智能客服,对于目前的智能客服,大部分都是基于引导式的 进行沟通,使得用户在使用过程中往往无法找到正确的解决方法,在智能客服的 各个应用场景的最后,用户还是不可避免地打向人工客服,因此,目前的智能客 服,使用体验差,无法真正有效帮助用户解决问题。

现在亟须一种基于知识图谱的问答方法及装置、存储介质。

发明内容

本发明所要解决的技术问题是如何提高对用户问问题时意图的识别,从而准 确有效地回答用户的问题。

针对上述问题,本发明提供了一种基于知识图谱的问答方法及装置、存储介 质。

第一方面,本发明提供了一种基于知识图谱的问答方法,包括以下步骤:

接收输入的问题信息,从所述问题信息中提取出用于表示意图的关键词;

将所述关键词输入到预先构建的知识图谱中,在所述知识图谱中筛选出与所 述关键词对应的实体,其中,所述知识图谱包括实体、实体之间的有向边以及实 体的属性值;

根据与所述关键词对应的实体确定所述知识图谱中与所述问题信息相对应 的查询链路,其中,所述查询链路中至少包括两个通过有向边连接的实体;

将所述查询链路中指定实体的属性值作为所述问题信息的答案输出。

根据本发明的实施例,优选地,将所述关键词输入到预先构建的知识图谱中, 在所述知识图谱中筛选出与所述关键词对应的实体,包括以下步骤:

将所述关键词与预先构建的知识图谱中的实体进行相似度对比,从所述知识 图谱中筛选出与所述关键词之间的相似度超过预设相似度阈值的实体,作为与所 述关键词对应的实体。

根据本发明的实施例,优选地,根据与所述关键词对应的实体确定所述知识 图谱中与所述问题信息相对应的查询链路,包括以下步骤:

根据所述筛选出的实体以及在所述知识图谱中所述筛选出的实体之间的有 向边形成的查询链路,作为与所述问题信息相对应的查询链路。

根据本发明的实施例,优选地,所述问题信息为音频信息,从所述问题信息 中提取出用于表示意图的关键词,包括以下步骤:

将所述音频信息转换成文本;

对所述文本进行分词得到词汇;

从所述词汇中选取用于表示意图的关键词。

根据本发明的实施例,优选地,所述知识图谱通过以下步骤构建:

对于预设的多个应用场景中的每一个应用场景,将该应用场景中与可能输入 的问题相对应的关键词作为实体,将表示不同实体之间的关系的有向边作为不同 实体之间的连接线,建立实体-关系-实体式三元结构,并对所述实体-关系-实体式 三元结构中的实体赋予属性值,形成该应用场景下的图谱;

将预设的多个应用场景中的每一个应用场景下的图谱集合在同一个网络图 中,构成多个应用场景下的知识图谱。

根据本发明的实施例,优选地,所述知识图谱中每一条实体之间的有向边还 分别具有权重值;

对应地,将所述查询链路中指定实体的属性值作为所述问题信息的答案输出, 包括以下步骤:

判断所述查询链路是否包括与所述关键词对应的所有实体:

当所述查询链路中包括与所述关键词对应的所有实体时,将所述查询链路中 末端实体的属性值作为所述问题信息的答案输出;

当所述查询链路并非包括与所述关键词对应的所有实体时,通过累加所述查 询链路中有向边的权重值得到所述查询链路的权重值;

判断所述查询链路的权重值是否大于或等于预设权重值阈值:

当所述查询链路的权重值大于或等于预设权重值阈值时,将所述查询链路中 末端实体的属性值作为所述问题信息的答案输出。

根据本发明的实施例,优选地,将所述查询链路中指定实体的属性值作为所 述问题信息的答案输出,包括以下步骤:

将所述查询链路中末端实体的属性值作为所述问题信息的答案输出。

第二方面,本发明提供了一种基于知识图谱的问答装置,包括:

提取模块,用于接收输入的问题信息,从所述问题信息中提取出用于表示意 图的关键词;

筛选模块,用于将所述关键词输入到预先构建的知识图谱中,在所述知识图 谱中筛选出与所述关键词对应的实体,其中,所述知识图谱包括实体、实体之间 的有向边以及实体的属性值;

确定模块,用于根据与所述关键词对应的实体确定所述知识图谱中与所述问 题信息相对应的查询链路;

输出模块,用于将所述查询链路中指定实体的属性值作为所述问题信息的答 案输出。

第三方面,本发明提供了一种存储介质,其上存储有计算机程序,该计算机 程序被处理器执行时实现上述方法的步骤。

第四方面,本发明提供了一种基于知识图谱的问答装置,其包括存储器和处 理器,该存储器上存储有计算机程序,该计算机程序被处理器执行时实现上述方 法的步骤。

与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益 效果:

应用本发明的基于知识图谱的问答方法,接收输入的问题信息,从所述问题 信息中提取出用于表示意图的关键词;将所述关键词输入到预先构建的知识图谱 中,在所述知识图谱中筛选出与所述关键词对应的实体,其中,所述知识图谱包 括实体、实体之间的有向边以及实体的属性值;根据与所述关键词对应的实体确 定所述知识图谱中与所述问题信息相对应的查询链路,其中,所述查询链路中至 少包括两个通过有向边连接的实体;将所述查询链路中指定实体的属性值作为所 述问题信息的答案输出,能够从用户的问题信息中提取所有表示意图的关键词, 根据关键词在知识图谱中的走向最大限度地推测用户的意图,使得根据关键词在 知识图谱中的推测出的答案能够最大限度地接近用户所需要的答案。

本发明的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中 变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在 说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明 的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:

图1示出了本发明实施例一基于知识图谱的问答方法的流程图;

图2示出了本发明实施例二基于知识图谱的问答方法的流程图;

图3示出了本发明实施例三基于知识图谱的问答方法的流程图;

图4示出了本发明实施例三中适用于智能客服使用场景的知识图谱的示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何 应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实 施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的 各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。

为解决现有技术中存在的上述技术问题,本发明实施例提供了一种基于知识 图谱的问答方法,在本实施例中,问题信息为音频信息。

参照图1,本实施例的基于知识图谱的问答方法,包括以下步骤:

S110,接收输入的音频信息,将所述音频信息转换成文本;

S120,对所述文本进行分词得到词汇;

S130,从所述词汇中选取用于表示意图的关键词;

S140,将所述关键词与预先构建的知识图谱中的实体进行相似度对比,判断 所述知识图谱中是否存在与所述关键词相似度超过预设相似度阈值的实体,其中, 所述知识图谱包括实体、实体之间的有向边以及实体的属性值:

若是,则执行步骤S150;

若否,则不予响应;

S150,将与所述关键词之间的相似度超过预设相似度阈值的实体筛选出来, 作为与所述关键词对应的实体;

S160,根据所述筛选出的实体以及在所述知识图谱中所述筛选出的实体之间 的有向边形成的查询链路,作为与所述问题信息相对应的查询链路,其中,所述 查询链路中至少包括两个通过有向边连接的实体;

S170,将所述查询链路中指定实体的属性值作为所述问题信息的答案输出。

在步骤S110中,所述知识图谱通过以下步骤构建:

对于预设的多个应用场景中的每一个应用场景,将该应用场景中与可能输入 的问题相对应的关键词作为实体,将表示不同实体之间的关系的有向边作为不同 实体之间的连接线,建立实体-关系-实体式三元结构,并对所述实体-关系-实体式 三元结构中的实体赋予属性值,形成该应用场景下的图谱;

将预设的多个应用场景中的每一个应用场景下的图谱集合在同一个网络图 中,构成多个应用场景下的知识图谱。

在步骤S110中,通过语言模型将所述音频信息转换成文本。

在步骤S130中,通过语义模型从所述词汇中选取用于表示意图的关键词, 其中,所述语义模型通过合成语料话术的方法进行训练得到。

本实施例的基于知识图谱的问答方法能够推测出最接近用户问问题时的意 图,能够解决当前智能客服使用体验差,无法有效解决用户使用智能家居的问题。

本实施例的基于知识图谱的问答方法能够通过合成语料话术的方法,实现大 量生成数据,为有效进行语义模型训练提供重要基础。

为解决现有技术中存在的上述技术问题,本发明实施例基于实施例一提供了 一种基于知识图谱的问答方法,其中,本发明实施例的方法对实施例一中步骤 S170进行改进,在本实施例中,将所述查询链路中末端实体的属性值作为所述问 题信息的答案输出,所述知识图谱中每一条实体之间的有向边还分别具有权重值。

参照图2,本实施例的基于知识图谱的问答方法,包括以下步骤:

S210,接收输入的音频信息,将所述音频信息转换成文本;

S220,对所述文本进行分词得到词汇;

S230,从所述词汇中选取用于表示意图的关键词;

S240,将所述关键词与预先构建的知识图谱中的实体进行相似度对比,判断 所述知识图谱中是否存在与所述关键词相似度超过预设相似度阈值的实体,其中, 所述知识图谱包括实体、实体之间的有向边以及实体的属性值:

若是,则执行步骤S250;

若否,则不予响应;

S250,将与所述关键词之间的相似度超过预设相似度阈值的实体筛选出来, 作为与所述关键词对应的实体;

S260,根据所述筛选出的实体以及在所述知识图谱中所述筛选出的实体之间 的有向边形成的查询链路,作为与所述问题信息相对应的查询链路,其中,所述 查询链路中至少包括两个通过有向边连接的实体;

S271,判断所述查询链路是否包括与所述关键词对应的所有实体:

若是,则执行步骤S274;

若否,则执行步骤S272;

S272,通过累加所述查询链路中有向边的权重值得到所述查询链路的权重值;

S273,判断所述查询链路的权重值是否大于或等于预设权重值阈值:

若是,则执行步骤S274;

若否,则不予响应;

S274,将所述查询链路中末端实体的属性值作为所述问题信息的答案输出。

在步骤S273中,当所述查询链路的权重值小于预设权重值阈值时,不予响 应,这里的不予响应可以理解为:对于用户的问题无法从知识图谱中获取答案时, 统一返回人工客服联系信息。

为解决现有技术中存在的上述技术问题,本发明实施例为实施例一提供了一 种基于知识图谱的问答方法应用于智能客服的情况。

参见图3,本实施例的基于知识图谱的问答方法,包括:

手机麦克风采集到用户的音频,将音频通过语言模型转成文本后,对文本进 行分词,其中,分词的方法为,对智能客服下能够代表用户意图的关键词进行标 签化处理,例如,“保修”,“配网”,“响应”,“退货”,“网络”等词汇;

将用户文本分词后,过滤掉语气词以及助词等词汇,将关键词输入知识图谱 中进行检索,当关键词与知识图谱中的实体相似时,将知识图谱中与关键词相似 的实体作为与关键词对应的实体,若所有关键词对应的实体在同一个实体三元结 构内,即关系都互为父实体或者子实体,则将末端实体属性值,作为答案返回用 户,也就是说,当所有关键词对应的实体在同一个实体三元结构时,所有关键词 对应的实体形成与用户意图相同的查询链路;

若所有关键词对应的实体不完全为父实体或者子实体,则获取父子实体关系 的实体之间有向边的权重值加和,当权重值加和大于预定阈值时,则将有父子实 体关系的末端实体属性作为答案返回用户,也就是说,当所有关键词对应的实体 之间有向边的权重值加和大于预定权重值阈值时,所有关键词对应的实体形成与 用户意图相似的查询链路。

其中,可通过现有的词库对关键词与知识图谱中的实体之间的相似度,进行 判定。

特别地,当对于用户的问题无法从知识图谱中获取答案时,统一返回人工客 服联系信息。

如图4所示,本实施例的知识图谱适用的智能客服使用场景包括操作流程, 故障排查以及售后流程三个主要板块,其中,操作流程包括智能家居配网、使用 操作以及使用技巧等内容,故障排查包括对设备出现故障的原因以及规避方法, 售后应用包括保修流程,退货处理,安装流程以及政策服务等。因此,在构建所 述知识图谱时,建立三个场景,对于三个场景中的每一个场景,明确用户在该场 景下意图,建立实体-关系-实体式三元结构,例如,如图4所示,在操作流程的 场景中,实体-关系-实体式三元结构可以是操作流程-配网-按键组合;在故障排查 的场景中,实体-关系-实体式三元结构可以是故障-响应-网络;在售后应用的场景 中,实体-关系-实体式三元结构可以是售后-保修-联系方式等;并根据三个场景下, 所有的问题以及解决的办法形成的集合体,构造成完整的语义网络图,即知识图 谱。

如图4所示,本实施例的知识图谱中包括操作流程,故障排查以及售后流程 三个场景下的查询链路。

具体地,操作流程场景下的查询链路包括:智能客服-操作流程-配网。

故障排查场景下的查询链路包括:智能客服-故障排查-网络-掉线;智能客服 -故障排查-网络-掉线-配网;智能客服-故障排查-网络-响应;智能客服-故障排查- 网络-响应-执行;智能客服-故障排查-网络-响应-执行-保修-联系;智能客服-故障 排查-语音-响应;智能客服-故障排查-语音-响应-执行;智能客服-故障排查-语音- 响应-执行-保修-联系;智能客服-故障排查-语音-执行;智能客服-故障排查-语音- 执行-保修-联系。

售后流程场景下的查询链路包括:智能客服-售后流程-退货;智能客服-售后 流程-安装;智能客服-售后流程-保修-联系。

通常情况下,将关键词对应的实体形成的查询链路中的末端实体的属性值作 为答复用户问题的答案,然而,本实施例除了包括将末端实体的属性值作为答复 用户问题的答案之外,还包括将关键词对应的实体形成的查询链路中的末端实体 以及其他指定实体的属性值作为答案返回至用户。

例如,将关键词对应的实体形成的查询链路中的末端实体以及与所述末端实 体相邻的实体的属性值作为答案返回至用户,具体地,如图4所示,当关键词对 应的实体形成的查询链路为智能客服-故障排查-网络-掉线-配网时,将掉线和配网 两个实体的属性值作为答案返回至用户;当关键词对应的实体形成的查询链路为 智能客服-故障排查-网络-响应-执行时,将响应和执行两个实体的属性值作为答案 返回至用户;当关键词对应的实体形成的查询链路为智能客服-故障排查-语音-响 应-执行时,将响应和执行两个实体的属性值作为答案返回至用户。

再例如,将关键词对应的实体形成的查询链路中的末端实体以及其他指定实 体的属性值作为答案返回至用户,具体地,如图4所示,当关键词对应的实体形 成的查询链路为智能客服-故障排查-语音-执行-保修-联系时,将执行和联系两个 实体的属性值作为答案返回至用户;当关键词对应的实体形成的查询链路为智能 客服-故障排查-网络-响应-执行-保修-联系时,将响应、执行和联系三个实体的属 性值作为答案返回至用户;当关键词对应的实体形成的查询链路为智能客服-故障 排查-语音-响应-执行-保修-联系时,将响应、执行和联系三个实体的属性值作为 答案返回至用户。

本实施例的基于知识图谱的问答方法能够基于智能家居场景应用特点,结合 知识图谱的推理特性,识别用户问题的意图。

本实施例的基于知识图谱的问答方法结合当前智能家居的使用场景,提高对 用户意图的识别准确率,使得智能客服对于用户基于不同的应用场景下的问题, 给予用户准确的答复。

本实施例的知识图谱的应用能够对用户意图进行推理,并结合知识图谱中实 体节点之间的权重值计算,找出与用户意图最为相似的查询链路,同时将该查询 链路的末端节点的属性值作为答案返回给用户。

为解决现有技术中存在的上述技术问题,本发明实施例还提供了一种基于知 识图谱的问答装置。

本实施例的基于知识图谱的问答装置,包括:

提取模块,用于接收输入的问题信息,从所述问题信息中提取出用于表示意 图的关键词;

筛选模块,用于将所述关键词输入到预先构建的知识图谱中,在所述知识图 谱中筛选出与所述关键词对应的实体,其中,所述知识图谱包括实体、实体之间 的有向边以及实体的属性值;

确定模块,用于根据与所述关键词对应的实体确定所述知识图谱中与所述问 题信息相对应的查询链路;

输出模块,用于将所述查询链路中指定实体的属性值作为所述问题信息的答 案输出。

为解决现有技术中存在的上述技术问题,本发明实施例还提供了一种存储介 质。

本实施例的存储介质,其上存储有计算机程序,该程序被处理器执行时实现 上述实施例中方法的步骤。

为解决现有技术中存在的上述技术问题,本发明实施例还提供了一种基于知 识图谱的问答装置。

本实施例的基于知识图谱的问答装置,其包括存储器和处理器,该存储器上 存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。

虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明 而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人 员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节 上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定 的范围为准。

相关技术
  • 一种基于知识图谱的复杂问句问答方法、装置及存储介质
  • 一种基于知识图谱的问答库生成方法、装置、电子设备和存储介质
技术分类

06120112172215