一种基于领域知识图谱的人机协同方法及系统

文献发布时间：2023-06-19 16:11:11

技术领域

本申请涉及知识图谱关系技术领域，尤其涉及一种基于领域知识图谱的人机协同方法及系统。

背景技术

智能发展将人类与机器相联合，将人类的大脑中的智慧与容量更大、运算更快的机器只能相结合，以便在不同层次给社会制造带来范式增长。目前智能客服主要基于事先的规则进行匹配，一旦规则未配置，则仍然需要人工进入干预，无法基于用户的部分意图给出对应识别以及处理现有的人机协同技术。市面上的大部分机器人问答采用的是预先设置好的1对1问答，无法根据逻辑回答推理类和对比类的问题，人机仍然处于分离状态，完全由人类单方面设定指令操控，基本只是共存的工作模式，没有任何耦合的协作过程。因此，为了实现人机耦合协作，需要一种依据领域知识图谱，智能理解用户意图更加智能化的回答非预设问题的系统。

CN113742474A公开了一种基于知识图谱的智能问答方法和装置，使用知识图谱来为知识库的各个知识点建立关联关系；在接收到用户的问题时，一方面通过知识图谱与知识库的对应关系来获取当前问题对应的知识点内容，另一方面通过知识图谱各个知识节点间的关联关系得到与当前问题相关的其他知识点内容；在向用户进行应答反馈时，将两部分内容同时推送给客户。但是，该技术无法识别用户意图，单纯通过知识图谱和知识库之间的对应关系获取相关知识点内容，一旦规则未配置则无法很好处理，无法基于用户的部分意图给出对应识别以及处理（类似用户说我当前很忙，你过会再给我打电话。无法自动识别记录并自动按照约定回访）。无法解决除了固定营销或者客服工作之外的场景问题。

发明内容

本申请提供一种基于领域知识图谱的人机协同方法及系统，以解决现有技术只能基于实现规则匹配，无法根据用户意图进行识别和处理的问题，且本发明能够回答推理类和对比类的问题，还能够通过文字转语音的方式介入机器人通话，从而实现单人介入多通通话。

为实现上述目的，本发明提供了一种基于领域知识图谱的人机协同方法，所述方法包括：

将业务语音小样进行提取及预处理：提取业务语音小样并对各语音小样的特征项目及各特征项目的数据信息进行预处理形成数据集；

构建知识图谱问答库，将预处理得到的数据集进行训练得到训练模型，建立领域知识图谱问答库；所述领域知识图谱问答库包括多个知识节点，所述知识节点至少包括知识关键词和知识内容，所述知识内容包括知识内容在知识关键词上的概率分布或已有知识内容在知识关键词上的概率分布；

构建意图识别库，将预处理得到的数据集进行训练得到意图识别模型，所述意图识别模型包括多个识别节点，所述识别节点至少包括意图关键词和意图内容，所述意图内容包括意图内容在所述意图关键词上的概率分布或已有意图内容在意图关键词上的概率分布；

用户意图判断：将预处理得到的语料转换为文本信息并对其意图关键词进行提取，根据意图关键词判断用户意图，并根据用户意图进行具体业务模块调用，当意图识别模型判断用户在提问时，转入知识节点检索；

知识节点检索：将步骤S1中预处理得到的语料转换为文本信息并对关键词进行提取，将提取的关键词进行聚类，得到知识关键词，获取该知识关键词对应的全部知识节点；将匹配的全部知识节点进行排序，选定概率分布最高的为目标知识内容。

将知识节点检索中选定的目标知识内容通过TTS系统转换为对应客服的目标知识内容语音发送给用户。

优选的，所述预处理包括语料清洗、长句分词、词性标注、语义纠错处理。

优选的，所述推理技术为：采用Jena操作Protege实体文档，创建推理规则文件，并在读取该规则文件获得jean的Rule对象及jena的Reasoner，将规则数据、业务套餐数据和Reasoner进行绑定得到infModel推理模型。

优选的，将预处理得到的数据集通过BTM文档模型进行训练得到训练模型，将预处理得到的数据集通过BTM文档模型进行训练得到意图识别模型；

优选的，将预处理得到的语料转换为文本信息并对关键词进行提取，将提取的关键词基于Sentence-Bert提取特征向量的聚类方式进行聚类，得到知识关键词。

本发明还提供了一种用于实现上述一种基于领域知识图谱的人机协同方法的系统，包括：提取及预处理模块、知识图谱问答库构建模块、意图识别库构建模块、用户意图判断模块、知识节点检索模块和文字转语音模块；

所述提取及预处理模块用于提取业务语音小样并对各语音小样的特征项目及各特征项目的数据信息进行预处理形成数据集；

所述知识图谱问答库构建模块用于将提取及预处理模块预处理得到的数据集进行训练得到训练模型，建立领域知识图谱问答库；

所述意图识别库构建模块用于提取及预处理模块预处理得到的数据集进行训练得到意图识别模块；

所述用户意图判断模块用于将提取及预处理模块预处理得到的语料转换为文本信息并对其意图关键词进行提取，根据意图关键词判断用户意图，并根据用户意图进行具体业务模块调用，当意图识别模型判断用户在提问时，转入知识节点检索模块；

所述知识节点检索模块用于将提取及预处理模块预处理得到的语料转换为文本信息并对关键词进行提取，将提取的关键词进行聚类，得到知识关键词，通过推理技术获取领域知识图谱问答库中该知识关键词对应的全部知识节点；将匹配的全部知识节点进行排序，选定概率分布最高的为目标知识内容。

所述文字转语音模块用于将知识节点检索模块中选定的目标知识内容通过TTS系统转换为对应客服的目标知识内容语音发送给用户。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本申请实施例一提供的一种基于领域知识图谱的人机协同方法的流程示意图；

图2为本申请实施例一提供的一种基于领域知识图谱的人机协同方法推理技术原理示意图；

图3为本申请实施例二提供的一种基于领域知识图谱的人机协同系统的系统架构示意图；

图4为本申请实施例二提供的一种基于领域知识图谱的人机协同系统中意图判断模块示意图；

图5为本申请实施例二提供的一种基于领域知识图谱的人机协同系统的知识节点检索模块示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。以下结合附图，详细说明本申请各实施例提供的技术方案。

实施例一：

本发明提供一种基于领域知识图谱的人机协同方法，以解决现有技术只能基于实现规则匹配，无法根据用户意图进行识别和处理的问题，且本发明能够回答推理类和对比类的问题，还能够通过文字转语音的方式介入机器人通话，从而实现单人介入多通通话。

如图1所示，本方法主要包括以下步骤：

S1:在人工坐席过程中与客户进行对话，客户的语音内容作为语音小样，首先对将业务语音小样进行提取及预处理：提取业务语音小样并对各语音小样的特征项目及各特征项目的数据信息进行预处理形成数据集；此时的预处理包括所述预处理包括语料清洗、长句分词、词性标注、语义纠错处理等。本发明也可以用于在线文字客服，可以将通过输入模块将文字信息进行预处理，并将其处理后的数据与语音数据一起继续下列步骤。

S2:构建知识图谱问答库，将预处理得到的数据集进行训练得到训练模型，建立领域知识图谱问答库；所述领域知识图谱问答库包括多个知识节点，所述知识节点至少包括知识关键词和知识内容，所述知识内容包括知识内容在知识关键词上的概率分布或已有知识内容在知识关键词上的概率分布；所述知识内容还可以包括内容在关键词上的权重，也可以对其进行设置标签，确定相似概率。

S3：构建意图识别库，将预处理得到的数据集进行训练得到意图识别模型，所述意图识别模型包括多个识别节点，所述识别节点至少包括意图关键词和意图内容，所述意图内容包括意图内容在所述意图关键词上的概率分布或已有意图内容在意图关键词上的概率分布；

S4:用户意图判断：将预处理得到的语料转换为文本信息并对其意图关键词进行提取，根据意图关键词判断用户意图，并根据用户意图进行具体业务模块调用，当意图识别模型判断用户在提问时，转入知识节点检索。意图识别就是判断用户咨询的问题是什么及用户想要表达的意思，根据用户表达内容调用具体的业务模块，若用户表达的是“我现在在忙，一会再给我打吧。”将记录为稍后回拨，并将该内容标记在人工坐席的时间表上。若用户表达的是“然后呢”、“嗯”、“还有呢”等语句，将标记为继续说。若用户表达的是愤怒，不耐烦的语句，则系统将标记为愤怒，并调用安抚的语句。若系统识别到用户正在发出提问，则系统转入知识节点检索。

S5:知识节点检索：将步骤S1中预处理得到的语料转换为文本信息并对关键词进行提取，将提取的关键词进行聚类，得到知识关键词，获取该知识关键词对应的全部知识节点；将匹配的全部知识节点进行排序，选定概率分布最高的为目标知识内容。若系统识别到用户正在发出提问，以“我想预定明天上午南京到拉萨的机票，要商务舱的。”为例，则系统转入知识节点检索。将提取关键词[明天上午]「南京][拉萨][机票][商务舱]，并通过机器学习，也就是使用逻辑回归进行分类。在使用逻辑回归之前，对词语进行分词，向量化。分词可以比较各个分词的效果，将词与进行向量化，最后确定最优知识节点回答。

S6:将知识节点检索中选定的目标知识内容通过TTS系统转换为对应客服的目标知识内容语音发送给用户。若采取是文字在线客服，则系统将直接将文字结果发送给用户，

如图4所示的为所述推理技术的知识推理原理示意图为：采用Jena操作Protege实体文档，创建推理规则文件，并在读取该规则文件获得jean的Rule对象及jena的Reasoner，将规则数据、业务套餐数据和Reasoner进行绑定得到infModel推理模型。然后将这部分数据转换成RDF形式并载入 infModel 中，便可按照规则自动推理，然后我们就可以通过SPARQL获得原先和推理的数据，将这些数据再加工便可得到我们需要的并呈现给用户。优选的，将预处理得到的数据集通过BTM文档模型进行训练得到训练模型，将预处理得到的数据集通过BTM文档模型进行训练得到意图识别模型；在该推理原理中用户直飞本体层进行操作；底层对用户是透明的，且该底层数据可以是关系数据库或者其他形式的数据源。二者是通过重写进行关联的。

另外，将预处理得到的语料转换为文本信息并对关键词进行提取，将提取的关键词可以基于Sentence-Bert提取特征向量的聚类方式进行聚类，得到知识关键词。

实施例二：

本发明提供一种基于领域知识图谱的人机协同的系统，包括：提取及预处理模块、知识图谱问答库构建模块、意图识别库构建模块、用户意图判断模块、知识节点检索模块和文字转语音模块；

所述提取及预处理模块用于提取业务语音小样并对各语音小样的特征项目及各特征项目的数据信息进行预处理形成数据集；

所述知识图谱问答库构建模块用于将提取及预处理模块预处理得到的数据集进行训练得到训练模型，建立领域知识图谱问答库；

所述意图识别库构建模块用于提取及预处理模块预处理得到的数据集进行训练得到意图识别模块；

所述文字转语音模块用于将知识节点检索模块中选定的目标知识内容通过TTS系统转换为对应客服的目标知识内容语音发送给用户。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：朱宇光;
专利申请人：江苏微皓智能科技有限公司;

上一篇：深度多标签电子病历集分类模型的训练方法及装置
下一篇：一种图像分类方法、装置、存储介质及终端