掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本公开实施例涉及人工智能技术领域,尤其涉及一种智能问答方法、装置、设备及可读存储介质。

背景技术

随着电商业务的飞速发展,网上购物已成为人们生活中的常见行为。网上购物包括新兴的直播购物、以及常规的商家对客户((business to customer,B2C)平台购物等。

客户系统是电商业务的一个重要环节,客服系统用于对用户大量的咨询做出回答,客服系统的质量对用户的网上购物体验的影响巨大。传统对客服人员培训上岗的方式给企业带来了大量的人力成本。而且,客服人员的上班时间是有时间约束的。随着人工智能的飞速发展,现考虑通过智能客服来削减企业客服人员的人力成本,并解决客服人员非上班时间或不在岗时无法及时响应用户的问题。

现有的基于人工智能的客服系统往往针对售后工作,如物流、退货等。但是,用户网购购物时往往会做一些售前咨询。上述针对售后的客服系统并不适用。因此,如何利用人工智能快速响应用户的售前咨询,视为急待解决的问题。

发明内容

本公开实施例提供一种智能问答方法、装置、设备及可读存储介质,通过构建预设模型,借助知识图谱定位用户的需求以进行智能导购,节省客服系统的人力成本并提高响应效率。

第一方面,本公开实施例提供一种智能问答方法,包括:接收用户通过电子设备发送的待处理查询语句;利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分,所述至少一个三元组中的每个三元组包含第一实体,所述待处理查询语句包含所述第一实体;根据所述至少一个相关分,从所述至少一个三元组中确定目标三元组;根据所述目标三元组包含的所述第一实体、第二实体、所述第一实体和所述第二实体的关系,确定目标话术;向所述电子设备发送所述目标话术。

第二方面,本公开实施例提供一种智能问答装置,包括:

接收单元,用于接收用户通过电子设备发送的待处理查询语句。

第一确定单元,用于利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分,所述至少一个三元组中的每个三元组包含第一实体,所述待处理查询语句包含所述第一实体。

第二确定单元,用于根据所述至少一个相关分,从所述至少一个三元组中确定目标三元组。

第三确定单元,用于根据所述目标三元组包含的所述第一实体、第二实体、所述第一实体和所述第二实体的关系,确定目标话术。

发送单元,用于向所述电子设备发送所述目标话术。

第三方面,根据本公开的一个或多个实施例,提供了一种电子设备,包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的智能问答方法。

第四方面,根据本公开的一个或多个实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的智能问答方法。

本公开实施例提供的智能问答方法、装置、设备及可读存储介质,服务器上预先部署预设模型。当服务器接收到用户输入的待处理查询语句后,从待处理查询语句中确定第一实体,并确定包含第一实体的至少一个三元组。然后,服务器将待查询语句和至少一个三元组中的每个三元组以此输入至预设模型,就能得到待查询语句和每个三元组的相关分,根据至少一个相关分从至少一个三元组中确定目标三元组,根据目标三元组包含的第二实体、第一实体和第二实体的关系,确定目标话术并返回给电子设备。采用该种方案,服务器通过构建预设模型,借助知识图谱定位用户的需求以进行智能导购,节省客服系统的人力成本并提高响应效率。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的智能问答方法所适用的网络架构示意图;

图2是本公开实施例提供的智能问答方法的流程图;

图3是本公开实施例提供的智能问答方法中构建预设模型的流程图;

图4为本公开实施例提供的一种智能问答装置的结构框图;

图5为本公开实施例提供的另一种智能问答装置的结构框图;

图6为用来实现本公开实施例的电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

随着电商的飞速发展及,很多用户将网上购物习惯迁移到直播这种新的生态系统中,而客服系统是电商业务非常重要的一环。传统对客服人员培训上岗的方式给企业带来了大量的人力成本。而且,客服人员的上班时间是有时间约束的。随着人工智能的飞速发展,现考虑通过智能客服来削减企业客服人员的人力成本,并解决客服人员非上班时间或不在岗时无法及时响应用户的问题。

现有的基于人工智能的客服系统往往针对售后工作,如物流、退货等。但是,用户网购购物时往往会做一些售前咨询。比如,客户购物衣服之前,可能会详细咨询品牌、价格、颜色、面料等。上述针对售后的客服系统并不适用。因此,如何利用人工智能快速响应用户的售前咨询,通过结构化的知识图谱来帮助商家进行智能导购,节省人力并提高效率,视为急待解决的问题。

图1是本公开实施例提供的智能问答方法所适用的网络架构示意图。请参照图1,该网络架构包括:电子设备1和服务器2,电子设备1和服务器2之间建立网络连接。服务器2上预先部署训练好的预设模型。同时,服务器上存储一个结构化的知识图谱,该结构化的知识图谱是对一些对象对应的参数等进行抽取、识别和存储得到的。例如,对于衣服这个实体,结构化的知识图谱中存储的知识包括:<衣服,尺码,XL>、<衣服,颜色,红色>和<衣服,款式,韩版>。

用户通过电子设备1向服务器发送待处理查询语句,服务器从该待处理查询语句中提取出第一实体,根据该第一实体得到包含该第一实体的至少一个三元组。然后,服务器将待处理查询语句和每个三元组输入至预设模型,得到待处理查询语句和每个三元组的相关分。之后,服务器根据相关分确定目标三元组,将目标三元组包含的第二实体作为回复给用户的话术中的实体,进而根据第一实体和第二实体的关系以及第二实体确定目标话术,并将目标话术回复给用户。

图1中,电子设备1为台式电子设备或移动电子设备,台式电子设备如电视、电脑等,移动电子设备如手机、平板电脑、笔记本电脑、智能机器人、便携式可穿戴设备等。服务器是独立设置的服务器或至少一个服务器组成的服务器集群等,本公开实施例并不限制。

图2是本公开实施例提供的智能问答方法的流程图。本实施例是从电子设备和服务器交互的角度进行说明。本实施例包括:

101、服务器接收待处理查询语句。

服务器接收用户通过输入输出设备,如键盘、鼠标、麦克风等输入的待处理查询语句。或者,服务器接收来自电子设备的待处理查询语句。例如,,用户能够通过电子设备中部署的应用程序(application,APP)与服务器进行人机交互。用户可通过语音方式或文本方式向电子设备输入查询语句,一条查询语句也称为一条query。当用户以文本方式输入查询语句时,服务器能够直接识别出文字内容。当用户以语音方式输入时,电子设备或服务器能够利用自然语言处理(Natural Language Processing,NLP)等方式识别出文字内容。

102、利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分,所述预设模型是预先利用至少一个问题答案QA对训练得到的。

其中,所述至少一个三元组中的每个三元组包含第一实体,所述待处理查询语句包含所述第一实体。

示例性的,服务器上预先存储预设模型,该预设模型的输入是待查询语句和一个三元组,输出是待查询语句和三元组的相关分。

三元组为知识图谱的三元组,一个三元组也成为一个关系序列。知识图谱中的三元组采用如下方式进行表示:<实体1,关系,实体2>。例如:<衣服,尺码,XL>;再如:<衣服,款式,韩版>。

服务器接收到待处理查询语句后,从待处理查询语句中确定一个关键实体,以下称为第一实体。例如,服务器预先采用序列标注算法训练出一个实体识别模型。该实体识别模型的输入是待处理查询语句,输出是待处理查询语句包含的第一实体。其中,序列标注算法可以为条件随机场(conditional random field,CRF)算法、双向长短期记忆网络条件随机场(Bi-directional-Long Short-Term Memory conditional random field,BiLSTM-CRF)算法、双向编码器双向长短期记忆网络条件随机场(Bidirectional EncoderRepresentationsfrom Transformers-Long Short-Term Memory conditional randomfield,Bert-BiLSTM-CRF)算法等。

之后,服务器根据该第一实体确定至少一个包含第一实体的三元组,得到至少一个三元组。例如,服务器上预先存储每个实体所属的三元组,服务器得到第一实体后,查询预存的三元组就能够得到至少一个三元组。

再如,知识图谱(knowledge graph,KG)本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示一个实体,每条边表示实体与实体之间的关系。其中,实体指具有可区别性且独立存在的某种事物,例如某一个人、某一个城市、某一种植物、某一种商品等。知识图谱是关系的最有效的表示方式,旨在描述真实世界中存在的各种实体或概念及其关系。知识图谱通过将数据结构化,输出主体(subject)、谓词(property)、客体(object)三元组(SPO)。因此,服务器得到第一实体后,利用该第一实体对知识图谱中的实体进行匹配,如部分匹配或全部匹配,就能够得到包含该第一实体的至少一个三元组。此处的匹配是指从知识图谱中找到第一实体或第一实体的近义词、同义词等。

采用该种方案,通过知识图谱确定包含待查询语句中的第一实体的至少一个三元组,速度快且准确率高。

服务器得到至少一个三元组后,将待查询语句和至少一个三元组中的每个三元组以此输入至预设模型,就能得到待查询语句和每个三元组的相关分。

103、根据所述至少一个相关分,从所述至少一个三元组中确定目标三元组。

对于同一个第一实体,不同的三元组中的第二实体不同。例如,两个三元组分别为:<衣服,尺码,XL>、<衣服,款式,韩版>。因此,服务器需要从至少一个三元组中确定目标三元组。例如,服务器将相关分最高的三元组作为目标三元组。再如,服务器从至少一个相关分中确定最高相关分,判断该最高相关分是是否超过预设阈值。若最高相关分超过预设阈值,则将该最高相关分对应的三元组作为目标三元组;若最高相关分未超过预设阈值,则服务器认为该些三元组中不存在目标三元组。

104、根据所述目标三元组包含的所述第一实体、第二实体、所述第一实体和所述第二实体的关系,确定目标话术。

服务器确定目标三元组后,根据目标三元组中的第一实体、第二实体、第一实体与第二实体之间的关系,确定目标话术并完善。例如,服务器将第一实体和目标三元组中的关系进行拼接,到知识图谱中找到要回答的实体。

105、发送所述目标话术。

服务器输出完善后的目标话术。例如,服务器将目标话术显示在显示屏上;再如,服务器播放目标话术;又如,服务器将目标话术术发送给电子设备,供用户查看。与用户输入查询语句类似,服务器可通过语音的方式发送目标话术,也可以通过文本或图片的方式发送目标话术,本公开实施例并不限制。

本公开实施例提供的智能问答方法,服务器上预先部署预设模型。当服务器接收到用户输入的待处理查询语句后,从待处理查询语句中确定第一实体,并确定包含第一实体的至少一个三元组。然后,服务器将待查询语句和至少一个三元组中的每个三元组以此输入至预设模型,就能得到待查询语句和每个三元组的相关分,根据至少一个相关分从至少一个三元组中确定目标三元组,根据目标三元组包含的第二实体、第一实体和第二实体的关系,确定目标话术并返回给电子设备。采用该种方案,服务器通过构建预设模型,借助知识图谱定位用户的需求以进行智能导购,节省客服系统的人力成本并提高响应效率。

上述实施例中,服务器利用所述第一实体和知识图谱,确定所述至少一个三元组之前,从所述待处理查询语句中确定至少两个第五实体,所述至少两个第五实体中的各第五实体重名。接着,服务器根据所述待处理查询语句的上下文,从所述至少两个第五实体中确定所述第一实体。

示例性的,很多实体具有重名的特性,为了进行精确定位,需要依赖于待处理查询语句的上下文进行实体消歧。实体消歧也称为实体链接等。

例如,用户想要购买张三的歌曲,但是张三这个实体有很多,某个张三是个歌手,另外一个张三是体育明星。用户的输入的待处理查询语句为:张三的歌曲。服务器从该查询语句中提取出两个第五实体,分别为歌手张三以及体育明星张三。此时,服务器结合上下文发现用户其实找的是歌手张三,因此,服务器认为第一实体实际上是歌手张三。

采用该种方案,服务器通过实体消歧技术,对用户的意图进行精确定位,实现准确答复用户的目的。

上述实施例中,服务器利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,还利用历史查询语句构建预设模型。示例性的,请参照图3,图3是本公开实施例提供的智能问答方法中构建预设模型的流程图。本实施例包括:

201、获取至少一个问题答案QA对。

示例性的,服务器上预先存储很至少一个问题答案(query answer,QA)对,每个对中的query为历史查询语句,answer为用户与人工客服进行沟通时,人工客服回复用户的话术;或者,answer为预定义的回复话术。历史查询语句为过去一段时间用户内用户提出的查询语句,一条查询语句也称为一条query。对于同一个商家,假设该商家提供的商品包括衣服和鞋子,则该历史查询语句包括购买鞋子的咨询和购买衣服的售前咨询。

202、根据所述至少一个问题答案QA对,确定至少一个实体对。

其中,所述实体对包含第三实体和第四实体,所述第三实体包含在所述QA对中的问题中,所述第四实体包含在所述QA中的回答话术中。

示例性的,服务器获取到至少一个QA对后,对于每个QA对,服务器从该QA对包含的query中确定第三实体,从该QA对包含的answer(即回复话术)中确定第四实体,该第三实体和第四实体构成一个实体对。

确定实体对的过程中,对于所述至少一个QA对中的每个QA对,对所述QA对包含的查询语句进行分词,得到第一词语集合,对所述QA对包含的回答话术进行分词,得到第二词语集合。由于第一词语集合中可能存在至少一个词语,该些词语中有的是实体,有的不是实体。因此,服务器需要从该些词语中过滤掉非实体的词语。之后,从剩余的词语中抽取出关键词,将该关键词作为第三实体。例如,服务器确定剩余的词语中每个词语的词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)值,将TF-IDF值最大的词语作为第三实体。同理,服务器能够从第二词语集合中确定第四实体。之后,服务器根据第三实体和第四实体查询知识图谱,从而确定每个实体对中第三实体和第四实体之间的关系。

采用该种方案,服务器对至少一个QA对进行挖掘,通过实体识别、关系抽取等确定至少一个实体对,进而实现借助知识图谱技术定位用户需求的目的。

203、确定所述至少一个实体对中每个实体对包含的两个实体之间的关系。

示例性的,对于每个QA对,服务器通过实体识别定位出query中的第三实体,通过实体识别定位出该QA对包含的answer中的第四实体后,利用第三实体和第四实体查询知识图谱,就能够确定第三实体和第四实体的关系(relation),将该关系作为模型的输入。

204、根据至少一条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型。

其中,所述多条历史查询语句为所述至少一个QA对中的问题。

示例性的,服务器根据至少一个QA对中每个QA对包含的query得到多条历史查询语句,利用该些历史查询语句和上述的至少一个实体中实体对的关系不断的训练初始模型,以使得初始模型达到最优状态,将最优状态的初始模型作为预设模型。其中,初始模型例如为深度语义模型(Deep Structured Sematic models,DSSM)、卷积神经网络(Convolutional Neural Networks,CNN)模型、深度神经网络(Deep Neural Networks,DNN)、循环神经网络((recurrent neural network,RNN)等。

采用该种方案,服务器采用自动挖掘的方式,对用户和人工客服的导购沟通语料进行挖掘,得到两个实体之间的关系,进而利用至少一个实体对各种包含的两个实体的关系以及多条历史查询语句训练出预设模型,进而实现借助知识图谱技术定位用户需求的目的。

上述图3实施例步骤204中,服务器根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型时,将所述多条历史查询语句中的每条历史查询语句包含的第三实体替换为通配符,得到多条中间查询语句。之后,服务器利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型。

示例性的,对于多条历史查询语句中的每条历史查询语句,服务器用一个通配符替换该历史查询语句中的第三实体,得到新的查询语句,以下将该新的查询语句成为中间查询语句。其中,通配符例如为等。之后,服务器将中间查询语句和实体对中实体的关系作为输入训练初始模型,从而得到预设模型。

采用该种方案,服务器将通配符替换后的中间查询语句和关系作为输入训练出预设模型,进而实现借助知识图谱技术定位用户需求的目的。

上述实施例中,服务器利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型时,先确定所述多条中间查询语句中每条中间查询语句对应的第一向量,得到至少一个第一向量。然后,服务器确定所述至少一个实体对中每个实体对包含的两个实体之间的关系的第二向量,得到至少一个第二向量。之后,服务器根据所述至少一个第一向量和所述至少一个第二向量,训练所述预设模型。

示例性的,中间查询语句和实体对是一一对应的。训练预设模型的过程中,服务器利用预设模型的双向循环神经网络(Bi-directional Recurrent Neural Network,Bi-RNN)确定中间查询语句的第一向量,服务器利用预设模型的CNN确定实体对包含的两个实体的关系的第二向量,该第一向量和第二向量为相同维度的向量。然后,服务器对这两个向量进行相减、元素相乘后拼接等,将处理结果输入至预设模型的损失函数层进行相关性的识别。其中,损失函数层的损失函数例如为sigmoid损失函数等,本公开实施例并不限制。

采用该种方案,服务器将通配符替换后的中间查询语句输入至Bi-RNN,将实体对包含的两个实体的关系输入至CNN得到两个相同维度的向量,然后根据这俩个向量得到预设模型,进而实现借助知识图谱技术定位用户需求的目的。

根据上述可知:本公开实施例提供的智能问答方法,主要包括:实体识别、实体链接、关系抽取和知识匹配返回这四个阶段。实体识别过程中,针对当前待处理查询语句,通过实体识别找到第一实体。由于很多实体具有重名的特性,为了精确定位,需要依赖于待处理查询语句的上下文进行实体消歧。因此,实体链接过程就是通过实体链接技术进行实体消歧的过程。关系抽取过程中,服务器从知识图谱中抽取出实体的所有关系,即至少一个三元组。最后,知识匹配返回阶段中,服务器利用预设模型,确定当前的待处理查询语句和至少一个三元组中每个三元组的相关分,从而定位出目标三元组,根据目标三元组得到目标话术。

因此,采用本公开实施例所述的方法,通过实体识别、实体链接、关系抽取和知识匹配返回来进行智能导购,从而借助知识图谱技术来帮助智能客服系统更容易的定位用户需求,节省人力和提高效率

对应于上文实施例的智能问答方法,图4为本公开实施例提供的一种智能问答装置的结构框图。为了便于说明,仅示出了与本公开实施例相关的部分。参照图4,所述智能问答装置包括:接收单元11、第一确定单元12、第二确定单元13、第三确定单元14和发送单元15。

接收单元11,用于接收待处理查询语句。

第一确定单元12,用于利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分,所述至少一个三元组中的每个三元组包含第一实体,所述待处理查询语句包含所述第一实体,所述预设模型是预先利用至少一个问题答案QA对训练得到的。

第二确定单元13,用于根据所述至少一个相关分,从所述至少一个三元组中确定目标三元组。

第三确定单元14,用于根据所述目标三元组包含的所述第一实体、第二实体、所述第一实体和所述第二实体的关系,确定目标话术。

发送单元15,用于发送所述目标话术。

图5为本公开实施例提供的另一种智能问答装置的结构框图。本实例提供的智能问答装置100在上述图4的基础上,还包括:

训练单元16,用于在所述第一确定单元12利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,获取至少一个问题答案QA对;根据所述至少一个问题答案QA对,确定至少一个实体对,所述实体对包含第三实体和第四实体,所述第三实体包含在所述QA对中的问题中,所述第四实体包含在所述QA中的回答话术中;确定所述至少一个实体对中每个实体对包含的两个实体之间的关系;根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型,所述多条历史查询语句为所述至少一个QA对中的问题。

在本公开的一个实施例中,所述训练单元16根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型时,用于将所述多条历史查询语句中的每条历史查询语句包含的第三实体替换为通配符,得到多条中间查询语句;利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型。

在本公开的一个实施例中,所述训练单元16利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型时,用于确定所述多条中间查询语句中每条中间查询语句对应的第一向量,得到至少一个第一向量;确定所述至少一个实体对中每个实体对包含的两个实体之间的关系的第二向量,得到至少一个第二向量;根据所述至少一个第一向量和所述至少一个第二向量,训练所述预设模型。

在本公开的一个实施例中,所述训练单元16根据所述至少一个问题答案QA对,确定至少一个实体对时,对于所述至少一个QA对中的每个QA对,对所述QA对包含的查询语句进行分词,得到第一词语集合,对所述QA对包含的回答话术进行分词,得到第二词语集合;从所述第一词语集合中确定所述第三实体,从所述第二词语集合中确定所述第四实体;利用知识图谱确定所述第三实体和所述第四实体之间的关系。

在本公开的一个实施例中,所述第一确定模块利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,还用于从所述待处理查询语句中确定所述第一实体;利用所述第一实体和知识图谱,确定所述至少一个三元组。

在本公开的一个实施例中,所述第一确定模块利用所述第一实体和知识图谱,确定所述至少一个三元组之前,还用于从所述待处理查询语句中确定至少两个第五实体,所述至少两个第五实体中的各第五实体重名,根据所述待处理查询语句的上下文,从所述至少两个第五实体中确定所述第一实体。

本实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。

图6为用来实现本公开实施例的电子设备的结构示意图,该电子设备200可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑(PortableAndroid Device,简称PAD)、便携式多媒体播放器(Portable Media Player,简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示,电子设备200可以包括处理装置(例如中央处理器、图形处理器等)201,其可以根据存储在只读存储器(Read Only Memory,简称ROM)202中的程序或者从存储装置208加载到随机访问存储器(Random Access Memory,简称RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有电子设备200操作所需的各种程序和数据。处理装置201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。

通常,以下装置可以连接至I/O接口205:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置206;包括例如液晶显示器(Liquid CrystalDisplay,简称LCD)、扬声器、振动器等的输出装置207;包括例如磁带、硬盘等的存储装置208;以及通信装置209。通信装置209可以允许电子设备200与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备200,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置209从网络上被下载和安装,或者从存储装置208被安装,或者从ROM202被安装。在该计算机程序被处理装置201执行时,执行本公开实施例的方法中限定的上述功能。

需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network,简称LAN)或广域网(Wide Area Network,简称WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

第一方面,根据本公开的一个或多个实施例,提供了一种智能问答方法,包括:接收用户通过电子设备发送的待处理查询语句;利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分,所述至少一个三元组中的每个三元组包含第一实体,所述待处理查询语句包含所述第一实体,所述预设模型是预先利用至少一个问题答案QA对训练得到的;根据所述至少一个相关分,从所述至少一个三元组中确定目标三元组;根据所述目标三元组包含的所述第一实体、第二实体、所述第一实体和所述第二实体的关系,确定目标话术;发送所述目标话术。

根据本公开的一个或多个实施例,所述利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,还包括:获取至少一个问题答案QA对;根据所述至少一个问题答案QA对,确定至少一个实体对,所述实体对包含第三实体和第四实体,所述第三实体包含在所述QA对中的问题中,所述第四实体包含在所述QA中的回答话术中;确定所述至少一个实体对中每个实体对包含的两个实体之间的关系;根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型,所述多条历史查询语句为所述至少一个QA对中的问题。

根据本公开的一个或多个实施例,所述根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型,包括:将所述多条历史查询语句中的每条历史查询语句包含的第三实体替换为通配符,得到多条中间查询语句;利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型。

根据本公开的一个或多个实施例,所述利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型,包括:确定所述多条中间查询语句中每条中间查询语句对应的第一向量,得到至少一个第一向量;确定所述至少一个实体对中每个实体对包含的两个实体之间的关系的第二向量,得到至少一个第二向量;根据所述至少一个第一向量和所述至少一个第二向量,训练所述预设模型。

根据本公开的一个或多个实施例,所述根据所述至少一个问题答案QA对,确定至少一个实体对,包括:对于所述至少一个QA对中的每个QA对,对所述QA对包含的查询语句进行分词,得到第一词语集合,对所述QA对包含的回答话术进行分词,得到第二词语集合;从所述第一词语集合中确定所述第三实体,从所述第二词语集合中确定所述第四实体;利用知识图谱确定所述第三实体和所述第四实体之间的关系。

根据本公开的一个或多个实施例,所述利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,还包括:从所述待处理查询语句中确定所述第一实体;利用所述第一实体和知识图谱,确定所述至少一个三元组。

根据本公开的一个或至少一个实施例,所述利用所述第一实体和知识图谱,确定所述至少一个三元组之前,还包括:从所述待处理查询语句中确定至少两个第五实体,所述至少两个第五实体中的各第五实体重名;根据所述待处理查询语句的上下文,从所述至少两个第五实体中确定所述第一实体。

第二方面,根据本公开的一个或多个实施例,提供了一种智能问答装置,包括:

接收单元,用于接收待处理查询语句。

第一确定单元,用于利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分,所述至少一个三元组中的每个三元组包含第一实体,所述待处理查询语句包含所述第一实体,所述预设模型是预先利用至少一个问题答案QA对训练得到的。

第二确定单元,用于根据所述至少一个相关分,从所述至少一个三元组中确定目标三元组。

第三确定单元,用于根据所述目标三元组包含的所述第一实体、第二实体、所述第一实体和所述第二实体的关系,确定目标话术。

发送单元,用于向所述电子设备发送所述目标话术。

根据本公开的一个或多个实施例,上述的装置还包括:训练单元,用于在所述第一确定单元利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,获取至少一个问题答案QA对;根据所述至少一个问题答案QA对,确定至少一个实体对,所述实体对包含第三实体和第四实体,所述第三实体包含在所述QA对中的问题中,所述第四实体包含在所述QA中的回答话术中;确定所述至少一个实体对中每个实体对包含的两个实体之间的关系;根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型,所述多条历史查询语句为所述至少一个QA对中的问题。

根据本公开的一个或多个实施例,所述训练单元根据多条历史查询语句和所述至少一个实体对中每个实体对包含的实体的关系,训练所述预设模型时,用于将所述多条历史查询语句中的每条历史查询语句包含的第三实体替换为通配符,得到多条中间查询语句;利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型。

根据本公开的一个或多个实施例,所述训练单元利用所述多条中间查询语句和所述至少一个实体对中每个实体对包含的两个实体之间的关系,训练所述预设模型时,用于确定所述多条中间查询语句中每条中间查询语句对应的第一向量,得到至少一个第一向量;确定所述至少一个实体对中每个实体对包含的两个实体之间的关系的第二向量,得到至少一个第二向量;根据所述至少一个第一向量和所述至少一个第二向量,训练所述预设模型。

根据本公开的一个或多个实施例,所述训练单元根据所述至少一个问题答案QA对,确定至少一个实体对时,对于所述至少一个QA对中的每个QA对,对所述QA对包含的查询语句进行分词,得到第一词语集合,对所述QA对包含的回答话术进行分词,得到第二词语集合;从所述第一词语集合中确定所述第三实体,从所述第二词语集合中确定所述第四实体;利用知识图谱确定所述第三实体和所述第四实体之间的关系。

根据本公开的一个或多个实施例,所述第一确定模块利用预设模型确定所述待处理查询语句和至少一个三元组中的每个三元组的相关分,得到至少一个相关分之前,还用于从所述待处理查询语句中确定所述第一实体;利用所述第一实体和知识图谱,确定所述至少一个三元组。

根据本公开的一个或多个实施例,所述第一确定模块利用所述第一实体和知识图谱,确定所述至少一个三元组之前,还用于从所述待处理查询语句中确定至少两个第五实体,所述至少两个第五实体中的各第五实体重名,根据所述待处理查询语句的上下文,从所述至少两个第五实体中确定所述第一实体。

第三方面,根据本公开的一个或多个实施例,提供了一种电子设备,包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的智能问答方法。

第四方面,根据本公开的一个或多个实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的智能问答方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

相关技术
  • 计算机可读存储介质、智能问答方法及智能问答装置
  • 智能问答方法、装置、电子设备和计算机可读存储介质
技术分类

06120112168363