掌桥专利:专业的专利平台
掌桥专利
首页

针对反馈内容的用户意图识别方法、装置及电子设备

文献发布时间:2023-06-19 09:24:30


针对反馈内容的用户意图识别方法、装置及电子设备

技术领域

本发明涉及自然语言处理技术领域,特别是涉及一种针对反馈内容的用户意图识别方法、装置及电子设备。

背景技术

为了更好提升用户体验,产品供应商往往会设置产品意见反馈中心接收用户针对产品的反馈内容,工作人员需要根据用户的反馈内容确定用户的反馈意图,如用户是对产品某一功能不满、或用户是在寻求帮助等,进而可以根据用户的反馈意图针对性的进行处理。

现有技术中,需要工作人员自行基于用户的反馈内容确定用户的反馈意图,效率较低。

发明内容

本发明实施例的目的在于提供一种针对反馈内容的用户意图识别方法,以提高基于用户的反馈内容确定用户的反馈意图的效率。具体技术方案如下:

第一方面,本发明实施例提供了一种针对反馈内容的用户意图识别方法,包括:

获取待识别的目标反馈内容;

基于预设的关于各个分类条件与意图类别的对应关系,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别;其中,每一分类条件对应的意图类别为满足该分类条件的反馈内容所能够表征的意图类别;

若判断出所述初始类别为指定类别,利用预先训练的意图分类模型,确定所述目标反馈内容的意图识别结果;

否则,将所述初始类别确定为所述目标反馈内容的意图识别结果;

其中,所述指定类别为存在相似意图类别的意图类别;所述意图分类模型为基于多个样本反馈内容训练得到的分类模型,所述多个样本反馈内容包括:能够表征所述指定类别的样本反馈内容,以及能够表征所述指定类别的相似意图类别的样本反馈内容。

可选的,在基于预设的关于各个分类条件与意图类别的对应关系,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别之前,所述方法还包括:

生成表示所述目标反馈内容的句向量,作为目标向量;

计算所述目标向量与聚类空间内每一类簇的距离,其中,所述聚类空间为基于样本反馈内容的句向量所建立的,所述聚类空间内每一类簇与一意图类别关联;

确定与所述目标向量之间的距离小于预设阈值的目标类簇,并确定与所述目标类簇所关联的意图类别,作为预选类别;

所述基于预设的关于各个分类条件与意图类别的对应关系,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别,包括:

基于预设的关于各个分类条件与意图类别的对应关系以及所述预选类别,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别。

可选的,所述基于预设的关于各个分类条件与意图类别的对应关系以及所述预选类别,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别,包括:

从预设的关于各个分类条件与意图类别的对应关系,查找与所述预选类别对应的分类条件;

从所查找的分类条件中,确定所述目标反馈内容所满足的分类条件,并基于所述对应关系,确定与所目标反馈内容所满足分类条件对应的意图类别,作为初始类别。

可选的,所述生成表示所述目标反馈内容的句向量,包括:

确定所述目标反馈内容中所包含的关键分词,其中,所述关键分词为属于预设分词类型的分词;

生成所述关键分词的词向量,并基于所述关键分词的词向量,生成表示所述目标反馈内容的句向量。

可选的,所述意图分类模型为:基于随机森林分类模型训练的意图分类模型。

可选的,所述方法还包括:

按照预先设定的关于预设分词与所述意图识别结果下的子类别之间的映射关系,确定与所述目标反馈内容所包含预设分词存在映射关系的子类别,作为所述目标反馈内容的子类别。

第二方面,本发明实施例提供了一种针对反馈内容的用户意图识别装置,包括:

内容获取模块,用于获取待识别的目标反馈内容;

类别确定模块,用于基于预设的关于各个分类条件与意图类别的对应关系,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别;其中,每一分类条件对应的意图类别为满足该分类条件的反馈内容所能够表征的意图类别;

结果确定模块,用于若判断出所述初始类别为指定类别,利用预先训练的意图分类模型,确定所述目标反馈内容的意图识别结果;否则,将所述初始类别确定为所述目标反馈内容的意图识别结果;

其中,所述指定类别为存在相似意图类别的意图类别;所述意图分类模型为基于多个样本反馈内容训练得到的分类模型,所述多个样本反馈内容包括:能够表征所述指定类别的样本反馈内容,以及能够表征所述指定类别的相似意图类别的样本反馈内容。

可选的,所述装置还包括:

向量生成模块,用于在所述类别确定模块执行基于预设的关于各个分类条件与意图类别的对应关系,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别之前,生成表示所述目标反馈内容的句向量,作为目标向量;

距离计算模块,用于计算所述目标向量与聚类空间内每一类簇的距离,其中,所述聚类空间为基于样本反馈内容的句向量所建立的,所述聚类空间内每一类簇与一意图类别关联;

类簇确定模块,用于确定与所述目标向量之间的距离小于预设阈值的目标类簇,并确定与所述目标类簇所关联的意图类别,作为预选类别;

所述类别确定模块,具体用于基于预设的关于各个分类条件与意图类别的对应关系以及所述预选类别,确定与所述目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别。

可选的,所述类别确定模块,具体用于从预设的关于各个分类条件与意图类别的对应关系,查找与所述预选类别对应的分类条件,并且从所查找的分类条件中,确定所述目标反馈内容所满足的分类条件,并基于所述对应关系,确定与所目标反馈内容所满足分类条件对应的意图类别,作为初始类别。

可选的,所述向量生成模块,具体用于确定所述目标反馈内容中所包含的关键分词,其中,所述关键分词为属于预设分词类型的分词,并且生成所述关键分词的词向量,并基于所述关键分词的词向量,生成表示所述目标反馈内容的句向量。

可选的,所述意图分类模型为:基于随机森林分类模型训练的意图分类模型。

可选的,所述装置还包括:

子类别确定模块,用于按照预先设定的关于预设分词与所述意图识别结果下的子类别之间的映射关系,确定与所述目标反馈内容所包含预设分词存在映射关系的子类别,作为所述目标反馈内容的子类别。

第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现权利要求第一方面所提供的方法步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所提供的方法步骤。

本发明实施例所提供的针对反馈内容的用户意图识别方法中,由于预先建立了各个分类条件与意图类别的对应关系,进而可以确定与目标反馈内容所满足的分类条件相对应的意图类别,并进一步当初始类别为指定类别,利用意图分类模型确定目标反馈内容的意图识别结果,否则将初始类别确定为目标反馈内容的意图识别结果。可见,本方案可以避免人工基于用户的反馈内容确定用户的反馈意图,实现了自动识别目标反馈内容的用户意图,因此可以提高识别效率。

另外,本方案采用关于各个分类条件与意图类别的对应关系,以及意图分类模型相结合的方式,可以使得通过对应关系所得到的初始类别存在相似类别时,对初始类别进行修正,因此,可以进一步保证意图识别的准确度。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明一个实施例提供的针对反馈内容的用户意图识别方法的流程图;

图2为本发明一个实施例提供的针对反馈内容的用户意图识别方法的另一流程图;

图3为本发明一个实施例提供的针对反馈内容的用户意图识别装置的结构示意图;

图4为本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了提高基于用户的反馈内容确定用户的反馈意图的效率,本发明实施例提供了针对反馈内容的用户意图识别方法、装置及电子设备。

其中,本发明实施例所提供的一种针对反馈内容的用户意图识别方法应用于电子设备。在具体应用中,该电子设备可以为服务器,也可以为智能手机、平板电脑等终端设备。

在本发明的一个实施例中,提供一种针对反馈内容的用户意图识别方法,如图1所示,该方法包括以下步骤:

S101,获取待识别的目标反馈内容。

本步骤中,电子设备可以接收用户针对产品反馈的反馈内容,即反馈文本,并将接收到的反馈内容作为目标反馈内容。当然,电子设备还可以从意见反馈中心获取目标反馈内容。其中,意见反馈中心为用于收集、存储用户针对产品的评论、建议和疑问等反馈内容的数据中心,因此,电子设备可以从意见反馈中心中用于存储用户针对产品的反馈内容的数据库中,读取反馈内容,并将读取到的反馈内容作为目标反馈内容。

上述目标反馈内容可以为用户针对产品的评论、意见和疑问等内容。例如,针对清理工具类应用软件,目标反馈内容可以为“如何清理应用垃圾”、“误删除文件该怎么办”等。

上述目标反馈内容还可以为对所接收、获取得到的反馈内容进行预处理后的反馈内容,其中,预处理用于去除反馈内容中所包含的表情、符号、无意义的重复文字等特殊字符。

S102,基于预设的关于各个分类条件与意图类别的对应关系,确定与目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别;其中,每一分类条件对应的意图类别为满足该分类条件的反馈内容所能够表征的意图类别。

其中,意图类别可以基于产品所具备的功能点进行预先设置。例如,以聊天软件举例说明,意见类别可以包括聊天类别、通讯录类别和群聊类别等。当然,意图类别也可以基于所收集的样本反馈内容进行确定。

为了自动识别意图类别,可以预先收集大量反馈内容,并利用该大量反馈内容所表征的意图类别以及反馈内容自身的文本信息,建立关于各个分类条件与意图类别的对应关系,每一分类条件对应的意图类别为满足该分类条件的反馈内容所能够表征的意图类别。基于该对应关系,当需要识别出目标反馈内容的用户意图时,可以判断在预先设置的分类条件中,目标反馈内容所满足的分类条件,进而将与目标反馈内容所满足的分类条件对应的意图类别确定为初始类别。与每一意图类别对应的分类条件可以基于关键词进行设置,其中,该关键词与能够表征该意图类别的反馈内容相关,如能够表征该意图类别的反馈内容可能包含的词汇。此时,该关于各个分类条件与意图类别的对应关系可以被称为一种关键词图谱,通过该关键词图谱中的关于关键词的分类条件,可以确定出相应的意图类别。

举例而言,意图类别包括界面显示类别和文件处理类别,当反馈内容中出现“图标”、“字体”、“背景”词汇时,该反馈内容大概率为界面显示类别。因此,以“图标”、“字体”、“背景”作为关键词,来设置与界面显示类别对应的分类条件。例如,与界面显示类别对应的分类条件可以为:反馈内容中包含“背景”,那么,当目标反馈内容中包含“背景”时,则确定目标反馈内容属于界面显示类别。

另外,与每一意图类别对应的分类条件的设置还可以结合反馈内容的句式、反馈内容的情感倾向以及关键词在反馈内容中所处的位置、实际的需求等不同维度信息进行设置,本发明对此不作具体限定。

S103,若判断出初始类别为指定类别,利用预先训练的意图分类模型,确定目标反馈内容的意图识别结果;否则,将初始类别确定为目标反馈内容的意图识别结果;其中,指定类别为存在相似意图类别的意图类别;意图分类模型为基于多个样本反馈内容训练得到的分类模型,多个样本反馈内容包括:能够表征指定类别的样本反馈内容,以及能够表征指定类别的相似意图类别的样本反馈内容。

其中,由于分类条件和对应关系是人工基于经验和需求进行设定得到的,而人工所接触过的反馈意见是有限的,使得所设定的分类条件可能无法涵盖所有可能出现的情况,特别是对于多个相似的意图类别而言,往往导致目标反馈内容在字面上满足某一分类条件时,可能实际表征的意图类别是该分类条件对应意图类别的相似类别。

为了提高反馈意图识别的准确率,可以将较为相似的意图类别作为指定类别,进而使用预先训练的意图分类模型,确定目标反馈内容的意图识别结果,以对初始类别进行修正。若判断出初始类别为指定类别,利用预先训练的意图分类模型,确定目标反馈内容的意图识别结果,具体为:将目标反馈内容输入至预先训练的意图分类模型,得到目标反馈内容的意图识别结果。当初始类别不为指定类别时,通过步骤S102所得到的初始类别也是准确的,因此,可以将初始类别确定为目标反馈内容的意图识别结果。

举例而言,桌面锁类别和应用锁类别为相似两种意图类别,则桌面锁类别和应用锁类别均可作为指定类别。当桌面锁类别作为指定类别时,相似类别为应用所类别,以及当应用锁类别作为指定类别时,相似类别为桌面所类别。当初始类别为桌面锁类别,则通过意图分类模重新确定目标反馈内容所表征的是桌面锁类别,还是应用所类别。

可选的,可以预先设定多组类别各自的意图分类模型,其中,每一组类别中包括相似的多个意图类别。

在一种实现方式中,基于多个样本反馈内容对分类模型进行训练的方式,可以包括:

获取预先收集的用户针对产品的多个样本反馈内容,以及每一反馈内容的标定内容;其中,每一样本反馈内容包括:能够表征指定类别的样本反馈内容,以及能够表征指定类别的相似意图类别的样本反馈内容,每一样本反馈内容的标定内容为该样本反馈内容所能够表征的意图类别,且标定内容可以通过人工等方式确定得到;

以每一样本反馈内容和标定内容作为训练数据,对初始的意图分类模型进行训练。具体为:将每一样本反馈内容输入至初始的意图分类模型,得到该样本反馈内容的意图识别结果;基于各个样本反馈内容的意图识别结果和标定内容的差异,计算损失值;若损失值小于预定损失阈值,则判定该意图分类模型收敛,得到训练完成的意图分类模型,若损失值不小于预定损失值时,调节意图分类模型的网络参数,并返回将每一样本反馈内容输入至初始的意图分类模型,得到该样本反馈内容的意图识别结果的步骤,从而对该意图分类模型进行继续训练。其中,关于样本反馈内容的生成方式,可以参照关于目标反馈内容的生成方式,在此不做赘述。

上述意图分类模型可以为基于随机森林分类模型训练的意图分类模型。其中,随机森林分类模型是由一系列相互独立的决策树组合而成的,每一个决策树构成了整个随机森林算法的最小组成。当随机森林分类模型给定一个待分类的数据后,每个决策树都会互不影响地对输入进行独立判断,最终通过投票选定整个分类器最优的分类结果。单独的决策树决策能力往往比较薄弱,但是将一系列决策树进行集合,其决策能力将十分强大。

本实施例所提供方案中,可以预先建立各个分类条件与意图类别的对应关系,进而可以确定与目标反馈内容所满足的分类条件相对应的意图类别,并进一步当初始类别为指定类别,利用意图分类模型确定目标反馈内容的意图识别结果,否则将初始类别确定为目标反馈内容的意图识别结果。可见,本方案可以避免人工基于用户的反馈内容确定用户的反馈意图,实现了自动识别目标反馈内容的用户意图,因此可以提高识别效率。

另外,本方案采用关于各个分类条件与意图类别的对应关系,以及意图分类模型相结合的方式,可以使得通过对应关系所得到的初始类别存在相似类别时,对初始类别进行修正,因此,可以进一步保证意图识别的准确度。

基于图1的实施例,如图2所示,本发明的另一实施例所提供的针对反馈内容的用户意图识别方法,在S102之前,还可以包括:

S104,生成表示目标反馈内容的句向量,作为目标向量;

其中,可以基于目标反馈内容所包含分词的词向量生成表示目标反馈内容的句向量。具体而言,可以通过文本分割等方式获取目标反馈内容的分词,进而确定每一分词的词向量,再通过所确定词向量生成表示目标反馈内容的句向量。

S105,计算目标向量与聚类空间内每一类簇的距离,其中,聚类空间为基于样本反馈内容的句向量所建立的,聚类空间内每一类簇与一意图类别关联;

其中,由前述实施例可知,与每一分类条件对应的意图类别可以是基于所收集的样本反馈内容进行确定。具体而言,可以对所收集的样本反馈内容的的句向量进行聚类,生成聚类空间,并得到聚类后的多个类簇,进一步可以结合实际使用场景和需求为每一类簇设置关联的意图类别。

当确定目标反馈内容的目标向量后,可以在聚类空间中,计算目标向量与每一类簇的距离。其中,目标向量与每一类簇的距离可以为目标相邻与每一类簇的质心间的余弦距离。而每一类簇的质心为每一类簇所包含句向量的均值。

S106,确定与目标向量之间的距离小于预设阈值的目标类簇,并确定与目标类簇所关联的意图类别,作为预选类别。

其中,预设阈值可以基于需求和经验进行确定。

示例性的,聚类空间包含三个类簇,分别为类簇A、类簇B和类簇C,并且与类簇A关联的意图类别为意图类别A,与类簇B关联的意图类别为意图类别B,与类簇C关联的意图类别为意图类别C。通过计算,确定目标相邻与类簇A的距离为0.2、与类簇B的距离为0.4以及与类簇C的距离为0.6。当预设阈值为0.5时,可以确定类簇A和类簇B为目标类簇。并进一步确定意图类别A和意图类别为预选类别。

相应的,在得到预先类别后,在一种实现方式中,上述步骤S102可以包括如下步骤:

S102A,基于预设的关于各个分类条件与意图类别的对应关系以及预选类别,确定与目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别。

其中,可选地,在一种实现方式中,为了提高用户意图识别的准确率,可以从各个分类条件中确定目标反馈内容所满足的分类条件,当目标反馈内容所满足的分类条件有多个时,可以基于预选类别,从所确定的多个分类条件中确定出初始类别。例如,可以先确定与多个分类条件中每一分类条件对应的意图类别,判断所确定的意图类别中是否存在预选类别,当存在时,将该预选类别作为初始类别。

示例性的,预设的分类条件包括条件1、条件2和条件3,与条件1对应的意图类别为类别1、与条件2对应的意图类别为类别2、与条件3对应的意图类别为类别3。当目标反馈内容同时满足条件1和条件2,而预选类别为类别1时,可以将类别1作为初始类别。

可选的,在另一种实现方式中,为了提高用户意图识别的效率,可以按照以下方式确定初始类别:

从预设的关于各个分类条件与意图类别的对应关系,查找与预选类别对应的分类条件;从所查找的分类条件中,确定目标反馈内容所满足的分类条件,并基于对应关系,确定与所目标反馈内容所满足分类条件对应的意图类别,作为初始类别。

示例性的,预设的分类条件包括条件1、条件2和条件,与条件1对应的意图类别为类别1、与条件2对应的意图类别为类别2、与条件3对应的意图类别为类别3。当预选类别为类别1和类别2时,从可以从条件1和条件2中确定目标反馈内容所满足的分类条件,并将目标反馈内容所满足分类条件对应的意图类别,作为初始类别。

本实施例所提供方案中,可以基于目标反馈内容的句向量从各个意图类别中筛选出目标反馈内容可能满足的预选类别,并进一步的结合预选类别和分类条件确定出目标反馈内容的初始类别,可以提高用户意图识别的准确率和效率。

可选地,本发明的另一实施例中,上述步骤S104可以包括如下步骤:

确定目标反馈内容中所包含的关键分词,其中,关键分词为属于预设分词类型的分词;生成关键分词的词向量,并基于关键分词的词向量,生成表示目标反馈内容的句向量。

其中,在确定关键分词之前,可以对目标反馈内容进行数据处理,以去除目标反馈内容中的表情等特殊字符。

上述关键分词为属于预设类型的词汇,其中,预设类型可以根据实际需求和经验确定。例如,预设类型可以包括功能类型、情感类型以及请求类型,其中,功能类型的词汇可以为描述应用程序功能点的词汇,如“界面”、“应用锁”、“垃圾清理”等。情感类型的词汇可以为描述情感倾向的词汇,如“很好”、“不错”、“喜欢”、“很差”、“太差了”、“不喜欢”等,请求类型的词汇可以为描述所需请求的词汇,如“怎么办”、“如何设置”、“怎么恢复”等。

为了准确的确定出目标反馈内容中所包含的关键分词,预先建立关键词典,其中关键词典中包含预设类型的的分词。关键词典可以基于结巴分词自定义词典进行建立。例如,将结巴分词自定义词典中自定义关键词部分作为关键词典。当获取到目标反馈内容后,可以查找出目标反馈内容中出现在关键词词典中的分词,即为目标反馈内容的关键分词。

上述生成的词向量的维度可以基于经验和场景进行确定。在预先确定出词向量的维度后,可以采用多种方式生成关键分词的词向量,例如可以两种方式中的一种方式生成关键分词的词向量:

第一种方式:可以利用TF-IDF(Term Frequency-Inverse Document Frequenc y,词频-反向文档频率)算法生成关键分词的词向量。

第二种方式:可以基于词向量模型生成关键分词的词向量。词向量模型可以为word2vec词向量模型,也可以为GloVe(Global vectors for word representation,字表示的全局向量)词向量模型,选择何种模型可以结合实际需求确定。

在生成关键分词的词向量后,可以基于该词向量生成表示目标反馈内容的句向量,其中,表示目标反馈内容的句向量和关键分词的词向量的维度相同。

可选的,在一种实现方式中,可以基于关键分词的词向量和非关键分词的词向量,计算目标反馈内容的句向量,其中,非关键分词为目标反馈内容所包含的分词中除关键分词以外的分词。

其中,可以预先构建出引入结巴分词自定义词典的关键词词典,该关键词词典中包含自定义的关键分词,该自定义的关键分词可以是结合实际所使用的场景、经验以及样本集进行确定,同时,结巴分词自定义词典中还存在通用词典。当获取到目标反馈内容后,可以筛选出包含于结巴分词自定义词典中的关键分词,和包含于通用词典中的非关键分词。

进而按照相同的维度生成关键分词的词向量和非关键分词的词向量,可以对关键分词的词向量和非关键分词的词向量进行向量间的运行,以计算目标反馈内容的句向量。

可选的,可以按照以下两种方式中的一种方式计算目标反馈内容的句向量:

第一种方式:计算目标反馈内容的词长度与关键分词的词向量的乘积,得到第一词向量;对第一词向量和非关键分词的词向量进行加权平均,以生成目标反馈内容的句向量。

本方式中,目标反馈内容的词长度为目标反馈内容所分割出分词的数量,即关键分词和非关键分词的数量和。通过词长度与关键分词的词向量相乘可以增强关键分词的词向量在句向量中的占比,避免关键分词携带的情感倾向被非关键分词所覆盖,使得后续进行用户意图识别更准确。

第二种方式:计算预设倍数、目标反馈内容的词长度和关键分词的词向量三者的乘积,得到第二词向量;对第二词向量和非关键分词的词向量进行加权平均,以生成目标反馈内容的句向量。

本方式中,通过预设倍数进一步提高了关键分词的词向量在句向量中的占比,进一步的提高了用户意图识别的准确度。其中,预设倍数可以基于实际需求和经验进行确定,如可以为3倍。

可选的,在本发明的另一个实施例中,该针对反馈内容的用户意图识别方法还可以包括:

按照预先设定的关于预设分词与意图识别结果下的子类别之间的映射关系,确定与目标反馈内容所包含预设分词存在映射关系的子类别,作为目标反馈内容的子类别。

其中,意图类别可以包含多个子类别。例如,意图类别为清理类别下可以包含文件清理子类别、图片清理子类别和视频清理子类别。不同的子类别用于进一步对反馈内容的用户意图进行细分,使得用户意图识别的更精准。

意图类别可以包含的每个子类别预先与预设分词建立有映射关系。在同一意图类别下,不同子类别映射的预设分词是相互不同的。可以通过建立子类别关键词词典的方式,记录每个子类别的预设分词。

示例性的,以意图类别为清理类别进行举例说明。其中,清理类别可以包含的每个子类别预先与预设分词建立有映射关系。在同一意图类别下,不同子类别映射的预设分词是相互不同的。举例而言,意图类别为清理类别,清理类别包含文件清理子类别、图片清理子类别和视频清理子类别三个子类别。其中,与文件清理子类别建立有映射关系的预设分词可以为“文件”、“文稿”等,与图片清理子类别建立有映射关系的预设分词可以为“图片”、“照片”等,与视频清理子类别建立有映射关系的预设分词可以为“视频”、“电影”等。当目标反馈内容包含有“视频”时,则可以确定视频清理子类别为目标反馈内容的子类别。

本实施例所提供方案中,通过预设分词与意图识别结果下的子类别之间的映射关系,可以在意图识别结果的基础上,确定目标反馈内容的子类别。可以,可以对目标反馈内容进行进一步的细分,从而可以更精准的识别用户意图。

相应于上述实施例所提供的针对反馈内容的用户意图识别方法,如图3所示,本发明实施例还提供了一种针对反馈内容的用户意图识别装置,装置包括:

内容获取模块301,用于获取待识别的目标反馈内容;

类别确定模块302,用于基于预设的关于各个分类条件与意图类别的对应关系,确定与目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别;其中,每一分类条件对应的意图类别为满足该分类条件的反馈内容所能够表征的意图类别;

结果确定模块303,用于若判断出初始类别为指定类别,利用预先训练的意图分类模型,确定目标反馈内容的意图识别结果;否则,将初始类别确定为目标反馈内容的意图识别结果;

其中,指定类别为存在相似意图类别的意图类别;意图分类模型为为基于多个样本反馈内容训练得到的分类模型,多个样本反馈内容包括:能够表征指定类别的样本反馈内容,以及能够表征指定类别的相似意图类别的样本反馈内容。

进一步的,装置还包括:

向量生成模块,用于在类别确定模块执行基于预设的关于各个分类条件与意图类别的对应关系,确定与目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别之前,生成表示目标反馈内容的句向量,作为目标向量;

距离计算模块,用于计算目标向量与聚类空间内每一类簇的距离,其中,聚类空间为基于样本反馈内容的句向量所建立的,聚类空间内每一类簇与一意图类别关联;

类簇确定模块,用于确定与目标向量之间的距离小于预设阈值的目标类簇,并确定与目标类簇所关联的意图类别,作为预选类别;

类别确定模块,具体用于基于预设的关于各个分类条件与意图类别的对应关系以及预选类别,确定与目标反馈内容所满足的分类条件相对应的意图类别,作为初始类别。

进一步的,类别确定模块,具体用于从预设的关于各个分类条件与意图类别的对应关系,查找与预选类别对应的分类条件,并且从所查找的分类条件中,确定目标反馈内容所满足的分类条件,并基于对应关系,确定与所目标反馈内容所满足分类条件对应的意图类别,作为初始类别。

进一步的,向量生成模块,具体用于确定目标反馈内容中所包含的关键分词,其中,关键分词为属于预设分词类型的分词,并且生成关键分词的词向量,并基于关键分词的词向量,生成表示目标反馈内容的句向量。

进一步的,意图分类模型为:基于随机森林分类模型训练的意图分类模型。

进一步的,装置还包括:

子类别确定模块,用于按照预先设定的关于预设分词与意图识别结果下的子类别之间的映射关系,确定与目标反馈内容所包含预设分词存在映射关系的子类别,作为目标反馈内容的子类别。

本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,

存储器403,用于存放计算机程序;

处理器401,用于执行存储器403上所存放的程序时,实现上述针对反馈内容的用户意图识别方法步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一针对反馈内容的用户意图识别方法的步骤。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一针对反馈内容的用户意图识别方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质、计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

相关技术
  • 针对反馈内容的用户意图识别方法、装置及电子设备
  • 一种用户意图识别方法、用户意图识别装置和存储介质
技术分类

06120112153173