掌桥专利:专业的专利平台
掌桥专利
首页

交互方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 19:30:30


交互方法、装置、电子设备及存储介质

技术领域

本发明涉及交互技术领域,尤其涉及一种交互方法、装置、电子设备及存储介质。

背景技术

近几年人机交互技术越来越走进人们的日常生活,用户可以通过类似与人交流的方式给机器提出指令,机器也能理解用户所提出的指令,例如使用苹果手机打电话时,只需要跟手机说嘿siri,打电话给谁即可。使用人机交互技术的应用越来越多,例如手机的智能语音助手,购物平台的智能客服,智能汽车的车载助手和智能电视盒子等。

现有技术中,人机交互模型的开发需要大量人力资源和大量数据,一旦用户需求变更则需要重新开发,而且很难新增意图,比如播放歌手唱的某个语种的歌曲这个新的意图,传统模型则需要重新收集相关数据再进行整体的训练从而达到支持该意图的效果,不能直接动态增加新的意图。另外新增意图本身存在的数据量过少,无法达到训练模型的最小量,因此,人机交互模型输出结果的准确率较低。

发明内容

本发明提供一种交互方法、装置、电子设备及存储介质,用以解决现有技术中对于新增意图,传统模型需要重新收集相关数据再进行整体的训练从而达到支持该意图的效果,不能直接动态增加新的意图,以及新增意图本身存在的数据量过少,无法达到训练模型的最小量,人机交互模型输出结果的准确率较低的缺陷。

本发明提供一种交互方法,包括:

获取用户文本,并确定所述用户文本对应的各候选意图;

基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;

基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;

基于所述目标意图进行交互。

根据本发明提供的一种交互方法,所述确定所述用户文本对应的各候选意图,包括:

对所述用户文本进行实体检测,得到所述用户文本对应的检测结果;所述检测结果包括实体、所述实体的位置和所述实体的类型;

确定所述检测结果对应的各候选意图。

根据本发明提供的一种交互方法,所述确定所述检测结果对应的各候选意图,包括:

基于所述检测结果的语义特征和各意图的句式语义特征之间的相似度,从所述各意图中确定候选意图;

所述句式语义特征是基于所述意图的各句式的语义特征确定的。

根据本发明提供的一种交互方法,所述检测结果的语义特征和各意图的句式语义特征之间的相似度的确定步骤包括:

基于样本用户文本对,计算所述检测结果的语义特征和所述句式语义特征之间的相似度;

所述样本用户文本对包括第一用户文本,以及与所述第一用户文本具备相同实体和相同意图的正样本用户文本和/或与所述第一用户文本具备不同实体和不同意图的负样本用户文本。

根据本发明提供的一种交互方法,所述样本用户文本对还包括:上下文文本对、问答文本对以及翻译文本对中的至少一种。

根据本发明提供的一种交互方法,所述基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式,包括:

基于所述用户文本与所述各候选意图的各句式在文本编辑层面的差距,从所述各候选意图的各句式中确定所述各候选意图的目标句式。

根据本发明提供的一种交互方法,所述用户文本分别与所述各候选意图的目标句式之间的相似度的确定步骤包括:

将所述用户文本中的实体补入所述目标句式,得到目标文本;

分别对所述用户文本和所述目标文本进行语义提取,得到所述用户文本中各分词的语义特征,以及所述目标文本中各分词的语义特征;

基于所述用户文本中除所述实体之外的各分词的语义特征,以及所述目标文本中除所述实体之外各分词的语义特征,确定所述用户文本与所述目标句式之间的相似度。

本发明还提供一种交互装置,包括:

获取单元,用于获取用户文本,并确定所述用户文本对应的各候选意图;

确定目标句式单元,用于基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;

确定目标意图单元,用于基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;

交互单元,用于基于所述目标意图进行交互。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述交互方法。

本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述交互方法。

本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述交互方法。

本发明提供的交互方法、装置、电子设备及存储介质,基于用户文本分别与各候选意图的目标句式之间的相似度,从各候选意图中确定目标意图,由此实现基于目标意图的交互,用户文本分别与各候选意图的目标句式之间的相似度的计算保证了目标意图确定的可靠性和准确性,并且,对于新的意图的句式也能识别,从而进行交互,提高了交互的智能性,且方法的执行无需再重新收集相关数据进行训练,极大降低了基于目标意图的交互的执行门槛,有助于扩宽交互的应用范围。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的交互方法的流程示意图;

图2是本发明提供的交互方法中步骤110的流程示意图;

图3是本发明提供的语言模型的结构示意图;

图4是本发明提供的用户文本分别与各候选意图的目标句式之间的相似度的确定步骤的流程示意图之一;

图5是本发明提供的用户文本分别与各候选意图的目标句式之间的相似度的确定步骤的流程示意图之二;

图6是本发明提供的交互装置的结构示意图;

图7是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类。

相关技术中,人机交互模型构建一个技能需要该技能相关的数据,以及意图识别模型和命名实体识别模型,以音乐技能举例,存在技能:播放某首音乐和播放某个歌手的音乐等,首先需要大量标注相关数据例如:

播放某首音乐的句式:播放晴天,来一首忘情水,需要标注[晴天],[忘情水]为歌曲名字,

播放某个歌手的句式为:放ABC的音乐,我想听DEF的音乐。需要标注[ABC],[DEF]为歌手名。

当收集完成相关数据之后,可以开始训练模型,意图识别模型目前主流为用语言模型打底(通常可以使用LSTM(Long Short-Term Memory,长短期记忆网络)或BERT(Bidirectional Encoder Representation from Transformers)),再接上一层或多层全连接层当作分类器,用以识别该句话是音乐技能下的什么意图(例如,播放歌曲,播放控制等)或非音乐技能。另一个命名实体识别主流也是以语言模型打底,最后接上CRF(Conditional Random Field,条件随机场),对用户说的句子进行判断当中是否存在实体资源,例如前面例子中的ABC,DEF为歌手实体资源。

当完成相关模型的搭建后,用户说出一句话先使用意图模型判断是否有相关意图,再使用命名实体识别模型把当中的相关信息抽取出来,最终传入传统的程序执行用户的意图。

人机交互模型的开发需要大量人力资源和大量数据,一旦用户需求变更则需要重新开发,而且很难新增意图,比如播放歌手唱的某个语种的歌曲这个新的意图,传统模型则需要重新收集相关数据再进行整体的训练从而达到支持该意图的效果,不能直接动态增加新的意图。另外新增意图本身存在的数据量过少,无法达到训练模型的最小量,因此,人机交互模型输出结果的准确率较低。

还有另外一种较为传统的方式是通过文法规则系统对输入语句进行判断,例如直接规定好句式:播放[歌手名]的[歌曲],先使用文本全匹配方式识别出是否是规定的句式。这种添加方式较为死板,往往句式变动一点就会导致无法识别,例如该句式变成播一下[歌手名]的[歌曲],系统就不识别了。

基于上述问题,本发明提供一种交互方法,图1是本发明提供的交互方法的流程示意图,如图1所示,该方法包括:

步骤110,获取用户文本,并确定所述用户文本对应的各候选意图。

具体地,可以获取用户文本,此处的用户文本可以是用户直接输入的,也可以是将采集所得的用户音频进行语音转写后得到的,此处的用户音频可以通过拾音设备得到,此处的拾音设备可以是智能设备上自带的,也可以是与智能设备连接的外设,此处的智能设备可以是智能手机、平板电脑,还可以是智能电器,例如音响、电视和空调等,拾音设备在经过麦克风阵列拾音得到用户音频后,还可以对用户音频进行放大和降噪,本发明实施例对此不作具体限定。

可以理解的是,此处的用户文本和用户音频均是针对于进行人机交互的用户而言的,用户音频即对于用户在人机交互中的发言录制的音频。

在获取到用户文本之后,可以确定用户文本对应的各候选意图,此处的候选意图即后续可能作为目标意图的意图,用户文本对应的各候选意图可以是歌曲名查歌,也可以是歌手查歌,还可以是年代和风格查歌等,本发明实施例对此不作具体限定。

此处,确定用户文本对应的各候选意图,可以是基于对用户文本进行实体检测得到的检测结果确定的。

此外,确定用户文本对应的各候选意图可以使用BERT(Bidirectional EncoderRepresentation from Transformers)模型,也可以使用CNN(Convolutional NeuralNetwork,卷积神经网络),还可以使用RNN(Recurrent Neural Networks,循环神经网络)等,本发明实施例对此不作具体限定。

步骤120,基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式。

具体地,在获取到用户文本之后,可以基于用户文本,从各候选意图的各句式中确定各候选意图的目标句式。此处的各候选意图的目标句式反映了各候选意图最终在句式层面的信息。

例如,候选意图为歌曲名查歌时,候选意图的目标句式可以是“播放一下[歌曲名]”,也可以是“来一首[歌曲名]”,还可以是“[歌曲名]放一下”等,本发明实施例对此不作具体限定。

又例如,候选意图为歌手查歌时,候选意图的目标句式可以是“[歌手]的歌来一首”,也可以是“[歌手]唱过啥”,还可以是“播放[歌手]唱过的歌”等,本发明实施例对此不作具体限定。

还例如,候选意图为年代和风格查歌,候选意图的目标句式可以是“来一首[年代]的[风格]”,也可以是“[年代]的歌曲,[风格]类型的”,还可以是“播放[年代]的[风格]”等,本发明实施例对此不作具体限定。

步骤130,基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图。

具体地,在获取到用户文本和各候选意图的目标句式之后,可以基于用户文本分别与各候选意图的目标句式之间的相似度,从各候选意图中确定目标意图,此处的目标意图是指最终用于交互的意图,目标意图可以是“我想听晴天”,也可以是“放一首晴天”等,本发明实施例对此不作具体限定。

可以理解的是,目标意图可以是用户文本分别与各候选意图的目标句式之间的相似度中最高的相似度对应的候选意图。

此处的用户文本分别与各候选意图的目标句式之间的相似度可以是采用余弦相似度、Pearson相关系数等方法进行计算得到,本发明实施例对此不作具体限定。

可以理解的是,基于用户文本分别与各候选意图的目标句式之间的相似度,从各候选意图中确定目标意图,对于新的意图的句式也能识别,从而进行交互,提高了交互的智能性。

步骤140,基于所述目标意图进行交互。

具体地,在得到目标意图之后,可以基于目标意图进行交互,例如,在音乐场景下,可以将目标意图“放一首晴天”传输至智能家居小助手,进行人机交互。

又例如,在厨艺场景下,可以将目标意图“帮我查一下红烧肉怎么做”传输至智能家居小助手,进行人机交互。

还例如,在汇率场景下,可以将目标意图“日元与人民币的今日汇率”传输至智能小助手,进行人机交互。

本发明实施例提供的方法,基于用户文本分别与各候选意图的目标句式之间的相似度,从各候选意图中确定目标意图,由此实现基于目标意图的交互,用户文本分别与各候选意图的目标句式之间的相似度的计算保证了目标意图确定的可靠性和准确性,并且,对于新的意图的句式也能识别,从而进行交互,提高了交互的智能性,且方法的执行无需再重新收集相关数据进行训练,极大降低了基于目标意图的交互的执行门槛,有助于扩宽交互的应用范围。

基于上述实施例,图2是本发明提供的交互方法中步骤110的流程示意图,如图2所示,步骤110包括:

步骤111,对所述用户文本进行实体检测,得到所述用户文本对应的检测结果;所述检测结果包括实体、所述实体的位置和所述实体的类型;

步骤112,确定所述检测结果对应的各候选意图。

具体地,在获取到用户文本之后,可以对用户文本进行实体检测,得到用户文本对应的检测结果。

此处,对用户文本进行实体检测可以使用字典树查找算法,也可以使用HMM(Hidden Markov Model,隐含马尔科夫模型),还可以使用BERT模型等,本发明实施例对此不作具体限定。

此处的检测结果可以包括实体、实体的位置和实体的类型,此处的实体可以是歌曲名,也可以是歌手,还可以是歌曲名和歌手等。

此处的实体的位置是指实体在用户文本中的位置,例如,实体的位置4-6表示实体由用户文本中的第4个字至第6个字表示。此处的实体的类型是指不同实体对应的类型。

例如,用户文本可以是“请播放ABC的晴天”,检测结果可以是实体的位置:4-6,实体:ABC,实体的类型:歌手,也可以是实体的位置:8-9,实体:晴天,实体的类型:歌曲名,还可以是实体的位置:4-6,实体:ABC,实体的类型:歌手;实体的位置:8-9,实体:晴天,实体的类型:歌曲名。

又例如,用户文本可以是“帮我查一下红烧肉怎么做”,检测结果可以是实体的位置:4-4,实体:一,实体的类型:步骤,也可以是实体的位置:6-8,实体:红烧肉,实体的类型:菜名,还可以是实体的位置:4-4,实体:一,实体的类型:步骤;实体的位置:6-8,实体:红烧肉,实体的类型:菜名。

还例如,用户文本可以是“日元和人民币的今日汇率”,检测结果可以是实体的位置:1-2,实体:日元,实体的类型:币种;实体的位置:2-2,实体:元,实体的类型:币种;实体的位置:4-6,实体:人民币,实体的类型:币种;实体的位置:7-8,实体:今日,实体的类型:日期。

此外,在得到检测结果之后,可以组合所有实体的可能,其中,若实体位置重合则忽略该种组合,例如,用户文本为“日元和人民币的今日汇率”,因为日元和元的检测结果中的实体位置重合,所以,日元和元不能同时出现,则最终的检测结果可以是:

日元与人民币的今日汇率;

日元与[人民币{币种}]的今日汇率;

日元与人民币的[今日{日期}]汇率;

日元与[人民币{币种}]的[今日{日期}]汇率;

日[元{币种}]与[人民币{币种}]的今日汇率;

日[元{币种}]与人民币的[今日{日期}]汇率;

日[元{币种}]与[人民币{币种}]的[今日{日期}]汇率;

[日元{币种}]与[人民币{币种}]的今日汇率;

[日元{币种}]与人民币的[今日{日期}]汇率;

[日元{币种}]与[人民币{币种}]的[今日{日期}]汇率。

在得到用户文本对应的检测结果之后,可以确定检测结果对应的候选意图。此处的候选意图即后续可能作为目标意图的意图,检测结果对应的候选意图可以是歌曲名查歌,也可以是歌手查歌,还可以是年代和风格查歌等,本发明实施例对此不作具体限定。

本发明实施例提供的方法,对用户文本进行实体检测,得到用户文本对应的检测结果,并确定检测结果对应的候选意图,检测结果包括实体、实体的位置和实体的类型,由此,确定的候选意图反映了丰富的实体信息,提高了后续交互的准确性和可靠性。

基于上述实施例,步骤112包括:

基于所述检测结果的语义特征和各意图的句式语义特征之间的相似度,从所述各意图中确定候选意图;

所述句式语义特征是基于所述意图的各句式的语义特征确定的。

具体地,在得到检测结果之后,可以基于检测结果的语义特征和各意图的句式语义特征之间的相似度,从各意图中确定候选意图,此处的各意图的句式语义特征是基于意图的各句式的语义特征确定的。此处的各意图的句式语义特征反映了各意图的句式在语义层面的特征信息。

例如,各意图的句式可以为“来一首[歌曲名]”、“点首[歌曲名]”、“来首[歌曲名]”、“点一首[歌曲名]”、“我想听[歌曲名]”、“我要听[歌曲名]”,检测结果中的实体为忘情水,则意图的各句式的语义特征可以是对“来一首忘情水”、“点首忘情水”、“来首忘情水”、“点一首忘情水”、“我想听忘情水”、“我要听忘情水”分别进行向量化得到的。

此处的句式语义特征可以是对意图的各句式的语义特征进行平均化得到的,也可以是进行特征融合得到的,此处的特征融合可以是将意图的各句式的语义特征进行拼接,也可以是利用注意力机制将意图的各句式的语义特征进行加权之后再拼接,本发明实施例对此不作具体限定。

此处的候选意图可以是各意图中相似度得分前N的意图,此处的N可以是5,也可以是4,还可以是3等,本发明实施例对此不作具体限定。

此处,检测结果的语义特征和各意图的句式语义特征之间的相似度可以是采用余弦相似度、Pearson相关系数等方法进行计算得到,本发明实施例对此不作具体限定。

可以理解的是,检测结果的语义特征和各意图的句式语义特征之间的相似度反映了检测结果与各意图的句式在语义层面的匹配程度,检测结果的语义特征和各意图的句式语义特征之间的相似度越高,检测结果与各意图的句式越匹配;检测结果的语义特征和各意图的句式语义特征之间的相似度越低,检测结果与各意图的句式越不匹配。

图3是本发明提供的语言模型的结构示意图,如图3所示,可以将检测结果的语义特征和各意图的句式语义特征输入语言模型中,此处的语言模型可以包括输入层、编码层、表示层和相似度计算层,此处的编码层可以是RNN模型,也可以是CNN模型,还可以是Transformer、Bert等模型,此处的表示层可以是CRF等,本发明实施例对此不作具体限定。

本发明实施例提供的方法,基于检测结果的语义特征和各意图的句式语义特征之间的相似度,从各意图中确定候选意图,检测结果的语义特征和各意图的句式语义特征之间的相似度反映了检测结果与各意图的句式在语义层面的匹配程度,由此,保证了确定的候选意图的准确性和可靠性。

基于上述实施例,所述检测结果的语义特征和各意图的句式语义特征之间的相似度的确定步骤包括:

基于样本用户文本对,计算所述检测结果的语义特征和所述句式语义特征之间的相似度;

所述样本用户文本对包括第一用户文本,以及与所述第一用户文本具备相同实体和相同意图的正样本用户文本和/或与所述第一用户文本具备不同实体和不同意图的负样本用户文本。

具体地,为了实现更准确地计算检测结果的语义特征和句式语义特征之间的相似度,本发明实施例设置了初始语言模型,此处的初始语言模型的参数可以是预先设置的,也可以是随机生成的,本发明实施例对此不作具体限定。

还可以预先收集样本用户文本对,此处的样本用户文本对可以包括第一用户文本,以及与第一用户文本具备相同实体和相同意图的正样本用户文本和/或与第一用户文本具备不同实体和不同意图的负样本用户文本。

例如,第一用户文本为“播放一下晴天”,与第一用户文本具备相同实体和相同意图的正样本用户文本可以是“来一首晴天”,与第一用户文本具备不同实体和不同意图的负样本用户文本可以是“帮我查一下红烧肉怎么做”。

在得到初始语言模型之后,可以将样本用户文本对输入至初始语言模型中,在初始语言模型的训练过程中,初始语言模型针对第一用户文本的语义特征和与第一用户文本具备相同实体和相同意图的正样本用户文本的语义特征之间的相似度越高,初始语言模型针对第一用户文本的语义特征和与第一用户文本具备不同实体和不同意图的负样本用户文本的语义特征之间的相似度越低,则初始语言模型的训练效果越好。

可以基于第一用户文本的语义特征与正样本用户文本的语义特征之间的相似度,确定第一损失函数值,第一损失函数值反映初始语言模型对于第一用户文本的语义特征与正样本用户文本的语义特征在共性特征上提取的损失。

可以基于第一用户文本的语义特征与负样本用户文本的语义特征之间的相似度,确定第二损失函数值,第二损失函数值反映初始语言模型对于第一用户文本的语义特征与负样本用户文本的语义特征在差异性特征上提取的损失。

最后,可以基于第一损失函数值和第二损失函数值,确定对比学习损失函数值,并基于对比学习损失函数值,对初始语言模型进行参数迭代,并将参数迭代之后的初始语言模型确定为语言模型。

其中,对比学习损失函数的公式如下:

其中,f表示初始语言模型,τ表示超参数,χ表示样本用户文本对,x

此处,x

在得到语言模型之后,可以将检测结果的语义特征和句式语义特征输入至语言模型中,计算检测结果的语义特征和句式语义特征之间的相似度。

基于上述实施例,所述样本用户文本对还包括:上下文文本对、问答文本对以及翻译文本对中的至少一种。

具体地,样本用户文本对还可以包括上下文文本对、问答文本对以及翻译文本对中的至少一种,即样本用户文本对可以包括上下文文本对和问答文本对,也可以包括上下文文本对和翻译文本对,还可以包括上下文文本对、问答文本对以及翻译文本对,本发明实施例对此不作具体限定。

此处的上下文文本对可以包括同一篇文章中的上下句句子,此处的问答文本对可以包括问题文本,以及问题文本对应的答案文本,此处的翻译文本对可以包括原语种文本,以及原语种文本对应的翻译语种文本,例如,翻译文本对可以包括中文文本,以及中文文本对应的英文文本。

本发明实施例提供的方法,样本用户文本对还包括上下文文本对、问答文本对以及翻译文本对中的至少一种,提高了样本用户文本对的丰富性。

基于上述实施例,步骤120包括:

基于所述用户文本与所述各候选意图的各句式在文本编辑层面的差距,从所述各候选意图的各句式中确定所述各候选意图的目标句式。

具体地,可以基于用户文本与各候选意图的各句式在文本编辑层面的差距,从各候选意图的各句式中确定各候选意图的目标句式,例如,可以基于用户文本与各候选意图的各句式的编辑距离的差距,从各候选意图的各句式中确定各候选意图的目标句式。

可以理解的是,用户文本与各候选意图的各句式在文本编辑层面的差距越大,各候选意图的各句式与用户文本越不匹配;用户文本与各候选意图的各句式在文本编辑层面的差距越小,各候选意图的各句式与用户文本越匹配。

相关技术中,传统的交互模型没有在句式层面对交互模型进行训练,实际应用中不能直接动态增加新的意图,交互模型的识别效果差。

基于上述问题,本发明实施例在句式层面对交互模型进行训练,进一步提高交互的准确性和可靠性。

基于上述实施例,图4是本发明提供的用户文本分别与各候选意图的目标句式之间的相似度的确定步骤的流程示意图之一,图5是本发明提供的用户文本分别与各候选意图的目标句式之间的相似度的确定步骤的流程示意图之二,如图4、图5所示,所述用户文本分别与所述各候选意图的目标句式之间的相似度的确定步骤包括:

步骤410,将所述用户文本中的实体补入所述目标句式,得到目标文本;

步骤420,分别对所述用户文本和所述目标文本进行语义提取,得到所述用户文本中各分词的语义特征,以及所述目标文本中各分词的语义特征;

步骤430,基于所述用户文本中除所述实体之外的各分词的语义特征,以及所述目标文本中除所述实体之外各分词的语义特征,确定所述用户文本与所述目标句式之间的相似度。

具体地,可以将用户文本中的实体补入目标句式,得到目标文本,例如,目标句式为“放一首[歌曲]”,用户文本为“我想听晴天”,可以将用户文本中的实体[晴天]补入目标句式,得到目标文本“放一首晴天”。

在得到目标文本之后,可以分别对用户文本和目标文本进行语义提取,得到用户文本中各分词的语义特征,以及目标文本中各分词的语义特征。此处的用户文本中各分词的语义特征反映了用户文本中各个分词的语义层面的特征信息,此处的目标文本中各分词的语义特征反映了目标文本中各个分词的语义层面的特征信息。

此处,分别对用户文本和目标文本进行语义提取可以使用语义提取模型,此处的语义提取模型可以使用Encoder模块,也可以使用CNN模型等,本发明实施例对此不作具体限定。

在得到用户文本中各分词的语义特征,以及目标文本中各分词的语义特征之后,可以基于用户文本中除实体之外的各分词的语义特征,以及目标文本中除实体之外各分词的语义特征,确定用户文本与目标句式之间的相似度。

此处,可以在投影层中确定用户文本与目标句式之间的相似度。此处的用户文本与目标句式之间的相似度可以是采用余弦相似度、Pearson相关系数等方法进行计算得到,本发明实施例对此不作具体限定。

基于上述任一实施例,一种交互方法,步骤如下:

第一步,获取用户文本。

第二步,对用户文本进行实体检测,得到用户文本对应的检测结果,此处的检测结果可以包括实体、实体的位置和实体的类型。

第三步,基于检测结果的语义特征和各意图的句式语义特征之间的相似度,从各意图中确定候选意图。

此处的句式语义特征是基于意图的各句式的语义特征确定的。

第四步,基于用户文本与各候选意图的各句式在文本编辑层面的差距,从各候选意图的各句式中确定各候选意图的目标句式。

第五步,基于用户文本分别与各候选意图的目标句式之间的相似度,从各候选意图中确定目标意图。

其中,用户文本分别与各候选意图的目标句式之间的相似度的确定步骤包括:

将用户文本中的实体补入目标句式,得到目标文本。

分别对用户文本和目标文本进行语义提取,得到用户文本中各分词的语义特征,以及目标文本中各分词的语义特征。

基于用户文本中除实体之外的各分词的语义特征,以及目标文本中除实体之外各分词的语义特征,确定用户文本与目标句式之间的相似度。

第六步,基于目标意图进行交互。

下面对本发明提供的交互装置进行描述,下文描述的交互装置与上文描述的交互方法可相互对应参照。

基于上述任一实施例,本发明提供一种交互装置,图6是本发明提供的交互装置的结构示意图,如图6所示,该装置包括:

获取单元610,用于获取用户文本,并确定所述用户文本对应的各候选意图;

确定目标句式单元620,用于基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;

确定目标意图单元630,用于基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;

交互单元640,用于基于所述目标意图进行交互。

本发明实施例提供的装置,基于用户文本分别与各候选意图的目标句式之间的相似度,从各候选意图中确定目标意图,由此实现基于目标意图的交互,用户文本分别与各候选意图的目标句式之间的相似度的计算保证了目标意图确定的可靠性和准确性,并且,对于新的意图的句式也能识别,从而进行交互,提高了交互的智能性,且方法的执行无需再重新收集相关数据进行训练,极大降低了基于目标意图的交互的执行门槛,有助于扩宽交互的应用范围。

基于上述任一实施例,获取单元具体用于:

实体检测单元,用于对所述用户文本进行实体检测,得到所述用户文本对应的检测结果;所述检测结果包括实体、所述实体的位置和所述实体的类型;

确定候选意图单元,用于确定所述检测结果对应的各候选意图。

基于上述任一实施例,确定候选意图单元具体用于:

基于所述检测结果的语义特征和各意图的句式语义特征之间的相似度,从所述各意图中确定候选意图;

所述句式语义特征是基于所述意图的各句式的语义特征确定的。

基于上述任一实施例,所述检测结果的语义特征和各意图的句式语义特征之间的相似度的确定步骤包括:

基于样本用户文本对,计算所述检测结果的语义特征和所述句式语义特征之间的相似度;

所述样本用户文本对包括第一用户文本,以及与所述第一用户文本具备相同实体和相同意图的正样本用户文本和/或与所述第一用户文本具备不同实体和不同意图的负样本用户文本。

基于上述任一实施例,所述样本用户文本对还包括:上下文文本对、问答文本对以及翻译文本对中的至少一种。

基于上述任一实施例,确定目标句式单元具体用于:

基于所述用户文本与所述各候选意图的各句式在文本编辑层面的差距,从所述各候选意图的各句式中确定所述各候选意图的目标句式。

基于上述任一实施例,所述用户文本分别与所述各候选意图的目标句式之间的相似度的确定步骤包括:

确定目标文本单元,用于将所述用户文本中的实体补入所述目标句式,得到目标文本;

确定分词语义特征单元,用于分别对所述用户文本和所述目标文本进行语义提取,得到所述用户文本中各分词的语义特征,以及所述目标文本中各分词的语义特征;

确定相似度单元,用于基于所述用户文本中除所述实体之外的各分词的语义特征,以及所述目标文本中除所述实体之外各分词的语义特征,确定所述用户文本与所述目标句式之间的相似度。

图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行交互方法,该方法包括:获取用户文本,并确定所述用户文本对应的各候选意图;基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;基于所述目标意图进行交互。

此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的交互方法,该方法包括:获取用户文本,并确定所述用户文本对应的各候选意图;基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;基于所述目标意图进行交互。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的交互方法,该方法包括:获取用户文本,并确定所述用户文本对应的各候选意图;基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;基于所述目标意图进行交互。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术分类

06120115934072