掌桥专利:专业的专利平台
掌桥专利
首页

交互方法、装置和系统,以及智能设备

文献发布时间:2023-06-19 13:49:36


交互方法、装置和系统,以及智能设备

技术领域

本发明涉及互联网技术领域,具体而言,涉及一种交互方法、装置和系统,以及智能设备。

背景技术

在语音交互场景中,用户的语音输入经过自语音识别技术(Automatic SpeechRecognition,简称ASR)识别成文本后,需要经过意图检测、实体识别、对话决策、文本生成等部分才能得到回复用户的文本,并经过TTS变成声音后播放给用户。其中对话决策主要基于经过精心设计后,由开发人员编写逻辑代码完成的。一旦设计的对话逻辑过于复杂,编写对话逻辑代码的成本也变得非常高甚至难以实现。

在传统的对话交互系统中,用户的语音输入经过ASR识别成文本后,需要经过意图检测、实体识别、对话决策、文本生成等部分才能得到回复用户的文本,并经过TTS变成声音后播放给用户。

其中意图检测、实体识别、和对话决策等模块共同组成了对话交互的核心,传统的方法通过将对话交互拆分为如上三个部分:由意图检测识别用户交互的意图;实体识别得到用户请求中关键的实体信息;而对话决策则根据用户的上下文以及环境信息得所需执行的动作以及给用户的回复,该部分主要通过开发人员编写逻辑代码而完成。

通过上述现有技术却导致管道(PipeLine)的处理过程带来了错误的传递效应,比如,三个部分每个部分的准确率为0.9,则最终系统的准确率也只能达到0.729;并且通过逻辑代码实现的对话决策系统带来维护和修改成本的大增,而且对于复杂的对话交互过程极为难以实现。

针对上述现有技术在对话决策制定和实施的过程中,代码需求量大的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种交互方法、装置和系统,以及智能设备,以至少解决由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

根据本发明实施例的一个方面,提供了一种交互的方法,包括:依据采集到的输入语句,获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;依据语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、输入语句中请求调用的第三方服务。

可选的,获取输入语句中的语义实体包括:对输入语句进行分词,得到组成输入语句的至少一个分词;获取至少一个分词的所属类别,并依据类别确定输入语句中的语义实体。

可选的,依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息包括:获取历史交互结果;依据输入语句、语义实体和历史交互结果,获取对应输入语句的对话向量;通过对话模型获取对话向量对应的反馈信息。

进一步地,可选的,该方法还包括:在得到反馈信息后,将反馈信息与输入语句作为更新数据输入对话模型,得到优化后的对话模型。

可选的,对话模型为通过获取输入语句的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取输入语句的类别标签和动作特征;依据类别标签和动作特征,生成对应输入语句的反馈信息;依据包含有反馈信息的历史对话对获取输入语句的语言特征、对话向量、类别标签和动作特征的过程进行训练得到。

根据本发明实施例的一个方面,提供了另一种交互的方法,包括:采集多个对象输入的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;基于不同对象的语义实体,确定不同对象的语言特征;基于不同对象的语言特征,调用不同的对话模型;对不同对象输入的输入语句采用对应的对话模型进行处理,生成不同对象所对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

根据本发明实施例的一个方面,提供了又一种交互的方法,包括:获取样本数据的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取样本数据的类别标签和动作特征;依据类别标签和动作特征,生成对应样本数据的反馈信息;依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型,其中,对话模型,用于获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

可选的,获取样本数据的语言特征包括:分别对样本数据进行实体识别和语义识别,得到语言特征。

进一步地,可选的,分别对样本数据进行实体识别和语义识别,得到语言特征包括:对样本数据进行实体识别,得到语义实体;依据语义实体与预设数据进行匹配,得到第一识别结果;对样本数据进行语义识别,得到第二识别结果;依据第一识别结果、第二识别结果和输入样本数据的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征。

可选的,依据语言特征获取对应的对话向量包括:依据所语言特征与至少一次历史对话数据进行关联,得到对话向量。

进一步地,可选的,依据所语言特征与至少一次历史对话数据进行关联,得到对话向量包括:依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量。

可选的,依据语言特征和对话向量获取样本数据的类别标签和动作特征包括:依据对话向量,获取样本数据的类别标签;依据语言特征和对话向量,获取样本数据的动作特征。

进一步地,可选的,依据对话向量,获取样本数据的类别标签包括:对对话向量中的语义标签进行分类,得到样本数据的类别标签。

可选的,该交互的方法应用于端到端交互系统,其中,端到端交互系统包括:在线交互系统、智能交互设备、嵌入智能交互设备的装置。

根据本发明实施例的一个方面,提供了再一种交互的方法,包括:步骤A,采集当前输入的输入语句;步骤B,调用对话模型分析当前输入的输入语句,在触控屏上显示与当前输入的输入语句具有语义关系的反馈信息;步骤C,采集基于反馈信息再次输入的输入语句;步骤D,调用对话模型分析再次输入的输入语句,在触控屏上显示与再次输入的输入语句具有语义关系的反馈信息;步骤E,循环执行上述步骤C和步骤D,直至接收到结束指令。

根据本发明实施例的另一个方面,提供了一种交互的方法,包括:服务器接收智能设备采集到的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;服务器依据语义实体,通过对话模型获取与输入语句匹配的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、输入语句中请求调用的第三方服务;服务器将反馈信息发送给智能设备。

根据本发明实施例的另一个方面,提供了一种智能设备,包括:语音采集装置,用于采集语音信息;处理器,与语音采集装置连接,用于从语音信息中识别出输入语句,并通过对话模型处理输入语句的语义实体,生成对应的反馈信息,其中,输入语句的语义实体表征输入语句中的语义。

根据本发明实施例的另一个方面,提供了另一种智能设备,包括:触控屏,用于采集通过触控交互功能输入的输入语句,其中,输入语句的语义实体表征输入语句的语义;处理器,与触控屏连接,用于通过对话模型处理输入语句的语义实体,生成对应的反馈信息;其中,触控屏还用于显示反馈信息。

根据本发明实施例的另一个方面,提供了又一种智能设备,包括:语音采集装置,用于采集语音信息;触控屏,用于显示识别语音信息而产生的至少一条语句,并接收通过触控交互功能从至少一条语句中选择的输入语句,其中,输入语句的语义实体表征输入语句的语义;处理器,与语音采集装置和触控屏连接,用于通过对话模型处理输入语句的语义实体,生成对应的反馈信息;其中,触控屏还用于显示反馈信息。

根据本发明实施例的另一个方面,提供了一种交互的装置,包括:获取模块,用于依据采集到的输入语句,获取输入语句中的语义实体,其中,语义实体用于识别输入语句中的语义;交互模块,用于依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、对应输入语句中请求调用的第三方服务。

根据本发明实施例的另一个方面,提供了另一种交互的装置,包括:采集模块,用于采集多个对象输入的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;特征模块,用于基于不同对象的语义实体,确定不同对象的语言特征;调用模块,用于基于不同对象的语言特征,调用不同的对话模型;交互模块,用于对不同对象输入的输入语句采用对应的对话模型进行处理,生成不同对象所对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

根据本发明实施例的另一个方面,提供了又一种交互的装置,包括:第一获取模块,用于获取样本数据的语言特征,并依据语言特征获取对应的对话向量;第二获取模块,用于依据语言特征和对话向量,获取样本数据的类别标签和动作特征;语句生成模块,用于依据类别标签和动作特征,生成对应样本数据的反馈信息;模型训练模块,用于依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型,其中,对话模型,用于获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

根据本发明实施例的又一个方面,提供了一种交互的系统,包括:实体识别模块、语义建模模块、特征获取模块、门控循环模块、动作决策模块、分类模块和对话回复模块,其中,实体识别模块,用于对输入语句进行实体识别,得到语义实体,并将语义实体与预设数据进行匹配,得到第一识别结果;语义建模模块,用于对输入语句进行语义识别,得到第二识别结果;特征获取模块,分别与实体识别模块和语义建模模块连接,用于依据第一识别结果,第二识别结果和输入语句的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征;门控循环模块,与特征获取模块连接,用于依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量;动作决策模块,与特征获取模块和门控循环模块连接,用于依据语言特征和对话向量,获取输入语句的动作特征;分类模块,与门控循环模块连接,用于依据对话向量,获取输入语句的类别标签;对话回复模块,依据类别标签和动作特征,生成对应输入语句的反馈信息。

根据本发明实施例的又一个方面,提供了一种非易失性存储介质,其中,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行上述交互方法。

根据本发明实施例的又一个方面,提供了一种处理器,其中,处理器用于运行程序,其中,程序运行时执行上述交互方法。

在本发明实施例中,通过依据采集到的输入语句,获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;依据语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、输入语句中请求调用的第三方服务,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明实施例的一种交互的方法的计算机终端的硬件结构框图;

图2是根据本发明实施例的一种交互的方法的流程图;

图3是根据本发明实施例二的一种交互的方法的流程图;

图4是根据本发明实施例三的一种交互的方法的流程图;

图5是根据本发明实施例三的一种交互的方法中对话系统的示意图;

图6是根据本发明实施例四的一种交互的方法的流程图;

图7是根据本发明实施例五的一种交互的方法的流程图;

图8a是根据本发明实施例六的一种智能设备的示意图;

图8b是根据本发明实施例七的一种智能设备的示意图;

图8c是根据本发明实施例八的一种智能设备的示意图;

图9是根据本发明实施例十一的一种交互的装置的示意图;

图10是根据本发明实施例十二的一种交互的装置的示意图;

图11是根据本发明实施例十三的一种交互的装置的示意图;

图12是根据本发明实施例十四的一种交互的系统的示意图;

图13是根据本发明实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请涉及的技术名词:

GRU:gate recurrent unit门控循环单元,是循环神经网络RNN(RecurrentNeural Network)的一种;

ASR:Automatic Speech Recognition,自动语音识别;

TTS:Text To Speech从文本到语音;

PipeLine:指在NET Framework外接程序编程模型中,标识在外接程序与其宿主之间交换数据的管线段的线性通信模型,直译为导管;

LSTM:Long Short-Term Memery,长短期记忆网络,也是循环神经网络RNN(Recurrent Neural Network)的一种。

实施例1

根据本发明实施例,还提供了一种交互的方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种交互的方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的交互的方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

在语音交互场景中,用户的语音输入经过ASR(Automatic Speech Recognition,自动语音识别)识别成文本后,需要经过意图检测、实体识别、对话决策、文本生成等部分才能得到回复用户的文本,并经过TTS(Text To Speech从文本到语音)变成声音后播放给用户。其中对话决策主要基于经过精心设计后的并由开发人员编写逻辑代码而完成的。一旦设计的对话逻辑过于复杂,编写对话逻辑代码的成本也变得非常高甚至难以实现。本实施例在复杂对话设计场景下,提供一种交互的方案。直接将用户输入的文本输入对话模型,由对话模型直接输出回复语音,从而避免了复杂的处理流程,需要编写的代码量大,导致精度较低的问题。

在上述运行环境下,本申请提供了如图2所示的交互的方法。图2是根据本发明实施例的一种交互的方法的流程图,如图2所示,该方法包括以下步骤:

步骤S202,依据采集到的输入语句,获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;

本申请上述步骤S202中,获取输入语句可以通过语音接收装置接收用户语音,然后通过语音转换的方式将用户语音转换为用户的输入文本,例如,采用ASR技术将上述语音识别为文本。上述样本数据可以为用户的语音,或者用户的语音对应的文本。

其中,获取输入语句中的语义实体的步骤包括如下:

对输入语句进行实体识别,得到语义实体,可以将上述输入语句先经过实体解析模块,识别样本数据中的语义实体。具体的,将上述输入语句的文本,输入实体解析模块,由该实体解析模块输出对应的语义实体。

步骤S204,依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、输入语句中请求调用的第三方服务。

本申请上述步骤S204中,基于步骤S202中得到的输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息可以包括:对用户问答的回答语句,或者对用户对话的回复,或者对用户需求外部服务的响应(即本申请实施例中的第三方服务)。

其中,第三方服务器可以包括:天气查询、在线购物、智能家电控制、导航、在线订票中的至少一种。

本申请实施例中反馈信息的表现形式包容如下方式:

方式一:反馈信息为对用户问答的回答语句的情况下;

例如,输入语句为:“你好,在吗?”反馈信息则可以反馈为:“在呢,请讲”。

方式二:反馈信息为输入语句中请求调用的第三方服务的情况下;

例如,输入语句为:“明天A地天气”,反馈信息则可以反馈为通过调用第三方的天气查询服务,反馈:“明天A地天气:晴;微风,……”。并可扩展为A地未来N天的天气、出行意见和穿衣意见。

方式三:反馈信息为用户问答的回答语句和输入语句中请求调用的第三方服务的情况下;

具体的,结合方式一和方式二,例如,输入语句为:“你好,明天A地天气”,反馈信息则通过调用第三方的天气查询服务器,反馈为:“您是想知道明天A地的天气吗?明天A地天气:晴;微风,……”。

需要说明的是,本申请实施例中的反馈信息仅以上述示例为例进行说明,以实现本申请实施例提供的交互的方法为准,具体不做限定。

在本发明实施例中,通过依据获取到的输入语句,获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息包括:对输入语句的回复,和/或,输入语句中请求调用的第三方服务,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

可选的,步骤S202中获取输入语句中的语义实体包括:对输入语句进行分词,得到组成输入语句的至少一个分词;获取至少一个分词的所属类别,并依据类别确定输入语句中的语义实体。

其中,输入语句中的语言特征可以包括状态特征、实体特征、语义特征和词特征。上述状态特征可以是用户的个性化标签以及行为标签,例如,用户是否为新用户,用户性别是男是女。上述状态特征可以根据用户的信息进行获取,可以通过0/1的形式进行记录。上述实体特征可以是表示当前交互中用户谈及的实体。

例如,用户说:我喜欢听歌手A的《XXX》。

其中歌手A属于歌手,《XXX》属于歌曲名。上述语义特征可以是对用户当前输入经过模型得到的向量化表示。上述词特征可以是当前用户在输入的语音或者文本中,具体的词汇。

上述语言特征还可以包括二元分词(BiGram),词向量(word vector)等其他特征,从而丰富语言特征,以使对话模型可以更准确的确定对应的反馈信息。

获取样本数据之后,从样本数据中确定语言特征,由于语言特征包括多个内容,不同的内容获取方式不同。上述状态特征可以通过用户信息进行获取。

上述实体特征可以根据样本数据确定,具体的,可以将上述样本数据先经过实体解析模块,识别样本数据中的实体,并将该实体与知识图谱中的实体节点关联起来,确定实体特征。

可选的,步骤S204中依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息包括:获取历史交互结果;依据输入语句、语义实体和历史交互结果,获取对应输入语句的对话向量;通过对话模型获取对话向量对应的反馈信息。

其中,依据输入语句中的语言特征、语义实体与至少一次历史对话数据(即,本申请实施例中的历史交互结果)进行关联,得到对话向量。

通过语言特征和上一次的历史对话数据进行关联,生成本次对话的上述语言特征下的对话向量。具体的,可以通过语言特征和上一次对话交互得到的GRU的结果,输入GRU得到当前对话交互的对话向量。

上述历史对话可以是前一轮系统与用户的对话交互,包括用户的提问和系统对用户提问的回答,提问和回答组成前一轮对话交互。在前一轮系统对话中,根据用户的提问的语言特征确定有该提问对应的GRU的结果。在本轮对话交互中,GRU的输入是上述语言特征,以及上一次的对话交互的GRU的结果。

作为一种可选的实施例,依据语言特征与至少一次历史对话数据进行关联,得到对话向量包括:依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量。

上述历史对话可以包括用户的历史提问,以及该历史提问对应的系统回复,一个提问和一个回复构成一次历史对话。上述对话向量包括上述语言特征和上述历史对话数据。

上述历史对话数据可以为当前历史对话的前一次对话,距离当前对话越近,两次对话的关联可能越紧密,互相之间的影响越大,因此上述历史对话可以是距离本次对话最近的历史对话。

进一步地,可选的,本申请实施例提供的交互的方法还包括:在得到反馈信息后,将反馈信息与输入语句作为更新数据输入对话模型,得到优化后的对话模型。

具体的,通过对话树(即,本申请实施例中包含的反馈信息和输入语句和历史交互对话组成的树状交互结构)对上述对话模型进行优化,对话树是数据来源,通过对话树优化的是对话模型的整体。即从对话树可以得到一个个对话的交互包括用户的输入问题和系统的动作,对话树的对话数据作为训练样本优化上述整体的端到端对话模型。

可选的,对话模型为通过获取输入语句的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取输入语句的类别标签和动作特征;依据类别标签和动作特征,生成对应输入语句的反馈信息;依据包含有反馈信息的历史对话对获取输入语句的语言特征、对话向量、类别标签和动作特征的过程进行训练得到。

具体的,本申请实施例提供的对话模型的训练过程具体如下:

1).用户的输入文本首先经过实体解析模块,识别实体,并将该实体与知识图谱中的实体节点关联起来;其中,知识图谱的构建方式可以通过爬取线上数据,如音乐信息,包括歌手、专辑名、作曲者、歌曲名等。知识图谱中的节点表示实体,如歌手、歌曲,知识图谱中的边表示关系,如歌手“演唱”歌曲。

2).用户的输入文本经过语义建模可以得到该文本的语义表示,也即是语义特征,在本系统中通过一个双向的LSTM句子编码器输出输入文本的语义表示。

3).用户的输入状态连同上述两步的结果,可以得到用户整个输入的特征,包括:状态特征、实体特征、语义特征和词特征等;输入状态包括用户的个性化及行为特征,如:用户是否为新用户、是否第一次进入,是男是女等。

上述状态特征是用户的个性化标签以及行为标签,如用户是否为新用户,是男是女等,是作为0/1向量的模式输入;

上述实体特征是表示当前交互中用户谈及的实体,如用户说了什么歌手、什么歌曲,也是作为0/1向量的模式输入;

上述语义特征是对用户当前输入经过模型得到的向量化表示;

上述词特征是当前用户输入问题中说了哪些词汇,作为0/1向量的模式输入。

4).第3步的特征以及上一次交互得到的GRU的结果经过GRU(门控循环单元)能够得到当前交互的向量表示,也即是对话向量;GRU的输入是第三步中的四个特征:状态特征、实体特征、语义特征和词特征;输出是隐层向量,即向量表示。上一次交互就是前一轮系统跟用户的交互,包括用户的输入问题以及系统的回复,这两者组成了一轮对话。

5).第4步得到的当前交互的向量表示经过分类模块以及将前述特征作为输入的动作预决策模块,得到最终系统的输出,即系统的回复或者所需请求的外部服务。分类模块,是分类器,可以认为是从前述向量经过解码得到的类别标签得分。输入是前述交互向量,输出是对话动作类别标签的得分。动作决策模块的输入是前述第三部得到的四类特征,以及上一轮得到GRU的向量表示;输出表示动作。

6).最后根据对话树的数据整体优化上述模块,以期对话数据的动作与上述系统预测的动作是一致的。对话树是指树状结构的对话,每个节点是用户说了什么,系统怎么回答,下一层的节点同样对应着用户说了什么系统怎么回的。对话树是数据来源,通过对话树优化的是对话模型的整体。即从对话树可以得到一个个对话的交互包括用户的输入问题和系统的动作,这个数据作为训练样本优化上述整体的端到端对话模型。

上述步骤3)中的特征部分还能采用更多的特征,如二元分词BiGram、词向量wordvector等特征。上述步骤4)中除了GRU(门控循环单元)还可以采用LSTM等循环神经网络常用的单元。

实施例2

本申请提供了如图3所示的交互的方法。图3是根据本发明实施例二的一种交互的方法的流程图,如图3所示,该方法包括以下步骤:

步骤S302,采集多个对象输入的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;

本申请上述步骤S302中,获取多个对象输入的输入语句可以通过语音接收装置接收用户语音,然后通过语音转换的方式将用户语音转换为用户的输入文本,例如,采用ASR技术将上述语音识别为文本。上述样本数据可以为用户的语音,或者用户的语音对应的文本。

其中,获取输入语句中的语义实体的步骤包括如下:

对输入语句进行实体识别,得到语义实体,可以将上述输入语句先经过实体解析模块,识别样本数据中的语义实体。具体的,将上述输入语句的文本,输入实体解析模块,由该实体解析模块输出对应的语义实体。

步骤S304,基于不同对象的语义实体,确定不同对象的语言特征;

本申请上述步骤S304中,上述语言特征可以包括状态特征、实体特征、语义特征和词特征。上述状态特征可以是用户的个性化标签以及行为标签,例如,用户是否为新用户,用户性别是男是女。上述状态特征可以根据用户的信息进行获取,可以通过0/1的形式进行记录。上述实体特征可以是表示当前交互中用户谈及的实体。

例如,用户说:我喜欢听歌手A的《XXX》。

其中歌手A是歌手,《XXX》是歌曲名。上述语义特征可以是对用户当前输入经过模型得到的向量化表示。上述词特征可以是当前用户在输入的语音或者文本中,具体的词汇。

上述语言特征还可以包括二元分词(BiGram),词向量(word vector)等其他特征,从而丰富语言特征,以使对话模型可以更准确的确定对应的反馈信息。

获取输入语句之后,从输入语句中确定语言特征,由于语言特征包括多个内容,不同的内容获取方式不同。上述状态特征可以通过用户信息进行获取。

上述实体特征可以根据输入语句确定,具体的,可以将上述输入语句先经过实体解析模块,识别输入语句中的实体,并将该实体与知识图谱中的实体节点关联起来,确定实体特征。

上述语义特征可以通过一个双向的LSTM(Long Short-Term Memory,长短期记忆网络)句子编码器进行确定,将输入语句输入上述LSTM句子编码器,由上述LSTM句子编码器输出输入语句的语义特征。

作为一种可选的实施例,从输入语句中确定语义特征,还可以先建立语义识别模型,上述语义识别模型可以为深度学习模型或者机器学习模型,通过输入语句和对应的语义特征进行训练,然后通过将输入语句输入语义识别模型,由语义识别模型输出语义特征。

上述词特征可以直接对上述输入语句的文本进行文本识别,确定文本中的词特征。

根据语言特征获取对应的对话向量可以通过语言特征和上一次的历史对话数据进行关联,生成本次对话的上述语言特征下的对话向量。具体的,可以通过语言特征和上一次对话交互得到的GRU的结果,输入GRU得到当前对话交互的对话向量。

上述历史对话可以是前一轮系统与用户的对话交互,包括用户的提问和系统对用户提问的回答,提问和回答组成前一轮对话交互。在前一轮系统对话中,根据用户的提问的语言特征确定有该提问对应的GRU的结果。在本轮对话交互中,GRU的输入是上述语言特征,以及上一次的对话交互的GRU的结果。

步骤S306,基于不同对象的语言特征,调用不同的对话模型;

步骤S308,对不同对象输入的输入语句采用对应的对话模型进行处理,生成不同对象所对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

本申请上述步骤S308中,基于步骤S302中得到的不同对象输入的输入语句和语义实体,通过对话模型获取不同对象所对应的的反馈信息,其中,反馈信息可以包括:对用户问答的回答语句,或者对用户对话的回复,或者对用户需求外部服务的响应(即本申请实施例中的第三方服务)。

其中,第三方服务器可以包括:天气查询、在线购物、智能家电控制、导航、在线订票中的至少一种。

本申请实施例中反馈信息的表现形式包容如下方式:

方式一:反馈信息为对用户问答的回答语句的情况下;

例如,输入语句为:“你好,在吗?”反馈信息则可以反馈为:“在呢,请讲”。

方式二:反馈信息为输入语句中请求调用的第三方服务的情况下;

例如,输入语句为:“明天A地天气”,反馈信息则可以反馈为通过调用第三方的天气查询服务,反馈:“明天A地天气:晴;微风,……”。并可扩展为A地未来N天的天气、出行意见和穿衣意见。

方式三:反馈信息为用户问答的回答语句和输入语句中请求调用的第三方服务的情况下;

具体的,结合方式一和方式二,例如,输入语句为:“你好,明天A地天气”,反馈信息则通过调用第三方的天气查询服务器,反馈为:“您是想知道明天A地的天气吗?明天A地天气:晴;微风,……”。

需要说明的是,本申请实施例中的反馈信息仅以上述示例为例进行说明,以实现本申请实施例提供的交互的方法为准,具体不做限定。

在本发明实施例中,通过采集多个对象输入的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;基于不同对象的语义实体,确定不同对象的语言特征;基于不同对象的语言特征,调用不同的对话模型;对不同对象输入的输入语句采用对应的对话模型进行处理,生成不同对象所对应的反馈信息,其中,反馈信息包括:对输入语句的反馈信息,和/或,输入语句中请求调用的第三方服务,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

实施例3

本申请提供了如图4所示的交互的方法。图4是根据本发明实施例三的一种交互的方法的流程图,如图4所示,该方法包括以下步骤:

步骤S402,获取样本数据的语言特征,并依据语言特征获取对应的对话向量;

获取样本数据可以通过语音接收装置接收用户语音,然后通过语音转换的方式将用户语音转换为用户的输入文本,例如,采用ASR技术将上述语音识别为文本。上述样本数据可以为用户的语音,或者用户的语音对应的文本。

上述语言特征可以包括状态特征、实体特征、语义特征和词特征。上述状态特征可以是用户的个性化标签以及行为标签,例如,用户是否为新用户,用户性别是男是女。上述状态特征可以根据用户的信息进行获取,可以通过0/1的形式进行记录。上述实体特征可以是表示当前交互中用户谈及的实体。

例如,用户说:我喜欢听歌手A的《XXX》。

其中歌手A是歌手,《XXX》是歌曲名。上述语义特征可以是对用户当前输入经过模型得到的向量化表示。上述词特征可以是当前用户在输入的语音或者文本中,具体的词汇。

上述语言特征还可以包括二元分词(BiGram),词向量(word vector)等其他特征,从而丰富语言特征,以使对话模型可以更准确的确定对应的反馈信息。

获取样本数据之后,从样本数据中确定语言特征,由于语言特征包括多个内容,不同的内容获取方式不同。上述状态特征可以通过用户信息进行获取。

上述实体特征可以根据样本数据确定,具体的,可以将上述样本数据先经过实体解析模块,识别样本数据中的实体,并将该实体与知识图谱中的实体节点关联起来,确定实体特征。

上述语义特征可以通过一个双向的LSTM(Long Short-Term Memory,长短期记忆网络)句子编码器进行确定,将样本数据输入上述LSTM句子编码器,由上述LSTM句子编码器输出样本数据的语义特征。

作为一种可选的实施例,从样本数据中确定语义特征,还可以先建立语义识别模型,上述语义识别模型可以为深度学习模型或者机器学习模型,通过样本数据和对应的语义特征进行训练,然后通过将样本数据输入语义识别模型,由语义识别模型输出语义特征。

上述词特征可以直接对上述样本数据的文本进行文本识别,确定文本中的词特征。

根据语言特征获取对应的对话向量可以通过语言特征和上一次的历史对话数据进行关联,生成本次对话的上述语言特征下的对话向量。具体的,可以通过语言特征和上一次对话交互得到的GRU的结果,输入GRU得到当前对话交互的对话向量。

上述历史对话可以是前一轮系统与用户的对话交互,包括用户的提问和系统对用户提问的回答,提问和回答组成前一轮对话交互。在前一轮系统对话中,根据用户的提问的语言特征确定有该提问对应的GRU的结果。在本轮对话交互中,GRU的输入是上述语言特征,以及上一次的对话交互的GRU的结果。

作为一种可选的实施例,获取样本数据的语言特征包括:分别对样本数据进行实体识别和语义识别,得到语言特征。

上述语言特征可以包括状态特征、实体特征、语义特征和词特征,其中状态特征和词特征分别可以通过用户信息和样本数据的文本直接进行确定和获取,上述实体特征和语义特征需要对样本数据进行识别。具体的,实体特征需要对样本数据进行实体识别进行获取;语义特征要对样本进行语义识别进行获取。因此,分别对样本数据进行实体识别和语义识别,可以得到上述语言特征。

在本实施例中,上述对样本数据进行实体识别,可以将上述样本数据先经过实体解析模块,识别样本数据中的实体,例如,用户说“我喜欢听歌手A的《XXX》”,其中的实体包括:歌手A是歌手,《XXX》是歌曲名。

对样本数据进行语义识别,可以通过语义识别模型进行识别,上述语音识别模型可以为深度学习模型,机器学习模型,句子编码器等。在本实施例中,对上述样本数据可以通过一个双向的LSTM(Long Short-Term Memory,长短期记忆网络)句子编码器进行语义识别。

作为一种可选的实施例,分别对样本数据进行实体识别和语义识别,得到语言特征包括:对样本数据进行实体识别,得到语义实体;依据语义实体与预设数据进行匹配,得到第一识别结果;对样本数据进行语义识别,得到第二识别结果;依据第一识别结果、第二识别结果和输入样本数据的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征。

对样本数据进行实体识别,得到语义实体,可以将上述样本数据先经过实体解析模块,识别样本数据中的语义实体。具体的,将上述样本数据的文本,输入实体解析模块,由该实体解析模块输出对应的语义实体。

上述预设数据可以为知识图谱,预先创建知识图谱可以通过爬取线上数据获得,如音乐信息,包括歌手、专辑名、作曲者、歌曲名等。知识图谱中的节点表示实体,包括歌手、歌曲等,知识图谱中的边表示不同节点或者不同实体之间的关系,例如,A歌手节点和B歌曲节点之间的边表示A歌手“演唱”B歌曲。

上述第一识别结果可以为上述实体特征,包括实体和实体之间的关系。依据语义实体与预设数据进行匹配,得到第一识别结果,可以是并将该样本数据的语义实体与知识图谱中的实体节点关联起来,得到实体特征,记录在知识图谱中,包括实体和实体之间的关系。

对样本数据进行语义识别,得到第二识别结果,上述第二识别结果可以为语义特征,在本实施例中,可以通过一个双向的LSTM(Long Short-Term Memory,长短期记忆网络)句子编码器进行确定,将样本数据输入上述LSTM句子编码器,由上述LSTM句子编码器输出样本数据的语义特征。

上述依据第一识别结果、第二识别结果和输入样本数据的状态,得到语言特征。上述第一识别结果是实体识别得到的实体特征,第二识别结果是语义识别得到的语义特征,输入样本数据的状态,可以得到样本的状态特征,根据上述样本数据的文本可以得到词特征。

上述语言特征还可以包括其他方式获取的用于确定反馈信息的特征,例如,二元分词,词向量等其他特征。

作为一种可选的实施例,依据语言特征获取对应的对话向量包括:依据语言特征与至少一次历史对话数据进行关联,得到对话向量。

根据语言特征获取对应的对话向量可以通过语言特征和上一次的历史对话数据进行关联,生成本次对话的上述语言特征下的对话向量。具体的,可以通过语言特征和上一次对话交互得到的GRU的结果,输入GRU得到当前对话交互的对话向量。

上述历史对话可以是前一轮系统与用户的对话交互,包括用户的提问和系统对用户提问的回答,提问和回答组成前一轮对话交互。在前一轮系统对话中,根据用户的提问的语言特征确定有该提问对应的GRU的结果。在本轮对话交互中,GRU的输入是上述语言特征,以及上一次的对话交互的GRU的结果。

作为一种可选的实施例,依据语言特征与至少一次历史对话数据进行关联,得到对话向量包括:依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量。

上述历史对话可以包括用户的历史提问,以及该历史提问对应的系统回复,一个提问和一个回复构成一次历史对话。上述对话向量包括上述语言特征和上述历史对话数据。

上述历史对话数据可以为当前历史对话的前一次对话,距离当前对话越近,两次对话的关联可能越紧密,互相之间的影响越大,因此上述历史对话可以是距离本次对话最近的历史对话。

步骤S404,依据语言特征和对话向量,获取样本数据的类别标签和动作特征;

上述类别标签可以是对话动作类别标签,例如,询问,对话,查询等。上述类别标签还可以是对话语言类别标签。上述动作特征可以是回答问题,响应对话,查询信息等。

作为一种可选的实施例,依据语言特征和对话向量获取样本数据的类别标签和动作特征包括:依据对话向量,获取样本数据的类别标签;依据语言特征和对话向量,获取样本数据的动作特征。

在本实施例中,上述类别标签可以为对话动作类别标签,依据对话向量,获取样本数据的类别标签,可以通过分类器来实现。具体的,将对话向量作为输入,输入分类器,得到该对话向量对应的类别标签。例如,通过分类器从上述对话向量进行解码得到类标签的得分,根据不同类别标签的得分确定对话向量对应的类别标签。

依据语言特征和对话向量,获取样本数据的动作特征,可以通过动作决策模块实现。具体的,将上述语言特征和对话向量作为输入,输入动作决策模块,得到动作特征,根据该动作特征,得到最终的系统的输出,即系统对用户的回复或者提供用户所请求的外部服务。

作为一种可选的实施例,依据对话向量,获取样本数据的类别标签包括:对对话向量中的语义标签进行分类,得到样本数据的类别标签。

步骤S406,依据类别标签和动作特征,生成对应样本数据的反馈信息;

根据类别标签和动作特征得到系统最终对用户输入的样本数据的反馈信息,包括对用户问答的回答语句,或者对用户对话的回复,或者对用户需求外部服务的响应。

步骤S408,依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型,其中,对话模型,用于获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

根据上述历史对话和语言特征,对话向量,类别标签和动作特征进行训练,得到对话模型,具体的,可以通过样本数据和语言特征对获取语言特征的模型部分进行训练,通过语言特征和对话向量对获取对话向量的模型部分进行训练,通过语言特征和类别标签对分类器进行训练,通过语言特征,对话向量和动作特征对动作决策模块进行训练,从而实现分布对模型进行训练,建立对话模型。

作为一种可选的实施例,还可以通过对话树对上述对话模型进行优化,对话树是数据来源,通过对话树优化的是对话模型的整体。即从对话树可以得到一个个对话的交互包括用户的输入问题和系统的动作,对话树的对话数据作为训练样本优化上述整体的端到端对话模型。

本申请实施例中反馈信息的表现形式包容如下方式:

方式一:反馈信息为对用户问答的回答语句的情况下;

例如,输入语句为:“你好,在吗?”反馈信息则可以反馈为:“在呢,请讲”。

方式二:反馈信息为输入语句中请求调用的第三方服务的情况下;

例如,输入语句为:“明天A地天气”,反馈信息则可以反馈为通过调用第三方的天气查询服务,反馈:“明天A地天气:晴;微风,……”。并可扩展为A地未来N天的天气、出行意见和穿衣意见。

方式三:反馈信息为用户问答的回答语句和输入语句中请求调用的第三方服务的情况下;

具体的,结合方式一和方式二,例如,输入语句为:“你好,明天A地天气”,反馈信息则通过调用第三方的天气查询服务器,反馈为:“您是想知道明天A地的天气吗?明天A地天气:晴;微风,……”。

需要说明的是,本申请实施例中的反馈信息仅以上述示例为例进行说明,以实现本申请实施例提供的交互的方法为准,具体不做限定。

根据上述步骤,通过获取样本数据的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取样本数据的类别标签和动作特征;依据类别标签和动作特征,生成对应样本数据的反馈信息;依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型的方式,通过样本数据的语言特征、对话向量、类别标签和动作特征,以及对应的反馈信息训练模型,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

作为一种可选的实施例,交互的方法应用于端到端交互系统,其中,端到端交互系统包括:在线交互系统、智能交互设备、嵌入智能交互设备的装置。

具体的,接收输入语句可以通过语音接收装置接收用户语音,然后通过语音转换的方式将用户语音转换为用户的输入文本,例如,采用ASR技术将上述语音识别为文本。上述输入信息可以为用户的语音,或者用户的语音对应的文本。接收输入语句还可以通过交互装置接收用户输入的文本。

上述语言特征可以包括状态特征、实体特征、语义特征和词特征。上述状态特征可以是用户的个性化标签以及行为标签,例如,用户是否为新用户,用户性别是男是女。上述状态特征可以根据用户的信息进行获取。上述实体特征可以是表示当前交互中用户谈及的实体。上述语义特征可以是对用户当前输入经过模型得到的向量化表示。上述词特征可以是当前用户在输入的语音或者文本中,具体的词汇。

获取输入语句之后,从输入语句中确定语言特征,由于语言特征包括多个内容,不同的内容获取方式不同。上述状态特征可以通过用户信息进行获取。上述实体特征可以根据输入语句确定,具体的,可以将上述输入语句先经过实体解析模块,识别输入语句中的实体,并将该实体与知识图谱中的实体节点关联起来,确定实体特征。上述语义特征可以通过一个双向的LSTM句子编码器进行确定,将输入语句输入上述LSTM句子编码器,由上述LSTM句子编码器输出输入语句的语义特征。上述词特征可以直接对上述输入语句的文本进行文本识别,确定文本中的词特征。

根据语言特征获取对应的对话向量,可以通过语言特征和上一次的历史对话数据进行关联,生成本次对话的上述语言特征下的对话向量。具体的,可以通过语言特征和上一次对话交互得到的GRU的结果,输入GRU得到当前对话交互的对话向量。上述历史对话可以是前一轮系统与用户的对话交互,包括用户的提问和系统对用户提问的回答,提问和回答组成前一轮对话交互。在前一轮系统对话中,根据用户的提问的语言特征确定有该提问对应的GRU的结果。在本轮对话交互中,GRU的输入是上述语言特征,以及上一次的对话交互的GRU的结果。

依据语言特征和对话向量获取样本数据的类别标签和动作特征包括:依据对话向量,获取样本数据的类别标签;依据语言特征和对话向量,获取样本数据的动作特征。依据对话向量,获取样本数据的类别标签,可以通过分类器来实现。具体的,将对话向量作为输入,输入分类器,得到该对话向量对应的类别标签。例如,通过分类器从上述对话向量进行解码得到类标签的得分,根据不同类别标签的得分确定对话向量对应的类别标签。

依据语言特征和对话向量,获取样本数据的动作特征,可以通过动作决策模块实现。具体的,将上述语言特征和对话向量作为输入,输入动作决策模块,得到动作特征,根据该动作特征,得到最终的系统的输出,即系统对用户的回复或者提供用户所请求的外部服务。

根据类别标签和动作特征得到系统最终对用户输入的样本数据的反馈信息,包括对用户问答的回答语句,或者对用户对话的回复,或者对用户需求外部服务的响应。

根据上述历史对话和语言特征,对话向量,类别标签和动作特征进行训练,得到对话模型,具体的,可以通过样本数据和语言特征对获取语言特征的模型部分进行训练,通过语言特征和对话向量对获取对话向量的模型部分进行训练,通过语言特征和类别标签对分类器进行训练,通过语言特征,对话向量和动作特征对动作决策模块进行训练,从而实现分布对模型进行训练,建立对话模型。

根据上述步骤,通过接收输入语句;通过对话模型获取对应输入语句的反馈信息;其中,对话模型通过获取输入语句的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取输入语句的类别标签和动作特征;依据类别标签和动作特征,生成对应输入语句的反馈信息;依据包含有反馈信息的历史对话对获取输入语句的语言特征、对话向量、类别标签和动作特征的过程进行训练得到的方式,通过样本数据的语言特征、对话向量、类别标签和动作特征,以及对应的反馈信息训练模型,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

需要说明的是,本实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。

本实施方式通过一个端到端的序列分类模型从对话树中学习对话交互模型,其中,端到端是指从输入不经过pipeline的处理直接经过模型得到所需要的输出。该系统仅包括两部分算法模块,具体的,1.实体识别模块,即识别出用户提问(也即是输入语句)中的实体,比如知道“我要听歌手A的《XXX》”中歌手A为歌手,《XXX》为歌曲;2.对话交互模型,根据用户的输入语句以及识别的实体,直接得到系统向用户执行的动作。

本实施方式能够降低传统方法模块拆分带来的错误传播的问题,而且通过端到端的对话交互算法直接得到系统给用户的回复或者所需要请求的外部服务,避免了传统方法中对话决策模块的逻辑代码编写。

图5是根据本发明实施例三的一种交互的方法中对话系统的示意图,如图5所示,本实施方式的主要流程如下:

1).用户的输入文本首先经过实体解析模块,识别实体,并将该实体与知识图谱中的实体节点关联起来;其中,知识图谱的构建方式可以通过爬取线上数据,如音乐信息,包括歌手、专辑名、作曲者、歌曲名等。知识图谱中的节点表示实体,如歌手、歌曲,知识图谱中的边表示关系,如歌手“演唱”歌曲。

2).用户的输入文本经过语义建模可以得到该文本的语义表示,也即是语义特征,在本系统中通过一个双向的LSTM句子编码器输出输入文本的语义表示。

3).用户的输入状态连同上述两步的结果,可以得到用户整个输入的特征,包括:状态特征、实体特征、语义特征和词特征等;输入状态包括用户的个性化及行为特征,如:用户是否为新用户、是否第一次进入,是男是女等。

上述状态特征是用户的个性化标签以及行为标签,如用户是否为新用户,是男是女等,是作为0/1向量的模式输入;

上述实体特征是表示当前交互中用户谈及的实体,如用户说了什么歌手、什么歌曲,也是作为0/1向量的模式输入;

上述语义特征是对用户当前输入经过模型得到的向量化表示;

上述词特征是当前用户输入问题中说了哪些词汇,作为0/1向量的模式输入。

4).第3步的特征以及上一次交互得到的GRU的结果经过GRU(门控循环单元)能够得到当前交互的向量表示,也即是对话向量;GRU的输入是第三步中的四个特征:状态特征、实体特征、语义特征和词特征;输出是隐层向量,即向量表示。上一次交互就是前一轮系统跟用户的交互,包括用户的输入问题以及系统的回复,这两者组成了一轮对话。

5).第4步得到的当前交互的向量表示经过分类模块以及将前述特征作为输入的动作预决策模块,得到最终系统的输出,即系统的回复或者所需请求的外部服务。分类模块,是分类器,可以认为是从前述向量经过解码得到的类别标签得分。输入是前述交互向量,输出是对话动作类别标签的得分。动作决策模块的输入是前述第三部得到的四类特征,以及上一轮得到GRU的向量表示;输出表示动作。

6).最后根据对话树的数据整体优化上述模块,以期对话数据的动作与上述系统预测的动作是一致的。对话树是指树状结构的对话,每个节点是用户说了什么,系统怎么回答,下一层的节点同样对应着用户说了什么系统怎么回的。对话树是数据来源,通过对话树优化的是对话模型的整体。即从对话树可以得到一个个对话的交互包括用户的输入问题和系统的动作,这个数据作为训练样本优化上述整体的端到端对话模型。

上述步骤3)中的特征部分还能采用更多的特征,如二元分词BiGram、词向量wordvector等特征。上述步骤4)中除了GRU(门控循环单元)还可以采用LSTM等循环神经网络常用的单元。

原来多个模块组成的Pipeline的处理流程导致误差传播,无法整体优化。本实施方式将原来的三个模块(实际会更多)缩减至两个模块,而且可以整体进行优化;传统的方法中进行对话交互决策需要用代码编写的方法进行。本实施方式直接从对话数据中学习得到对话决策模型,避免对话决策中的代码编写,同时通过对话预决策模块保证了本方法的逻辑可控。

本实施方式的关键点在于,将传统方法至少三个模块的Pipeline的系统建模成端到端可整体优化的对话交互系统;利用序列学习算法直接学习对话交互中系统给出的决策动作,避免需要代码编写对话决策,极大地降低了门槛。

本实施方式可以应用于tensorflow基础开发工具。

实施例4

本申请提供了如图6所示的交互的方法。图6是根据本发明实施例四的一种交互的方法的流程图,如图6所示,该方法包括以下步骤:

步骤A,采集当前输入的输入语句;

其中,采集当前输入的输入语句的方式可以包括:通过终端设备内部的声音采集装置(例如,麦克风)采集用户说话的声音,依据采集到的用户说话的声音转换为输入终端设备的输入语句;和/或,通过具备触控屏/外接输入设备(如:键盘和/或鼠标,或,具备输入、选择、控制功能的显示屏)采集用户输入的输入语句。

步骤B,调用对话模型分析当前输入的输入语句,在触控屏上显示与当前输入的输入语句具有语义关系的反馈信息;

其中,通过调用对话模型分析步骤A采集到的该输入语句,将与该输入语句具有语义关系的反馈信息显示于触控屏中,在本申请实施例中,触控屏除了作为输入设备外还能够用于显示。

本申请上述步骤B中,通过调用对话模型,将采集到的输入语句进行语义分析,将语义分析结果匹配对应的反馈信息,其中,该反馈信息可以包括:对所述输入语句的回复和/或对应所述输入语句中请求调用的第三方服务。

例如,用户A说:“明天A地的天气。”终端设备通过采集该“明天A地的天气。”进行语义分析,得到用户A想要获知:明天、A地、天气的语义分析结果,终端设备通过调用第三方天气查询服务,向用户A反馈明天A地天气,并可扩展的显示A地未来N天的天气。

步骤C,采集基于反馈信息再次输入的输入语句;

本申请上述步骤C中,仍以步骤B中的示例为例进行说明,若用户A获知A地明天的天气后,终端设备再次采集用户A输入的输入语句,例如,用户A想知道更多关于A地的信息,即,A地机场到用户A订的酒店的乘车方式,可表现为“从出发地A地机场到用户A订的酒店A的乘车攻略”。

步骤D,调用对话模型分析再次输入的输入语句,在触控屏上显示与再次输入的输入语句具有语义关系的反馈信息;

本申请上述步骤D中,基于步骤C中输入的输入语句,通过再次调用对话模型,对该输入语句作进一步地分析,终端设备通过调用对话模型获知:用户A的出发地是A地机场,目的地是用户A订的酒店A,A地机场到酒店A的乘车攻略的语义分析结果,进而依据语义分析结果生成反馈信息,即,终端设备可以反馈:公交路线(含乘车下车点,乘车用时和车票价格)、驾车路线、打车路线(含在线打车,全程用时,预估价格)。

步骤E,循环执行上述步骤C和步骤D,直至接收到结束指令。

本申请上述步骤E中,通过循环执行步骤C和步骤D,直至用户完成与终端设备的交互,认为本轮人机交互结束。

此外,将用户A与终端设备的交互记录进行保存,并将该交互记录返回至神经网络做为样本进行进一步地学习,从而丰富神经网络的样本学习数量、类型,使得为以后用户A的交互提供更贴合的服务,或,依据用户A的交互记录为其他用户提供可参考的交互结果。

本申请实施例中反馈信息的表现形式包容如下方式:

方式一:反馈信息为对用户问答的回答语句的情况下;

例如,输入语句为:“你好,在吗?”反馈信息则可以反馈为:“在呢,请讲”。

方式二:反馈信息为输入语句中请求调用的第三方服务的情况下;

例如,输入语句为:“明天A地天气”,反馈信息则可以反馈为通过调用第三方的天气查询服务,反馈:“明天A地天气:晴;微风,……”。并可扩展为A地未来N天的天气、出行意见和穿衣意见。

方式三:反馈信息为用户问答的回答语句和输入语句中请求调用的第三方服务的情况下;

具体的,结合方式一和方式二,例如,输入语句为:“你好,明天A地天气”,反馈信息则通过调用第三方的天气查询服务器,反馈为:“您是想知道明天A地的天气吗?明天A地天气:晴;微风,……”。

需要说明的是,本申请实施例中的反馈信息仅以上述示例为例进行说明,以实现本申请实施例提供的交互的方法为准,具体不做限定。

需要说明的是,本申请实施例提供的交互的方法中所应用的终端设备可以为携带触控屏的智能音箱,或,安装有含有对话模型APP的智能移动设备,其中,智能移动设备可以包括:智能手机、平板电脑、笔记本电脑、台式电脑、智能穿戴设备(智能手表,智能眼镜,VR设备或AR设备)。

本申请实施例提供的交互的方法以适用于天气查询和交通出行查询为例进行说明,除此之外还可以包括对室内智能家居的控制,具体不做限定,以实现本申请实施例提供的交互的方法为准。

实施例5

本申请提供了如图7所示的交互的方法。图7是根据本发明实施例五的一种交互的方法的流程图,如图7所示,在服务器侧,该方法包括以下步骤:

步骤S702,服务器接收智能设备采集到的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;

本申请步骤S702中,服务器可以为云端服务器,或服务器集群,该云端服务器集群可以包括分布式服务器集群;智能设备可以包括:智能移动终端(例如,智能手机)、智能(小)家电(例如,智能音箱);

具体的,将智能设备以智能音箱为例,服务器接收智能音箱采集的用户A的输入语句,通过分析该用户A的输入语句,获取该输入语句中的语义实体。

步骤S704,服务器依据语义实体,通过对话模型获取与输入语句匹配的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、输入语句中请求调用的第三方服务;

本申请上述步骤S704中,服务器在得到语义实体后,依据该语义实体通过调用对话模型获取与输入语句匹配的反馈信息。

例如,智能设备采集到用户A说:“明天A地的天气。”服务器通过获取该输入语句“明天A地的天气”,得到语义实体:时间(明天),位置(A地),天气;

基于上述得到的语义实体,通过对话模型确定该输入语句对应的动作(询问天气),因此得到对应该输入语句的反馈信息,如:明天A地天气晴,紫外线指数X,微风,建议穿衣:#¥%……,并可扩展的显示A地未来N天的天气。

步骤S706,服务器将反馈信息发送给智能设备。

本申请上述步骤S706中,基于步骤S704中得到的反馈信息,返回智能设备。

本申请实施例中反馈信息的表现形式包容如下方式:

方式一:反馈信息为对用户问答的回答语句的情况下;

例如,输入语句为:“你好,在吗?”反馈信息则可以反馈为:“在呢,请讲”。

方式二:反馈信息为输入语句中请求调用的第三方服务的情况下;

例如,输入语句为:“明天A地天气”,反馈信息则可以反馈为通过调用第三方的天气查询服务,反馈:“明天A地天气:晴;微风,……”。并可扩展为A地未来N天的天气、出行意见和穿衣意见。

方式三:反馈信息为用户问答的回答语句和输入语句中请求调用的第三方服务的情况下;

具体的,结合方式一和方式二,例如,输入语句为:“你好,明天A地天气”,反馈信息则通过调用第三方的天气查询服务器,反馈为:“您是想知道明天A地的天气吗?明天A地天气:晴;微风,……”。

需要说明的是,本申请实施例中的反馈信息仅以上述示例为例进行说明,以实现本申请实施例提供的交互的方法为准,具体不做限定。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个非易失性存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。

实施例6

根据本发明实施例,还提供了一种智能设备,图8a是根据本发明实施例六的一种智能设备的示意图,如图8a所示,包括:语音采集装置82a,用于采集语音信息;处理器84a,与语音采集装置82a连接,用于从语音信息中识别出输入语句,并通过对话模型处理输入语句的语义实体,生成对应的反馈信息,其中,输入语句的语义实体表征输入语句中的语义。

具体的,本申请实施例中的智能设备可以包括:智能音箱,或,具备声音采集功能的智能家电,如,电视、冰箱、空调、洗衣机、电压力锅;

在智能设备为智能音箱的情况下,智能音箱通过内置语音采集装置(或连接的手机、平板电脑)采集用户的语音信息,通过语音采集装置从该语音信息中识别出输入语句,并通过对话模型分析该输入语句,得到该输入语句的语义实体,并依据该语义实体获取该输入语句对应动作(以查询天气为例,此时输入语句对的动作为查询),最终生成对应的反馈信息,如,未来A地天气为#¥%。

同理,对于声音采集功能的智能家电对于语音信息的解析方式同上述。

需要说明的是,在本申请实施例中反馈信息的展示形式与实施例1至5中任意一个示例中的方式相同,此处不再赘述。

实施例7

根据本发明实施例,还提供了一种智能设备,图8b是根据本发明实施例七的一种智能设备的示意图,如图8b所示,包括:触控屏82b,用于采集通过触控交互功能输入的输入语句,其中,输入语句的语义实体表征输入语句的语义;处理器84b,与触控屏82b连接,用于通过对话模型处理输入语句的语义实体,生成对应的反馈信息;其中,触控屏还用于显示反馈信息。

具体的,本申请实施例中的智能设备可以包括:携带有触控屏的智能音箱,或,具备触控屏的智能家电,如,电视、冰箱、空调、洗衣机、电压力锅;其中触控屏可以为具备输入功能的LED屏。

在智能设备为具有输入功能的触控屏的智能音箱的情况下,智能音箱通过触控屏采集用户的输入语句,并通过处理器中的对话模型分析该输入语句,得到该输入语句的语义实体,并依据该语义实体获取该输入语句对应动作(以查询天气为例,此时输入语句对的动作为查询),最终生成对应的反馈信息,如,未来A地天气为#¥%。

同理,对于智能家电对于输入语句的解析方式同上述。

需要说明的是,在本申请实施例中反馈信息的展示形式与实施例1至5中任意一个示例中的方式相同,此处不再赘述。

实施例8

根据本发明实施例,还提供了一种智能设备,图8c是根据本发明实施例八的一种智能设备的示意图,如图8c所示,包括:语音采集装置82c,用于采集语音信息;触控屏84c,用于显示识别语音信息而产生的至少一条语句,并接收通过触控交互功能从至少一条语句中选择的输入语句,其中,输入语句的语义实体表征输入语句的语义;处理器86c,与语音采集装置和触控屏连接,用于通过对话模型处理输入语句的语义实体,生成对应的反馈信息;其中,触控屏还用于显示反馈信息。

区别于实施例6和7中的,本申请实施例中的智能设备是同时具备语音采集装置和触控屏的智能设备,在实施上通过语音采集装置采集用户的语音信息,并通过触控屏显示对应该语音信息产生对应的至少一条语句,并在用户选择的语句中通过处理器中的对话模型进行识别分析,产生对应的反馈信息。

需要说明的是,在本申请实施例中反馈信息的展示形式与实施例1至5中任意一个示例中的方式相同,此处不再赘述。

实施例9

根据本发明实施例,还提供了一种用于实施上述实施例4的交互的方法的装置,该装置包括:第一采集模块,用于采集当前输入的输入语句;第二调用模块,用于调用对话模型分析所述当前输入的输入语句,在触控屏上显示与所述当前输入的输入语句具有语义关系的反馈信息;第二采集模块,用于采集基于所述反馈信息再次输入的输入语句;第二调用模块,用于调用所述对话模型分析所述再次输入的输入语句,在所述触控屏上显示与所述再次输入的输入语句具有语义关系的反馈信息;执行模块,用于循环执行上述第二采集模块和第二调用模块,直至接收到结束指令。

实施例10

根据本发明实施例,还提供了一种用于实施上述实施例5的交互的方法的装置,在服务器侧,该装置包括:接收模块,用于接收智能设备采集到的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;匹配模块,用于依据语义实体,通过对话模型获取与输入语句匹配的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、输入语句中请求调用的第三方服务;发送模块,用于将反馈信息发送给智能设备。

实施例11

根据本发明实施例,还提供了一种用于实施上述实施例1的交互的方法的装置,图9是根据本发明实施例十一的一种交互的装置的示意图,如图9所示,该装置包括:获取模块92,用于依据采集到的输入语句,获取输入语句中的语义实体,其中,语义实体用于识别输入语句中的语义;交互模块94,用于依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的回复、对应输入语句中请求调用的第三方服务。

根据上述装置,通过获取模块,用于依据获取到的输入语句,获取输入语句中的语义实体,其中,语义实体用于识别输入语句中的语义;交互模块,用于依据输入语句和语义实体,通过对话模型获取输入语句对应的反馈信息,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

此处需要说明的是,上述获取模块92和交互模块94对应于实施例1中的步骤S202至步骤S204,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。

实施例12

根据本发明实施例,还提供了一种用于实施上述实施例2的交互的方法的装置,图10是根据本发明实施例十二的一种交互的装置的示意图,如图10所示,该装置包括:采集模块102,用于采集多个对象输入的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;特征模块104,用于基于不同对象的语义实体,确定不同对象的语言特征;调用模块106,用于基于不同对象的语言特征,调用不同的对话模型;交互模块108,用于对不同对象输入的输入语句采用对应的对话模型进行处理,生成不同对象所对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

根据上述装置,通过采集模块,用于采集多个对象输入的输入语句,并获取输入语句中的语义实体,其中,语义实体用于表征输入语句中的语义;特征模块,用于基于不同对象的语义实体,确定不同对象的语言特征;调用模块,用于基于不同对象的语言特征,调用不同的对话模型;交互模块,用于对不同对象输入的输入语句采用对应的对话模型进行处理,生成不同对象所对应的反馈信息,其中,反馈信息包括:对输入语句的反馈信息,和/或,输入语句中请求调用的第三方服务,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

此处需要说明的是,上述采集模块102,特征模块104,调用模块106和交互模块108对应于实施例2中的步骤S302至步骤S308,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例2所公开的内容。

实施例13

根据本发明实施例,还提供了一种用于实施上述实施例3的交互的方法的装置,图11是根据本发明实施例十三的一种交互的装置的示意图,如图11所示,该装置包括:第一获取模块112,第二获取模块114,语句生成模块116和模型训练模块118,下面对该装置进行详细说明。

第一获取模块112,用于获取样本数据的语言特征,并依据语言特征获取对应的对话向量;第二获取模块114,与上述第一获取模块112相连,用于依据语言特征和对话向量,获取样本数据的类别标签和动作特征;语句生成模块116,第二获取模块114相连,用于依据类别标签和动作特征,生成对应样本数据的反馈信息;模型训练模块118,与上述语句生成模块116相连,用于依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型,其中,对话模型,用于获取输入语句对应的反馈信息,其中,反馈信息包括如下至少之一:对输入语句的反馈信息、输入语句中请求调用的第三方服务。

根据上述装置,通过第一获取模块获取样本数据的语言特征,并依据语言特征获取对应的对话向量;第二获取模块依据语言特征和对话向量,获取样本数据的类别标签和动作特征;语句生成模块依据类别标签和动作特征,生成对应样本数据的反馈信息;模型训练模块依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型的方式,通过样本数据的语言特征、对话向量、类别标签和动作特征,以及对应的反馈信息训练模型,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

此处需要说明的是,上述第一获取模块112,第二获取模块114,语句生成模块116和模型训练模块118对应于实施例3中的步骤S402至步骤S408,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例3所公开的内容。

实施例14

根据本发明实施例,还提供了一种交互的系统,图12是根据本发明实施例十四的一种交互的系统的示意图,该系统包括:实体识别模块1202、语义建模模块1204、特征获取模块1206、门控循环模块1208、动作决策模块1210、分类模块1212和对话回复模块1214,下面对该系统进行详细说明。

实体识别模块1202、语义建模模块1204、特征获取模块1206、门控循环模块1208、动作决策模块1210、分类模块1212和对话回复模块1214,其中,实体识别模块1202,用于对输入语句进行实体识别,得到语义实体,并将语义实体与预设数据进行匹配,得到第一识别结果;语义建模模块1204,用于对输入语句进行语义识别,得到第二识别结果;特征获取模块1206,分别与实体识别模块1202和语义建模模块1204连接,用于依据第一识别结果,第二识别结果和输入语句的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征;门控循环模块1208,与特征获取模块1206连接,用于依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量;动作决策模块1210,与特征获取模块1206和门控循环模块1208连接,用于依据语言特征和对话向量,获取输入语句的动作特征;分类模块1212,与门控循环模块1208连接,用于依据对话向量,获取输入语句的类别标签;对话回复模块1214,依据类别标签和动作特征,生成对应输入语句的反馈信息。

根据上述系统,通过实体识别模块1202,用于对输入语句进行实体识别,得到语义实体,并将语义实体与预设数据进行匹配,得到第一识别结果;语义建模模块1204,用于对输入语句进行语义识别,得到第二识别结果;特征获取模块1206,分别与实体识别模块1202和语义建模模块1204连接,用于依据第一识别结果,第二识别结果和输入语句的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征;门控循环模块1208,与特征获取模块1206连接,用于依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量;动作决策模块1210,与特征获取模块1206和门控循环模块1208连接,用于依据语言特征和对话向量,获取输入语句的动作特征;分类模块1212,与门控循环模块1208连接,用于依据对话向量,获取输入语句的类别标签;对话回复模块1214,依据类别标签和动作特征,生成对应输入语句的反馈信息,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

此处需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

实施例15

本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。

可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中,上述计算机终端可以执行应用程序的漏洞检测方法中以下步骤的程序代码:获取样本数据的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取样本数据的类别标签和动作特征;依据类别标签和动作特征,生成对应样本数据的反馈信息;依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型。

可选地,图13是根据本发明实施例的一种计算机终端的结构框图。如图13所示,该计算机终端130可以包括:一个或多个(图中仅示出一个)处理器132、存储器134、以及外设接口136。

其中,存储器可用于存储软件程序以及模块,如本发明实施例中的安全漏洞检测方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的交互的方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端130。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取样本数据的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取样本数据的类别标签和动作特征;依据类别标签和动作特征,生成对应样本数据的反馈信息;依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型,其中,对话模型用于获取输入语句对应的反馈信息,其中,反馈信息包括:对输入语句的反馈信息,和/或,输入语句中请求调用的第三方服务。

可选的,上述处理器还可以执行如下步骤的程序代码:获取样本数据的语言特征包括:分别对样本数据进行实体识别和语义识别,得到语言特征。

可选的,上述处理器还可以执行如下步骤的程序代码:分别对样本数据进行实体识别和语义识别,得到语言特征包括:对样本数据进行实体识别,得到语义实体;依据语义实体与预设数据进行匹配,得到第一识别结果;对样本数据进行语义识别,得到第二识别结果;依据第一识别结果、第二识别结果和输入样本数据的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征。

可选的,上述处理器还可以执行如下步骤的程序代码:依据语言特征获取对应的对话向量包括:依据所语言特征与至少一次历史对话数据进行关联,得到对话向量。

可选的,上述处理器还可以执行如下步骤的程序代码:依据所语言特征与至少一次历史对话数据进行关联,得到对话向量包括:依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量。

可选的,上述处理器还可以执行如下步骤的程序代码:依据语言特征和对话向量获取样本数据的类别标签和动作特征包括:依据对话向量,获取样本数据的类别标签;依据语言特征和对话向量,获取样本数据的动作特征。

可选的,上述处理器还可以执行如下步骤的程序代码:依据对话向量,获取样本数据的类别标签包括:对对话向量中的语义标签进行分类,得到样本数据的类别标签。

可选的,上述处理器还可以执行如下步骤的程序代码:交互的方法应用于端到端交互系统,其中,端到端交互系统包括:在线交互系统、智能交互设备、嵌入智能交互设备。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收输入语句;通过对话模型获取对应输入语句的反馈信息;其中,对话模型通过获取输入语句的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取输入语句的类别标签和动作特征;依据类别标签和动作特征,生成对应输入语句的反馈信息;依据包含有反馈信息的历史对话对获取输入语句的语言特征、对话向量、类别标签和动作特征的过程进行训练得到。

采用本发明实施例,提供了一种交互的方法的方案。通过获取样本数据的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取样本数据的类别标签和动作特征;依据类别标签和动作特征,生成对应样本数据的反馈信息;依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型的方式,通过样本数据的语言特征、对话向量、类别标签和动作特征,以及对应的反馈信息训练模型,达到了通过对话模型直接输出反馈信息的目的,从而实现了避免传统方法中逻辑代码编写步骤的技术效果,进而解决了由现有技术在对话决策制定和实施的过程中,代码需求量大的技术问题。

本领域普通技术人员可以理解,图13所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图13其并不对上述电子装置的结构造成限定。例如,计算机终端130还可包括比图13中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图13所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读非易失性存储介质中,非易失性存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。

实施例16

本发明的实施例还提供了一种非易失性存储介质。可选地,在本实施例中,上述非易失性存储介质可以用于保存上述实施例一所提供的交互的方法所执行的程序代码。

可选地,在本实施例中,上述非易失性存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:获取样本数据的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取样本数据的类别标签和动作特征;依据类别标签和动作特征,生成对应样本数据的反馈信息;依据包含有反馈信息的历史对话对获取样本数据的语言特征、对话向量、类别标签和动作特征的过程进行训练,得到对话模型,其中,对话模型用于获取输入语句对应的反馈信息,其中,反馈信息包括:对输入语句的反馈信息,和/或,输入语句中请求调用的第三方服务。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:获取样本数据的语言特征包括:分别对样本数据进行实体识别和语义识别,得到语言特征。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:分别对样本数据进行实体识别和语义识别,得到语言特征包括:对样本数据进行实体识别,得到语义实体;依据语义实体与预设数据进行匹配,得到第一识别结果;对样本数据进行语义识别,得到第二识别结果;依据第一识别结果、第二识别结果和输入样本数据的状态,得到语言特征,其中,语言特征包括:状态特征、实体特征、语义特征和词特征。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:依据语言特征获取对应的对话向量包括:依据所语言特征与至少一次历史对话数据进行关联,得到对话向量。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:依据所语言特征与至少一次历史对话数据进行关联,得到对话向量包括:依据语言特征中的状态特征、实体特征、语义特征和词特征,与至少一次历史对话数据进行关联,得到包含语言特征和至少一次历史对话数据的对话向量。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:依据语言特征和对话向量获取样本数据的类别标签和动作特征包括:依据对话向量,获取样本数据的类别标签;依据语言特征和对话向量,获取样本数据的动作特征。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:依据对话向量,获取样本数据的类别标签包括:对对话向量中的语义标签进行分类,得到样本数据的类别标签。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:交互的方法应用于端到端交互系统,其中,端到端交互系统包括:在线交互系统、智能交互设备、嵌入智能交互设备的装置。

可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:接收输入语句;通过对话模型获取对应输入语句的反馈信息;其中,对话模型通过获取输入语句的语言特征,并依据语言特征获取对应的对话向量;依据语言特征和对话向量,获取输入语句的类别标签和动作特征;依据类别标签和动作特征,生成对应输入语句的反馈信息;依据包含有反馈信息的历史对话对获取输入语句的语言特征、对话向量、类别标签和动作特征的过程进行训练得到。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取非易失性存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个非易失性存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的非易失性存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术分类

06120113821757