掌桥专利:专业的专利平台
掌桥专利
首页

一种信息交互方法、装置、存储介质及电子设备

文献发布时间:2023-06-19 09:23:00


一种信息交互方法、装置、存储介质及电子设备

技术领域

本说明书涉及计算机技术领域,尤其涉及一种信息交互方法、装置、存储介质及电子设备。

背景技术

随着人工智能技术的进步,早期无需理解信息场景和含义,仅基于预设规则和关键字驱动的计算机交互程序,已经发展成为了能够使用自然语言处理、机器学习等技术,响应各种各样的请求的交互工具的聊天机器人,通过交互的方式为人的生活提供各种各样的辅助,将人力从繁琐的工作中解放出来。

在现有技术中,聊天机器人通常是在接收到信息后产生被动的响应,从功能性来看,聊天机器人包括:闲聊式对话机器人,在开放域背景下进行拟人化的交互,通常用于满足用户的交流需求;任务型机器人,通过准确理解用户指令,采用查询等方式执行某一项任务,例如天气查询、预定机票等;问答型机器人,对用户提出的问题利用预设的业务资源给出答案,例如客服机器人,销售机器人等。

然而,现有的聊天机器人,仅仅能够根据所接收信息的语义产生被动的响应,而无法根据业务需求,结合交互状态进行连续的、有目的的响应。

发明内容

本说明书提供一种信息交互方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案:

本说明书提供的一种信息交互方法,包括:

接收用户发送的待响应信息;

采用训练后的意图识别模型识别所述待响应信息,获得所述待响应信息的意图;并采用训练后的情感识别模型识别所述待响应信息,获得所述待响应信息的情感;

确定当前交互状态;

根据所述意图、所述情感、所述当前交互状态确定响应方式;

根据所述意图和所述情感更新所述当前交互状态;根据所述响应方式生成响应信息,并向所述用户反馈所述响应信息。

可选地,所述待响应信息包括语音信息;

采用训练后的意图识别模型识别所述待响应信息,获得所述待响应信息的意图,具体包括:

采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息;

采用训练后的意图识别模型识别所述文本信息,获得所述文本信息的意图,将所述文本信息的意图作为所述文本信息对应的语音信息的意图。

可选地,所述待响应信息包括语音信息;

采用训练后的情感识别模型识别所述待响应信息,获得所述待响应信息的情感,具体包括:

采用训练后的人声情感识别模型识别所述语音信息,获得所述语音信息的人声情感;

根据所述人声情感确定所述语音信息的情感。

可选地,根据所述人声情感确定所述语音信息的情感,具体包括:

采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息;

采用训练后的文本情感识别模型识别所述文本信息,获得所述文本信息的情感,将所述文本信息的情感作为所述文本信息对应的语音信息的文本情感;

根据所述语音信息的人声情感和所述语音信息的文本情感确定所述语音信息的情感。

可选地,根据所述意图、所述情感、所述当前交互状态确定响应方式,具体包括:

根据所述意图、所述情感、所述当前交互状态,确定预设的与所述意图、所述情感、所述当前交互状态对应的响应信息模板;

所述响应信息模板中包含变量信息和常量信息;

根据所述响应方式生成响应信息,具体包括:

确定所述响应信息模板中包含的变量信息对应的变量类型;

根据所述用户的用户信息和/或所述更新后的当前交互状态,确定所述变量类型对应的变量信息的变量值;

根据所述变量值和所述响应信息模板中包含的常量信息,生成响应信息。

可选地,根据所述意图和所述情感更新所述当前交互状态,具体包括:

确定预设的交互状态,以及交互状态间的预设跳转条件;

确定当前交互状态以及当前交互状态下所述意图和所述情感满足的跳转条件;

更新所述当前交互状态为满足所述跳转条件的交互状态。

可选地,所述常量信息包括预先录制的语音信息;

根据所述变量值和所述响应信息模板中包含的常量信息,生成响应信息,具体包括:

根据所述变量信息的变量值,采用训练后的变量语音生成模型生成与所述变量值对应的语音信息;

将生成的语音信息与所述预先录制的语音信息进行拼接,得到响应信息。

本说明书提供了一种信息交互装置,包括:

信息接收模块:接收用户发送的待响应信息;

信息识别模块:采用训练后的意图识别模型识别所述待响应信息,获得所述待响应信息的意图;并采用训练后的情感识别模型识别所述待响应信息,获得所述待响应信息的情感;

状态确定模块:确定当前交互状态;

响应方式模块:根据所述意图、所述情感、所述当前交互状态确定响应方式;

状态更新及响应信息模块:根据所述意图和所述情感更新所述当前交互状态;根据所述响应方式生成响应信息,并向所述用户反馈所述响应信息。

本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的信息交互方法。

本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的信息交互方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果:

在本说明书提供的信息交互方法中,根据业务需求预设用来定位交互进程的交互状态,根据待响应信息的意图和情感选取在当前交互状态下合适的响应方式用于反馈给用户,并对当前交互状态进行更新。从上述方法中可以看出,本方法能够将交互进程动态地定位到预先设定的交互状态上,并且在不同的交互状态能够根据待响应信息的意图和情感生成适合的响应方式,在连续的交互进程中能够动态生成有目的的响应,为业务提供辅助。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:

图1为本说明书中一种信息交互方法的流程示意图;

图2A为本说明书中一实施例示出的一种确定响应方式的流程示意图;

图2B为本说明书中另一实施例示出的一种确定响应方式的流程示意图;

图3为本说明书中一种更新当前交互状态的流程示意图;

图4为本说明书中一种获取语音信息的意图及情感的流程示意图;

图5为本说明书提供的一种信息交互装置的示意图;

图6为本说明书提供的对应于图1的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。

目前,用于信息交互的聊天机器人,通常在接收到用户发送的待响应信息后,对待响应信息本身进行理解,根据所需功能不同,采取不同的方式生成合适的响应后反馈给用户。其中,任务型机器人,在识别出待响应信息的语义后即执行对应的动作,例如,打开设备中对应的文件、联网查询天气预报、给被指定的人拨打电话等;问答型机器人,通常待响应信息为用户对业务过程产生的问题,需要结合预设的业务资源进行回答,例如,电商的客服机器人在接收到用户询问商品库存数量后,调用数据库中预存的商品库存数量信息,并生成包含商品库存数量信息的回复信息,反馈给用户;闲聊机器人,不仅能够理解当前接收到的待响应信息的语义,在多轮交互的情况下,通常还会结合先前信息对当前的待响应信息进行分析,以获取更准确的语义,选取语料库中对应的回复信息向用户反馈。

通常,聊天机器人只能够进行对待响应信息的被动响应,也就是说,交互过程是由用户发送的信息主导的,无法根据业务目的主动影响交互过程,生成的响应也不具有目的性,从而无法用于获取业务所需信息或完成特定的业务流程。

以下结合附图,详细说明本说明书各实施例提供的技术方案。

图1为本说明书中一种信息交互方法的流程示意图,具体包括以下步骤:

S100:接收用户发送的待响应信息。

自然语言作为人际交流的重要方式,由于有着历史悠久、便于理解、使用广泛等优势,承担着人和人之间的信息表达、交换的重担。基于此,目前用于信息交互的机器人在与用户间进行信息交互的过程中,也常使用自然语言理解技术,用以通过自然语言“拟人”地与用户进行交互。

常见的,通过自然语言与用户进行交互的过程一般是以“接收用户发送的信息、对所述用户发送的信息进行处理、产生响应信息并反馈给用户”这三个过程为一轮,可以进行多轮交互。本说明书实施例对一个交互过程中所包含的轮次不作限定,下面仅以单轮交互为例进行说明,所述单轮交互可以是信息交互过程中唯一的单轮交互,也可以是信息交互过程的多轮交互中的一个单轮交互。

本说明书实施例中,对上述整个交互过程的建立方式不作限定,根据业务需求,可以为用户主动建立的交互,也可以为机器人主动建立的与用户的交互,在建立交互后,所述待响应信息可以为用户主动发送信息,作为待响应信息,当所述单轮交互为一个多轮交互中的非首轮交互时,所述待响应信息也可以为用户根据之前一轮单轮交互中的所述响应信息产生的反馈信息。

所述信息交互装置为能够实现本说明书任一实施例信息交互方法的,区别于用户端设备的,采用图1所示的方法进行信息交互的机器人(即执行图1所示方法的执行主体)可以由任意的智能设备实现,如服务器、个人计算机(Personal Computer,PC)等。

S102:采用训练后的意图识别模型识别所述待响应信息,获得所述待响应信息的意图;并采用训练后的情感识别模型识别所述待响应信息,获得所述待响应信息的情感。

基于语言行为理论,意图为行为视角下的语义,也即语义的一种表现方式,也就是说,意图是希望达到某种目的的打算,在本说明书实施例中,所述意图为所述待响应信息被识别出的目的倾向;情感为自然语言中携带的,能够反映人类感知、态度的信息,在本说明书实施例中,所述情感为所述待响应信息被识别出的情感倾向。

用于识别所述待响应信息的意图和情感的识别模型为已经根据识别目的分别进行过训练的模型,所述识别目的包括对待响应信息意图和情感的识别,该识别模型可以是诸如神经网络等各种机器学习模型。训练该识别模型的方法具体可以为:首先选取样本,然后初始化该识别模型,即,为该识别模型中的所有模型参数赋上初始值。然后将样本输入对应的识别模型,确定识别模型分别输出的预测结果(即,意图识别模型识别出的样本的意图,以及情感识别模型识别出的样本的情感),根据识别模型分别输出的预测结果以及对应样本的标注,分别确定识别模型的损失,损失越小,表示识别模型输出的预测结果与标注越接近,反之表示预测结果与标注差异越大。可根据损失确定梯度,并使用梯度下降算法调整该识别模型中的各模型参数。当模型参数的调整次数达到预设次数阈值,和/或,损失小于预设损失阈值时,将得到识别模型分别作为训练后的意图识别模型和情感识别模型。

得到训练完成的意图识别模型和情感识别模型后,即可通过训练后的意图识别模型和情感识别模型得到待响应信息的意图识别结果和情感识别结果,具体的,所述意图识别结果可以为所述待响应信息的意图类型为预设的每一类意图类型的概率;所述情感识别结果可以为所述待响应信息的情感类型为预设的每一类情感类型的概率。

S104:确定当前交互状态。

根据业务需求,业务进程通常包含至少一个预设的业务环节,相应的,在本说明书实施例中,预设至少一个交互状态,所述交互状态能够表征对应的所述业务环节。所述当前交互状态为能够表征当前交互所代表的业务状态的一个预设交互状态。

在本说明书一个实施例中,所述根据所述业务需求,其中一个业务环节需要对用户身份进行确认,在该业务环节中,预设交互状态包括:用户身份待确认状态、用户身份与预设身份信息对应状态、用户身份与预设身份信息不对应状态,其中,预设身份信息为预先设定的身份信息与联系方式的对应关系,在确认用户身份之前,对应的当前交互状态为用户身份待确认状态,机器人向用户反馈响应信息:请问你是张三吗?识别用户输入的待响应信息,并根据识别结果更新当前交互状态,具体的,若用户回答“是”,则更新当前交互状态为用户身份与预设身份信息对应状态;若用户回答“不是”,则更新当前交互状态为户身份与预设身份信息不对应状态。

S106:根据所述意图、所述情感、所述当前交互状态确定响应方式。

在本说明书中,预设的每一个交互状态,对应至少一个响应方式,所述响应方式用来生成响应信息反馈给用户。当所述当前交互状态为预设的某个交互状态时,该预设的交互状态对应的响应方式,即为当前交互状态对应的响应方式。也就是说,若当前交互状态更新,则所述当前交互状态对应的响应方式也会随之进行相应更新。

对于特定的交互状态,响应方式根据所述待响应信息的意图和情感确定,也就是说,在一种交互状态下,对于待响应信息不同的意图和情感,所选取的响应方式也不同。

具体的,如图2A所示,所述交互状态可以对应由至少一个响应方式构成的响应方式表,所述响应方式表记载了所述交互状态下的所有响应方式,并根据意图和情感选取响应方式,识别所述待响应信息,获得所述待响应信息的意图类型和情感类型,根据识别出的意图类型和情感类型选取其对应的响应方式,具体的,在状态A下所述待响应信息被识别为情感类型3和意图类型2,即选取响应方式(3,2)作为响应方式,并根据响应方式(3,2)生成响应信息反馈给用户。

本说明书另一实施例中,如图2B所示,所述交互状态可以对应由两个坐标轴构成的二维平面,两坐标轴分别被预设代表为意图和情感,在二维平面中所有可能出现识别结果的区域上预设响应方式,根据所述待响应信息的意图识别结果和情感识别结果,定位所述待响应信息在二维平面上的坐标,用以表征所属待响应信息的意图和情感,根据所述待响应信息在所述二维平面上的坐标选取响应方式,并根据所述响应方式生成响应信息反馈给用户。

S108:根据所述意图和所述情感更新所述当前交互状态;根据所述响应方式生成响应信息,并向所述用户反馈所述响应信息。

在本说明书一个实施例中,在单轮交互中,所述当前交互状态包括现态和次态,所述当前交互状态更新前的交互状态为现态,所述当前交互状态更新后的交互状态为次态,次态是相对于现态而言的,一旦更新执行,次态即成为了现态,也就是说,所述当前交互状态执行更新后,所述当前交互状态对应的交互状态即从次态变成了现态。

在本说明书一个实施例中,采用有限状态机表现业务环节的逻辑,处理状态间的切换,具体的,在确定能够表征对应的所述业务环节的交互状态作为该单轮交互的现态后,根据获取到的所述意图和所述情感,选择能够表征所述业务环节的交互状态作为次态,并将选择的次态更新为现态,即,将当前交互状态更新为选择作为次态的交互状态。

具体的,本说明书一个实施例如图3所示,在一个单轮交互中,状态A为所述当前交互状态更新前的交互状态,当意图和情感满足条件c时,所述当前交互状态由状态A更新为状态D,在该单论交互中,状态A为现态,状态D为次态,但当所述意图和所述情感被判定满足条件c后,所述当前交互状态执行更新,此时状态D就由次态变为了现态。

可以看出,所述当前交互状态并不是一直固定的,由于随着每一轮信息交互的进行,当前正在进行的交互在业务环节中所处的位置状态也是变化的,因此,需要根据信息交互的进行对所述当前交互状态进行更新,以确保在进行动态的多轮信息交互时,每一轮信息交互所处的业务环节都能被进行该轮信息交互进行时的当前交互状态所表征。根据所述待响应信息的意图和情感确定更符合该轮信息交互的交互状态,作为当前交互状态。

在本说明书一个实施例中,所述响应方式为根据所述当前交互状态,及所述待响应信息的意图和情感确定的响应策略,根据所述响应方式,生成反馈给用户的响应信息。

在以自然语言作为载体的多轮交互中,往往用户输入的待响应信息是与机器人发出的响应信息具有逻辑关联的,例如,在响应信息为一个问题的时候,通常会收到针对该问题的回答,具体的,在确认用户身份的业务环节中,发送给用户的所述响应信息为:请问你是张三吗?下一轮交互中收到的待响应信息通常包含能够判断用户身份的信息,例如“是的”或“不是”。基于此,合理设置所述响应方式,生成合适的响应信息,通常可以获得符合业务需求的所述待响应信息。

在本说明书一个实施例中,根据所述业务环节,以及所述业务希望达到的业务目的,预设在概率上更可能获得符合业务需求的用户反馈的响应状态,即所述交互有更大概率朝向业务需要的方向发展。

通过上述图1所述的方法可见,本说明书提出了一种信息交互方法,本方法引入当前交互状态定位交互过程,并根据当前交互状态、待响应信息的意图和情感生成响应反馈给用户,所述当前交互状态随着交互的进行而更新,在用于辅助业务时,可以保证所述当前交互状态始终能够表征当前交互在业务中的环节,可选地,本方法还可以根据所述业务需求预设合适的响应方式,用以推动交互过程朝向目的业务环节的方向发展,为具有预设环节和业务需求的业务提供辅助,本方法采用意图和情感两个维度提取所述待响应信息的特征,对用户表达出的意图感知和细粒度情感识别更精确,从而生成更符合人际交互习惯的响应,提高所述交互过程中用户对交互系统的无感知率。

进一步的,在以自然语言为载体的实际信息交互过程中,通常并不仅仅使用固定的一种信息类型,而是为了便于意思的表述使用不同类型的信息,例如,在希望使用较为含蓄的方式表达时,可以使用诗歌(文本类型)、乐曲(音频类型)等信息;网络时代中,预设的表情包(图像类型)更是作为一种流行文化,常在信息交互中被用作表示意图和情感的方式。由于在自然语言交流的过程中,常采用多种类型的信息进行意图和情感的表达,因此,具备理解多种类型信息的信息交互方法,相比于仅能够理解固定的一种类型信息的信息交互方法,在信息交互的过程中能够更准确的理解所述待响应信息。

基于此,本说明书实施例提供在所述待响应信息的类型不同的情况下,对所述待响应信息的意图或情感的识别方法,以实现对所述待响应信息更准确的理解。

在本说明书一个实施例中,在接收到文本类型的待响应信息时,识别待响应信息意图的方法可包括:采用训练后的文本意图识别模型识别所述文本信息,获得所述文本信息的意图,作为所述待响应信息的意图。识别待响应信息情感的方法可包括:采用训练后的文本情感识别模型识别所述文本信息,获得所述文本信息的情感,作为所述待响应信息的情感。

类似的,在接收到音频类型的待响应信息时,识别待响应信息意图的方法可以为:先判断所述音频信息是否为语音信息。若所述音频信息为语音信息,则可直接采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息,采用训练后的文本意图识别模型识别所述文本信息,获得所述文本信息的意图,作为所述待响应信息的意图。若所述音频信息不是语音信息,则可根据预存的音频信息与所述用户发送的音频信息的相似度,确定与所述用户发送的音频信息相匹配的音频信息,作为标准音频信息,根据预设的所述标准音频信息对应的意图,确定所述用户发送的音频信息的意图,即为待响应信息的意图。若在预存的音频信息中未确定出于所述用户发送的音频信息相匹配的音频信息,则可采用训练后的所述非语音音频意图识别模型识别所述用户发送的音频信息的意图,作为所述待响应信息的意图。识别待响应信息情感的方法可以为:先判断所述音频信息是否为语音信息;若所述音频信息为语音信息,可以采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息,采用训练后的文本情感识别模型识别所述文本信息,获得所述文本信息的情感,将所述文本信息的情感作为所述待响应信息的情感。也可以采用训练后的人声情感识别模型识别所述语音信息,获得所述语音信息的人声情感,将所述语音信息的人声情感作为所述待响应信息的情感。还可以如图4所示,采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息,采用训练后的文本情感识别模型识别所述文本信息,获得所述文本信息的情感;采用训练后的人声情感识别模型识别所述语音信息,获得所述语音信息的人声情感;根据所述文本信息的情感和所述人声情感确定所述待响应信息的情感。若所述音频信息不是语音信息,则可根据预存的音频信息与所述用户发送的音频信息的相似度,确定与所述用户发送的音频信息相匹配的音频信息,作为标准音频信息,根据预设的所述标准音频信息对应的情感,确定所述用户发送的音频信息的情感,即为所述待响应信息的情感。若在预存的音频信息中未确定出于所述用户发送的音频信息相匹配的音频信息,则可采用训练后的所述非语音音频识别模型识别所述用户发送的音频信息的情感,将识别出的所述音频信息的情感作为所述待响应信息的情感。

当接收到的待响应信息为音频信息时,采用上述方法识别该音频信息的意图和/或情感之前,可先对多种音频信息对应的意图和/或情感进行标注,并存储这些音频信息及其对应的意图和/或情感的标注。

上述预存的音频信息与所述用户发送的音频信息的相似度可以为根据音频类型的所述待响应信息的特征,采用计算机技术进行识别得到的,与所述标准音频信息的相似概率,具体的,所述特征可以为能够表征音频频率、振幅、节拍、过零率、短时能量、梅尔频率倒谱系数等特点的数值,所述计算机技术可以为包括统计法、神经网络法和模板匹配法等多种技术,所述特征和所述计算机技术均可选用任一现有技术,本说明书不再赘述。

类似的,在接收到图像类型的待响应信息时,识别待响应信息意图的方法可包括:根据预存的图像信息与所述用户发送的图像信息的相似度,确定与所述用户发送的图像信息相匹配的图像信息,作为标准图像信息,根据预设的所述标准图像信息对应的意图,确定所述用户发送的图像信息的意图,即为待响应信息的意图。若在预存的图像信息中未确定出于所述用户发送的图像信息相匹配的图像信息,则可采用训练后的图像意图识别模型识别所述用户发送的图像信息的意图,将识别出的所述图像信息的意图作为所述待响应信息的意图。识别待响应信息情感的方法为:可以根据预存的图像信息与所述用户发送的图像信息的相似度,确定与所述用户发送的图像信息相匹配的图像信息,作为标准图像信息,根据预设的所述标准图像信息对应的情感,确定所述用户发送的图像信息的情感,作为所述待响应信息的情感。若在预存的图像信息中未确定出于所述用户发送的图像信息相匹配的图像信息,则可采用训练后的图像情感识别模型识别所述用户发送的图像信息的情感,作为所述待响应信息的情感。

当接收到的待响应信息为图像信息时,采用上述方法识别该图像信息的意图和/或情感之前,可先对多种图像信息对应的意图和/或情感进行标注,并存储这些图像信息及其对应的意图和/或情感的标注。

在本说明书一个实施例中,上述预存的图像信息与所述用户发送的图像信息的相似度可以为根据图像类型的所述待响应信息的特征,采用计算机技术进行识别得到的,与所述标准图像信息的相似概率,具体的,所述特征可以为能够表征图像的颜色、形状、灰度和纹理等的数值,所述计算机技术可以为包括统计法、句法识别法、神经网络法、模板匹配法和几何变换法等多种技术,所述特征和所述计算机技术均可选用任一现有技术,本说明书不再赘述。

在本说明书一个实施例中,具体的,上述采用有限状态机表现业务环节的逻辑,处理状态间的切换包括:将预先设置的所述至少一个交互状态作为有限状态机的状态,预设状态间的跳转条件,所述跳转条件用于判断所述识别结果的意图和情感对条件的满足情况,并根据判断结果执行交互状态的跳转,为每一个交互状态预设对应的至少一种响应方式,根据所述意图和所述情感选取当前交互状态对应响应方式中的一种,所述响应方式用来生成响应信息反馈给用户。

在本说明书一个实施例中,如图3所示,所述有限状态机包括状态A、状态B、状态C和状态D,状态之间存在预设的跳转条件,在满足当前状态的跳转条件时,可以执行状态的跳转。例如,更新前当前交互状态为状态A,在所述待响应信息被识别出的意图、情感满足条件c时,更新当前交互状态为状态D。

在本说明书一个实施例中,所述响应方式为一种自然语言模板,根据所述模板可以生成以自然语言为载体的响应信息,所述响应信息模板中包含变量信息和常量信息,具体的,在确定了选取的响应方式之后,所述常量信息中包含的信息并不会因为用户不同而改变;而对于不同的用户,所述变量信息也不同。在响应方式确定之后,常量信息也就随之确定,进而根据用户信息和/或所述当前交互状态确定变量信息。

在本说明书一个实施例中,在提醒用户所预定的服务期限时,所述响应模板可以为:您所预定的A服务还有B分钟就要过期啦,请问需要延期吗?其中,A为类型为服务内容的变量信息,B为类型为时间的变量信息,其余为常量信息,本例中,根据用户信息可以确定用户所预定的服务的内容A,以及距离服务到期的时间B。

其中,常量信息包括预先录制的语音信息,也可以包括预存的其他固定不变的语音信息。而对于变量信息,则可根据所述变量信息的变量值,采用训练后的变量语音生成模型生成与所述变量值对应的语音信息,具体的,在上述提醒用户所预定的服务期限的实施例中,确定所述变量值A、B后,采用训练后的变量语音生成模型生成以自然语言方式输出的语音信息,所述语音信息生成方式可以是采用神经网络等计算机技术的语音生成方式。生成了变量信息对应的语音信息之后,则可将变量信息对应的语音信息与预先录制的常量信息的语音信息进行拼接,得到响应信息。

上述只是根据变量信息生成语音信息的一种示例性的方法,本领域技术人员可以理解,还可以采用其他的方式生成变量信息对应的语音信息,本说明书对此不作限制。

以上为本说明书实施例提供的信息交互方法,基于同样的思路,本说明书还提供了相应的装置、存储介质和电子设备。

图5为本说明书实施例提供的一种信息选择装置的结构示意图,所述装置包括:

信息接收模块500,用于接收用户发送的待响应信息;

信息识别模块502,用于采用训练后的意图识别模型识别所述待响应信息,获得所述待响应信息的意图;并采用训练后的情感识别模型识别所述待响应信息,获得所述待响应信息的情感;

状态确定模块504,用于确定当前交互状态;

响应方式模块506,用于根据所述意图、所述情感、所述当前交互状态确定响应方式;

状态更新及响应信息模块508,用于根据所述意图和所述情感更新所述当前交互状态;根据所述响应方式生成响应信息,并向所述用户反馈所述响应信息。

可选地,所述信息识别模块502具体包括意图识别单元502A和情感识别单元502B,所述意图识别单元502A具体用于,采用训练后的意图识别模型识别所述待响应信息,获得所述待响应信息的意图;所述情感识别单元502B具体用于,采用训练后的情感识别模型识别所述待响应信息,获得所述待响应信息的情感。

可选地,所述信息交互装置中状态更新及响应信息模块508具体包括当前交互状态更新单元508A和响应信息生成单元508B,所述括当前交互状态更新单元508A具体用于,根据所述意图和所述情感更新所述当前交互状态,所述响应信息生成单元508B具体用于,根据所述响应方式生成响应信息,并向所述用户反馈所述响应信息。

可选地,所述待响应信息包括语音信息;所述信息识别模块502具体用于,采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息;采用训练后的意图识别模型识别所述文本信息,获得所述文本信息的意图,将所述文本信息的意图作为所述文本信息对应的语音信息的意图。

可选地,所述待响应信息包括语音信息;所述信息识别模块502具体用于,采用训练后的人声情感识别模型识别所述语音信息,获得所述语音信息的人声情感;根据所述人声情感确定所述语音信息的情感。

可选地,所述信息识别模块502具体用于,采用训练后的语音识别模型识别所述语音信息,获得所述语音信息对应的文本信息;采用训练后的文本情感识别模型识别所述文本信息,获得所述文本信息的情感,将所述文本信息的情感作为所述文本信息对应的语音信息的文本情感;根据所述语音信息的人声情感和所述语音信息的文本情感确定所述语音信息的情感。

可选地,所述响应方式模块506具体用于,根据所述意图、所述情感、所述当前交互状态,确定预设的与所述意图、所述情感、所述当前交互状态对应的响应信息模板;所述响应信息模板中包含变量信息和常量信息;根据所述响应方式生成响应信息,具体包括:确定所述响应信息模板中包含的变量信息对应的变量类型;根据所述用户的用户信息和/或所述更新后的当前交互状态,确定所述变量类型对应的变量信息的变量值;根据所述变量值和所述响应信息模板中包含的常量信息,生成响应信息。

可选地,所述状态更新及响应信息模块508具体用于,确定预设的交互状态,以及交互状态间的预设跳转条件;确定当前交互状态以及当前交互状态下所述意图和所述情感满足的跳转条件;更新当前交互状态为满足所述跳转条件的交互状态。

可选地,所述常量信息包括预先录制的语音信息;所述状态更新及响应信息模块508具体用于,根据所述变量信息的变量值,采用训练后的变量语音生成模型生成与所述变量值对应的语音信息;将生成的语音信息与所述预先录制的语音信息进行拼接,得到响应信息。

具体的,上述如图5所示的信息交互装置可以为用于与用户进行信息交互的机器人。

本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的信息交互方法。

本说明书还提供了图6所示的电子设备的示意结构图。如图6所述,在硬件层面,该信息交互设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的信息交互方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

相关技术
  • 信息交互方法、信息交互装置、 电子设备和计算机可读存储介质
  • 一种信息的交互方法、交互装置、电子设备及存储介质
技术分类

06120112148549