掌桥专利:专业的专利平台
掌桥专利
首页

中枢对话系统和对话处理方法

文献发布时间:2023-06-19 09:44:49


中枢对话系统和对话处理方法

技术领域

本公开的实施例涉及一种中枢对话系统和对话处理方法。

背景技术

对话系统是可以识别用户的语音并提供与所识别的语音相对应的服务的系统。近来,已经使用对话系统提供了各种对话服务。特别地,各种IoT(物联网)设备与对话系统联动。通过分析语音,可以根据用户的意图来控制IoT设备。

然而,这些对话系统在可访问性方面具有封闭性。也就是说,只有由销售IoT设备的公司或与销售IoT设备的公司合作的公司提供的对话系统可以控制IoT设备,因此用户记住哪个对话系统与要控制的IoT设备联动,并且用户必须说出对话系统的呼叫语以及该对话系统的适当命令。这是降低用户便利性的因素。

发明内容

本公开的实施例涉及一种能够与用户通信的中枢对话系统、中枢对话系统的控制方法以及电子设备。

本公开的一方面提供一种中枢对话系统、中枢对话系统的控制方法以及电子设备,用于在一个中枢对话系统中处理用户话语以生成并输出适合于与要由用户控制的设备联动的外部对话系统的命令语句。

根据本公开的实施例,一种中枢对话系统包括:语音处理器,被配置为当输入用户话语时判断包括在输入的用户话语中的用户意图;通信装置,被配置为通过无线通信与对应于至少一个外部对话系统的至少一个本地扬声器连接;控制器,被配置为从至少一个外部对话系统中确定与用户意图相对应的外部对话系统,生成指示用户意图的命令语句,将命令语句转换为语音信号,并控制通信装置将语音信号传送到与确定的外部对话系统相对应的本地扬声器。

另外,至少一个本地扬声器可以设置在从至少一个本地扬声器输出的语音信号能够被输入到相应的外部对话系统的麦克风的位置。

另外,中枢对话系统可以进一步包括:存储装置,被配置为针对至少一个用户意图匹配并存储指示用户意图的命令语句。

另外,控制器可以将用于注册命令语句的用户话语转换为语音信号,并且将语音信号传送到本地扬声器。

另外,通信装置可以通过无线通信与对应于至少一个外部对话系统的至少一个本地麦克风连接,并且可以从至少一个本地麦克风接收从至少一个外部对话系统输出的系统响应。

另外,控制器可以基于输入的系统响应来判断语音信号是否能够被至少一个外部对话系统识别。

另外,当语音信号不能被至少一个外部对话系统识别时,控制器可以再次请求用户话语。

另外,控制器可以将重新输入的用户话语转换为语音信号,并通过控制通信装置将语音信号传送到本地扬声器。

另外,当语音信号能够被至少一个外部对话系统识别时,控制器可以将包括在用户话语中的语句存储为与用户意图相对应的命令语句。

另外,当在中枢对话系统中注册至少一个外部对话系统时,控制器可以向用户请求指示用户意图的命令语句,并将由用户输入的命令语句与用户意图匹配并存储。

本公开的另一方面提供一种中枢对话系统的控制方法。该方法包括:当输入用户话语时,判断包括在输入的用户话语中的用户意图;从在中枢对话系统中注册的至少一个外部对话系统中确定与用户意图相对应的外部对话系统;生成指示用户意图的命令语句;将命令语句转换为语音信号;以及将语音信号传送到与确定的外部对话系统相对应的本地扬声器。

另外,至少一个本地扬声器可以设置在从至少一个本地扬声器输出的语音信号能够被输入到相应的外部对话系统的麦克风的位置。

另外,该方法可以进一步包括:针对至少一个用户意图匹配并存储指示用户意图的命令语句。

另外,该方法可以进一步包括:将用于注册命令语句的用户话语转换为语音信号;以及将语音信号传送到本地扬声器。

另外,该方法可以进一步包括:从与至少一个外部对话系统相对应的至少一个本地麦克风接收从至少一个外部对话系统输出的系统响应。

另外,该方法可以进一步包括:基于输入的系统响应来判断语音信号是否能够被至少一个外部对话系统识别。

另外,该方法可以进一步包括:当语音信号不能被至少一个外部对话系统识别时,再次请求用户话语。

另外,该方法可以进一步包括:将重新输入的用户话语转换为语音信号;以及通过控制通信装置将语音信号传送到本地扬声器。

另外,该方法可以进一步包括:当语音信号能够被至少一个外部对话系统识别时,将包括在用户话语中的语句存储为与用户意图相对应的命令语句。

另外,针对至少一个用户意图匹配并存储指示用户意图的命令语句可以包括:当在中枢对话系统中注册至少一个外部对话系统时,向用户请求指示用户意图的命令语句并通过匹配用户意图来存储由用户输入的命令语句。

附图说明

通过以下结合附图对实施例的描述,本公开的这些和/或其它方面将变得显而易见并且更容易理解,其中:

图1是示出根据本公开的实施例的中枢对话系统与另一外部对话系统之间的关系的示图;

图2是示出根据本公开的实施例的中枢对话系统的控制框图;

图3是示出根据本公开的实施例的将中枢对话系统连接到外部对话系统的方法的示图;

图4和图5是示出根据示例性实施例的中枢对话系统的存储装置中存储的信息的示例的示图;

图6至图8是用于描述根据本公开的实施例的在中枢对话系统中注册外部对话系统的过程的示图;

图9是示出根据本公开的实施例的中枢对话系统的控制方法的流程图;

图10是示出根据本公开的实施例的在中枢对话系统的控制方法中注册与用户意图相对应的命令语句的过程的流程图。

以下附图标记可以与附图结合使用:

100:中枢对话系统 110:语音处理器

120:控制器 130:通信装置

140:存储装置 S:本地扬声器

M:本地麦克风 10、20、30、40:外部对话系统

200:用户终端

具体实施方式

本文描述的实施例和附图中示出的配置是本公开的优选示例,在提交本申请时,可以存在可以替代本说明书的实施例和附图的各种修改。

此外,本文中使用的术语仅出于描述特定实施例的目的,并且不旨在限制本公开。除非上下文另外明确指出,否则单数表达包括复数表达。如本文中所使用的,术语“包括”、“包含”或“具有”旨在表示存在说明书中描述的特征、数量、步骤、动作、组件、部件或其组合,并且不排除预先存在或增加一个或多个其它特征或数量、步骤、操作、组件、部件或其组合。

另外,诸如“~部”、“~组”、“~块”、“~构件”、“~模块”的术语可以指用于处理至少一个功能或操作的单元。例如,这些术语可以指诸如现场可编程门阵列(FPGA)/专用集成电路(ASIC)的至少一个硬件、存储在存储器中的至少一个软件或处理器处理的至少一个硬件。

步骤所附的附图标记用于识别步骤。这些附图标记不指示步骤之间的顺序。除非上下文清楚地指示特定顺序,否则每个步骤可以以不同于所述顺序的顺序执行。

另一方面,可以以用于存储由计算机可执行的指令的记录介质的形式来实现所公开的实施例。指令可以以程序代码的形式存储,并且当由处理器执行时,可以生成程序模块以执行所公开的实施例的操作。记录介质可以被实现为计算机可读记录介质。

计算机可读记录介质包括其上存储有可以由计算机读取的指令的各种记录介质。例如,可以有只读存储器(ROM)、随机存取存储器(RAM)、磁带、磁盘、闪存、光学数据存储设备等。

在下文中,将参照附图详细描述根据一方面的中枢对话系统、中枢对话系统的控制方法和电子设备的实施例。

图1是示出根据本公开的实施例的中枢对话系统与另一外部对话系统之间的关系的示图。

在该实施例中,除根据实施例的中枢对话系统100以外的其它对话系统将被称为外部对话系统。

根据图1的示例,外部对话系统A 10与多个电子设备E联动以处理用于控制多个电子设备E的用户话语,并且可以根据包括在用户话语中的用户意图来控制多个电子设备E。

与外部对话系统A 10联动的多个电子设备通过互联网连接到外部对话系统A 10以形成网络,该多个电子设备也可以被称为IoT(物联网)设备。

与外部对话系统A 10联动的多个电子设备E可以选自家用电器,例如洗衣机、冰箱、空调、TV、空气净化器、机器人清扫器、PC等。

在此,电子设备与对话系统联动是指电子设备被注册在对话系统中,用户说出用于控制电子设备的命令,电子设备可以处于与命令相对应的控制信号被传送到电子设备的状态。相同的解释可以适用于其它对话系统。

外部对话系统B 20也与多个电子设备E联动以处理用于控制多个电子设备E的用户话语,并且可以根据包括在用户话语中的用户意图来控制多个电子设备E。

与外部对话系统B 20联动的多个电子设备E可以是与与外部对话系统A 10联动的多个电子设备E不同类型的电子设备E。例如,与外部对话系统A 10联动的多个电子设备E包括洗衣机和空调,与外部对话系统B 20联动的多个电子设备E可以包括机器人清扫器和冰箱。

然而,中枢对话系统100的实施例不限于此,并且与不同外部对话系统联动的电子设备可以部分重叠。

外部对话系统C 30可以提供用户请求的信息,而不与电子设备联动。例如,外部对话系统C 30可以包括搜索服务器,或者可以连接到外部搜索服务器以从搜索服务器检索用户请求的信息。

此外,外部对话系统D 40与车辆V联动以处理用于控制车辆V的用户话语,并且可以根据包括在用户话语中的用户意图将控制信号传送到车辆V。

如上所述,与外部对话系统10、20、30和40中的每一个联动的设备不同,并且用于激活对话服务的呼叫语也不同。可以被识别以用于设备控制的命令语句中也存在差异。因此,如果用户不使用稍后将描述的中枢对话系统100,则询问用户要控制的设备与哪个对话系统联动,对话系统的呼叫语是什么,记住对话系统中的所有适当的命令语句,然后每次控制设备时,用户必须使用适当的呼叫语和适当的命令语句将话语输入到相应的对话系统中。

然而,根据实施例的中枢对话系统100,用户仅需要输入语音来接收期望的服务,而无需担心要被控制的设备与哪个对话系统联动,中枢对话系统100可以选择能够提供用户期望的服务的外部对话系统,并且生成适当的命令语句并将适当的命令语句输入到所选择的外部对话系统中。

图2是示出根据本公开的实施例的中枢对话系统的控制框图,图3是示出根据本公开的实施例的将中枢对话系统连接到外部对话系统的方法的示图。

参照图2,根据实施例,中枢对话系统100可以包括:语音处理器110,当输入用户话语时,该语音处理器110判断包括在输入的用户话语中的用户意图;通信装置130,通过无线通信与对应于至少一个外部对话系统的至少一个本地扬声器连接;以及控制器120,用于从至少一个外部对话系统中确定与用户意图相对应的外部对话系统,生成指示用户意图的命令语句,将所生成的命令语句转换成语音信号,并控制通信装置130将语音信号传送到与确定的外部对话系统相对应的本地扬声器S。另外,中枢对话系统100可以包括存储装置140,存储装置140被配置成存储执行中枢对话系统100的操作所需的各种类型的信息。

用户可以通过用户终端访问中枢对话系统100。用户可以将用户话语输入到用户终端中设置的麦克风中以请求期望的服务。

用户终端可以是诸如智能电话、PC或AI扬声器的移动设备,或者可以是车辆。用户终端仅需要能够接收用户话语并将用户话语传递到中枢对话系统100,并且对用户终端的类型没有其它限制。

语音处理器110可以包括:语音到文本(STT)引擎,将通过麦克风输入的用户话语转换为文本;以及对话管理器,分析文本并确定包括在用户话语中的用户意图。

具体地,对话管理器通过对文本形式的用户话语进行词法分析来将输入字符串转换为词素。对话管理器还可以从用户话语识别实体名称。实体名称是专有名词,例如人名、地名、组织名称、时间、日期、货币等。实体名称识别是识别语句中的实体名称并确定识别的实体名称的类型的工作。通过识别单个名称,可以从语句提取重要的关键字以了解语句的含义。

对话管理器可以从用户话语提取域。该域可以识别用户说出的语言的主题。例如,要控制的设备的类型可以是域。因此,诸如冰箱、空调、TV、机器人清扫器、空气净化器、洗衣机和PC的电子设备可以是域。另外,包括诸如文本、导航、日程、天气、交通、车辆控制等的各种主题的域可以是数据库并存储在存储装置140中。

对话管理器可以分析用户话语的语音行为。语音行为分析是分析用户话语的意图,并掌握话语的意图,例如用户是提出问题、提出要求、做出响应还是表达简单的情感。

对话管理器可以基于诸如与用户话语相对应的域、实体名称、语音行为等的信息来掌握用户意图,并且提取与用户意图相对应的动作。动作可以由对象和操作符定义。

例如,如果识别出的用户意图是[操作空调],则相应的动作可以被定义为“空调(对象)_开(操作符)”,并且如果识别出的用户意图是[运行机器人清扫器],则相应的动作可以被定义为“机器人清扫器(对象)_运行(操作符)”。

控制器120可以在多个外部对话系统10、20、30和40中确定与由语音处理器110判断的用户意图相对应的外部对话系统。但是,在此,外部对话系统的数量基于上面描述的图1的示例,当然可以使用更少或更多的外部对话系统。

控制器120可以确定可以提供期望的服务的外部对话系统。稍后将描述其详细描述。

控制器120可以生成指示用户意图的命令语句,并将所生成的命令语句转换为语音信号。指示用户意图的命令语句可以是能够提供用户期望的服务的外部对话系统可识别的语句。例如,如果用户话语不是外部对话系统可以识别的语言,则可以以外部对话系统可以识别的语言生成命令语句。如果用户话语包括在能够提供用户期望的服务的外部对话系统中可识别的语句,则该语句可以原样转换为语音信号。

控制器120可以包括文本到语音(TTS)引擎,以将命令语句转换为语音信号。TTS引擎可以将所生成的命令语句转换为语音信号,并且通信装置130可以将语音信号传送到与上面确定的外部对话系统相对应的本地扬声器S。

参照图3,可以设置与每个外部对话系统相对应的本地扬声器。

例如,可以为外部对话系统A 10设置与外部对话系统A 10相对应的本地扬声器AS_A,可以为外部对话系统B 20设置与外部对话系统B 20相对应的本地扬声器B S_B,可以为外部对话系统C 30设置与外部对话系统C 30相对应的本地扬声器C S_C,并且可以为外部对话系统D 40设置与外部对话系统D 40相对应的本地扬声器D S_D。

如上所述,每个外部对话系统都设置有用于与用户连接的麦克风,就像用户使用用户终端中设置的麦克风来访问中枢对话系统100一样。

因此,根据实施例的中枢对话系统100可以包括设置在与每个外部对话系统的麦克风相对应的位置处的本地扬声器S。在此,与外部对话系统的麦克风相对应的位置可以表示从本地扬声器S输出的语音信号可以被输入到外部对话系统的麦克风的位置。

具体地,与外部对话系统A 10相对应的本地扬声器A S_A设置在从本地扬声器AS_A输出的语音信号可以被输入到外部对话系统A 10的麦克风的位置。与外部对话系统B20相对应的本地扬声器B S_B设置在从本地扬声器B S_B输出的语音信号可以被输入到外部对话系统B 20的麦克风的位置。与外部对话系统C 30相对应的本地扬声器C S_C设置在从本地扬声器C S_C输出的语音信号可以被输入到外部对话系统C 30的麦克风的位置。与外部对话系统D 40相对应的本地扬声器D S_D可以设置在从本地扬声器D S_D输出的语音信号可以被输入到外部对话系统D 40的麦克风的位置。

例如,如果用户期望的服务,具体地,用户意图是控制空调,则用户仅需要将用于控制空调的用户话语输入到中枢对话系统100,而不管与空调联动的外部对话系统是哪个外部对话系统,然后中枢对话系统100可以判断与空调联动的外部对话系统是外部对话系统A 10。中枢对话系统100生成外部对话系统A 10中可识别的命令语句,将该命令语句转换为语音信号并将该语音信号输出到本地扬声器A S_A,因此效果就像用户向外部对话系统A10的麦克风说出命令语句一样。

以这种方式,即使与其它外部对话系统没有单独的合作关系或契约关系,中枢对话系统100也可以根据用户意图来控制与其它外部对话系统联动的各种设备。

图4和图5是示出根据示例性实施例的中枢对话系统的存储装置中存储的信息的示例的示图。

存储装置140可以存储控制器120用于确定与用户意图相对应的外部对话系统的信息。如上所述,语音处理器110可以判断包括在用户话语中的用户意图,并提取与用户意图相对应的域、动作等。

在存储装置140中,可以针对每个域匹配并存储与该域相对应的外部对话系统的信息和与该外部对话系统相对应的本地扬声器的信息。

根据图4的示例,在域“空调”中,匹配并存储关于与空调联动的外部对话系统A 10的信息和关于分配给外部对话系统A 10的本地扬声器A S_A的信息。关于本地扬声器A S_A的信息可以包括本地扬声器A S_A的序列号、IP地址等。

在域“TV”中,可以匹配并存储关于与TV联动的外部对话系统B 20的信息和关于分配给外部对话系统B 20的本地扬声器B S_B的信息。

在域“机器人清扫器”中,可以匹配并存储关于与机器人清扫器联动的外部对话系统A 10的信息和关于分配给外部对话系统A 10的本地扬声器A S_A的信息。

在域“洗衣机”中,可以匹配并存储关于与洗衣机联动的外部对话系统B 20的信息和关于分配给外部对话系统B 20的本地扬声器B S_B的信息。

在域“灯”中,可以匹配并存储关于与灯联动的外部对话系统C 30的信息和关于分配给外部对话系统C 30的本地扬声器C S_C的信息。

在域“计算机”中,可以匹配并存储关于与计算机联动的外部对话系统D 40的信息和关于分配给外部对话系统D 40的本地扬声器D S_D的信息。

相同的描述可以适用于其余域。

另外,存储装置140可以存储控制器120用于生成指示用户意图的命令语句的信息。详细地,存储装置140可以针对每个用户意图匹配并存储指示相应的用户意图的命令语句。在此,指示用户意图的命令语句可以以与用户意图相对应的外部对话系统中可识别的语句的形式生成。

在该示例中,用户意图将被显示为与用户意图相对应的动作。

根据图5的示例,与用户意图“空调_开”相对应的命令语句被存储为“打开空调”,并且与用户意图“空调_关”相对应的命令语句被存储为“关闭空调”。与用户意图“洗衣机_运行(标准模式)”相对应的命令语句被存储为“在洗衣机标准模式下操作”。与用户意图“客厅灯_开”相对应的命令语句被存储为“打开客厅灯”,与用户意图“客厅灯_关”相对应的命令语句被存储为“关闭客厅灯”。

例如,如果输入到中枢对话系统100的用户话语为“太热”,则语音处理器110可以判断包括在用户话语中的用户意图是[空调运行],因此相应的域可以是“空调”,动作可以是“空调_开”。

如图4所示,控制器120基于存储在存储装置140中的信息,将外部对话系统A 10确定为与用户意图相对应的外部对话系统,并基于图5所示的信息生成指示用户意图的命令语句“打开空调”。

控制器120使用TTS引擎将“打开空调”转换为语音信号,并通过通信装置130将“打开空调”语音信号传送到本地扬声器A S_A。

本地扬声器A S_A可以输出语音信号“打开空调”,并将语音信号“打开空调”输入到外部对话系统A 10的麦克风。

另一方面,每个外部对话系统可以具有呼叫语以激活相应的对话系统。因此,存储装置140可以针对每个外部对话系统匹配并存储呼叫语,存储装置140还可以匹配并存储与每个域相对应的外部对话系统的呼叫语,并且存储装置140还可以针对每个用户意图匹配并存储外部对话系统的相应呼叫语。匹配并存储呼叫语的位置没有限制。

控制器120可以在命令语句之前添加外部对话系统的呼叫语。因此,用户仅需要说出中枢对话系统100的呼叫语,而不必记住或说出每种期望服务所需的呼叫语。

根据实施例的中枢对话系统100可以包括:至少一个存储器,用于存储用于执行上述操作和下述操作的程序和相关数据;以及至少一个处理器,用于执行所存储的程序。

语音处理器110和控制器120也可以使用单独的存储器和处理器,并且语音处理器110和控制器120中的一些或全部可以共用存储器和处理器。

控制器120的TTS引擎也可以使用单独的存储器和处理器。

另外,存储装置140可以包括诸如只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、闪存等的非易失性存储器,并且存储装置140可以进一步包括诸如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM)的易失性存储器。根据要存储的信息的类型,要存储的信息可以存储在非易失性存储器中或可以存储在易失性存储器中。例如,上述的图4和图5中所示的信息可以存储在非易失性存储器中。

存储装置140可以与语音处理器110和控制器120共用存储器,或者可以使用单独的存储器。

通信装置130可以包括各种无线通信模块中的至少一个,以通过无线通信与用户终端200(参照图6)和本地扬声器S交换信号。例如,通信装置130可以包括可以以诸如Wi-Fi、无线宽带、全球移动通信系统(GSM)、码分多址(CDMA)、宽带码分多址(WCDMA)、通用移动电信系统(UMTS)、时分多址、LTE(长期演进)、4G移动通信、5G移动通信等的无线通信方法连接到互联网网络的各种无线通信模块中的至少一个。

另外,通信装置130可以通过用户终端200将指示命令语句的语音信号传送到本地扬声器S。例如,当用户终端200被实施为移动设备时,用户终端200通过互联网网络连接到中枢对话系统100,并且可以利用诸如蓝牙通信的局域通信方案与本地扬声器S连接。当用户终端200从中枢对话系统100接收到指示命令语句的语音信号时,用户终端200可以将接收到的语音信号传送到本地扬声器S。

根据实施例,中枢对话系统100可以被实施为服务器,并且在这种情况下,中枢对话系统100的组件110、120、130和140可以设置在服务器中。但是,中枢对话系统100的组件110、120、130、140中的一些也可以设置在用户终端200中。

图6至图8是用于描述根据本公开的实施例的在中枢对话系统中注册外部对话系统的过程的示图。

如上所述,中枢对话系统100确定与用户意图相对应的外部对话系统,生成适合于所确定的外部对话系统的命令语句,并且在中枢对话系统100中注册外部对话系统以将生成的命令语句输入到外部对话系统的麦克风中。

首先,将本地扬声器S放置在与将由用户要注册的外部对话系统的麦克风相对应的位置处。例如,当本地扬声器S被实施为小型无线扬声器时,本地扬声器S可以被附接到外部对话系统的麦克风。

参照图6,用户可以在用户终端200上运行用于访问中枢对话系统100的应用。用户可以通过运行相应的应用来访问中枢对话系统100。该应用可以由用户下载并安装,或者可以默认安装在用户终端200中。

中枢对话系统100可以显示可以通过用户终端200注册的外部对话系统的列表,并且用户可以从显示的列表选择要注册的外部对话系统。

如图7所示,中枢对话系统100可以请求关于与通过用户终端200选择的外部对话系统相对应的本地扬声器S的信息。例如,可以请求用于识别本地扬声器S的序列号的输入。

中枢对话系统100通过通信装置130从用户终端200接收用户想要注册的外部对话系统的信息和与该外部对话系统相对应的本地扬声器的信息。

另外,用户可以在用户终端200中输入与要注册的外部对话系统联动的电子设备的类型。即使当在外部对话系统的初始注册之后添加了要联动的电子设备的类型时,用户也可以输入添加到用户终端200的电子设备的类型。用户终端200可以将与外部对话系统联动的电子设备的类型传送到中枢对话系统100。

中枢对话系统100可以基于从用户终端200接收的信息,构建如上述图4所示的表,并将该表存储在存储装置140中。

同时,在注册外部对话系统时,如图5所示的关于与用户意图相对应的命令语句的信息可以从用户以文本或语音信号的形式输入。

可选地,在注册外部对话系统时,中枢对话系统100接收用于注册每个用户意图的命令语句的测试用户话语,将用户话语转换为语音信号,并通过通信装置130传送到与相应的外部对话系统相对应的本地扬声器S。

如图8所示,中枢对话系统100可以进一步包括用于接收从外部对话系统的扬声器输出的语音信号的本地麦克风M。当然,本地扬声器S和本地麦克风M可以一体实现。

当从本地扬声器S输出语音信号时,相应的外部对话系统可以根据语音信号的识别结果生成并输出系统响应。本地麦克风M接收外部对话系统的系统响应,并将输入的系统响应传送到通信装置130。

控制器120可以基于输入的系统响应来确定语音信号是否可以被外部对话系统识别。例如,如果输入的系统响应对应于包括在测试用户话语中的用户意图,例如“您要运行空调吗?”,则可以判断外部对话系统可以识别输入的用户话语。

如果确定外部对话系统可以识别测试用户话语,则如图5所示,控制器120将包括在用户话语中的语句存储为与用户意图相对应的命令语句。

例如,当用户注册外部对话系统A 10时,用户说出“打开空调”,则中枢对话系统100通过本地扬声器A S_A输出“打开空调”的语音信号,然后如果从外部对话系统A 10输出系统响应“您是否要运行空调?”,则如图5所示,控制器120可以将“打开空调”存储为与用户意图“空调_开”相对应的命令语句。

另外,如果判断外部对话系统无法识别测试用户话语,则控制器120可以再次请求用户话语。控制器120将输入的用户话语转换为语音信号,并通过通信装置130将语音信号传送到本地扬声器S。控制器120可以最终将包括在由外部对话系统识别出的用户话语中的语句存储为与用户意图相对应的命令语句。

另一方面,可以在将外部对话系统注册到中枢对话系统100中之后,在第一次使用时执行上述过程。

在下文中,将描述根据实施例的中枢对话系统的控制方法。在实施根据实施例的中枢对话系统的控制方法时,可以使用根据上述实施例的中枢对话系统100。因此,即使没有另外提及,参照图1至图8描述的内容也可以应用于中枢对话系统的控制方法的实施例,并且以下描述的中枢对话系统的控制方法的实施例的描述也可以应用于中枢对话系统100。

图9是示出根据本公开的实施例的中枢对话系统的控制方法的流程图。

根据图9所示的中枢对话系统的控制方法,当输入用户话语时(310中为“是”),判断包括在输入的用户话语中的用户意图(311)。可以通过在连接用户与中枢对话系统100的用户终端200中设置的麦克风来输入用户话语,并且中枢对话系统100的语音处理器110可以通过应用语音识别和自然语言理解技术来判断包括在用户话语中的用户意图。

从在中枢对话系统中注册的至少一个外部对话系统中确定与用户意图相对应的外部对话系统(312)。如以上参照图6和图7所述,用户可以通过用户终端200在中枢对话系统100中注册至少一个外部对话系统和与该外部对话系统联动的电子设备。基于注册的信息,如图4所示,中枢对话系统100可以构建将域和与域对应的外部对话系统匹配的表并存储在存储装置140。控制器120可以基于该表确定与用户意图相对应的外部对话系统。

生成指示用户意图的命令语句(313)。如以上参照图5所描述的,可以针对每个用户意图,将指示用户意图的命令语句匹配并存储在存储装置140中。所存储的命令语句是可以由与用户意图相对应的外部对话系统识别的语句。稍后将描述存储命令语句的过程。控制器120可以基于存储在存储装置140中的信息来生成指示用户意图的命令语句。

将命令语句转换为语音信号(314),并且将语音信号传送到与外部对话系统相对应的本地扬声器S(315)。如上所述,与外部对话系统相对应的本地扬声器S可以设置在从本地扬声器S输出的语音信号可以被输入到外部对话系统的麦克风的位置。结果,就像用户向外部对话系统A 10的麦克风说出命令语句一样。即使与其它外部对话系统没有单独的合作或契约,与其它外部对话系统联动的各种设备也可以根据用户意图进行控制。

图10是示出根据本公开的实施例的在中枢对话系统的控制方法中注册与用户意图相对应的命令语句的过程的流程图。

图10中所示的过程可以当在中枢对话系统100中注册外部对话系统时被执行,或者可以在中枢对话系统100中注册外部对话系统之后,当输入用于使用外部对话系统的用户话语时可以执行该过程。然而,在下面的用于详细描述的示例中,假定在中枢对话系统100中注册外部对话系统的过程中执行图10的过程。

根据图10所示的中枢对话系统的控制方法,当输入用户话语时(320中为“是”),将用户话语转换为语音信号(321),并且将转换后的语音信号传送到本地扬声器S(322)。在此,用户话语可以是用于注册每个用户意图的命令语句的测试用户话语,并且语音信号被传送到的本地扬声器S可以是与当前正在进行注册过程的外部对话系统相对应的本地扬声器。

可以从本地麦克风M接收外部对话系统的系统响应(323)。如图8所示,中枢对话系统100可以进一步包括用于接收从外部对话系统的扬声器输出的语音信号的本地麦克风M。当然,本地扬声器S和本地麦克风M可以一体实现。当从本地扬声器S输出语音信号时,相应的外部对话系统可以根据语音信号的识别结果生成并输出系统响应。

基于系统响应,判断通过本地扬声器S输出的语音信号是否可被外部对话系统识别(324)。例如,如果系统响应对应于包括在用户话语中的用户意图,则控制器120可以判断输出的语音信号可被外部对话系统识别。

如果判断语音信号可被外部对话系统识别(325中为“是”),则将包括在用户话语中的语句存储为与用户意图相对应的命令语句(326),如果判断语音信号不可被外部对话系统识别(325中为“否”),则再次请求用户话语(327)。可以重复上述过程,直到外部对话系统可以识别从用户话语转换的语音信号为止。

作为另一示例,当在中枢对话系统100中注册外部对话系统时,中枢对话系统100向用户请求指示用户意图的命令语句,并且也可以将从用户输入的文本或语音信号形式的命令语句与用户意图匹配,并将命令语句存储在存储装置中。

根据上述中枢对话系统及其控制方法,用户输入用于接收期望服务的话语而无需担心要被控制的设备与哪个对话系统联动,选择可以提供期望服务的外部对话系统,生成适当的命令语句并将适当的命令语句输入到选择的外部对话系统中。

另外,由于通过本地扬声器将命令语句的语音信号输入到外部对话系统的麦克风,就像用户向外部对话系统的麦克风说出命令语句一样。

以这种方式,即使与其它外部对话系统没有单独的合作关系或契约关系,中枢对话系统也可以根据用户意图控制与其它外部对话系统联动的各个设备。

根据实施例,一种电子设备包括:存储器,被配置为存储一个或多个程序;以及处理器,被配置为执行所存储的程序,并且其中存储在存储器中的程序在输入用户话语时判断包括在用户话语中的用户意图,在至少一个外部对话系统中确定与用户意图相对应的外部对话系统,生成指示用户意图的命令语句,将该命令语句转换为语音信号,并将语音信号传送到与确定的外部对话系统相对应的本地扬声器。

另外,存储在电子设备的存储器中的程序用于执行上述中枢对话系统的控制方法,当然,可以进一步包括中枢对话系统的控制方法中包括的每个步骤。

如上所述,参照附图描述了所公开的实施例。本领域技术人员将理解,在不改变本公开的技术思想或基本特征的情况下,可以以与所公开的实施例不同的形式来实现本公开。所公开的实施例是示例性的并且不应被解释为限制性的。

本公开的一方面提供一种中枢对话系统、中枢对话系统的控制方法以及电子设备,用于处理用户话语并且生成并输出适合于与由用户要控制的设备联动的外部对话系统的命令语句,用户可以使用单个对话系统来控制各个设备。

相关技术
  • 中枢对话系统和对话处理方法
  • 对话系统、具有对话系统的车辆以及对话处理方法
技术分类

06120112288392