掌桥专利:专业的专利平台
掌桥专利
首页

一种对设备进行控制的方法、装置和存储介质

文献发布时间:2023-06-19 09:51:02


一种对设备进行控制的方法、装置和存储介质

技术领域

本申请涉及电子技术领域,尤其涉及一种对设备进行控制的方法、装置和存储介质。

背景技术

智能音箱可以通过语音去控制用户使用的其它智能设备。用户通过语音控制特定范围内的被控智能设备时,现有的话术解析技术主要是是针对单个设备,比如“打开空调”、“打开灯”等这一类话术文本,通常仅能通过一句文本控制对应的一个设备。对于拥有智能设备较多的用户,单句话术文本控制单一设备已经无法满足用户便捷控制的需求。

发明内容

本申请实施例提供了一种对设备进行控制的方法,克服了单句话术控制单一设备无法满足用户便捷控制需求的问题。

该方法包括:

获取用户语音文本;

将所述用户语音文本输入预先建立的单意图信息识别模型,确定所述用户语音文本的意图语义信息,其中,所述单意图信息识别模型用于解析所述用户语音文本的语义;

将所述用户语音文本与批量同义词词库进行匹配,当在所述批量同义词词库中存在匹配成功的批量同义词信息时,基于所述意图语义信息和所述批量同义词信息,生成操作信息,并对与所述批量同义词信息对应个数的用户设备执行所述操作信息。

可选地,计算所述用户语音文本与所述单意图信息识别模型中的所述意图语义信息之间的语义相似度,并在所述语义相似度大于预设阈值时,为所述用户语音文本关联所述意图语义信息。

可选地,遍历所述批量同义词词库,将所述用户语音文本与所述批量同义词词库中的所述批量同义词进行对比,并在所述用户语音文本中包含至少一个所述批量同义词时,确定所述批量同义词与所述用户语音文本匹配成功。

可选地,遍历预先建立的无意义词库,并将所述用户语音文本与所述无意义词库中的无意义词进行对比,当所述用户语音文本中包括所述无意义词时,过滤所述用户语音文本中与所述无意义词相同的文本词。

可选地,基于所述操作信息中的所述批量同义词信息,以及所述操作信息中与所述用户语音文本相关联的所述意图语义信息,在所述用户设备列表中查找与所述意图语义信息对应的用户设备,并选择其中与所述批量同义词信息对应个数的所述用户设备执行所述操作信息。

在本发明的另一个实施例中,提供了一种对设备进行控制的装置,该装置包括:

获取模块,用于获取用户语音文本;

确定模块,用于将所述用户语音文本输入预先建立的单意图信息识别模型,确定所述用户语音文本的意图语义信息,其中,所述单意图信息识别模型用于解析所述用户语音文本的语义;

操作模块,用于将所述用户语音文本与批量同义词词库进行匹配,当在所述批量同义词词库中存在匹配成功的批量同义词信息时,基于所述意图语义信息和所述批量同义词信息,生成操作信息,并对与所述批量同义词信息对应个数的用户设备执行所述操作信息。

可选地,所述确定模块进一步用于:

计算所述用户语音文本与所述单意图信息识别模型中的所述意图语义信息之间的语义相似度,并在所述语义相似度大于预设阈值时,为所述用户语音文本关联所述意图语义信息。

可选地,所述操作模块进一步用于:

遍历所述批量同义词词库,将所述用户语音文本与所述批量同义词词库中的所述批量同义词进行对比,并在所述用户语音文本中包含至少一个所述批量同义词时,确定所述批量同义词与所述用户语音文本匹配成功。

在本发明的另一个实施例中,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行上述一种对设备进行控制的方法中的各个步骤。

在本发明的另一个实施例中,提供了一种终端设备,包括处理器,所述处理器用于执行上述一种对设备进行控制的方法中的各个步骤。

基于上述实施例,首先获取用户语音文本,其次,将用户语音文本输入预先建立的单意图信息识别模型,确定用户语音文本的意图语义信息,其中,单意图信息识别模型用于解析用户语音文本的语义,最后,将用户语音文本与批量同义词词库进行匹配,当在批量同义词词库中存在匹配成功的批量同义词信息时,基于意图语义信息和批量同义词信息,生成操作信息,并对与批量同义词信息对应个数的用户设备执行所述操作信息。本申请实施例通过在不添加批量意图模板的情况下通过批量同义词词库以及单意图信息识别模型匹配具有批量意图的用户语音文本,在在不新增模板的情况下,实现含有批量控制语义的用户语音文本的准确识别。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了为本申请实施例100所提供的一种对设备进行控制的方法的流程示意图;

图2示出了本申请实施例200提供的一种对设备进行控制的方法的具体流程的示意图;

图3示出了本申请实施例300还提供一种对设备进行控制的装置的示意图;

图4示出了本申请实施例400所提供的一种终端设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。

基于现有技术中的问题,本申请实施例提供了一种对设备进行控制的方法,主要适用于计算机技术领域。在不需要手动扩展模板模型的情况下就可以对用户具有批量意图的控制话术有较好的扩展性支持,实现支持用户的批量控制语音话术的识别。以下几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。如图1所示,为本申请实施例100提供的一种对设备进行控制的方法的流程示意图。本申请实施例的场景主要为可进行语音操控智能设备的室内场景。其中,详细步骤如下:

步骤S11,获取用户语音文本。

本步骤中,用户语音文本一般指用户使用语音对智能设备发出指令的语音对应的文本内容。如针对室内的名称为“空调”、“卧室电视”等智能设备,在用户通过语音控制智能设备时,需要说的类似于“打开空调”,“关闭灯”,“卧室电视声音大一点”等语音内容可作为用户语音文本。

步骤S12,将用户语音文本输入预先建立的单意图信息识别模型,确定用户语音文本的意图语义信息,其中,单意图信息识别模型用于解析用户语音文本的语义。

本步骤中,单意图信息识别模型是预先建立的包含用户语音文本可能对应的意图语义信息的模板库。具体的,单意图信息识别模型中设置有用户对智能设备可能进行的操作动作,如“打开”、“关闭”、“调高”和“调低”等操作动作。进一步地,将操作动作和智能设备的名称关联后作为模板保存在单意图信息识别模型中。

步骤S13,将用户语音文本与批量同义词词库进行匹配,当在批量同义词词库中存在匹配成功的批量同义词信息时,基于意图语义信息和批量同义词信息,生成操作信息,并对与批量同义词信息对应个数的用户设备执行操作信息。

本步骤中,批量同义词词库用于穷尽保存有批量语义的文本信息,如类似“所有”,“全部”等批量语义的批量同义词信息。具体地,将获取的用户语音文本与批量同义词词库中的批量同义词信息进行对比,判断用户语音文本中是否包含批量同义词信息。进一步地,在匹配到批量同义词时,基于单意图信息识别模型确定的意图语义信息和匹配成功的批量同义词信息,生成操作信息。其中,操作信息中包含需要执行的操作类型、需要进行操作的智能设备的设备ID和需要进行操作的智能设备的批量信息。进一步地,基于操作信息,对与批量同义词信息对应个数的用户设备执行操作信息。

如上所述,基于上述实施例,首先获取用户语音文本,其次,将用户语音文本输入预先建立的单意图信息识别模型,确定用户语音文本的意图语义信息,其中,单意图信息识别模型用于解析用户语音文本的语义,最后,将用户语音文本与批量同义词词库进行匹配,当在批量同义词词库中存在匹配成功的批量同义词信息时,基于意图语义信息和批量同义词信息,生成操作信息,并对与批量同义词信息对应个数的用户设备执行所述操作信息。本申请实施例通过在不添加批量意图模板的情况下通过批量同义词词库以及单意图信息识别模型匹配具有批量意图的用户语音文本,在在不新增模板的情况下,实现含有批量控制语义的用户语音文本的准确识别。

如图2所示,为本申请实施例200提供的一种对设备进行控制的方法的具体流程的示意图。其中,该具体流程的详细过程如下:

S201,获取用户语音文本。

这里,获取用户的语音文本中包含智能设备的名称的语音文本作为用户语音文本。

S202,过滤用户语音文本中的无意义词。

这里,遍历预先建立的无意义词库,并将用户语音文本与无意义词库中的无意义词进行对比,当用户语音文本中包括无意义词时,过滤用户语音文本中与无意义词相同的文本词。具体地,对用户语音文本进行预处理,遍历无意义词库,通过与无意义词库中的无意义词进行对比,将与无意义词相同的文本词进行过滤。去除无意义的虚词以及比如句首的“请”、“帮我”句尾的“呢”“了”等等无意义词。用户语音文本“帮我打开所有的空调”在经过预处理后变为“打开所有空调”。

S203,将用户语音文本与批量同义词词库进行匹配。

本步骤中,遍历批量同义词词库,将用户语音文本与批量同义词词库中的批量同义词进行对比。具体的,预先建立批量同义词词库,穷尽包含含有批量含义的批量同义词,如“所有”、“全部”等。进一步地,将用户语音文本与批量同义词词库中的批量同义词进行对比。

S204,将用户语音文本输入预先建立的单意图信息识别模型,确定用户语音文本的意图语义信息。

这里,计算用户语音文本与单意图信息识别模型中的意图语义信息之间的语义相似度,并在语义相似度大于预设阈值时,为用户语音文本关联意图语义信息。具体的,单意图信息识别模型中穷尽建立用户可能对智能设备可进行的操作。如建立“【open】【device】”作为开启智能设备的意图语义信息。其中,“open”和“device”均为同义词集合索引,如“open”可以代表全部的打开类的同义词集合(“打开|开启|启动”等)。上述模板可以匹配的意图语义信息为“打开空调”、“开启空调”等。此外还有表达关闭智能设备的意图语义信息的模板如“【close】【device】”和“【device】【close】”等。进一步地,计算获取的用户文本信息与单意图信息识别模型中的各个意图语义信息的语义相似度,并在超过预设阈值的语义相似度中选取数值最高的意图语义信息与用户文本信息进行关联。

S205,当在批量同义词词库中存在匹配成功的批量同义词信息时,基于意图语义信息和批量同义词信息,生成操作信息。

这里,在经过上述匹配后,在用户语音文本中包含至少一个批量同义词时,确定批量同义词与用户语音文本匹配成功。具体的,若用户语音文本中包含批量词库中的词,则将此用户语音文本标记为批量用户语音文本,然后去掉用户语音话术中的那个匹配到的批量同义词,例如:“打开全部空调”则转变为“打开空调”(批量用户语音文本)。进一步地,基于此前关联的意图语义信息和匹配成功的批量同义词信息,生成操作信息。其中,操作信息包括需要执行的操作类型、需要进行操作的智能设备的设备ID和需要进行操作的智能设备的批量信息。

S206,对与批量同义词信息对应个数的用户设备执行操作信息。

这里,依据操作信息,从用户设备列表中查找需要被控制的智能设备。比如操作信息中的需要为全部“空调”执行打开操作,则若用户名下有空调品类的两个智能设备,分别命名为“小白”和“小黑”,以及冰箱品类的一个智能设备名为“小蓝”,通过操作信息确定用户此次要控制打开的是名为“小白”以及“小黑”的智能设备。

S207,当不匹配时,基于用户语音文本关联的意图语义信息生成操作信息。

S208,对用户设备执行操作信息。

本申请实施例所示出的一种对设备进行控制的方法基于普通单意图语音话术识别的基础上实现的,现有的单意图识别技术更多是基于模板匹配的方式,即用正则表达式类型的模板来匹配单个的用户语音文本。直接利用单意图识别时所建立的模板模型,在不新增模板的情况下,实现批量控制的用户语音文本的准确识别。

针对拥有智能设备较多的家庭,单句控制单个设备会越来越无法满足便捷控制的需求;对用户语音控制话术限制过于死板,无法灵活运用,单个语音话术只能局限到单个设备;用户无法一次通过语音控制相同品类的多个设备,比如:用户话术为“打开全部的空调”。这类话术无法准确的被理解到,用户的意图是把自己家中全部的空调打开;用户无法单次对相同名称的多个设备进行控制,比如:用户名下有多款设备,一款为空调,一款为灯具,但是都将其命名为“小白”,话术为“打开全部小白”等话术无法语义解析的问题,本申请实施例所示出的一种对设备进行控制的方法在不需要手动扩展模板模型的情况下就可以对用户具有批量意图的控制话术有较好的扩展性支持,更加丰富的用户语音文本,降低匹配失败率。

基于同一发明构思,本申请实施例300还提供一种对设备进行控制的装置,其中,如图3所示,该装置包括:

获取模块31,用于获取用户语音文本;

确定模块32,用于将用户语音文本输入预先建立的单意图信息识别模型,确定用户语音文本的意图语义信息,其中,单意图信息识别模型用于解析用户语音文本的语义;

操作模块33,用于将用户语音文本与批量同义词词库进行匹配,当在批量同义词词库中存在匹配成功的批量同义词信息时,基于意图语义信息和批量同义词信息,生成操作信息,并对与批量同义词信息对应个数的用户设备执行操作信息。

本实施例中,获取模块31、确定模块32和操作模块33的具体功能和交互方式,可参见图1对应的实施例的记载,在此不再赘述。

可选地,确定模块32进一步用于:

计算用户语音文本与单意图信息识别模型中的意图语义信息之间的语义相似度,并在语义相似度大于预设阈值时,为用户语音文本关联意图语义信息。

可选地,操作模块33进一步用于:

遍历批量同义词词库,将用户语音文本与批量同义词词库中的批量同义词进行对比,并在用户语音文本中包含至少一个批量同义词时,确定批量同义词与用户语音文本匹配成功。

如图4所示,本申请的又一实施例400还提供一种终端设备,包括处理器401,其中,处理器401用于执行上述一种对设备进行控制的方法的步骤。从图4中还可以看出,上述实施例提供的终端设备还包括非瞬时计算机可读存储介质402,该非瞬时计算机可读存储介质402上存储有计算机程序,该计算机程序被处理器401运行时执行上述一种对设备进行控制的方法的步骤。实际应用中,该终端设备可以是一台或多台计算机,只要包括上述计算机可读介质和处理器即可。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘和FLASH等,该存储介质上的计算机程序被运行时,能够执行上述的一种对设备进行控制的方法中的各个步骤。实际应用中,所述的计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或多个程序被执行时,能够执行上述的一种对设备进行控制的方法中的各个步骤。

根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标注的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行变更或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些变更、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

相关技术
  • 用于对录音设备进行录音控制的方法及装置、电子设备、可读存储介质
  • 一种对设备进行控制的方法、装置和存储介质
技术分类

06120112322130