导航：首页> 乐器；声学>语音控制洗衣机的方法和装置

语音控制洗衣机的方法和装置

文献发布时间：2023-06-19 16:06:26

技术领域

本申请涉及智能家电领域，并且更具体地，涉及一种语音控制洗衣机的方法和装置。

背景技术

随着互联网技术和人工智能的发展，智能家电已进入人们的生活，目前，很多智能家电具有语音模块，用户通过语音模块实现对智能家电的开关以及控制等。

以智能洗衣机为例，大多智能洗衣机都带有语音模块，用户通过语音方式控制洗衣机的启动、暂停、开门、关机等操作。而有些操作不适宜儿童使用，儿童操作可能带来安全隐患，从而降低了智能洗衣机的使用安全性。

发明内容

本申请实施例提供了一种语音控制洗衣机的方法和装置，能够提高智能洗衣机的安全性。

第一方面，本申请提供了一种语音控制洗衣机的方法，包括：

接收用户输入的语音数据；

识别所述语音数据中是否包含预设关键词；

如果所述语音数据中包含预设关键词，则通过声纹识别确定所述语音数据对应的发声用户的年龄；

当所述发声用户的年龄小于预设年龄时，禁止执行所述语音数据对应的动作；

当所述发声用户的年龄不小于所述预设年龄时，执行所述语音数据对应的动作。

可选的，所述禁止执行所述语音数据对应的动作，包括：开启童锁功能。

可选的，当所述发声用户的年龄小于预设年龄时，所述方法还包括：

向所述洗衣机连接的控制设备或者预设手机号发送通知信息，所述通知信息用于通知有儿童对所述洗衣机进行操作；和/或

语音提示用户所述语音数据对应的动作无法执行。

可选的，所述通过声纹识别确定所述语音数据对应的发声用户的年龄，包括：

从所述语音数据中提取声纹参数，所述声纹参数包括以下参数中一个或者多个：基因周期、短时频率、短时能量、短时过零率、倒谱、线性预测系数LPC参数、梅尔倒谱系数MFCC参数；

将所述声纹参数与预先获取的多个年龄阶段的声纹参数进行匹配；

如果所述声纹参数与所述多个年龄阶段的声纹参数的第一年龄阶段的声纹参数匹配成功，则确定所述第一年龄阶段的最大值为所述发声用户的年龄。

可选的，所述识别所述语音数据中是否包含预设关键词，包括：

识别所述语音数据中是否包含所述洗衣机的语音唤醒词；

当所述语音数据中包括所述洗衣机的语音唤醒词时，识别所述语音数据中是否包含预设关键词。

可选的，所述预设关键词包括启动、暂停、开门、开机或者关机，所述方法还包括：

接收控制设备发送的设置消息，所述设置消息中包括所述预设关键词；

根据所述设置消息设置所述预设关键词。

第二方面，本申请提供一种语音控制洗衣机的装置，包括：

接收模块，用于接收用户输入的语音数据；

语音识别模块，用于识别所述语音数据中是否包含预设关键词；

声纹识别模块，用于当所述语音数据中包含预设关键词时，通过声纹识别确定所述语音数据对应的发声用户的年龄；

安全模块，用于当所述发声用户的年龄小于预设年龄时，语音提示用户所述语音数据对应的动作无法执行，并禁止执行所述语音数据对应的动作；

执行模块，用于当所述发声用户的年龄不小于所述预设年龄时，执行所述语音数据对应的动作。

可选的，所述安全模块具体用于：

当所述发声用户的年龄小于预设年龄时，语音提示用户所述语音数据对应的动作无法执行，并开启童锁功能。

可选的，还包括发送模块和/或提示模块，所述发送模块用于向所述洗衣机连接的控制设备或者手机号发送通知信息，所述通知信息用于通知有儿童对所述洗衣机进行操作；

所述提示模块，用于语音提示用户所述语音数据对应的动作无法执行。

可选的，所述声纹识别模块具体用于：

将所述声纹参数与预先获取的多个年龄阶段的声纹参数进行匹配；

如果所述声纹参数与所述多个年龄阶段的声纹参数的第一年龄阶段的声纹参数匹配成功，则确定所述第一年龄阶段的最大值为所述发声用户的年龄。

可选的，所述语音识别模块具体用于：

识别所述语音数据中是否包含所述洗衣机的语音唤醒词；

当所述语音数据中包括所述洗衣机的语音唤醒词时，识别所述语音数据中是否包含预设关键词。

可选的，所述预设关键词包括启动、暂停、开门、开机或者关机。所述接收模块，还用于接收控制设备发送的设置消息，所述设置消息中包括所述预设关键词；所述装置还包括设置模块，用于根据所述设置消息设置所述预设关键词。

第三方面，本申请提供一种洗衣机，包括：至少一个处理器、存储器和洗衣组件；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如本申请第一方面所述的方法；

所述洗衣组件，用于根据所述至少一个处理器的控制执行对应操作。

第四方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如本发明第一方面以及可选方式中任一项所述的方法。

第五方面，本申请提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，实现如本发明第一方面以及可选方式中任一项所述的方法。

本申请提供的语音控制洗衣机的方法，通过接收用户输入的语音数据，识别语音数据中是否包含预设关键词，如果语音数据中包含预设关键词，则通过声纹识别确定语音数据对应的发声用户的年龄，当发声用户的年龄小于预设年龄时，禁止执行语音数据对应的动作；当发声用户的年龄不小于预设年龄时，执行语音数据对应的动作。通过识别语音数据对应的发声用户的年龄，当确定发声用户为儿童时，禁止执行语音数据对应的动作，降低儿童因为好奇误操作引发的安全隐患，提高了洗衣机的使用安全性。

附图说明

图1为洗衣机的一种结构示意图；

图2为本发明实施例一提供的语音控制洗衣机的方法；

图3为本申请实施例二提供的语音控制洗衣机的装置的结构示意图；

图4为本发明实施例三提供的洗衣机的一种结构示意图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

本申请提供一种语音控制洗衣机的方法，可以应用于具有语音功能的洗衣机或者智能洗衣机，该洗衣机可以是波轮式洗衣机、滚筒式洗衣机或者搅拌式洗衣机。

图1为洗衣机的一种结构示意图，图1所示洗衣机为滚筒式洗衣机，该洗衣机包括箱体1、主控板2和前门3(也称为前盖)。

箱体1包括后U型总成、前面板、底饰板、台面板和后背盖板等。后U型总成的背面上设置有进水口、箱体把手等。

主控板2上设置有显示屏幕、旋钮、按键和分配器盒等。显示屏幕设置在主控板2的中部位置，用于显示洗衣机的工作模式、洗衣时长和提示信息等。旋钮和按键一般设置在主控板2的右侧，用于选择洗衣机的工作模式、控制洗衣机的开关、暂停等操作。分配器盒一般设置在主控板2的左侧，用于放置洗涤剂、预洗剂和消毒剂等，分配器盒上方设置有用于喷水的喷头，水从分配器盒流入到外筒内。

主控板2内部设置有主控电路板，通常位于旋钮和按键后方，主控电路板上设置有处理单元，用于控制洗衣机的运转。该处理单元可以是通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integratedcircuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

前门3设置在前面板上，位于主控板2的下方，前门3能够关闭，通过前门3将衣物投入洗衣机内。

可以理解，洗衣机的箱体1内还包括进水组件、筒总成、加热组件、驱动组件、平衡减震组件和排水组件等。本实施例不再一一列举。

图2为本发明实施例一提供的语音控制洗衣机的方法，本实施例的方法可以由主控板2中处理单元执行，如图2所示，本实施例提供的方法可以包括以下步骤。

S101、接收用户输入的语音数据。

洗衣机上设置有语音采集装置，该语音采集装置可以为麦克风，在洗衣机处于待机状态或者运转状态时，麦克风采集语音数据。

S102、识别语音数据中是否包含预设关键词。

洗衣机的语音模块一般都需要语音唤醒词进行唤醒，该唤醒词例如为小优小优等。语音识别模块对语音数据进行识别，得到语音数据对应的文本内容，如果语音数据对应的文本内容中包含预设的关键词，则执行步骤S103，如果语音数据对应的文本内容中不包含预设的关键词，则执行步骤S106。

该预设的关键词包括以下词语中的任意一个或者多个：启动、暂停、开门、开机或者关机。

关键词可以由用户根据需要灵活设置，智能洗衣机可以和控制设备连接，通过控制设备上的app对洗衣机进行设置，该控制设备可以为手机、平板电脑、台式电脑等。

用户通过控制设备上的app设置关键词，控制设备根据用户的设置，向智能洗衣机发送设置消息，该设置消息中包括预设关键词，智能洗衣机根据该设置消息设置预设关键词。

S103、通过声纹识别确定语音数据对应的发声用户的年龄。

声纹是指用电声学仪器显示的携带语言信息的声波频率，它和指纹、掌纹、脸像、虹膜、笔迹一样，都属于生物认证，通过声纹识别能够识别不同的人，不同年龄段的人，不同性别的人。

人的年龄、性别差异会体现在整个发音系统尤其是声道形状上，进而使声纹参数发生变化，从各种声纹参数中，可以提取出其相应的差异。人体发音器官包括：肺、气管、喉、咽、鼻、口。喉的部分为声门，从声门到嘴唇的通道为声道。声道的形状主要由嘴唇、鄂、舌的位置决定。声道形状不断变化会导致发出不同的声音。

一种实现方式中，从语音数据中提取声纹参数，将提取到的声纹参数与预先获取的多个年龄阶段的声纹参数进行匹配，如果提取到的声纹参数与该多个年龄阶段的声纹参数的第一年龄阶段的声纹参数匹配成功，则确定该第一年龄阶段的最大值为发声用户的年龄。

可选的，该声纹参数包括以下参数中一个或者多个：基因周期、短时频率、短时能量、短时过零率、倒谱、线性预测系数(Linear Prediction Coefficient，简称LPC)参数、梅尔频率倒谱系数(Mel-scaleFrequency Cepstral Coefficients，简称MFCC)参数。

不同年龄阶段人的声纹参数有所不同，通过大量的语音数据能够得到不同年龄阶段的声纹参数，假设声纹参数包括基因周期、短时频率和短时能量，共有3个年龄段3-8岁、9-15岁，15岁以上，则三个年龄阶段的声纹参数的取值不同。示例性的，3-8岁的基因周期的取值为a1-a2，短时频率为b1-b2，短时能量为c1-c2；9-15岁的基因周期的取值为a3-a4，短时频率为b3-b4，短时能量为c3-c4；15岁以上的基因周期的取值为a5-a6，短时频率为b3-b4，短时能量为c3-c4。

在匹配时，将提取到的语音数据的基因周期与三个年龄段的基因周期进行比较，将提取到的语音数据的短时频率与三个年龄段的短时频率进行比较，将提取到的语音数据的短时能量与三个年龄段的短时能量进行比较。如果提取到的语音数据的基因周期、短时频率和短时能量均属于9-15岁年龄段对应的基因周期、短时频率和短时能量的取值范围内，则确定提取到的语音数据的声纹参数与9-15岁年龄段对应的声纹参数匹配，将9-15岁年龄段中的最大年龄值15作为发声用户的年龄。

另一种可能的实现方式中，通过计算提取到的声纹参数与各年龄阶段对应的声纹参数的相似度，当提取到的声纹参数与第一年龄阶段的声纹参数的相似度大于相似度阈值时，确定提取到的声纹参数与第一年龄阶段的声纹参数匹配成功。当提取到的声纹参数与第一年龄阶段的声纹参数的相似度小于或者等于该相似度阈值时，确定提取到的声纹参数与第一年龄阶段的声纹参数不匹配或者匹配失败。

另一种实现方式中，可以通过大量的语音数据样本进行训练得到声纹识别模型，将语音数据输入该声纹识别模型后，能够得到该语音数据对应的发声用户的年龄。可以采用深度神经网络模型训练得到该声纹识别模型。

S104、判断发声用户的年龄是否小于预设年龄。

该预设年龄为儿童对应的年龄，例如为12岁、15等，当发声用户的年龄小于预设年龄时，执行步骤是105，当发声用户的年龄不小于(即大于或等于)预设年龄时，执行步骤S106。

S105、禁止执行语音数据对应的动作。

当发声用户的年龄小于该预设年龄时，说明发声用户为儿童，为了避免儿童操作可能带来的安全隐患禁止执行语音数据对应的动作。

在禁止执行语音数据对应的动作后，该语音数据对应的动作不会被执行，洗衣机继续运转。

如果洗衣机具有童锁功能，则禁止执行语音数据对应的动作具体可以为：开启童锁功能，当童锁功能启用时，其它任何操作键都会暂时失去其控制功能，这就避免了儿童因好奇误操作而导致的危险。

在童锁功能开启之后，只有解除童锁功能洗衣机才能响应用户的其他外部操作。如果用户不解除童锁功能，则洗衣机按照已设定的工作模式进行运转，并且在运转过程中不会响应用户的其他外部操作，在已设定的工作模式结束之后，洗衣机解除童锁功能。例如，用户设置了快洗模式，那么在启动童锁功能之后，洗衣机按照快洗模式进行运转，该过程中不会响应其他操作。

可选的，在洗衣机具有童锁功能的前提下，禁止执行语音数据对应的动作时，可以不开启童锁功能，只禁止本次语音数据对应的动作。

如果洗衣机连接有控制设备，则当确定发声用户的年龄小于预设年龄时，还可以向洗衣机连接的控制设备发送通知信息，该通知信息用于通知有儿童对洗衣机进行操作，便于家长根据该通知消息了解情况，并采取对应措施。

或者，当确定发声用户的年龄小于预设年龄时，向预设的手机号发送通知消息，即以短信方式发送该通知消息。

当确定发声用户的年龄小于预设年龄时，可选的，还可以语音提示用户语音数据对应的动作无法执行。

S106、执行语音数据对应的动作。

当发声用户的年龄大于或等于预设年龄时，说明该语音数据不是儿童发出的，是用户对洗衣机的正常语音控制指令，则根据识别到的语音数据对应的文字，确定出该语音数据对应的动作。

例如，当语音数据对应的动作为暂停时，控制洗衣机暂停工作，当语音数据对应的动作为关机时，控制洗衣机关机。

本实施例中，接收用户输入的语音数据，识别语音数据中是否包含预设关键词，如果语音数据中包含预设关键词，则通过声纹识别确定语音数据对应的发声用户的年龄，当发声用户的年龄小于预设年龄时，禁止执行语音数据对应的动作；当发声用户的年龄不小于预设年龄时，执行语音数据对应的动作。通过识别语音数据对应的发声用户的年龄，当确定发声用户为儿童时，禁止执行语音数据对应的动作，降低儿童因为好奇误操作引发的安全隐患，提高了洗衣机的使用安全性。

图3为本申请实施例二提供的语音控制洗衣机的装置的结构示意图，该装置集成在洗衣机中，如图3所示，本实施例的装置100包括：

接收模块11，用于接收用户输入的语音数据；

语音识别模块12，用于识别所述语音数据中是否包含预设关键词；

声纹识别模块13，用于当所述语音数据中包含预设关键词时，通过声纹识别确定所述语音数据对应的发声用户的年龄；

安全模块14，用于当所述发声用户的年龄小于预设年龄时，禁止执行所述语音数据对应的动作；

执行模块15，用于当所述发声用户的年龄不小于所述预设年龄时，执行所述语音数据对应的动作。

可选的，所述安全模块14具体用于：当所述发声用户的年龄小于预设年龄时，语音提示用户所述语音数据对应的动作无法执行，并开启童锁功能。

可选的，还包括发送模块和提示模块，所述发送模块用于向所述洗衣机连接的控制设备或者预设手机号发送通知信息，所述通知信息用于通知有儿童对所述洗衣机进行操作。所述提示模块，用于语音提示用户所述语音数据对应的动作无法执行。

可选的，所述声纹识别模块13具体用于：

将所述声纹参数与预先获取的多个年龄阶段的声纹参数进行匹配；

如果所述声纹参数与所述多个年龄阶段的声纹参数的第一年龄阶段的声纹参数匹配成功，则确定所述第一年龄阶段的最大值为所述发声用户的年龄。

可选的，所述语音识别模块12具体用于：识别所述语音数据中是否包含所述洗衣机的语音唤醒词，当所述语音数据中包括所述洗衣机的语音唤醒词时，识别所述语音数据中是否包含预设关键词。

可选的，所述预设关键词包括启动、暂停、开门、开机或者关机。所述接收模块11，还用于接收控制设备发送的设置消息，所述设置消息中包括所述预设关键词；所述装置100还包括设置模块，用于根据所述设置消息设置所述预设关键词。

本实施例的装置，可用于执行实施例一的方法，具体实现方式和技术效果类似，这里不再赘述。

图4为本发明实施例三提供的洗衣机的一种结构示意图，如图4所示，该洗衣机200包括：处理器21、存储器22和收发器23，所述存储器22用于存储指令，所述收发器23用于和其他设备通信，所述处理器21用于执行所述存储器中存储的指令，以使所述电子设备200执行如上述实施例一所述的方法步骤，具体实现方式和技术效果类似，这里不再赘述。

可以理解，本实施例只示出了与本发明相同的组件处理器21、存储器22和收发器23，洗衣机还包括更多的功能组件，具体可以参照上述图1所示洗衣机的描述。其中，处理器21、存储器22和收发器23位于图1所示洗衣机的主控板电路上。

本发明实施例四提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上述实施例一或实施例二中分播设备执行的方法步骤，具体实现方式和技术效果类似，这里不再赘述。

本发明实施例五提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，实现如上述实施例一或实施例二中分播设备执行的方法步骤，具体实现方式和技术效果类似，这里不再赘述。

本申请实施例中不限定上述处理器21、存储器22以及通信接口23之间的具体连接介质。本申请实施例在图4中以处理器21、存储器22以及通信接口23之间通过总线24连接。总线24在图4中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

应理解，本申请实施例中的处理器可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digitalsignal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

还应理解，本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(directrambus RAM，DR RAM)。应注意，本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

本说明书中使用的术语“单元”、“模块”等，可用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

在上述实施例中，各功能单元的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令(程序)。在计算机上加载和执行所述计算机程序指令(程序)时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张高贤;许升;
专利申请人：青岛海尔洗衣机有限公司;海尔智家股份有限公司;