掌桥专利:专业的专利平台
掌桥专利
首页

语音设备及其唤醒方法、装置以及存储介质

文献发布时间:2023-06-19 09:24:30


语音设备及其唤醒方法、装置以及存储介质

技术领域

本申请涉及语音技术领域,尤其是涉及一种语音设备及其唤醒方法、装置以及存储介质。

背景技术

随着家电产品越来越智能化,语音识别技术日趋成熟,语音识别技术应用到家电产品已成趋势。目前,很多用户家庭普遍存在多种品类的语音设备,而各语音设备的唤醒方式大都相同,由此容易导致一次操作同时唤醒多个设备的情况的发生,影响用户使用。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种语音设备的唤醒方法,以使多个语音设备可以实现唯一唤醒。

本发明的第二个目的在于提出一种语音设备的唤醒装置。

本发明的第三个目的在于提出一种计算机可读存储介质。

本发明的第四个目的在于提出一种语音设备。

为达上述目的,本发明第一方面实施例提出了一种语音设备的唤醒方法,包括:

获取多个语音设备发出的唤醒信息,其中,语音设备发出的唤醒信息由该语音设备根据得到的语种信息发出,所述语种信息和所述唤醒信息均由对应的语音设备根据接收到的语音唤醒指令得到;

根据所述唤醒信息,确定待唤醒的语音设备,并生成唤醒指令;

将所述唤醒指令发送至所述待唤醒语音设备,以唤醒所述待唤醒语音设备。

根据本发明实施例的语音设备的唤醒方法,多个语音设备可以同时对语音唤醒指令进行识别分析,以获取多个语音设备获取的语种信息和唤醒信息,并根据语种信息和唤醒信息确定需要唤醒的待唤醒语音设备,通过向其发送唤醒指令以将该待唤醒设备唤醒,从而实现多个语音设备的唯一唤醒。

根据本发明的一个实施例,所述唤醒信息包括唤醒能量值,其中,所述根据所述唤醒信息,确定待唤醒的语音设备,包括:对所述多个语音设备的唤醒能量值进行比较;将唤醒能量值最大的语音设备作为所述待唤醒语音设备。

根据本发明的一个实施例,语音设备在得到的语种信息与其对应的预设语种匹配时,发出对应的唤醒信息。

根据本发明的一个实施例,各所述语音设备根据接收到的语种设置指令确定对应的设置语种,并将所述设置语种作为自身的预设语种。

根据本发明的一个实施例,所述唤醒方法还包括:接收唤醒设置指令;根据所述唤醒设置指令确定待设置唤醒语种的语音设备和对应的设置语种;根据所述设置语种向所述待设置唤醒语种的语音设备发送唤醒设置信息,以使所述待设置唤醒语种的语音设备将所述设置语种作为自身的预设语种。

根据本发明的一个实施例,所述预设语种为英语、法语、德语、粤语、四川话、山东话、上海话、闽南语、东北话中的一者。

根据本发明的一个实施例,所述唤醒方法由语音设备实现,所述唤醒方法还包括:获取多个语音设备的运行参数;根据所述运行参数确定用于实现所述唤醒方法的语音设备。

为达上述目的,本发明第二方面实施例提出了一种语音设备的唤醒装置,包括:

获取模块,用于获取多个语音设备发出的唤醒信息,其中,语音设备发出的唤醒信息由该语音设备根据得到的语种信息发出,所述语种信息和所述唤醒信息均由对应的语音设备根据接收到的语音唤醒指令得到;

确定模块,用于根据所述唤醒信息,确定待唤醒的语音设备,并生成唤醒指令;

发送模块,用于将所述唤醒指令发送至所述待唤醒语音设备,以唤醒所述待唤醒语音设备。

根据本发明实施例的唤醒装置,通过获取模块对多个语音设备的语音唤醒指令识别,以获取多个语音设备获取的语种信息和唤醒能量值,确定模块可以将语种信息与预设语种匹配,根据唤醒能量值确定待唤醒语音设备,并生成唤醒指令,由发送模块发送唤醒指令唤醒待唤醒语音设备,实现多个语音设备中的唯一唤醒功能。

根据本发明的一个实施例,所述确定模块,具体用于:

将所述多个语音设备的语种信息与预设语种进行匹配,并对所述多个语音设备的唤醒能量值进行比较;

将语种信息与所述预设语种匹配且唤醒能量值最大的语音设备作为所述待唤醒语音设备。

为达上述目的,本发明第三方面实施例提出了一种计算机可读存储介质,所述计算机程序被处理器执行时,实现如本发明第一方面实施例所述的语音设备的唤醒方法。

为达上述目的,本发明第四方面实施例提出了一种语音设备包括:如本发明第二方面实施例所述的语音设备的唤醒装置;或者存储器、处理器和存储在所述存储器上的计算机程序,所述计算机程序被所述处理器执行时,实现如本发明第一方面实施例所述的语音设备的唤醒方法。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

图1是本发明一个实施例的语音设备的唤醒方法的流程图;

图2是本发明另一个实施例的语音设备的唤醒方法的流程图;

图3是本发明实施例的语音设备的唤醒装置的结构示意图;

图4是本发明实施例的语音设备的结构示意图;

图5是本发明另一个实施例的语音设备的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的语音设备及其唤醒方法、装置以及存储介质。

图1是本发明一个实施例的语音设备的唤醒方法的流程图。如图1所示,语音设备的唤醒方法包括以下步骤:

S101,获取多个语音设备发出的唤醒信息,其中,语音设备发出的唤醒信息由该语音设备根据得到的语种信息发出。

在该实施例中,语种信息和唤醒信息均由对应的语音设备根据接收到的语音唤醒指令得到。多个语音设备可以是连接在同一局域网内的语音设备,多个语音设备可以通过局域网通讯。

具体地,语音唤醒指令可以是用户发出的,例如可以是语音“小美小美”。当处于同一局域网中的多个语音设备通过对应的麦克风接收到上述语音唤醒指令后,各语音设备可对自身接收的语音唤醒指令进行分析,得到对应的语种信息(即接收到的语音唤醒指令是何语种)。根据语种信息确定是否发出唤醒信息,如唤醒能量值(可以是计算得到的语音能量,即声音强度值),若确定发出唤醒信息,则将唤醒信息发送至局域网内的特定设备,或者,发送至云端服务器。其中,特定设备可以是预先设置的上述局域网内的固定设备,该固定设备不可变,即每次均由该固定设备实现本发明的唤醒方法;也可以是上述多个语音设备仲裁出的一个语音设备,该仲裁出的语音设备可变,即每次冲裁出的语音设备可不同。

其中,“语种信息”可以是不同的语言种类,如:中文、英语、法语、德语等,还可以是不同类型的方言,以中文为例,可以包括:粤语、四川话、山东话、上海话等。

需要说明的是,各语音设备在接收到语音唤醒指令时,还可识别得到语音唤醒指令对应的词句,并可对该词句与预设唤醒词进行匹配,如果匹配通过,可进一步得到语种信息。并且,各语音设备在发送唤醒信息时,还可将自身的身份信息一并发送,以便后续确定待唤醒的语音设备和唤醒指令的发送。

S102,根据唤醒信息,确定待唤醒的语音设备,并生成唤醒指令。

具体地,语音设备在得到的语种信息与其对应的预设语种匹配时,发出对应的唤醒信息。上述的特定设备或者云端服务器,在获取到各语音设备的唤醒信息之后,可对多个语音设备的唤醒信息如唤醒能量值进行比较;将唤醒信息满足预设条件的语音设备作为待唤醒语音设备。

其中,预设语种可以为英语、法语、德语、粤语、四川话、山东话、上海话、闽南语、东北话中的一者。

需要说明的是,语音设备在得到的语种信息与其对应的预设语种不匹配时,则发出对应的唤醒信息,包括可不进行唤醒能量值的计算。

S103,将唤醒指令发送至待唤醒语音设备,以唤醒待唤醒语音设备。

具体地,上述的特定设备或者云端服务器,确定唯一的待唤醒语音设备后,可将生成的唤醒指令发送至该待唤醒语音设备,以唤醒该待唤醒语音设备,使该待唤醒语音设备进入交互环节,可与用户进行交互。

由此,该语音设备的唤醒方法,可以实现多个语音设备对接收到的同一语音唤醒指令进行识别分析,以获取多个语音设备获取的语种信息和唤醒信息,并根据语种信息和唤醒信息确定需要唤醒的待唤醒语音设备,通过向其发送唤醒指令以将该待唤醒设备唤醒,从而实现多个语音设备的唯一唤醒。

在本发明的一些实施例中,唤醒信息可包括唤醒能量值,根据唤醒信息,确定待唤醒的语音设备,可包括:对多个语音设备的唤醒能量值进行比较,将唤醒能量值最大的语音设备作为待唤醒语音设备。由此,可以在多个语音设备中选取一个语音设备并将其唤醒,从而实现唯一唤醒功能。

需要说明的是,用户发出语音唤醒指令时,多个语音设备与用户发出语音唤醒指令时的所处位置的距离以及方位存在差异,由此,每个语音设备计算出的唤醒能量值不同。

在本发明一些可选的实施例中,各语音设备根据接收到的语种设置指令确定对应的设置语种,并将设置语种作为自身的预设语种。

具体地,作为一个示例,在对某一语音设备进行唤醒语种设置时,用户可开启该语音设备,并语音下发语种设置指令,如粤语版的“打开唯一唤醒”,该语音设备可自动识别该指令的语义,确定进行唯一唤醒语种设置,进而识别该指令的语种,将该语种作为唯一唤醒语种,即上述的预设语种。

作为另一个示例,多个语音设备连接在同一局域网且开启时,用户语音下发语音设置指令,如以粤语版的“设置语音设备X的唯一唤醒”,各语音设备自动识别该指令的语义,确定自身是否进行唯一唤醒语种设置。语音设备X根据该指令确定自身进行唯一唤醒语种设置,进而识别该指令的语种,将该语种作为唯一唤醒语种,即上述的预设语种。相应的,其他语音设备根据该指令确定自身不进行唯一唤醒语种设置,便不再进行之后的步骤。

由此,用户可以根据个人的使用需求,对语音设备的预设语种进行设置,从而可以更好地满足不同用户的使用需求。

在本发明另一些可选的实施例中,如图2所示,唤醒方法还包括:

S201,接收唤醒设置指令。

S202,根据唤醒设置指令确定待设置唤醒语种的语音设备和对应的设置语种。

S203,根据设置语种向待设置唤醒语种的语音设备发送唤醒设置信息,以使所述待设置唤醒语种的语音设备将设置语种作为自身的预设语种。

具体地,多个语音设备连接在同一局域网且开启时,用户语音下发语音设置指令,如以粤语版的“设置语音设备X的唯一唤醒”,特定语音设备可自动识别该指令的语义,确定进行唯一唤醒语种设置的语音设备X,进而识别该指令的语种,并生成唤醒设置信息。将包含设置语种的唤醒设置信息发送至语音设备X,以使语音设备X将设置语种作为自身的唯一唤醒语种,即上述的预设语种。

由此,用户可以根据个人的使用需求,对语音设备的预设语种进行设置,从而可以更好地满足不同用户的使用需求。

可以理解的是,不同用户之间的语言习惯存在差异,如:因地方差异导致语言习惯存在差异等。对于广东、香港等地区的用户,其常用语言为粤语,此时用户可以将预设语种设置为粤语。在用户设置预设语种之后,用户可以发出语音唤醒指令,语音设备可以将其获取的语音唤醒指令中的语种信息进行识别,并判断其是否与预设语种(粤语)相匹配。当语音唤醒指令中的语种信息与预设语种不匹配时,语音唤醒指令无法唤醒语音设备。

在本发明的一些实施例中,在设置预设语种后,还可进一步设置唤醒词。

在本发明的一些可选实施例中,唤醒方法由仲裁出的语音设备实现。在该实施例中,唤醒方法还可包括:获取多个语音设备的运行参数,根据运行参数确定用于实现唤醒方法的语音设备。

其中,运行参数可以是语音设备的内存参数、CPU处理能力等;当语音设备仅由电池进行供电时,运行参数还可包括电池的实时电量。由此,可以通过比较多个语音设备的运行参数以仲裁出适于唤醒的语音设备,例如,可以是内存最大的语音设备,也可以是CPU处理能力最优的语音设备,还可以是电量最多的语音设备。

综上,本发明实施例的语音设备的唤醒方法,可通过对语音唤醒指令的语种、能量值的识别,从多个语音设备中确定待唤醒的语音设备,从而实现语音设备的唯一唤醒,有助于提升用户与语音设备的交互体验。

图3是本发明实施例的语音设备的唤醒装置的结构示意图。如图3所示,语音设备的唤醒装置100,包括:获取模块10、确定模块20和发送模块30。

其中,获取模块10用于获取多个语音设备发出的唤醒信息,其中,语音设备发出的唤醒信息由该语音设备根据得到的语种信息发出,语种信息和唤醒信息均由对应的语音设备根据接收到的语音唤醒指令得到。确定模块20用于根据唤醒信息,确定待唤醒的语音设备,并生成唤醒指令。发送模块30用于将唤醒指令发送至待唤醒语音设备,以唤醒待唤醒语音设备。

在本发明的一个实施例中,唤醒信息包括唤醒能量值,其中,确定模块20具体用于:对多个语音设备的唤醒能量值进行比较,将唤醒能量值最大的语音设备作为待唤醒语音设备。

其中,预设语种为英语、法语、德语、粤语、四川话、山东话、上海话、闽南语、东北话中的一者。

在本发明的一个实施例中,语音设备在得到的语种信息与其对应的预设语种匹配时,发出对应的唤醒信息。

作为一个示例,各语音设备可根据接收到的语种设置指令确定对应的设置语种,并将设置语种作为自身的预设语种。

作为另一个示例,语音设备的唤醒装置100,还可包括:接收模块,用于接收唤醒设置指令。确定模块20还可用于根据唤醒设置指令确定待设置唤醒语种的语音设备和对应的设置语种。发送模块30还可用于根据设置语种向待设置唤醒语种的语音设备发送唤醒设置信息,以使所述待设置唤醒语种的语音设备将设置语种作为预设语种。

在本发明的一个实施例中,获取模块10还用于获取多个语音设备的运行参数;确定模块20还用于根据运行参数确定用于实现上述实施例的唤醒方法的语音设备。

需要说明的是,本发明实施例的语音设备的唤醒装置的其他具体实施方式,可参见本发明上述实施例的语音设备的唤醒方法。

根据本发明实施例的语音设备的唤醒装置,可通过对语音唤醒指令的语种、能量值的识别,从多个语音设备中确定待唤醒的语音设备,从而实现语音设备的唯一唤醒,有助于提升用户与语音设备的交互体验。

为了实现上述实施例,本发明还提出一种语音设备。

在本发明的一个实施例中,如图4所示,语音设备1000包括:上述的语音设备的唤醒装置100。

在本发明的另一个实施例中,如图5所示,语音设备1000包括:存储器200、处理器300和存储在存储器200上的计算机程序400,计算机程序被处理器执行时,实现上述的语音设备的唤醒方法。

为了实现上述实施例,本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述的语音设备的唤醒方法。

需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 智能设备、语音唤醒方法、语音唤醒装置及存储介质
  • 语音设备的唤醒调整方法、装置、语音设备及存储介质
技术分类

06120112157042