掌桥专利:专业的专利平台
掌桥专利
首页

设备唤醒方法、装置、存储介质及电子设备

文献发布时间:2024-04-18 20:00:50


设备唤醒方法、装置、存储介质及电子设备

技术领域

本申请涉及物联网技术领域,具体涉及一种设备唤醒方法、装置、存储介质及电子设备。

背景技术

远场语音唤醒场景中,通过将采集的用于语音的音频数据实时送入语音唤醒模型进行分析,在持续分析的过程中,模型会对用户语音是否包含唤醒词“比如小T小T,小爱同学等”进行置信度打分评定,当唤醒置信度达到预定语音唤醒阈值,则判定触发唤醒动作进行设备唤醒。

目前,预定语音唤醒阈值一般在初始化语音唤醒模型的时候主动设定,并且针对同一个版本语音唤醒模型一般采用同一个预定语音唤醒阈值,该语音唤醒模型的设定通常固定且统一,实际应用时,申请人发现不能有效应单个用户的实际情况变化,导致设备的语音唤醒效果较差,不同用户的体验差异较大。

发明内容

本申请实施例提供一种方案,可以有效提升设备的语音唤醒效果,提升用户的体验。

本申请实施例提供以下技术方案:

根据本申请的一个实施例,一种设备唤醒方法,其包括:获取目标用户的多个用户语音对应的唤醒评定信息;从所述多个用户语音对应的唤醒评定信息中,提取至少包括各所述用户语音的唤醒置信度的语音特征信息,所述唤醒置信度为语音唤醒模型对用户语音分析得到的;对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,所述用户语音唤醒阈值用于判断是否根据所述目标用户的唤醒语音进行设备唤醒。

在本申请的一些实施例中,所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,包括:对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值;根据所述第一平均值,得到所述目标用户对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的唤醒场景;所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,包括:根据各所述用户语音对应的唤醒场景,将所述语音特征信息中包括的所述用户语音的唤醒置信度,划分为不同唤醒场景下的唤醒置信度;分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值;根据不同唤醒场景下的第二平均值,得到所述目标用户在不同唤醒场景下对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的音量大小;所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:根据各所述用户语音对应的音量大小,查询各所述用户语音的音量加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和音量加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的环境吵杂度;所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:根据各所述用户语音对应的环境吵杂度,查询各所述用户语音的环境加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和环境加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述获取目标用户的多个用户语音对应的唤醒评定信息,包括:获取超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音对应的唤醒评定信息,得到所述多个用户语音对应的唤醒评定信息,所述疑似语音唤醒阈值小于所述语音唤醒模型对应的预定语音唤醒阈值。

在本申请的一些实施例中,在所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值之后,所述方法还包括:接收所述目标用户针对目标设备的唤醒语音;采用所述语音唤醒模型对所述唤醒语音进行分析处理,得到所述唤醒语音对应的唤醒置信度;若所述唤醒语音对应的唤醒置信度大于或等于所述用户语音唤醒阈值,则唤醒所述目标设备。

根据本申请的一个实施例,一种设备唤醒装置,所述装置包括:获取模块,用于获取目标用户的多个用户语音对应的唤醒评定信息;提取模块,用于从所述多个用户语音对应的唤醒评定信息中,提取至少包括各所述用户语音的唤醒置信度的语音特征信息,所述唤醒置信度为语音唤醒模型对用户语音分析得到的;分析模块,用于对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,所述用户语音唤醒阈值用于判断是否根据所述目标用户的唤醒语音进行设备唤醒。

在本申请的一些实施例中,所述分析模块,用于:对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值;根据所述第一平均值,得到所述目标用户对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的唤醒场景;所述分析模块,用于:根据各所述用户语音对应的唤醒场景,将所述语音特征信息中包括的所述用户语音的唤醒置信度,划分为不同唤醒场景下的唤醒置信度;分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值;根据不同唤醒场景下的第二平均值,得到所述目标用户在不同唤醒场景下对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的音量大小;所述分析模块,用于:根据各所述用户语音对应的音量大小,查询各所述用户语音的音量加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和音量加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的环境吵杂度;所述分析模块,用于:根据各所述用户语音对应的环境吵杂度,查询各所述用户语音的环境加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和环境加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述获取模块,用于:获取超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音对应的唤醒评定信息,得到所述多个用户语音对应的唤醒评定信息,所述疑似语音唤醒阈值小于所述语音唤醒模型对应的预定语音唤醒阈值。

在本申请的一些实施例中,在所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值之后,所述装置还包括唤醒模块,用于:接收所述目标用户针对目标设备的唤醒语音;采用所述语音唤醒模型对所述唤醒语音进行分析处理,得到所述唤醒语音对应的唤醒置信度;若所述唤醒语音对应的唤醒置信度大于或等于所述用户语音唤醒阈值,则唤醒所述目标设备。

根据本申请的另一实施例,一种存储介质,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行本申请实施例所述的方法。

根据本申请的另一实施例,一种电子设备可以包括:存储器,存储有计算机程序;处理器,读取存储器存储的计算机程序,以执行本申请实施例所述的方法。

根据本申请的另一实施例,一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例所述的各种可选实现方式中提供的方法。

本申请实施例中,获取目标用户的多个用户语音对应的唤醒评定信息;从所述多个用户语音对应的唤醒评定信息中,提取至少包括各所述用户语音的唤醒置信度的语音特征信息,所述唤醒置信度为语音唤醒模型对用户语音分析得到的;对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,所述用户语音唤醒阈值用于判断是否根据所述目标用户的唤醒语音进行设备唤醒。

以这种方式,针对目标用户,收集该目标用户多个用户语音对应的包括唤醒置信度的语音特征信息,对收集的信息进行分析得到目标用户对应的用户语音唤醒阈值,动态生成能更好匹配该目标用户的唤醒阈值,达到一用户一阈值的定制效果,进而,该目标用户使用语音进行设备唤醒时,该用户语音唤醒阈值更符合用户实际情况,可以有效提升设备的语音唤醒效果,提升用户的体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了根据本申请的一个实施例的设备唤醒方法的流程图。

图2示出了根据本申请的一个实施例的设备唤醒装置的框图。

图3示出了根据本申请的一个实施例的电子设备的框图。

具体实施方式

以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本公开,并不用于限定本公开。另外,以下所提供的实施例是用于实施本公开的部分实施例,而非提供实施本公开的全部实施例,在不冲突的情况下,本公开实施例记载的技术方案可以任意组合的方式实施。

需要说明的是,在本公开实施例中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其他要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元,例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。

例如,本公开实施例提供的设备唤醒方法包含了一系列的步骤,但是本公开实施例提供的设备唤醒方法不限于所记载的步骤,同样地,本公开实施例提供的设备唤醒装置包括了一系列单元,但是本公开实施例提供的装置不限于包括所明确记载的单元,还可以包括为获取相关信息、或基于信息进行处理时所需要设置的单元。

除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本公开。

图1示意性示出了根据本申请的一个实施例的设备唤醒方法的流程图。该设备唤醒方法的执行主体可以是任意具有处理能力的设备或服务器,设备例如电脑、手机、智能手表以及家电设备等,服务器例如云端服务器或物理服务器等。

如图1所示,该设备唤醒方法可以包括步骤S110至步骤S130。

步骤S110,获取目标用户的多个用户语音对应的唤醒评定信息;步骤S120,从所述多个用户语音对应的唤醒评定信息中,提取至少包括各所述用户语音的唤醒置信度的语音特征信息,所述唤醒置信度为语音唤醒模型对用户语音分析得到的;步骤S130,对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,所述用户语音唤醒阈值用于判断是否根据所述目标用户的唤醒语音进行设备唤醒。

针对目标用户,可以获取的多个用户语音中各用户语音对应的唤醒评定信息,用户语音对应的唤醒评定信息可以包括用户语音对应的唤醒置信度、唤醒场景、及音量大小等信息。其中,语音唤醒模型可以针对多个用户语音分别进行分析,得到每个用户语音对应的唤醒置信度。

从收集多个用户语音对应的唤醒评定信息中,可以提取需要的唤醒置信度等信息,得到至少包括各用户语音的唤醒置信度的语音特征信息。对至少包括各用户语音的唤醒置信度的语音特征信息进行分析处理,得到目标用户对应的个性化的用户语音唤醒阈值。

该用户语音唤醒阈值可以用于判断是否根据目标用户的唤醒语音进行设备唤醒,例如,接收到该目标用户的唤醒语音后,可以将该唤醒语音的音频数据输入前述的语音唤醒模型进行分析,得到语音唤醒模型输出的该唤醒语音对应的唤醒置信度,若该唤醒语音对应的唤醒置信度大于该用户语音唤醒阈值,则可以唤醒该唤醒语音需要唤醒的设备。

以这种方式,基于步骤S110至步骤S130,针对目标用户,收集该目标用户多个用户语音对应的包括唤醒置信度的语音特征信息,对收集的信息进行分析得到目标用户对应的用户语音唤醒阈值,动态生成能更好匹配该目标用户的唤醒阈值,达到一用户一阈值的定制效果,进而,该目标用户使用语音进行设备唤醒时,该用户语音唤醒阈值更符合用户实际情况,可以有效提升设备的语音唤醒效果,提升用户的体验。

下面描述图1实施例下进行设备唤醒时,所进行的各步骤下进一步可选的具体实施例。

一种实施例中,所述获取目标用户的多个用户语音对应的唤醒评定信息,包括:获取超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音对应的唤醒评定信息,得到所述多个用户语音对应的唤醒评定信息,所述疑似语音唤醒阈值小于所述语音唤醒模型对应的预定语音唤醒阈值。

语音唤醒模型可以针对目标用户的语音分别进行分析,得到目标用户的对应的唤醒置信度,若某个语音对应的唤醒置信度大于或等于疑似语音唤醒阈值,则才将该某个语音为超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音。

例如,疑似语音唤醒阈值小于语音唤醒模型对应的预定语音唤醒阈值,例如,算法预制的预定语音唤醒阈值WakeupV为90,疑似语音唤醒阈值mWakeupV为80,则某个语音的唤醒置信度大于或等于80时,会获取该某个语音的唤醒评定信息。

疑似语音唤醒阈值可以根据实际情况设定,获取超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音对应的唤醒评定信息,可以进一步提升分析得到的用户语音唤醒阈值的准确性。

一种实施例中,所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,包括:

对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值;根据所述第一平均值,得到所述目标用户对应的用户语音唤醒阈值。

例如,多个用户语音的数量为100个,计算该100个用户语音的唤醒置信度的平均值,得到的平均值即该第一平均值。

根据第一平均值,得到目标用户对应的用户语音唤醒阈值,具体可以包括:若该第一平均值大于或等于语音唤醒模型对应的预定语音唤醒阈值,则将预定语音唤醒阈值作为最终的目标用户对应的用户语音唤醒阈值;若该第一平均值小于语音唤醒模型对应的预定语音唤醒阈值,则将第一平均值作为目标用户对应的用户语音唤醒阈值。

进一步的,一种实施方式中,所述语音特征信息还包括各所述用户语音对应的音量大小;所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:根据各所述用户语音对应的音量大小,查询各所述用户语音的音量加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和音量加权系数求加权平均,得到所述第一平均值。

具体地,该实施方式下,可以根据公式Y1=(A1*X1+A2*X2+...+An*Xn)/n,计算得到第一平均值,其中,Y1为第一平均值,A1至An分别为各用户语音对应的唤醒置信度,X1至Xn分别为各用户语音对应的音量加权系数。

该实施方式下,进一步考虑不同用户语音的音量大小获得用户语音唤醒阈值,进一步提升计算得到的用户语音唤醒阈值的准确性,提升唤醒效果。

进一步的,一种实施方式中,所述语音特征信息还包括各所述用户语音对应的环境吵杂度;所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:

根据各所述用户语音对应的环境吵杂度,查询各所述用户语音的环境加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和环境加权系数求加权平均,得到所述第一平均值。

具体地,该实施方式下,可以根据公式Y1=(A1*M1+A2*M2+...+An*Mn)/n,计算得到第一平均值,其中,Y1为第一平均值,A1至An分别为各用户语音对应的唤醒置信度,M1至Mn分别为各用户语音对应的环境加权系数。其中,环境吵杂度可以反映语音中含杂音程度,环境吵杂度越高则语音中含杂音程度越高。

该实施方式下,进一步考虑不同用户语音的环境吵杂度获得用户语音唤醒阈值,也可以进一步提升计算得到的用户语音唤醒阈值的准确性,提升唤醒效果。

进一步的,一种实施方式中,所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:根据公式Y1=(A1+A2+...+An)/n,计算得到第一平均值,其中,Y1为第一平均值,A1至An分别为各用户语音对应的唤醒置信度。

一种实施例中,所述语音特征信息还包括各所述用户语音对应的唤醒场景;所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,包括:根据各所述用户语音对应的唤醒场景,将所述语音特征信息中包括的所述用户语音的唤醒置信度,划分为不同唤醒场景下的唤醒置信度;分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值;根据不同唤醒场景下的第二平均值,得到所述目标用户在不同唤醒场景下对应的用户语音唤醒阈值。

不同的唤醒场景可以根据实际情况进行划分。例如,按照场所进行划分,不同的唤醒场景可以是家居、工厂或办公室等等,或者,按照人员数量进行划分,不同的唤醒场景可以是大流量场所、中流量场所或小流量场所等等。

根据各用户语音对应的唤醒场景,将语音特征信息中包括的用户语音的唤醒置信度,划分为不同唤醒场景下的唤醒置信度。分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值。

根据不同唤醒场景下的第二平均值,可以得到目标用户在不同唤醒场景下对应的用户语音唤醒阈值,具体可以包括:若某个唤醒场景下的第二平均值大于或等于语音唤醒模型对应的预定语音唤醒阈值,则将预定语音唤醒阈值作为最终的目标用户在某个唤醒场景下对应的用户语音唤醒阈值;若某个唤醒场景下的第二平均值小于语音唤醒模型对应的预定语音唤醒阈值,则将第二平均值作为目标用户在该某个唤醒场景下对应的用户语音唤醒阈值。

进一步的,一种实施方式中,所述语音特征信息还包括各所述用户语音对应的音量大小;所述分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值,包括:在各唤醒场景下,根据唤醒场景下各所述用户语音对应的音量大小,查询各所述用户语音的音量加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和音量加权系数求加权平均,得到唤醒场景下的第二平均值。

进一步的,一种实施方式中,所述语音特征信息还包括各所述用户语音对应的环境吵杂度;所述分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值,包括:在各唤醒场景下,根据唤醒场景下各所述用户语音对应的环境吵杂度,查询各所述用户语音的环境加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和环境加权系数求加权平均,得到唤醒场景下的第二平均值。

进一步的,一种实施方式中,所述分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值,包括:在各唤醒场景下,根据公式Y2=(B1+B2+...+Bn)/n,计算得到唤醒场景下的第二平均值,其中,Y2为唤醒场景下的第二平均值,B1至Bn分别为唤醒场景下的各用户语音对应的唤醒置信度。

一种实施例中,在所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值之后,所述方法还包括:接收所述目标用户针对目标设备的唤醒语音;采用所述语音唤醒模型对所述唤醒语音进行分析处理,得到所述唤醒语音对应的唤醒置信度;若所述唤醒语音对应的唤醒置信度大于或等于所述用户语音唤醒阈值,则唤醒所述目标设备。

接收到该目标用户的唤醒语音后,可以将该唤醒语音的音频数据输入前述的语音唤醒模型进行分析,得到语音唤醒模型输出的该唤醒语音对应的唤醒置信度,若该唤醒语音对应的唤醒置信度大于该用户语音唤醒阈值,则可以唤醒该唤醒语音需要唤醒的设备。

动态生成能更好匹配该目标用户的唤醒阈值,达到一用户一阈值的定制效果,进而,该目标用户使用语音进行设备唤醒时,该用户语音唤醒阈值更符合用户实际情况,设备的语音唤醒效果良好。

为便于更好的实施本申请实施例提供的设备唤醒方法,本申请实施例还提供一种基于上述设备唤醒方法的设备唤醒装置。其中名词的含义与上述设备唤醒方法中相同,具体实现细节可以参考方法实施例中的说明。图2示出了根据本申请的一个实施例的设备唤醒装置的框图。

如图2所示,设备唤醒装置200中可以包括:获取模块210可以用于获取目标用户的多个用户语音对应的唤醒评定信息;提取模块220可以用于从所述多个用户语音对应的唤醒评定信息中,提取至少包括各所述用户语音的唤醒置信度的语音特征信息,所述唤醒置信度为语音唤醒模型对用户语音分析得到的;分析模块230可以用于对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,所述用户语音唤醒阈值用于判断是否根据所述目标用户的唤醒语音进行设备唤醒。

在本申请的一些实施例中,所述分析模块,用于:对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值;根据所述第一平均值,得到所述目标用户对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的唤醒场景;所述分析模块,用于:根据各所述用户语音对应的唤醒场景,将所述语音特征信息中包括的所述用户语音的唤醒置信度,划分为不同唤醒场景下的唤醒置信度;分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值;根据不同唤醒场景下的第二平均值,得到所述目标用户在不同唤醒场景下对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的音量大小;所述分析模块,用于:根据各所述用户语音对应的音量大小,查询各所述用户语音的音量加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和音量加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的环境吵杂度;所述分析模块,用于:根据各所述用户语音对应的环境吵杂度,查询各所述用户语音的环境加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和环境加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述获取模块,用于:获取超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音对应的唤醒评定信息,得到所述多个用户语音对应的唤醒评定信息,所述疑似语音唤醒阈值小于所述语音唤醒模型对应的预定语音唤醒阈值。

在本申请的一些实施例中,在所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值之后,所述装置还包括唤醒模块,用于:接收所述目标用户针对目标设备的唤醒语音;采用所述语音唤醒模型对所述唤醒语音进行分析处理,得到所述唤醒语音对应的唤醒置信度;若所述唤醒语音对应的唤醒置信度大于或等于所述用户语音唤醒阈值,则唤醒所述目标设备。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外,本申请实施例还提供一种电子设备,如图3所示,其示出了本申请实施例所涉及的电子设备的结构示意图,具体来讲:

该电子设备可以包括一个或者一个以上处理核心的处理器301、一个或一个以上计算机可读存储介质的存储器302、电源303和输入单元304等部件。本领域技术人员可以理解,图3中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

其中:

处理器301是该电子设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器302内的软件程序和/或模块,以及调用存储在存储器302内的数据,执行计算机设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器301可包括一个或多个处理核心;优选的,处理器301可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户页面和应用程序等,调制解调处理器主要处理无线通讯。可以理解的是,上述调制解调处理器也可以不集成到处理器301中。

存储器302可用于存储软件程序以及模块,处理器301通过运行存储在存储器302的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器302还可以包括存储器控制器,以提供处理器301对存储器302的访问。

电子设备还包括给各个部件供电的电源303,优选的,电源303可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源303还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

具体在本实施例中,电子设备中的处理器301会按照如下的指令,将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器302中,并由处理器301来运行存储在存储器302中的计算机程序,从而实现本申请前述实施例中各种功能,如处理器301可以执行下述步骤:

获取目标用户的多个用户语音对应的唤醒评定信息;从所述多个用户语音对应的唤醒评定信息中,提取至少包括各所述用户语音的唤醒置信度的语音特征信息,所述唤醒置信度为语音唤醒模型对用户语音分析得到的;对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,所述用户语音唤醒阈值用于判断是否根据所述目标用户的唤醒语音进行设备唤醒。

在本申请的一些实施例中,所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,包括:对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值;根据所述第一平均值,得到所述目标用户对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的唤醒场景;所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值,包括:根据各所述用户语音对应的唤醒场景,将所述语音特征信息中包括的所述用户语音的唤醒置信度,划分为不同唤醒场景下的唤醒置信度;分别对不同唤醒场景下的唤醒置信度求平均,分别得到不同唤醒场景下的第二平均值;根据不同唤醒场景下的第二平均值,得到所述目标用户在不同唤醒场景下对应的用户语音唤醒阈值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的音量大小;所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:根据各所述用户语音对应的音量大小,查询各所述用户语音的音量加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和音量加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述语音特征信息还包括各所述用户语音对应的环境吵杂度;所述对所述语音特征信息中包括的所述用户语音的唤醒置信度的求平均,得到第一平均值,包括:根据各所述用户语音对应的环境吵杂度,查询各所述用户语音的环境加权系数;对所述语音特征信息中包括的所述用户语音对应的唤醒置信度和环境加权系数求加权平均,得到所述第一平均值。

在本申请的一些实施例中,所述获取目标用户的多个用户语音对应的唤醒评定信息,包括:获取超过唤醒置信度大于或等于疑似语音唤醒阈值的用户语音对应的唤醒评定信息,得到所述多个用户语音对应的唤醒评定信息,所述疑似语音唤醒阈值小于所述语音唤醒模型对应的预定语音唤醒阈值。

在本申请的一些实施例中,在所述对所述语音特征信息进行分析处理,得到所述目标用户对应的用户语音唤醒阈值之后,还包括:接收所述目标用户针对目标设备的唤醒语音;采用所述语音唤醒模型对所述唤醒语音进行分析处理,得到所述唤醒语音对应的唤醒置信度;若所述唤醒语音对应的唤醒置信度大于或等于所述用户语音唤醒阈值,则唤醒所述目标设备。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本申请实施例还提供一种存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种方法中的步骤。

其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种方法中的步骤,因此,可以实现本申请实施例所提供的方法所能实现的有益效果,详见前面的实施例,在此不再赘述。

本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的实施例,而可以在不脱离其范围的情况下进行各种修改和改变。

相关技术
  • 智能泄漏气体检测及防泄漏的装置、方法和计算机可读存储介质
  • 预付费射频卡与电能表数据交互过程检测装置及检测方法
  • 一种基于阵列天线实时检测微波泄漏的装置及方法
  • 一种基于FPGA的数据交互方法及装置
  • 基于业务时序特征分析的数据交互防泄漏检测方法及装置
  • 基于特征分析的防欺诈检测方法、装置、设备及存储介质
技术分类

06120116538895