掌桥专利:专业的专利平台
掌桥专利
首页

唤醒模型迭代方法、装置、存储介质及电子装置

文献发布时间:2024-04-18 20:01:23


唤醒模型迭代方法、装置、存储介质及电子装置

技术领域

本申请涉及智能家居/智慧家庭技术领域,具体而言,涉及一种唤醒模型迭代方法、装置、存储介质及电子装置。

背景技术

随着智能科技的兴起,各种家用电器一直朝着智能化的方向发展。例如,用户可以通过语音唤醒的方式对家用电器进行控制。

现有的语音唤醒模型应用在家用电器上时,受限于家用电器上的硬件资源限制,往往使用的模型结构都比较简单,性能较差,无法满足不同用户在不用场景下的需要,用户的使用体验较差。

发明内容

本申请提供一种唤醒模型迭代方法、装置、存储介质及电子装置,以解决现有的语音唤醒模型性能较差,无法满足不同用户在不用场景下的需要,用户的使用体验较差的技术问题。

本申请提供一种唤醒模型迭代方法,包括:

确定第一唤醒模型;所述第一唤醒模型与目标设备中的第二唤醒模型相同;

基于获取到的用户唤醒数据集对所述第一唤醒模型进行优化训练,得到所述第一唤醒模型的优化参数;所述用户唤醒数据集是基于唤醒关键词对所述目标设备中第二唤醒模型识别到的唤醒语音数据进行准确性校验后确定的;

将所述优化参数发送至所述目标设备,以使所述目标设备基于所述优化参数对所述第二唤醒模型进行优化迭代。

根据本申请提供的唤醒模型迭代方法,所述用户唤醒数据集是基于如下步骤确定的:

接收目标设备发送的第二唤醒模型识别到的唤醒语音数据;

将所述唤醒语音数据输入唤醒语音校验模型,由所述唤醒语音校验模型基于唤醒关键词确定所述唤醒语音数据对应的准确性校验结果;

基于所述唤醒语音数据,以及所述唤醒语音数据对应的准确性校验结果,确定所述用户唤醒数据集。

根据本申请提供的唤醒模型迭代方法,所述唤醒语音校验模型的神经网络层数大于所述第二唤醒模型的神经网络层数,和/或,所述唤醒语音校验模型中神经网络层的神经元数量大于所述第二唤醒模型中神经网络层的神经元数量。

根据本申请提供的唤醒模型迭代方法,所述用户唤醒数据集是基于如下步骤扩增的:

接收各个候选设备发送的网络地址;所述候选设备与所述目标设备的设备类型相同;

基于各个候选设备的网络地址,确定各个候选设备的地理位置;

基于各个候选设备的地理位置,确定各个候选设备的唤醒语言类别;

将与所述目标设备的唤醒语言类别相同的候选设备发送的唤醒语音数据,增加至所述用户唤醒数据集。

根据本申请提供的唤醒模型迭代方法,所述基于获取到的用户唤醒数据集对所述第一唤醒模型进行优化训练,得到所述第一唤醒模型的优化参数,包括:

确定基础训练数据集和基础测试数据集;

基于所述基础训练数据集和所述用户唤醒数据集中的训练数据集,对所述第一唤醒模型进行训练;

基于所述基础测试数据集和所述用户唤醒数据集中的测试数据集,分别对训练前的第一唤醒模型和训练后的第一唤醒模型进行测试,确定所述第一唤醒模型的训练前识别准确率和训练后识别准确率;

在所述训练后识别准确率与所述训练前识别准确率之差大于或等于预设差值的情况下,将训练后的第一唤醒模型中的模型参数确定为所述第一唤醒模型的优化参数。

根据本申请提供的唤醒模型迭代方法,所述将所述优化参数发送至所述目标设备,包括:

向所述目标设备发送包含所述优化参数的模型迭代指令,并将所述第二唤醒模型的当前模型参数保存为历史模型参数;

接收所述目标设备发送的所述历史模型参数对应的识别成功率和所述优化参数对应的识别成功率;所述识别成功率是基于所述目标设备接收到的语音数据数量和识别的唤醒语音数据数量确定的;

在所述优化参数对应的识别成功率低于所述历史模型参数对应的识别成功率的情况下,向所述目标设备发送包含历史模型参数的模型迭代指令。

根据本申请提供的唤醒模型迭代方法,所述确定第一唤醒模型,包括:

确定所述用户唤醒数据集中唤醒语音数据的数量;

在唤醒语音数据的数量大于或等于预设数量的情况下,向所述目标设备发送模型参数获取指令;

接收所述目标设备基于所述模型参数获取指令发送的所述第二唤醒模型的当前模型参数;

基于所述当前模型参数,以及所述第二唤醒模型的模型结构,构建所述第一唤醒模型。

本申请提供一种唤醒模型迭代装置,包括:

确定单元,用于确定第一唤醒模型;所述第一唤醒模型与目标设备中的第二唤醒模型相同;

训练单元,用于基于获取到的用户唤醒数据集对所述第一唤醒模型进行优化训练,得到所述第一唤醒模型的优化参数;所述用户唤醒数据集是基于唤醒关键词对所述目标设备中第二唤醒模型识别到的唤醒语音数据进行准确性校验后确定的;

迭代单元,用于将所述优化参数发送至所述目标设备,以使所述目标设备基于所述优化参数对所述第二唤醒模型进行优化迭代。

本申请提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述的唤醒模型迭代方法。

本申请提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述的唤醒模型迭代方法。

本申请提供的唤醒模型迭代方法、装置、存储介质及电子装置,确定第一唤醒模型;第一唤醒模型与目标设备中的第二唤醒模型相同;根据用户唤醒数据集对第一唤醒模型进行训练,得到第一唤醒模型的优化参数;将优化参数发送至目标设备,以使目标设备根据优化参数对第二唤醒模型进行迭代;通过在远程服务器中设置与目标设备中的唤醒模型相同的模型,将优化训练后的参数发送至目标设备,实现了目标设备中的唤醒模型的参数迭代,无需消耗目标设备的硬件资源,由于用户唤醒数据集是经过准确性校验后确定的,具有更高的可信度,包含了目标设备对应的用户的语音特性,使得采用优化参数迭代后的唤醒模型具有较高的识别准确率,而且更能够贴近用户的使用习惯,提高了用户的使用体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请提供的唤醒模型迭代方法的流程示意图之一;

图2是本申请提供的唤醒模型迭代方法的流程示意图之二;

图3是本申请提供的唤醒模型迭代装置的结构示意图;

图4是本申请提供的唤醒模型迭代方法的硬件环境示意图;

图5是本申请提供的电子装置的结构示意图。

附图标记:

401:终端设备;402:服务器。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1是本申请提供的唤醒模型迭代方法的流程示意图之一,如图1所示,该方法包括步骤110、步骤120和步骤130。

步骤110、确定第一唤醒模型;第一唤醒模型与目标设备中的第二唤醒模型相同。

具体地,本申请实施例提供的唤醒模型迭代方法的执行主体为唤醒模型迭代装置。该装置可以通过软件形式体现,运行于智能家电远程监控服务器;也可以为远程监控服务器中的硬件模块。智能家电远程监控服务器为云端服务器。

目标设备可以为在家庭场景中使用的各类家电设备,即具有网络通信模块,能够接入互联网或者物联网,能够发送自身运行状态,接收并执行远程控制指令的各类家电设备,包括智能音箱、智能空调、智能冰箱、智能电视、智能浴霸、智能灯具和智能开关等。

语音唤醒,为在连续的语音流中检测特定的关键词并通过这些关键词来触发设备进行特定的运行状态。例如,用户可以通过语音发出“空调开机”,则在休眠状态或者待机状态下的智能空调检测到用户的语音,并识别得到“空调开机”时,触发智能空调内部的压缩机等开始运行,进入工作状态。

语音唤醒是通过在目标设备中的唤醒模型来实现的。唤醒模型可以根据神经网络模型等实现。例如,唤醒模型可以是以神经网络模型为初始模型,采用唤醒语音和唤醒语音标签进行训练后得到的模型。

第一唤醒模型运行于智能家电远程监控服务器中,第二唤醒模型运行于目标设备中,两个唤醒模型完全相同,即模型结构和模型参数完全相同。

第二唤醒模型运行于目标设备中,目标设备可以通过与智能家电远程监控服务器进行通信,将第二唤醒模型的模型参数直接发送至智能家电远程监控服务器。智能家电远程监控服务器根据接收到的模型参数和第二唤醒模型的模型结构,可以构建第一唤醒模型。

步骤120、基于用户唤醒数据集对第一唤醒模型进行训练,得到第一唤醒模型的优化参数。其中,用户唤醒数据集是基于唤醒关键词对目标设备中第二唤醒模型识别到的唤醒语音数据进行准确性校验后确定的。

具体地,唤醒语音数据是经过目标设备中的第二唤醒模型对用户发出的语音识别后得到的语音数据,是被第二唤醒模型确定为可以实现唤醒目标设备的语音数据。由于目标设备的硬件资源限制,第二唤醒模型的模型结构相对简单,模型参数相对较少,因此,识别得到的唤醒语音数据中可能存在误识别的唤醒语音数据。

因此,可以对目标设备中第二唤醒模型识别的唤醒语音数据进行准确性校验。准确性校验的方法可以通过在智能家电远程监控服务器中设置模型结构相对复杂和/或模型参数相对较多的校验模型。通过采用大量的样本唤醒语音数据和样本唤醒语音数据的样本标签,对校验模型进行训练。

根据目标设备发送的并进行准确性校验的唤醒语音数据,可以构建用户唤醒数据集。根据用户唤醒数据集对第一唤醒模型进行训练,可以得到第一唤醒模型的优化参数。

由于用户唤醒数据集是经过准确性校验后确定的,具有更高的可信度,能够提高第一唤醒模型的识别准确率;由于用户唤醒数据集是目标设备发送的,第一唤醒模型可以学习到目标设备对应的用户的语音特性,例如用户的说话习惯、发音习惯,以及用户所处的使用场景等。因此,训练后的第一唤醒模型不仅具有较高的识别准确率,而且更能够贴近用户的使用习惯,实现为用户量身打造的技术效果。

可以根据唤醒关键词对第二唤醒模型识别到的唤醒语音数据进行准确性校验。唤醒关键词可以根据需要进行设置。如果唤醒语音数据的语音识别结果与唤醒关键词相似度大于预设相似度阈值,可以确定准确性校验结果为准确;如果唤醒语音数据的语音识别结果与唤醒关键词相似度小于预设相似度阈值,可以确定准确性校验结果为不准确。

步骤130、将优化参数发送至目标设备,以使目标设备基于优化参数对第二唤醒模型进行优化迭代。

具体地,唤醒模型迭代装置可以将第一唤醒模型的优化参数导出,并发送至目标设备。目标设备在接收到优化参数,对第二唤醒模型进行参数迭代,即实现了对第二唤醒模型进行参数更新。

上述唤醒模型迭代方法可以按照时间周期触发执行,例如可以设定预设时间周期触发执行,预设时间周期可以为1个月、6个月或者12个月等;也可以按照用户唤醒数据集中唤醒语音数据的数量触发执行,例如可以设定唤醒语音数据的数量达到预设数量时触发执行,预设数量可以为100、500或者1000等。

本申请实施例提供的唤醒模型迭代方法,确定第一唤醒模型;第一唤醒模型与目标设备中的第二唤醒模型相同;根据用户唤醒数据集对第一唤醒模型进行训练,得到第一唤醒模型的优化参数;将优化参数发送至目标设备,以使目标设备根据优化参数对第二唤醒模型进行迭代;通过在远程服务器中设置与目标设备中的唤醒模型相同的模型,将优化训练后的参数发送至目标设备,实现了目标设备中的唤醒模型的参数迭代,无需消耗目标设备的硬件资源,由于用户唤醒数据集是经过准确性校验后确定的,具有更高的可信度,包含了目标设备对应的用户的语音特性,使得采用优化参数迭代后的唤醒模型具有较高的识别准确率,而且更能够贴近用户的使用习惯,提高了用户的使用体验。

基于上述实施例,用户唤醒数据集是基于如下步骤确定的:

接收目标设备发送的第二唤醒模型识别到的唤醒语音数据;

将唤醒语音数据输入唤醒语音校验模型,由唤醒语音校验模型基于唤醒关键词确定唤醒语音数据对应的准确性校验结果;

基于唤醒语音数据,以及唤醒语音数据对应的准确性校验结果,确定用户唤醒数据集。

具体地,目标设备可以将第二唤醒模型识别的唤醒语音数据发送至智能家电远程监控服务器。

智能家电远程监控服务器中的唤醒模型迭代装置将唤醒语音数据输入至唤醒语音校验模型,由唤醒语音校验模型对唤醒语音数据中的语音信号进行特征提取,并根据提取的特征识别得到唤醒语音数据对应的语音识别结果,将语音识别结果与唤醒关键词进行对比,确定准确性校验结果。

如果语音识别结果与唤醒关键词相似度大于预设相似度阈值,可以确定准确性校验结果为准确;如果语音识别结果与唤醒关键词相似度小于预设相似度阈值,可以确定准确性校验结果为不准确。

根据多个唤醒语音数据,以及每个唤醒语音数据对应的准确性校验结果,可以建立用户唤醒数据集。

准确性校验结果为正确的唤醒语音数据,可以作为用户唤醒数据集中的正样本,准确性校验结果为不正确的唤醒语音数据,可以作为用户唤醒数据集中的负样本,通过正负样本对唤醒模型进行优化训练,可以提高唤醒模型的识别准确率。

基于上述任一实施例,唤醒语音校验模型的神经网络层数大于第二唤醒模型的神经网络层数,和/或,唤醒语音校验模型中神经网络层的神经元数量大于第二唤醒模型中神经网络层的神经元数量。

具体地,可以将唤醒语音校验模型部署于智能家电远程监控服务器中。由于服务器的硬件配置远高于目标设备,因此,唤醒语音校验模型可以选择具有复杂结构的神经网络。

相比于第二唤醒模型,唤醒语音校验模型具有更多的神经网络层数,或者,各个神经网络层中具有更多的神经元数量。神经网络层数越多,神经元越多,模型结构越复杂,模型对于特征的学习能力越强,相应地,识别准确率越高。

例如,唤醒语音校验模型可以包括依次连接的特征提取层、特征识别层、特征比较层。特征提取层用于对唤醒语音数据进行语音特征提取,语音特征可以包括时域特征和频域特征等。特征识别层用于根据提取的语音特征进行识别,得到唤醒语音数据对应的识别文本。特征比较层用于将识别文本与唤醒关键词进行相似度比较,根据相似度比较结果输出准确性校验结果。其中,各个层可以采用全连接层的网络结构,包含的神经元数量可以根据需要进行设置。

基于上述任一实施例,用户唤醒数据集是基于如下步骤扩增的:

接收各个候选设备发送的网络地址;候选设备与目标设备的设备类型相同;

基于各个候选设备的网络地址,确定各个候选设备的地理位置;

基于各个候选设备的地理位置,确定各个候选设备的唤醒语言类别;

将与目标设备的唤醒语言类别相同的候选设备发送的唤醒语音数据,增加至用户唤醒数据集。

具体地,为了提高用户唤醒数据集的训练效果,可以对用户唤醒数据集的数量进行扩增。

可以将与目标设备的设备类型相同的设备作为候选设备。由于候选设备的设备类型与目标设备相同,其硬件配置和软件配置均相似或者相同,具有参考价值。

由于各个候选设备均与智能家电远程监控服务器通过网络连接,智能家电远程监控服务器获取各个候选设备的网络地址(例如IP地址),根据网络地址的归属地确定各个候选设备的地理位置。根据各个候选设备的地理位置,确定各个候选设备的唤醒语言类别。例如,对属于同一国别的候选设备,其唤醒语音类型可以为同一种语言,例如英语、德语和日语等;对属于同一行政区域的候选设备,其唤醒语言类型可以为同一种方言,例如四川话、广东话和福建话等。

与目标设备的唤醒语言类别相同的候选设备发送的唤醒语音数据可能具有相同的语音特征,因此可以用来扩增用户唤醒数据集。例如对于相同的唤醒关键词,同一语言或者同一语系的语音特征较为相似。

采用扩增后的用户唤醒数据集对唤醒模型进行训练,能够提高唤醒模型的鲁棒性。

基于上述任一实施例,步骤120包括:

确定基础训练数据集和基础测试数据集;

基于基础训练数据集和用户唤醒数据集中的训练数据集,对第一唤醒模型进行训练;

基于基础测试数据集和用户唤醒数据集中的测试数据集,分别对训练前的第一唤醒模型和训练后的第一唤醒模型进行测试,确定第一唤醒模型的训练前识别准确率和训练后识别准确率;

在训练后识别准确率与训练前识别准确率之差大于或等于预设差值时,将训练后的第一唤醒模型中的模型参数确定为第一唤醒模型的优化参数。

具体地,可以按照一定的分配比例,将用户唤醒数据集分为训练数据集和测试数据集。分配比例可以根据需要进行确定。

基础训练数据集和基础测试数据集均是根据标准语音建立的语音样本集。

如果仅仅采用用户唤醒数据集进行训练和测试,由于用户唤醒数据集是目标设备采集的用户数据,目标设备对应的用户可能不止一个,各个用户之间的发音差异可能较大,全部采用用户数据,可能使得唤醒模型过拟合。因此,可以将基础训练数据集和用户唤醒数据集中的训练数据集合并,对第一唤醒模型进行优化训练。

在训练后,将基础测试数据集和用户唤醒数据集中的测试数据集合并,对训练后的第一唤醒模型进行测试,确定第一唤醒模型的训练后识别准确率。作为对照,还可以对训练前的第一唤醒模型进行测试,确定第一唤醒模型的训练前识别准确率。

可以设置预设差值,用于衡量训练后识别准确率与训练前识别准确率之间的差异,即第一唤醒模型的识别准确率提高的程度。

如果训练后识别准确率与训练前识别准确率之差小于预设差值,表明优化训练对识别准确率提高的程度较低,无需进行参数迭代;如果训练后识别准确率与训练前识别准确率之差大于或等于预设差值,表明优化训练对识别准确率提高的程度较高,可以进行参数迭代,则将训练后的第一唤醒模型中的模型参数确定为第一唤醒模型的优化参数。

基于上述任一实施例,目标设备是基于如下步骤对第二唤醒模型进行迭代的:

接收优化参数;

将第二唤醒模型的当前模型参数保存为历史模型参数,并将优化参数迭代为第二唤醒模型的当前模型参数;

基于迭代后的第二唤醒模型对用户发出的语音数据进行识别,在识别成功的情况下,将语音数据确定为唤醒语音数据;

确定接收到的语音数据数量和识别的唤醒语音数据数量,并基于语音数据数量和唤醒语音数据数量,确定当前模型参数对应的识别成功率;

在当前模型参数对应的识别成功率低于历史模型参数对应的识别成功率的情况下,将历史模型参数确定为第二唤醒模型的当前模型参数。

具体地,目标设备在接收到优化参数后,将第二唤醒模型正在使用的当前模型参数保存为历史模型参数,并将优化参数导入,对第二唤醒模型进行迭代,作为当前模型参数。

迭代后的第二唤醒模型对用户发出的语音数据进行识别,在识别成功的情况下,将语音数据确定为唤醒语音数据。同时,目标设备还在迭代后的一定的时间范围内对接收到的语音数据和唤醒语音数据数量进行统计,并根据语音数据数量和唤醒语音数据数量,确定当前模型参数对应的识别成功率。例如,识别成功率可以为唤醒语音数据数量与语音数据数量的比值。

将当前模型参数对应的识别成功率与历史模型参数对应的识别成功率进行比较,如果当前模型参数对应的识别成功率高于历史模型参数对应的识别成功率,表明在第二唤醒模型进行参数迭代后,能够给用户提供更好的唤醒服务;如果当前模型参数对应的识别成功率低于历史模型参数对应的识别成功率,表明在第二唤醒模型进行参数迭代后,给用户提供了较差的唤醒服务。在此情况下,可以将历史模型参数确定为第二唤醒模型的当前模型参数,即实现了参数回退操作,使第二唤醒模型回退到之前的状态。

通过将当前模型参数对应的识别成功率与历史模型参数对应的识别成功率进行比较,可以为用户提供更好的使用体验。

基于上述任一实施例,步骤130包括:

向目标设备发送包含优化参数的模型迭代指令,并将第二唤醒模型的当前模型参数保存为历史模型参数;

接收目标设备发送的历史模型参数对应的识别成功率和优化参数对应的识别成功率;识别成功率是基于目标设备接收到的语音数据数量和识别的唤醒语音数据数量确定的;

在优化参数对应的识别成功率低于历史模型参数对应的识别成功率的情况下,向目标设备发送包含历史模型参数的模型迭代指令。

具体地,参数回退操作也可以由远程服务器触发执行。

远程服务器向目标设备发送包含优化参数的模型迭代指令,并把第二唤醒模型的当前模型参数(正在使用但未优化迭代的参数)保存为历史模型参数。

目标设备在本次迭代优化前,可以根据接收到的语音数据数量和识别的唤醒语音数据数量确定历史模型参数对应的识别成功率,并将其发送至远程服务器。

目标设备在接收优化参数后,也可以根据接收到的语音数据数量和识别的唤醒语音数据数量确定优化参数对应的识别成功率,并将其发送至远程服务器。

远程服务器根据迭代前后的识别成功率进行判断,在优化参数对应的识别成功率低于历史模型参数对应的识别成功率的情况下,确定优化参数给用户提供了较差的唤醒服务,因此可以向目标设备发送包含历史模型参数的模型迭代指令,即触发执行参数回退操作。

基于上述任一实施例,步骤110包括:

确定用户唤醒数据集中唤醒语音数据的数量;

在唤醒语音数据的数量大于或等于预设数量的情况下,向目标设备发送模型参数获取指令;

接收目标设备基于模型参数获取指令发送的第二唤醒模型的当前模型参数;

基于当前模型参数,以及第二唤醒模型的模型结构,构建第一唤醒模型。

具体地,频繁的进行迭代优化,将消耗远程监控服务器的硬件资源,也消耗目标设备的硬件资源,对目标设备执行其他任务产生了资源冲突,因此,可以根据唤醒语音数据的数量触发执行参数迭代。

在用户唤醒数据集中唤醒语音数据的数量大于或等于预设数量的情况下,唤醒模型迭代装置向目标设备发送模型参数获取指令,并接收目标设备发送的第二唤醒模型的当前模型参数。

唤醒模型迭代装置根据当前模型参数,以及第二唤醒模型的模型结构,可以在远程监控服务器中构建第一唤醒模型。所构建的第一唤醒模型与第二唤醒模型完全相同。

基于上述任一实施例,图2是本申请提供的唤醒模型迭代方法的流程示意图之二,如图2所示,该方法包括:

步骤210、用户与设备进行语音交互,唤醒模型产生唤醒数据,唤醒数据通过网络上传云端;

步骤220、云端接收到数据后使用更复杂的模型对数据进行校验,判断是唤醒还是误唤醒;

步骤230、对校验后的数据进行处理,根据所需的形式(特征/音频)存储到数据库,按照一定比例划分为训练集和测试集;

步骤240、根据唤醒数据量判断是否达到优化条件;

步骤250、达到优化条件,则开始利用基础训练集与用户数据训练集优化模型,获取终端模型参数,在该模型的基础上进行迭代学习;

步骤260、将优化后模型在基础测试集和积攒的用户数据测试集上测试,与原模型对比,有优化效果则推送到设备端进行迭代,并通知用户有迭代;

步骤270、用户在体验过程中觉得变难用了,可以在设置中回退到设备上保存的前两次模型中的一个自己体验更好的一个。

基于上述任一实施例,图3是本申请提供的唤醒模型迭代装置的结构示意图,如图3所示,该装置包括:

确定单元310,用于确定第一唤醒模型;第一唤醒模型与目标设备中的第二唤醒模型相同;

训练单元320,用于基于获取到的用户唤醒数据集对第一唤醒模型进行优化训练,得到第一唤醒模型的优化参数;用户唤醒数据集是基于唤醒关键词对目标设备中第二唤醒模型识别到的唤醒语音数据进行准确性校验后确定的;

迭代单元330,用于将优化参数发送至目标设备,以使目标设备基于优化参数对第二唤醒模型进行优化迭代。

本申请实施例提供的唤醒模型迭代装置,确定第一唤醒模型;第一唤醒模型与目标设备中的第二唤醒模型相同;根据用户唤醒数据集对第一唤醒模型进行训练,得到第一唤醒模型的优化参数;将优化参数发送至目标设备,以使目标设备根据优化参数对第二唤醒模型进行迭代;通过在远程服务器中设置与目标设备中的唤醒模型相同的模型,将优化训练后的参数发送至目标设备,实现了目标设备中的唤醒模型的参数迭代,无需消耗目标设备的硬件资源,由于用户唤醒数据集是经过准确性校验后确定的,具有更高的可信度,包含了目标设备对应的用户的语音特性,使得采用优化参数迭代后的唤醒模型具有较高的识别准确率,而且更能够贴近用户的使用习惯,提高了用户的使用体验。

基于上述任一实施例,该装置还包括:

用户唤醒数据集确定单元,用于接收目标设备发送的第二唤醒模型识别到的唤醒语音数据;

将唤醒语音数据输入唤醒语音校验模型,由唤醒语音校验模型基于唤醒关键词确定唤醒语音数据对应的准确性校验结果;

基于唤醒语音数据,以及唤醒语音数据对应的准确性校验结果,确定用户唤醒数据集。

基于上述任一实施例,唤醒语音校验模型的神经网络层数大于第二唤醒模型的神经网络层数,和/或,唤醒语音校验模型中神经网络层的神经元数量大于第二唤醒模型中神经网络层的神经元数量。

基于上述任一实施例,该装置还包括:

用户唤醒数据集扩增单元,用于接收各个候选设备发送的网络地址;候选设备与目标设备的设备类型相同;

基于各个候选设备的网络地址,确定各个候选设备的地理位置;

基于各个候选设备的地理位置,确定各个候选设备的唤醒语言类别;

将与目标设备的唤醒语言类别相同的候选设备发送的唤醒语音数据,增加至用户唤醒数据集。

基于上述任一实施例,训练单元具体用于:

确定基础训练数据集和基础测试数据集;

基于基础训练数据集和用户唤醒数据集中的训练数据集,对第一唤醒模型进行训练;

基于基础测试数据集和用户唤醒数据集中的测试数据集,分别对训练前的第一唤醒模型和训练后的第一唤醒模型进行测试,确定第一唤醒模型的训练前识别准确率和训练后识别准确率;

在训练后识别准确率与训练前识别准确率之差大于或等于预设差值的情况下,将训练后的第一唤醒模型中的模型参数确定为第一唤醒模型的优化参数。

基于上述任一实施例,迭代单元用于:

向目标设备发送包含优化参数的模型迭代指令,并将第二唤醒模型的当前模型参数保存为历史模型参数;

接收目标设备发送的历史模型参数对应的识别成功率和优化参数对应的识别成功率;识别成功率是基于目标设备接收到的语音数据数量和识别的唤醒语音数据数量确定的;

在优化参数对应的识别成功率低于历史模型参数对应的识别成功率的情况下,向目标设备发送包含历史模型参数的模型迭代指令。

基于上述任一实施例,确定单元用于:

确定用户唤醒数据集中唤醒语音数据的数量;

在唤醒语音数据的数量大于或等于预设数量的情况下,向目标设备发送模型参数获取指令;

接收目标设备基于模型参数获取指令发送的第二唤醒模型的当前模型参数;

基于当前模型参数,以及第二唤醒模型的模型结构,构建第一唤醒模型。

基于上述任一实施例,本申请还提供一种唤醒模型迭代方法。该唤醒模型迭代方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。在本实施例中,图4是本申请提供的唤醒模型迭代方法的硬件环境示意图,上述唤醒模型迭代方法可以应用于如图4所示的由终端设备401和服务器402所构成的硬件环境中。服务器402通过网络与终端设备401进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器402提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器402提供数据运算服务。

上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备401可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。

基于上述任一实施例,基于上述任一实施例,图5为本申请提供的电子装置的结构示意图,如图5所示,该电子装置可以包括:处理器(Processor)510、通信接口(Communications Interface)520、存储器(Memory)530和通信总线(Communications Bus)540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑命令,以执行如下方法:

确定第一唤醒模型;第一唤醒模型与目标设备中的第二唤醒模型相同;基于获取到的用户唤醒数据集对第一唤醒模型进行优化训练,得到第一唤醒模型的优化参数;用户唤醒数据集是基于唤醒关键词对目标设备中第二唤醒模型识别到的唤醒语音数据进行准确性校验后确定的;将优化参数发送至目标设备,以使目标设备基于优化参数对第二唤醒模型进行优化迭代。此外,上述的存储器530中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例提供的电子装置中的处理器可以调用存储器中的逻辑指令,实现上述方法,其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。

本申请实施例还提供一种计算机可读的存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法。

其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。

本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如上述方法。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

相关技术
  • 一种高处悬空钢筋混凝土梁膜结构预埋件的施工方法
  • 一种可调式免焊预埋件的施工方法
  • 一种组合夹板预埋件和预埋件施工方法
  • 混凝土结构临时预埋件施工方法及临时预埋件处理装置
技术分类

06120116552223