掌桥专利:专业的专利平台
掌桥专利
首页

基于量子信息分析的语音识别方法、装置、设备及介质

文献发布时间:2023-06-19 19:28:50


基于量子信息分析的语音识别方法、装置、设备及介质

技术领域

本发明涉及语音语义领域,尤其涉及基于量子信息分析的语音识别方法、装置、设备及介质。

背景技术

基于量子信息分析的语音识别是指利用量子并行计算和量子纠缠等特性,通过将量子信息与人工神经网络相结合而形成的人工智能技术理论实现语音识别的过程,可以用于弥补传统的人工神经网络的容易陷入局部极小值、收敛速度慢等固有缺陷。

目前,语音识别主要通过语音识别系统的识别一组词汇或命令就能为用户提供有效的语音识别功能,因此简单有效的孤立词特定人语音识别系统就能满足要求,现有的语音识别系统虽已具备了较高的识别率,但语音识别仍存在高耗时的缺点,因此,提高语音识别的识别速度己成为当今语音识别领域的重要研究方向。

发明内容

为了解决上述问题,本发明提供了基于量子信息分析的语音识别方法、装置、设备及介质,可以提高语音识别的识别速度。

第一方面,本发明提供了基于量子信息分析的语音识别方法、装置、设备及介质,包括:

获取语音信号,对所述语音信号进行预处理,得到预处理信号;

识别所述预处理信号中的频谱分布信息,根据所述频谱分布信息,确定所述预处理信号的能量谱信号,利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号;

根据所述能量特征信号,优化预构建的量子音频识别模型中的量子权值与量子间隔,根据所述量子权值与量子间隔,生成优化量子音频识别模型;

利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,根据所述二分类结果,确定所述语音信号的语音识别结果。

在第一方面的一种可能实现方式中,所述对所述语音信号进行预处理,得到预处理信号,包括:

利用如下公式对所述语音信号进行预加重处理,得到预加重信号:

G(h)=1-0.95*h

其中,G(h)表示所述预加重信号,h表示所述语音信号;

利用如下公式对所述预加重信号进行加窗处理,得到加窗信号:

S=G(h)*H(n)

其中,S表示所述加窗信号,H(n)表示海明窗函数,G(h)表示所述预加重信号,n表示n=1,2,…,N-1,N表示海明窗函数的有效长度;

将所述加窗信号作为所述预处理信号。

在第一方面的一种可能实现方式中,所述利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号,包括:

获取所述三角滤波器中的滤波器组,根据所述滤波器组,计算所述能量谱信号的对数能量;

对所述对数能量进行离散弦变换,得到所述能量特征信号;

其中,利用下述公式计算所述能量谱信号的对数能量:

其中,T(m)表示所述能量谱信号的对数能量,X(k)表示所述频域信号,k表示所述频域信号的第k个信号点数,H

利用下述公式对所述对数能量进行离散弦变换:

其中,C(q)表示所述能量特征信号,T(m)表示所述对数能量,q表示第q个对数能量。

在第一方面的一种可能实现方式中,所述根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子间隔,包括:

将所述能量特征信号作为所述预构建的量子音频识别模型的训练数据,根据所述训练数据,构建所述预构建的量子音频识别模型的量子间隔函数;

根据所述量子间隔函数,计算所述预构建的量子音频识别模型中的初始量子间隔;

根据所述初始量子间隔,调整所述预构建的量子音频识别模型中的量子间隔;

其中,利用下述公式构建所述预构建的量子音频识别模型的量子间隔函数:

其中,

利用下述公式计算所述预构建的量子音频识别模型中的初始量子间隔:

V

其中,Δθ

在第一方面的一种可能实现方式中,所述利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,包括:

获取所述量子隐藏层中的隐藏层节点,根据所述隐藏层节点,构建所述能量特征信号的信号输出函数;

计算所述信号输出函数的信号函数数据,将所述信号函数数据作为所述特征数据;

其中,利用下述公式计算所述信号输出函数的信号函数数据:

其中,B

在第一方面的一种可能实现方式中,所述利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,包括:

获取所述量子输出层中的输出层节点,根据所述输出层节点,构建所述特征数据的特征输出函数;

计算所述特征输出函数的特征函数数据;

将所述特征函数数据中的每个特征函数数据作为所述二分类结果;

其中,利用下述公式计算所述特征输出函数的特征函数数据:

其中,C

在第一方面的一种可能实现方式中,所述根据所述二分类结果,确定所述语音信号的语音识别结果,包括:

获取所述量子语音识别模型对应的文本数据库,识别所述文本数据库中的文本标记;

将所述二分类结果与所述文本标记进行匹配;

在所述二分类结果与所述文本标记匹配成功时,将所述文本标记对应的文本数据作为所述语音信号的语音识别结果。

第二方面,本发明提供了一种基于量子信息分析的语音识别装置,所述装置包括:

信号预处理模块,用于获取语音信号,对所述语音信号进行预处理,得到预处理信号;

特征提取模块,用于识别所述预处理信号中的频谱分布信息,根据所述频谱分布信息,确定所述预处理信号的能量谱信号,利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号;

识别模型生成模块,用于根据所述能量特征信号,优化预构建的量子音频识别模型中的量子权值与量子间隔,根据所述量子权值与量子间隔,生成优化量子音频识别模型;

识别结果确定模块,用于利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,根据所述二分类结果,确定所述语音信号的语音识别结果。

第三方面,本发明提供一种电子设备,包括:

至少一个处理器;以及与所述至少一个处理器通信连接的存储器;

其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,以使所述至少一个处理器能够执行如上述第一方面中任意一项所述的基于量子信息分析的语音识别方法。

第四方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任意一项所述的基于量子信息分析的语音识别方法。

与现有技术相比,本方案的技术原理及有益效果在于:

本发明实施例首先通过获取语音信号,以用于后续从所述语音信号中提取语音特征,根据语音信号的语音特征,识别语音信息,进一步地,本发明实施例通过对所述语音信号进行预处理,得到预处理信号,以用于减少所述语音信号中高频部分信号的易受干扰性以及对所述语音信号分析的误差大小,本发明实施例通过识别所述预处理信号中的频谱分布信息,以用于将所述预处理信号通过坐标系体现,这样可以直观地观察到所述预处理信号的变化状态,进一步地,本发明实施例通过根据所述频谱分布信息,确定所述预处理信号的能量谱信号,以用于从所述频谱分布信息中提取与能量大小有关的数据进行后续的针对性分析,进一步地,本发明实施例通过利用预构建的量子音频识别模型中的三角滤波器对所述能量谱信号进行特征提取,以用于对频谱进行平滑化,并消除谐波的作用,突显原先语音的共振峰,并保障后续进行特征计算时,不会受到输入语音的音调不同而造成的影响,进一步地,本发明实施例通过根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子权值与量子间隔,以用于优化模型中量子级别的参数,提升模型优化的细致程度,进一步地,本发明实施例通过根据所述量子权值与量子间隔,生成优化量子音频识别模型,以用于提升所述量子音频识别模型的语音识别准确率,进一步地,本发明实施例通过利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,以用于将抽象的能量特征信号转化为数字形式,便于后续进行数据库比对,进一步地,本发明实施例通过利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,以用于将抽象的语音数据数值化,转换为通过数字标记的语音数据。因此,本发明实施例提出的基于量子信息分析的语音识别方法、装置、设备及介质,可以提高语音识别的识别速度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的基于量子信息分析的语音识别方法、装置、设备及介质的流程示意图;

图2为本发明一实施例中图1提供的基于量子信息分析的语音识别方法、装置、设备及介质的其中一个步骤的流程示意图;

图3为本发明一实施例中图1提供的基于量子信息分析的语音识别方法、装置、设备及介质的另外一个步骤的流程示意图;

图4为本发明一实施例提供的一种基于量子信息分析的语音识别装置的模块示意图;

图5为本发明一实施例提供的实现基于量子信息分析的语音识别方法的电子设备的内部结构示意图。

具体实施方式

应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供基于量子信息分析的语音识别方法、装置、设备及介质,所述基于量子信息分析的语音识别方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之,所述基于量子信息分析的语音识别方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

参阅图1所示,是本发明一实施例提供的基于量子信息分析的语音识别方法的流程示意图。其中,图1中描述的基于量子信息分析的语音识别方法包括:

S1、获取语音信号,对所述语音信号进行预处理,得到预处理信号。

本发明实施例通过获取语音信号,以用于后续从所述语音信号中提取语音特征,根据语音信号的语音特征,识别语音信息。其中,所述语音信号是指利用麦克风采集到的讲话人的语言信息。

进一步地,本发明实施例通过对所述语音信号进行预处理,得到预处理信号,以用于减少所述语音信号中高频部分信号的易受干扰性以及对所述语音信号分析的误差大小。

本发明的一实施例中,所述对所述语音信号进行预处理,得到预处理信号,包括:对所述语音信号进行预加重处理,得到预加重信号;对所述预加重信号进行加窗处理,得到加窗信号,将所述加窗信号作为所述预处理信号;其中,利用下述公式对所述语音信号进行预加重处理:

G(h)=1-0.95*h

其中,G(h)表示所述预加重信号,h表示所述语音信号;

利用下述公式对所述预加重信号进行加窗处理:

S=G(h)*H(n)

其中,S表示所述加窗信号,H(n)表示海明窗函数,G(h)表示所述预加重信号,n表示n=1,2,…,N-1,N表示海明窗函数的有效长度。

S2、识别所述预处理信号中的频谱分布信息,根据所述频谱分布信息,确定所述预处理信号的能量谱信号,利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号。

本发明实施例通过识别所述预处理信号中的频谱分布信息,以用于将所述预处理信号通过坐标系体现,这样可以直观地观察到所述预处理信号的变化状态。其中,所述频谱分布信息是指频率谱密度的简称,是频率的分布曲线,包括幅度谱与相位谱表示的信号分布信息。

本发明的一实施例中,参阅图2所示,所述识别所述预处理信号中的频谱分布信息,包括:

S201、通过离散傅立叶变换将所述预处理信号转换为频域信号;

S202、确定所述频域信号的频谱变化幅值;

S203、根据所述频谱变化幅值,识别所述频谱分布信息;

其中,所述离散傅立叶变换包括:

其中,X(k)表示所述频域信号,k表示所述频域信号的第k个信号点数,K表示所述频域信号的总信号点数,S(t)表示所述预处理信号,t表示所述预处理信号的信号点数,j表示虚数;

利用下述公式确定所述频域信号的频谱变化幅值:

其中,F表示所述频域信号的频谱变化幅值,X(k)表示所述频域信号,K表示所述频域信号的总信号点数。

可选地,所述根据所述频谱变化幅值,识别所述频谱分布信息,通过构建直角坐标系,将上述k(表示所述频域信号的第k个信号点数)作为所述直角坐标系的横坐标,将上述X(k)(表示所述频域信号)作为所述直角坐标系的纵坐标。

进一步地,本发明实施例通过根据所述频谱分布信息,确定所述预处理信号的能量谱信号,以用于从所述频谱分布信息中提取与能量大小有关的数据进行后续的针对性分析。其中,所述能量谱信号是指能量谱中表示的信号,所述能量谱是指用密度的概念表示信号能量在在个频点的分布情况。

本发明的一实施例中,所述根据所述频谱分布信息,确定所述预处理信号的能量谱信号,通过对所述频谱分布信息中的频谱变化幅值求平方实现。

进一步地,本发明实施例通过利用预设的三角滤波器对所述能量谱信号进行特征提取,以用于对频谱进行平滑化,并消除谐波的作用,突显原先语音的共振峰,并保障后续进行特征计算时,不会受到输入语音的音调不同而造成的影响。

其中,所述预构建的量子音频识别模型包括语音模型、语音识别方法与匹配规则,所述语音模型是指由于语音特征是矢量序列,每帧的特征参数构成对应的矢量,该序列的数据量通常过高,会给后面进一步的处理带来困难,因此要对数据进行压缩,经过数据压缩后的语音特征便成为语音的模型,所述语音识别方法是指矢量量化法,所述矢量量化法可用于语音识别,常用的矢量量化方法有无时间规整的矢量量化、有记忆矢量量化、神经网络模型等,所述匹配规则包括有线性时间归一化以及非线性时间归一化,用于计算识别的语音信号与参考标准信号之间的相似度。所述预设的三角滤波器是指Mel尺度的三角形滤波器组,其中,Mel尺度模拟人耳对不同频率语音的感知,所述三角滤波器可以用于将能量谱信号通过一组Mel尺度的三角形滤波器组之后产生的滤波器结果表现为,越靠近低频越密集,越靠近高频越稀疏。

本发明的一实施例中,所述利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号,包括:获取所述三角滤波器中的滤波器组,根据所述滤波器组,计算所述能量谱信号的对数能量;对所述对数能量进行离散弦变换,得到所述能量特征信号;其中,利用下述公式计算所述能量谱信号的对数能量:

其中,T(m)表示所述能量谱信号的对数能量,X(k)表示所述频域信号,k表示所述频域信号的第k个信号点数,H

利用下述公式对所述对数能量进行离散弦变换:

其中,C(q)表示所述能量特征信号,T(m)表示所述对数能量,q表示第q个对数能量。

S3、根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子权值与量子间隔,根据所述量子权值与量子间隔,生成优化量子音频识别模型。

本发明实施例通过根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子权值与量子间隔,以用于优化模型中量子级别的参数,提升模型优化的细致程度。其中,所述量子权值是指用于表示数据重要程度的权重。所述量子间隔是指模型中线性叠加的Sigmoid函数两两之间的间隔。

本发明的一实施例中,所述根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子权值,通过BP算法实现。

示例性地,基本的BP算法包括信号前向传播和误差反向传播两个过程,也就是说,误差输出的计算是在从输入到输出的方向进行,量子权值的调整是在从输出到输入的方向进行。在前向传播的情况下,输入信号经由隐含层作用在输出节点上,经由非线性变换产生输出信号,并且在实际输出不对应于期望输出时进入误差的反向传播过程。误差逆转录是指将输出误差通过隐含层逐层逆转录到输入层,将误差分配到各层所有单元,并将各层得到的误差信号作为调整各单元权重的依据。调整输入节点与隐藏层节点的耦合强度和隐藏层节点与输出节点的耦合强度及阈值,使误差沿梯度方向下降,经过迭代学习训练,确定最小误差对应的网络权重后,训练停止。

进一步地,本发明的一实施例中,所述根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子间隔,包括:将所述能量特征信号作为所述预构建的量子音频识别模型的训练数据,根据所述训练数据,构建所述预构建的量子音频识别模型的量子间隔函数;根据所述量子间隔函数,计算所述预构建的量子音频识别模型中的初始量子间隔;根据所述初始量子间隔,调整所述预构建的量子音频识别模型中的量子间隔;其中,利用下述公式构建所述预构建的量子音频识别模型的量子间隔函数:

其中,

利用下述公式计算所述预构建的量子音频识别模型中的初始量子间隔:

V

其中,Δθ

可选地,所述根据所述量子间隔函数,计算所述预构建的量子音频识别模型中的初始量子间隔是指通过将所述量子间隔函数进行求导数得到所述初始量子间隔;所述根据所述初始量子间隔,调整所述预构建的量子音频识别模型中的量子间隔是指调整所述量子间隔的数值大小,通过调整所述量子间隔的数值大小,进而改变所述初始量子间隔的大小,在所述初始量子间隔在低于预设阈值时,将所述初始量子间隔对应的量子间隔作为调整好的量子间隔。

进一步地,本发明实施例通过根据所述量子权值与量子间隔,生成优化量子音频识别模型,以用于提升所述量子音频识别模型的语音识别准确率。

本发明的一实施例中,所述根据所述量子权值与量子间隔,生成优化量子音频识别模型,通过将所述量子音频识别模型中的模型参数调整为对应的数值实现。

示例性地,将所述量子音频识别模型中的权值与每个量子之间的间隔调整为上述的量子权值与量子间隔,得到所述优化量子音频识别模型。

S4、利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,根据所述二分类结果,确定所述语音信号的语音识别结果。

本发明实施例通过利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,以用于将抽象的能量特征信号转化为数字形式,便于后续进行数据库比对。

其中,所述特征数据是指所述能量特征信号所携带的每个特征对应的数值,例如所述能量特征信号中的特征为“信号中间有停顿”,可以将所述“信号中间有停顿”的特征转换为数值表示的形式,如“1,2,3,......”

本发明的一实施例中,所述利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,包括:获取所述量子隐藏层中的隐藏层节点,根据所述隐藏层节点,构建所述能量特征信号的信号输出函数;计算所述信号输出函数的信号函数数据;将所述信号函数数据作为所述特征数据;其中,利用下述公式计算所述信号输出函数的信号函数数据:

其中,B

进一步地,本发明实施例通过利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,以用于将抽象的语音数据数值化,转换为通过数字标记的语音数据。

本发明的一实施例中,所述利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,包括:获取所述量子输出层中的输出层节点,根据所述输出层节点,构建所述特征数据的特征输出函数;计算所述特征输出函数的特征函数数据;将所述特征函数数据中的每个特征函数数据作为所述二分类结果;其中,利用下述公式计算所述特征输出函数的特征函数数据:

其中,C

进一步地,本发明实施例通过根据所述二分类结果,确定所述语音信号的语音识别结果,以用于根据所述二分类结果中每个语音信号对应的标记,将标记之后的语音信号与数据库中的数据进行匹配,得到语音信号对应的文本信息。

本发明的一实施例中,参阅图3所示,所述根据所述二分类结果,确定所述语音信号的语音识别结果,包括:

S301、获取所述量子语音识别模型对应的文本数据库,识别所述文本数据库中的文本标记;

S302、将所述二分类结果与所述文本标记进行匹配;

S303、在所述二分类结果与所述文本标记匹配成功时,将所述文本标记对应的文本数据作为所述语音信号的语音识别结果。

示例性地,若所述文本数据库中的文本标记分别为“你好:0.1”、“欢迎:0.2”,则将所述二分类结果0.1与所述文本标记进行匹配,可以得到匹配成功的结果,将所述“你好”作为所述语音信号的语音识别结果。

可以看出,本发明实施例首先通过获取语音信号,以用于后续从所述语音信号中提取语音特征,根据语音信号的语音特征,识别语音信息,进一步地,本发明实施例通过对所述语音信号进行预处理,得到预处理信号,以用于减少所述语音信号中高频部分信号的易受干扰性以及对所述语音信号分析的误差大小,本发明实施例通过识别所述预处理信号中的频谱分布信息,以用于将所述预处理信号通过坐标系体现,这样可以直观地观察到所述预处理信号的变化状态,进一步地,本发明实施例通过根据所述频谱分布信息,确定所述预处理信号的能量谱信号,以用于从所述频谱分布信息中提取与能量大小有关的数据进行后续的针对性分析,进一步地,本发明实施例通过利用预构建的量子音频识别模型中的三角滤波器对所述能量谱信号进行特征提取,以用于对频谱进行平滑化,并消除谐波的作用,突显原先语音的共振峰,并保障后续进行特征计算时,不会受到输入语音的音调不同而造成的影响,进一步地,本发明实施例通过根据所述能量特征信号,优化所述预构建的量子音频识别模型中的量子权值与量子间隔,以用于优化模型中量子级别的参数,提升模型优化的细致程度,进一步地,本发明实施例通过根据所述量子权值与量子间隔,生成优化量子音频识别模型,以用于提升所述量子音频识别模型的语音识别准确率,进一步地,本发明实施例通过利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,以用于将抽象的能量特征信号转化为数字形式,便于后续进行数据库比对,进一步地,本发明实施例通过利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,以用于将抽象的语音数据数值化,转换为通过数字标记的语音数据。因此,本发明实施例提出的基于量子信息分析的语音识别方法、装置、设备及介质可以提高用户画像分类的准确性。

如图4所示,是本发明基于量子信息分析的语音识别装置功能模块图。

本发明所述基于量子信息分析的语音识别装置400可以安装于电子设备中。根据实现的功能,所述基于量子信息分析的语音识别装置可以包括信号预处理模块401、特征提取模块402、识别模型生成模块403以及识别结果确定模块404。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

在本发明实施例中,关于各模块/单元的功能如下:

所述信号预处理模块401,用于获取语音信号,对所述语音信号进行预处理,得到预处理信号;

所述特征提取模块402,用于识别所述预处理信号中的频谱分布信息,根据所述频谱分布信息,确定所述预处理信号的能量谱信号,利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号;

所述识别模型生成模块403,用于根据所述能量特征信号,优化预构建的量子音频识别模型中的量子权值与量子间隔,根据所述量子权值与量子间隔,生成优化量子音频识别模型;

所述识别结果确定模块404,用于利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,根据所述二分类结果,确定所述语音信号的语音识别结果。

详细地,本发明实施例中所述基于量子信息分析的语音识别装置400中的所述各模块在使用时采用与上述的图1至图3中所述的基于量子信息分析的语音识别方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。

如图5所示,是本发明实现基于量子信息分析的语音识别方法的电子设备的结构示意图。

所述电子设备可以包括处理器50、存储器51、通信总线52以及通信接口53,还可以包括存储在所述存储器51中并可在所述处理器50上运行的计算机程序,如基于量子信息分析的语音识别程序。

其中,所述处理器50在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器50是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器51内的程序或者模块(例如执行基于量子信息分析的语音识别程序等),以及调用存储在所述存储器51内的数据,以执行电子设备的各种功能和处理数据。

所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器51在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器51在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器51不仅可以用于存储安装于电子设备的应用软件及各类数据,例如数据库配置化连接程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

所述通信总线52可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器51以及至少一个处理器50等之间的连接通信。

所述通信接口53用于上述电子设备5与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,所述用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。

图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器50逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

应该了解,所述实施例仅为说明之用,在专利发明范围上并不受此结构的限制。

所述电子设备中的所述存储器51存储的数据库配置化连接程序是多个计算机程序的组合,在所述处理器50中运行时,可以实现:

获取语音信号,对所述语音信号进行预处理,得到预处理信号;

识别所述预处理信号中的频谱分布信息,根据所述频谱分布信息,确定所述预处理信号的能量谱信号,利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号;

根据所述能量特征信号,优化预构建的量子音频识别模型中的量子权值与量子间隔,根据所述量子权值与量子间隔,生成优化量子音频识别模型;

利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,根据所述二分类结果,确定所述语音信号的语音识别结果。

具体地,所述处理器50对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。

本发明还提供一种存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:

获取语音信号,对所述语音信号进行预处理,得到预处理信号;

识别所述预处理信号中的频谱分布信息,根据所述频谱分布信息,确定所述预处理信号的能量谱信号,利用预设的三角滤波器对所述能量谱信号进行特征提取,得到能量特征信号;

根据所述能量特征信号,优化预构建的量子音频识别模型中的量子权值与量子间隔,根据所述量子权值与量子间隔,生成优化量子音频识别模型;

利用所述优化量子音频识别模型中的量子隐藏层计算所述能量特征信号的特征数据,利用所述优化量子音频识别模型中的量子输出层计算所述特征数据的二分类结果,根据所述二分类结果,确定所述语音信号的语音识别结果。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

技术分类

06120115921393