掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、存储介质、芯片与辅听设备

文献发布时间:2023-06-19 19:30:30


数据处理方法、装置、存储介质、芯片与辅听设备

技术领域

本公开涉及辅听设备技术领域,尤其涉及一种数据处理方法、装置、存储介质、芯片与辅听设备。

背景技术

据统计全球约有4.66亿听力损失者(简称听损者),且听损者的数值还在急剧上升。随着数字信号处理技术的发展,对抗听力损伤最常用的设备是数字助听器,但是数字助听器一般非常昂贵,其验配过程也极其繁琐。由于大部分的听损者的听力损失程度较轻,辅听设备,例如辅听耳机可以在一定程度上缓解听力进一步恶化。

然而,在现有的辅听设备的使用过程中,用户对外语的言语识别能力较好,而对中文的言语识别能力却相对较低。

发明内容

为克服相关技术中存在的问题,本公开提供一种数据处理方法、装置、存储介质、芯片与辅听设备。

根据本公开实施例的第一方面,提供一种数据处理方法,包括:

采用滤波器对频谱数据进行滤波分段,得到多个第一频带,所述频谱数据是对言语数据进行分帧后得到的数据;

在所述第一频带位于目标频带内的情况下,对输入声压级与输出声压级之间的初始增益值增加预设增益值,得到目标增益值;所述目标频带的时域包络信息在指定语言中的相对权重大于第一预设值;

根据所述目标增益值对所述输出声压级进行更新,得到增益后的言语信号。

可选地,所述滤波器通过以下步骤确定:

将频率域的频谱数据中每个频点对应的第一频率,转换至Bark域,得到Bark域中每个频点对应的第二频率;

对多个所述第二频率,按照多个第一临界频率进行划分,得到所述Bark域中的多个临界频带;

将每个所述临界频带中的第二频率转换至所述频率域,得到所述频率域中每个频点对应的第三频率;

根据所述第三频率中的第二临界频率,得到所述滤波器。

可选地,所述采用滤波器对频谱数据进行滤波分段,得到多个第一频带,包括:

采用所述滤波器,过滤所述频谱数据中除临界频带以外的频带,得到所述临界频带,所述临界频带包含多个第一频带。

可选地,所述临界频带包括以下至少一者与目标频带匹配的频带:502Hz-967Hz、967Hz-2014Hz、2014Hz-3434Hz。

可选地,所述初始增益值通过以下步骤确定:

将所述输出声压级减去所述输入声压级,得到所述初始增益值。

可选地,所述输出声压级通过以下步骤确定,包括:

确定与所述第一频带对应的宽动态范围压缩公式;

将所述第一频带的输入声压级,输入至与所述第一频带对应的宽动态范围压缩公式,得到所述输出声压级。

可选地,所述将所述第一频带的输入声压级,输入至与所述第一频带对应的宽动态范围压缩公式,得到所述输出声压级,包括:

在所述输入声压级位于第一预设范围之内的情况下,将第二预设值作为所述输出声压级;

在所述输入声压级位于第二预设范围之内的情况下,根据所述输入声压级、最低输入阈值与最低输出值,得到所述输出声压级;

在所述输入声压级位于第三预设范围内的情况下,根据所述输入声压级、低拐点值、低拐点增益值以及压缩比,得到所述输出声压级;

在所述输入声压级位于第四预设范围之内的情况下,根据高拐点值与高拐点增益值,得到所述输出声压级。

可选地,所述方法还包括:

在当前帧的频谱数据的均方根大于或等于上一帧的频谱数据的均方根情况下,根据启动时间与所述当前帧的频谱数据的均方根,得到所述当前频点对应的第一目标频率;

在所述当前帧的频谱数据的均方根,小于上一帧的频谱数据的均方根的情况下,根据释放时间与所述当前帧的频谱数据的均方根,得到所述当前频点对应的第二目标频率。

根据本公开实施例的第二方面,提供一种数据处理装置,包括:

滤波模块,被配置为采用滤波器对频谱数据进行滤波分段,得到多个第一频带,所述频谱数据是对言语数据进行分帧后得到的数据;

目标增益值确定模块,被配置为在所述第一频带位于目标频带内的情况下,对输入声压级与输出声压级之间的初始增益值增加预设增益值,得到目标增益值;所述目标频带的时域包络信息在指定语言中的相对权重大于第一预设值;

更新模块,被配置为根据所述目标增益值对所述输出声压级进行更新,得到增益后的言语信号。

根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的数据处理方法的步骤。

根据本公开实施例的第四方面,提供一种芯片,包括处理器和接口;所述处理器用于读取指令以执行本公开第一方面所提供的数据处理方法的步骤。

根据本公开实施例的第五方面,提供一种辅听设备,包括处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为在执行所述可执行指令时,实现本公开第一方面所提供的数据处理方法的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果:

在第一频带位于目标频带内的情况下,说明声源发出声音的频带位于对指定语言理解能力较强的目标频带内,此时声源正在发出指定语言。因此,可以在初始增益值的基础上增加预设增益值,来得到增大后的目标增益值,再以目标增益值对输出升压级进行更新,得到增益后的言语信号,即辅听设备会输出声强被扩大后的言语信号,用户可以更加清晰地听到声源发出指定语言的声音,提高了用户使用辅听设备时对指定语言的言语识别能力。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种数据处理方法的流程图。

图2是根据一示例性实施例示出的一种数据处理方法的示意图。

图3是根据一示例性实施例示出的一种Bark滤波器组的示意图。

图4是根据一示例性实施例示出的一种输入声压级与输出声压级之间的关系示意图。

图5是根据一示例性实施例示出的一种数据处理装置的框图。

图6是根据一示例性实施例示出的一种数据处理装置的框图。

图7是根据一示例性实施例示出的一种数据处理装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。

相关技术中,辅听设备的关键的技术之一是WDRC(Wide Dynamic RangeCompression,宽动态范围压缩算法)技术,WDRC技术会将言语数据划分为若干频带,针对不同频带和不同的输入声压级,利用大量实验得到不同的验配公式,并针对不同的频带,将输入升压级输入至不同的验配公式,计算不同频带的输出声压级,输出声压级相较于输入声压级被放大,起到了放大信号的目的。

目前使用的验配公式有POGO、NAL-RP、FIG6、NAL-NL2和CAM2,但是这些公式均是适用于外语,这些验配公式对汉语的适配度相对较低,导致用户使用辅听设备时,对外语的言语识别能力较好,对中文的言语识别能力相对较弱,即,用户对外语的听功能状态较好,而对中文的听功能较弱。

为了增强用户对中文的言语识别能力,本公开提出一种数据处理方法,请参阅图1所示,该方法可以运用至辅听设备中,辅听设备可以为辅听耳机,该方法包括以下步骤:

在步骤S11中,采用滤波器对频谱数据进行滤波分段,得到多个第一频带,所述频谱数据是对言语数据进行分帧后得到的数据。

其中,频谱数据是通过将时域上的言语数据分帧,得到多帧言语数据之后,将每帧时域上的言语数据转换成频域上的频谱数据,该过程可以称为分帧加窗过程和FFT(傅里叶变换过程)。对于每帧频谱数据而言,具有2048个频点,由于频谱数据是中心对称的,所以每帧频谱数据的有效频点的数量为1024个,除了1024个有效频点之外,还包括第一个频点的直流分量,该直流分量也为有效频点。言语数据是辅听设备接收到的周围声源发出的声信号数据。

其中,频点为频率的编号,除去直流分量以外,每帧频谱数据包含1024个有效频率,一个频点对应一个频率。例如,第1个频点对应频率20Hz,第2个频点对应40Hz…,第1024个频点对应204800Hz。一个频点为20Hz是一种示例,一个频点对应的频率通常为采样率除以频谱数据中的频点数量的值,例如,48KHz的采样率除以频点数量2048,得到一个频点对应的频率为23.4Hz。

其中,分帧加窗过程中,可以选择一帧言语数据的帧长为2048,窗函数为汉宁窗,汉宁窗的长度与一帧言语数据的帧长相同,汉宁窗的帧移为一帧言语数据的帧长的50%,即为1024,分帧加窗的公式如下:

st(n,m)=t((m-1)*inc+n)*w(n),0≤n≤(L-1)(1)

其中,m为言语数据的帧数索引;n为第m帧言语数据中的数据点索引,言语数据中包括多个数据点;st(n,m)为时域上第m帧言语数据中第n个数据点的数据;inc为帧移,帧移等于1024;L为一帧言语数据的帧长。

通过公式(1)得到每帧言语数据的数据点之后,可以将每帧言语数据的数据点进行傅里叶变换,得到每帧频谱数据T(n

其中,对言语信号处理系统的采样率一般为16kHz、44.1kHz或48kHz,辅听耳机要求声信号的高保真,故本公开使用的是48kHz采样率。

其中,除了直流分量外,每帧频谱数据包含1024个有效频点,1024个有效频点对应的频率分别为20Hz、40Hz、60Hz、80Hz…204800Hz,采用滤波器对频谱数据中的干扰频率进行过滤之后,可以得到多个第一频带。

可以理解的是,第一频带可以是相邻两个频点对应的频率以及两个频点之间的频率构成的频带,例如20Hz-40Hz、40Hz-60Hz、60Hz-80Hz等多个频带;当然第一频带也可以是间隔了至少一个频点的两个频点构成的频带,例如20Hz-60Hz、40Hz-80Hz等多个频带。第一频带可以是辅听设备获取到的言语数据对应的当前频带。

在步骤S12中,在所述第一频带位于目标频带内的情况下,对输入声压级与输出声压级之间的初始增益值增加预设增益值,得到目标增益值;所述目标频带的时域包络信息在指定语言中的相对权重大于第一预设值。

其中,第一频带的频率范围相较于目标频带的频率范围更窄,才能使得第一频带能够位于目标频带之内。指定语言可以为汉语,第一预设值可以为0.1,预设增益值可以为2db。

相关研究中,不同频带的时域包络信息在汉语(普通话)的言语识别中的相对权重是不同的,目标频带中的汉语的言语识别的相对权重均较高,目标频带的时域包络信息对汉语的言语识别的作用,要高于其余频带的时域包络信息对汉语的言语识别的作用。

目标频带包括以下至少一者频带:80Hz-502Hz、502Hz-1022Hz、1022Hz-1913Hz、1913Hz-3856Hz和3856Hz-7562Hz,这些频带对应的相对权重均值分别为0.25、0.28、0.22、0.2和0.15。

因此,在第一频带位于目标频带内的情况下,说明当前频带位于对汉语理解的相对权重较大的频带范围内,此时可以在初始增益值的情况下增加预设增益值,得到目标增益值,以放大后的目标增益值更新输出声压级,以使得通过目标增益值更新后的言语信号的声音能够被放大。

其中,辅听设备在对言语数据进行分析时,一般采用两种不同的维度,频域和时域。频域信息主要指言语数据中不同频带的言语信息;时域信息主要指言语数据中随时间变化的不同波动速率的言语信息。言语数据中的时域信息随时间变化的速率包括随时间变化速率低于50Hz的时域信息,其称为时域包络信息。

其中,输入声压级指的是输入至辅听设备中的言语信号的声音强度,输出声压级是辅听设备输出的言语信号的声音强度,在WDRC技术中,为了让用户能够听到周围声源发出的声音,一般会对输入至辅听设备的言语信号的输入声压级,以初始增益值进行增益,使得辅听设备输出放大后的输出升压级。

本公开在确定当前频带(第一频带)位于目标频带内的情况下,即确定辅听设备接收到的言语信号存在汉语的情况下,会在初始增益值的基础上,进一步地增加预设增益值,得到目标增益值,以目标增益值来对输入声压级进行放大,得到进一步增益后的输出声压级,以在辅听设备中放大其余声源说汉语的音量,提升用户使用辅听设备时对汉语的言语识别能力。

在步骤S13中,根据所述目标增益值对所述输出声压级进行更新,得到增益后的言语信号。

其中,在输出声压级被目标增益值进行更新之后,得到更新后的目标输出声压级,辅听设备会输出目标输出声压级的言语信号,来保证用户能够清洗地听到周围声源发出汉语时的声音。

其中,在声源发出汉语的一段时间内,每帧频谱数据内都会存在第一频带位于目标频带内的情况,所以辅听设备可以对声源发出汉语的言语信号进行进一步地放大,来保证用户能够清晰听到声源发出汉语的言语。

通过上述技术方案,在第一频带位于目标频带内的情况下,说明声源发出声音的频带位于对指定语言理解能力较强的目标频带内,此时声源正在发出指定语言,因此,可以在初始增益值的基础上增加预设增益值,来得到增大后的目标增益值,再以目标增益值对输出升压级进行更新,得到增益后的言语信号,即辅听设备会输出声强被扩大后的言语信号,用户可以更加清晰地听到声源发出指定语言的声音,提高了用户的使用感受。

在一种可能的实施方式中,上述的滤波器为三角滤波器,也可以称为Bark滤波器,滤波器通过以下步骤确定:

在步骤S21中,将频率域的频谱数据中每个频点对应的第一频率,转换至Bark域,得到Bark域中每个频点对应的第二频率。

其中,频率域与Bark域之间的转换公式如下:

在公式(2)中,f

在步骤S22中,对多个所述第二频率,按照多个第一临界频率进行划分,得到所述Bark域中的多个临界频带。

相关研究发现,人耳结构大致会对1024个有效频点中的24个频点产生共振,因此,信号在频带上也会呈现为24个临界频带,即,将24个频点中的每个频点对应的频率作为上个临界频带的最大值,并作为下个临界频带的最小值,这24个临界频带组成Bark域。

但是在WDRC技术中,没有必要划分如此多的频带,可以选择对0-24KHz按照14个频点,划分为14个临界频带。14个频点中第3、5、8、10个频点对应的临界频率分别为507Hz、967Hz、2014Hz与3434Hz,那么组成的临界频带分别为507Hz-967Hz、967Hz-2014Hz、2014Hz-3434Hz。

临界频带的产生原因在于:人耳对不同频率的信号的感知并不是线性的,由于耳蜗的结构,在临界频带中第一个单音感知性会被第二个单音的听觉掩蔽干扰,即一种声音对人耳听另外一种声音产生干扰,当这种干扰达到一定程度,人耳则无法听到另外一种声音。

其中,第一临界频率是上述14个频点对应的频率,在将频率域中频谱数据每个频点对应的第一频率转换成第二频率之后,可以采用14个第一临界频率,来对这1024个第二频率进行划分,得到Bark域中的14个临界频带。

在步骤S23中,将每个所述临界频带中的第二频率转换至所述频率域,得到所述频率域中每个频点对应的第三频率。

其中,在得到每个临界频带之后,会将每个临界频带中的第二频率从Bark域转换至频率域,得到频率域中每帧频谱数据的频点对应的第三频率,具体转换公式如下:

在公式(3)中,f

通过公式(3)的转换之后,即可得到频率域中,被划分到多个临界频带中的第三频率。

在步骤S24中,根据所述第三频率中的第二临界频率,得到所述滤波器。

其中,在得到被划分到多个临界频带中的第三频率之后,可以以每个临界频带的两个临界频率设计滤波器,得到Bark域的滤波器组。

示例地,请参阅图3所示,图3的横坐标为频率,纵坐标为幅度。对于每个临界频带而言,可以将临界频带上下限的两个临界频率设计为三角滤波器的两端,将临界频带内的频率设置为三角滤波器中间的数据,最终使得得到的三角滤波器呈三角形。

在得到滤波器之后,请参阅图2所示,滤波器会接收经过傅里叶变换后的频谱数据,过滤除了临界频带以外的频带,得到临界频带,且临界频带中包含的若干子频带为若干第一频带。在这个过程中,由于一帧频谱数据所包含的频率被划分为了14个临界频带,所以这14个临界频带所包含的频率可以代表一帧频谱数据。自然,在过滤掉除临界频带以外的干扰频带之后,剩余的临界频带能够更加准确地表达为一帧频谱数据。

其中,为了使得滤波器对频谱数据过滤分段后得到的第一频带能够位于目标频带中,本公开会筛选出与目标频带相匹配的临界频带与目标频带匹配的临界频带中的第一频带,位于目标频带中。

示例地,14个临界频带中的三个临界频带分别为507Hz-967Hz、967Hz-2014Hz、2014Hz-3434Hz。可以看出,临界频带507Hz-967Hz的两个临界频率是分别与目标频带502Hz-1022Hz的两个端点的频率接近的;临界频带967Hz-2014Hz的两个临界频率是分别与目标频带1022Hz-1913Hz的两个端点的频率接近的;临界频带2014Hz-3434Hz的两个临界频率是分别与目标频带1913Hz-3856Hz的两个端点的频率接近的。

可以看出,滤波器在过滤干扰频带时,会保留临界频带的两个临界频率以及临界频带内的频率,而过滤一些临界频带之间的干扰频率或干扰频带,在干扰频带被过滤之后,上述三个与目标频带匹配的临界频带中的第一频带,是会位于目标频带中的。

示例地,请参阅图3所示,滤波器中的第三个三角区间会保留507Hz-967Hz临界频带的频率,而这一临界频带是与目标频带匹配的临界频带,所以该临界频带中的第一频带502Hz-527Hz是位于目标频带502Hz-1022Hz中的。第一频带的频率范围小于临界频带的频率范围。

通过上述技术方案,通过滤波器的设置,一方面可以过滤频谱数据中的干扰频带和/或干扰频率,得到能够正确表达频谱数据的临界频带;另一方面可以将频谱数据划分为若干临界频带,来使得与目标频带匹配的临界频带中的第一频带是位于目标频带中的,减少第一频带不位于目标频带中的情况发生。

在一种可能的实施方式中,请参阅图2所示,在计算每个频带的增益之前,还需要对各个频带的RMS(均方根)进行平滑处理,来生成符合言语信号变化速度相对平缓的信号,因此,本公开还提出采用启动-释放时间平滑技术,来对均方根进行平滑处理,具体包括以下步骤:

在步骤S31中,在当前帧的频谱数据的均方根大于或等于上一帧的频谱数据的均方根情况下,根据启动时间与所述当前帧的频谱数据的均方根,得到所述当前频点对应的第一目标频率。

在步骤S32中,在所述当前帧的频谱数据的均方根,小于上一帧的频谱数据的均方根的情况下,根据释放时间与所述当前帧的频谱数据的均方根,得到所述当前频点对应的第二目标频率。

在上述步骤中,每帧频谱数据的均方根的计算方法为:

在公式(4)中,T(n

其中,对于每个频点对应的信号,可以通过以下公式进行平滑:

在公式(5)中,

从公式(5)可以看出,第一频带为频谱数据中的当前频带,所以频谱数据的频点也可以称为第一频带的当前频点。

在所述当前帧的频谱数据的均方根RMS

在所述当前帧的频谱数据的均方根RMS

通过上述技术方案,可以对频谱数据中的每个频点对应的频率进行平滑处理,来使得辅听设备输出的言语信号能够比较平滑,不会在短时间内出现忽大忽小的情况,例如,不会在200ms之内出现声音忽大忽小的情况,从而提高了用户的使用感受。并且,采用本公开提出的启动-释放时间平滑技术,来对频谱数据的均方根进行平滑的前后,辅听设备输出的时域波形的区别较小,即,启动-释放时间平滑技术在不会对言语信号造成影响的同时,还能提高用户的听感。

在一种可能的实施方式中,输出声压级与输入声压级在不同的频带上,具有不同的宽动态范围压缩公式。因此,本公开需要确定与所述第一频带对应的宽动态范围压缩公式(WDRC公式);将所述第一频带的输入声压级,输入至与所述第一频带对应的宽动态范围压缩公式,才能得到所述输出声压级。

其中,在所述输入声压级位于第一预设范围之内的情况下,将第二预设值(预设值为0)作为所述输出声压级;在所述输入声压级位于第二预设范围之内的情况下,根据所述输入声压级、最低输入阈值与最低输出值,得到所述输出声压级;在所述输入声压级位于第三预设范围内的情况下,根据所述输入声压级、低拐点值、低拐点增益值以及压缩比,得到所述输出声压级;在所述输入声压级位于第四预设范围之内的情况下,根据高拐点值与高拐点增益值,得到所述输出声压级。

请参阅图4所示,图4的横坐标为输入声压级,纵坐标为输出声压级,图中Thi、Tho、LK、HK、LKG、HKG分别表示:最低输入阈值、最低输出、低拐点、高拐点,低拐点增益,高拐点增益。由于人体的听力结构复杂,所以LK-HK段由多条压缩曲线得到,本公开以标准的三段式宽动态范围压缩公式举例,当然还可以有四段、五段、六段、七段、八段等,本公开在此不做限制。

示例地,可以采取以下公式描述图4:

在公式(6)中,SPL

从公式(6)可以看出,第一预设范围小于第二预设范围,第二预设范围小于第三预设范围,第三预设范围小于第四预设范围。第一预设范围可以为0

并且,在输入声压级位于第一预设范围之内的情况下,将0作为输出声压级;在输入声压级位于第二预设范围之内的情况下,将输入声压级减去最低输入阈值再加上最低输出值得到输出声压级;在输入声压级位于第三预设范围内的情况下,将输入声压级与低拐点之间的差值除以压缩比,加上低拐点与低拐点增益,得到输出声压级;在输入声压级位于第四预设范围之内的情况下,将高拐点值与高拐点增益值之后,作为输出声压级。

其中,初始增益值随着输入声压级与输出声压级的变化而变化,在通过公式(6)得到输出声压级之后,将输出声压级减去输入声压级,即可得到初始增益值。

示例地,初始增益值可以通过以下公式(7)表示:

G

在公式(7)中,G

其中,在初始增益值的基础上,增加预设增益值,得到目标增益值的情况下,也可以通过上述公式(7),来得到与当前的输入声压级对应的输出声压级,从该公式(7)可以看出,在输入声压级不变的情况下,若将初始增益值增大至目标增益值,会使得输出声压级增大,从而使得辅听设备输出更大的言语信号。

其中,在得到增益后的言语信号之后,可以通过STFT逆变换(ISTFT,傅里叶逆变换)输出得到时域信号并进行输出。

图5是根据一示例性实施例示出的一种数据处理装置的框图。参照图5,该数据处理装置500包括滤波模块510、目标增益值确定模块520与更新模块520。

滤波模块510,被配置为采用滤波器对频谱数据进行滤波分段,得到多个第一频带,所述频谱数据是对言语数据进行分帧后得到的数据;

目标增益值确定模块520,被配置为在所述第一频带位于目标频带内的情况下,对输入声压级与输出声压级之间的初始增益值增加预设增益值,得到目标增益值;所述目标频带的时域包络信息在指定语言中的相对权重大于第一预设值;

更新模块530,被配置为根据所述目标增益值对所述输出声压级进行更新,得到增益后的言语信号。

可选地,数据处理装置500包括:

第一转换模块,被配置为将频率域的频谱数据中每个频点对应的第一频率,转换至Bark域,得到Bark域中每个频点对应的第二频率;

划分模块,被配置为对多个所述第二频率,按照多个第一临界频率进行划分,得到所述Bark域中的多个临界频带;

第二转换模块,被配置为将每个所述临界频带中的第二频率转换至所述频率域,得到所述频率域中每个频点对应的第三频率;

滤波器确定模块,被配置为根据所述第三频率中的第二临界频率,得到所述滤波器。

可选地,滤波模块510包括:

滤波子模块,被配置为采用所述滤波器,过滤所述频谱数据中除临界频带以外的频带,得到所述临界频带,所述临界频带包含多个第一频带。

可选地,所述临界频带包括以下至少一者与目标频带匹配的频带:502Hz-967Hz、967Hz-2014Hz、2014Hz-3434Hz。

可选地,数据处理装置500包括:

初始增益值确定模块,被配置为将所述输出声压级减去所述输入声压级,得到所述初始增益值。

可选地,数据处理装置500包括:

公式确定模块,被配置为确定与所述第一频带对应的宽动态范围压缩公式;

输出声压级确定模块,被配置为将所述第一频带的输入声压级,输入至与所述第一频带对应的宽动态范围压缩公式,得到所述输出声压级。

可选地,输出声压级确定模块包括:

第一确定子模块,被配置为在所述输入声压级位于第一预设范围之内的情况下,将第二预设值作为所述输出声压级;

第二确定子模块,被配置为在所述输入声压级位于第二预设范围之内的情况下,根据所述输入声压级、最低输入阈值与最低输出值,得到所述输出声压级;

第三确定子模块,被配置为在所述输入声压级位于第三预设范围内的情况下,根据所述输入声压级、低拐点值、低拐点增益值以及压缩比,得到所述输出声压级;

第四确定子模块,被配置为在所述输入声压级位于第四预设范围之内的情况下,根据高拐点值与高拐点增益值,得到所述输出声压级。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图6是根据一示例性实施例示出的一种用于数据处理的装置800的框图。例如,装置800可以是辅听设备、移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图6,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出接口812,传感器组件814,以及通信组件816。

处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。

输入/输出接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述数据处理方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述数据处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

上述装置除了可以是独立的电子设备外,也可是独立电子设备的一部分,例如在一种实施例中,该装置可以是集成电路(Integrated Circuit,IC)或芯片,其中该集成电路可以是一个IC,也可以是多个IC的集合;该芯片可以包括但不限于以下种类:GPU(GraphicsProcessing Unit,图形处理器)、CPU(Central Processing Unit,中央处理器)、FPGA(Field Programmable Gate Array,可编程逻辑阵列)、DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、SOC(System on Chip,SoC,片上系统或系统级芯片)等。上述的集成电路或芯片中可以用于执行可执行指令(或代码),以实现上述的数据处理方法。其中该可执行指令可以存储在该集成电路或芯片中,也可以从其他的装置或设备获取,例如该集成电路或芯片中包括处理器、存储器,以及用于与其他的装置通信的接口。该可执行指令可以存储于该存储器中,当该可执行指令被处理器执行时实现上述的数据处理方法;或者,该集成电路或芯片可以通过该接口接收可执行指令并传输给该处理器执行,以实现上述的数据处理方法。

在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的数据处理方法的代码部分。

图7是根据一示例性实施例示出的一种用于数据处理的装置1900的框图。例如,装置1900可以被提供为一服务器。参照图7,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述数据处理方法。

装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入/输出接口1958。装置1900可以操作基于存储在存储器1932的操作系统。

本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

相关技术
  • 数据仓库内数据处理方法、装置、计算机设备和存储介质
  • 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
  • 财报数据处理方法、装置、计算机设备和存储介质
  • 数据访问请求的处理方法、装置和设备及存储介质
  • 一种数据处理方法、装置、设备及存储介质
  • 存储数据处理方法、装置、芯片、电子设备及存储介质
  • 存储芯片的数据处理方法、装置、计算机设备及存储介质
技术分类

06120115938843