基于参数均衡器的音频处理方法、装置、设备及介质

文献发布时间：2023-06-19 19:30:30

技术领域

本发明实施例涉及音频处理技术领域，尤其涉及一种基于参数均衡器的音频处理方法、装置、设备及介质。

背景技术

多轨音乐处理常出现于母带处理的过程中，不同于我们日常看到了双声道音频，多轨音乐有着更加丰富的乐器伴奏和人声清唱轨道，可以通过对每一个轨道进行单独的处理，产生不一样的音频效果。现有技术中主要基于固定频段均衡器的人声改进方法，用于改进一个固定区间的频率能量高低，从而改变人声的音高，使得整体的音质感受得到一个提升，当基于固定频段均衡器的方法存在如下缺点：1、固定频率的不可调整性，让人声可以修改的频率比较固定，即使不断的细分固定频段，也无法覆盖全领域的音频频率段；2、容易导致优化的人声跟背景声互相频率掩蔽，影响整体的音质效果。

发明内容

本发明实施例提供了一种基于参数均衡器的音频处理方法、装置、设备及介质，旨在解决现有音频中人声和背景声相互掩蔽导致音质效果较差的问题。

第一方面，本发明实施例提供了一种基于参数均衡器的音频处理方法，其包括：获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段；对所述待处理音频进行傅里叶变换得到时频音频，并通过相似度方法对所述时频音频进行处理得到第二背景声片段；对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段；对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率；根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理。

进一步地，通过响度计算公式对所述待处理音频进行计算得到输出响度；基于移动中位数方法对所述输出响度进行平滑处理以得到目标输出响度；计算所述目标输出响度的平均响度，并将所述目标输出响度中大于所述平均响度的片段作为第一背景声片段。

进一步地，从所述时频音频中的起始位置开始，依次获取预设长度的音频片段作为第一片段；将所述时频音频中去除了所述第一片段之外的音频片段作为剩余片段，并从所述剩余片段中依次获取与所述第一片段等长的音频片段作为第二片段；通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度以构造自相似矩阵；利用图像处理对所述自相似矩阵做线条检测得到第二背景声片段。

进一步地，将所述第一背景声片段和所述第二背景声片段进行合并取交集得到初始副歌片段；通过长上升方法及长下降方法对所述初始副歌片段进行扩充得到副歌时间片段。

进一步地，获取所述待处理音频中人声频率与背景声频率，并计算所述人声频率与所述背景声频率之差得到频率差值；若所述频率差值小于预设频率差值，则将与所述频率差值相对应的采样频率及采样时间点进行保存，并根据所述采样频率及所述采样时间点确定中心频率及频率宽度。

进一步地，根据所述副歌时间片段对所述待处理音频中的背景声响度增益进行调整得到目标响度增益；根据所述频率宽度、所述中心频率以及所述目标响度增益通过与参数均衡器相对应的频响值计算公式得到背景声目标频响值，并根据所述背景声目标频响值对所述待处理音频的均衡处理。

进一步地，根据与所述副歌时间片段相对应的副歌起始时间判断所述待处理音频中的背景声是否为副歌片段；若所述背景声为所述副歌片段，则下调所述待处理音频中的背景声响度增益；若所述背景声不为所述副歌片段，则上调所述背景声响度增益。

第二方面，本发明实施例还提供了一种基于参数均衡器的音频处理装置，其包括：查找单元，用于获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段；处理单元，用于对所述待处理音频进行傅里叶变换得到时频音频，并通过相似度方法对所述时频音频进行处理得到第二背景声片段；扩充单元，用于对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段；监测单元，用于对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率；均衡单元，用于根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理。

第三方面，本发明实施例还提供了一种计算机设备，其包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时可实现上述方法。

本发明实施例提供了一种基于参数均衡器的音频处理方法、装置、设备及介质。其中，所述方法包括：获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段；对所述待处理音频进行傅里叶变换得到时频音频，并通过相似度方法对所述时频音频进行处理得到第二背景声片段；对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段；对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率；根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理。本发明实施例的技术方案，先对待处理音频进行一系列处理得到副歌时间片段，再对待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率，最后根据副歌时间片段、频率宽度以及中心频率通过参数均衡器对待处理音频进行均衡处理，解决了音频中人声和背景声相互掩蔽的问题，从而提高了音频的音质效果。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于参数均衡器的音频处理方法的流程示意图；

图2为本发明实施例提供的一种基于参数均衡器的音频处理方法的子流程示意图；

图3为本发明实施例提供的一种基于参数均衡器的音频处理方法的子流程示意图；

图4为本发明实施例提供的一种基于参数均衡器的音频处理方法的子流程示意图；

图5为本发明实施例提供的一种基于参数均衡器的音频处理装置的示意性框图；以及

图6为本发明实施例提供的一种计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

请参阅图1，图1是本发明实施例提供的基于参数均衡器的音频处理方法的流程示意图。下面对所述基于参数均衡器的音频处理方法进行详细说明。如图1所示，该方法包括以下步骤S100-S140。

S100、获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段。

在本发明实施例中，用户将待处理音频上传至音视频编辑软件，上传完成之后，音视频编辑软件会获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段。需要说明的是，在本实施例中，所述待处理音频包括背景声和人声，其中，所述背景声包括副歌、前奏以及结尾等。可理解地，副歌部分是一首歌的主要组成部分，这个部分往往需要人声和副歌同时达到响度的最高值，在长音频中根据频率的相似性及响度可找到副歌部分。

在某些实施例，例如本实施例中，如图2所示，所述步骤S100可包括步骤S101-S103。

S101、通过响度计算公式对所述待处理音频进行计算得到输出响度；

S102、基于移动中位数方法对所述输出响度进行平滑处理以得到目标输出响度；

S103、计算所述目标输出响度的平均响度，并将所述目标输出响度中大于所述平均响度的片段作为第一背景声片段。

在本发明实施例中，通过响度计算公式对所述待处理音频进行计算得到输出响度，其中，所述响度计算公式如公式(1)所示，在公式(1)中，data为所述待处理音频，X

S110、对所述待处理音频进行傅里叶变换得到时频音频，并通过相似度方法对所述时频音频进行处理得到第二背景声片段。

在本发明实施例中，得到所述第一背景声片段之后，对所述待处理音频进行傅里叶变换得到时频音频，其中，所述待处理音频信号为一维信号，所述时频音频为时频分析的二维矩阵；通过相似度方法对所述时频音频进行处理得到第二背景声片段，其中，所述相似度方法为通过皮尔逊系数计算所述时频音频中预设长度的音频片段与剩余片段中等长的音频片段之间的相似度。需要说明的是，在本实施例中，通过傅里叶变换计算所述待处理音频中背景声的幅度值，是因为幅度值代表了所述待处理音频在频域上的能量信息。可理解地，音频总采样点为时间长度乘以采样率，采样率代表了音频一秒的时间内有多少个采样点，采样点包含了音频时域信息。

在某些实施例，例如本实施例中，如图3所示，所述步骤S110可包括步骤S111-S114。

S111、从所述时频音频中的起始位置开始，依次获取预设长度的音频片段作为第一片段；

S112、将所述时频音频中去除了所述第一片段之外的音频片段作为剩余片段，并从所述剩余片段中依次获取与所述第一片段等长的音频片段作为第二片段；

S113、通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度以构造自相似矩阵；

S114、利用图像处理对所述自相似矩阵做线条检测得到第二背景声片段。

在本发明实施例中，从所述时频音频中的起始位置开始，依次获取预设长度的音频片段作为第一片段，其中，所述预设长度为3-5s；将所述时频音频中去除了所述第一片段之外的音频片段作为剩余片段，并从所述剩余片段中依次获取与所述第一片段等长的音频片段作为第二片段；通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度以构造自相似矩阵；利用图像处理中的卷积运算对所述自相似矩阵做线条检测得到第二背景声片段。为方便理解，假设所述时频音频为20s长度的音频，第一次获取所述第一片段时从所述时频音频的起始位置开始获取，即所述第一片段为从0-4s的音频片段，也即为4s长的音频片段，可理解地，从4s到20s的音频片段即为剩余片段，从所述剩余片段中获取与所述第一片段等长音频片段作为第二片段，例如获取4s-8s的音频片段作为所述第二片段，通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度值为SIM11，之后，再获取8s-12s的音频片段作为所述第二片段，执行通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度的步骤得到相似度值SIM12，依次类推，可得到SIM13和SIM14；第二次获取所述第一片段时，是从第一次获取所述第一片段的结束位置开始，即二次获取所述第一片段为4-8s的音频片段，所述剩余片段为0-4s和8-20s的音频片段，再依次将所述0-4s、8-12s、12-16s以及16-20s的音频片段作为所述第二片段，并依次与所述第一片段计算相似度，得到SIM21、SIM22、SIM23以及SIM24，依次类推，即可构造出自相似矩阵。需要说明的是，在其它实施例中，针对同一所述第一片段，所述第二片段的选择在逻辑上有所重叠，例如，当与SIM11相对应的第二片段为4-8s的音频片段时，与SIM12相对应的第二片段可为7s-11s的音频片段，即重叠了1s的音频片段。还需要说明的是，在本实施例中，SIM值越接近1，表明相似度越高，说明这两段音频表达的频谱意义相同，认为在背景声中属于同一个部分，比如都属于副歌、前奏或结尾等其他歌曲组成部分。

S120、对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段。

在本发明实施例中，将所述第一背景声片段和所述第二背景声片段进行合并取交集得到初始副歌片段；通过长上升方法及长下降方法对所述初始副歌片段进行扩充得到副歌时间片段。需要说明的是，在本实施例中，之所以采用长上升方法及长下降方法对所述初始副歌片段进行扩充，是因为常规的音频副歌片段开头会伴有一个响度上升的过程，这一部分常常也会被认为是副歌的内容，使用平滑曲线过滤短暂的响度振幅，找到音频副歌片段的第一个响度点，在这之后的一个时间段内，响度值随着采样点不断上升，同理，长下降的逻辑相同，找到副歌结束时的最低的一个响度点，得到所述待处理音频的副歌部分。

S130、对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率。

在本发明实施例中，获取所述待处理音频中人声频率与背景声频率，并计算所述人声频率与所述背景声频率之差得到频率差值；判断所述频率差值是否小于预设频率差值，若所述频率差值小于所述预设频率差值，表明所述人声频率与所述背景声频率接近，则将与所述频率差值相对应的采样频率及采样时间点进行保存，并根据所述采样频率及所述采样时间点确定中心频率及频率宽度。可理解地，所述频率宽度即为最后一次保存的采样时间点与第一次保存的采样点之间的频率宽度，所述中心频率是所述频率宽度中点对应的频率。需要说明的是，在本实施例中，之所以对人声频率及背景声频率进行扫描监测，是为了查找背景声和人声之间是否存在掩蔽，存在掩蔽时，会导致用户听到声音滞后，降低用户的体验感。

S140、根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理。

在本发明实施例中，根据所述副歌时间片段对所述待处理音频中的背景声响度增益进行调整得到目标响度增益，再根据所述频率宽度、所述中心频率以及所述目标响度增益通过参数均衡器对所述待处理音频进行均衡处理。需要说明的是，参数均衡器与图形式均衡器不同的地方是，图形式均衡器所能调整的音频与波段是固定的，而参数均衡器可在全音域当中任意决定要调整的音频(即中央频率点)，也能够决定调整的频宽。参数均衡器的核心是二阶滤波器组，主要由中心频率f0、频率宽度Q以及响度因子dbgain等组成，其中，Q为需要进行增益或者衰减的频段宽度，也就是该频率点增益的影响范围，当设定的Q值越大，频段越窄；反之Q值越小，频段越宽。

在某些实施例，例如本实施例中，如图4所示，所述步骤S140可包括步骤S141-S144。

S141、根据与所述副歌时间片段相对应的副歌起始时间判断所述待处理音频中的背景声是否为副歌片段，若所述背景声为所述副歌片段，则执行步骤S142，否则执行步骤S143；

S142、下调所述待处理音频中的背景声响度增益；

S143、上调所述背景声响度增益；

S144、根据所述频率宽度、所述中心频率以及所述目标响度增益通过与参数均衡器相对应的频响值计算公式得到背景声目标频响值，并根据所述背景声目标频响值对所述待处理音频的均衡处理。

在本发明实施例中，根据与所述副歌时间片段相对应的副歌起始时间判断所述待处理音频中的背景声是否为副歌片段，其中，所述副歌起始时间包括副歌开始时间及副歌结束时间；具体地，若所述待处理音频中的背景声所对应的时间在所述副歌开始时间及所述副歌结束时间之间，则判定所述背景声为所述副歌片段，反之，若所述待处理音频中的背景声所对应的时间不在所述副歌开始时间及所述副歌结束时间之间，则判定所述背景声不为所述副歌片段；若所述背景声为所述副歌片段，则下调所述待处理音频中的背景声响度增益，以凸显出人声；若所述背景声不为所述副歌片段，例如为前奏或结尾部分，则上调所述背景声响度增益，以凸显出背景声，根据所述频率宽度、所述中心频率以及所述目标响度增益通过与参数均衡器相对应的频响值计算公式得到背景声目标频响值，并根据所述背景声目标频响值对所述待处理音频的均衡处理，其中，所述频响值计算公式如公式(2)所示，在公式(2)中，H(z)为背景声目标频响值，a0、a1、a2、b0、b1、b2分别为二阶滤波器的系数,Q为频率宽度，dbgain为响度增益因子,f0为音频的中心频率，Fs为音频的采样频率，A为响度增益，w0为音频频域上的旋转方向，在物理上称之为角速度，S为shelf slope用于平衡dBgain来改变指定中心频率点附近的频域能力分布，从而达到人声与背景声不互相掩蔽的目的。

其中，

b0＝sin(w0)/2＝Q*alpha

b1＝0

b2＝-sin(w0)/2＝-Q*alpha

a0＝1+alpha

a1＝-2*cos(w0)

a2＝1-alpha

A＝sqrt(10^(dBgain/20))＝10^(dBgain/40)

(for peaking and shelving EQ filters only)

w0＝2*pi*f0/Fs

alpha＝sin(w0)/2*sqrt((A+1/A)*(1/S-1)+2)

图5是本发明实施例提供的一种基于参数均衡器的音频处理装置200的示意性框图。如图5所示，对应于以上基于参数均衡器的音频处理方法，本发明还提供一种基于参数均衡器的音频处理装置200。该基于参数均衡器的音频处理装置200包括用于执行上述基于参数均衡器的音频处理方法的单元。具体地，请参阅图5，该基于参数均衡器的音频处理装置200包括查找单元201、处理单元202、扩充单元203、监测单元204以及均衡单元205。

其中，所述查找单元201用于获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段；所述处理单元202用于对所述待处理音频进行傅里叶变换得到时频音频，并通过相似度方法对所述时频音频进行处理得到第二背景声片段；所述扩充单元203用于对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段；所述监测单元204用于对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率；所述均衡单元205用于根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理。

在某些实施例，例如本实施例中，所述查找单元201包括第一计算单元、平滑处理单元以及第二计算单元。

其中，所述第一计算单元用于通过响度计算公式对所述待处理音频进行计算得到输出响度；所述平滑处理单元用于基于移动中位数方法对所述输出响度进行平滑处理以得到目标输出响度；所述第二计算单元用于计算所述目标输出响度的平均响度，并将所述目标输出响度中大于所述平均响度的片段作为第一背景声片段。

在某些实施例，例如本实施例中，所述处理单元202包括第一获取单元、第二获取单元、第三计算单元以及检测单元。

其中，所述第一获取单元用于从所述时频音频中的起始位置开始，依次获取预设长度的音频片段作为第一片段；所述第二获取单元用于将所述时频音频中去除了所述第一片段之外的音频片段作为剩余片段，并从所述剩余片段中依次获取与所述第一片段等长的音频片段作为第二片段；所述第三计算单元用于通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度以构造自相似矩阵；所述检测单元用于利用图像处理对所述自相似矩阵做线条检测得到第二背景声片段。

在某些实施例，例如本实施例中，所述扩充单元203包括合并单元及扩充子单元。

其中，所述合并单元用于将所述第一背景声片段和所述第二背景声片段进行合并取交集得到初始副歌片段；所述扩充子单元用于通过长上升方法及长下降方法对所述初始副歌片段进行扩充得到副歌时间片段。

在某些实施例，例如本实施例中，所述监测单元204包括第四计算单元及保存确定单元。

其中，所述第四计算单元用于获取所述待处理音频中人声频率与背景声频率，并计算所述人声频率与所述背景声频率之差得到频率差值；所述保存确定单元用于若所述频率差值小于预设频率差值，则将与所述频率差值相对应的采样频率及采样时间点进行保存，并根据所述采样频率及所述采样时间点确定中心频率及频率宽度。

在某些实施例，例如本实施例中，所述均衡单元205包括调整单元及均衡子单元。

其中，所述调整单元用于根据所述副歌时间片段对所述待处理音频中的背景声响度增益进行调整得到目标响度增益；所述均衡子单元用于根据所述频率宽度、所述中心频率以及所述目标响度增益通过与参数均衡器相对应的频响值计算公式得到背景声目标频响值，并根据所述背景声目标频响值对所述待处理音频的均衡处理。

在某些实施例，例如本实施例中，所述调整单元包括判断单元、第一调整子单元以及第二调整子单元。

其中，所述判断单元用于根据与所述副歌时间片段相对应的副歌起始时间判断所述待处理音频中的背景声是否为副歌片段；所述第一调整子单元用于若所述背景声为所述副歌片段，则下调所述待处理音频中的背景声响度增益；所述第二调整子单元用于若所述背景声不为所述副歌片段，则上调所述背景声响度增益。

本发明实施例的基于参数均衡器的音频处理装置200的具体实现方式与上述基于参数均衡器的音频处理方法相对应，在此不再赘述。

上述基于参数均衡器的音频处理装置可以实现为一种计算机程序的形式，该计算机程序可以在如图6所示的计算机设备上运行。

请参阅图6，图6是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备300为终端，终端可以是智能手机、台式电脑、手提电脑、平板电脑等具有通信功能的电子设备。

参阅图6，该计算机设备300包括通过系统总线301连接的处理器302、存储器和网络接口305，其中，存储器可以包括存储介质303和内存储器304。

该存储介质303可存储操作系统3031和计算机程序3032。该计算机程序3032被执行时，可使得处理器302执行一种基于参数均衡器的音频处理方法。

该处理器302用于提供计算和控制能力，以支撑整个计算机设备300的运行。

该内存储器304为存储介质303中的计算机程序3032的运行提供环境，该计算机程序3032被处理器302执行时，可使得处理器302执行一种基于参数均衡器的音频处理方法。

该网络接口305用于与其它设备进行网络通信。本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备300的限定，具体的计算机设备300可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器302用于运行存储在存储器中的计算机程序3032，以实现如下步骤：获取待处理音频，并对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段；对所述待处理音频进行傅里叶变换得到时频音频，并通过相似度方法对所述时频音频进行处理得到第二背景声片段；对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段；对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率；根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理。

在某些实施例，例如本实施例中，处理器302在实现所述对所述待处理音频的输出响度进行平滑处理以查找出高于平均响度的片段行作为第一背景声片段步骤时，具体实现如下步骤：通过响度计算公式对所述待处理音频进行计算得到输出响度；基于移动中位数方法对所述输出响度进行平滑处理以得到目标输出响度；计算所述目标输出响度的平均响度，并将所述目标输出响度中大于所述平均响度的片段作为第一背景声片段。

在某些实施例，例如本实施例中，处理器302在实现所述通过相似度方法对所述时频音频进行处理得到第二背景声片段步骤时，具体实现如下步骤：从所述时频音频中的起始位置开始，依次获取预设长度的音频片段作为第一片段；将所述时频音频中去除了所述第一片段之外的音频片段作为剩余片段，并从所述剩余片段中依次获取与所述第一片段等长的音频片段作为第二片段；通过皮尔逊系数计算所述第一片段与所述第二片段之间的相似度以构造自相似矩阵；利用图像处理对所述自相似矩阵做线条检测得到第二背景声片段。

在某些实施例，例如本实施例中，处理器302在实现所述对所述第一背景声片段及所述第二背景声片段进行取交集及扩充得到副歌时间片段步骤时，具体实现如下步骤：将所述第一背景声片段和所述第二背景声片段进行合并取交集得到初始副歌片段；通过长上升方法及长下降方法对所述初始副歌片段进行扩充得到副歌时间片段。

在某些实施例，例如本实施例中，处理器302在实现所述对所述待处理音频中的人声频率及背景声频率进行扫描监测得到频率宽度及中心频率步骤时，具体实现如下步骤：获取所述待处理音频中人声频率与背景声频率，并计算所述人声频率与所述背景声频率之差得到频率差值；若所述频率差值小于预设频率差值，则将与所述频率差值相对应的采样频率及采样时间点进行保存，并根据所述采样频率及所述采样时间点确定中心频率及频率宽度。

在某些实施例，例如本实施例中，处理器302在实现所述根据所述频率宽度、所述中心频率以及所述副歌时间片段通过参数均衡器对所述待处理音频进行均衡处理步骤时，具体实现如下步骤：根据与所述副歌时间片段相对应的副歌起始时间判断所述待处理音频中的背景声是否为副歌片段；若所述背景声为所述副歌片段，则下调所述待处理音频中的背景声响度增益；若所述背景声不为所述副歌片段，则上调所述背景声响度增益；根据所述频率宽度、所述中心频率以及所述目标响度增益通过与参数均衡器相对应的频响值计算公式得到背景声目标频响值，并根据所述背景声目标频响值对所述待处理音频的均衡处理。

应当理解，在本申请实施例中，处理器302可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器302还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被该计算机系统中的至少一个处理器执行，以实现上述基于参数均衡器的音频处理方法的实施例的流程步骤。

所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其他实施例的相关描述。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：戚成杰;
专利申请人：深圳万兴软件有限公司;

上一篇：一种含发光材料的复合毛线及其制备方法
下一篇：一种基于改进卷积神经网络的Massive MIMO多用户调度方法