掌桥专利:专业的专利平台
掌桥专利
首页

音频处理方法、装置、计算设备及介质

文献发布时间:2023-06-19 16:04:54



技术领域

本公开的实施方式涉及多媒体技术领域,更具体地,本公开的实施方式涉及一种音频处理方法、装置、计算设备及介质。

背景技术

本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

为了将普通立体声的音频渲染出环绕包围的沉浸式效果,通常需要将双声道音频上混音到多声道音频。

相关技术中,在对双声道音频进行上混音时,往往是先通过主成分分析(Principal Components Analysis,PCA)确定出双声道音频的主要(Primary)成分,再确定出主要成分正交的环绕(Ambient)成分,进而将所确定出的主要成分和环绕成分的线性组合,作为多声道音频,实现对双声道音频的上混音。

在上述实现过程中,是假定主要成分和环绕成分完全正交的,因此仅适合音频中只有一个主声源的音频的处理,当待处理的音频中存在多个主声源时,上述音频处理方法的处理效果会大打折扣。

发明内容

鉴于相关技术中音频处理方法在对存在多个主声源的待处理音频进行处理时处理效果较差的问题,本公开的实施方式至少提供一种音频处理方法、装置、计算设备及介质。

在本公开实施方式的第一方面中,提供了一种音频处理方法,该方法包括:

基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,频段权重参数通过第一音频网络训练得到,目标多声道音频包括目标左声道音频部分和目标右声道音频部分;

基于环绕成分音频以及目标映射参数,获取渲染音频,目标映射参数通过第二音频网络训练得到;

基于目标多声道音频对应的主成分音频和渲染音频,获取待处理音频对应的目标多声道音频。

在本公开的一个实施例中,基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,包括:

基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频;

基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频。

在本公开的一个实施例中,主成分音频包括主成分左声道音频和主成分右声道音频;

基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频,包括:

基于对应于主成分音频所属频段的用于对左声道音频进行处理的第一频段权重参数、以及用于对右声道音频进行处理的第二频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分左声道音频;

基于对应于主成分音频所属频段的用于对左声道音频进行处理的第三频段权重参数、以及用于对右声道音频进行处理的第四频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分右声道音频。

在本公开的一个实施例中,环绕成分音频包括环绕成分左声道音频和环绕成分右声道音频;

基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频,包括:

基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第五频段权重参数、以及用于对右声道音频进行处理的第六频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频;

基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第七频段权重参数、以及用于对右声道音频进行处理的第八频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频。

在本公开的一个实施例中,环绕成分音频包括环绕成分左声道音频和环绕成分右声道音频;

基于环绕成分音频以及目标映射参数,获取渲染音频,包括:

基于目标映射参数中用于对环绕成分左声道音频进行处理的第一目标映射参数、以及目标映射参数中用于对环绕成分右声道音频进行处理的第二目标映射参数,对环绕成分左声道音频和环绕成分右声道音频进行加权求和,得到渲染音频。

在本公开的一个实施例中,基于主成分音频和渲染音频,获取待处理音频对应的目标多声道音频,包括:

对主成分音频和渲染音频进行叠加,得到待处理音频对应的目标多声道音频。

在本公开的一个实施例中,频段权重参数和目标映射参数的训练过程包括:

基于样本多声道音频,获取样本左声道音频和样本右声道音频;

基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征,第一样本音频特征用于指示样本左声道音频和样本右声道音频的功率和,第二样本音频特征用于指示样本左声道音频和样本右声道音频的功率差,第三样本音频特征用于指示样本左声道音频和样本右声道音频的实部互相关功率;

基于样本左声道音频、样本右声道音频、以及通过第一音频处理网络对第一样本音频特征、第二样本音频特征和第三样本音频特征处理得到的多个预测频段权重参数,确定第一样本音频和第二样本音频;

基于第二样本音频以及通过第二音频处理网络对第二样本音频处理得到的预测映射参数,获取预测渲染音频;

基于第一样本音频和预测渲染音频,获取预测多声道音频;

基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数。

在本公开的一个实施例中,样本多声道音频包括样本左前声道音频、样本右前声道音频、样本中置声道音频、样本左环绕声道音频和样本右环绕声道音频;

基于样本多声道音频,获取样本左声道音频和样本右声道音频,包括:

通过预设权重参数分别对样本中置声道音频和样本左环绕声道音频进行加权,基于加权后的结果和样本左前声道音频,确定样本左声道音频;

通过预设权重参数分别对样本中置声道音频和样本右环绕声道音频进行加权,基于加权后的结果和样本右前声道音频,确定样本右声道音频。

在本公开的一个实施例中,基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征,包括:

基于样本左声道音频、样本左声道音频对应的复共轭音频、样本右声道音频、样本右声道音频对应的复共轭音频以及目标平滑参数,确定第一样本音频特征和第二样本音频特征;

基于样本左声道音频与样本右声道音频对应的复共轭音频的相乘结果的实部部分,以及目标平滑因子,确定第三样本音频特征。

在本公开的一个实施例中,基于样本左声道音频、样本右声道音频、以及通过第一音频处理网络对第一样本音频特征、第二样本音频特征和第三样本音频特征处理得到的多个预测频段权重参数,确定第一样本音频和第二样本音频之前,该方法还包括:

将第一样本音频特征、第二样本特征以及第三样本音频特征输入第一音频处理网络,分别通过第一音频处理网络所包括的第一线性变换层和第二线性变换层,对第一样本音频特征、第二样本特征以及第三样本音频特征进行处理,得到用于获取第一样本音频的多个预测频段权重参数、以及用于获取第二样本音频的多个预测频段权重参数。

在本公开的一个实施例中,基于第二样本音频以及通过第二音频处理网络对第二样本音频处理得到的预测映射参数,获取预测渲染音频之前,该方法还包括:

将第二样本音频输入第二音频处理网络,通过第二音频处理网络所包括的线性变换层,对第二样本音频进行处理,得到预测映射参数。

在本公开的一个实施例中,基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数,包括:

基于预测多声道音频和样本多声道音频,确定第一损失函数;

基于预测多声道音频在各个声道间的幅度差异,以及样本多声道音频在各个声道间的幅度差异,确定多个第二损失函数;

基于第一损失函数和多个第二损失函数,确定目标损失函数;

基于目标损失函数训练第一音频处理网络和第二音频处理网络,直至满足训练截止条件,得到频段权重参数和目标映射参数。

在本公开实施方式的第二方面中,提供了一种音频处理装置,该装置包括:

确定模块,用于基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,频段权重参数通过第一音频网络训练得到,目标多声道音频包括目标左声道音频部分和目标右声道音频部分;

第一获取模块,用于基于环绕成分音频以及目标映射参数,获取渲染音频,目标映射参数通过第二音频网络训练得到;

第二获取模块,用于基于目标多声道音频对应的主成分音频和渲染音频,获取待处理音频对应的目标多声道音频。

在本公开的一个实施例中,确定模块,在用于基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频时,包括:

第一确定单元,用于基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频;

第二确定单元,用于基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频。

在本公开的一个实施例中,主成分音频包括主成分左声道音频和主成分右声道音频;

第一确定单元,在用于基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频时,用于:

基于对应于主成分音频所属频段的用于对左声道音频进行处理的第一频段权重参数、以及用于对右声道音频进行处理的第二频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分左声道音频;

基于对应于主成分音频所属频段的用于对左声道音频进行处理的第三频段权重参数、以及用于对右声道音频进行处理的第四频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分右声道音频。

在本公开的一个实施例中,环绕成分音频包括环绕成分左声道音频和环绕成分右声道音频;

第二确定单元,在用于基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频时,用于:

基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第五频段权重参数、以及用于对右声道音频进行处理的第六频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频;

基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第七频段权重参数、以及用于对右声道音频进行处理的第八频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频。

在本公开的一个实施例中,环绕成分音频包括环绕成分左声道音频和环绕成分右声道音频;

第一获取模块,在用于基于环绕成分音频以及目标映射参数,获取渲染音频时,用于:

基于目标映射参数中用于对环绕成分左声道音频进行处理的第一目标映射参数、以及目标映射参数中用于对环绕成分右声道音频进行处理的第二目标映射参数,对环绕成分左声道音频和环绕成分右声道音频进行加权求和,得到渲染音频。

在本公开的一个实施例中,第二获取模块,在用于基于主成分音频和渲染音频,获取待处理音频对应的目标多声道音频时,用于:

对主成分音频和渲染音频进行叠加,得到待处理音频对应的目标多声道音频。

在本公开的一个实施例中,该装置还包括训练模块,该训练模块包括:

第一获取单元,用于基于样本多声道音频,获取样本左声道音频和样本右声道音频;

第一确定单元,用于基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征,第一样本音频特征用于指示样本左声道音频和样本右声道音频的功率和,第二样本音频特征用于指示样本左声道音频和样本右声道音频的功率差,第三样本音频特征用于指示样本左声道音频和样本右声道音频的实部互相关功率;

第二确定单元,用于基于样本左声道音频、样本右声道音频、以及通过第一音频处理网络对第一样本音频特征、第二样本音频特征和第三样本音频特征处理得到的多个预测频段权重参数,确定第一样本音频和第二样本音频;

第二获取单元,用于基于第二样本音频以及通过第二音频处理网络对第二样本音频处理得到的预测映射参数,获取预测渲染音频;

第三获取单元,用于基于第一样本音频和预测渲染音频,获取预测多声道音频;

训练单元,用于基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数。

在本公开的一个实施例中,样本多声道音频包括样本左前声道音频、样本右前声道音频、样本中置声道音频、样本左环绕声道音频和样本右环绕声道音频;

第一获取单元,在用于基于样本多声道音频,获取样本左声道音频和样本右声道音频时,用于:

通过预设权重参数分别对样本中置声道音频和样本左环绕声道音频进行加权,基于加权后的结果和样本左前声道音频,确定样本左声道音频;

通过预设权重参数分别对样本中置声道音频和样本右环绕声道音频进行加权,基于加权后的结果和样本右前声道音频,确定样本右声道音频。

在本公开的一个实施例中,第一确定单元,在用于基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征时,用于:

基于样本左声道音频、样本左声道音频对应的复共轭音频、样本右声道音频、样本右声道音频对应的复共轭音频以及目标平滑参数,确定第一样本音频特征和第二样本音频特征;

基于样本左声道音频与样本右声道音频对应的复共轭音频的相乘结果的实部部分,以及目标平滑因子,确定第三样本音频特征。

在本公开的一个实施例中,训练模块还包括:

第一处理单元,用于将第一样本音频特征、第二样本特征以及第三样本音频特征输入第一音频处理网络,分别通过第一音频处理网络所包括的第一线性变换层和第二线性变换层,对第一样本音频特征、第二样本特征以及第三样本音频特征进行处理,得到用于获取第一样本音频的多个预测频段权重参数、以及用于获取第二样本音频的多个预测频段权重参数。

在本公开的一个实施例中,该装置还包括:

第二处理单元,用于将第二样本音频输入第二音频处理网络,通过第二音频处理网络所包括的线性变换层,对第二样本音频进行处理,得到预测映射参数。

在本公开的一个实施例中,训练单元,在用于基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数时,用于:

基于预测多声道音频和样本多声道音频,确定第一损失函数;

基于预测多声道音频在各个声道间的幅度差异,以及样本多声道音频在各个声道间的幅度差异,确定多个第二损失函数;

基于第一损失函数和多个第二损失函数,确定目标损失函数;

基于目标损失函数训练第一音频处理网络和第二音频处理网络,直至满足训练截止条件,得到频段权重参数和目标映射参数。

在本公开实施方式的第三方面中,提供了一种计算设备,计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行程序时实现上述第一方面以及第一方面的任意实施例所提供的音频处理方法所执行的操作。

在本公开实施方式的第四方面中,提供了一种计算机可读存储介质,计算机可读存储介质上存储有程序,程序被处理器执行上述第一方面以及第一方面的任意实施例所提供的音频处理方法所执行的操作。

在本公开实施方式的第五方面中,提供了一种计算机程序产品,包括计算机程序,程序被处理器执行时实现上述第一方面以及第一方面的任意实施例所提供的音频处理方法所执行的操作。

根据本公开实施方式的音频处理方法、装置、计算设备及介质等,通过基于待处理音频所对应的左声道音频和右声道音频,以及通过第一音频网络训练得到的、分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,从而基于环绕成分音频以及通过第二音频网络训练得到的目标映射参数,获取渲染音频,进而基于目标多声道音频对应的主成分音频和渲染音频,获取待处理音频对应的目标多声道音频,通过采用音频处理网络训练得到的参数来进行音频处理,可以避免音频中存在多个主声源时分离信号时所采用的权重失衡导致分离度降低的问题,从而使得音频处理过程无需考虑待处理音频中所存在的主声源的个数,进而可以提高处理得到的目标多声道音频的准确性,提高音频处理方法的处理效果。

附图说明

通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:

图1是本公开根据一示例性实施例示出的一种音频处理方法的流程图;

图2是本公开根据一示例性实施例示出的一种基于待处理音频获取左右声道音频的原理图;

图3是本公开根据一示例性实施例示出的一种参数训练过程的流程图;

图4是本公开根据一示例性实施例示出的一种第一音频处理网络的网络结构示意图;

图5是本公开根据一示例性实施例示出的一种第二音频处理网络的网络结构示意图;

图6是本公开根据一示例性实施例示出的一种训练过程的流程图;

图7是本公开根据一示例性实施例示出的一种音频处理装置的框图;

图8是本公开根据一示例性实施例示出的一种计算机可读存储介质的示意图;

图9是本公开根据一示例性实施例示出的一种计算设备的结构示意图;

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。

根据本公开的实施方式,提出了一种音频处理方法、装置、计算设备及介质。上述方法可以由计算设备执行,用于对待处理音频进行处理,以得到目标多声道音频。其中,计算设备可以为服务器,如一台服务器、多台服务器、服务器集群、云计算平台等,可选地,计算设备还可以为终端设备,如智能手机、平板电脑、台式计算机、便携式计算机、智能音箱,等等,本公开对计算设备的设备类型和设备数量不加以限定。

在介绍了本公开的应用环境之后,下面对本公开的具体实现方式进行介绍。

参见图1,图1是本公开根据一示例性实施例示出的一种音频处理方法的流程图,该方法包括:

步骤101、基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,频段权重参数通过第一音频网络训练得到,目标多声道音频包括目标左声道音频部分和目标右声道音频部分。

其中,待处理音频可以为双声道音频,可选地,待处理音频还可以为多声道音频,待处理音频所包括的声道数小于目标多声道音频所包括的声道数。

步骤102、基于环绕成分音频以及目标映射参数,获取渲染音频,目标映射参数通过第二音频网络训练得到。

步骤103、基于目标多声道音频对应的主成分音频和渲染音频,获取待处理音频对应的目标多声道音频。

本公开通过基于待处理音频所对应的左声道音频和右声道音频,以及通过第一音频网络训练得到的、分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,从而基于环绕成分音频以及通过第二音频网络训练得到的目标映射参数,获取渲染音频,进而基于目标多声道音频对应的主成分音频和渲染音频,获取待处理音频对应的目标多声道音频,通过采用音频处理网络训练得到的参数来进行音频处理,可以避免音频中存在多个主声源时分离信号时所采用的权重失衡导致分离度降低的问题,从而使得音频处理过程无需考虑待处理音频中所存在的主声源的个数,进而可以提高处理得到的目标多声道音频的准确性,提高音频处理方法的处理效果。

在介绍了本公开的基本过程之后,下面具体介绍本公开的各种非限制性实施方式。

在一些实施例中,在步骤101之前,可以预先基于待处理音频,获取左声道音频和右声道音频,从而可以基于左声道音频和右声道音频来进行目标多声道音频的获取。可选地,可以通过如下过程,来进行左声道音频和右声道音频的获取。

在待处理音频为双声道音频的情况下,即可直接获取到待处理音频所包括的左声道音频和右声道音频。

在待处理音频为多声道音频的情况下,可以预先对待处理音频进行处理,以获取待处理音频所对应的左声道音频和右声道音频。

以待处理音频为包括5个声道的多声道音频为例,待处理音频可以包括左前声道音频、右前声道音频、中置声道音频、左环绕声道音频和右环绕声道音频,则可以通过如下处理方式,来获取待处理音频所对应的左声道音频和右声道音频:

通过预设权重参数分别对中置声道音频和左环绕声道音频进行加权,基于加权后的结果和左前声道音频,确定左声道音频;并通过预设权重参数分别对中置声道音频和右环绕声道音频进行加权,基于加权后的结果和右前声道音频,确定右声道音频。

例如,可以通过如下公式(1)和公式(2)分别确定左声道音频和右声道音频:

L=FL+a×C+a×RL (1)

R=FR+a×C+a×RR (2)

其中,L表示左声道音频,R表示右声道音频,FL表示左前声道音频,FR表示右前声道音频,C表示中置声道音频,RL表示左环绕声道音频,RR表示右环绕声道音频,a表示预设权重参数。

可选地,预设权重参数的取值可以为0.71。以预设权重参数为0.71为例,利用0.71作为预设权重参数对音频进行加权,相当于将音频衰减3分贝(dB),在预设参数为0.71的情况下,获取左声道音频和右声道音频的原理可以参见图2,图2是本公开根据一示例性实施例示出的一种基于待处理音频获取左右声道音频的原理图,如图2所示,在获取左声道音频时,可以将中置声道音频衰减3dB的结果后与左前声道音频进行求和,并将求和后的结果与左环绕声道音频衰减3dB后的结果进行求和,即可得到左声道音频;而在获取右声道音频时,可以将中置声道音频衰减3dB的结果后与右前声道音频进行求和,并将求和后的结果与右环绕声道音频衰减3dB后的结果进行求和,即可得到右声道音频。

上述仅为基于待处理音频获取左右声道音频的一种示例性方式,在更多可能的实现方式中,还可以采用其他方式来获取左右声道音频,本公开对具体采用哪种方式不加以限定。

在获取到待处理音频所对应的左右声道音频后,即可基于所获取到的左右声道音频,来进行目标多声道音频的获取。

在一些实施例中,对于步骤101,在基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频时,可以包括如下步骤:

步骤1011、基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频。

其中,主成分音频可以包括主成分左声道音频和主成分右声道音频。基于此,对于上述步骤1011,在确定主成分音频时,可以包括如下步骤:

步骤1011-1、基于对应于主成分音频所属频段的用于对左声道音频进行处理的第一频段权重参数、以及用于对右声道音频进行处理的第二频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分左声道音频。

例如,可以通过如下公式(3),来获取主成分左声道音频:

其中,

步骤1011-2、基于对应于主成分音频所属频段的用于对左声道音频进行处理的第三频段权重参数、以及用于对右声道音频进行处理的第四频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分右声道音频。

例如,可以通过如下公式(4),来获取主成分右声道音频:

其中,

步骤1012、基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频。

其中,环绕成分音频可以包括环绕成分左声道音频和环绕成分右声道音频。基于此,对于上述步骤1012,在确定环绕成分音频时,可以包括如下步骤:

步骤1012-1、基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第五频段权重参数、以及用于对右声道音频进行处理的第六频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频。

例如,可以通过如下公式(5),来获取环绕成分左声道音频:

其中,

步骤1012-2、基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第七频段权重参数、以及用于对右声道音频进行处理的第八频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频。

例如,可以通过如下公式(6),来获取环绕成分右声道音频:

其中,

需要说明的是,上述各个步骤的标号并不构成对上述两个步骤的执行顺序的限定,以步骤1011和步骤1012为例,可选地,可以先执行步骤1011再执行步骤1012,或者,可以先执行步骤1012再执行步骤1011,或者,可以同时执行步骤1011和步骤1012,本公开对具体采用哪种执行顺序不加以限定。

通过上述过程,即可按照线性估计的方法,即可确定出主成分音频和环绕成分音频,而主成分音频和环绕成分音频可以表示为立体声信号(也即是多声道信号)的线性组合,使得后续可以基于所确定出的主成分音频和环绕成分音频来确定目标多声道音频。

本公开通过利用第一音频处理网络训练得到的频段权重参数,来进行主成分音频和环绕成分音频的分离,无需获取分轨文件,即可得到分离度很高的主成分音频和环绕成分音频,另外,基于音频处理网络实现主成分音频和环绕成分音频的分离,避免了音频中存在多个主声源时分离信号权重失衡导致分离度降低的问题,从而可以提高音频分离效果。

在一些实施例中,对于步骤102,在基于环绕成分音频以及目标映射参数,获取渲染音频时,可以通过如下方式实现:

基于目标映射参数中用于对环绕成分左声道音频进行处理的第一目标映射参数、以及目标映射参数中用于对环绕成分右声道音频进行处理的第二目标映射参数,对环绕成分左声道音频和环绕成分右声道音频进行加权求和,得到渲染音频。

环绕成分音频可以提升扩散信号的多样性,并创造包围沉浸的声音效果,在将环绕成分信号渲染到多声道音频中时,可以通过解相关器生成各个声道互不相关的分解扩散信号。例如,可以通过如下公式(7),来将环绕成分信号渲染到多声道音频中,以得到渲染音频:

其中,

利用第二音频处理网络训练得到的目标映射参数,来对环绕成分音频进行渲染,可以提升沉浸式音频的渲染效果。

在一些实施例中,对于步骤103,在基于主成分音频和渲染音频,获取待处理音频对应的目标多声道音频时,可以通过如下方式实现:

对主成分音频和渲染音频进行叠加,得到待处理音频对应的目标多声道音频。

例如,可以通过如下公式(8),来获取目标多声道音频:

其中,U

由于主成分音频是具有指向性的音频信号,当主成分音频被映射到多声道音频时,需要保持主成分音频的空间声像方位。因而,需要对主成分音频的方向进行估计,然后根据角度映射到左右声道上,而除左右声道外的其他声道则无需保留主成分音频。因此,上述公式(8)中的主成分音频包括主成分左声道音频和主成分右声道音频即可,而其他声道的主成分音频映射后为0,可以忽略不计,即可保证用于获取目标多声道音频的主成分音频可以真实地还原原始声场的空间位置分布。

上述过程是关于如何采用预先训练得到的参数,基于待处理音频来获取目标多声道音频的介绍,下面对通过预先训练来获取参数的过程进行介绍。

在一些实施例中,频段权重参数和目标映射参数的训练过程可以参见图3,图3是本公开根据一示例性实施例示出的一种参数训练过程的流程图,如图3所示,参数训练过程包括:

步骤301、基于样本多声道音频,获取样本左声道音频和样本右声道音频。

其中,样本多声道音频可以为多声道数据集中的音频,样本多声道音频可以包括样本左前声道音频、样本右前声道音频、样本中置声道音频、样本左环绕声道音频和样本右环绕声道音频。

以样本多声道音频包括上述5个声道的音频为例,可以通过如下步骤,来获取样本左声道音频和样本右声道音频:

步骤3011、通过预设权重参数分别对样本中置声道音频和样本左环绕声道音频进行加权,基于加权后的结果和样本左前声道音频,确定样本左声道音频。

步骤3012、通过预设权重参数分别对样本中置声道音频和样本右环绕声道音频进行加权,基于加权后的结果和样本右前声道音频,确定样本右声道音频。

其中,通过上述步骤3011和步骤3012获取样本左右声道音频的过程可以参见公式(1)和公式(2)以及相关介绍,此处不再赘述。

步骤302、基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征,第一样本音频特征用于指示样本左声道音频和样本右声道音频的功率和,第二样本音频特征用于指示样本左声道音频和样本右声道音频的功率差,第三样本音频特征用于指示样本左声道音频和样本右声道音频的实部互相关功率。

在一种可能的实现方式中,可以通过如下步骤,来确定第一样本音频特征、第二样本音频特征和第三样本音频特征:

步骤3021、基于样本左声道音频、样本左声道音频对应的复共轭音频、样本右声道音频、样本右声道音频对应的复共轭音频以及目标平滑参数,确定第一样本音频特征和第二样本音频特征。

例如,可以通过如下公式(9)和公式(10),分别确定第一样本音频特征和第二样本音频特征:

其中,Φ

步骤3022、基于样本左声道音频与样本右声道音频对应的复共轭音频的相乘结果的实部部分,以及目标平滑因子,确定第三样本音频特征。

例如,可以通过如下公式(11),来确定第三样本音频特征:

其中,Φ

步骤303、基于样本左声道音频、样本右声道音频、以及通过第一音频处理网络对第一样本音频特征、第二样本音频特征和第三样本音频特征处理得到的多个预测频段权重参数,确定第一样本音频和第二样本音频。

其中,第一样本音频为样本主成分音频,第二样本音频为样本环绕成分音频。

需要说明的是,在步骤303之前,可以将第一样本音频特征、第二样本特征以及第三样本音频特征输入第一音频处理网络,从而通过第一音频处理网络,来获取多个预测频段参数。

在一种可能的实现方式中,第一音频处理网络可以为深度神经网络(Deep NeuralNetwork,DNN)。其中,第一音频处理网络可以包括第一线性变换层和第二线性变换层,第一线性变化层和第二线性变化层均可以由使用线性整流(Rectified Linear Unit,ReLU)函数作为激活函数的线性变换层以及使用归一化(Sigmoid)函数作为激活函数的线性变换层组成。

以第一音频处理网络包括第一线性变换层和第二线性变换层为例,在将第一样本音频特征、第二样本特征以及第三样本音频特征输入第一音频处理网络之后,可以分别通过第一音频处理网络所包括的第一线性变换层和第二线性变换层,对第一样本音频特征、第二样本特征以及第三样本音频特征进行处理,得到用于获取第一样本音频的多个预测频段权重参数、以及用于获取第二样本音频的多个预测频段权重参数,以便在步骤303中可以基于多个预测频段权重参数,来进行第一样本音频和第二样本音频的确定。

可选地,在将第一样本音频特征、第二样本音频特征和第三样本音频特征输入至第一音频处理网络时,可以对第一样本音频特征、第二样本音频特征和第三样本音频特征,得到目标特征,从而将拼接得到的目标特征输入第一音频处理网络。

参见图4,图4是本公开根据一示例性实施例示出的一种第一音频处理网络的网络结构示意图,如图4所示,第一线性变换层和第二线性变化层均可以由三个使用ReLU函数作为激活函数的线性变换层以及使用Sigmoid函数作为激活函数的线性变换层组成,则在通过如图4所示的第一音频处理网络来获取多个预测频段权重参数时,可以将第一样本音频特征、第二样本音频特征和第三样本音频特征分别输入第一线性变化层和第二线性变换层,以通过第一线性变化层和第二线性变换层,来分别获取用于对样本左声道音频进行加权处理的多个预测频段权重参数、以及用于对样本右声道音频进行加权处理的多个预测频段权重参数,下面分别对第一线性变化层和第二线性变换层的内部处理过程进行说明。

对于第一线性变化层,可以通过第一线性变化层所包括的三个使用ReLU函数作为激活函数的线性变换层,依次对输入各层的特征进行线性整流处理,以得到整流后的特征,进而通过使用Sigmoid函数作为激活函数的线性变换层,对整流后的特征进行归一化处理,并基于归一化处理得到的特征,确定用于获取第一样本音频的多个预测频段权重参数(包括第一预测频段权重参数w

对于第二线性变化层,可以通过第二线性变化层所包括的三个使用ReLU函数作为激活函数的线性变换层,依次对输入各层的特征进行线性整流处理,以得到整流后的特征,进而通过使用Sigmoid函数作为激活函数的线性变换层,对整流后的特征进行归一化处理,并基于归一化处理得到的特征,确定用于获取第二样本音频的多个预测频段权重参数(包括第五预测频段权重参数w

在确定出用于获取第一样本音频的多个预测频段权重参数以及用于获取第二样本音频的多个预测频段权重参数后,即可基于所确定出的预测频段参数,来确定第一样本音频和第二样本音频,具体确定方式可以参见上述步骤101以及有关公式(3)至公式(6)的介绍,此处不再赘述。

步骤304、基于第二样本音频以及通过第二音频处理网络对第二样本音频处理得到的预测映射参数,获取预测渲染音频。

需要说明的是,在步骤304之前,可以将第二样本音频输入第二音频处理网络,从而通过第二音频处理网络,来获取预测映射参数。

在一种可能的实现方式中,第二音频处理网络可以为DNN。其中,第二音频处理网络可以包括线性变换层,该线性变换层可以由使用ReLU函数作为激活函数的线性变换层以及使用Sigmoid函数作为激活函数的线性变换层组成。

在通过第二音频处理网络来获取预测映射参数时,可以通过第二音频处理网络所包括的线性变换层,对第二样本音频进行处理,得到预测映射参数,以便在步骤304中可以基于预测映射参数,来进行渲染音频的获取。

参见图5,图5是本公开根据一示例性实施例示出的一种第二音频处理网络的网络结构示意图,如图5所示,第二音频处理网络的线性变换层由两个使用ReLU函数作为激活函数的线性变换层以及使用Sigmoid函数作为激活函数的线性变换层组成,则在通过如图5所示的第二音频处理网络来获取预测映射参数时,可以将以向量形式表示的第二样本音频输入线性变换层,以通过线性变换层,来获取预测映射参数,下面对线性变换层的内部处理过程进行说明。

例如,可以通过线性变换层所包括的两个使用ReLU函数作为激活函数的线性变换层,依次对输入各层的特征进行线性整流处理,以得到整流后的特征,进而通过使用Sigmoid函数作为激活函数的线性变换层,对整流后的特征进行归一化处理,并基于归一化处理得到的特征,确定预测映射参数(包括第一预测映射参数o

在确定出预测映射参数后,即可基于所确定出的预测映射参数,来获取渲染音频,具体获取方式可以参见上述步骤102以及有关公式(7)的介绍,此处不再赘述。

步骤305、基于第一样本音频和预测渲染音频,获取预测多声道音频。

需要说明的是,上述步骤305的实现过程可以参见有关步骤103的介绍,此处不再赘述。

步骤306、基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数。

上述步骤306可以通过如下步骤实现:

步骤3061、基于预测多声道音频和样本多声道音频,确定第一损失函数。

其中,第一损失函数可以为最小均方误差(Mean-Square Error,MSE)损失函数。例如,第一损失函数可以参见如下公式(12):

其中,L

步骤3062、基于预测多声道音频在各个声道间的幅度差异,以及样本多声道音频在各个声道间的幅度差异,确定多个第二损失函数。

其中,第二损失函数可以为声道差异(Inter Channel Level Differences,ICLD)损失函数。例如,第二损失函数可以参见如下公式(13):

其中,L

以样本多声道音频和预测多声道音频为包括7个声道的音频为例,则样本多声道音频与预测多声道音频之间存在21个第二损失函数。

步骤3063、基于第一损失函数和多个第二损失函数,确定目标损失函数。

在一种可能的实现方式中,可以将第一损失函数与多个第二损失函数的和,确定为目标损失函数。例如,可以通过如下公式(14),来确定目标损失函数:

其中,L表示目标损失函数,L

步骤3064、基于目标损失函数训练第一音频处理网络和第二音频处理网络,直至满足训练截止条件,得到频段权重参数和目标映射参数。

需要说明的是,在满足训练截止条件的情况下,即可获取到训练好的第一音频处理网络和第二音频处理网络,通过训练好的第一音频处理网络输出的预测频段权重参数,即为要获取的频段权重参数,而通过训练好的第二音频处理网络输出的预测映射参数,即为要获取的目标映射参数。

其中,训练截止条件可以为目标损失函数的函数值满足设定条件,或者,迭代次数达到设备次数,可选地,训练截止条件还可以为其他条件,本公开对此不加以限定。

需要说明的是,图3所示的训练过程为迭代过程,也即是,每通过步骤301获取到一个样本左声道音频和一个样本右声道音频,即可通过步骤302至步骤305对所获取到的样本左声道音频和样本右声道音频进行处理,得到一个预测多声道音频,从而通过步骤306,来基于目标损失函数,训练第一音频处理网络和第二音频处理网络,进而继续通过步骤302至步骤305,对获取到的下一个样本左声道音频和样本右声道音频处理,得到一个预测多声道音频,从而通过步骤306,来基于目标损失函数,继续对训练得到的第一音频处理网络和第二音频处理网络进行训练,以此类推,直至满足训练截止条件,即可得到训练好的第一音频处理网络和第二音频处理网络,从而即可获取到频段权重参数和目标映射参数。

本公开通过在主成分音频和环绕成分音频分离环节引用深度神经网络,从而可以利用深度神经网络进行声道分离,定义输入信号的功率和、输入信号的功率差以及输入信号的互相关函数作为深度神经网络的输入特征,来对深度神经网络进行训练,深度神经网络包括多层线性变换层,可以通过深度神经网络所包括的线性变换层来对各层的输入特征进行线性整流处理,通过多层线性变化层实现迭代的线性整流处理后,可以通过使用Sigmoid函数作为激活函数的线性变换层来获取不同声道输出的音频,从而可以实现通过深度神经网络的声道分离,进而能够利用深度神经网络的优势,通过对深度神经网络的训练,来提升不同声道的音频的分离度,同时可以减少因对音频进行时域、频域变换和非线性处理,而造成音频失真和音质损伤的情况的出现。

另外,本公开还在环绕成分音频的渲染环节引入了深度神经网络,深度神经网络的引入可以避免在音频中存在多个主成分的情况下,环绕成分音频渲染时部分声道的学习因子为空的情形,从而使得本公开可以适应音频中存在多个主声源的情形,从而可以提高所生成的多声道音频的音频质量。

基于上述训练过程中涉及的各个可选实施例,本公开的训练过程的流程可以参见图6,图6是本公开根据一示例性实施例示出的一种训练过程的流程图,如图6所示,在从多声道数据集中获取到样本多声道音频后,即可通过步骤301,来基于样本多声道音频进行下混音,以得到样本左声道音频和样本右声道音频,从而可以通过步骤302至步骤303,来进行主成分和环绕成分的分离,以得到作为主成分音频的第一样本音频以及作为环绕成分的第二样本音频,进而基于第一样本音频进行映射,并通过步骤304来基于第二样本音频进行渲染,以便通过步骤305,来基于第一样本音频映射后的结果以及第二样本音频渲染后的结果,来获取预测多声道音频,进而通过步骤306,即可基于指示预测多声道音频与样本多声道音频之间的差异的损失函数,通过反向传播来进行训练,具体实现过程可以参见上述步骤301至步骤306,此处不再赘述。

在介绍了本公开示例性实施方式的音频处理方法之后,接下来,对本公开示例性实施方式的音频处理装置以及用于实现音频处理方法的计算设备的结构进行说明。

参见图7,图7是本公开根据一示例性实施例示出的一种音频处理装置的框图,该装置包括:

确定模块701,用于基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频,频段权重参数通过第一音频网络训练得到,目标多声道音频包括目标左声道音频部分和目标右声道音频部分;

第一获取模块702,用于基于环绕成分音频以及目标映射参数,获取渲染音频,目标映射参数通过第二音频网络训练得到;

第二获取模块703,用于基于目标多声道音频对应的主成分音频和渲染音频,获取待处理音频对应的目标多声道音频。

在本公开的一个实施例中,确定模块701,在用于基于待处理音频所对应的左声道音频和右声道音频,以及分别对应于目标多声道音频的主成分音频和环绕成分音频所属频段的频段权重参数,确定目标多声道音频对应的主成分音频和环绕成分音频时,包括:

第一确定单元,用于基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频;

第二确定单元,用于基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频。

在本公开的一个实施例中,主成分音频包括主成分左声道音频和主成分右声道音频;

第一确定单元,在用于基于左声道音频、右声道音频以及对应于主成分音频所属频段的频段权重参数,确定主成分音频时,用于:

基于对应于主成分音频所属频段的用于对左声道音频进行处理的第一频段权重参数、以及用于对右声道音频进行处理的第二频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分左声道音频;

基于对应于主成分音频所属频段的用于对左声道音频进行处理的第三频段权重参数、以及用于对右声道音频进行处理的第四频段权重参数,对左声道音频和右声道音频进行加权求和,得到主成分右声道音频。

在本公开的一个实施例中,环绕成分音频包括环绕成分左声道音频和环绕成分右声道音频;

第二确定单元,在用于基于左声道音频、右声道音频以及对应于环绕成分音频所属频段的频段权重参数,确定环绕成分音频时,用于:

基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第五频段权重参数、以及用于对右声道音频进行处理的第六频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频;

基于对应于环绕成分音频所属频段的用于对左声道音频进行处理的第七频段权重参数、以及用于对右声道音频进行处理的第八频段权重参数,对左声道音频和右声道音频进行加权求和,得到环绕成分左声道音频。

在本公开的一个实施例中,环绕成分音频包括环绕成分左声道音频和环绕成分右声道音频;

第一获取模块702,在用于基于环绕成分音频以及目标映射参数,获取渲染音频时,用于:

基于目标映射参数中用于对环绕成分左声道音频进行处理的第一目标映射参数、以及目标映射参数中用于对环绕成分右声道音频进行处理的第二目标映射参数,对环绕成分左声道音频和环绕成分右声道音频进行加权求和,得到渲染音频。

在本公开的一个实施例中,第二获取模块703,在用于基于主成分音频和渲染音频,获取待处理音频对应的目标多声道音频时,用于:

对主成分音频和渲染音频进行叠加,得到待处理音频对应的目标多声道音频。

在本公开的一个实施例中,该装置还包括训练模块,该训练模块包括:

第一获取单元,用于基于样本多声道音频,获取样本左声道音频和样本右声道音频;

第一确定单元,用于基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征,第一样本音频特征用于指示样本左声道音频和样本右声道音频的功率和,第二样本音频特征用于指示样本左声道音频和样本右声道音频的功率差,第三样本音频特征用于指示样本左声道音频和样本右声道音频的实部互相关功率;

第二确定单元,用于基于样本左声道音频、样本右声道音频、以及通过第一音频处理网络对第一样本音频特征、第二样本音频特征和第三样本音频特征处理得到的多个预测频段权重参数,确定第一样本音频和第二样本音频;

第二获取单元,用于基于第二样本音频以及通过第二音频处理网络对第二样本音频处理得到的预测映射参数,获取预测渲染音频;

第三获取单元,用于基于第一样本音频和预测渲染音频,获取预测多声道音频;

训练单元,用于基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数。

在本公开的一个实施例中,样本多声道音频包括样本左前声道音频、样本右前声道音频、样本中置声道音频、样本左环绕声道音频和样本右环绕声道音频;

第一获取单元,在用于基于样本多声道音频,获取样本左声道音频和样本右声道音频时,用于:

通过预设权重参数分别对样本中置声道音频和样本左环绕声道音频进行加权,基于加权后的结果和样本左前声道音频,确定样本左声道音频;

通过预设权重参数分别对样本中置声道音频和样本右环绕声道音频进行加权,基于加权后的结果和样本右前声道音频,确定样本右声道音频。

在本公开的一个实施例中,第一确定单元,在用于基于样本左声道音频和样本右声道音频,确定第一样本音频特征、第二样本音频特征和第三样本音频特征时,用于:

基于样本左声道音频、样本左声道音频对应的复共轭音频、样本右声道音频、样本右声道音频对应的复共轭音频以及目标平滑参数,确定第一样本音频特征和第二样本音频特征;

基于样本左声道音频与样本右声道音频对应的复共轭音频的相乘结果的实部部分,以及目标平滑因子,确定第三样本音频特征。

在本公开的一个实施例中,训练模块还包括:

第一处理单元,用于将第一样本音频特征、第二样本特征以及第三样本音频特征输入第一音频处理网络,分别通过第一音频处理网络所包括的第一线性变换层和第二线性变换层,对第一样本音频特征、第二样本特征以及第三样本音频特征进行处理,得到用于获取第一样本音频的多个预测频段权重参数、以及用于获取第二样本音频的多个预测频段权重参数。

在本公开的一个实施例中,该装置还包括:

第二处理单元,用于将第二样本音频输入第二音频处理网络,通过第二音频处理网络所包括的线性变换层,对第二样本音频进行处理,得到预测映射参数。

在本公开的一个实施例中,训练单元,在用于基于指示预测多声道音频和样本多声道音频之间的差异的目标损失函数,训练第一音频处理网络和第二音频处理网络,得到频段权重参数和目标映射参数时,用于:

基于预测多声道音频和样本多声道音频,确定第一损失函数;

基于预测多声道音频在各个声道间的幅度差异,以及样本多声道音频在各个声道间的幅度差异,确定多个第二损失函数;

基于第一损失函数和多个第二损失函数,确定目标损失函数;

基于目标损失函数训练第一音频处理网络和第二音频处理网络,直至满足训练截止条件,得到频段权重参数和目标映射参数。

应当注意,尽管在上文详细描述中提及了音频处理装置的若干模块/单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块/单元的特征和功能可以在一个模块/单元中具体化。反之,上文描述的一个模块/单元的特征和功能可以进一步划分为由多个模块/单元来具体化。

本公开实施例还提供了一种计算机可读存储介质。图8是本公开根据一示例性实施例示出的一种计算机可读存储介质的示意图,如图8所示,该存储介质上存储有计算机程序801,该计算机程序801被处理器执行时可以执行本公开任一实施例所提供的音频处理方法。

本公开实施例还提供了一种计算设备,该计算设备可以包括存储器、处理器,该存储器用于存储可在处理器上运行的计算机指令,该处理器用于在执行该计算机指令时实现本公开任一实施例所提供的音频处理方法。参见图9,图9是本公开根据一示例性实施例示出的一种计算设备的结构示意图,该计算设备900可以包括但不限于:处理器910、存储器920、连接不同系统组件(包括存储器920和处理器910)的总线930。

其中,存储器920存储有计算机指令,该计算机指令可以被处理器910执行,使得处理器910能够执行本公开任一实施例所提供的音频处理方法。存储器920可以包括随机存取存储单元RAM921、高速缓存存储单元922和/或只读存储单元ROM923。该存储器920还可以包括:具有一组程序模块924的程序工具925,该程序模块924包括但不限于:操作系统、一个或多个应用程序、其他程序模块和程序数据,这些程序模块一种或多种组合可以包含网络环境的实现。

总线930例如可以包括数据总线、地址总线和控制总线等。该计算设备900还可以通过I/O接口940与外部设备950通信,该外部设备950例如可以是键盘、蓝牙设备等。该计算设备900还可以通过网络适配器960与一个或多个网络通信,例如,该网络可以是局域网、广域网、公共网络等。如图9所示,该网络适配器960还可以通过总线930与计算设备900的其他模块进行通信。

本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,程序被计算设备900的处理器910执行时,可以实现本公开任一实施例所提供的音频处理方法。

此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

技术分类

06120114695058