掌桥专利:专业的专利平台
掌桥专利
首页

用于处理音频信号的方法和装置,音频解码器和音频编码器

文献发布时间:2023-06-19 11:32:36


用于处理音频信号的方法和装置,音频解码器和音频编码器

分案说明

本申请是申请日为2015年7月3日、申请号为201580040572.5、发明名称为“用于处理音频信号的方法和装置,音频解码器和音频编码器”的发明专利申请的分案申请。

技术领域

本发明涉及音频信号领域,更具体地涉及用于处理包括多个音频帧的音频信号的方法,其中减少或省略了相继的经滤波的音频帧之间的不连续性。

背景技术

在音频信号处理的领域中,可以出于各种原因来对音频信号进行滤波,例如,可以在音频信号编码器中使用长期预测滤波器,以衰减或甚至完全抑制音频信号中的一组谐波。

音频信号包括多个音频帧,并且使用长期预测滤波器对帧进行滤波。当考虑音频信号的两个相继帧,过去帧和当前帧时,使用具有一组参数c的线性滤波器H(z)来对音频信号进行滤波。更具体地,使用第一组参数c

H(z)=1-g·z

其中滤波器参数是增益“g”和音调滞后“T”。在更一般的形式中,长期预测滤波器可以描述如下:

H(z)=1-g·A(z)·z

其中A(z)是FIR滤波器。长期预测滤波器可以用于衰减或甚至完全抑制音频信号中的一组谐波。然而,当使用这样的长期预测滤波器时,以及当过去帧滤波器参数c

因此,考虑到上述的对相继帧的滤波导致不连续性,而不连续性进而可能产生不期望的伪像的问题,需要去除可能的不连续性的技术。涉及去除音频信号的经滤波的帧的不连续性的几种现有技术方法在本领域中是已知的。

在线性滤波器H(z)是FIR滤波器的情况下,用当前帧的滤波器参数c

在其他现有技术方法中,滤波器H(z)可以是具有递归部的滤波器,例如IIR滤波器。在这种情况下,在逐个样本的基础上应用上面关于图2描述的方法。在第一步骤中,处理始于利用过去帧n-1的滤波器参数c

用于从相继经滤波的帧中去除不连续性的上述已知方法的示例例如在US 5,012,517 A中在变换编码器的上下文中描述,在EP 0732687 A2中在语音带宽扩展器的上下文中描述,在US 5,999,899 A中在变换音频编码器的上下文中描述,或在US 7,353,168 B2中在解码语音后置滤波器的上下文中描述。

虽然上述方法对于去除不期望的信号不连续性是有效的,但是由于这些方法为了有效起见对当前帧的特定部分即开始部分进行操作,该帧部分的长度必须足够长,例如在帧长度为20ms的情况下,该帧部分或开始部分长度可以长达5ms。在某些情况下,这可能太长了,特别是在过去帧滤波器参数c

发明内容

本发明的目的是提供一种用于去除经滤波的音频帧之中的不连续性而不在经滤波的音频信号中产生任何潜在失真的改进方法。

该目的通过根据独立权利要求的方法和装置来实现。

本发明提供一种用于处理音频信号的方法,所述方法包括使用线性预测滤波去除所述音频信号的经滤波的过去帧与经滤波的当前帧之间的不连续性。

线性预测滤波器可以定义为

其中M是滤波器阶数,并且am是滤波器系数(其中a

根据实施例,所述方法包括:对所述音频信号的当前帧进行滤波,并且通过用以下信号修改经滤波的当前帧的开始部分来去除不连续性,所述信号通过对预定义信号进行线性预测滤波来获得,其中线性预测编码滤波器的初始状态基于过去帧的最后部分来定义。

根据实施例,所述线性预测滤波器的初始状态基于未经滤波的过去帧的最后部分来定义,其中,对所述未经滤波的过去帧的最后部分使用用于对当前帧进行滤波的滤波器参数集合来滤波。

根据实施例,所述方法包括在经滤波或未滤波的音频信号上估计线性预测滤波器。

根据实施例,估计线性预测滤波器包括使用Levinson-Durbin算法,基于音频信号的过去经滤波的帧或基于音频信号的过去帧或当前帧来估计滤波器。

根据实施例,线性预测滤波器包括音频编解码器的线性预测滤波器。

根据实施例,去除所述不连续性包括处理所述经滤波的当前帧的开始部分,其中,所述当前帧的开始部分具有小于或等于所述当前帧的样本总数的预定义数量的样本,并且其中,处理所述当前帧的开始部分包括从所述经滤波的当前帧的开始部分中减去零输入响应(ZIR)的开始部分。

根据实施例,所述方法包括使用非递归滤波器(如FIR滤波器)对音频信号的当前帧进行滤波,以产生经滤波的当前帧。

根据实施例,所述方法包括使用如IIR滤波器的递归滤波器逐样本地处理音频信号的未经滤波的当前帧,并且其中,处理当前帧的开始部分的样本包括:

使用递归滤波器,用当前帧的滤波器参数对样本进行滤波以产生经滤波的样本,以及

从经滤波的样本中减去对应的ZIR样本,以产生经滤波的当前帧的对应样本。

根据实施例,重复滤波和减去,直到处理了当前帧的开始部分中的最后一个样本为止,并且其中所述方法还包括使用递归滤波器,用当前帧的滤波器参数对当前帧中的剩余样本进行滤波。

根据实施例,所述方法包括生成ZIR,其中生成ZIR包括:

利用滤波器和用于对当前帧进行滤波的滤波器参数对未经滤波的过去帧的最后M个样本进行滤波,以产生经滤波的信号的第一部分,其中M是线性预测滤波器阶数,

从经滤波的信号的第一部分中减去使用过去帧的滤波器参数滤波的经滤波的过去帧的最后M个样本,以生成经滤波信号的第二部分,以及

通过用线性预测滤波器和等于经滤波信号的第二部分的初始状态对零样本的帧进行滤波来生成线性预测滤波器的ZIR。

根据实施例,所述方法包括对ZIR进行加窗,使得其幅度更快地降低到零。

本发明基于发明人的以下发现:在去除信号不连续性并导致上述附加的不想要的失真的常规方法中认识到的问题主要是因为基于过去帧的滤波器参数对当前帧或当前帧的至少一部分进行处理。根据本发明的方法,这被避免,即本发明的方法不用过去帧的滤波器参数来对当前帧的一部分进行滤波,从而避免了上述问题。根据实施例,为了去除不连续性,使用LPC滤波器(线性预测滤波器)来去除不连续性。LPC滤波器可以在音频信号上估计,因此它是音频信号的频谱形状的良好模型,使得当使用LPC滤波器时,音频信号的频谱形状将掩蔽不连续性。在实施例中,可以基于未经滤波的音频信号或基于已经由上述线性滤波器H(z)滤波的音频信号来估计LPC滤波器。根据实施例,可以通过使用音频信号(例如当前帧和/或过去帧)和Levinson-Durbin算法来估计LPC滤波器。它也可以使用Levinson-Durbin算法仅基于过去的经滤波的帧信号来计算。

在其它实施例中,用于处理音频信号的音频编解码器可以使用线性滤波器H(z),并且还可以使用量化或未量化的LPC滤波器,例如以在基于变换的音频编解码器中整形量化噪声。在这样的实施例中,这种现有LPC滤波器可以直接用于平滑不连续性,而没有估计新的LPC滤波器所需的附加复杂度。

附图说明

在下文中,将参照附图描述本发明的实施例,在附图中:

图1示出了根据常规方法处理音频信号的相继帧的框图,

图2示出了用于处理相继音频帧以去除不连续性的另一常规方法的框图,

图3示出了用于发送音频信号的系统的简化框图,其实现在编码器侧和/或在解码器侧的用于去除音频信号的相继帧之间的不连续性的本发明方法,

图4示出了描绘根据实施例的用于去除音频信号的相继帧之间的不连续性的本发明方法的流程图,

图5示出了根据本发明实施例的用于处理当前音频帧的示意性框图,其避免了输出信号中的不期望的失真,尽管去除了不连续性,

图6示出了表示图5中用于生成ZIR的块的功能的流程图,

图7示出了表示用于在滤波器块包括如MR滤波器的递归滤波器的情况下处理经滤波的当前帧的开始部分的图5中的块的功能的流程图,

图8示出了表示用于在滤波器块包括如FIR滤波器的非递归滤波器的情况下处理经滤波的当前帧的开始部分的图5中的块的功能的流程图。

具体实施方式

在下文中,将更详细地描述本发明方法的实施例,并且注意,在附图中,具有相同或类似功能的元件由相同的附图标记表示。

图3示出了用于在编码器侧和/或在解码器侧发送实现本发明方法的音频信号的系统的简化框图。图3的系统包括在输入202处接收音频信号204的编码器200。编码器包括编码处理器206,其接收音频信号204并生成在编码器的输出208处提供的经编码的音频信号。编码处理器可以被编程或构建为实现本发明的用于处理接收的音频信号的相继音频帧以避免不连续性的方法。然而,在其他实施例中,编码器不必是传输系统的一部分,它可以是生成经编码的音频信号的独立设备,或者它可以是音频信号发送器的一部分。根据实施例,编码器200可以包括天线210,以允许音频信号的无线传输,如212所示。在其他实施例中,编码器200可以使用有线连接线路输出在输出208处提供的经编码的音频信号,例如如附图标记214所示。

图3的系统还包括解码器250,所述解码器具有例如经由有线线路214或经由天线254接收要由编码器250处理的经编码的音频信号的输入252。编码器250包括对经编码的信号进行操作并在输出260处提供经解码的音频信号258的解码处理器256。解码处理器256可以被实现为根据本发明的方法对相继帧进行操作,所述相继帧以避免不连续性的方式被滤波。在其他实施例中,解码器不必是传输系统的一部分,相反,可以是用于对经编码的音频信号进行解码的独立设备,或者可以是音频信号接收器的一部分。

在下文中,将更详细地描述可以在编码处理器206和解码处理器256中的至少一个中实现的本发明方法的实施例。图4示出了根据本发明方法的实施例的用于处理音频信号的当前帧的流程图。将描述当前帧的处理,并且假设过去帧已经用下面描述的相同技术处理。根据本发明,在步骤S100中,接收音频信号的当前帧。在步骤S102中,以例如上面参照图1和2所述的方式(见滤波块102)对当前帧进行滤波。根据本发明的方法,将使用如在步骤S104处所示的线性预测滤波来去除经滤波的过去帧n-1和经滤波的当前帧n(见图1或2)之间的不连续性。根据实施例,线性预测滤波器可以定义为

其中,M是滤波器阶数,a

图5示出了根据本发明的实施例的用于处理音频信号的当前音频帧的示意性框图,其避免了输出信号中的不期望的失真,尽管去除了不连续性。在图5中,使用了和图1和2中相同的附图标记。接收音频信号100的当前帧n,音频信号100的每一个帧具有多个样本。音频信号100的当前帧n由滤波器块102处理。与图1和图2的现有技术方法相比,根据参照图5描述的实施例,基于ZIR样本进一步处理经滤波的当前帧,如框110示意性所示。根据实施例,基于过去帧n-1并且基于LPC滤波器,产生ZIR样本,如框112示意性地所示。

现在将更详细地描述处理块110和112的功能。图6示出了表示用于生成ZIR样本的处理块112的功能的流程图。如上所述,使用针对相应帧选择或确定的滤波器参数c,用线性滤波器H(z)对音频信号100的帧进行滤波。滤波器H(z)可以是递归滤波器,例如IIR滤波器,或者它可以是非递归滤波器,例如FIR滤波器。在处理块112中,使用可以量化或可以不被量化的LPC滤波器。LPC滤波器具有阶数M,并且可以在经滤波或未滤波的音频信号上估计,或者可以是也在音频编解码器中使用的LPC滤波器。在第一步骤S200中,用滤波器H(z)但使用当前帧n的滤波器参数或系数c

如上面参照图5所描述的ZIR被施加在处理块110中,参考图7的流程图来描述处理框110的功能,图7是将递归滤波器(如IIR滤波器)用作线性滤波器H(z)的情况。根据参照图5描述的实施例,为了去除当前帧和过去帧之间的不连续性,同时避免不期望的失真,对当前帧n进行滤波包括逐样本地处理(滤波)当前帧n,其中,根据本发明的方法处理开始部分的样本。更具体地,处理当前帧n的开始部分的M个样本,并且在第一步骤S300处,将变量m设置为0。在下一步骤S302中,使用滤波器H(z)和用于当前帧n的滤波器系数或参数c

根据另一个实施例,线性滤波器H(z)是非递归滤波器,如FIR滤波器,并且如上面参照图5所述的ZIR被施加在处理块110中。参考图8的流程图描述该实施例的功能。在步骤S400处,使用滤波器H(z),用当前帧的滤波器系数或参数c

本发明的方法可以应用于如上所述的对音频信号进行滤波时的情况。根据实施例,例如,当使用音频编解码器后置滤波器来降低信号谐波之间的编码噪声的水平时,本发明的方法也可以应用于解码器侧。为了在解码器处处理音频帧,根据实施例,后置滤波器可以如下:

H(z)=(1-B(z))/(1-A(z)·z

其中,B(z)和A(z)是两个FIR滤波器,并且H(z)滤波器参数是FIR滤波器B(z)和A(z)的系数,并且T表示音调滞后。在这种情景下,例如当过去帧滤波器参数c

虽然已经在装置的上下文中描述了所描述构思的一些方面,但是将清楚的是,这些方面还表示对对应方法的描述,其中,块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对对应块或者对应装置的项或特征的描述。

取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)来予以实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。因此,数字存储介质可以是计算机可读的。

根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。

通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。

其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。

换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。

因此,本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。

因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。

另一实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。

另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。

在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。

实施例1:一种用于处理音频信号(100)的方法,所述方法包括:使用线性预测滤波去除(S102、S104、S300-S308、S400-S402)所述音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性(106a、106b)。

实施例2:根据实施例1所述的方法,包括:对所述音频信号的当前帧进行滤波,并且通过以下信号修改经滤波的当前帧的开始部分来去除所述不连续性,所述信号通过对预定义信号进行线性预测滤波来获得,其中线性预测滤波器的初始状态基于过去帧的最后部分来定义。

实施例3:根据实施例2所述的方法,其中,所述线性预测滤波器的初始状态基于未经滤波的过去帧的最后部分的滤波来定义,其中,对所述未经滤波的过去帧的最后部分使用用于对当前帧进行滤波的滤波器参数集合来滤波。

实施例4:根据实施例1至3中的一项所述的方法,还包括:在经滤波或未滤波的音频信号(100)上估计所述线性预测滤波器。

实施例5:根据实施例4所述的方法,其中,估计所述线性预测滤波器包括:使用Levinson-Durbin算法,基于所述音频信号(100)的过去帧和/或当前帧或者基于所述音频信号(100)的过去的经滤波的帧来估计滤波器。

实施例6:根据实施例1至3中的一项所述的方法,其中,所述线性预测滤波器包括音频编解码器的线性预测滤波器。

实施例7:根据实施例1至6中的一项所述的方法,其中,去除所述不连续性包括处理所述经滤波的当前帧的开始部分,其中,所述当前帧的开始部分具有小于或等于所述当前帧的样本总数的预定义数量的样本,并且其中,处理所述当前帧的开始部分包括从所述经滤波的当前帧的开始部分中减去(S304、S402)零输入响应(ZIR)的开始部分。

实施例8:根据实施例7所述的方法,包括使用如FIR滤波器的非递归滤波器对所述音频信号的当前帧进行滤波(S400),以产生经滤波的当前帧。

实施例9:根据实施例7所述的方法,包括:使用如IIR滤波器的递归滤波器逐样本地处理所述音频信号的未经滤波的当前帧,并且其中,处理所述当前帧的开始部分的样本包括:使用所述递归滤波器,用所述当前帧的滤波器参数对所述样本进行滤波(S302),以产生经滤波的样本,以及从经滤波的样本中减去(S304)对应的ZIR样本,以产生经滤波的当前帧的对应样本。

实施例10:根据实施例9所述的方法,其中,重复滤波(S302)和减去(S304),直到处理了当前帧的开始部分中的最后一个样本为止,并且其中所述方法还包括:使用递归滤波器,用当前帧的滤波器参数对当前帧中的剩余样本进行滤波(S306)。

实施例11:根据实施例7至10中的一项所述的方法,包括生成所述ZIR,其中生成所述ZIR包括:用所述滤波器和用于对所述当前帧进行滤波的滤波器参数对未经滤波的过去帧的最后M个样本进行滤波(S200),以产生经滤波的信号的第一部分,其中M是所述线性预测滤波器的阶数;从经滤波的信号的第一部分中减去(S202)使用所述过去帧的滤波器参数进行滤波的经滤波的过去帧的最后M个样本,以生成经滤波的信号的第二部分;以及通过用线性预测滤波器和等于经滤波的信号的第二部分的初始状态对零样本的帧进行滤波来生成(S204)线性预测滤波器的ZIR。

实施例12:根据实施例11所述的方法,包括对所述ZIR进行加窗,使得其幅度更快地降低到零。

实施例13:一种非瞬时性计算机程序产品,包括存储指令的计算机可读介质,所述指令当在计算机上执行时执行实施例1至12中的一项所述的方法。

实施例14:一种用于处理音频信号(100)的装置,所述装置包括:处理器(102、110、112),用于使用线性预测滤波来去除所述音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性。

实施例15:一种用于处理音频信号(100)的装置,所述装置被配置为根据实施例1至12中的一项所述的方法进行操作。

实施例16:一种音频解码器(250),包括实施例14或15所述的装置。

实施例17:一种音频编码器(200),包括实施例14或15所述的装置。

上述实施例对于本发明的原理仅是说明性的。应当理解,本领域其他技术人员将清楚对于本文所述的布置和细节的修改和变形。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文实施例的描述和解释所给出的具体细节来限制。

相关技术
  • 音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法、计算机程序及音频信号
  • 音频解码器、音频编码器、用于基于已编码表示提供至少四个音频声道信号的方法、用于基于至少四个音频声道信号提供已编码表示的方法、及使用带宽扩展的计算机程序
技术分类

06120112963746