掌桥专利:专业的专利平台
掌桥专利
首页

具有优先级的空间感知多频带压缩系统

文献发布时间:2023-06-19 13:48:08


具有优先级的空间感知多频带压缩系统

技术领域

本文描述的主题涉及音频处理,并且更具体地涉及空间感知上下文中的音频信号的压缩。

背景技术

压缩是指控制音频信号的最响亮和最安静部分之间的范围。对于包括左声道和右声道的左右空间中的立体声音频信号,当左或右声道超过压缩阈值时,可以根据需要对左或右声道应用增益来达到左右空间中的压缩。然而,希望处理不在左右空间中的音频信号,诸如可以调整音频信号的空间特性的中间-侧空间。

发明内容

实施例涉及一种过程(或方法)以及一种系统和一种计算机程序产品,该计算机程序产品包括存储在非瞬态计算机可读存储介质上的指令,以用于在空间感知上下文中提供音频信号的压缩。当音频信号在左右空间中超过压缩阈值时,使用在中间-侧空间中应用的中间和侧分量的控制来压缩音频信号,以将压缩的伪影偏移到不同的空间位置。当音频信号低于扩展阈值时,该技术还可以应用于音频信号的扩展,无论是它自己单独应用还是与压缩相结合应用。

举例来说,一些实施例包括一种用于对音频信号应用压缩的方法。该方法包括根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量。该方法还包括确定第二音频坐标系中的幅度阈值,该幅度阈值定义针对第三分量和第四分量中的每个分量的水平,以用于应用压缩。该方法还包括使用第一压缩比率来生成用于第一分量的第一增益因子,该第一压缩比率定义当第一分量超过幅度阈值时第一分量超过幅度阈值的量与第一分量衰减到高于幅度阈值的量之间的关系。该方法还包括当第三分量或第四分量中的一个分量超过幅度阈值时将第一增益因子应用于第一分量,以生成经调整的第一分量。该方法还包括使用在第一音频坐标系中的经调整的第一分量和第二分量生成在第二音频坐标系中的第一输出声道和第二输出声道。

在一些实施例中,该方法还包括使用第二压缩比率生成用于第二分量的第二增益因子,该第二压缩比率定义当第二分量超过幅度阈值时第二分量超过幅度阈值的量与第二分量衰减到高于幅度阈值的量之间的关系;以及当第三分量或第四分量中的一个分量超过幅度阈值时,将第二增益因子应用于第二分量以生成经调整的第二分量。使用经调整的第一分量和第二分量生成第一输出声道和第二输出声道包括使用根据从第二分量生成的经调整的第二分量。

一些实施例包括存储程序代码的非瞬态计算机可读介质,该程序代码在被处理器执行时将处理器配置为:根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;确定第二音频坐标系中的幅度阈值,该幅度阈值定义针对第三分量和第四分量中的每个分量的水平,以用于应用压缩;使用第一压缩比率生成第一分量的第一增益因子,该第一压缩比率定义当第一分量超过幅度阈值时第一分量超过幅度阈值的量与第一分量衰减到高于幅度阈值的量之间的关系;当第三分量或第四分量中的一个分量超过幅度阈值时,将第一增益因子应用于第一分量,以生成经调整的第一分量;并且使用第一音频坐标系中的经调整的第一分量和第二分量生成第二音频坐标系中的第一输出声道和第二输出声道。

在一些实施例中,程序代码还将处理器配置为:使用第二压缩比率生成用于第二分量的第二增益因子,该第二压缩比率定义当第二分量超过幅度阈值时第二分量超过幅度阈值的量与第二分量衰减高于到幅度阈值的量之间的关系;并且当第三分量或第四分量中的一个分量超过幅度阈值时,将第二增益因子应用于第二分量,以生成经调整的第二分量。将处理器配置为使用经调整的第一分量和第二分量生成第一输出声道和第二输出声道的程序代码包括将处理器配置为使用根据从第二分量生成的经调整的第二分量的程序代码。

一些实施例包括一种用于对音频信号应用压缩的系统。该系统包括处理电路,其被配置为:根据第二音频坐标系中的音频信号的第三分量和第四分量生成第一音频坐标系中的第一分量和第二分量;确定第二音频坐标系中的幅度阈值,该幅度阈值定义针对第三分量和第四分量中的每个分量的水平,以用于应用压缩;使用第一压缩比率生成用于第一分量的第一增益因子,该第一压缩比率定义当第一分量超过幅度阈值时第一分量超过幅度阈值的量与第一分量衰减到高于幅度阈值的量之间的关系;当第三分量或第四分量中的一个分量超过幅度阈值时,将第一增益因子应用于第一分量以生成经调整的第一分量;并且使用第一音频坐标系中的经调整的第一分量和第二分量生成第二音频坐标系中的第一输出声道和第二输出声道。

在一些实施例中,处理电路还被配置为:使用第二压缩比率生成用于第二分量的第二增益因子,该第二压缩比率定义当第二分量超过幅度阈值时第二分量超过幅度阈值的量与第二分量衰减到高于幅度阈值的量之间的关系;并且当第三分量或第四分量中的一个分量超过幅度阈值时,将第二增益因子应用于第二分量以生成经调整的第二分量。被配置为使用经调整的第一分量和第二分量生成第一输出声道和第二输出声道的处理电路包括被配置为使用根据从第二分量生成的经调整的第二分量的处理电路。

附图说明

图1是根据一些实施例的音频处理系统的框图。

图2是根据一些实施例的空间压缩器的框图。

图3是根据一些实施例的频带分配器的框图。

图4A是根据一些实施例的侧分量压缩、然后是L/R压缩的框图。

图4B是根据一些实施例的中间分量压缩、然后是L/R压缩的框图。

图5是根据一些实施例的并行的中间分量压缩和侧分量压缩、然后是L/R压缩的框图。

图6A是根据一些实施例的侧分量压缩、然后是中间分量压缩、然后是L/R压缩的框图。

图6B是根据一些实施例的中间分量压缩、然后是侧分量压缩、然后是L/R压缩的框图。

图7是根据一些实施例的用于侧链处理的音频压缩器的框图。

图8是根据一些实施例的用于对音频信号进行空间压缩的过程的流程图。

图9是根据一些实施例的用于对音频信号进行空间压缩的过程的流程图。

图10是根据一些实施例的用于使用子频带对音频信号进行空间压缩的过程的流程图。

图11是根据一些实施例的用于对音频信号进行空间压缩的过程的流程图。

图12是根据一些实施例的宽带处理器的框图。

图13是根据一些实施例的计算机的框图。

仅用于说明的目的,附图描绘并且详细描述描述了各种非限制性实施例。

具体实施方式

现在将对实施例进行详细参考,其示例在附图中被图示出。在以下详细描述中,阐述了许多具体细节以便提供对各种描述的实施例的透彻理解。然而,可以在没有这些具体细节的情况下实践所描述的实施例。在其他实例中,没有详细描述众所周知的方法、过程、组件、电路和网络,以免不必要地混淆实施例的各方面。

本公开的实施例涉及使用在中间-侧(mid-side)空间中应用的控制来对左右空间中的音频信号进行范围控制。包括左声道和右声道的音频信号被转换为中间分量和侧分量。确定定义左和右声道中的每个声道所允许的最大水平的左右阈值。确定压缩特性,这样的压缩比率、补偿增益设置、包络参数以及定义中间分量和侧分量之间的压缩的优先级的分量优先级设置。当左或右声道超过左右阈值时,基于压缩特性来控制中间分量和侧分量中的更多的一个分量。经调整的分量被转换回左右空间,成为左输出声道和右输出声道,每个声道都满足左右空间中的左右阈值。

压缩可以根据中间和侧分量之间的空间限制的优先级而被定义。空间限制的优先级可以是可调整的并且定义了伪影到不同空间位置的期望偏移以满足左右阈值。

在一些实施例中,多频带压缩被用于中间分量和侧分量的不同子频带。在一些实施例中,使用跨频带压缩,其中基于从宽带音频信号导出的控制信号来控制不同的子频带。

在一些实施例中,多频带优先级压缩被应用于多输入多输出(MIMO)系统。通过合并广义侧链矩阵,可以建立跨子频带和空间声道的优先级。

通过放松不超过目标阈值的要求,可以在不需要向前看的情况下通过在正面和负面意义上不对称地平滑增益校正函数而减少增益校正伪影。此外,这些非线性平滑元素可以用针对不同声道的不同系数而被指定,从而提供将伪影偏移到更可能发生感知掩蔽的输出空间区域的能力。

在一些实施例中,将信号分解为子频带使用相位校正的4阶Linkwitz-Riley网络,但是这也可以被扩展到其他滤波器组拓扑,包括小波分解和短时傅立叶变换(STFT)方法。

示例音频处理系统

图1是根据一些实施例的音频处理系统100的框图。音频处理系统100包括电路,该电路接收包括左输入声道112和右输入声道114的输入音频信号,并且处理声道112、114的中间分量(或被称为“中间子频带分量116”的中间分量的子频带)和侧分量(或被称为“侧子频带分量118”的侧分量的子频带),以生成包括左输出声道176和右输出声道178的输出音频信号。当音频信号超过定义左和右声道的水平的左右阈值

音频处理系统100包括频带分配器162、L/R到M/S转换器102、包括空间压缩器104和L/R压缩器106的音频压缩器180、M/S到L/R转换器108、频带组合器165、宽带处理器182和控制器110。在一些实施例中,宽带处理器182可以被包括以准许跨频带侧链设置。

频带分配器162接收左输入声道112和右输入声道114并且将这些声道分离成子频带分量。左输入声道112和右输入声道114可以各自被分成n个频率子频带。左输入声道112和右输入声道114的n个频率子频带中的每个频率子频带可以对应于频率范围。对于n=4个频率子频带的示例,频率子频带(1)可以对应于0到300Hz,频率子频带(2)可以对应于300到510Hz,频率子频带(3)可以对应于510到2700Hz,并且频率子频带(4)可以对应于2700Hz到奈奎斯特频率。在一些实施例中,n个频率子频带是临界频带的合并集合。可以使用来自各种音乐流派的音频样本的语料库来确定临界频带。从样本中确定了24个巴克尺度临界频带上的中间到侧分量的长期平均能量比率。然后将具有相似长期平均比率的连续频带组合在一起以形成临界频带集合。频率子频带的范围以及频率子频带的数目可以是可调整的。在一些实施例中,所生成的子频带可以不表示频谱的连续区域,而是可以对应于被估计的声源或其他分开的音频分量。这样,频带分配器162从左输入声道112生成左子频带分量172,并且从右输入声道114生成右子频带分量174。

L/R到M/S转换器102接收左子频带分量172和右子频带分量174并且从左子频带分量172和右子频带分量174生成中间子频带分量116和侧子频带分量118。在一些实施例中,对于n个子频带中的每个子频带,可以基于子频带的左子频带分量和子频带的右子频带分量的总和来生成中间子频带分量。对于每个子频带,可以基于子频带的左子频带分量和子频带的右子频带分量之间的差来生成侧分量。可以以其他方式生成中间分量和侧分量,诸如使用基于源分离技术的各种变换。

在一些实施例中,每个子频带的中间和侧分量是从多声道(例如,环绕声)音频信号生成的。例如,可以组合多个左声道(例如,左、左环绕和左后环绕等)以生成左输入声道112,并且可以组合多个右声道(例如,右、右环绕和右后环绕等)以生成右输入声道114。这些附加的声道也可以被用来生成除了中间和侧之外的新空间轴,使用对L/R到M/S转换器102的修改以适应增加的维度。例如,正交变换可以被用来导出在感知上有意义的声道组合。在一些实施例中,这些变换可以与取代M/S到L/R转换器108的对应逆变换配对。

音频压缩器180处理中间子频带分量116和侧子频带分量118,以使得输出声道176、178每个都被限制在低于左右压缩阈值

在一些实施例中,对于每个子频带,在中间分量和侧分量之间可以存在压缩的优先级。在一些实施例中,不同的子频带可以包括用于中间和侧子频带分量之间的压缩的不同优先级或者使用不同的左右压缩阈值

L/R压缩器106包括L/R增益处理器156。L/R增益处理器156接收由空间限制器104调整的经调整的中间子频带分量120和经调整的侧子频带分量122,并且对于每个子频带,将残余增益因子α

如下文结合图4A到图6B所更详细地讨论的,针对每个子频带的增益因子α

M/S到L/R转换器108接收经调整的中间子频带分量124和经调整的侧子频带分量126,并且从经调整的中间子频带分量124和经调整的侧子频带分量126生成经调整的左子频带分量132和经调整的右子频带分量134。对于每个子频带,可以基于子频带的经调整的中间分量124和经调整的侧分量126的总和来生成经调整的左子频带分量132。对于每个子频带,可以基于子频带的经调整的中间子频带分量122和经调整的侧子频带分量124之间的差来生成经调整的右子频带分量134。其他类型的变换可以被用来从中间和侧分量生成左子频带分量和右子频带分量。这样,M/S到L/R转换器108为n个子频带中的每个子频带生成经调整的左子频带分量132和经调整的右子频带分量134。

频带组合器164接收经调整的左子频带分量132和经调整的右子频带分量134,并且生成左输出声道176和右输出声道178。可以通过组合每个经调整的左子频带分量132来生成左输出声道176。可以通过组合每个经调整的右子频带分量134来生成右输出声道178。频带组合器164将左输出声道176输出到左扬声器并且将右输出声道178输出到右扬声器。作为空间压缩器104和L/R压缩器106应用的处理的结果,当左输入声道112或右输入声道114超过左右阈值

宽带处理器182通过利用从宽带音频信号导出的控制信号140和142促进对每个子频带的控制来支持音频处理系统100的跨频带操作。宽带处理器182从宽带音频信号生成控制信号140和142,以用于通过音频压缩器180调整一个或多个子频带。宽带处理器182接收左声道112和右声道114,并且确定由音频压缩器180使用的宽带侧链信号水平。宽带处理器182可以被实现为侧链矩阵,侧链矩阵与频带分配器162和L/S到M/S转换器102并行处理音频信号。在一些实施例中,诸如对于非跨频带操作,可以省略或绕过宽带处理器182。在一些实施例中,从对宽带音频信号的变换(诸如均衡或滤波器的应用)中导出控制信号140和142。然后可以使用L/R到M/S转换器构造侧链矩阵,以从可以控制中间增益处理器152的跨频带信号140或可以控制侧增益处理器154的跨频带信号142导出新的中间-侧分量。以侧链矩阵、LR阈值

在一些实施例中,控制器110控制音频处理系统100的操作。控制器110可以被耦合到音频处理系统100的其他组件以配置它们的操作,诸如通过定义参数(例如,

在一些实施例中,音频处理系统100在空间感知上下文中提供宽带压缩。例如,频带分配器162和频带组合器164可以被省略或绕过。空间压缩器104和L/R压缩器106不是处理每个子频带的中间分量和侧分量,而是将中间分量和侧分量作为宽带分量处理,而不分离成子频带。虽然子频带的处理增加了可以被应用于音频信号的压缩类型,但宽带处理可以减少空间感知压缩的计算要求。

如上面所讨论的,L/S到M/S转换器102、空间压缩器104、L/R压缩器106以及M/S到L/R转换器108可以处理n个子频带中的每个子频带。在一些实施例中,音频处理系统100包括这些子频带处理组件的多个实例,每个实例专用于处理n个子频带中的一个子频带。多个子频带可以并行或串行地进行处理。

示例空间压缩器

图2是根据一些实施例的空间压缩器200的框图。空间压缩器200是音频处理系统100的空间压缩器104的示例。与图1中所示的空间压缩器104不同,空间压缩器200不使用来自宽带处理器182的控制信号140和142。空间压缩器200使用子频带的信息来控制应用于子频带的动态处理算法。空间压缩器200包括中间峰提取器202、侧峰提取器204、中间增益处理器206、侧增益处理器208、中间混频器210和侧混频器212。空间压缩器200的操作被讨论用于n个子频带中的一个子频带的中间和侧子频带分量的处理。可以对n个子频带中的每个子频带执行类似的操作。在另一示例中,空间压缩器200提供宽带处理,其中中间和侧分量不分离成子频带。

中间峰提取器202接收中间子频带分量116并且确定表示中间子频带分量116的峰值的中间峰214。中间峰提取器202将中间峰214提供给中间增益处理器206和侧增益处理器208。侧峰提取器204接收侧子频带分量118并且确定表示侧子频带分量118的峰值的侧峰216。侧峰提取器204将侧峰216提供给中间增益处理器206和侧增益处理器208。

中间增益处理器206基于中间峰214、侧峰216、左右空间中的压缩阈值

中间混频器210接收中间子频带分量116和中间增益因子218(α

在一些实施例中,L/R压缩器级与空间压缩器200集成。中间增益处理器206将残余增益因子α

频带分配器

图3是根据一些实施例的频带分配器300的框图。频带分配器300是音频处理系统100的频带分配器162的示例。频带分配器300将诸如左输入声道112或右输入声道114的音频信号分离成子频带分量318、320、322和324。

频带分配器包括具有相位校正的4阶Linkwitz-Riley分频器的级联,以允许在输出处进行相干求和。频带分配器300包括低通滤波器302、高通滤波器304、全通滤波器306、低通滤波器308、高通滤波器310、全通滤波器312、高通滤波器316和低通滤波器314。

低通滤波器302和高通滤波器304包括具有转角频率(例如,300Hz)的四阶Linkwitz-Riley分频器,并且全通滤波器306包括匹配的二阶全通滤波器。低通滤波器308和高通滤波器310包括具有另一转角频率(例如,510Hz)的四阶Linkwitz-Riley分频器,并且全通滤波器312包括匹配的二阶全通滤波器。低通滤波器314和高通滤波器316包括具有另一转角频率(例如,2700Hz)的四阶Linkwitz-Riley分频器。这样,频带分配器300产生:与包括0到300Hz的子频带(1)相对应的子频带分量318,与包括300到510Hz的子频带(2)相对应的子频带分量320,与包括510到2700Hz的频率子频带(3)相对应的子频带分量322,以及与包括2700Hz到奈奎斯特频率的子频带(4)相对应的子频带分量324。在该示例中,频带分配器300生成n=4个子频带分量。由频带分配器300生成的子频带分量的数目和它们对应的频率范围可以变化。由频带分配器300生成的子频带分量允许诸如通过频带组合器164无偏差完美求和。虽然频带分配器300被讨论作为被应用于左右空间中的左和右声道,但是在一些实施例中,将宽带分量分离成子频带可以被应用于中间-侧空间中的中间和侧分量。在一些实施例中,由频带分配器300定义的子频带可以包括不连续的频率集合。在一些实施例中,那些组成频率可以根据直接的用户规范或响应于输入信号而随时间变化。

左右空间到中间-侧空间坐标变换

压缩,无论是针对宽带还是单独的子频带,都可以被应用于输入音频信号的中间分量116和侧分量118中的一个分量或两者。为了创建中间分量116和侧分量118,L/S到M/S转换器102可以使用变换M来将信号从左右空间转换到中间-侧空间,如等式1所定义:

在中间-侧空间中,可以在中间或侧分量中执行各种处理,包括子频带空间处理、串扰处理(例如,串扰消除或串扰模拟)、串扰补偿(例如,调整由串扰处理所引起的频谱伪影)以及增益应用。诸如通过M/S到L/R转换器108,经处理的中间和侧分量被转换到左右空间作为用于左扬声器的左输出声道和用于右扬声器的右输出声道。

用于将信号从中间-侧空间转换到左右空间的逆变换M

等式1和2可以比真正的正交形式更优选,其中正向和逆向变换都按2的平方根进行缩放,以降低计算复杂度。

优先级压缩

一个声道相对于另一声道(在子频带内)的优先级是部分地通过排列增益校正操作的顺序来确定的。因此,除了最终的L/R增益校正之外,这些操作的呈现顺序可以有所不同。在存在优先级层次的情况下,用于(多个)较低优先级声道的增益因子是相对于(多个)增益校正的较高优先级声道来定义的。在优先级层次完全是水平的情况下,参考未校正的声道数据来确定用于每个声道的增益因子。增益校正计算步骤涉及在另一种意义上可以对基于声道的增益校正优先级进行编码的约束。

图4A是根据一些实施例的侧分量压缩然后是L/R压缩的框图。首先是侧压缩器级402,然后是左右压缩器级404。在侧压缩器级402处,侧增益因子α

图4B是根据一些实施例的中间分量压缩然后是L/R压缩的框图。首先是中间压缩器级406,然后是左右压缩器级404。在中间压缩器级406处,中间增益因子α

图5是根据一些实施例的并行的中间分量压缩和侧分量压缩、然后是L/R压缩的框图。首先,存在与中间压缩器级504并联的侧压缩器级502,以及在并联级502和504之后的L/R压缩器级506。在侧压缩器级502处,侧增益因子α

图6A是根据一些实施例的侧分量压缩、接着是中间分量压缩、接着是L/R压缩的框图。首先是侧压缩器级602,以使得侧分量是用于压缩的主要分量,然后是中间压缩器级604,以使得中间分量是用于压缩的次要分量,然后是L/R限制器级606。在压缩器级602处,侧增益因子α

图6B是根据一些实施例的中间分量压缩、接着是侧分量压缩、接着是L/R压缩的框图。首先是中间压缩器级604,以使得中间分量是用于压缩的主要分量,然后是侧压缩器级602,以使得侧分量是用于压缩的次要分量,然后是L/R压缩器级606。在压缩器级604处,中间增益因子α

主要声道增益校正

下面讨论一个示例,其中,侧分量接收主要校正并且中间分量接收次要校正(例如,如图6A中所示)。用于控制中间分量和侧分量中的每个分量的适当增益控制系数是基于中间和侧能量而被生成的。当侧分量是用于校正的主要声道时,侧增益因子由等式3定义:

其中

如等式3所定义,侧增益因子α

次要声道增益校正

次要声道的增益因子的计算,在这种情况下为α

其中r1是用于中间分量m1的压缩比率。压缩比率r1定义了当中间分量超过幅度阈值时,中间分量超过左右阈值

如公式4所定义,中间增益因子a

残余声道增益校正

如果为a

其中r

其中P

增益因子应用

一旦增益因子a

其中最小侧增益系数θ

如等式7所定义,如果侧增益因子a

如果侧增益因子a

如果侧增益因子a

在增益降低的两级(例如,中间和侧)被赋予同等优先级的情况下,增益校正系数是彼此并行计算的,并且a

补偿增益

以上在等式3、4和5中讨论的增益因子a

其中μ是用于适当分量的补偿增益因子,它与r和θ的分量相匹配。如果r

侧链处理

图7是根据一些示例实施例的用于侧链处理的空间压缩器700的框图。空间压缩器700是空间压缩器104的示例。侧链处理在由低频引起的泵浦伪影存在于交叉级中的情况下特别有用。由于混音中的流行惯例可以包括将低频(例如,低音)居中,因此中间分量的低频可以需要比侧分量的低频更多的增益降低。

音频压缩器700包括混合峰提取器702、侧峰提取器704、中间增益处理器706、侧增益处理器708、中间混频器710、侧混频器712、开关752和开关754。

中间峰提取器702经由开关752从宽带处理器182选择性地接收中间子频带分量116或用于中间分量的控制信号140中的一个。中间峰提取器702确定表示控制信号140或中间子频带分量116的峰值的中间峰714。中峰提取器702将中峰714提供给中间增益处理器706和侧增益处理器708。侧峰值提取器704经由开关754从宽带处理器182选择性地接收侧子频带分量118或用于侧分量的控制信号142。侧峰提取器704确定表示控制信号142或侧子频带分量118的峰值的侧峰716。侧峰提取器704将侧峰峰值716提供给中间增益处理器706和侧增益处理器708。

中间增益处理器706基于中间峰714、侧峰716和左右空间中的阈值

侧链处理可以基于用于中间增益因子α

其中每个条目都是独立的操作符。操作符矩阵提供能力来不仅基于宽带空间特性,而且还基于大量其他特性(诸如频率内容等)来对增益控制进行优先级排序。条目MM是定义了中间分量116对中间增益因子a

在利用侧链处理实现优先级的示例中,侧增益处理器708使用等式3确定包括侧增益因子a

中间混频器710接收中间子频带分量116和增益因子718并且将这些值相乘以生成经调整的中间子频带分量124。侧混频器712接收侧子频带分量118和增益因子720并且将这些值相乘以生成经调整的侧子频带分量126。

空间压缩器700可以对n个子频带中的每个子频带的中间子频带分量116和侧子频带分量118执行处理。不同的子频带可以包括不同的增益因子。在一些实施例中,诸如当音频信号没有被分离成多个子频带时,空间压缩器700执行宽带中间分量和宽带侧分量的处理。中间峰提取器702和侧峰提取器704的相应输入处的开关752和754在空间压缩器700的两种有区别的配置之间进行选择。中间峰提取器702和侧峰提取器704可以从控制信号140和142或者从中间子频带分量116和侧子频带分量118导出中间峰714和侧峰716。当以这种方式将控制信号140和142从分量116和118解耦以在中间混频器710和侧混合器712处衰减时,其结果被称为“侧链”压缩。

控制信号平滑

上述增益控制等式适用于瞬时增益值。如果这些值在没有平滑的情况下被逐样本地应用,则结果将在适当的子空间中被有效地控制硬削波。由此产生的伪影本质上是增益控制函数的高频率调制。为了减少这些伪影,非线性低通滤波器可以限制增益控制函数的斜率。在期望完全因果增益控制响应的情况下,向下钳位可以立即发生,但向上移动被限制于某个最大斜率。在可以在控制缓冲器中向前看(look ahead)的情况下,可以应用最大负向下斜率限制(由向前看长度确定)并且仍然在适当的峰值处达到目标控制增益。这两种变体都将伪影偏移到音乐声音的瞬态阶段,在那里它们被感知掩蔽,并且同时降低了它们的带宽。在一些实施例中,多变量(例如,而不是标量值)平滑函数被用于提供空间感知压缩。

示例过程

图8是根据一些实施例的用于对音频信号进行空间压缩的过程800的流程图。当音频信号在左右空间中超过阈值时,过程800通过控制音频信号的中间和侧分量来提供对音频信号进行压缩。过程800使用宽带处理,该宽带处理不将音频信号分离成多个子频带。过程800可以具有更少或更多的步骤,并且可以以不同的顺序执行步骤。

音频处理系统(例如,音频压缩器180或控制器110)确定805左右阈值。左右阈值

音频处理系统(例如,音频压缩器180或控制器110)确定810音频信号的左右峰值能量何时超过左右阈值。例如,音频处理系统确定左声道何时超过左右阈值并且确定右声道何时超过左右阈值。

音频处理系统(例如,L/R到M/S转换器102)从音频信号生成815中间分量和侧分量。例如,响应于确定左声道的峰值或右声道的峰值超过左右阈值,可以将左右空间中的音频信号转换到中间-侧空间以进行空间压缩。中间分量和侧分量可以从音频信号的左和右声道来被确定,如等式1中所定义的。中间分量和侧分量表示中间-侧空间中的音频信号,并且左声道和右声道表示左右空间中的音频信号。中间分量可以包括左声道和右声道的总和。侧分量可以包括左声道和右声道之间的差。在一些实施例中,当左和右声道的峰没有超过左右阈值时,可以绕过空间压缩。

音频处理系统(例如,音频压缩器180或控制器110)确定820压缩特性。可以为音频信号的左、右、中间或侧分量定义压缩特性。这些特性可以包括与动态范围控制相关的参数,诸如压缩比率、补偿增益设置或包络参数(例如冲击/释放时间等)。

在一些实施例中,音频处理系统在中间和侧分量之间实现空间压缩的优先级。例如,压缩特性可以包括定义中间分量和侧分量之间的压缩的优先级的分量优先级设置。空间压缩优先级设置的一些实施例可以包括仅中间、仅侧、中间在侧之前或侧在中间之前的指定。在两个空间分量都被控制的实施例中,可以通过确定可以被应用于每个分量的最大处理量来导出给定优先级指定内的进一步变体。

音频处理系统(例如,音频压缩器180的空间压缩器104)控制825中间分量或侧分量中的至少一个以符合压缩特性。例如,音频处理系统确定如等式3定义的用于侧分量的侧增益因子a

音频处理系统(例如,音频压缩器180的L/R压缩器106)控制830中间和侧分量,以使得剩余的峰能量在左右空间中被对称地控制。例如,中间增益因子a

音频处理系统(例如,M/S到L/R转换器108)从中间分量和侧分量生成835左输出声道和右输出声道。根据应用到中间分量和侧分量中的每个分量的控制,左和右输出声道的每个输出声道都被限制低于左右阈值。

过程800的步骤可以以不同的顺序来执行。例如,可以在确定左右峰能量何时超过左右阈值之前生成中间和侧分量。在一些实施例中,可以在将中间分量和侧分量转换为左和右分量之后执行左右空间中对剩余峰能量的对称控制。在这里,控制可以被应用于左右空间中的左和右分量而不是中间-侧空间中的中间和侧分量。

图9是根据一些实施例的用于对音频信号进行空间压缩的过程900的流程图。当音频信号在左右空间中超过左右阈值

音频处理系统(例如,频带分配器162)将音频信号分离905成子频带。例如,音频处理系统确定与每个子频带相关联的分频频率并且根据分频频率将音频信号划分为子频带分量。

在步骤910-940中,音频处理系统分开地处理子频带。每个子频带可以包括左分量和右分量。空间压缩可以被应用于子频带中的一个或多个子频带。在一些实施例中,并行处理多个子频带。关于图8中所示的过程800中的宽带信号的步骤805-830的讨论,可以对于每个子频带而分别适用于步骤910-935。

音频处理系统(例如,音频压缩器180)确定910子频带的左右阈值。子频带的左右阈值

音频处理系统(例如,音频压缩器180或控制器110)确定915子频带的左右峰能量何时超过左右阈值。例如,音频处理系统确定子频带的左分量何时超过子频带的左右阈值并且确定子频带的右分量何时超过左右阈值。

音频处理系统(例如,L/R到M/S转换器102)从子频带的左和右分量生成920中间子频带分量和侧子频带分量。例如,响应于确定子频带的左分量的峰或右分量的峰超过左右阈值,可以将左右空间中的子频带分量转换到中间-侧空间以用于空间压缩。中间子频带分量可以包括子频带分量的左声道和右声道的总和。侧子频带分量可以包括子频带分量的左声道和右声道之间的差。

音频处理系统(例如,音频压缩器180或控制器110)确定925子频带的压缩特性。压缩特性可以包括压缩比率、补偿增益设置或包络参数(例如,冲击/释放时间等)。在一些实施例中,压缩特性可以包括定义中间子频带分量和侧子频带分量之间的压缩的优先级的分量优先级设置。不同的子频带可以使用不同的压缩特性。

音频处理系统(例如,音频压缩器180的空间压缩器104)控制930中间子频带分量或侧子频带分量中的至少一个分量以符合压缩特性。

音频处理系统(例如,音频压缩器180的L/R压缩器106)控制935中间和侧子频带分量,以使得剩余峰能量在左右空间中被对称地控制。

音频处理系统(例如,M/S到L/R转换器108)从中间子频带分量和侧子频带分量生成940左子频带分量和右子频带分量。

音频处理系统(例如,频带组合器164)将多个子频带的左子频带分量组合945成左输出声道,并且将多个子频带的右子频带分量组合成右输出声道。每个子频带可以包括用于每个子频带的左子频带分量和右子频带分量,并且子频带被组合以生成左和右输出声道。

过程900的步骤可以以不同的顺序来执行。例如,可以在确定左右峰能量何时超过子频带的左右阈值之前生成子频带的中间和侧子频带分量。在一些实施例中,可以在将中间子频带分量和侧子频带分量转换为左和右子频带分量之后执行左右空间中对剩余峰能量的对称控制。在这里,控制可以被应用于左右空间中的左和右分量而不是中间-侧空间中的中间和侧分量。

图10是根据一些实施例的用于使用子频带对音频信号进行空间压缩的过程1000的流程图。过程1000包括使用从宽带音频信号导出的控制信号来控制每个子频带的跨频带处理。音频信号被分离成多个子频带,并且可以基于针对子频带的控制信号对不同的子频带应用不同的空间压缩。当音频信号在左右空间中超过阈值

音频处理系统(例如,频带分配器162或控制器110)将音频信号分开1005成子频带。例如,音频处理系统确定与每个子频带相关联的分频频率并且根据分频频率将音频信号划分为子频带分量。在步骤1010-1045中,音频处理系统分开地处理多个子频带。

音频处理系统(例如,宽带处理器182或控制器110)通过处理宽带音频信号来生成1010用于子频带的控制信号。控制信号可以定义与子频带的压缩相关的期望信号水平。在一些实施例中,宽带音频信号的处理是使用侧链矩阵来执行的,其中与步骤1015-1020中的个体子频带的处理并行地执行宽带处理。不同的子频带可以包括不同的控制信号。在一些实施例中,从对宽带音频信号的变换诸如均衡或滤波器的应用中导出控制信号。然后可以使用L/R到M/S转换器构造侧链矩阵,以从控制信号中导出新的中间-侧分量,每个控制信号可以控制中间增益处理器152或侧增益处理器154。中间增益处理器152和侧增益处理器154中的每个然后可以以侧链矩阵所确定的方式处理中间子频带分量116和侧子频带分量118,就好像它们具有控制信号的特性一样。由于控制信号是从左和右声道112和114中导出的,并且以侧链矩阵、LR阈值

音频处理系统(例如,音频压缩器180或控制器110)确定1015子频带的左右阈值。子频带的左右阈值定义了子频带的左和右分量中的每个分量所允许的最大水平。不同的子频带可以具有不同的左右阈值。

音频处理系统(例如,音频压缩器180或控制器110)确定1020子频带的左右峰能量何时超过左右阈值。例如,音频处理系统确定子频带的左分量何时超过子频带的左右阈值并且确定子频带的右分量何时超过左右阈值。

音频处理系统(例如,L/R到M/S转换器102)从子频带的左和右分量生成1025中间子频带分量和侧子频带分量。例如,响应于确定子频带的左分量的峰或右分量的峰超过左右阈值,可以将左右空间中的子频带分量转换到中间-侧空间以用于空间压缩。中间子频带分量可以包括子频带分量的左声道和右声道的总和。侧子频带分量可以包括子频带分量的左声道和右声道之间的差。

音频处理系统(例如,音频压缩器180或控制器110)确定1030子频带的压缩特性。压缩特性可以包括压缩比率、补偿增益设置或包络参数(例如,冲击/释放时间等)。在一些实施例中,压缩特性可以包括定义中间子频带分量和侧子频带分量之间的压缩的优先级的分量优先级设置。不同的子频带可以使用不同的压缩特性。

音频处理系统(例如,音频压缩器180的空间压缩器104)基于控制信号来控制1035中间子频带分量或侧子频带分量中的至少一个分量以符合压缩特性。控制信号可以定义宽带侧链信号水平。可以使用L/R到M/S转换器构造侧链矩阵(确定以下的权重:控制中间分量的侧链信号的中间分量,控制中间分量的侧链信号的侧分量,控制侧分量的侧链信号的中间分量,以及控制侧分量的侧链信号的侧分量),以从控制信号中导出新的中间-侧分量,每个控制信号可以控制要被处理的信号的中间或侧分量(例如,通过中间增益处理器152或侧增益处理器154)。中间子频带分量116和侧子频带分量118中的任一个然后可以以侧链矩阵、LR阈值

音频处理系统(例如,音频压缩器180的L/R压缩器106)控制1040中间和侧子频带分量,以使得剩余峰能量在左右空间中被对称地控制。

音频处理系统(例如,M/S到L/R转换器108)从中间子频带分量和侧子频带分量生成1045左子频带分量和右子频带分量。

音频处理系统(例如,频带组合器164)将多个子频带的左子频带分量1050组合成左输出声道,并且将多个子频带的右子频带分量组合成右输出声道。每个子频带可以包括用于每个子频带的左子频带分量和右子频带分量,并且子频带被组合以生成左和右输出声道。

过程1000的步骤可以以不同的顺序来执行。例如,可以在确定左右峰能量何时超过子频带的左右阈值之前生成子频带的中间和侧子频带分量。在一些实施例中,可以在将中间子频带分量和侧子频带分量转换为左和右子频带分量之后执行左右空间中对剩余峰能量的对称控制。在这里,控制可以被应用于左右空间中的左和右分量而不是中间-侧空间中的中间和侧分量。

图11是根据一些示例实施例的用于使用不同音频坐标系对音频信号进行空间压缩的过程1100的流程图。当音频信号超过第二音频坐标系中的幅度阈值时,过程1200通过控制第一音频坐标系中的音频信号的第一分量和第二分量来提供对音频信号进行压缩。过程1200可以具有更少或更多的步骤,并且可以以不同的顺序执行步骤。

音频处理系统(例如,音频处理系统100)根据第二音频坐标系中的音频信号的第三分量和第四分量生成1105第一音频坐标系中的第一分量和第二分量。第一音频坐标系可以是中间-侧音频坐标系并且第二音频坐标系可以是左右音频坐标系,如上面结合图1到图10所讨论的。第一和第二分量可以包括中间和侧分量。第三和第四分量可以包括左和右分量。在另一示例中,第一音频坐标系可以是左右音频坐标系并且第二音频坐标系可以包括中间-侧音频坐标系。第一和第二分量可以包括左和右分量。第三和第四分量可以包括中间和侧分量。在一些实施例中,第一、第二、第三和第四分量是子频带分量。

音频处理系统确定1110第二音频坐标系中的幅度阈值,该幅度阈值定义第三分量和第四分量中的每个分量的水平,以用于应用压缩。幅度阈值在与其中增益因子被应用于压缩以满足幅度阈值的音频坐标系不同的音频坐标系中被定义。

音频处理系统使用第一压缩比率生成1115用于第一分量的第一增益因子。第一压缩比率可以定义当第一分量超出幅度阈值时第一分量超过幅度阈值的量与第一分量衰减到高于幅度阈值的量之间的关系。第一增益因子可以包括第一分量增益因子(例如,当侧分量是第一分量时为a

当第三分量或第四分量中的一个分量超过幅度阈值时,音频处理系统将第一增益因子应用于1120第一分量以生成经调整的第一分量。当第三或第四分量超过幅度阈值时,将第一增益因子应用于第一分量导致第一分量被衰减。

音频处理系统使用第二压缩比率生成1125用于第二分量的第二增益因子。第二压缩比率可以定义当第二分量超过幅度阈值时第二分量超过幅度阈值的量与第二分量衰减到高于幅度阈值的量之间的关系。

第二增益因子可以包括第二分量增益因子(例如,当侧分量是第二分量时为a

当第三分量或第四分量中的一个分量超过幅度阈值时,音频处理系统将第二增益因子应用于1130第二分量以生成经调整的第二分量。当第三或第四分量超过幅度阈值时,将第二增益因子应用于第二分量导致第二分量被衰减。

在一些实施例中,第一分量比第二分量具有更高的用于压缩的优先级。在这里,使用第一增益因子生成第二增益因子。在一些实施例中,最小第一增益因子或最小第二增益因子可以被用来控制第一和第二增益因子的应用。最小增益因子定义了分量的增益降低预算。例如,音频处理系统可以确定用于第一分量的最小第一增益因子和用于第二分量的最小第二增益因子,确定使用第一压缩比率生成的第一增益因子的第一分量增益因子是否超过最小第一增益因子,以及确定使用第二压缩比率生成的第二增益因子的第二分量增益因子是否超过最小第二增益因子。

如果第一分量增益因子超过最小第一增益因子,那么第一分量增益因子作为第一增益因子而被应用于第一分量并且第二增益因子不被应用于第二分量。如果第一分量增益因子没有超过最小第一增益因子并且第二分量增益因子超过最小第二增益因子,那么将第一分量增益因子作为第一增益因子而被应用于第一分量,并且第二分量增益因子作为第二增益因子而被应用于第二分量。如果第一分量增益因子增益因子没有超过最小第一增益因子并且第二分量增益因子没有超过最小第二增益因子,那么第一分量增益因子和残余增益因子作为第一增益因子而被应用于第一分量并且第二最小增益因子和残余增益因子作为第二增益因子而被应用于第二分量。

在一些实施例中,第一分量具有与第二分量相同的用于压缩的优先级。使用第一压缩比率生成的第一增益因子的第一分量增益因子独立于第二增益因子而被生成,并且使用第二压缩比率生成的第二增益因子的第二分量增益因子独立于第一增益因子而被生成。此外,音频处理系统可以确定应用第一分量增益因子之后的第一分量和应用第二分量增益因子之后的第二分量的总和是否超过幅度阈值。响应于总和超过幅度阈值,第一和第二增益因子可以各自包括残余增益因子。

在一些实施例中,诸如第一、第二、第三和第四分量是子频带的子频带分量的情况下,可以基于包括子频带的音频信号的多个子频带来确定第一压缩比率和第二压缩比率(以及其他压缩特性)。在一些实施例中,宽带音频信号可以被用来确定被用于一个或多个子频带的压缩特性。

在一些实施例中,平滑函数可以被应用于第一或第二增益因子以减少压缩的伪影。

音频处理系统使用第一音频坐标系中的经调整的第一分量和经调整的第二分量来生成1135第二音频坐标系中的第一输出声道和第二输出声道。经调整的第一和第二分量是应用增益因子之后的第一和第二分量。在一些实施例中,仅调整第一分量或第二分量,并且可以仅使用一个经调整的分量和未调整的分量来生成输出声道。

示例宽带处理器

图12是根据一些实施例的宽带处理器182的框图。宽带处理器182包括L/R到M/S转换器1202和宽带处理元件1204。L/R到M/S转换器1202接收左输入声道112和右输入声道114并且生成中间分量1206和侧分量1202。宽带处理元件1204处理中间分量1206以生成控制信号140,并且处理侧分量1208以生成控制信号142。宽带处理元件1204可以包括用于中间分量1206和侧分量1208中的每个分量的均衡滤波器。宽带处理元件1204将控制信号140提供给空间压缩器104的中间增益处理器152并且将控制信号142提供给空间压缩器104的侧增益处理器154。例如,宽带处理元件可以包括M/S均衡器,着重150-250Hz范围,M/S均衡器可以被用来控制跨度500-1000Hz的子频带中的侧增益因子α

示例计算机

图13是根据一些实施例的计算机1300的框图。计算机1300是实现音频处理系统的电路的示例。图示的是耦合到芯片集1304的至少一个处理器1302。芯片集1304包括存储器控制器中心1320和输入/输出(I/O)控制器中心1322。存储器1306和图形适配器1312耦合到存储器控制器中心1320,并且显示设备1318耦合到图形适配器1312。存储设备1308、键盘1310、定点设备1314和网络适配器1316耦合到I/O控制器中心1322。计算机1300可以包括各种类型的输入或输出设备。计算机1300的其他实施例具有不同的架构。例如,在一些实施例中,存储器1306直接耦合到处理器1302。

存储设备1308包括一个或多个非瞬态计算机可读存储介质,诸如硬盘驱动器、压缩盘只读存储器(CD-ROM)、DVD或固态存储器设备。存储器1306保存由处理器1302使用的程序代码(由一个或多个指令组成)和数据。程序代码可以对应于图1到图11描述的各个处理方面。

定点设备1314与键盘1310结合使用以将数据输入到计算机系统1300中。图形适配器1312在显示设备1318上显示图像和其他信息。在一些实施例中,显示设备1318包括用于接收用户输入和选择的触摸屏功能。网络适配器1316将计算机系统1300耦合到网络。计算机1300的一些实施例具有与图13中所示的那些不同的和/或其他的组件。

其他注意事项

所公开的配置的一些示例益处和优点包括使用在中间-侧空间中应用的增益因子来压缩左右空间中的音频信号以将压缩的伪影偏移到不同的空间位置,以及用户指定的偏好。在各种类型的音频处理中使用对音频信号的中间或侧分量的处理,并且如本文所讨论的空间优先级压缩提供在中间/侧空间中与这种处理技术的计算效率更高的集成。在最低级别,这些偏好被规定为阈值,在这些阈值之间压缩器进入不同的操作方式,以及对这些操作方式进行逻辑顺序。在更高级别,这可以被理解为各种声场失真的伪影与传统动态范围处理的伪影之间的权衡。当低于扩展阈值时,本文讨论的用于压缩的技术还可以应用于音频信号的扩展。可以它自己单独或结合压缩对音频信号执行扩展。

虽然已经图示和描述了特定的实施例和应用,但是应当理解,本发明不限于本文公开的精确构造和组件,并且在不脱离本公开的精神和范围的情况下,可以在本文公开的方法和装置的布置、操作和细节方面进行对于本领域的技术人员来说将是明显的各种修改、改变和变化。

相关技术
  • 具有优先级的空间感知多频带压缩系统
  • 具有优先级的空间感知动态范围控制系统
技术分类

06120113817492