掌桥专利:专业的专利平台
掌桥专利
首页

编码方法、装置、程序以及记录介质

文献发布时间:2023-06-19 11:27:38


编码方法、装置、程序以及记录介质

本申请为以下专利申请的分案申请:申请日为2015年5月15日,申请号为201580041465.4,发明名称为“编码方法、装置、以及记录介质”。

技术领域

本发明涉及音响信号的编码技术。尤其,涉及将音响信号变换为频域而进行编码的编码技术。

背景技术

在声音或音乐等音响信号的编码中,将输入音响信号在频域进行编码的方法正在被广泛使用。作为音响信号的频域上的编码方法,有例如非专利文献1或非专利文献2的方法。

在非专利文献1所记载的编码方法中,进行使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理。具体地,在非专利文献1所记载的编码方法中,对从输入音响信号中得到的能够变换为线性预测系数的系数进行编码从而得到线性预测系数码,通过能够变换为与线性预测系数码对应的量化后的线性预测系数的系数所对应的频谱包络系数列,编码对与输入音响信号对应的频域系数列进行正规化而得到的正规化系数列,从而得到正规化系数码。能够变换为线性预测系数的系数是指,线性预测系数其本身、PARCOR系数(偏自相关系数)或者LSP参数等。

在非专利文献2所记载的编码方法中,取得划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值的差分,进行伴随差分值可变长度编码的编码处理。具体地,在非专利文献2所记载的编码方法中,将与输入音响信号对应的频域系数列划分为越低频则采样数越少而越高频则采样数越多的频域,得到划分后的每个频域的平均能量,将该平均能量通过对数轴进行量化。对量化后的值、与将相邻的频域的平均能量同样通过对数轴进行量化后的值的差分进行可变长度编码。使用划分后的每个频域的通过对数轴量化后的平均能量,适应性地决定各频域系数的量化比特数或各频域系数的量化步长,从而对各频域系数进行量化,进而对其进行可变长度编码。

现有技术文献

非专利文献

非专利文献1:Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.

非专利文献2:M.Bosi and R.E.Goldberg,”Introduction to Digital AudioCoding and Standards”,Kluwer Academic Publishers,2003.

发明内容

发明要解决的课题

根据非专利文献2的编码方法,在输入音响信号的频谱包络的起伏不大的情况或频谱的集中度不高的情况下,通过对平均能量的差分进行可变长度编码从而能够减少平均能量码的码量,因此,能够高效地对输入音响信号进行编码。可是,在输入音响信号的频谱包络的起伏大的情况或频谱的集中度高的情况下,对平均能量的差分进行可变长度编码而得到的平均能量码的码量变多。

对此,根据非专利文献1的编码方法,通过能够变换为线性预测系数的系数,能够高效地对频谱包络进行编码,因此,在输入音响信号的频谱包络的起伏大的情况或频谱的集中度高的情况下,能够比非专利文献2的编码方法更高效地对输入音响信号进行编码。可是,在输入音响信号的频谱包络的起伏不大的情况或频谱的集中度不高的情况下,不能如非专利文献2的编码方法那样高效地进行编码。

如此,在以往的编码方法中,存在根据输入音响信号的特性而不能高效地进行编码的情况。

本发明的目的在于,提供一种编码方法、装置、程序以及记录介质,与输入音响信号的特性无关地,高效地进行编码,且能够得到收听者感到不自然的情况较少的解码音响信号。

用于解决课题的手段

本发明的一个方式的编码方法是,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码的编码方法,所述编码方法包含:决定步骤,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理。

本发明的一个方式的编码方法是,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码的编码方法,所述编码方法包含:决定步骤,在前一帧的输入音响信号的高频分量的能量的大小和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,在并非如此的情况下,根据输入音响信号的高频分量为稀疏的状态,决定是设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理,还是将与前一帧相同的编码处理决定作为当前帧的编码处理。

本发明的一方式的编码方法是,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码的编码方法,所述编码方法包含:第一编码步骤,使用基于能够变换为与输入音响信号对应的线性预测系数的系数的频谱包络,对与输入音响信号对应的频域的系数列进行编码;第二编码步骤,针对与输入音响信号对应的频域的系数列,伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码,进行编码;以及决定步骤,在当前帧的输入音响信号的频谱的起伏大的情况或者集中度高的情况下,设为能够决定将当前帧通过第一编码步骤来进行编码,在当前帧的输入音响信号的频谱的起伏小的情况或者集中度低的情况下,设为能够决定将当前帧通过第二编码步骤来进行编码。

发明效果

通过能够按每个帧选择在频域上进行编码的多个编码处理的其中一个的结构,从而能够得到收听者感到不自然的情况较少的解码音响信号。

附图说明

图1是示例了编码装置的结构的框图。

图2是示例了解码装置的结构的框图。

图3是表示编码方法的处理的流程的例的图。

图4是表示决定部380的处理的流程的例的图。

图5是表示适合编码处理判定部382的处理的流程的例的图。

图6是表示第二实施方式的切换决定部383的处理的流程的例的图。

图7是表示第三实施方式的适合编码处理判定部382的处理的流程的例的图。

图8是第一编码处理以及第二编码处理的概念图。

具体实施方式

[第一实施方式]

以下,说明本发明的第一实施方式。第一实施方式是如下的结构:在通过进行在频域上的编码处理的多个不同的编码处理的其中一个而对与每个帧的输入音响信号对应的频域的系数列进行编码的结构中,仅在输入音响信号或者/以及与输入音响信号对应的频域的系数列的高频分量的能量小的情况下,进行编码处理的切换。输入音响信号的高频分量的能量是指,输入音响信号的高频分量的能量的大小本身、或高频分量的能量在输入音响信号中占据的大小等。

<编码装置300>

编码装置300的结构在图1中示出。编码装置300具备:频域变换部110、决定部380、第一编码部101、第二编码部201。第一编码部101具备:例如,线性预测分析编码部120、频谱包络系数列生成部130、包络正规化部140、正规化系数编码部150。第二编码部201具备:例如,领域分割部220、平均对数能量差分可变长度编码部240、系数编码部250。在编码装置300中,以规定的时间区间即帧为单位,时域的声音音响数字信号(以下,设为输入音响信号。)被输入,按每个帧进行以下的处理。以下,设为当前的输入音响信号是第f个帧,对各部的具体处理进行说明。将第f个帧的输入音响信号设为x

以下,针对编码装置300的动作进行说明。通过编码装置300,执行在图3中示例的编码方法的各步骤的处理。

<频域变换部110>

频域变换部110将输入音响信号x

此外,当在第一编码部101、第二编码部201、决定部380中通过多个精度或方法得到的频域的系数列为必须的情况下,在频域变换部110中,通过多个精度或方法得到频域的系数列即可。例如,在第一编码部101和第二编码部201将MDCT系数列作为频域的系数列来使用,且决定部380将功率谱(power spetrum)序列作为频域的系数列来使用的情况下,频域变换部110从输入音响信号中求出MDCT系数列和功率谱序列即可。此外,例如,在第一编码部101和第二编码部201将MDCT系数列作为频域的系数列来使用,且决定部380将每个频带的能量的序列作为频域的系数列来使用的情况下,频域变换部110从输入音响信号中求出MDCT系数列和每个频带的能量的序列即可。此外,例如,在第一编码部101和第二编码部201将MDCT系数列作为频域的系数列来使用,且决定部380的切换可否判定部381将每个频带的能量的序列作为频域的系数列来使用,且决定部380的适合编码处理判定部382将功率谱序列作为频域的系数列来使用的情况下,频域变换部110从输入音响信号中求出MDCT系数列和每个频带的能量的序列和功率谱序列即可。

<决定部380>

决定部380在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个比规定的阈值小的情况下,能够将与前一帧不同的编码处理决定为当前帧的编码处理(步骤S380)。

换而言之,决定部380进行如下判定,进行切换控制以使根据该判定结果来对当前帧的频域的系数列进行编码,其中,所述判定是在至少输入音响信号的高频分量的能量小的情况下,允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在并非如此的情况下不允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。

决定部380具备:例如,切换可否判定部381、适合编码处理判定部382、切换决定部383、切换部384。以下,针对决定部380的一例进行说明。决定部380进行在图4中示例的各步骤的处理。

<切换可否判定部381>

切换可否判定部381在前一帧的输入音响信号的高频分量的能量的大小、与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个比规定的阈值小的情况下,判定为可切换、即能够通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,在并非如此的情况下判定为不可切换、即不允许通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,并输出判定结果(步骤S381)。

以下,对切换可否判定部381的动作的例进行说明。首先,说明作为输入音响信号的高频分量的能量的大小,使用MDCT系数列的高频的能量的例。

切换可否判定部381首先分别通过下述的式(1)求出前一帧的MDCT系数列X

【数1】

切换可否判定部381接着在前一帧的高频的能量Eh

另外,在当前帧的步骤S3811中求出的前一帧的高频的能量Eh

接着,说明作为输入音响信号的高频分量的能量的大小,使用高频的能量相对于MDCT系数列的全部能量的比例的例。

切换可否判定部381首先分别通过下述的式(1A)来求出前一帧的高频的能量相对于MDCT系数列X

【数2】

切换可否判定部381接着在前一帧的高频的能量相对于全部能量的比例Eh’

另外,在当前帧的步骤S3811中求出的前一帧的高频的能量相对于全部能量的比例Eh’

另外,在上述的2个例中,在Eh

此外,在上述的例中,使用MDCT系数列求出了高频的能量或高频的能量相对于全部能量的比例,但是,也可以使用功率谱序列或每个频带的能量的序列来求出高频的能量或高频的能量相对于全部能量的比例。

<适合编码处理判定部382>

适合编码处理判定部382判定与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理的哪一个,并输出判定结果(步骤S382)。

以下,说明适合编码处理判定部382的动作的一例。适合编码处理判定部382进行在图5中示例的各步骤的处理。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。

在该例中,在输入音响信号的频谱包络的起伏大或者/以及集中度高的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理,在输入音响信号的频谱包络的起伏小或者/以及集中度低的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理,并输出判定结果。

作为估计频谱的起伏或集中度的方法,可以采用任意的方法,在以下的例中,针对估计频谱或者该包络的谷的深度的结构进行说明。在该结构中,在频谱或者该包络的谷浅时被判定为频谱的起伏小且集中度低,在频谱或者该包络的谷深时被判定为频谱的起伏大且集中度高。频谱或者该包络的谷浅也可以说成是噪声基地(noise floor)高。此外,频谱或者该包络的谷深也可以说成是噪声基地低。

适合编码处理判定部382首先将当前帧的MDCT系数列X

适合编码处理判定部382接着求出部分系数列XS

【数3】

适合编码处理判定部382接着针对功率的平均值或者功率的平均值的对数值的序列AVE

【数4】

AVE

适合编码处理判定部382接着求出与满足式(4)的q对应的Vally个AVE

【数5】

适合编码处理判定部382接着在所有的部分领域的AVE

此外,在步骤S3821中,也可以设为对每个部分系数列不同的采样数。例如,也可以将当前帧的MDCT系数列X

<切换决定部383>

切换决定部383根据切换可否判定部381得到的切换可否的信息、和适合编码处理判定部382得到的哪个编码处理适合的信息,决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,并输出能够确定所决定的编码处理的码即切换码(步骤S383)。所输出的切换码被输入至解码装置400。在此,切换决定部383在为不可切换的情况下,不论当前帧适合的编码处理是哪个编码处理,都决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。此外,在为可切换的情况下,不论前一帧的编码处理是哪个编码处理,都决定通过当前帧适合的编码处理来对当前帧的频域的系数列进行编码。其中,也可以包含如下情况:即使在为可切换的情况下,也决定为不是通过当前帧适合的编码处理,而是通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。

以下,说明切换决定部383的动作的一例。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。

切换决定部383在切换可否判定部381得到的切换可否的信息表示不可切换的情况、以及/或者、适合编码处理判定部382得到的哪个编码处理适合的信息表示与前一帧的MDCT系数列X

即,在前一帧的MDCT系数列X

此外,在前一帧的MDCT系数列X

在切换可否判定部381得到的切换可否的信息表示可切换的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息表示与前一帧的MDCT系数列X

<切换部384>

切换部384进行控制以使将频域变换部110输出的MDCT系数列X

例如,在第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,且第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量与相邻的频域的平均能量之差分的可变长度编码的编码处理的情况下,由于仅在第一编码部101中当前帧的输入音响信号x

<第一编码部101、第二编码部201>

第一编码部101和第二编码部201都进行将频域的系数列编码的编码处理,但是,进行的编码处理相互不同。即,第一编码部101通过与第二编码部201不同的编码处理来对当前帧的频域的系数列进行编码,输出作为所得到的码的第一码(步骤S101)。此外,第二编码部201通过与第一编码部101不同的编码处理来对当前帧的频域的系数列进行编码,输出作为所得到的码的第二码(步骤S201)。例如,第一编码部101进行使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201进行使用了划分后的每个频域的系数的平均能量的编码处理。

以下,说明第一编码部101和第二编码部201的动作的一例。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量与相邻的频域的平均能量之差分的可变长度编码的编码处理。

在该例中,第一编码部101的第一编码处理是如图8的左边示例那样通过能够变换为线性预测系数的系数来表现频域的频谱包络形状的处理。另一方面,第二编码部201的第二编码处理是如图8的右边示例那样通过比例因子带(scale factor band;频域系数列的向多个领域的划分)来表现包络形状的处理。根据第二编码处理,由于使用各领域的平均的高度的差分值的可变长度编码,因此,在平均值平滑变化的情况下,也可以说效率非常好。

基于决定部380的决定或者选择的结果,进行作为在频域中的多个编码处理的第一编码部101的处理以及第二编码部201的处理之中的一个。

<第一编码部101>

第一编码部101具备:线性预测分析编码部120、频谱包络系数列生成部130、包络正规化部140、正规化系数编码部150。在第一编码部101中,输入当前帧的MDCT系数列X

<线性预测分析编码部120>

线性预测分析编码部120对输入音响信号x

<频谱包络系数列生成部130>

频谱包络系数列生成部130得到与线性预测分析编码部120得到的能够变换为量化后的线性预测系数的系数对应的功率谱包络系数列W

<包络正规化部140>

包络正规化部140使用频谱包络系数列生成部130得到的功率谱包络系数列W

<正规化系数编码部150>

正规化系数编码部150对包络正规化部140得到的正规化MDCT系数列XN

<第二编码部201>

此外,第二编码部201具备:领域分割部220、平均对数能量差分可变长度编码部240、系数编码部250。在第二编码部201中,输入当前帧的MDCT系数列X

<领域分割部220>

领域分割部220将频域变换部110得到的MDCT系数列X

<平均对数能量差分可变长度编码部240>

平均对数能量差分可变长度编码部240针对领域分割部220得到的各部分领域,求出部分领域中包含的系数的平均能量,针对部分领域的平均能量分别在对数轴上进行量化,对与相邻的部分领域的平均能量的对数轴上的量化值之差进行可变长度编码,得到平均能量码CA

平均对数能量差分可变长度编码部240首先通过式(5)而求出各部分领域r(r=1,...,R)的平均能量E

【数6】

平均对数能量差分可变长度编码部240接着针对各部分领域,进行平均能量E

【数7】

平均对数能量差分可变长度编码部240接着对平均对数能量差分DiffE

<系数编码部250>

系数编码部250使用平均对数能量差分可变长度编码部240得到的平均能量的对数领域上的量化值Q(log(E

【数8】

系数编码部250首先考虑与各领域对应的平均能量的对数领域上的量化值Q(log(E

系数编码部250接着根据各部分领域的平均能量的量化值Q(E

系数编码部250接着将各部分领域系数列的各系数以所决定的步长和比特数进行量化,进而对量化后的各系数的整数值进行可变长度编码,得到系数码CD

<解码装置400>

在图2中示出解码装置400的结构。解码装置400具备:切换部480、第一解码部401以及第二解码部501。第一解码部401具备:例如,线性预测解码部420、频谱包络系数列生成部430、正规化系数解码部450以及包络逆正规化部440。第二解码部501具备:例如,平均对数能量差分可变长度解码部540以及系数解码部550。在解码装置400中,以作为规定的时间区间的帧为单位,输入包含切换码和输入码的码。在是由第一编码部101编码后的帧的情况下,输入码包含线性预测系数码CL

以下,说明解码装置400的动作。

<切换部480>

切换部480根据所输入的切换码,决定将当前帧的输入码在第一解码部401中进行解码还是在第二解码部501中进行解码,进行控制以使将输入码输入至第一解码部401或者第二解码部501,使得能够进行所决定的解码处理(步骤S480)。

具体地,切换部480在所输入的切换码是用于确定第一编码部101的编码处理的码、即用于确定使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理的码的情况下,进行控制以使将输入码输入至进行与第一编码部101的编码处理对应的解码处理的第一解码部401。此外,在所输入的切换码是用于确定第二编码部201的编码处理的码、即用于确定伴随着划分后的每个频域的系数的平均能量与相邻的频域的平均能量之差分的可变长度编码的编码处理的码的情况下,进行控制以使将输入码输入至进行与第二编码部201的编码处理对应的解码处理的第二解码部501。

<第一解码部401>

第一解码部401具备:线性预测解码部420、频谱包络系数列生成部430、正规化系数解码部450、包络逆正规化部440。在第一解码部401中,输入当前帧的线性预测系数码CL

<线性预测解码部420>

线性预测解码部420对输入码中包含的线性预测系数码CL

<频谱包络系数列生成部430>

频谱包络系数列生成部430得到与线性预测解码部420得到的能够变换为解码后的线性预测系数的系数对应的功率谱包络系数列W

<正规化系数解码部450>

正规化系数解码部450对所输入的正规化系数码CN

<包络逆正规化部440>

包络逆正规化部440使用频谱包络系数列生成部430得到的功率谱包络系数列W

<第二解码部501>

第二解码部501具备:平均对数能量差分可变长度解码部540、系数解码部550。在第二解码部501中,输入当前帧的平均能量码CA

<平均对数能量差分可变长度解码部540>

平均对数能量差分可变长度解码部540对所输入的平均能量码CA

平均对数能量差分可变长度解码部540首先对平均能量码CA

平均对数能量差分可变长度解码部540接着对每个部分领域,将对数领域上的能量的差DiffE

【数9】

平均对数能量差分可变长度解码部540接着得到将平均能量的对数领域上的解码值Q(log(E

<系数解码部550>

系数解码部550使用在平均对数能量差分可变长度解码部540中得到的解码平均能量Q(E

<时域变换部410>

时域变换部410将N点的解码MDCT系数列^X

根据第一实施方式,由于仅在输入音响信号的高频的能量小的情况下能够进行编码处理以及解码处理的切换,因此,即使在安装了高频分量的量化特性不同的多个编码处理以及解码处理的情况下,也能够得到收听者感到不自然的情况较少的解码音响信号。

根据第一实施方式,此外,不实际尝试进行编码,就能够选择在使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理和使用了划分后的每个频域的系数的平均能量的编码处理之中适合于输入音响信号的编码处理,因此,能够通过较少的演算处理量来进行适合于输入音响信号的编码处理。

根据第一实施方式,进而,能够从使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理和使用了划分后的每个频域的系数的平均能量的编码处理之中选择编码处理并进行编码,因此,无论是输入音响信号的频谱的起伏大的情况或者集中度高的情况下还是并非如此的情况下,都能够与输入音响信号的特性无关地进行高效率的编码处理。

[第二实施方式]

在第一实施方式中,在输入音响信号的高频分量的能量的大小较大的情况下必定通过与前一帧的编码处理相同的编码处理来对当前帧的频域的系数列进行编码,但是,在第二实施方式中,即使在输入音响信号的高频分量的能量的大小较大的情况下,也在输入音响信号的高频分量为稀疏的状态下,允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。

第二实施方式的编码装置在输入音响信号的高频分量的能量小的情况下,能够将与前一帧不同的编码处理决定为当前帧的编码处理,在并非如此的情况下,根据输入音响信号的高频分量为稀疏的状态,决定是能够将与前一帧不同的编码处理决定为当前帧的编码处理,还是将与前一帧相同的编码处理决定为当前帧的编码处理。

第二实施方式的编码装置的结构是与第一实施方式相同的图1。在第二实施方式的编码装置300中,除了决定部380内的切换可否判定部381和切换决定部383的处理不同的部分以外,与第一实施方式的编码装置300是相同的。第二实施方式的解码装置的结构是与第一实施方式相同的图2,各部的处理与第一实施方式的解码装置也是相同的。以下,说明进行与第一实施方式的编码装置300不同的处理的决定部380内的切换可否判定部381和切换决定部383。

<切换可否判定部381>

切换可否判定部381在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个比规定的阈值小的情况下,判定为可切换、即设为能够通过与对前一帧的频域的系数列进行编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,并输出判定结果(步骤S381)。在上述以外的情况下,即没有判定为可切换也没有判定为不可切换,将表示没有判定为任一个的信息作为判定结果进行输出,或者不输出判定结果。作为输入音响信号的高频分量的能量的大小,也可以使用高频的能量,也可以使用高频的能量相对于全部能量的比例,这与第一实施方式是同样的。

<切换决定部383>

切换决定部383根据切换可否判定部381得到的切换可否的信息、适合编码处理判定部382得到的哪个编码处理适合的信息、从输入音响信号求出的输入音响信号的高频分量是否稀疏的状态,决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,输出能够确定所决定的编码处理的码即切换码(步骤S383B)。所输出的切换码被输入至解码装置400。

在切换可否判定部381得到的切换可否的信息为可切换的情况下,即在输入音响信号的高频分量的能量小的情况下,切换决定部383进行与第一实施方式的切换决定部383相同的处理。在切换可否判定部381得到的切换可否的信息表示没有判定为任一个的情况下、或者没有对切换可否判定部381输入判定结果的情况下,即输入音响信号的高频分量的能量大的情况下,基于从输入音响信号求出的输入音响信号的高频分量是否稀疏的状态,决定是否允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。

以下,说明切换决定部383的动作之中与第一实施方式的切换决定部383不同的部分、即输入音响信号的高频分量的能量大的情况下的切换决定部383的动作的一例。在以下的例中,与第一实施方式同样地,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。切换决定部383进行例如图6的步骤S3831B至S3836B的处理。

切换决定部383首先将当前帧的MDCT系数列X

切换决定部383接着求出部分系数列XS

切换决定部383还求出MDCT系数列X

【数10】

切换决定部383接着求出q在预先设定的Q

【数11】

AVE

切换决定部383接着在峰的领域的个数为阈值TH3以下的情况下,判定为当前帧的输入音响信号的高频分量稀疏,在峰的领域的个数超过阈值TH3的情况下,判定为当前帧的输入音响信号的高频分量不稀疏(步骤S3835B)。在此,阈值TH3是根据预先决定的规则而决定的值,使得在与当前帧相近的过去的帧的输入音响信号的高频分量稀疏的情况下成为比与当前帧相近的过去的帧的输入音响信号的高频分量不稀疏的情况更大的值。例如,在与当前帧相近的过去的帧的输入音响信号的高频分量稀疏的情况下将预先决定的TH3_1设为阈值TH3,在与当前帧相近的过去的帧的输入音响信号的高频分量不稀疏的情况下将比TH3_1更小的值的预先决定的TH3_2设为阈值TH3。在此,与当前帧相近的过去的帧是指,例如前一帧或2帧前的帧等。当前帧的输入音响信号的高频分量是否稀疏的判定结果直到至少2帧后为止存储在切换决定部383内。

切换决定部383接着基于前一帧的编码处理、和针对当前帧以及与当前帧相近的过去的帧的输入音响信号的高频分量是否稀疏的判定结果,决定将当前帧的频域的系数列在第一编码部101和第二编码部201的哪一个中进行编码(步骤S3836B)。即,决定是否允许通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码。

例如,切换决定部383针对之前的帧的MDCT系数列X

此外,切换决定部383针对之前的帧的MDCT系数列X

另外,切换决定部383在允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,基于适合编码处理判定部382得到的哪个编码处理适合的信息,决定当前帧的频域的系数列的编码处理。例如,切换决定部383在允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,即使在前一帧的MDCT系数列X

另外,切换决定部383在即使允许了通过与前一帧的编码处理不同的编码处理来对当前帧的频域的系数列进行编码的情况下,在根据编码装置300中未图示的部件得到的其他的信息已判定为应该通过与前一帧的编码处理相同的编码处理来对当前帧的频域的系数列进行编码的情况下,也可以通过与前一帧的编码处理相同的编码处理来对与当前帧的输入音响信号对应的频域的系数列进行编码。

此外,在步骤S3831B中也可以设为对每个部分系数列不同的采样数。例如,也可以将当前帧的MDCT系数列X

此外,在适合编码处理判定部382进行了与步骤S3831B或步骤S3832B或步骤S3833B的处理相同的处理的情况下,切换决定部383也可以使用由适合编码处理判定部382进行的处理结果,而不进行步骤S3831B或步骤S3832B或步骤S3833B。

[第三实施方式]

在第一实施方式以及第二实施方式中使用1个阈值来判定当前帧适合的编码处理,但是,第三实施方式进行使用了2个阈值的判定。

第三实施方式的编码装置的结构是与第一实施方式相同的图1。第三实施方式的编码装置300除了决定部380内的适合编码处理判定部382和切换决定部383的处理不同的部分以外,与第一实施方式或者第二实施方式的编码装置300是相同的。第三实施方式的解码装置的结构是与第一实施方式相同的图2,各部的处理与第一实施方式的解码装置也是相同的。以下,说明进行与第一实施方式的编码装置300不同的处理的决定部380内的适合编码处理判定部382和切换决定部383。

<适合编码处理判定部382>

适合编码处理判定部382进行图7中示例的各步骤的处理。适合编码处理判定部382判定与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理的哪一个,换而言之,判定是否进行其中一个编码处理就可以,并输出判定结果(步骤S382A)。

以下,对适合编码处理判定部382的动作的一例进行说明。适合编码处理判定部382进行图7中示例的各步骤的处理。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。

在该例中,适合编码处理判定部382在输入音响信号的频谱包络的起伏大或者/以及集中度高的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理,在输入音响信号的频谱包络的起伏小或者/以及集中度低的情况下,判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理,在输入音响信号的频谱包络的起伏为中等程度或者/以及集中度为中等程度的情况下,判定为与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都可以、即适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理,并输出判定结果。

在输入音响信号的频谱包络的起伏为中等程度或者/以及集中度为中等程度的情况下,如后述那样,在切换决定部383中决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。即,在切换决定部383中,决定当前帧的编码处理,使得由于在前一帧和当前帧之间编码处理切换而收听者感到不自然的情况较少。因此,输入音响信号的频谱包络的起伏为中等程度或者/以及集中度为中等程度的情况不仅仅包含与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理都可以的情况、或适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况,还包含很难说与当前帧的输入音响信号对应的频域的系数列适合第一编码部101的编码处理和第二编码部201的编码处理的哪一个编码处理的情况、或有可能与当前帧的输入音响信号对应的频域的系数列不适合第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况。即,也可以将上述的“适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理”的判定,读作“无法判别对于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的适合性”的判定。

作为估计频谱的起伏或集中度的方法,也可以采用任意的方法,但是,对估计频谱包络的谷的深度的结构进行说明。在该结构中,在频谱包络的谷浅时判定为频谱的起伏小且集中度低,在频谱包络的谷深时判定为频谱的起伏大且集中度高,在频谱包络的谷的深度为中等程度时判定为频谱的起伏为中等程度且集中度为中等程度。

适合编码处理判定部382进行与第一实施方式的适合编码处理判定部382相同的步骤S3821至S3825、和与第一实施方式的适合编码处理判定部382不同的步骤S3826A。以下,对与第一实施方式的适合编码处理判定部382不同的部分进行说明。

适合编码处理判定部382在步骤S3825之后,进行使用了阈值TH2_1,TH2_2的下面的判定处理以及后述的适合信息的输出(步骤S3826A)。

适合编码处理判定部382在所有的部分领域的AVE

此外,适合编码处理判定部382在所有的部分领域的AVE

此外,适合编码处理判定部382在所有的部分领域的AVE

之后,适合编码处理判定部382对适合的编码处理的信息即适合信息进行输出。适合信息是适合编码处理判定部382的判定结果,也可以称作其中一个或者双方的编码处理是否适合的信息。

另外,适合编码处理判定部382也可以设为如下结构:仅在判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理的其中一个的情况下,输出表示适合于第一编码部101的编码处理的信息或者表示适合于第二编码部201的编码处理的信息,在判定为与当前帧的输入音响信号对应的频域的系数列进行第一编码部101的编码处理和第二编码部201的编码处理的哪一个编码处理都可以、即适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,不输出判定结果。

<切换决定部383>

切换决定部383根据切换可否判定部381得到的切换可否的信息、和适合编码处理判定部382得到的其中一个或者双方的编码处理是否适合的信息、即适合的编码处理的信息(适合信息),决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,对能够确定所决定的编码处理的码即切换码进行输出(步骤S383A)。所输出的切换码被输入至解码装置400。在此,切换决定部383在是不可切换的情况下,不论当前帧适合的编码处理是哪一个编码处理,都决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。此外,切换决定部383在是可切换、且当前帧适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,决定通过与前一帧相同的编码处理来对当前帧的频域的系数列进行编码。此外,切换决定部383在是可切换、且当前帧适合于第一编码部101的编码处理和第二编码部201的编码处理的其中一个的情况下,不论前一帧的编码处理是哪一个编码处理,都决定通过当前帧适合的编码处理来对当前帧的频域的系数列进行编码。

以下,说明切换决定部383的动作的一例。在以下的例中,第一编码部101的编码处理是非专利文献1中示例的、使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理,第二编码部201的编码处理是非专利文献2中示例的、伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理。

切换决定部383在切换可否判定部381得到的切换可否的信息表示不可切换的情况、以及/或者、适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示与前一帧的MDCT系数列X

即,切换决定部383在前一帧的MDCT系数列X

此外,切换决定部383在前一帧的MDCT系数列X

切换决定部383在切换可否判定部381得到的切换可否的信息表示可切换的情况、且适合编码处理判定部382得到的哪个编码处理适合的信息(适合信息)表示与前一帧的MDCT系数列X

另外,在将适合编码处理判定部382设为在判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下不输出判定结果的结构的情况下,切换决定部383在没有输入适合的编码处理的信息的情况下,进行上述的哪个编码处理适合的信息(适合信息)表示适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下的处理即可。

[第一变形例]

在当前帧的输入音响信号适合非专利文献1中示例的使用了基于能够变换为线性预测系数的系数的频谱包络的编码处理、和非专利文献2中示例的伴随着划分后的每个频域的系数的平均能量的对数值与相邻的频域的平均能量的对数值之差分的可变长度编码的编码处理的哪一个编码处理的判定中,除了输入音响信号的频谱包络的起伏的大小或集中度之外,还可以进行包含其他的信息的判定。

例如,即使在与前一帧的输入音响信号对应的频域的系数列通过第一编码部101编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。即,编码装置300是如下的结构即可:在与前一帧的输入音响信号对应的频域的系数列通过第一编码部101编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201进行编码。

此外,相反地,即使在与前一帧的输入音响信号对应的频域的系数列通过第二编码部201编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。即,编码装置300是如下的结构即可:在与前一帧的输入音响信号对应的频域的系数列通过第二编码部201编码、切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101进行编码。

此外,例如,在第三实施方式的编码装置300中,即使在与前一帧的输入音响信号对应的频域的系数列通过第一编码部101编码、适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,在切换可否判定部381判定为可切换、且根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。

此外,相反地,即使在与前一帧的输入音响信号对应的频域的系数列通过第二编码部201编码、适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的第二编码部201的编码处理中的任一个编码处理的情况下,在切换可否判定部381判定为可切换、且根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。

即,第三实施方式的编码装置300是如下的结构即可:在切换可否判定部381判定为可切换、且适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过与前一帧相同的编码处理来进行编码。

[第二变形例]

在将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码的决定中,也可以不使用切换可否判定部381得到的切换可否的信息。在该情况下,在决定部380内也可以不具备切换可否判定部381。

在该情况下,切换决定部383不使用切换可否判定部381得到的切换可否的信息,而是根据适合编码处理判定部382得到的适合信息,决定将当前帧的频域的系数列在第一编码部101中进行编码还是在第二编码部201中进行编码,对能够确定所决定的编码处理的码即切换码进行输出。

例如,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码即可。

在该情况下,与第一变形例同样地,也可以进行包含其他的信息的判定。例如,即使在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。

相反地,即使在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。

即,作为如下结构即可:在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理进行编码。此外,作为如下结构即可:在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第二编码部201的编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码。

此外,例如,在第三实施方式的编码装置300中,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况之中,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第一编码部101来进行编码。

此外,在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况之中,在根据编码装置300中未图示的部件得到的其他的信息而判定为应该将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201的编码处理来进行编码的情况下,也可以将与当前帧的输入音响信号对应的频域的系数列通过第二编码部201来进行编码。

即,第三实施方式的编码装置300是如下的结构即可:在适合编码处理判定部382判定为与当前帧的输入音响信号对应的频域的系数列适合于第一编码部101的编码处理和第二编码部201的编码处理中的任一个编码处理的情况下,能够决定将与当前帧的输入音响信号对应的频域的系数列通过与前一帧相同的编码处理来进行编码。

另外,在上述的各实施方式中的、计算出的值和阈值的比较中,在计算出的值与阈值为相同的值的情况下,设定为分类到以阈值为边界而相邻的2个情况的任一个即可。即,也可以将是某个阈值以上的情况作为比该阈值大的情况,并且,将比该阈值小的情况作为是该阈值以下的情况。此外,也可以将比某个阈值大的情况作为是该阈值以上的情况,并且,将是该阈值以下的情况作为比该阈值小的情况。

例如,在第一实施方式中,决定部380也可以在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个是规定的阈值以下的情况下,能够将与前一帧不同的编码处理决定作为当前帧的编码处理(步骤S380)。

此外,在第二实施方式中,切换可否判定部381也可以在前一帧的输入音响信号的高频分量的能量的大小、和当前帧的输入音响信号的高频分量的能量的大小的至少其中一个是规定的阈值以下的情况下,判定为可切换、即能够通过与对前一帧的频域的系数列进行了编码的编码处理不同的编码处理来对当前帧的频域的系数列进行编码,并输出判定结果。

此外,在第一实施方式中,适合编码处理判定部382在所有的部分领域的AVE

此外,在第三实施方式中,适合编码处理判定部382在所有的部分领域的AVE

在编码装置以及编码方法中所说明的处理不仅可以根据记载的顺序按时间序列执行,也可以根据执行处理的装置的处理能力或者根据需要,并行地或者单独地执行。

此外,在将编码方法中的各步骤通过计算机来实现的情况下,编码方法应该具有的功能的处理内容由程序来记述。然后,将该程序在计算机中进行执行,从而其各步骤在计算机上被实现。

记述了该处理内容的程序能够记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如,磁记录装置、光盘、光磁记录介质、半导体存储器等任意介质均可。

此外,各处理部件也可以设为通过在计算机上执行规定的程序而构成,也可以设为将这些处理内容的至少一部分以硬件方式来实现。

另外,不言而喻的是在不脱离本发明的宗旨的范围能够适当地进行变更。

相关技术
  • 图像编码装置、图像解码装置、图像编码方法、图像解码方法、图像编码程序、图像解码程序、以及记录了图像编码程序的计算机可读记录介质、记录了图像解码程序的计算机可读记录介质
  • 图像编码设备、图像编码方法、记录介质和程序以及图像解码设备、图像解码方法、记录介质和程序
技术分类

06120112938386