掌桥专利:专业的专利平台
掌桥专利
首页

处理视频信号的方法及其设备

文献发布时间:2023-06-19 11:21:00


处理视频信号的方法及其设备

本申请是2017年9月11日提交的国际申请日为2016年3月10日的申请号为201680014969.1(PCT/KR2016/002407)的,发明名称为“处理视频信号的方法及其设备”的专利申请的分案申请。

技术领域

本发明涉及视频处理,更具体地,涉及一种在树结构中使用递归分割处理视频信号的方法和装置。

背景技术

按照数字视频处理技术的快速发展,使用各种媒体,诸如高清数字广播、数字多媒体广播、因特网广播等等的数字多媒体服务已经被启用。随着高清数字广播变得普遍,已经开发了各种服务应用,并且需要用于高质量和高分辨率的视频图像的高速视频处理技术。为此,用于编译视频信号的标准,诸如H.265/HEVC(高效视频编译)和H.264/AVC(高级视频编译)已经积极地讨论。

发明内容

技术任务

本发明的一个技术任务是为了提供一种用于有效地处理视频信号的方法及其装置。

本发明的另一个技术任务是为了提供一种用于增加在将图片的基本处理单元递归地/重复地分割成对其应用有相同预测模式的处理单元中的编译效率的方法及其装置。

本发明的又一技术任务是为了提供一种用于用信号发送用于将图片的基本处理单元有效地分割成对其应用有相同预测模式的处理单元的信息的方法及其装置。

从本发明可获得的技术任务不受以上提及的技术任务的限制。并且,其他未提及的技术任务可以由本发明所属的技术领域的普通技术人员从以下的描述中清楚地理解。

技术方案

在本发明的第一方面,在此提供一种用于通过解码设备对用于视频信号的比特流进行解码的方法,该方法包括:从比特流获得指示当前块的分割方案的分割模式信息,该分割方案包括不分割当前块的第一方案、将当前块分割成垂直方向中的两个块的第二方案、将当前块分割成水平方向中的两个块的第三方案、以及将当前块分割成垂直和水平方向中的4个块的第四方案;当分割模式信息指示第一方案时,从比特流获得用于当前块的预测模式信息,该预测模式信息指示是否使用帧内预测模式或者帧间预测模式编译当前块,以及基于预测模式信息解码当前块;当分割模式信息指示第二到第四方案中的一个时,将当前块分割成至少两个块并且从比特流中获得用于至少两个块中的每一个的分割模式信息。

在本发明的第二方面,在此提供了一种解码设备,该解码设备被配置成对用于视频信号的比特流进行解码,该解码设备包括:存储器;和处理器,该处理器可操作地连接到存储器,其中该处理器被配置为:从比特流获得指示当前块的分割方案的分割模式信息,该分割方案包括不分割当前块的第一方案、将当前块分割成垂直方向中的两个块的第二方案、将当前块分割成水平方向中的两个块的第三方案、以及将当前块分割成垂直和水平方向中的4个块的第四方案;当分割模式信息指示第一方案时,从比特流获得用于当前块的预测模式信息,该预测模式信息指示是否使用帧内预测模式或者帧间预测模式编译当前块,并且基于预测模式信息解码当前块;并且当分割模式信息指示第二到第四方案中的一个时,将当前块分割成至少两个块,并且从比特流中获得用于至少两个块中的每一个的分割模式信息。

优选地,当分割模式信息指示第二方案时,将当前块分割成至少两个块包括:从比特流获得指示最小分割单元的最小分割单元信息,从比特流获得指示距当前块的参考位置的偏移的分割位置信息;基于最小分割单元信息和分割位置信息确定分割边界,并且将当前块分割成包括顶部块和底部块的两个块。

优选地,根据由最小分割单元信息指示的值和由分割位置信息指示的值的乘积来确定分割边界。

优选地,顶部块和底部块具有与当前块相同的水平大小。

优选地,参考位置对应于当前块的左上角样本的垂直坐标。

优选地,当分割模式信息指示第三方案时,将当前块分割成至少两个块包括:从比特流获得指示最小分割单元的最小分割单元信息,从比特流获得指示距当前块的参考位置的偏移的分割位置信息,基于最小分割单元信息和分割位置信息确定分割边界,并且将当前块分割成包括左块和右块的两个块。

优选地,根据由最小分割单元信息指示的值和由分割位置信息指示的值的乘积来确定分割边界。

优选地,参考位置对应于当前块的左上角样本的垂直坐标。

优选地,当分割模式信息指示第四方案时,将当前块分割成至少两个块包括:从比特流获得指示最小分割单元的最小分割单元信息,从比特流获得指示距当前块的参考位置的第一偏移的第一分割位置信息,基于最小分割单元信息和第一分割位置信息确定第一分割边界,从比特流获得指示距当前块的参考位置的第二偏移的第二分割位置信息,基于最小分割单元信息和第二分割位置信息确定第二分割边界,并且基于所述第一分割边界和所述第二分割边界将当前块分割成4个块。

优选地,根据由最小分割单元信息指示的值和由第一分割位置信息指示的值的乘积确定第一分割边界,并且其中根据由最小分割单元信息指示的值与由第二分割位置信息指示的值的乘积确定第二分割边界。

优选地,参考位置包括当前块的左上角样本的垂直和水平坐标。

优选地,当预测模式信息指示当前块在帧内预测模式中被编译时,解码当前块包括:将当前块分割成至少一个变换块,通过对至少一个变换块执行帧内预测获得预测值,并且基于获得的预测值重建至少一个变换块。

优选地,当预测模式信息指示当前块在帧间预测模式中被编译时,解码当前块包括:将当前块分割成至少一个预测块,获得关于该至少一个预测块的帧间预测信息,通过基于所获得的帧间预测信息执行帧间预测获得预测值,将当前块分割成至少一个变换块,获得关于至少一个变换块的残差信息,并且基于获得的预测值和获得的残差信息重建当前块。

优选地,当分割模式信息指示第二到第四方案中的一个时,该方法还包括,基于关于至少两个块中的每一个的分割模式信息对至少两个块中的每一个递归地执行解码或者分割。

有益效果

根据本发明,能够有效地处理视频信号。

此外,根据本发明,在将图片的基本处理单元递归地/重复地分割成对其应用有相同预测模式的处理单元中能够增加编译效率。

此外,根据本发明,能够通过比特流用信号发送信息使得将图片的基本处理单元有效地分割成对其应用有相同预测模式的处理单元。

从本发明可获得的效果不受以上提及的效果的限制。并且,其他未提及的效果可以由本发明所属的技术领域的普通技术人员从以下的描述中清楚地理解。

附图说明

附图被包括以提供对本发明进一步的理解,附图图示本发明的实施例,并且与该说明书一起用作解释本发明的原理。

图1图示编码过程。

图2图示解码过程。

图3是示出通过四叉树方案分割编译树块的一个示例的图。

图4是根据本发明的分割方法的流程图。

图5示出由二叉树方案分割的编译树块的一个示例。

图6示出使用混合树方案分割的编译树块。

图7示出根据本发明的非对称四叉树方案的一个示例。

图8示出用于非对称四叉树方案的中心位置的一个示例。

图9示例性地示出用于非对称四叉树方案的各种模式。

图10示出根据本发明的用于矩形树块的分割方法的一个示例。

图11示出根据本发明的由分割方法分割的编译树块的一个示例。

图12示出根据本发明的基于分割模式信息的分割方案的一个示例。

图13示出根据本发明的基于最小分割单元信息的分割偏移的示例。

图14示出根据本发明确定的分割边界的一个示例。

图15示出根据本发明的用于分割方法的语法的一个示例。

图16图示能够应用本发明的框图。

具体实施方式

在下文中描述的技术可以用于被配置为编码和/或解码视频信号的图像信号处理设备。通常地,视频信号对应于能够由眼睛识别的图像信号或者图片的序列。但是,在本说明书中,视频信号可以用于指示表示编码的图片的比特序列,或者对应于比特序列的比特流。图片可以指示样本阵列,并且可以被称为帧、图像等等。更具体地说,图片可以指示样本的二维阵列或者二维的样本阵列。样本可以指示用于构成图片的最小单元,并且可以被称为像素、图片元素、像元等等。样本可以包括亮度(luma)分量和/或色度(chroma、色差)分量。在本说明书中,编译可用于指示编码,或者可以通常地指示编码/解码。

图片可以包括至少一个或多个片,并且片可以包括至少一个或多个块。当比特流由于数据丢失等被损坏时,片可以被配置为包括为了诸如并行处理、解码的再同步目的的整数个块。每个片可以被独立地编码。块可以包括至少一个或多个样本,并且可以指示样本的阵列。块可以具有等于或者小于图片大小的大小。块可以被称为单元。当前编译的图片可以称为当前图片,并且当前编译的块可以称为当前块。可以存在构成图片的各种块单元。例如,在ITU-T H.265标准(或者高效视频编译(HEVC)标准)的情况下,可以存在诸如编译树块(CTB)(或者编译树单元(CTU))、编译块(CB)(或者编译单元(CU))、预测块(PB)(或者预测单元(PU))、变换块(TB)(或者变换单元(TU))等等这样的块单元。

编译树块对应于用于构建图片的最基本单元,并且可以被分割成四叉树形式的编译块以按照图片的纹理提高编译效率。编译块可以对应于用于执行编译的基本单元,并且帧内编译或者帧间编译可以以编译块为单位执行。帧内编译将使用帧内预测执行编译,并且帧内预测将使用包括在相同图片或者片中的样本执行预测。帧间编译将使用帧间预测执行编译,并且帧间预测将使用包括在不同于当前图片的图片中的样本执行预测。使用帧内编译进行编译的块可以称为帧内块,并且使用帧间编译进行编译的块可以被称为帧间块。并且,使用帧内编译的编译模式可以被称为帧内模式,并且使用帧间编译的编译模式可以被称为帧间模式。

预测块可以对应于用于执行预测的基本单元。相同的预测可以适用于预测块。例如,在帧间预测的情况下,相同的运动矢量可以适用于一个预测块。变换块可以对应于用于执行变换的基本单元。变换可以对应于将像素域(或者空间域或者时间域)的样本变换为频率域(或者变换系数域)的变换系数的操作,或者反之亦然。尤其是,将频率域(或者变换系数域)的变换系数变换为像素域(或者空间域或者时间域)的样本的操作可以被称为反变换。例如,变换可以包括离散余弦变换(DCT)、离散正弦变换(DST)、傅里叶变换等等。

图1图示编码过程。

编码设备100接收原始图像102的输入,对原始图像执行编码,并且输出比特流114。原始图像102可以对应于图片。但是,在当前的示例中,假设原始图像102对应于用于构建图片的块。例如,原始图像102可以对应于编译块。编码设备100可以确定是否原始图像102被以帧内模式或者帧间模式编码。如果原始图像102被包括在帧内图片或者片中,则原始图像102可以被仅以帧内模式编码。但是,如果原始图像102被包括在帧间图片或者片中,例如,能够在帧内编译之后考虑到RD(速率失真)成本确定有效编译方法,并且对原始图像102执行帧间编译。

在对原始图像102执行帧内编译的情况下,编码装置100可以使用包括原始图像102(104)的当前图片的重建的样本确定示出RD优化的帧内预测模式。例如,帧内预测模式可以由从直流(DC)预测模式、平面预测模式和角度预测模式组成的组中选择的一个确定。DC预测模式对应于使用在当前图片的重建的样本之中的参考样本的平均值执行预测的模式,平面预测模式对应于使用参考样本的双线性内插执行预测的模式,并且角度预测模式对应于使用相对于原始图像102位于特定方向的参考样本执行预测的模式。编码装置100可以使用确定的帧内预测模式输出预测的样本或者预测值(或者预测器)107。

当对原始图像102执行帧间编译的时候,编码装置100使用被包括在(解码的)图片缓存器122中的重建的图片执行运动估计(ME),并且然后可以能够获得运动信息(106)。例如,运动信息可以包括运动矢量、参考图片索引等等。运动矢量可以对应于二维矢量,该二维矢量提供在当前图片中从原始图像102的坐标到参考图片中的坐标的偏移。参考图片索引可以对应于在存储在(解码的)图片缓存器122中的重建的图片之中用于帧间预测的参考图片的列表(或者参考图片列表)的索引。参考图片索引指示相应的参考图片。编码装置100可以使用获得的运动信息输出预测的样本或者预测的值107。

随后,编码装置100可以从在原始图像102和预测的样本107之间的差值产生残差数据108。编码装置100可以对产生的残差数据108(110)执行变换。例如,离散余弦变换(DCT)、离散正弦变换(DST),和/或小波变换可以适用于该变换。更具体地说,其可以使用具有4×4至32×32大小的基于整数的DCT,并且可以使用4×4、8×8、16×16和32×32变换。编码装置100执行变换110以获得变换系数信息。

编码装置100量化变换系数信息以产生量化的变换系数信息(112)。量化可以对应于使用量化参数(QP)缩放变换系数信息的等级的操作。因此,量化的变换系数信息可以被称为缩放的变换系数信息。量化的变换系数信息可以经由熵编码114作为比特流116被输出。例如,熵编码114可以基于固定长度编译(FLC)、可变长度编译(VLC)或者算术编译来执行。更具体地说,其可以应用基于算术编译的上下文自适应的二进制算术编译(CABAC)、基于可变长度编译的Exp-Golomb编译和固定长度编译。

并且,编码装置100对量化的变换系数信息执行反量化118和反变换120以产生重建的样本121。虽然在图1中没有描述,但在通过获取用于图片的重建的样本121而获得重建的图片之后,可以对重建的图片执行环内滤波。对于环内滤波,例如,其可以应用去块滤波器、样本自适应偏移(SAO)滤波器。随后,重建的图片121被存储在图片缓存器122中,并且可以用于编码下一个图片。

图2图示解码过程。

解码设备200接收比特流202,并且可以执行熵解码204。熵解码204可以对应于在图1中先前提及的熵编码114的反操作。解码设备200可以经由熵解码204通过包括预测模式信息、帧内预测模式信息、运动信息等等获得解码所必需的数据和(量化的)变换系数信息。解码设备200可以通过对获得的变换系数信息执行反量化206和反变换208产生残差数据209。

经由熵解码204获得的预测模式信息可以指示是否当前块以帧内模式或者帧间模式被编码。如果预测模式信息指示帧内模式,则解码设备200可以基于经由熵解码204(210)获得的帧内预测模式,从当前图片的重建的样本获得预测样本(或者预测值)213。如果预测模式信息指示帧间模式,则解码设备200可以基于经由熵解码204(212)获得的运动信息,从存储在图片缓存器214中的参考图片获得预测样本(或者预测值)213。

解码设备200可以使用残差数据209和预测样本(或者预测值)获得用于当前块的重建的样本216。虽然在图2中没有描述,在通过获得用于图片的重建的样本216重建图片之后,可以对重建的图片执行环内滤波。随后,重建的图片216可以存储在图片缓存器中以解码下一个图片,或者可以被输出用于显示。

视频编码/解码过程对于软件/硬件(SW/HW)处理需要非常高的复杂度。因此,为了使用有限的资源执行高复杂度的作业,能够以通过作为最小处理单元的基本处理单元对其进行分割的方式处理图片(或视频)。基本处理单元可以根据视频编译标准具有不同的名称。

例如,在JPEG(联合图像专家组)标准(ISO/IEC 10918或ITU-T T.81)的情况下,基本处理单元可以被称为MPU(最小处理单元)并且具有16×16个像素的大小。因此,在JPEG标准的情况下,能够以通过作为基本处理单元的MPU划分的方式对单个图片进行编码/解码。对于详细示例,在对640×480图片进行编码/解码的情况下,能够对从将图片划分成1200(=40×30)个MPU而产生的1200个MPU执行在图1中所示的编码过程或者在图2中所示的解码过程。

对于另一示例,在MPEG(运动图像专家组)标准(ISO/IEC 11172-2或ITU-TH.261)、MPEG-2标准(ISO/IEC 13818-2或ITU-T H.262)、MPEG-4标准(ISO/IEC 14496-2或ITU-T H.263或H.26L)、VC-1或SMPTE(运动图片和电视工程师协会)421M标准、或AVC(高级视频编码)标准(MPEG-4部分10或ITU-T H.264)的情况下,基本处理单元可以命名为宏块(或MB),并且具有16×16像素的大小。因此,在上述标准的情况下,通过被作为基本处理单元的宏块划分,单个图片能够被编码/解码。对于详细示例,在编码/解码640×480图片的情况下,能够对从将图片划分成1200个MB(=40×30)产生的1200个MB执行图1中所示的编码过程或者图2中所示的解码过程。

对于又一示例,在如上所述的HEVC(高效率视频编码)标准(ISO/IEC 23008-2或ITU-T H.265)的情况下,基本处理单元可以被命名为CTB(编译树块)或CTU(编译树单元)MP并且具有64×64像素的大小。因此,在HEVC标准的情况下,能够以被作为基本处理单元的CTB划分的方式对单个图像进行编码/解码。对于详细示例,在编码/解码8192×4096图片的情况下,能够对从将图片划分成8192个CTB(=128×64)产生的8192个CTB执行图1所示的编码过程或图2所示的解码过程。

根据现有技术的视频编译标准,可以将帧内编译模式或帧间编译模式确定为基本处理单元。因此,如果帧内编译模式或帧间编译模式被确定为基本处理单元,尽管基本处理单元被分割(或分离)为子块,但是按照每个基本处理单元确定的帧内或帧间编译模式可以相同地适用于子块。

例如,在诸如MPEG、MPEG-2、MPEG-4和VC-1的现有视频编译标准中,由作为基本处理单元的宏块单元确定帧内或帧间编译模式。因此,一旦帧内或帧间编译模式被确定为基本处理单元,尽管宏块被分割为多个块,但是可以根据宏块的编译模式对被分割的块中的每一个进行编码/解码。

类似地,在AVC标准的情况下,由作为基本处理单元的宏块单元确定帧内或帧间预测模式。尽管宏块被分割成多个块,但是可以根据宏块的预测模式对被分割的块中的每一个进行编码/解码。

在HEVC标准中,与用于压缩效率增强的现有视频编译标准(例如,VC-1、AVC)不同,在通过四叉树方案将CTB分割成至少一个编译块(或编译单元)之后,能够为编译块(或编译单元)确定帧内或帧间预测模式。如果CTB未被分割,则CTB可以对应于编译块。在这种情况下,编译块可以具有相同的CTB大小,并且能够为相应的编译树块确定帧内或帧间预测模式。

如上所述,在本说明书中,帧内预测模式可以指使用当前图片的重建样本执行预测的模式,或者在没有使用除了当前图片之外的图片的情况下使用当前图片执行预测的模式,并且被示意性地称为帧内模式。帧间预测模式可以指使用与当前图片不同的图片的重建样本执行预测的模式,或使用当前片和不同于当前图片的图片来执行预测的模式,并且被示意性地称为帧间预测模式。此外,使用帧内预测模式编译的块可以被称为帧内块,并且使用帧间预测模式编译的块可以被称为帧间块。

当通过四叉树方案分割CTB时,它可以被递归地分割。在已经将CTB分割成4个块之后,每个块可以另外地通过四叉树方案再被分割成子块。通过四叉树方案递归地分割CTB生成的每个块可以成为编译块(或编译单元)。例如,在已经将CTB分割为第一至第四块之后,如果将第一块分割为第五块至第八块但是第二块至第四块未被分割,则能够将第二至第八块确定为编译块。在此示例中,可以为第二至第八块中的每一个确定帧内或帧间预测模式。

考虑到RD(速率失真)效率可以由编码器侧确定编译树块(或编译树单元)是否被分割成编译块(或编译单元),并指示存在或不存在分割的信息可以被包括在比特流中。例如,在HEVC标准中可以将指示编译块(或编译单元)是否被分割为具有半水平/垂直大小的编译块(或编译单元)的信息称为split_cu_flag。为了清楚起见,指示块是否在编译树块内被分割的信息可以被称为用于编译块的分割指示信息。解码器侧通过从比特流获得指示在编译四叉树中用于每个块的分割的存在或不存在的信息来确定是否分割块,并且能够通过四叉树方案递归地分割该块。编译树指的是通过递归地分割编译树块而形成的编译块的树结构。如果每个块在编译树内不再被分割,则相应块可以被指定为编译块。

如上所述,能够将编译块(或编译单元)分割为至少一个预测块(或预测单元)以执行预测。此外,能够将编译块(或编译单元)分割为至少一个变换块(或变换单元)以进行变换。以类似于编译树块的方式,通过四叉树方案编译块可以被递归地分割成变换块。通过四叉树方案分割编译块形成的结构可以被称为变换树,并且类似于分割指示信息,指示每个块是否在变换树内被分割的信息可以被包括在比特流中。例如,HEVC标准中的指示块是否被分割成用于变换的具有半水平/垂直大小的块的信息可以被称为split_transform_flag。为了清楚起见,指示每个块是否在变换树中被分割的信息可以被称为分割指示信息。

图3是示出通过四叉树方案分割编译树块的一个示例的图。

参考图3,编译树块可以被分割成包含块1至7的第一编译块、包含块8至17的第二编译块、对应于块18的第三编译块、以及包含块19至28的第四编译块。第一编译块可以被分割为对应于块1的编译块、对应于块2的编译块、包含块3至6的第五编译块、以及与块7相对应的编译块。尽管不能在编译四叉树中进一步分割,第二编译块可以被分割成用于变换的附加变换块。第四编译块可以被分割为包含块19至22的第六编译块、对应于块23的编译块、对应于块24的编译块、以及包含块25至28的第七编译块。第六编译块可以被分割为对应于块19的编译块、对应于块20的编译块、对应于块21的编译块、以及对应于块22的编译块。而且,尽管不能在编译四叉树中被进一步分割,第七编译块可以被分割成用于变换的附加变换块。

如上所述,指示用于编译树块或每个编译块的分割的存在或不存在的信息(例如,split_cu_flag)可以被包括在比特流中。如果指示分割的存在或不存在的信息具有第一值(例如,1),则能够分割编译树块或者每个编译块。如果指示分割的存在或不存在的信息具有第二值(例如,0),则不分割编译树块或每个编译块。并且,指示分割的存在或不存在的信息的值可以变化。

在图3中所示的示例中,用于编译树块、第一编译块、第四编译块和第六编译块的分割指示信息(例如,split_cu_flag)可以具有第一值(例如,1)。解码器从比特流获得关于相应块的分割指示信息,并且然后能够将相应块分割成4个子块。另一方面,用于其他编译块(与块1、块2、块7、块18至23和块3至6相对应的编译块、与块8至17相对应的编译块,以及与块25至28相对应的编译块)的分割指示信息(例如,split_cu_flag)可以具有第二值(例如,0)。解码器从比特流获得关于相应块的分割指示信息,并且根据该值不进一步分割相应的块。

如上所述,根据用于变换的变换块的分割指示信息,可以通过四叉树方案将每个编译块分割成至少一个变换块。现在参考图3,因为与块1、2、4、7、18对应的编译块没有被分割用于变换,所以变换块可以对应于编译块,但是可以另外分割另一编译块(与块3和块4、8至17或25至28对应的编译块)用于变换。用于从每个编码块(例如,与块3、4、8至17或25至28对应的编译块)形成的变换树内的每个块的分割指示信息(例如,split_transform_flag),并且相应的编译块可以根据分割指示信息的值被分割为变换块。如图3中示例地示出,可以将对应于块3至6的编译块分割为变换块以形成深度1的变换树,与块8至17对应的编译块可以被分割成变换块以形成具有深度3,并且对应于块25至28的编译块可以被分割成变换块以形成具有深度1的变换树。

因为通过四叉树的分割方案将对应块分割成具有半水平/垂直大小的子块,所以对于关于相应块的分割类型的信息没有必要被另外包括在比特流中。即,仅指示分割的存在或不存在的信息需要被包括在比特流中。在这种情况下,例如,因为仅1比特信息能够被包括在比特流中,所以在分割2维空间(2D)中可以是有效的。然而,在四叉树方案的情况下,每当分割被执行一次,因为用于相应的被分割块的信息量规律地增加4倍,所以可能会发生效率低情况。此外,因为被包括在单个块中的图片内容不总是被配置为对应于相同大小的4个块,所以可以产生通过执行预测和变换而发生的相对大量的变换系数信息并且编译效率可能被降低。由于相应块总是被分割成相同大小的4个子块,所以存在无法灵活应对图片内容的问题。

本发明提出各种分割方案以改善这种问题。

在四叉树方案的情况下,因为相应块总是被分割为4个块,所以用于每个块的信息量没有选择,而是每次增加4倍。因此,为了减少每次分割块时增加的信息量,能够考虑使用二叉树方案分割块。因此,本发明提出使用二叉树方案分割编译树块(或编译树单元)。

在分割块(编译树块或编译块)的情况下,相应块可以被分割为2个子块。特别地,特定块可以被分割成具有相应块的相同垂直大小的2个子块。在这种情况下,子块的水平大小可以对应于相应块的水平大小的一半,并且两个子块中的每一个可以具有相同类型的矩形。例如,如果当前块是2N×2N块,则能够将其分割为2个N×2N块。

或者,特定块可以被分割成具有相应块的相同水平大小的2个子块。在这种情况下,子块的垂直大小可以对应于相应块的垂直大小的一半,并且两个子块中的每一个可以具有相同类型的矩形。例如,如果当前块是2N×2N块,则可以将其分割成2个2N×N块。

在应用基于根据本发明的二叉树方案的分割方法的情况下,可以通过比特流用信号发送指示分割的存在或不存在的信息和指示分割方向的信息以指示分割类型。指示分割的存在或不存在的信息指示相应块是否被分割成两个块。对于非限制性示例,在具有第一值(例如,1)的情况下,该信息指示相应块被分割成2个子块。在具有第二值(例如,0)的情况下,该信息指示相应块没有被进一步分割。第一值和/或第二值可以被设置为不同的值。此外,例如,指示二叉树内的分割的存在或不存在的信息可以指的是split_flag。

此外,指示分割方向的信息可以指示是否在水平或垂直方向上分割相应块。对于非限制性示例,如果指示分割方向的信息具有第一值(例如,0),则可以指示相应块在水平方向上被分割成2个子块。如果信息具有第二值(例如,1),则可以指示相应块在垂直方向上被分割成2个子块。用于指示分割方向的信息的第一值和第二值可以变化。例如,第一值为1并且第二值为0。或者,第一值和第二值可以包括0和1以外的值。例如,指示分割方向的信息可以指的是split_dir_flag。并且,指示分割方向的信息可以被称为分割模式信息。

在水平方向中的分割可以指示相应块被分割成左子块和右子块。在垂直方向中的分割可以指示相应块被分割成顶部子块和底部子块。在水平分割的情况下,每个子块的水平大小(或宽度)是相应块的水平大小(或宽度)的一半,并且每个子块的垂直大小(或高度)等于相应块的垂直大小(或高度)。在垂直分割的情况下,每个子块的水平大小(或宽度)等于相应块的水平大小(或宽度),并且每个子块的垂直大小(或高度)是相应块的垂直大小(或高度)的一半。

作为根据本发明的分割方法1的另一示例,替代指示分割的存在或不存在的信息和指示分割方向的信息,指示分割模式的信息可以被包括在比特流中。分割模式指示信息可以指示分割块和分割方向二者的存在或不存在。对于非限制性示例,如果分割模式指示信息具有第一值,则其可以指示相应块在水平方向中被分割。如果分割模式指示信息具有第二值,则其可以指示相应块在垂直方向上被分割。如果分割模式指示信息具有第三值,则其可以指示相应块没有被分割。对于非限制性示例,第一到第三值可以分别被设置为0、1和2。对于另一示例,第一到第三值可以分别被设置为1、2和0。而且,这些值可以被设置为除了第一到第三值之外的值。此外,例如,分割模式指示信息可以指的是split_mode。

图4是根据本发明的分割方法的流程图。尽管在图4中所示的示例中示例性地示出由解码器执行的流程图,但是可以由编码器执行与图4的各个步骤相对应的步骤。

参考图4,在步骤S402中,解码器能够从比特流获得指示编译树块(或编译块)是否被分割的分割指示信息(例如,split_flag)。如果分割指示信息指示编译树块被分割,则解码器可以进入步骤S404。如果分割指示信息指示编译树块未被分割,则解码器可以进入步骤S406。如上所述,如果分割指示信息具有第一值(例如,1),则分割指示信息指示相应的编译树块(或编译块)被分割。如果分割指示信息具有第二值(例如,0),则分割指示信息指示相应的编译树块(或编译块)未被分割。

在通过二叉树方案执行分割的情况下,能够使用指示对于每个块在二叉树内的深度的信息(或深度信息)。在编译树块的情况下,深度信息可以具有0的值。如果编译树块被分割一次或多次,则深度信息可以具有大于0的值。

在步骤S404中,解码器可以从比特流获得指示相应的编译树块(或编译块)的分割方向的分割方向信息(例如,split_dir_flag)。分割方向信息可以指示相应的编译树块(或编译块)是否在水平方向上被分割成2个子块或在垂直方向上被分割成2个子块。如果分割方向信息指示在水平方向上的分割,则解码器可以将相应的编译树块(或编译块)分割成包括左编译块和右编译块的两个块。如果分割方向信息指示在垂直方向上的分割,则解码器可以将相应的编译树块(或编译块)分割成包括顶部编译块和底部编译块的两个块。如果分割方向信息具有第一值(例如,0),则分割方向信息指示相应的编译树块(或编译块)在水平方向上被分割。如果分割方向信息具有第二值(例如,1),则分割方向信息指示相应的编译树块(或编译块)未被分割。

在步骤S404中,解码器基于分割方向信息通过二叉树方案分割相应的编译树块(或编译块),并且然后能够通过特定值(例如,1)增加深度信息。此后,解码器能够对每个分割(编译)的块递归地执行步骤S402。递归地执行每个步骤可以指的是对分割的子块重复地执行每个步骤直到不进一步执行分割。

在步骤S406中,如果基于分割指示信息(例如,split_flag)特定编译块或编译树块未被分割,则解码器获得关于相应块的预测模式信息,并且可以基于获得的预测模式信息执行解码。预测模式信息指示相应的编译块是否在帧内预测模式或者帧间预测模式中被编译。

在步骤S406中,因为根据预测模式信息确定用于相应的编译块的预测模式(例如,帧内或帧间编译模式),所以尽管相应的编译块被附加地分割成用于变换的至少一个变换块(或单元)或被附加地分割成执行预测的至少一个预测块(或单元),但相同的预测模式(或编译模式)可以应用于分割的变换块或分割的预测块。

此外,在步骤S406中,如果预测模式指示相应的编译块在帧内预测模式(或帧内编译模式)中被编译,则解码器能够将相应的编译块分割成至少一个变换块。如上所述,能够通过分割编译块来形成变换树。解码器对在变换树内分割的至少一个变换块中的每一个执行帧内预测,并且可以获得用于相应的变换块的预测器或预测值。因此,解码器能够通过由变换块单元执行帧内预测获得用于相应的编译块的预测值。此外,解码器能够通过从比特流获得关于每个变换块的变换系数信息来获得残差信息,并且对获得的变换系数信息执行反量化/反变换。因此,解码器能够通过由变换块单元获得变换系数信息并且执行反量化/反变换获得残差信息。解码器能够使用预测值和用于相应的编译块的残差信息重建相应的编译块。

此外,在步骤S406中,如果预测模式信息指示在帧间预测模式(或帧间编译模式)中编译相应的编译块,则解码器能够将编译块分割成用于预测的至少一个预测块。如果编译块被分割成用于预测的至少一个预测块,则解码器从比特流中获取用于每个分割的预测块的运动信息(例如,参考图片索引信息和/或运动矢量信息),执行帧间预测,并且然后能够获得用于预测块的预测值。因此,解码器能够通过由预测块单元执行帧间预测获得用于相应的编译块的预测值。此外,以帧内预测模式的相同方式,解码器能够通过将编译块分割成用于变换的至少一个变换块并且然后获得关于每个变换块的残差信息来获得用于相应的编译块的残差信息。解码器能够使用预测值和用于相应的编译块的残差信息重建相应的编译块。

尽管图4中所示的示例图示一种分割指示信息(例如,split_flag)和分割方向信息(例如,split_dir_flag)通过比特流被单独地用信号发送的情况的方法,但是即使通过比特流用信号发送分割模式信息(例如,split_mode)也能够以相同/类似的方式执行解码。在使用分割模式信息的情况下,解码器可以根据分割模式信息执行步骤S402和步骤S404或执行步骤S406。例如,如果分割模式信息指示相应的编译块未被分割,则解码器可以进入步骤S406。如果分割模式信息指示水平方向的分割或垂直方向分割,则解码器可以通过执行与步骤S404相关联地描述的操作分割相应块,并且对被分割的块递归地/重复地执行步骤S402和步骤S404的操作。

图5示出由二叉树方案分割的编译树块的一个示例。在图5中所示的示例中,假设单个编译树块通过二叉树方案分割成9个编译块,本发明不限于此。虽然单个编译树块被分割成除9个编译块之外的编译块或通过另一个二叉树结构被分割,但是本发明可相似地/类似地应用。

参考图5,在深度0处,编译树块能够在垂直方向上被分割为两个块(块8和与块0至7相对应的块)。在深度1处,顶部块能够在水平方向上分割成两个块(对应于块0和块1的块和对应于块3至7的块)。在深度2处,可以在垂直方向上分割左块(对应于块0和1),并且可以在水平方向上分割右块(对应于块3至7)。在深度3处,块0、1和3未被进一步分割,并且可以对剩下的块递归地执行附加分割。在图5的示例中,编译树块可以最终被分割成编译块0至8。

如上所述,能够通过比特流用信号发送用于每个编译块(例如,编译块0至8)的分割指示信息(例如,split_flag)和分割方向信息(例如,split_dir_flag)。在这种情况下,解码器获得用于每个编译块的分割指示信息和分割方向信息,并且能够确定是否执行附加分割或解码。在执行解码的情况下,解码器能够通过获得用于每个编译块的预测模式信息并且在每个编译块内应用相同的预测模式执行解码。

或者,可以通过比特流用信号发送用于每个编译块(例如,编译块0至8)的分割模式信息(例如,split_mode)。在这种情况下,解码器获得用于每个编译块的分割模式信息并且能够确定是否执行附加分割或解码。

通过将四叉树和二叉树的优点结合在一起,能够使用混合树方案的树结构。为此,能够通过比特流用信号发送是否使用二叉树方案或四叉树方案直到规定深度(或等级)的树。指示使用二叉树方案或四叉树方案的编译树的深度的信息可以以序列、图片、片,贴片或编译树块(或编码树单元)为单位被独立地用信号发送。序列指的是一系列接入单元,并且贴片可以指的是在图片中被配置编译树块的矩形区域。在根据本发明的分割方法2中,为了清楚起见,指示使用二叉树方案或四叉树方案的编译树的深度的信息将被称为深度信息。

在混合树方案的情况下,首先,应用二叉树方案。其后,可以从特定深度应用四叉树方案。在这种情况下,例如,深度信息可以指示在混合树中使用二叉树分割方案的最大深度。在本示例中,如果深度信息指示深度N,则根据直至深度N的二叉树方案对编译树块进行分割并且能够根据四叉树方案从深度N+1开始分割块。

对于详细示例,如果编译树块(或CTU)的大小为256×256并且最小编译块大小是8×8,则二叉树方案能够被用于深度(CU深度)0(256×256)到深度(CU深度)2(64×64),并且四叉树方案能够被用于深度(CU深度)3(32×32)到深度(CU深度)5(8×8)。

对于另一示例,深度信息可以指示用于在混合树中使用四叉树方案的开始深度。在本示例中,如果深度信息指示深度N,则根据二叉树方案在混合树中将编译树块分割成直至深度N-1并且能够根据四叉树方案从深度N分割块。

或者,相反,首先应用四叉树方案并且可以从特定深度应用二叉树方案。在这种情况下,可以以与上述描述相似的方式根据深度信息应用二叉树方案或四叉树方案。

能够在图4所示的步骤S402之前通过比特流用信号发送根据本发明的分割方法2的深度信息。再次参考图4,解码器在步骤S402之前从比特流获得深度信息,并且然后能够基于获得的深度信息应用二叉树方案或四叉树方案。在应用二叉树方案的情况下,可以执行参考图4描述的操作。在应用四叉树方案的情况下,可以省略指示分割方向的信息。

图6示出使用混合树方案分割的编译树块。在图6中示出的示例中,假设二叉树方案被应用直到深度4并且从深度5应用四叉树方案,本发明不受此限制。

参考图6,能够使用混合树方案将单个编译树块分割为编译块0至12。因为二叉树方案被应用直到深度4,所以如果深度信息指示应用二叉树方案的最大深度,则能够通过比特流用信号发送指示深度4的深度信息。或者,如果混合深度信息指示应用四叉树方案的开始深度,则能够通过比特流用信号发送指示深度5的深度信息。解码器以序列、图片、片,贴片或编译树块(或编码树单元)为单位从比特流中获取深度信息,并且然后能够基于深度信息应用二叉树方案或四叉树方案。

在图6中示出的示例中,通过应用混合树方案能够将单个编译块最终分割成编译块0至12。如在图6中示例性地示出,如果应用混合树方案,则最终分割的编译块可以具有矩形形状和正方形形状。即,在使用混合树方案分割编译树块的情况下,分割的编译块可以具有2N×2N、N×2N、或者2N×N的大小。

在前述的分割方法中,以对称的方式对每个编译块进行分割。特别地,在前述的分割方法中,以分割的块具有相同大小的方式执行分割。例如,在四叉树方案或混合树方案的情况下,如果当前块是2N×2N,则将其分割为4个N×N个块。在二叉树或混合树方案的情况下,如果当前块是2N×2N,则将其分割为2个2N×N块或2个N×2N块。但是,根据图片内容,为了编码效率提高,非对称分割可以是优选的。

因此,在根据本发明的分割方法3中,提出非对称四叉树方案。在本发明中分割的每个块可以具有不同的大小。即,如果当前块是N×N块,则能够将其分割为4个n1×n1、n1×n2、n2×n1和n2×n2块。为了提高分割效率,n1和n2可以具有小于当前块的水平或垂直大小的任意整数值。例如,如果当前块是N×N,则n1和n2可以是任意整数(其中0

图7示出根据本发明的非对称四叉树方案的一个示例。

参考图7,在深度0处,当前块是编译树块。能够通过被分割成4个子块将当前块分割成深度1的4个块。如果当前块是深度1处的右下块,则通过再次分割成4个子块当前块能够被分割成深度2的类型。如果当前块是在深度2处的左上块,则能够通过再分割成4个子块将当前块分割层深度3的类型。

为了支持这种非对称四叉树方案,可以通过比特流来用信号发送用于分割的中心位置信息。中心位置信息可以指示在相应的编译块内分割的4个子块的边界或中心位置。特别地,中心位置信息可以指示当前块内的用于分割的中心或边界位置的坐标。在应用非对称四叉树方案的情况下,解码器从比特流获取中心位置信息,并且能够对当前块进行分割,并且能够基于由当前块内的中心位置信息指示的位置通过四叉树方案来分割当前块。如果中心位置信息指示当前块内的死点,则当前块可以被对称地分割。

根据本发明的分割方法3的中心位置信息可以用于图4的步骤S404。再次参考图4,在从比特流获取中心位置信息之后,解码器基于获得的中心位置信息将当前块(编译树块或编译块)分割成子块,并且能够对被分割的子块中的每一个重复地/递归地执行步骤S402和步骤S404。

图8示出用于非对称四叉树方案的中心位置的一个示例。假设在图8中分割单个编译树块。图8(a)示出用于深度0的中心位置的一个示例,图8(b)示出用于深度1的中心位置的一个示例,图8(c)示出用于深度2的中心位置的一个示例。

参考图8(a),因为其是深度0的情况,所以当前块可以对应于编译树块。如果编译树块的中心位置信息指示(x0,y0),则当前块可以被分割为以编译树块内的位置(x0,y0)为中心的4个块。

参考图8(b),在深度1的情况下,当前块是右下块,并且中心位置信息可以指示当前块中的位置(x1,y1)或编译树块中的位置(x1,y1)。并且,当前块可以被分割成以编译树块内的位置(x1,y1)为中心的4个块。

参考图8(c),当前块是深度1的子块当中的左上块,并且中心位置信息可以指示当前块中的位置(x2,y2)或编译树块中的位置(x2,y2)。并且,当前块可以被分割成以位置(x2,y2)为中心的4个块。

作为根据本发明的分割方法3的另一方案,在预先已经定义非对称分割方法之后,可以通过比特流用信号发送指示定义的方案之一的分割模式信息。在此方案的情况下,因为分割方案被预先定义,所以用于每个分割方案的分割大小具有固定值。

此方案的分割模式信息可以被用于图4的步骤S404。再次参考图4,在从比特流获得分割模式信息之后,解码器基于获得的分割模式信息将当前块(编译树块或编译块)分割成子块,并且能够对被分割的子块中的每一个重复地/递归地执行步骤S402和步骤S404。

图9示例性地示出用于非对称四叉树方案的各种模式。在图9的示例中,仅图示5种分割模式,本发明不限于此。并且,本发明还可以包括除了图9中示出的模式之外的模式。

参考图9,根据分割模式信息可以基于5种分割模式之一将当前块分割为4个子块。在图9的示例中,如果当前块被假定为2N×2N块,则第一分割模式(例如,模式0)指示当前块被分割成当前块内的左上的n1×n1块,和右上的n1×n2块、左下的n2×n1块,以及右下的n2×n2块的情况,其中n1

或者,可以通过修改来实现本发明的分割方法3。根据本发明的分割方法3的分割模式信息可以包括与当前块未被分割的情况相对应的模式。在这种情况下,根据本发明的分割方法3的分割模式信息可以指示当前块未被分割或者通过特定分割方案分割当前块。因此,可以以与根据本发明的分割方法1中描述的分割模式信息(例如,split_mode)类似的方式使用分割模式信息。如在分割方法1中所描述的,解码器可以取决于分割模式信息执行步骤S402和404或步骤S406。例如,如果分割模式信息指示相应的编译块未被分割,则解码器可以进入步骤S406。如果分割模式信息指示特定分割模式,则解码器基于分割模式信息将当前块(编译树块或编译块)分割成子块,并且能够对被分割的子块中的每一个重复地/递归执行步骤S402和步骤S404。

在现有的HEVC标准中,编译树块(或编译树单元)被指定为具有正方形(例如,64×64)形状。然而,由于确定矩形的基本处理单元是更有效的,所以本发明提出一种矩形的编译树块。在这种情况下,单个图片被配置具有相同大小的矩形形状的编译树块,并且可以由矩形形状的编译树块单元执行编码/解码。矩形形状的编译树块可以指的是具有水平大小不同于垂直大小的编译树块。

此外,在根据本发明的分割方法4中,提出一种用于编译树块具有矩形形状的情况的分割方法。

作为第一种方法,提出一种以应用于正方形形状的编译树块的四叉树方案的相同方式,根据深度顺序/递归/重复地分割编译树块的方法[被称为“分割方法4-1']。因为四叉树块以矩形形状被分割,所以分割的子块可以具有矩形形状。因此,在由通过四叉树方案最终分割形成的编码树中,编译块也可以具有矩形形状。如上所述,因为以编译块(或编译单元)为单位来确定帧内/帧间预测模式,所以在分割方法4-1的情况下在矩形形状中可以通过编译块单元确定帧内/帧间预测模式。为了支持根据本发明的分割方法4-1,作为用于帧内/帧间预测模式确定的单位的编译块(或编码单元)可以具有矩形形状。

在根据本发明的分割方法4-1的情况下,尽管支持矩形形状的编译块,但用于帧间预测的预测块或用于变换的变换块可以具有正方形形状。特别地,矩形形状的编译块可以被分割成多个用于预测的正方形形状的预测块,并且矩形形状的编译块可以被分割成多个用于变换的正方形形状的变换块。例如,如果编译块为4N×N,则相应的编译块被分割成用于变换的4个N×N变换块并且然后可以通过四叉树方案递归/重复地被分割成更小大小的变换块。在这种情况下,尽管由矩形形状的编译块单元确定帧内/帧间预测模式,但可以由正方形形状的变换块单元执行帧内预测和/或变换,并且也可以由正方形形状的预测块单元执行帧间预测。

对于另一示例,根据本发明的分割方法4-1可相同/类似地应用于变换树。在这种情况下,变换块可以具有矩形形状并且可以以矩形形式执行帧内预测和/或变换。

作为第二种方法,如果将矩形形状的编译树块分割直到最小大小的编译块,则建议应将编译树块分割成正方形形状的编译块[被称为“分割方法4-2']。如果编译树块被分割直到最小大小的编译块,则因为很有可能相应的编译块没有被进一步分割成用于变换的其他变换块,所以当将编译树块分割直到最小大小的编译块时,编译树块被预先分割成用于变换的正方形形状的编译块可能是有利的。根据本发明的分割方法4-2可以保证最小大小的编译块具有正方形形状。

可以通过比特流发信号发送最小编译块大小。为了减少对于用信号发送最小编译块大小所要求的比特的数目,最小编译块大小是在相应信息取log2值之后减去特定偏移得到的值,并且可以通过比特流用信号发送。在这种情况下,解码器可以通过从比特流获得指示编译块的最小大小的信息并且然后将特定的偏移添加到信息的值获得最小编译块大小的log2的值。例如,具体的偏移可以是3。

由于块的大小通常能够被表示为2的次方,所以在表示块的大小中得到大小的log2值可能是有效的。如果在实际寻找块的大小中使用移位操作,则能够通过单个指令周期从log2值中找到实际大小。因此,为了确定编译块是否具有最小大小,能够将当前编译块的大小的log2值与最小编译块大小的log2值进行比较。如果两个值彼此相等,则能够确定相应的编译块为最小大小。如果当前编译块的大小的log2值大于最小编译块大小的log2值,则能够确定当前编译块大于最小编译块大小。因为假定矩形形状的四叉树方案,所以当将当前编译块的水平大小(或宽度)或垂直大小(或高度)与最小大小进行比较时,如果两个值中的一个等于最小大小,则当前的编译块能够被分割成正方形编译块。

可以通过比特流以序列、图片,片或贴片的等级用信号发送指示最小编译块大小的信息。因此,再次参考图4,解码器在步骤S402之前从比特流获得指示最小编译块大小的信息,并且然后能够基于获得的最小编译块大小执行本发明的分割方法4-2。因为在本发明的分割方法4-2中应用四叉树方案,所以能够跳过与指示分割方向的信息(例如,split_dir_flag)有关的操作。

作为第三种方法,提出通过比特流用信号发送执行正方形四叉树方案的分割的深度并且以正方形形状通过四叉树方案执行分割(被称为“分割方法4-3”]。在根据本发明的分割方法4-3中,能够指定编译块具有正方形形状的深度(或深度等级)。在根据本发明的分割方法4-3中,解码器从比特流获得指示通过正方形形状的四叉树方案应用分割的深度的深度信息,并且能够通过正方形形状的四叉树方案从指示的深度分割编译块。

例如,如果深度信息指示深度2,则解码器能够通过从深度2应用正方形形状的四叉树方案递归地/重复地分割编译块。为此,如果矩形形状的编译块在深度1处被另外分割,则深度1的编译块能够被分割成正方形形状的编译块。这被概括如下。假设通过比特流获得的深度信息指示深度N,如果深度N-1的矩形编译块被分割,则矩形编译块能够被分割使得在深度N处变成正方形形状的编译块替代矩形形状的四叉树方案。

作为本发明的分割方法4-3的修改,能够通过比特流来用信号发送指示通过正方形形状的四叉树方案应用分割的块的大小的信息替代深度信息。在这种情况下,可以以与本发明的分割方法4-2的描述相同/相似的方式通过比特流用信号发送指示块的大小的信息,并且解码器能够以与本发明的分割方法4-2的描述相同/相似的方式操作。

图10示出根据本发明的用于矩形树块的分割方法的一个示例。图10(a)示出通过本发明的分割方法4-1分割的编译树块的一个示例,图10(b)示出通过本发明的分割方法4-2分割的编译树块的一个示例,并且图10(c)示出通过本发明的分割方法4-3分割的编译树块的一个示例。在图10的示例中,假设编译树块被分割为直到深度3,本发明不限于此。

参考图10(a),通过简单的四叉树方案分割矩形形状的编译块。并且,最终形成的编译块也具有矩形形状。

参考图10(b),假设在深度2处的编译块的高度等于最小大小,在深度2处将编译块分割为正方形形状的编译块。

参考图10(c),如果深度信息指示从深度2开始的正方形形状的分割,则能够通过从深度2开始应用正方形形状的四叉树方案分割编译块。为此,在深度1分割的编译块可以被分割成正方形形状的编译块。

能够考虑不管支持矩形形状的编译树块如何保持矩形形状的四叉树方案的方法。为此,本发明提出在深度1处相等地分割编译树块以具有正方形形状。特别地,根据本发明,如果在深度0处编译树块被分割,则首先能够被均匀地分割成正方形形状的块。因此,根据本发明,从深度1开始完整地应用现有的四叉树方案,并且与变换和预测相关的过程可相同地应用。因此,不管支持矩形形状的编译树块如何,现有的分割方案和现有的编码/解码方案能够保持完整是有利的。

能够通过比特流用信号发送从编译树块(在深度1处的编译树块的初始分割大小或正方形块的大小)分割的正方形块的大小。在这种情况下,可以以序列、图片、片、贴片或编译树块(或编码树单元)为单位独立地用信号发送从编译树块分割的正方形块的大小。因此,解码器通过以序列、图片、片、贴片或编译树块(或编码树单元)为单位获得指示从编译树块分割的正方形块的大小的信息,并且然后能够基于所获得的信息以被指示的大小将编译树块等同地分割成正方形块。

因此,再次参考图4,解码器在步骤S402之前从比特流中获取指示从编译树块分割的正方形块的大小的信息,并且然后能够基于获得的正方形块的大小执行本发明的分割方法5。根据本发明的分割方法5,能够省略与指示分割方向的信息(例如,split_dir_flag)相关的操作。

并且,从编译树块分割的正方形块的大小能够被指示为从log2值减去特定偏移得到的值。在这种情况下,解码器从比特流中获取指示从编译树块分割的正方形块的大小的信息,并且能够使用通过添加特定偏移获得的值来获得正方形块的大小。能够通过将所获得的值向左移位1获得正方形块的大小。

或者,从编译树块分割的正方形块的大小(在深度1处的编译树块的初始分割大小或正方形块的大小)可以由编码器和解码器两者事先固定为预定值。如果正方形块的大小事先固定为预定值,则在初始地分割编译树块的情况下解码器能够将编译树块均等地分割成固定大小的正方形块。例如,如果矩形形状的编译树块比现有编译树块的大小(例如,64×64)大,则固定大小的正方形块可以被配置成具有现有编译树块的大小(例如,64×64)以保持与现有方案的兼容性。

在这种情况下,虽然解码器可以执行参考图4描述的操作,可以省略与指示分割方向的信息(例如,split_dir_flag)相关的操作。

图11示出根据本发明的通过分割方法分割的编译树块的一个示例。在图11的示例中,假设编译树块被分割直到深度3,本发明不限于此。

参考图11,尽管编译树块具有矩形形状,但是根据本发明能够通过分割方法5将其从深度1分割成正方形形状的编译块。在编译树块的初始分割的情况下,如图11(a)或者图11(b)中所示,编译树块能够在深度1处被分割成各种大小的正方形块。因为仅从深度1起存在正方形形状的块,当以与现有方案相同/相似的方式递归地/重复地应用四叉树方案时,编译树块能够被分割成正方形形状的编译块。

在根据本发明的分割方法6中,提出一种自由地组合四叉树方案和二叉树方案并且自由地指定分割大小的方法。在分割方法6中,能够通过比特流用信号发送关于分割的信息(称为分割模式信息)、分割的最小单元(称为最小分割单元信息)和分割位置信息(被称为分割位置信息)。

分割模式信息可以指示当前块的分割方案。基于分割模式信息,当前块的分割方案可以包括4种分割方案。第一分割方案指示当前块未分割。第二分割方案指示当前块在垂直方向上被分割成两个块。第三分割方案指示当前块在水平方向上被分割成两个块。第四分割方案指示以与四叉树方案类似的方式将当前块分割成4个块。例如,分割模式信息可以被称为分离模式。

图12示出根据本发明的基于分割模式信息的分割方案的一个示例。

参考图12,基于分割模式信息(例如,split_mode),根据4种分割方案中的一种,当前块未被分割或被分割成两个或更多个块。与每个分割方案相对应的分割模式信息的值仅是示例性的,可以被设置为其它值。

在图12的示例中,当前块被图示彷佛被分成相同大小的子块,这仅是示例性的。可以基于如下所述的最小分割单元信息和/或分割位置信息来确定分割边界。

最小分割单元信息可以指示通过样本单元的分割的最小大小。分割位置信息可以指示用于从参考位置起在垂直或水平方向上的分割边界的偏移。参考位置可以对应于当前块的左上角样本的位置。分割位置信息可以包括根据方向的第一分割位置信息和/或第二分割位置信息。第一分割位置信息指示从参考位置起在垂直(或水平)方向上的分割边界的偏移,并且第二分割位置信息可以指示用于从参考位置在水平(或垂直)方向上的分割边界的偏移。例如,最小分割单元信息、第一分割位置信息和第二分割位置信息可以分别被称为split_offset_size、split_offset_0和split_offset_1。

最小分割单元信息可以指示分割位置信息的偏移大小。由分割位置信息指示的偏移可以表示为由最小分割单元信息指示的大小的单元。在这种情况下,分割边界的位置可以从由最小分割单元信息指示的值与由分割位置信息指示的值的乘积来确定。例如,如果最小分割单元信息指示“a”并且分割位置信息指示“b”,则分割边界的位置可以对应于从参考位置开始的a*b的样本位置。最小分割单元信息可以被称为分割偏移大小信息,并且分割位置信息可以被称为分割偏移信息。

图13示出根据本发明的基于最小分割单元信息的分割偏移的示例。在图13的示例中,为了清楚起见,当前块被假定为32×32,本发明不限于此。

参考图13(a),示例性地示出最小分割单元信息(例如,split_offset_size)指示4的情况。如果最小分割单元信息指示4,则可以由4个样本单元确定分割偏移,并且可以在一个当前块内存在8个偏移单元。在这种情况下,分割位置信息可以指示1到7。

参见图13(b),示例性地示出最小分割单元信息(例如,split_offset_size)指示8的情况。如果最小分割单元信息指示8,则可以由8个样本单元确定分割偏移,并且在当前块中可以存在4个偏移单元。在这种情况下,分割位置信息可以指示1到3。

图14示出根据本发明确定的分割边界的一个示例。如果分割模式信息指示当前块未分割[第一分割方案],则可不通过比特流用信号发送最小分割单元信息和分割位置信息。图14(a)示例性地示出分割模式信息指示当前块在垂直方向上被分割成两个块的情况[第二分割方案],图14(b)示例性地示出分割模式信息指示当前块在水平方向上被分割成两个块的情况[第三分割方案],并且图14(c)示例性地示出分割模式信息指示当前块被分割成4个块的情况[第四分割方案]。

参考图14(a),分割位置信息可以指示5,并且可以由5*(由最小分割单元信息指示的值)确定分割边界。像图13所示的示例一样,如果当前块是32×32并且最小分割单元信息指示4,则可以将分割边界确定为20。

参见图14(b),分割位置信息可以指示6,并且分割边界可以由6*(由最小分割单元信息指示的值)确定。像图13所示的示例一样,如果当前块是32×32并且最小分割单元信息指示4,则可以将分割边界确定为24。

参见图14(c),可以通过比特流用信号发送第一分割位置信息和第二分割位置信息。如果第一分割位置信息指示垂直分割位置并且第二分割位置信息指示水平分割位置,则第一分割位置信息和第二分割位置信息可以分别指示5和6。在这种情况下,可以将垂直分割边界确定为5*(由第一分割位置信息指示的值)并且水平分割边界可以被确定为6*(由第二分割位置信息指示的值)。

或者,如果第一分割位置信息指示水平分割位置并且第二分割位置信息指示垂直分割位置,则第一分割位置信息和第二分割位置信息可以分别指示6和5。在这种情况下,可以将垂直分割边界确定为5*(由第二分割位置信息指示的值)并且可以将水平分割边界确定为6*(由第一分割位置信息指示的值)。

与在图13中示出的示例一样,如果当前块是32×32并且最小分割单元信息指示4,则可以将垂直分割边界确定为20并且可以将水平分割边界确定为24。

图15示出根据本发明的用于分割方法的语法的一个示例。在图15中,示例性地示出用于当前块的语法。并且,在图15中示出的语法可以递归/重复地应用。因此,如果当前块被分割成多个块,则图15的语法对于每个分割块来说存在。如果分割块被另外分割,则图15的语法对于另外分割的块来说可以存在。

参考图15,能够通过比特流用信号发送用于当前块的分割模式信息(例如,split_mode)。解码器从比特流获取关于当前块的分割模式信息,并且能够确定当前块的分割方案。如果分割模式信息指示当前块未被分割[第一分割方案],则当前块没有被进一步分割并且关于当前块的其他信息不存在。在这种情况下,解码器在没有分割当前块的情况下可以将当前块确定为最终编译块,并且不从比特流获得其他信息(例如,最小分割单元信息、分割位置信息)。在这种情况下,解码器能够对当前块执行图4的步骤S406中描述的操作。此外,例如,如果分割模式信息具有0的值,则分割模式信息能够指示当前块未被分割。

如果分割模式信息指示当前块被分割[第二分割方案、第三分割方案、第四分割方案],则可以通过比特流用信号发送最小分割单元信息(例如,split_offset_size)和分割位置信息(例如,split_offset_0和/或split_offset_1)。例如,如果分割模式信息具有大于0的值,则分割模式信息能够指示当前块被分割。在这种情况下,解码器可以从比特流获得最小分割单元信息和分割位置信息,确定分割边界,并且根据分割边界将当前块分割成至少两个块。

特别地,如果分割模式信息指示当前块被分割成4个块[第四分割方案],则解码器可以从比特流另外获得第二分割位置信息。在这种情况下,解码器可以使用已经获得的分割位置信息和已经获得的第二分割位置信息确定分割边界,并且根据确定的分割边界将当前块分割成4个块。例如,如果分割模式信息具有大于2的值(例如,3),则分割模式信息能够指示当前块被分割成4个块。

如前面的描述所述,对于在编译树块或编译树内分割的每个编译块可以通过比特流用信号发送最小分割单元信息(例如,split_offset_size)。但是,因为不太可能对于每个编译块将会改变最小分割单元,所以如果用于确定分割的最小单元的最小分割单元信息被包括在用于每个编译块的比特流中,则可以降低编译效率。为此,以较高的等级用信号发送用于确定分割的最小单元的最小分割单元信息(例如,split_offset_size)可以比对于编译树块或者编译块用信号发送其更加有效。

例如,可以以序列或图片等级或片或贴片等级确定最小分割单元。为此,可以将最小分割单元信息配置为在序列参数集(SPS)、图片参数集(PPS)或片报头上用信号发送。在这种情况下,解码器通过序列参数集(SPS)、图片参数集(PPS)或片报头从比特流获得最小分割单元信息(例如,split_offset_size),并且可以不获得用于每个编译块的最小分割单元信息。在这种情况下,在图15中示出的语法被修改以删除最小分割单元信息(例如,split_offset_size),并且最小分割单元信息(例如,split_offset_size)可以被包括在序列参数集(SPS)、图片参数集(PPS)或片报头中。

图16图示本发明可以适用于的框图。视频处理装置可以包括视频信号的编码装置和/或解码装置。例如,本发明可以适用于的视频处理装置可以包括诸如智能电话的移动终端、诸如膝上电脑的移动设备,诸如数字TV、数字视频播放器的消费电子设备等等。

存储器12可以存储由处理器11处理和控制的程序,并且可以存储编译的比特流、重建的图像、控制信息等等。此外,存储器12可以用作各种视频信号的缓存器。存储器12可以作为诸如ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、闪存、SRAM(静态RAM)、HDD(硬盘驱动器)、SSD(固态驱动器)等等的存储设备来实现。

处理器11控制视频处理装置中的每个模块的操作。处理器11可以执行按照本发明的各种控制功能以执行编码/解码。处理器11可以被称为控制器、微控制器、微处理器、微型计算机等等。处理器11可以作为硬件或者固件、软件或者其组合来实现。当本发明使用硬件实现的时候,处理器11可以包括ASIC(专用集成电路)、DSP(数字信号处理器)、DSPD(数字信号处理设备)、PLD(可编程序逻辑器件)、FPGA(现场可编程门阵列)等等。同时,当本发明使用固件或者软件实现的时候,固件或者软件可以包括执行按照本发明的功能或者操作的模块、过程或者功能。配置为执行本发明的固件或者软件可以在处理器11中实现,或者可以存储在存储器12中,并且由处理器11执行。

此外,装置10可以选择性地包括网络接口模块(NIM)13。网络接口模块13可操作地与处理器11相连接,并且处理器11可以控制网络接口模块13以经由无线/有线网络发送或者接收携带信息、数据、信号和/或消息的无线/有线信号。例如,网络接口模块13可以支持各种通信标准,诸如IEEE 802系列、3GPP LTE(-A)、Wi-Fi、ATSC(高级电视系统委员会)、DVB(数字视频广播)等等,并且可以按照相应的通信标准发送和接收诸如编码的比特流和/或控制信息的视频信号。根据需要,网络接口模块13可以不必被包括。

此外,装置10可以选择性地包括输入/输出接口14。输入/输出接口14可操作地与处理器11相连接,并且处理器11可以控制输入/输出接口14以输入或者输出控制信号和/或数据信号。例如,输入/输出接口14可以支持诸如USB(通用串行总线)、蓝牙、NFC(近场通信)、串行/并行接口、DVI(数字视觉接口)、HDMI(高分辨率多媒体接口)的规范,以便与诸如键盘、鼠标、触摸板、照相机的输入设备以及诸如显示器的输出设备连接。

如上所述的本发明的实施例是本发明的元素和特征的组合。除非另外提及,该元素或者特征可以考虑是选择性的。每个元素或者特征可以无需与其它的元素或者特征结合来实践。此外,本发明的实施例可以通过合并元素和/或特征的部分来构成。在本发明的实施例中描述的操作顺序可以被重新排序。任何一个实施例的某些结构可以被包括在另一个实施例中,并且可以以另一个实施例的相应结构替换。对本领域技术人员来说显而易见,在所附的权利要求书中没有明确地相互引用的权利要求可以以作为本发明的实施例组合地呈现,或者通过在本申请提交之后的后续修改作为新的权利要求被包括。

本发明的实施例可以通过例如,硬件、固件、软件或者其组合的各种手段实现。在硬件实现中,本发明的实施例可以通过一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程序逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等等来实现。

在固件或者软件实现中,本发明的实施例可以以模块、过程、功能等等的形式来实现。软件代码可以被存储在存储器单元中,并且由处理器执行。存储器单元位于处理器的内部或者外面,并且可以经由各种已知的装置向处理器发送数据以及从处理器接收数据。

对于那些本领域技术人员来说显而易见,不脱离本发明的精神或者范围的情况下,可以在本发明中进行各种修改和变化。因此,本发明意欲覆盖本发明的修改和变化,只要它们落入所附权利要求及其等同物的范围内。

工业实用性

本发明可以适用于诸如解码装置或者编码装置的视频处理装置。

相关技术
  • 视频信号处理设备和视频信号处理方法、视频信号编码设备和视频信号编码方法、及程序
  • 视频信号处理设备和视频信号处理方法、视频信号编码设备和视频信号编码方法、及程序
技术分类

06120112895246