掌桥专利:专业的专利平台
掌桥专利
首页

用于处理图像的方法及其设备

文献发布时间:2023-06-19 09:23:00


用于处理图像的方法及其设备

技术领域

本公开涉及静止图像或视频图像的处理方法,更具体地,涉及一种用于确定执行编码/解码的块的划分结构的方法以及支持该方法的设备。

背景技术

压缩编码意指一系列通过通信线路发送数字化信息的信号处理技术或者以适合于存储介质的形式存储信息的技术。包括画面、图像、音频等的介质可以是压缩编码的目标,具体地,对画面执行压缩编码的技术被称为视频图像压缩。

下一代视频内容应该具有高空间分辨率、高帧频和高场景表示维度的特性。为了处理这些内容,将导致存储器存储、存储器存取速率和处理能力急剧增加。

因此,需要设计一种高效地处理下一代视频内容的编码工具。

发明内容

技术问题

本公开的目的提出一种用于在使用QTBT结构执行块划分时高效地调节块划分的方法。

本公开的另一目的提出一种在BT划分和TT划分之后支持QT划分的方法。

本公开的另一目的提出一种用于将非正方形块划分成相同大小的块的条纹树(ST)结构划分方法。

本公开的另一目的提出一种在相同的句法级别高效地用信号通知QT、BT、TT划分结构信息的方法。

本发明要解决的技术问题不限于上述技术问题,本发明所属领域的技术人员可从以下描述清楚地理解上面没有提及的其它技术问题。

技术方案

在本公开的一方面,一种视频解码方法可包括以下步骤:当当前块满足预先配置的条件时,解析指示当前块是否被划分为多个子块的第一句法元素;当第一句法元素指示当前块被划分时,解析指示当前块是否使用四叉树结构划分的第二句法元素;当第二句法元素指示当前块未使用四叉树结构划分时,解析第三句法元素和第四句法元素中的至少一个,第三句法元素指示当前块是否使用二叉树结构或三叉树结构划分,第四句法元素指示当前块的划分方向;以及基于第一句法元素、第二句法元素、第三句法元素和第四句法元素中的至少一个来确定当前块的划分模式。

优选地,当第一句法元素指示当前块未被划分时,该方法还可包括调用用于当前块的解码处理的编码单元句法。

优选地,当第一句法元素的值为0时,当前块可不被划分,并且当第一句法元素的值为1时,当前块可使用四叉树结构划分为4个子块,或者使用二叉树结构划分为2个子块,或者使用三叉树结构划分为3个子块。

优选地,该方法还可包括调用编码树单元句法以用于基于划分模式来确定从当前块划分的子块的划分结构。

优选地,可从相同级别的句法解析第一句法元素、第二句法元素、第三句法元素和第四句法元素。

优选地,当当前块的左上样本的水平方向坐标的值加上当前块的宽度等于或小于当前画面的宽度时,并且当当前块的左上样本的垂直方向坐标的值加上当前块的高度等于或小于当前画面的高度时,可满足预先配置的条件。

优选地,该方法还可包括解析指示使用二叉树结构或三叉树结构从较高节点的块划分的当前块是否使用四叉树结构划分的第五句法元素。

在本公开的另一方面,一种视频解码设备可包括:句法元素解析单元,其被配置为:当当前块满足预先配置的条件时,解析指示当前块是否被划分为多个子块的第一句法元素,当第一句法元素指示当前块被划分时,解析指示当前块是否使用四叉树结构划分的第二句法元素,并且当第二句法元素指示当前块未使用四叉树结构划分时,解析第三句法元素和第四句法元素中的至少一个,第三句法元素指示当前块是否使用二叉树结构或三叉树结构划分,第四句法元素指示当前块的划分方向;以及划分模式确定单元,其被配置为基于第一句法元素、第二句法元素、第三句法元素和第四句法元素中的至少一个来确定当前块的划分模式。

优选地,该设备还可包括编码单元句法调用单元,编码单元句法调用单元被配置为当第一句法元素指示当前块未被划分时,调用用于当前块的解码处理的编码单元句法。

优选地,当第一句法元素的值为0时,当前块可不被划分,并且当第一句法元素的值为1时,当前块可使用四叉树结构划分为4个子块,或者使用二叉树结构划分为2个子块,或者使用三叉树结构划分为3个子块。

优选地,该设备还可包括编码树单元句法调用单元,编码树单元句法调用单元被配置为调用编码树单元句法以用于基于划分模式来确定从当前块划分的子块的划分结构。

优选地,可从相同级别的句法解析第一句法元素、第二句法元素、第三句法元素和第四句法元素。

优选地,当当前块的左上样本的水平方向坐标的值加上当前块的宽度等于或小于当前画面的宽度时,并且当当前块的左上样本的垂直方向坐标的值加上当前块的高度等于或小于当前画面的高度时,可满足预先配置的条件。

优选地,句法元素解析单元可解析指示使用二叉树结构或三叉树结构从较高节点的块划分的当前块是否使用四叉树结构划分的第五句法元素。

有益效果

根据本公开的实施方式,高效地确定QTBT划分结构,并且用信号通知相关信息,因此,压缩效率可改进。

本公开可获得的效果不限于上述效果,本公开所属领域的普通技术人员可从以下描述显而易见地理解上面没有描述的其它技术效果。

附图说明

附图被包括以提供本发明的进一步理解并且构成详细描述的一部分,附图示出本发明的实施方式并且与说明书一起用于说明本发明的原理。

图1是作为应用了本公开的实施方式的对视频/图像信号进行编码的编码设备的示意性框图。

图2是作为应用了本公开的实施方式的对视频/图像信号进行解码的解码设备的示意性框图。

图3是示出作为可应用本公开的实施方式的多类型树结构的示例的图。

图4是示出作为可应用本公开的实施方式的具有嵌套多类型树结构的四叉树的分区划分信息的信令机制的图。

图5是示出作为可应用本公开的实施方式的基于四叉树和嵌套多类型树结构将CTU分区为多个CU的方法的图。

图6是示出作为可应用本公开的实施方式的限制三叉树划分的方法的图。

图7是示出作为可应用本公开的实施方式的在二叉树划分和三叉树划分中可生成的冗余划分图案的图。

图8是示出作为可应用本公开的实施方式的基于四叉树和嵌套多类型树结构对块进行分区的方法的图。

图9是示出作为可应用本公开的实施方式的基于四叉树的块划分结构的图。

图10是示出作为可应用本公开的实施方式的基于二叉树的块划分结构的图。

图11是示出作为可应用本公开的实施方式的基于三叉树的块划分结构的图。

图12是示出作为可应用本公开的实施方式的基于二叉树和三叉树的块划分结构的图。

图13是示出作为可应用本公开的实施方式的基于条纹树结构对块进行划分的方法的图。

图14是示出作为可应用本公开的实施方式的当前块和邻近块的参考位置的图。

图15是示出根据应用了本公开的实施方式的视频信号的解码方法的流程图。

图16是示出根据应用了本公开的实施方式的视频信号的解码设备的流程图。

图17示出应用了本公开的视频编码系统。

图18是作为应用了本公开的实施方式的内容流系统的配置图。

具体实施方式

参照附图详细描述本公开的一些实施方式。要连同附图一起公开的详细描述旨在描述本公开的一些实施方式,而非旨在描述本公开的仅有实施方式。以下详细描述包括更多细节,以便提供本公开的全面理解。然而,本领域技术人员将理解,本公开可在没有这些更多细节的情况下实现。

在一些情况下,为了避免本公开的概念变得模糊,已知结构和装置被省略或者可基于各个结构和装置的核心功能以框图形式示出。

尽管本公开中使用的大多数术语选自本领域中广泛使用的一般术语,但是一些术语是申请人任意选择的,其含义根据需要在以下描述中详细说明。因此,本公开应该以术语的预期含义而非其简单名称或含义来理解。

提供以下描述中使用的特定术语以帮助理解本公开,并且这些特定术语的使用可在不脱离本公开的技术精神的情况下以各种形式改变。例如,在各个编码处理中,信号、数据、样本、画面、帧、块等可适当地替换和解释。

在本说明书中,“处理单元”是指执行诸如预测、变换和/或量化的编码/解码处理的单元。以下,为了描述方便,处理单元可被称为“处理块”或“块”。

此外,处理单元可被解释为包括用于亮度分量的单元和用于色度分量的单元的含义。例如,处理单元可对应于编码树单元(CTU)、编码单元(CU)、预测单元(PU)或变换单元(TU)。

另外,处理单元可被解释为用于亮度分量的单元或用于色度分量的单元。例如,处理单元可对应于用于亮度分量的编码树块(CTB)、编码块(CB)、预测单元PU或变换块(TB)。此外,处理单元可对应于用于色度分量的CTB、CB、PU或TB。此外,处理单元不限于此,可被解释为包括用于亮度分量的单元和用于色度分量的单元的含义。

另外,处理单元未必限于正方形块,可被配置成具有三个或更多个顶点的多边形形状。

此外,在本说明书中,像素被称为样本。另外,使用样本可意指使用像素值等。

图1是作为应用了本公开的实施方式的对视频/图像信号进行编码的编码设备的示意性框图。

参照图1,编码设备100可被配置为包括图像分割器110、减法器115、变换器120、量化器130、解量化器140、逆变换器150、加法器155、滤波器160、存储器170、帧间预测器180、帧内预测器185和熵编码器190。帧间预测器180和帧内预测器185可被共同称为预测器。换言之,预测器可包括帧间预测器180和帧内预测器185。变换器120、量化器130、解量化器140和逆变换器150可被包括在残差处理器中。残差处理器还可包括减法器115。在一个实施方式中,图像分割器110、减法器115、变换器120、量化器130、解量化器140、逆变换器150、加法器155、滤波器160、帧间预测器180、帧内预测器185和熵编码器190可被配置成一个硬件组件(例如,编码器或处理器)。此外,存储器170可包括解码画面缓冲器(DPB),并且可由数字存储介质实现。

图像分割器110可将输入到编码设备100的输入图像(或画面或帧)分割为一个或更多个处理单元。例如,处理单元可被称为编码单元(CU)。在这种情况下,编码单元可基于四叉树二叉树(QTBT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地划分。例如,一个编码单元可基于四叉树结构和/或二叉树结构被划分为深度更深的多个编码单元。在这种情况下,例如,可首先应用四叉树结构,然后可应用二叉树结构。另选地,可首先应用二叉树结构。根据本公开的编码过程可基于不再划分的最终编码单元执行。在这种情况下,最大编码单元可根据图像特性基于编码效率直接用作最终编码单元,或者如果需要,编码单元可被递归地划分为深度更深的编码单元。因此,具有最优大小的编码单元可用作最终编码单元。在这种情况下,编码过程可包括诸如稍后描述的预测、变换或重构的过程。又如,处理单元还可包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元中的每一个可从各个最终编码单元分割或分区。预测单元可以是用于样本预测的单元,变换单元可以是推导变换系数的单元和/或从变换系数推导残差信号的单元。

单元可根据情况与块或区域互换地使用。在通常情况下,M×N块可指示配置有M列和N行的样本集合或变换系数的集合。通常,样本可指示像素或像素的值,并且可仅指示亮度分量的像素/像素值或者仅指示色度分量的像素/像素值。在样本中,一个画面(或图像)可用作与像素对应的术语。

编码设备100可通过从输入图像信号(原始块或原始样本阵列)减去帧间预测器180或帧内预测器185所输出的预测信号(预测块或预测样本阵列)来生成残差信号(残差块或残差样本阵列)。所生成的残差信号被发送到变换器120。在这种情况下,如所示,编码设备100内从输入图像信号(原始块或原始样本阵列)减去预测信号(预测块或预测样本阵列)的单元可被称为减法器115。预测器可对处理目标块(以下称为当前块)执行预测,并且可生成包括当前块的预测样本的预测块。预测器可确定是否在当前块或CU单元中应用帧内预测或应用帧间预测。预测器可生成关于预测的各种信息(例如,稍后将在各个预测模式的描述中描述的预测模式信息),并且可将信息发送到熵编码器190。关于预测的信息可在熵编码器190中被编码,并且可按比特流形式输出。

帧内预测器185可参考当前画面内的样本来预测当前块。所参考的样本可邻近当前块设置,或者可根据预测模式与当前块间隔开。在帧内预测中,预测模式可包括多个非角模式和多个角模式。例如,非角模式可包括DC模式和平面模式。例如,根据预测方向的精细度,角模式可包括33个角预测模式或65个角预测模式。在这种情况下,例如,根据配置,可使用比33个角预测模式或65个角预测模式更多或更少的角预测模式。帧内预测器185可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧间预测器180可基于参考画面上的运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,运动信息可基于邻近块与当前块之间的运动信息的相关性被预测为块、子块或样本单元。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测)信息。在帧间预测的情况下,邻近块可包括当前画面内的空间邻近块和参考画面内的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可相同或不同。时间邻近块可被称为共置参考块或共置CU(colCU)的名称。包括时间邻近块的参考画面可被称为共置画面(colPic)。例如,帧间预测器180可基于邻近块来构造运动信息候选列表,并且可生成指示哪一候选用于推导当前块的运动向量和/或参考画面索引的信息。可基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器180可使用邻近块的运动信息作为当前块的运动信息。在跳过模式的情况下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,邻近块的运动向量可用作运动向量预测器。可通过用信号通知运动向量差来指示当前块的运动向量。

通过帧间预测器180或帧内预测器185生成的预测信号可用于生成重构信号或残差信号。

变换器120可通过对残差信号应用变换方案来生成变换系数。例如,变换方案可包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。在这种情况下,GBT意指如果像素之间的关系信息被表示为图形,从该图形获得的变换。CNT意指基于使用所有先前重构的像素生成的预测信号获得的变换。此外,变换过程可应用于具有相同大小的正方形形式的像素块,或者可应用于具有可变大小而非正方形形式的块。

量化器130可将变换系数量化并将其发送到熵编码器190。熵编码器190可对量化的信号(关于量化的变换系数的信息)进行编码并将其以比特流形式输出。关于量化的变换系数的信息可被称为残差信息。量化器130可基于系数扫描顺序以一维向量形式重排块形式的量化的变换系数,并且可基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。熵编码器190可执行诸如指数Golomb、上下文自适应可变长度编码(CAVLC)和上下文自适应二进制算术编码(CABAC)的各种编码方法。除了量化的变换系数之外,熵编码器190可一起或单独地对视频/图像重构所需的信息(例如,句法元素的值)进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式发送或存储在网络抽象层(NAL)单元中。比特流可经由网络发送或者可被存储在数字存储介质中。在这种情况下,网络可包括广播网络和/或通信网络。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD的各种存储介质。发送熵编码器190所输出的信号的发送器(未示出)和/或用于存储信号的存储装置(未示出)可被配置为编码设备100的内部/外部元件,或者发送器可以是熵编码器190的元件。

量化器130所输出的量化的变换系数可用于生成预测信号。例如,可通过在循环内通过解量化器140和逆变换器150对量化的变换系数应用解量化和逆变换来重构残差信号。加法器155可将重构的残差信号与帧间预测器180或帧内预测器185所输出的预测信号相加,因此可生成重构信号(重构画面、重构块或重构样本阵列)。如果如已应用跳过模式的情况中一样针对处理目标块不存在残差,则预测块可用作重构块。加法器155可被称为重构器或重构块生成器。所生成的重构信号可用于当前画面内的下一处理目标块的帧内预测,并且可通过滤波用于下一画面的帧间预测(如稍后将描述的)。

滤波器160可通过对重构信号应用滤波来改进主观/可观画面质量。例如,滤波器160可通过对重构画面应用各种滤波方法来生成修改的重构画面。修改的重构画面可被存储在存储器170中,更具体地,存储在存储器170的DPB中。例如,各种滤波方法可包括解块滤波、样本自适应偏移、自适应环路滤波器和双边滤波器。滤波器160可生成用于滤波的各种信息(如稍后将在各个滤波方法的描述中描述的),并且可将其发送到熵编码器190。滤波信息可由熵编码器190编码并以比特流形式输出。

发送到存储器170的修改的重构画面可用作帧间预测器180中的参考画面。如果应用帧间预测,则编码设备可避免编码设备100和解码设备中的预测失配并改进编码效率。

存储器170的DPB可存储修改的重构画面以在帧间预测器180中使用其作为参考画面。存储器170可存储推导(或编码)当前画面中的运动信息的块的运动信息和/或已经重构的画面中的块的运动信息。所存储的运动信息可被转发到帧间预测器180以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器170可存储当前画面中的重构块的重构样本并将其转发到帧内预测器185。

图2是应用了本公开的实施方式,并且是将视频/图像信号解码的解码设备的示意性框图。

参照图2,解码设备200可被配置为包括熵解码器210、解量化器220、逆变换器230、加法器235、滤波器240、存储器250、帧间预测器260和帧内预测器265。帧间预测器260和帧内预测器265可被统称为预测器。即,预测器可包括帧间预测器180和帧内预测器185。解量化器220和逆变换器230可被统称为残差处理器。即,残差处理器可包括解量化器220和逆变换器230。根据实施方式,熵解码器210、解量化器220、逆变换器230、加法器235、滤波器240、帧间预测器260和帧内预测器265可被配置成一个硬件组件(例如,解码器或处理器)。此外,存储器170可包括解码画面缓冲器(DPB),并且可由数字存储介质实现。

当输入包括视频/图像信息的比特流时,解码设备200可根据图1的编码设备中处理视频/图像信息的过程来重构图像。例如,解码设备200可使用编码设备中应用的处理单元来执行解码。因此,例如,用于解码的处理单元可以是编码单元。根据四叉树结构和/或二叉树结构,可从编码树单元或最大编码单元划分编码单元。此外,可通过回放装置回放通过解码设备200解码和输出的重构的图像信号。

解码设备200可按比特流形式接收图1的编码设备所输出的信号。所接收的信号可通过熵解码器210解码。例如,熵解码器210可通过解析比特流来推导用于图像重构(或画面重构)的信息(例如,视频/图像信息)。例如,熵解码器210可基于诸如指数Golomb编码、CAVLC或CABAC的编码方法将比特流内的信息解码,并且可输出用于图像重构的句法元素的值或关于残差的变换系数的量化值。更具体地,在CABAC熵解码方法中,可从比特流接收与各个句法元素对应的信元(bin),可使用邻近和解码目标块的解码目标句法元素信息和解码信息或先前步骤中解码的符号/信元的信息来确定上下文模型,可基于所确定的上下文模型来预测信元发生的概率,并且可通过对信元执行算术解码来生成与各个句法元素的值对应的符号。在这种情况下,在CABAC熵解码方法中,在确定上下文模型之后,可使用针对下一符号/信元的上下文模型解码的符号/信元的信息来更新上下文模型。熵解码器2110中解码的信息当中关于预测的信息可被提供给预测器(帧间预测器260和帧内预测器265)。与已在熵解码器210中执行熵解码的残差值有关的参数信息(即,量化的变换系数)可被输入到解量化器220。此外,熵解码器210中解码的信息当中关于滤波的信息可被提供给滤波器240。此外,接收编码设备所输出的信号的接收器(未示出)可被进一步配置为解码设备200的内部/外部元件,或者接收器可以是熵解码器210的元件。

解量化器220可将量化的变换系数解量化并输出变换系数。解量化器220可按二维块形式重排量化的变换系数。在这种情况下,可基于编码设备中执行的系数扫描顺序来执行重排。解量化器220可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化,并且可获得变换系数。

逆变换器230可通过对变换系数应用逆变换来输出残差信号(残差块或残差样本阵列)。

预测器可对当前块执行预测,并且可生成包括当前块的预测样本的预测块。预测器可基于熵解码器210所输出的关于预测的信息来确定是否对当前块应用帧内预测或应用帧间预测,并且可确定详细帧内/帧间预测模式。

帧内预测器265可参考当前画面内的样本来预测当前块。根据预测模式,所参考的样本可邻近当前块设置或者可与当前块间隔开。在帧内预测中,预测模式可包括多个非角模式和多个角模式。帧内预测器265可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧间预测器260可基于参考画面上的运动向量所指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,运动信息可基于邻近块与当前块之间的运动信息的相关性被预测为块、子块或样本单元。运动信息可包括运动向量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测)信息。在帧间预测的情况下,邻近块可包括当前画面内的空间邻近块和参考画面内的时间邻近块。例如,帧间预测器260可基于邻近块来配置运动信息候选列表,并且可基于所接收的候选选择信息来推导当前块的运动向量和/或参考画面索引。可基于各种预测模式执行帧间预测。关于预测的信息可包括指示当前块的帧间预测模式的信息。

加法器235可通过将所获得的残差信号与帧间预测器260或帧内预测器265所输出的预测信号(预测块或预测样本阵列)相加来生成重构信号(重构画面、重构块或重构样本阵列)。如果如已应用跳过模式的情况中一样针对处理目标块不存在残差,则预测块可用作重构块。

加法器235可被称为重构器或重构块生成器。所生成的重构信号可用于当前画面内的下一处理目标块的帧内预测,并且可用于下一画面通过滤波的帧间预测(如稍后将描述的)。

滤波器240可通过对重构信号应用滤波来改进主观/客观画面质量。例如,滤波器240可通过对重构画面应用各种滤波方法来生成修改的重构画面,并且可将修改的重构画面发送到存储器250,更具体地,发送到存储器250的DPB。例如,各种滤波方法可包括解块滤波、样本自适应偏移SAO、自适应环路滤波器ALF和双边滤波器。

存储在存储器250的DPB中的(修改的)重构画面可在帧间预测器260中用作参考画面。存储器250可存储推导(或解码)当前画面中的运动信息的块的运动信息和/或已经重构的画面中的块的运动信息。所存储的运动信息可被转发到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器170可存储当前画面中的重构块的重构样本并将其转发到帧内预测器265。

在本公开中,编码设备100的滤波器160、帧间预测器180和帧内预测器185中描述的实施方式可分别相同地或以对应方式应用于解码设备200的滤波器240、帧间预测器260和帧内预测器265。

根据本公开的视频/图像编码方法可基于各种详细技术来执行,下面描述各种详细技术中的每一种。对于本领域技术人员而言显而易见的是,本文所描述的技术可与上述和/或下述的视频/图像编码/解码过程中的相关过程(例如,预测、残差处理(逆)变换、(去)量化等、句法元素编码、滤波、分区/划分)关联。

可在上述编码设备的图像分割器110中执行根据本公开的块分区过程,并且分区相关信息可在熵编码器190中进行(编码)处理并以比特流格式转发到解码设备。解码设备的熵解码器210可基于从比特流获得的分区相关信息来获得当前画面的块分区结构,并且基于其,可执行一系列过程(例如,预测、残差处理、块重构、环路滤波等)以用于图像解码。

画面可被分割为编码树单元(CTU)的序列。CTU可对应于编码树块(CTB)。另选地,CTU可包括亮度样本的编码树块和对应色度样本的两个编码树块。换言之,对于包括三种类型的样本阵列的画面,CTU可包括亮度样本的N×N块和色度样本的两个对应样本。

用于编码和预测的CTU的最大支持大小可不同于用于变换的CTU的最大支持大小。例如,CTU中的亮度块的最大支持大小可为128×128。

可基于四叉树(QT)结构将CTU分割成CU。四叉树结构可被称为四元结构。这是为了反映各种局部特性。此外,在本公开中,CTU可基于包括二叉树(BT)和三叉树(TT)以及四叉树的多类型树结构分区来分割。以下,QTBT结构可包括四叉树和二叉树结构,QTBTTT可包括基于二叉树和三叉树的分区结构。另选地,QTBT结构还可包括基于四叉树、二叉树和三叉树的分区结构。在编码树结构中,CU可具有正方形或矩形形状。CTU可首先被分割成四叉树结构,然后,可另外按照多类型树结构分割四叉树结构的叶节点。

图3是示出作为可应用本公开的实施方式的多类型树结构的示例的图。

在本公开的实施方式中,多类型树结构可包括图3所示的4个划分类型。这4个划分类型可包括垂直二元划分(SPLIT_BT_VER)、水平二元划分(SPLIT_BT_HOR)、垂直三元划分(SPLIT_TT_VER)和水平三元划分(SPLIT_TT_HOR)。多类型树结构的叶节点可被称为CU。这些CU可用于预测和变换过程。在本公开中,通常,CU、PU和TU可具有相同的块大小。然而,在最大支持变换长度小于颜色分量的宽度或高度的情况下,CU和TU可具有不同的块大小。

图4是示出作为可应用本公开的实施方式的具有嵌套多类型树结构的四叉树的分区划分信息的信令机制的图。

这里,CTU可被当作四叉树的根并且最初被分区为四叉树结构。稍后,各个四叉树叶节点可被进一步分区为多类型树结构。在多类型树结构中,用信号通知第一标志(例如,mtt_split_cu_flag)以指示对应节点是否被进一步分区。在对应节点被进一步分区的情况下,可用信号通知第二标志(例如,mtt_split_cu_verticla_flag)以指示划分方向。稍后,可用信号通知第三标志(例如,mtt_split_cu_binary_flag)以指示划分类型是二元划分还是三元划分。例如,基于mtt_split_cu_vertical_flag和mtt_split_cu_binary_flag,可如下表1中所示推导多类型树划分模式(MttSplitMode)。

[表1]

图5是示出作为可应用本公开的实施方式的基于四叉树和嵌套多类型树结构将CTU分区为多个CU的方法的图。

这里,加粗的块边缘表示四叉树分区,剩余边缘表示多类型树分区。具有嵌套多类型树的四叉树分区可提供内容自适应编码树结构。CU可对应于编码块(CB)。或者,CU可包括亮度样本的编码块和对应色度样本的两个编码块。CU的大小可与CTU一样大,或者在亮度样本单元中可像4×4一样小。例如,在4:2:0颜色格式(或色度格式)的情况下,最大色度CB大小可为64×64,最小色度CB大小可为2×2。

在本公开中,例如,最大支持亮度TB大小可为64×64,最大支持色度TB大小可为32×32。在根据树结构分区的CB的宽度或高度大于最大变换宽度或高度的情况下,CB可被进一步分区,直至自动(或隐含地)满足水平方向和垂直方向上的TB大小极限为止。

此外,对于没有嵌套多类型的四叉树编码树方案,以下参数可被定义或识别为SPS句法元素。

-CTU大小:四叉树的根节点大小

-MinQTSize:最小允许四叉树叶节点大小

-MaxBtSize:最大允许二叉树根节点大小

-MaxTtSize:最大允许三叉树根节点大小

-MaxMttDepth:从四叉树叶多类型树划分的最大允许层次深度

-MinBtSize:最小允许二叉树叶节点大小

-MinTtSize:最小允许三叉树叶节点大小

作为具有嵌套多类型树的四叉树编码树方案的示例,CTU大小可被设定为128×128亮度样本和两个对应色度样本的64×64块(在4:2:0色度样本中)。在这种情况下,MinOTSize可被设定为16×16,MaxBtSize可被设定为128×128,MaxTtSzie可被设定为64×64,MinBtSize和MinTtSize(对于宽度和高度二者)可被设定为4×4,MaxMttDepth可被设定为4。四叉树分区可被应用于CTU并且生成四叉树叶节点。四叉树叶节点可被称为叶QT节点。四叉树叶节点可具有16×16大小(即,MinOTSize)至128×128大小(即,CTU大小)的大小。在叶QT节点为128×128的情况下,叶QT节点可不分区为二叉树/三叉树。这是因为即使在叶QT节点被分区的情况下,叶QT节点也超过MaxBtsize和MaxTtszie(即,64×64)。在其它情况下,叶QT节点可另外被分区为多类型树。因此,叶QT节点可以是多类型树的根节点,并且叶QT节点可具有多类型树深度(mttDepth)0值。在多类型树深度达到MaxMttdepth(例如,4)的情况下,可不再考虑附加分区。在多类型树节点的宽度等于MinBtSize并且小于或等于2xMinTtSize的情况下,可不再考虑附加水平分区。在多类型树节点的高度等于MinBtSize并且小于或等于2xMinTtSize的情况下,可不再考虑附加垂直分区。

图6是示出作为可应用本公开的实施方式的限制三叉树划分的方法的图。

参照图6,为了在硬件解码器中支持64×64亮度块和32×32色度管线设计,在特定情况下可限制TT划分。例如,在亮度编码块的宽度或高度大于预定的特定值(例如,32、64)的情况下,如图6所示,可限制TT划分。

在本公开中,编码树方案可支持亮度块和色度块具有单独的块树结构。关于P切片和B切片,单个CTU中的亮度和色度CTB可被限制为具有相同的编码树结构。然而,关于I切片,亮度块和色度块可具有相应单独的块树结构。在应用单独的块树模式的情况下,亮度CTB可基于特定编码树结构被分区为CU,并且色度CTB可基于不同的编码树结构被分区为色度CU。这可意味着I切片中的CU可包括色度分量的编码块或两个色度分量的编码块,P切片或B切片中的CU可包括三个颜色分量的块。

在上述“使用树结构的CTU的分区”中,描述了具有嵌套多类型树的四叉树编码树方案,但是CU被分区的结构不限于此。例如,BT结构和TT结构可被解释为包括在多分区树(MPT)结构中的概念,并且可解释为CU通过QT结构和MPT结构来分区。在CU通过QT结构和MPT结构分区的示例中,可用信号通知包括关于QT结构的叶节点被分区为的块的数量的信息的句法元素(例如,MPT_split_type)以及包括在垂直方向和水平方向之间QT结构的叶节点被分区的方向的信息的句法元素(例如,MPT_split_mode),并且可确定划分结构。

在另一示例中,CU可按照与QT结构、BT结构或TT结构不同的方法分区。即,与根据QT结构将低层深度的CU分区为高层深度的CU的1/4大小,根据BT结构将低层深度的CU分区为高层深度的CU的1/2大小,或者根据TT结构将低层深度的CU分区为高层深度的CU的1/4大小或1/2大小不同,在一些情况下低层深度的CU可被分区为高层深度的CU的1/5、1/3、3/8、3/5、2/3或5/8大小,但是对CU进行分区的方法不限于此。

在树节点块的一部分超过底画面边界或右画面边界的情况下,可限制对应树节点块,使得所有编码的CU的所有样本均位于画面边界内。在这种情况下,例如,可应用以下划分规则。

-如果树节点块的一部分超过底画面边界和右画面边界二者,

-如果块是QT节点并且块的大小大于最小QT大小,则强迫以QT划分模式划分块。

-否则,强迫以SPLIT_BT_HOR模式划分块。

-否则,如果树节点块的一部分超过底画面边界,

-如果块是QT节点,并且块的大小大于最小QT大小并且块的大小大于最大BT大小,则强迫以QT划分模式划分块。

-否则,如果块是QT节点,并且块的大小大于最小QT大小并且块的大小小于或等于最大BT大小,则强迫以QT划分模式或SPLIT_BT_HOR模式划分块。

-否则(块是BTT节点或者块的大小小于或等于最小QT大小),强迫以SPLIT_BT_HOR模式划分块。

-否则,如果树节点块的一部分超过右画面边界,

-如果块是QT节点,并且块的大小大于最小QT大小并且块的大小大于最大BT大小,则强迫以QT划分模式划分块。

-否则,如果块是QT节点,并且块的大小大于最小QT大小并且块的大小小于或等于最大BT大小,则强迫以QT划分模式或SPLIT_BT_VER模式划分块。

-否则(块是BTT节点或者块的大小小于或等于最小QT大小),强迫以SPLIT_BT_VER模式划分块。

此外,上述具有嵌套多类型树的四叉树编码树方案可提供非常灵活的分区结构。由于多类型树中支持的划分类型,在一些情况下不同的划分图案可带来相同的编码块结构结果。通过限制这些冗余划分图案的生成,分区信息的数据量可减少。这参照以下附图描述。

图7是示出作为可应用本公开的实施方式的在二叉树划分和三叉树划分中可生成的冗余划分图案的图。

如图7所示,一个方向上的两个级别的连续二元划分可具有与在三元划分之后对中央分区的二元划分相同的编码块结构。在这种情况下,可(在给定方向上)限制对三叉树划分的中央分区的二叉树划分。这种限制可应用于所有画面的CU。在这种特定划分被限制的情况下,可通过反映限制的情况来修改对应句法元素的信令,并且由此,为分区用信号通知的比特数可减少。例如,如图7中举例说明的,在对CU的中央分区的二叉树划分被限制的情况下,可不用信号通知指示划分是二元划分还是三元划分的mtt_split_cu_binary_flag句法元素,并且解码器可将该值推断为0。

如上所述,CTU(或CTB(编码树块)、CU(C、CB))可基于包括二叉树(BT)和三叉树(TT)的多类型树结构划分以及四叉树来分区。在基于该划分结构对块进行分区并基于分区的块单元执行编码时,本公开的实施方式提出了一种用于改进编码速率的方法。

本公开的目的在于提出一种用于在使用QTBT结构执行块分区时高效地调节块划分的方法。

另外,本公开的目的提出一种在BT划分和TT划分之后支持QT划分的方法。

另外,本公开的目的在于提出一种用于将非正方形块划分成相同大小的块的条纹树(ST)结构划分方法。

另外,本公开的目的在于提出一种在相同的句法级别高效地用信号通知QT、BT、TT划分结构信息的方法。

根据本公开的实施方式,可高效地确定QTBT结构,并且用信号通知相关信息,因此,压缩性能可显著改进。

在本公开的实施方式中,编码器/解码器可利用BT(二叉树)或TT(三叉树)结构(即,多类型树结构)执行块划分。作为实施方式,CTU或单个QT端块(即,QT结构的叶节点块)可通过BT分区为两个下块。另外,CTU或单个QT端块可通过TT分区为三个下块。

图8是示出作为可应用本公开的实施方式的基于四叉树和嵌套多类型树结构对块进行分区的方法的图。

参照图8,示出通过BT和TT的分区方法。在图8中,假设正方形块在水平方向或垂直方向上被分区的情况,但本公开不限于此,非正方形块也可被分区。

在以BT结构分区的情况下,单个块可在水平方向或垂直方向上被分区为两个下块,如图8的(a)和图8的(b)所示。即,分区的块可具有两个N×2N形状或两个2N×N形状。

在以TT结构分区的情况下,单个块可在水平方向或垂直方向上被分区为三个下块,如图8的(c)和图8的(d)所示。在块被分区为三个块的情况下,一个块较大,两个块较小,或者三个块可相等地分区。作为示例,在水平方向分区的情况下,高度可按1:2:1比例分区,在垂直方向分区的情况下,宽度可按1:2:1比例分区。

可通过经由各种结构的块划分增加自由度来改进压缩效率,但是由于改进的划分自由度而引起的复杂度增加可能成为问题。因此,在本公开的实施方式中,在基于QT结构执行块划分时,提出了一种通过考虑性能和复杂度之间的关系来发送用于调节QT划分度的句法的方法。

作为实施方式,编码器可发送最大QT块大小(MaxQTSize)、最小QT块大小(MinQTSize)和最大QT块划分深度(MaxQTDepth)的至少一个句法(或句法元素)。这里,最大QT块大小可表示可进行QT划分的最大块大小,并且可被表示为对数尺度形式(例如,log2)。最小QT块大小可表示可进行QT划分的最小块大小,并且可被表示为对数尺度形式(例如,log2)。另外,最大QT块划分深度可表示从最大QT块大小的QT划分数量。

根据切片(或拼块组)、拼块和图像分量的类型,各个句法信息可通过序列参数集(SPS)、画面参数集(PPS)、切片头(SH)(或拼块组头(TGH))或网络抽像层(NAL)单元的头来发送。

关于单个图像(或序列、画面、拼块、拼块组),上述句法可按互补方式发送。作为实施方式,单个图像可按以下实施方式的组合发送。

(1)最大QT块大小,最小QT块大小

(2)最大QT块大小,最大QT块划分深度

(3)最小QT块大小,最大QT块划分深度

(4)最大QT块大小,最小QT块大小,最大QT块划分深度

参照实施方式(1),编码器可将最大QT块大小和最小QT块大小句法(或句法元素)用信号通知给解码器,并且解码器可使用最大QT块大小和最小QT块大小来得出最大QT块划分深度值。另外,参照实施方式(2),编码器可将最大QT块大小和最大QT块划分深度句法用信号通知给解码器。解码器可使用最大QT块大小和最大QT块划分深度来得出最小QT块划分深度值。另外,参照实施方式(3),编码器可将最小QT块大小和最大QT块划分深度句法用信号通知给解码器。解码器可使用最小QT块大小和最大QT块划分深度来得出最大QT块大小值。另外,参照实施方式(4),编码器可用信号通知所有三个句法。在这种情况下,最大QT块划分深度的值可与最大QT块大小和最小QT块大小之间的差相同。

在本公开的实施方式中,在基于BT结构执行块划分时,可通过考虑性能和复杂度之间的关系来发送用于调节BT划分度的句法。

作为实施方式,编码器可发送最大BT块大小(MaxBTSize)、最小BT块大小(MinBTSize)和最大BT块划分深度(MaxBTDepth)的至少一个句法(或句法元素)。这里,最大BT块大小可表示可进行BT划分的最大块大小并且可被表示为对数尺度形式(例如,log2)。最小BT块大小可表示可进行BT划分的最小块大小并且可被表示为对数尺度形式(例如,log2)。另外,最大BT块划分深度可表示从最大BT块大小的BT划分数量。

根据切片(或拼块组)、拼块和图像分量的类型,各个句法信息可通过序列参数集(SPS)、画面参数集(PPS)、切片头(SH)(或拼块组头(TGH))或网络抽像层(NAL)单元的头来发送。

关于单个图像(或序列、画面、拼块、拼块组),上述句法可按互补方式发送。作为实施方式,单个图像可按以下实施方式的组合发送。

(1)最大BT块大小,最小BT块大小

(2)最大BT块大小,最大BT块划分深度

(3)最小BT块大小,最大BT块划分深度

(4)最大BT块大小,最小BT块大小,最大BT块划分深度

参照实施方式(1),编码器可将最大BT块大小和最小BT块大小句法(或句法元素)用信号通知给解码器,并且解码器可使用最大BT块大小和最小BT块大小来得出最大BT块划分深度值。另外,参照实施方式(2),编码器可将最大BT块大小和最大BT块划分深度句法用信号通知给解码器。解码器可使用最大BT块大小和最大BT块划分深度来得出最小BT块划分深度值。另外,参照实施方式(3),编码器可将最小BT块大小和最大BT块划分深度句法用信号通知给解码器。解码器可使用最小BT块大小和最大BT块划分深度来得出最大BT块大小值。另外,参照实施方式(4),编码器可用信号通知所有三个句法。在这种情况下,最大BT块划分深度的值可与最大BT块大小和最小BT块大小之间的差不同。这是因为开始BT划分的块的大小取决于QT划分。

在实施方式中,可用信号通知在上述(2)至(4)中用信号通知的最大BT块划分深度作为包括BT结构和TT结构的多类型树划分的最大深度。换言之,最大BT块划分深度可与最大MTT块划分深度相同。

编码器/解码器可使用最大BT块划分深度值来调节(或控制)性能和复杂度。另外,在开始BT划分的块的大小较小的情况下,其比最大BT块划分深度更快到达最小BT块大小。在这种情况下,对应块不再允许BT划分。

在本公开的实施方式中,在基于TT结构执行块划分时,可通过考虑性能和复杂度之间的关系来发送用于调节TT划分度的句法。

作为实施方式,编码器可发送最大TT块大小(MaxTTSize)、最小TT块大小(MinTTSize)和最大TT块划分深度(MaxTTDepth)的至少一个句法(或句法元素)。这里,最大TT块大小可表示可进行TT划分的最大块大小并且可被表示为对数尺度形式(例如,log2)。最小TT块大小可表示可进行TT划分的最小块大小并且可被表示为对数尺度形式(例如,log2)。另外,最大TT块划分深度可表示从最大TT块大小的TT划分数量。

根据切片(或拼块组)、拼块和图像分量的类型,各个句法信息可通过序列参数集(SPS)、画面参数集(PPS)、切片头(SH)(或拼块组头(TGH))或网络抽像层(NAL)单元的头来发送。

关于单个图像(或序列、画面、拼块、拼块组),上述句法可按互补方式发送。作为实施方式,单个图像可按以下实施方式的组合发送。

(1)最大TT块大小,最小TT块大小

(2)最大TT块大小,最大TT块划分深度

(3)最小TT块大小,最大TT块划分深度

(4)最大TT块大小,最小TT块大小,最大TT块划分深度

参照实施方式(1),编码器可将最大TT块大小和最小TT块大小句法(或句法元素)用信号通知给解码器,并且解码器可使用最大TT块大小和最小TT块大小来得出最大TT块划分深度值。

另外,参照实施方式(2),编码器可将最大TT块大小和最大TT块划分深度句法用信号通知给解码器。解码器可使用最大TT块大小和最大TT块划分深度来得出最小TT块划分深度值。

另外,参照实施方式(3),编码器可将最小TT块大小和最大TT块划分深度句法用信号通知给解码器。解码器可使用最小TT块大小和最大TT块划分深度来得出最大TT块大小值。

另外,参照实施方式(4),编码器可用信号通知所有三个句法。在这种情况下,最大TT块划分深度的值可与最大TT块大小和最小TT块大小之间的差不同。这是因为TT划分开始的块大小取决于QT划分。

编码器/解码器可使用最大TT块划分深度值来控制(或调节)性能和复杂度。另外,在开始TT划分的块的大小较小的情况下,其比最大TT块划分深度更早达到最小TT块大小。在这种情况下,对应块不再允许TT划分。

在实施方式中,可用信号通知在上述(2)至(4)中用信号通知的最大TT块划分深度作为包括BT结构和TT结构的多类型树划分的最大深度。换言之,最大BT块划分深度可与最大MTT块划分深度相同。

在实施方式中,最大TT块大小可被定义为16×16。在这种情况下,TT块的一侧长度可被定义为4、8、4。另外,最小TT块大小可被表示为log2_min_luma_TT_block_size_minus4,并且最小TT块大小和最大TT块大小之间的差可被表示为log2_diff_max_min_luma_TT_block_size。

解码器可使用最小TT块大小来得出TT块大小变量(TTbLog2SizeY)。例如,可使用下式1和2来得出TT块大小变量(TTbLog2SizeY)。

[式1]

MinTTbLog2SizeY=log2_min_luma_TT_block_size_minus4+4

[式2]

TTbLog2SizeY=MinTTbLog2SizeY+log2_diff_max_min_luma_TT_block_size

通过该式得出的TT块大小变量(TTbLog2SizeY)可用在后续解码处理中。例如,TT块大小变量(TTbLog2SizeY)可用在帧内预测、帧间预测、滤波、变换、量化和熵解码处理中。

在本公开的实施方式中,在基于BT结构和TT结构(可被称为MTT或BTT作为多类型树结构)执行块划分时,编码器/解码器可通过考虑性能和复杂度之间的关系来发送用于调节MTT划分度的句法。

作为实施方式,编码器可发送最大MTT块大小(MaxMTTSize)、最小MTT块大小(MinMTTSize)和最大MTT块划分深度(MaxBTTDepth)的至少一个句法(或句法元素)。这里,最大MTT块大小可表示可进行MTT划分的最大块大小并且可被表示为对数尺度形式(例如,log2)。最小MTT块大小可表示可进行MTT划分的最小块大小并且可被表示为对数尺度形式(例如,log2)。另外,最大MTT块划分深度可表示从最大MTT块大小的MTT划分数量。

根据切片(或拼块组)、拼块和图像分量的类型,各个句法信息可通过序列参数集(SPS)、画面参数集(PPS)、切片头(SH)(或拼块组头(TGH))或网络抽像层(NAL)单元的头来发送。

关于单个图像(或序列、画面、拼块、拼块组),上述句法可按互补方式发送。作为实施方式,单个图像可按以下实施方式的组合发送。

(1)最大MTT块大小,最小MTT块大小

(2)最大MTT块大小,最大MTT块划分深度

(3)最小MTT块大小,最大MTT块划分深度

(4)最大MTT块大小,最小MTT块大小,最大MTT块划分深度

参照实施方式(1),编码器可将最大MTT块大小和最小MTT块大小句法(或句法元素)用信号通知给解码器,并且解码器可使用最大MTT块大小和最小MTT块大小来得出最大MTT块划分深度值。

另外,参照实施方式(2),编码器可将最大MTT块大小和最大MTT块划分深度句法用信号通知给解码器。解码器可使用最大MTT块大小和最大MTT块划分深度来得出最小MTT块划分深度值。

另外,参照实施方式(3),编码器可将最小MTT块大小和最大MTT块划分深度句法用信号通知给解码器。解码器可使用最小MTT块大小和最大MTT块划分深度来得出最大MTT块大小值。

另外,参照实施方式(4),编码器可用信号通知所有三个句法。在这种情况下,最大MTT块划分深度的值可与最大MTT块大小和最小MTT块大小之间的差不同。这是因为MTT划分开始的块大小取决于QT划分。

编码器/解码器可使用最大MTT块划分深度值来控制(或调节)性能和复杂度。另外,在开始MTT划分的块的大小较小的情况下,其比最大MTT块划分深度更快到达最小MTT块大小。在这种情况下,对应块不再允许MTT划分。

图9是示出作为可应用本公开的实施方式的基于四叉树的块划分结构的图。

参照图9,在本公开的实施方式中,单个块可基于四叉树(QT)来划分。另外,以QT结构划分的单个子块可进一步以QT结构递归地划分。不再以QT结构划分的端块(可被称为叶块或叶节点块)可通过二叉树(BT)、三叉树(TT)或非对称树(AT)中的至少一个划分。

作为示例,块A可按QT结构划分为四个子块A0、A1、A2和A3。另外,子块A1可再次以QT结构进一步划分为四个子块B0、B1、B2和B3。

图10是示出作为可应用本公开的实施方式的基于二叉树的块划分结构的图。

参照图10,BT可具有包括水平方向BT(例如,2N×N、2N×N)和垂直方向BT(例如,N×2N、N×2N)的两个划分形状。

作为示例,不再以QT结构划分的块(即,叶节点块)B3可被划分为垂直方向BT C0和C1或水平方向BT D0和D1。在垂直方向上划分的情况下,类似于块C0,各个子块可在水平方向BT E0和E1或垂直方向BT F0和F1中递归地划分。

图11是示出作为可应用本公开的实施方式的基于三叉树的块划分结构的图。

参照图11,TT可具有包括水平方向TT(例如,2N×1/2N、2N×N、2N×1/2N)和垂直方向TT(例如,1/2N×2N、N×2N、1/2N×2N)的两个划分形状。

作为示例,不再以QT结构划分的块B3可被划分为垂直方向TT C0、C1和C2或水平方向TT D0、D1和D2。如图11所示,块C1可在水平方向TT E0、E1和E2或垂直方向TT F0、F1和F2中递归地划分。

作为另一示例,AT可具有包括水平向上AT(2N×1/2N、2N×3/2N)、水平向下AT(2N×3/2N、2N×1/2N)、垂直向左AT(1/2N×2N、3/2N×2N)和垂直向右AT(3/2N×2N、1/2N×2N)的四个划分结构形状。BT、TT和AT中的每一个可使用BT、TT和AT进一步递归地划分。

图12是示出作为可应用本公开的实施方式的基于二叉树和三叉树的块划分结构的图。

参照图12,可一起使用BT划分结构和TT划分结构来划分处理块。例如,以BT结构划分的子块可按TT结构划分。另选地,以TT结构划分的子块可按BT结构划分。

在图12中,由细实线表示的划分表示第一划分,由粗虚线表示的划分表示在第一划分中生成的子块中执行的第二划分。

表2表示编码四叉树句法结构,表3表示编码树的句法。

[表2]

参照表2,描述用于确定四叉树划分结构的解码处理。可以当前块的左上坐标(x0,y0)、当前块的大小(log2CbSize)和当前四叉树划分的深度作为输入来调用编码四叉树句法(或函数)。

在当前块不超过当前画面的宽度或高度,并且当前块大于最小大小的编码块的情况下,解码器解析split_qt_flag句法元素。split_qt_flag句法元素指示当前块是否以四叉树结构划分为四个块。例如,在split_qt_flag值为0的情况下,该情况表示当前块不以四叉树结构划分为四个块,并且在split_qt_flag值为1的情况下,该情况表示当前块被划分为一半宽度和一半高度的四个块。x0和y0表示亮度图像的左上位置。

作为解析结果,在确定当前块以四叉树结构划分的情况下,解码器针对从当前块划分的4个子块再次调用编码四叉树句法(或函数)。

作为解析结果,在确定当前块未以四叉树结构划分的情况下,解码器针对当前块调用编码四叉树句法(或函数)以用于确定后续划分结构(即,多类型树结构)。

[表3]

参照表3,描述用于确定四叉树叶节点块中的附加划分结构的解码处理。可以当前块的左上坐标(x0,y0)、当前块的宽度(log2CbSize)和当前块的宽度(log2CbSizeH)作为输入调用编码四叉树句法(或函数)。

在当前块未超过当前画面的宽度或高度并且当前块大于最小大小的MTT块的情况下,解码器解析split_fur_flag句法元素。split_fur_flag句法元素指示当前块是否被进一步划分。例如,在split_fur_flag值为0的情况下,该情况表示当前块不再划分,在split_fur_flag值为1的情况下,该情况表示当前块被划分。

作为解析结果,在确定当前块被进一步划分的情况下,解码器调用split_bt_flag和split_dir句法元素(或函数)。split_bt_flag句法表示当前块是否以BT结构或TT结构划分。例如,在split_bt_flag值为1的情况下,该情况表示块以BT划分,在split_bt_flag值为0的情况下,该情况表示块以TT划分。

当前块的划分类型(SplitType)可基于split_fur_flag句法和split_bt_flag句法如下表4所示确定。

[表4]

另外,在表3中,split_dir句法元素表示划分方向。例如,在split_dir值为0的情况下,该情况表示块在水平方向上划分,在split_dir值为1的情况下,该情况表示块在垂直方向上划分。

可如下表5所示得出从当前块MTT划分的最终块划分模式(SplitMode)。

[表5]

解码器再次针对根据最终确定的划分结构划分的子块调用编码树句法(或函数)。

在本公开的实施方式中,在以多类型树(即,BT、TT)结构划分之后,提出了一种在划分期间支持QT划分的方法。作为实施方式,如下表6所示,可通过序列参数集(SPS)中的标志信令选择性地使用在执行BT划分和TT划分之后支持QT划分。

[表6]

参照表6,nesting_split_qt_enable_flag句法元素表示是否在QT划分之后以下级句法(例如,编码树)发送用于QT划分的split_qt_flag。例如,在nesting_split_qt_enable_flag值为0的情况下,不在编码树单元中发送split_qt_flag。在nesting_split_qt_enable_flag值为1的情况下,可在编码树单元中发送split_qt_flag。

上述表6仅是示例,但本公开不限于此。可使用画面参数集(PPS)、切片头(或拼块组头)或其它网络抽像层(NAL)以及SPS用信号通知nesting_split_qt_enable_flag句法。

下表7表示根据本公开的实施方式的编码树的句法结构。

[表7]

参照表7,可以当前块的左上坐标(x0,y0)、当前块的宽度(log2CbSizeW)和当前块的宽度(log2CbSizeH)作为输入来调用编码树句法(或函数)。

解码器检查当前块是否未超过当前画面的宽度或高度并且当前块是否大于最小大小的BTT块(或MTT块)。

在当前块未超过当前画面的宽度或高度并且当前块大于最小大小的BTT块的情况下,当从较高级别的句法解析的nesting_split_qt_enable_flag为1,bttDepth大于0,并且块的宽度和高度相等时,解码器可解析nesting_split_qt_flag。

这里,bttDepth可意指以BT或TT划分的块的深度,并且可基于开始BT或TT划分的块的宽度和高度计算为当前块的大小之比。nesting_split_qt_flag句法表示当前编码块是否以QT形状划分为四个块。例如,在nesting_split_qt_flag值为0的情况下,该情况表示当前块未被划分,在nesting_split_qt_flag值为1的情况下,该情况表示当前块被划分为一半宽度和一半高度的四个块。

在比特流中未示出nesting_split_qt_flag的情况下,其被得出为0。稍后,在nesting_split_qt_flag值为0的情况下,解码器解析split_fur_flag。另外,在根据split_fur_flag值识别出当前块被另外划分的情况下,解码器解析split_bt_flag和split_dir句法元素。

split_fur_flag句法表示当前编码块是否被另外划分。例如,在split_fur_flag值为0的情况下,该情况表示块不再划分,在split_fur_flag值为1的情况下,该情况表示块被划分。

split_bt_flag句法表示块是否以BT或TT结构划分。例如,在split_bt_flag值为1的情况下,该情况表示块以BT划分,在split_bt_flag值为0的情况下,该情况表示块以TT划分。可基于split_fur_flag句法和split_bt_flag句法如下表8所示确定当前块的划分类型(SplitType)。

[表8]

另外,在表7中,split_dir句法元素表示划分方向。例如,在split_dir值为0的情况下,该情况表示块在水平方向上划分,在split_dir值为1的情况下,该情况表示块在垂直方向上划分。

可如下表9所示得出从当前块MTT划分的最终块划分模式(SplitMode)。

[表9]

解码器针对根据最终确定的划分结构划分的子块再次调用编码树句法(或函数)。

图13是示出作为可应用本公开的实施方式的基于条纹树结构来对块进行划分的方法的图。

在编码器和解码器的硬件方面,正方形形状的划分可比非正方形划分的划分更高效。在非正方形块的情况下宽度和高度显著不同的情况下,将非正方形块再次划分为正方形块可能更高效。因此,在本公开的实施方式中,提出了用于将非正方形块划分为相同大小的四个块的条纹树(ST)块划分结构。

具体地,如图13所示,编码器/解码器可在垂直方向(图13的(a))或垂直方向(图13的(b))上以ST结构将非正方形块划分为相同大小的四个块。

作为实施方式,如下表10所示,可通过序列参数集(SPS)中的标志信令选择性地使用ST划分的支持。

[表10]

参照表10,split_st_enable_flag句法元素表示是否以较低级别的句法(例如,编码树)发送用于ST划分的split_st_flag。例如,在split_st_enable_flag值为0的情况下,不在编码树单元中发送split_st_flag。在split_st_enable_flag值为1的情况下,可在编码树单元中发送split_st_flag。

上述表10仅是示例,但本公开不限于此。可使用画面参数集(PPS)、切片头(或拼块组头)或其它网络抽像层(NAL)以及SPS用信号通知split_st_enable_flag句法。

下表11表示根据本公开的实施方式的编码树的句法结构。

[表11]

参照表11,可以当前块的左上坐标(x0,y0)、当前块的宽度(log2CbSizeW)和当前块的宽度(log2CbSizeH)作为输入来调用编码树句法(或函数)。省略与上述表7重复的描述。

在较高级别的句法中解析的split_st_enable_flag值为1,并且当前块的宽度比高度大四倍或者当前块的高度比宽度大四倍的情况下,解码器解析split_st_flag。这里,split_st_flag句法元素表示当前编码块是否以ST形状划分为四个块。

例如,在split_st_flag值为0的情况下,该情况意指块不被划分,在split_st_flag值为1的情况下,该情况意指块在水平方向或垂直方向上被划分为相同大小的四个块。在比特流中未示出split_st_flag的情况下,其可被得出为0。稍后,当split_st_flag值为0时,可发送split_fur_flag、split_bt_flag和split_dir句法。

split_fur_flag句法表示当前编码块被另外划分。例如,在split_fur_flag值为0的情况下,该情况意指块不再划分,在split_fur_flag值为1的情况下,该情况意指块被划分。

可基于split_fur_flag句法和split_bt_flag句法如下表12所示确定当前块的划分类型(SplitType)。

[表12]

另外,在表11中,split_dir句法元素表示划分方向。例如,在split_dir值为0的情况下,该情况表示块在水平方向上划分,在split_dir值为1的情况下,该情况表示块在垂直方向上划分。

可如下表13所示得出从当前块MTT划分的最终块划分模式(SplitMode)。

[表13]

另外,在实施方式中,如下表14所示,上述split_st_flag句法元素可位于split_fur_flag句法之后。

[表14]

参照表14,在当前块根据split_fur_flag进一步划分的情况下,解码器可在较高级别的句法中解析的split_st_enable_flag值为1并且当前块的宽度比高度大四倍或者当前块的高度比宽度大四倍的情况下解析split_st_flag。

另外,在上表11和表14中,通过假设ST中宽度和高度之间的差为4倍来发送(或解析)split_st_flag,但本公开不限于此,而是可在宽度和高度之间的差为一倍(相同大小)、两倍、八倍或十六倍的情况下发送(或解析)split_st_flag。另选地,可通过配置两个或三个比例的组合来发送split_st_flag。另选地,可在预定块比例或以上的情况下发送split_st_flag。

另外,split_st_flag可与实施方式7中描述的nesting_split_qt_flag一起使用。在两个句法元素一起使用的情况下的句法结构可表示在下表15中。

[表15]

参照表15,可通过解析nesting_split_qt_flag来识别是否执行qt划分,并且通过解析split_fur_flag来识别当前块是否被划分。在当前块根据split_fur_flag进一步划分的情况下,解码器可在较高级别的句法中解析的split_st_enable_flag值为1并且当前块的宽度比高度大四倍或者当前块的高度比宽度大四倍的情况下解析split_st_flag。

在本公开的实施方式中,提出了一种以相同的句法结构(即,相同级别的句法)发送QT、BT和TT的划分结构的方法。在此实施方式中,不考虑块是正方形块还是非正方形块,编码器/解码器可从最高节点(例如,CTU)执行QT结构划分。另外,不考虑BT结构和TT结构是不是QT划分的叶节点,也可进行从最高节点的划分。表16表示根据本公开的实施方式的编码四叉树的句法。

[表16]

参照表16,可以当前块的左上坐标(x0,y0)、当前块的大小(log2CbSize)和当前四叉树划分的深度作为输入来调用编码四叉树句法(或函数)。

在当前块未超过当前画面的宽度或高度并且当前块大于最小大小的编码块的情况下,解码器解析split_fur_flag句法元素。这里,split_fur_flag句法元素指示当前块是否以四叉树结构划分为四个块。

例如,在split_fur_flag值为0的情况下,该情况表示当前块不以四叉树结构划分为四个块,在split_fur_flag值为1的情况下,该情况表示当前块被划分为较低深度的块。即,在此实施方式中,并且在split_fur_flag值为1的情况下,可发送split_qt_flag句法元素。

即,解码器识别split_fur_flag值,并且在值为1的情况下,解码器解析split_qt_flag句法元素。这里,split_st_flag句法元素表示当前块是否以QT结构划分为四个块。在当前块被另外划分的情况下,解码器可首先检查当前块是否以QT结构划分。例如,在split_qt_flag值为0的情况下,该情况表示块不以QT结构划分,在split_qt_flag值为1的情况下,该情况表示块被划分为包括一半宽度和一半高度的四个块。在此实施方式中,在split_qt_flag值为0的情况下,可发送split_bt_flag。换言之,在当前块不以QT结构划分的情况下,解码器可识别当前块是否以MTT结构划分。

即,在split_qt_flag值为0的情况下,解码器可解析split_bt_flag和/或split_dir句法元素。这里,split_bt_flag句法元素表示块是否以多类型树结构(即,BT或TT)划分。例如,在split_bt_flag值为1的情况下,该情况表示块以BT划分,在split_bt_flag值为0的情况下,该情况表示块以TT划分。另选地,在split_bt_flag值为0的情况下,该情况表示块以BT划分,在split_bt_flag值为1的情况下,该情况表示块以TT划分。

可基于split_fur_flag、split_qt_flag和split_bt_flag句法元素如下表17所示确定当前块的划分类型(SplitType)。

[表17]

以下,描述与上面的实施方式4中描述的描述关联的实施方式。

在实施方式中,可在执行帧内预测时在得出帧内预测模式的处理中使用上面的实施方式4中描述的TT块大小参数(TTbLog2SizeY)。具体地,可在得出候选帧内预测模式的处理中使用TT块大小变量(TTbLog2SizeY)。

例如,在预测块存在于TT块的最上侧的情况下,上邻近块的候选帧内预测模式可被设定为INTRA_DC。更具体的实施方式可如下,但本公开不限于此。

图14是示出作为可应用本公开的实施方式的当前块的和邻近块的参考位置的图。

参照图14,(xPb,yPb)指示预测块的位置,(xNbB,yNbB)指示与上侧相邻的样本的位置,(xNbA,yNbA)指示与左侧相邻的样本的位置。(xNbA,yNbA)可被设定为(xPb-1,yPb),(xNbB,yNbB)可被设定为(xPb,yPb-1)。

为了得出候选帧内预测模式,编码器/解码器可检查左邻近块和上邻近块是否可用(称为第一条件)。在左邻近块和上邻近块不可用的情况下,候选帧内预测模式(candIntraPredModeX)(X=A、B)可被设定为INTRA_DC。

在并非所有左邻近块和上邻近块均不可用的情况下,编码器/解码器可检查左邻近块或上邻近块是帧间模式还是PCM模式(称为第二条件)。在左邻近块或上邻近块不是帧内预测模式或PCM标志为1的情况下(即,PCM编码的情况),编码器/解码器可将候选帧内预测模式(candIntraPredModeX)(X=A、B)设定为INTRA_DC。

当不满足第一条件和第二条件时,在预测块存在于TT块的最上侧的情况下,上邻近块的候选帧内预测模式可被设定为INTRA_DC。

如上所述,可基于TT块大小变量(TTbLog2SizeY)得出候选帧内预测模式,并且候选帧内预测模式可用于得出当前块的帧内预测模式。基于得出的帧内预测模式来生成预测块,并且解码器可通过将残差块和预测块相加来重构视频信号。

作为另一实施方式,可在帧间预测中在预测时间运动向量的处理中使用TT块大小变量(TTbLog2SizeY)。例如,可在得出右下块的并置运动向量的处理中使用TT块大小变量(TTbLog2SizeY)。

具体地,基于TT块大小变量(TTbLog2SizeY),可得出右下块的并置运动向量,并且右下块的并置运动向量可用于生成当前预测块的运动向量预测值。

编码器/解码器可通过将运动向量预测值和运动向量差值相加来生成运动向量,并使用该运动向量来生成帧间预测块。解码器可通过将残差块和预测块相加来重构视频信号。

作为另一实施方式,可在得出量化参数的处理中使用TT块大小变量(TTbLog2SizeY)。例如,可在得出左邻近块或上邻近块的量化参数的处理中使用TT块大小变量(TTbLog2SizeY)。

作为另一实施方式,可在执行SAO(样本自适应偏移)的处理中使用TT块大小变量(TTbLog2SizeY)。

另外,在表16中,split_dir句法元素表示划分方向。例如,在split_dir值为0的情况下,该情况表示块在水平方向上划分,在split_dir值为1的情况下,该情况表示块在垂直方向上划分。

可如下表18所示得出从当前块MTT划分的最终块划分模式(SplitMode)。

[表18]

解码器针对根据最终确定的划分结构划分的子块再次调用编码四叉树句法(或函数)。

在本公开的实施方式中,在描述以相同的句法结构(即,相同级别的句法)发送QT、BT和TT的划分结构的方法时,为了描述方便,主要描述以编码四叉树句法发送QT、BT和TT的划分结构的情况,但本公开不限于此。例如,以编码树句法发送QT、BT和TT的划分结构。

到目前为止,为了描述方便,针对各个实施方式单独地描述了本公开的实施方式,但本公开不限于此。换言之,上述实施方式1至9可单独地执行,或者一个或更多个实施方式可组合执行。

图15是示出根据应用了本公开的实施方式的视频信号的解码方法的流程图。

参照图15,为了描述方便,主要描述解码器,但本公开不限于此。根据本公开的实施方式的视频信号的解码方法可在编码器和解码器中以相同的方式执行。

在当前块满足预先配置的条件的情况下,解码器解析指示当前块是否被划分为多个子块的第一句法元素(步骤S1501)。

如上述实施方式6至9中所述,在第一句法元素值为0的情况下,当前块可不被划分,在第一句法元素值为1的情况下,当前块可使用四叉树结构划分为四个子块,可使用二叉树结构划分为两个子块,或者可使用三叉树结构划分为三个子块。

另外,如上面的表2、3、7、11、14、15和16的示例中所述,在当前块的左上样本的水平方向坐标的值加上当前块的宽度等于或小于当前画面的宽度的情况下,并且在当前块的左上样本的垂直方向坐标的值加上当前块的高度等于或小于当前画面的高度的情况下,可满足预先配置的条件。

另外,如上所述,解码器可调用用于确定当前块的划分结构的编码树单元句法。在这种情况下,可在步骤S1501之前执行用于当前块的编码树单元句法的步骤。

在第一句法元素指示当前块被划分的情况下,解码器解析指示当前块是否使用四叉树结构划分的第二句法元素(步骤S1502)。

如上述实施方式1至9中所述,在第一句法元素指示当前块不被划分的情况下,解码器可调用编码单元句法以用于当前块的解码处理。

在第二句法元素指示当前块不使用四叉树结构划分的情况下,解码器解析指示当前块是否使用二叉树结构或三叉树结构划分的第三句法元素和指示当前块的划分方向的第四句法元素中的至少一个(步骤S1503)。

解码器基于第一句法元素、第二句法元素、第三句法元素和第四句法元素中的至少一个来确定当前块的划分模式(或划分类型)(步骤S1504)。作为示例,划分类型可根据第一句法元素、第二句法元素、第三句法元素和第四句法元素如上述表4、表5、表8、表9、表12、表13和表17中那样确定。

另外,如上述实施方式6至9中所述,解码器可调用编码树单元句法以用于基于划分模式确定从当前块划分的子块的划分结构。

另外,如上述实施方式9中所述,第一句法元素、第二句法元素、第三句法元素和第四句法元素可从相同级别的句法解析。

另外,如上述实施方式7所述,解码器可解析指示使用二叉树结构或三叉树结构从较高节点的块划分的当前块是否使用四叉树结构划分的第五句法元素。

图16是示出根据应用了本公开的实施方式的视频信号的解码设备的流程图。

在图16中,为了描述方便,解码设备被描绘于单个块中,但是图16所示的解码设备可被实现为包括在编码器和/或解码器中的组件。

参照图16,解码设备实现上面的图1至图15中提出的功能、处理和/或方法。具体地,解码设备可包括句法元素解析单元1601和划分模式确定单元1602。另外,在实施方式中,句法元素解析单元1601可以是包括在划分模式确定单元1602中的组件。

在当前块满足预先配置的条件的情况下,句法元素解析单元1601解析指示当前块是否被划分为多个子块的第一句法元素。

如上述实施方式6至9中所述,在第一句法元素值为0的情况下,当前块可不被划分,在第一句法元素值为1的情况下,当前块可使用四叉树结构划分为四个子块,可使用二叉树结构划分为两个子块,或者可使用三叉树结构划分为三个子块。

另外,如上面的表2、表3、表7、表11、表14、表15和表16的示例中所述,在当前块的左上样本的水平方向坐标的值加上当前块的宽度等于或小于当前画面的宽度的情况下,并且在当前块的左上样本的垂直方向坐标的值加上当前块的高度等于或小于当前画面的高度的情况下,可满足预先配置的条件。

另外,如上所述,句法元素解析单元1601可调用编码树单元句法以用于确定当前块的划分结构。

在第一句法元素指示当前块被划分的情况下,句法元素解析单元1601解析指示当前块是否使用四叉树结构划分的第二句法元素。

如上述实施方式1至9中所述,在第一句法元素指示当前块不被划分的情况下,句法元素解析单元1601可调用用于当前块的解码处理的编码单元句法。

在第二句法元素指示当前块不使用四叉树结构划分的情况下,句法元素解析单元1601解析指示当前块是否使用二叉树结构或三叉树结构划分的第三句法元素和指示当前块的划分方向的第四句法元素中的至少一个。

划分模式确定单元1602基于第一句法元素、第二句法元素、第三句法元素和第四句法元素中的至少一个来确定当前块的划分模式(或划分类型)。作为示例,可根据第一句法元素、第二句法元素、第三句法元素和第四句法元素如上述表4、表5、表8、表9、表12、表13和表17中那样确定划分类型。

另外,如上述实施方式6至9中所述,划分模式确定单元1602可调用编码树单元句法以用于基于划分模式来确定从当前块划分的子块的划分结构。

另外,如上述实施方式9中所述,可从相同级别的句法解析第一句法元素、第二句法元素、第三句法元素和第四句法元素。

另外,如上述实施方式7中所述,划分模式确定单元1602可解析指示使用二叉树结构或三叉树结构从较高节点的块划分的当前块是否使用四叉树结构划分的第五句法元素。

图17示出应用了本公开的视频编码系统。

视频编码系统可包括源装置和接收装置。源装置可通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流格式转发到接收装置。

源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示单元,该显示单元可被构造为独立装置或外部组件。

视频源可通过诸如捕获、合成或生成的处理来获得视频/图像。视频源可包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可包括例如计算机、平板计算机和智能电话,并且可例如(以电方式)生成视频/图像。例如,可通过计算机来生成虚拟视频/图像,并且在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。

编码设备可对输入的视频/图像进行编码。为了压缩和编码效率,编码设备可执行包括预测、变换、量化等的一系列处理。

发送器可通过数字存储介质或网络将以比特流格式输出的编码的视频/图像信息或数据以文件或流格式转发到接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定的文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络发送的元件。接收器可提取比特流并将其转发到解码设备。

解码设备可执行与编码设备的操作对应的一系列处理(包括解量化、逆变换、预测等)并将视频/图像解码。

渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示单元显示。

图18是作为应用了本公开的实施方式的内容流系统的配置图。

应用了本公开的内容流系统可包括编码服务器、流服务器、web服务器、媒体存储装置、用户设备和多媒体输入装置。

编码服务器用于将从诸如智能电话、相机和摄像机的多媒体输入装置输入的内容压缩为数字数据以生成比特流并将该比特流发送到流服务器。作为另一示例,当诸如智能电话、相机和摄像机的多媒体输入装置直接生成比特流时,编码服务器可被省略。

可通过应用了本公开的编码方法或比特流生成方法来生成比特流,并且流服务器可在发送或接收比特流的处理中暂时存储比特流。

流服务器基于用户请求通过web服务器将多媒体数据发送到用户设备,并且web服务器用作告知用户服务的介质。当用户向web服务器发送对期望的服务的请求时,web服务器将请求传送至流服务器并且流服务器将多媒体数据发送到用户。这里,内容流系统可包括附加控制服务器,并且在这种情况下,控制服务器用于控制内容流系统中的装置之间的命令/响应。

流服务器可从媒体存储装置和/或编码服务器接收内容。例如,当从编码服务器接收内容时,流服务器可实时接收内容。在这种情况下,流服务器可将比特流存储预定时间,以便提供平滑的流服务。

用户设备的示例可包括蜂窝电话、智能电话、膝上型计算机、数字广播终端、PDA(个人数字助理)、PMP(便携式多媒体播放器)、导航装置、石板PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜和HMD(头戴式显示器))、数字TV、台式计算机、数字标牌等。

内容流系统中的各个服务器可作为分布式服务器操作,并且在这种情况下,各个服务器接收的数据可按分布式方式处理。

本公开中描述的实施方式可在处理器、微处理器、控制器或芯片上实现并执行。例如,图中所示的功能单元可在计算机、处理器、微处理器、控制器或芯片上实现并执行。

此外,应用本公开的解码器和编码器可被包括在多媒体广播发送和接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、用于监视的相机、视频对话装置、诸如视频通信的实时通信装置、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、视频电话装置和医疗视频装置中,并且可用于处理视频信号或数据信号。例如,OTT视频装置可包括游戏控制台、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC和数字视频记录仪(DVR)。

此外,应用本公开的处理方法可按照由计算机执行的程序的形式生成,并且可被存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可被存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的所有类型的存储装置。例如,计算机可读记录介质可包括蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波的形式实现的介质(例如,通过互联网的传输)。此外,使用编码方法生成的比特流可被存储在计算机可读记录介质中,或者可经由有线和无线通信网络发送。

此外,本公开的实施方式可使用程序代码被实现为计算机程序产品。程序代码可由根据本公开的实施方式的计算机执行。程序代码可被存储在可由计算机读取的载体上。

在上述实施方式中,本公开的元素和特性已按特定形式组合。除非明确地另外描述,否则各个元素或特性可被视为可选的。各个元素或特性可按不与其它元素或特性组合的形式实现。此外,一些元素和/或特性可被组合以形成本公开的实施方式。本公开的实施方式中描述的操作顺序可改变。实施方式的一些元素或特性可被包括在另一实施方式中,或者可由另一实施方式的对应元素或特性代替。显然,实施方式可通过将权利要求中不具有明确的引用关系的权利要求组合来构造,或者可在提交申请之后通过修改作为新的权利要求而被包括。

根据本公开的实施方式可由例如硬件、固件、软件或其组合的各种手段实现。在通过硬件实现的情况下,本公开的实施方式可使用一个或更多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等来实现。

在通过固件或软件实现的情况下,本公开的实施方式可按照执行上述功能或操作的模块、过程或函数的形式实现。软件代码可被存储在存储器中并由处理器驱动。存储器可位于处理器内部或外部,并且可通过各种已知手段与处理器交换数据。

对于本领域技术人员而言显而易见的是,在不脱离本公开的本质特性的情况下,本公开可按其它特定形式实现。因此,详细描述不应被解释为限制性的,而是应该被解释为从所有方面均是例示性的。本公开的范围应该由所附权利要求的合理分析确定,并且本公开的等同范围内的所有改变均被包括在本公开的范围内。

工业实用性

出于例示性目的公开了本公开的上述优选实施方式,在不脱离所附权利要求中公开的本公开的技术精神和范围的情况下,本领域技术人员可改进、改变、替代或添加各种其它实施方式。

相关技术
  • 图像处理设备、图像处理方法、用于图像处理方法的程序、以及记录有用于图像处理方法的程序的记录介质
  • 用于分析物体轮廓图像的方法与图像处理装置 ,用于检测物体的方法与图像处理装置 ,工业视觉设备 ,智能相机,图像显示器 ,安全系统 ,以及计算机程序产品
技术分类

06120112145860