掌桥专利:专业的专利平台
掌桥专利
首页

使用调色板译码的编码器、解码器和相应方法

文献发布时间:2023-06-19 10:36:57


使用调色板译码的编码器、解码器和相应方法

技术领域

本申请(发明)的实施例通常涉及图像处理领域,更具体地,涉及当图像处理装置和方法使用分离树方法进行编码和解码时的调色板译码。

背景技术

视频编码(视频编码和解码)广泛用于数字视频应用,例如广播数字电视、互联网和移动网络的视频传输、如视频聊天、视频会议等实时会话应用、DVD和蓝光光盘、视频内容采集和编辑系统以及可携式摄像机的安全应用。

即使在视频较短的情况下也需要对大量的视频数据进行描述,当数据要在带宽容量受限的通信网络中发送或以其它方式传输时,这样可能会造成困难。因此,视频数据通常要先压缩然后在现代电信网络中传输。由于内存资源可能有限,因此当在存储设备上存储视频时,视频的大小也可能成为问题。视频压缩设备通常在信源侧使用软件和/或硬件,以在传输或存储之前对视频数据进行编码,从而减少用来表示数字视频图像所需的数据量。然后,压缩的数据在目的地侧由对视频数据进行解码的视频解压缩设备接收。在有限的网络资源以及对更高视频质量的需求不断增长的情况下,需要改进压缩和解压缩技术,这些改进的技术在几乎不影响图像质量的情况下能够提高压缩率。

发明内容

本申请实施例提供了独立权利要求所描述的编码和解码方法和装置。

前述和其它目的通过独立权利要求的主题实现。其它实现方式在从属权利要求、说明书和附图中显而易见。

根据一个实施例,提供了一种解码设备实现的解码方法,包括:确定目标译码单元(coding unit,CU)的分割类型,其中,所述分割类型为:单一分割类型,在所述单一分割类型下,所述目标译码单元被分割成包括一个亮度译码块(coding block,CB)和两个色度CB的单一CU;或分离分割类型,在所述分离分割类型下,所述目标译码单元被分割成分离的仅包括一个亮度CB的亮度CU和仅包括两个色度CB的色度CU;以及基于所述目标CU的所述分割类型,从码流中解码出所述目标CU和关联的调色板译码信息。

应注意,所述关联的调色板译码信息与所述目标CU相关联。所述目标CU也可以表示为当前CU,指的是当前处理的CU。基于所述分割类型对目标CU和所述调色板译码信息进行解码的优点之一是可以实现有效语法。由于所述两种分割类型的调色板译码信息可能不同,利用对应调色板译码的目标CU也不同。因此,通过在对所述目标CU和所述调色板译码信息进行译码时考虑所述分割类型,可以实现更有效的译码和/或二值化。

所述分离分割类型指的是存在两种分离的分割树,一种树对应所述亮度译码单元,一种树对应所述色度译码单元的两个(通常是一个或多个)分量(译码块),在所述分离分割类型中,将目标译码单元分割成分离的仅包括一个亮度CB的亮度CU和仅包括两个色度CB的色度CU。这也意味着所述目标译码单元可以包括大小和/或位置彼此不对应的一个或多个亮度译码单元和一个或多个色度译码单元。类似地,上文术语“分割成包括一个亮度译码块(coding block,CB)和两个色度CB的单一CU”不一定意味着不可以将该CU进一步划分(分割)成更小的单元。而意味着所有分量(Y、Cb、Cr)共享同一分割树。

除了上述实施例,在另一实施例中,所述关联的调色板译码信息包括调色板译码信息语法元素,所述调色板译码信息语法元素是基于所述目标CU的所述分割类型在所述码流中进行信号发送的。

例如,在所述解码器侧,使用所述调色板译码信息语法元素与所述分割类型一起来确定所述调色板并相应地对所述目标CU进行解码。

例如,当所述目标CU的所述分割类型为所述单一分割类型时,针对所述目标CU,所述调色板译码信息语法元素在所述码流中对Y分量、Cb分量、Cr分量一起进行一次信号发送。

这里,术语“针对Y分量、Cb分量、Cr分量一起进行一次”意味着所述三个分量共用所述调色板译码信息语法元素。例如,所述调色板译码信息(information,info)语法元素可以包括调色板查找表的条目或对查找表中一个查找表的引用,并且所述Y分量、Cb分量、Cr分量共用所述一个或多个查找表。应注意,在该示例中,颜色分量为Y、Cb、Cr。然而,本发明不限于此,可以使用如RGB、YUV等任何其它颜色空间。此外,所述颜色空间中可以包括多于或少于3个分量。

在一个示例中,当所述目标CU的所述分割类型为所述分离分割类型时,针对所述目标CU所述调色板译码信息语法元素在所述码流中分两次进行信号发送:一次针对Y分量,一次针对联合Cb-Cr分量。

在该示例中,可以提供Y分量的分离(与其它颜色分量分离)调色板,并信号发送对应的信息。所述解码器然后提取信号发送的调色板译码信息语法元素,并从中推导出Y分量的调色板。

除了上述任一实施例和示例之外,在另一实施例中,当所述目标CU的所述分割类型为所述分离分割类型时,针对所述亮度CU,所述调色板译码信息语法元素在所述码流中对Y分量进行一次信号发送。

在该实施例中,可以提供所述Cb-Cr分量的调色板译码信息语法元素以指示联合Cb-Cr调色板条目(例如,一个调色板索引指Cb和Cr分量值的组合),并且可以如上所述单独提供所述Y分量的调色板译码信息语法元素。

在一个实施例中,当所述目标CU的所述分割类型为所述分离分割类型时,所述调色板译码信息语法元素在所述码流中对所述色度CU中的Cb-Cr分量一起进行一次信号发送。

例如,所述调色板译码信息语法元素包括以下各项中的任一种或任意组合:一个或多个调色板的预测向量、一个或多个调色板的大小、一个或多个调色板、一个或多个跳出标志、一个或多个索引图。

另外(或或者),当所述目标CU的所述分割类型为所述分离分割类型时,针对所述色度CU,所述调色板译码信息语法元素的信号发送取决于所述目标CU的所述亮度CU的调色板译码控制标志。

这里,所述目标CU的所述亮度CU是指一个或多个并置亮度CU。一个或多个并置亮度CU是指(至少部分地)与(所述目标CU的)所述色度CU位于相同像素点位置上的亮度CU。所述调色板译码控制标志可以指示是否对相应的亮度或色度CU进行调色板编码。应注意,本文任一实施例中的所述目标CU可以是编码树单元,也可以是编码树单元中包括的译码单元。

或者(或另外),当所述目标CU的所述分割类型为所述分离分割类型时,根据以下规则,针对所述色度CU,所述调色板译码信息语法元素的信号发送取决于所述目标CU的所述亮度CU的所述调色板译码控制标志:如果所述目标CU的所有亮度CB的调色板译码控制标志都等于1,则在所述码流中信号发送所述色度CB的调色板译码控制标志。否则,所述色度CB不使用调色板编码。

换句话说,如果与所述色度CB重叠(或包括在所述色度CB中)的所有亮度CB的标志设置为1,则意味着所有亮度CB都使用所述调色板编码。在这种情况下,可以信号发送所述色度CB标志。否则,可以将色度CB的标志推断为0。应注意,可以将规则反过来,即,在上述情况下的调色板译码控制标志实际上可以在所述码流中指示为0而不是1,反之亦然。通常,所述调色板译码控制标志可以取两个不同值中的一个:第一值和第二值。上文“1”对应第一值,而“0”(或“否则”)对应第二值。

在另一个示例中,当所述目标CU的所述分割类型为所述分离分割类型时,根据以下规则,针对所述色度CU,所述调色板译码信息语法元素的信号发送取决于所述目标CU的所述亮度CU的所述调色板译码控制标志:如果所述目标CU的所有亮度CB的调色板译码控制标志都等于1,则推断所述色度CB的调色板译码控制标志等于1,并在所述码流中信号发送所述色度CB的所述调色板译码信息语法元素。否则,在所述码流中信号发送所述色度CB的所述调色板译码控制标志。

根据一个实施例,提供了一种编码设备实现的编码方法,包括:确定目标译码单元(coding unit,CU)的分割类型;将所述目标CU在单一分割类型中分割成包括一个亮度译码块(coding block,CB)和两个色度CB的单一CU,或在分离分割类型中分割成分离的仅包括所述亮度CB的亮度CU和仅包括所述两个色度CB的色度CU;以及根据所述目标CU的所述分割类型,将所述目标CU和关联的调色板译码信息编码到码流中。

此外,还提供了一种程序,存储在非瞬时性(存储)介质上并包括具有指令的代码,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行上述任一种方法。

根据一个实施例,提供了一种解码设备,包括处理电路,所述处理电路用于:确定目标译码单元(coding unit,CU)的分割类型,其中,所述分割类型为:译码单元译码块单一分割类型,在所述单一分割类型下,所述目标译码单元被分割成包括一个亮度译码块(coding block,CB)和两个色度CB的单一CU;或译码单元分离分割类型,在所述分离分割类型下,所述目标译码单元被分割成分离的仅包括一个亮度CB的亮度CU和仅包括两个色度CB的色度CU;以及基于所述目标CU的所述分割类型,从码流中解码出所述目标CU和关联的调色板译码信息。

根据一个实施例,提供了一种编码设备,包括处理电路,所述处理电路用于:确定目标译码单元(coding unit,CU)的分割类型;将所述目标CU在单一分割类型下分割成包括一个亮度译码块(coding block,CB)和两个色度CB的单一CU,或在分离分割类型下分割成分离的仅包括所述亮度CB的亮度CU和仅包括所述两个色度CB的色度CU;以及根据所述目标CU的所述分割类型,将所述目标CU和关联的调色板译码信息编码到码流中。

附图和以下描述对一个或多个实施例进行了详细阐述。其它特征、目的和优点在说明书、附图以及权利要求中是显而易见的。

附图说明

下文结合附图对本发明实施例进行更详细的描述。在附图中:

图1A为示出用于实现本发明实施例的视频编码系统示例的框图;

图1B为示出用于实现本发明实施例的视频编码系统的另一示例的框图;

图2为示出用于实现本发明实施例的视频编码器示例的框图;

图3为示出用于实现本发明实施例的视频解码器的示例性结构的框图;

图4为示出编码装置或解码装置示例的框图;

图5为示出编码装置或解码装置的另一示例的框图;

图6为示出实现内容分发业务的内容供应系统3100的示例性结构的框图。

图7为示出终端设备示例结构的框图。

在下文中,除非另外明确说明,否则相同的附图标记是指相同或至少功能上等效的特征。

具体实施方式

以下描述中,参考组成本发明一部分并以说明的方式示出本发明实施例的具体方面或可使用本发明实施例的具体方面的附图。应理解,本发明实施例可在其它方面中使用,并可包括附图中未描述的结构变化或逻辑变化。因此,以下详细描述不应以限制性的意义来理解,本发明的范围由所附权利要求书界定。

例如,应理解,结合所描述方法的公开内容可以对用于执行所述方法的对应设备或系统也同样适用,且反之亦然。例如,如果描述一个或多个具体方法步骤,则对应的设备可以包括一个或多个单元(例如,功能单元)来执行所描述的一个或多个方法步骤(例如,一个单元执行一个或多个步骤,或多个单元中的每个单元都执行多个步骤中的一个或多个),即使附图中未明确描述或说明该一个或多个单元。另一方面,例如,如果基于一个或多个单元(例如,功能单元)描述具体装置,则对应的方法可以包括一个步骤来实现一个或多个单元的功能(例如,一个步骤实现一个或多个单元的功能,或多个步骤中的每个步骤实现多个单元中一个或多个单元的功能),即使附图中未明确描述或说明该一个或多个步骤。此外,应理解,除非另有说明,否则本文中描述的各种示例性实施例和/或方面的特征可相互组合。

视频编码通常指对构成视频或视频序列的图像序列进行处理。在视频编码领域中,术语“帧(frame)”或“图像(picture/image)”可以用作同义词。视频编码(coding)(或通常称为编码)包括视频编码和视频解码两部分。视频编码在源侧执行,通常包括处理(例如,压缩)原始视频图像以减少表示视频图像所需的数据量(从而更高效存储和/或传输)。视频解码在目的地侧执行,通常包括相对于编码器作逆处理,以重建视频图像。实施例涉及的视频图像(或通常称为图像)的“编码”应理解为视频图像或相应视频序列的“编码”或“解码”。编码部分和解码部分也合称为编解码(编码和解码,CODEC)。

在无损视频编码情况下,可以重建原始视频图像,即重建的视频图像与原始视频图像具有相同的质量(假设存储或传输期间没有传输损耗或其它数据丢失)。在有损视频编码情况下,通过量化等进行进一步压缩来减少表示视频图像所需的数据量,而解码器处无法完全重建视频图像,即重建的视频图像的质量比原始视频图像的质量更低或更差。

几个视频编码标准属于“有损混合视频编解码器”组(即,将像素点域中的空间预测和时间预测与变换域中用于应用量化的2D变换编码结合)。视频序列中的每个图像通常分割成不重叠的块集合,通常基于块级进行编码。换句话说,编码器处通常在块(视频块)级处对视频进行处理,即编码,例如,通过空间(帧内)预测和/或时间(帧间)预测来生成预测块;从当前块(当前处理/待处理的块)中减去预测块,获得残差块;在变换域中变换残差块并量化残差块,以减少待传输(压缩)的数据量,而解码器处将相对于编码器的逆处理应用于经编码或压缩的块,以重建用于表示的当前块。此外,编码器重复解码器的处理步骤,使得编码器和解码器生成相同的预测(例如,帧内预测和帧间预测)和/或重建,用于对后续块进行处理(即编码)。

在以下实施例中,基于图1至图3描述了视频编码系统10、视频编码器20和视频解码器30。

图1A为示意性框图,示出了示例性编码系统10,例如可以利用本申请技术的视频编码系统10(或简称为编码系统10)。视频编码系统10的视频编码器20(或简称为编码器20)和视频解码器30(或简称为解码器30)代表可用于根据本申请中描述的各种示例执行各技术的设备。

如图1A所示,编码系统10包括源设备12,所述源设备12用于将经编码的图像数据21提供给例如目的设备14以对经编码的图像数据21进行解码。

源设备12包括编码器20,并且可以另外(即可选地)包括图像源16、预处理器(或预处理单元)18(例如,图像预处理器18)和通信接口或通信单元22。

图像源16可以包括或可以是任何类型的图像采集设备,例如用于采集真实世界图像的摄像机,和/或任何类型的图像生成设备,例如用于生成计算机动画图像的计算机图形处理器,或用于获取和/或提供真实世界图像、计算机生成图像(例如,屏幕内容、虚拟现实(virtual reality,VR)图像)和/或其任何组合(例如,增强现实(augmented reality,AR)图像)的任何类型的其它设备。所述图像源可以为存储任一上述图像的任何类型的存储器(memory/storage)。

区别于预处理器18和预处理单元18执行的处理,图像或图像数据17也可以称为原始图像或原始图像数据17。

预处理器18用于接收(原始)图像数据17,对图像数据17进行预处理,以获得经预处理的图像19或经预处理的图像数据19。预处理器18执行的预处理可包括修剪、颜色格式转换(例如从RGB转换为YCbCr)、颜色校正或去噪等。可以理解的是,预处理单元18可以是可选组件。

视频编码器20用于接收经预处理的图像数据19并提供经编码的图像数据21(下文将基于图2等进一步详细描述)。

源设备12的通信接口22可用于接收经编码的图像数据21并经由通信信道13将经编码的图像数据21(或其任何其它经处理版本)传输到其它设备,例如目的设备14或用于存储或直接重建的任何其它设备。

目的设备14包括解码器30(例如,视频解码器30),并且可以另外(即,可选地)包括通信接口或通信单元28、后处理器32(或后处理单元32)和显示设备34。

目的设备14的通信接口28用于接收经编码的图像数据21(或其任何其它经处理版本),例如,直接从源设备12或任何其它源(例如,编码图像数据存储设备等存储设备)接收,并将经编码的图像数据21提供给解码器30。

通信接口22和通信接口28可以用于经由源设备12与目的设备14之间的直接通信链路(例如,直接有线或无线连接),或经由任何类型的网络(例如,有线或无线网络或其任意组合,或任何类型的专用和公共网络),或其任意组合发送或接收经编码的图像数据21或编码数据13。

例如,通信接口22可用于将经编码的图像数据21封装为数据包等合适的格式,和/或采用任何类型的传输编码或处理来处理所述经编码的图像数据,以便经由通信链路或通信网络进行传输。

例如,与通信接口22对应的通信接口28可用于接收传输数据,并采用任何类型的对应传输解码或处理和/或解封装对传输数据进行处理,以获得经编码的图像数据21。

通信接口22和通信接口28均可配置为单向通信接口(如图1A中从源设备12指向目的设备14的通信信道13的箭头所指示),或双向通信接口,并可用于发送和接收消息等,例如,建立连接,确认和交互与通信链路和/或数据传输(例如,经编码的图像数据传输)相关的任何其它信息。

解码器30用于接收经编码的图像数据21并提供经解码的图像数据31或解码图像31(下文将基于图3或图5等进一步详细描述)。

目的设备14的后处理器32用于对经解码的图像数据31(也称为经重建的图像数据)(例如,解码图像31)进行后处理,以获得经后处理的图像数据33(例如,后处理图像33)。例如,由后处理单元32执行的后处理可以包括颜色格式转换(例如从YCbCr转换为RGB)、颜色校正、修剪或重采样,或任何其它处理,例如,用于准备经解码的图像数据31以供显示设备34等显示。

目的设备14的显示设备34用于接收经后处理的图像数据33,以向用户或观看者等显示所述图像。显示设备34可以是或包括用于显示重建图像的任何类型的显示器,例如,集成或外部的显示器或监视器。例如,显示器可以包括液晶显示器(liquid crystaldisplay,LCD)、有机发光二极管(organic light emitting diode,OLED)显示器、等离子显示器、投影仪、微型LED显示器、硅基液晶显示器(liquid crystal on silicon,LCoS)、数字光处理器(digital light processor,DLP)或任意类型的其它显示器。

尽管图1A将源设备12和目的设备14作为单独的设备进行描述,但是设备实施例还可以包括两种设备或两种功能,即源设备12或对应功能以及目的设备14或对应功能。在这类实施例中,源设备12或对应功能以及目的设备14或对应功能可以使用相同的硬件和/或软件或通过单独的硬件和/或软件或其任意组合来实现。

基于描述,技术人员显而易见的是,图1A所示的源设备12和/或目的设备14中的不同单元或功能的存在和(精确)划分可以根据实际设备和应用而不同。

编码器20(例如视频编码器20)或解码器30(例如视频解码器30),或编码器20和解码器30两者都可经由如图1B所示的处理电路实现,如一个或多个微处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application-specific integratedcircuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)、离散逻辑、硬件、视频编码专用处理器或其任意组合。编码器20可以由处理电路46实现,以体现结合图2的编码器20所描述的各种模块和/或本文描述的任何其它编码器系统或子系统。解码器30可以由处理电路46实现,以体现结合图3的解码器30所描述的各种模块和/或本文描述的任何其它解码器系统或子系统。所述处理电路可用于执行下文描述的各种操作。如图5所示,如果所述技术部分地以软件形式实现,则设备可以将软件的指令存储在合适的非瞬时性计算机可读介质中,并且可以使用一个或多个处理器执行硬件中的指令,以执行本发明的技术。视频编码器20和视频解码器30中的任一个可作为组合编解码器(encoder/decoder,CODEC)的一部分集成在单个设备中,如图1B所示。

源设备12和目的设备14可以包括多种设备中的任一种,包括任何类型的手持或固定设备,例如,笔记本电脑或膝上型电脑、手机、智能手机、平板电脑(tablet/tabletcomputer)、摄像机、台式计算机、机顶盒、电视机、显示设备、数字媒体播放器、视频游戏机、视频流设备(如内容服务服务器或内容分发服务器)、广播接收器设备、广播发射器设备等,并且可以不使用或使用任何类型的操作系统。在某些情况下,可以配备源设备12和目的设备14以用于无线通信。因此,源设备12和目的设备14可以是无线通信设备。

在某些情况下,图1A所示的视频编码系统10仅仅是示例,本申请的技术可适用于在编码设备与解码设备之间不一定包括任何数据通信的视频编码设置(例如,视频编码或视频解码)。在其它示例中,数据从本地存储器中检索,经由网络流式传输,等等。视频编码设备可以对数据进行编码并将数据存储到存储器中,和/或视频解码设备可以从存储器中检索数据并对数据进行解码。在一些示例中,编码和解码由相互不通信而只是将数据编码到存储器和/或从存储器中检索数据并对数据进行解码的设备来执行。

为便于描述,本文参考由ITU-T视频编码专家组(Video Coding Experts Group,VCEG)和ISO/IEC运动图像专家组(Motion Picture Experts Group,MPEG)的视频编码联合工作组(Joint Collaboration Team on Video Coding,JCT-VC)研发的高效视频编码(High-Efficiency Video Coding,HEVC)或通用视频编码(Versatile Video Coding,VVC)(下一代视频编码标准)参考软件等描述本发明实施例。本领域普通技术人员应理解本发明实施例不限于HEVC或VVC。

编码器和编码方法

图2为用于实现本申请技术的示例性视频编码器20的示意性框图。在图2的示例中,视频编码器20包括输入端201(或输入接口201)、残差计算单元204、变换处理单元206、量化单元208、反量化单元210、逆变换处理单元212、重建单元214、环路滤波单元220、解码图像缓冲器(decoded picture buffer,DPB)230、模式选择单元260、熵译码单元270和输出端272(或输出接口272)。模式选择单元260可以包括帧间预测单元244、帧内预测单元254和分割单元262。帧间预测单元244可以包括运动估计单元和运动补偿单元(未示出)。图2所示的视频编码器20也可以称为混合视频编码器或基于混合视频编解码器的视频编码器。

残差计算单元204、变换处理单元206、量化单元208、模式选择单元260可以组成编码器20的正向信号路径,而反量化单元210、逆变换处理单元212、重建单元214、缓冲器216、环路滤波器220、解码图像缓冲器(decoded picture buffer,DPB)230、帧间预测单元244和帧内预测单元254可以组成视频编码器20的反向信号路径。视频编码器20的反向信号路径与解码器(参见图3中的视频解码器30)的信号路径对应。反量化单元210、逆变换处理单元212、重建单元214、环路滤波器220、解码图像缓冲器(decoded picture buffer,DPB)230、帧间预测单元244和帧内预测单元254还组成视频编码器20的“内置解码器”。

图像和图像分割(图像和块)

编码器20可用于经由输入端201等接收图像17(或图像数据17),例如,形成视频或视频序列的图像序列中的图像。接收的图像或图像数据也可以是经预处理的图像19(或经预处理的图像数据19)。为简单起见,以下描述使用图像17。图像17也可以称为当前图像或待编码图像(特别是在视频编码中,以便将当前图像与其它图像(例如,同一视频序列(即,也包括当前图像的视频序列)的先前编码和/或解码的图像)区分开)。

(数字)图像为或可以看作具有强度值的像素点的二维阵列或矩阵。阵列中的像素点也可以称为像素(pixel/pel)(图像元素的简称)。图像的大小和/或分辨率由阵列或图像在水平和垂直方向(或轴)上的像素点数量定义。通常采用三种颜色分量来表示颜色,即该图像可表示为三个像素点阵列或包括三个像素点阵列。在RGB格式或颜色空间中,图像包括对应的红色、绿色和蓝色像素点阵列。然而,在视频编码中,每个像素通常由亮度和色度格式或在颜色空间中表示,例如,YCbCr,包括Y指示的亮度分量(有时也用L指示)和Cb和Cr指示的两个色度分量。亮度(或简称luma)分量Y表示亮度或灰度级强度(例如,像灰度图像),而两个色度(或简称chroma)分量Cb和Cr表示色度或颜色信息分量。因此,YCbCr格式的图像包括亮度像素点值(Y)的亮度像素点阵列和色度值(Cb和Cr)的两个色度像素点阵列。RGB格式的图像可转换或变换成YCbCr格式,反之亦然,该过程也称为颜色转换或颜色变换。如果图像是单色的,则该图像可以仅包括亮度像素点阵列。相应地,例如,图像可以为单色格式的亮度像素点阵列或4:2:0、4:2:2和4:4:4彩色格式的亮度像素点阵列和两个对应的色度像素点阵列。

视频编码器20的实施例可包括图像分割单元(图2中未示出),所述图像分割单元用于将图像17分割成多个(通常不重叠)图像块203。这些块也可以称为根块、宏块(H.264/AVC)或编码树块(coding tree block,CTB),或编码树单元(coding tree unit,CTU)(H.265/HEVC和VVC)。图像分割单元可用于对视频序列的所有图像使用相同的块大小和定义块大小的对应网格,或者用于改变图像或图像子集或组之间的块大小,并将每个图像分割成对应块。就非单色图像17而言,图像分割单元可以用于对亮度块和色度块使用联合(单)或分离(双)分割。在VVC等中使用这种方法,称为分离树或双树分割。如果对某CU应用双树,该CU可以是具有一个亮度译码块(coding block,CB)的亮度CU,或具有两个色度译码块(coding block,CB)的色度CU。应注意,通常基于条带类型、块大小等预定义条件应用双树。如果不满足这些条件,则对CU使用单树分割,其中CU包括一个亮度译码块(codingblock,CB)和两个色度译码块。

在其它实施例中,视频编码器可用于直接接收图像17的块203,例如,组成图像17的一个、几个或所有块。图像块203也可以称为当前图像块或待编码图像块。

与图像17类似,图像块203同样是或可以看作是具有强度值(像素点值)的像素点的二维阵列或矩阵,但是,图像块203的尺寸比图像17小。换句话说,例如,块203可以包括一个像素点阵列(例如,在应用双树时,在单色图像17的情况下或在彩色图像和亮度块的情况下的一个亮度阵列);或两个像素点阵列(例如,在应用双树时,在彩色图像和色度块的情况下的两个色度阵列);或三个像素点阵列(例如,在彩色图像17的情况下的一个亮度阵列和两个色度阵列)或取决于所采用的颜色格式的任何其它数量和/或种类的阵列。块203的水平方向和垂直方向(或轴线)上的像素点数量决定了块203的大小。相应地,块可以为M×N(M列×N行)个像素点阵列,或M×N个变换系数阵列等。

图2所示的视频编码器20的实施例可以用于逐块对图像17进行编码,例如,按块203进行编码和预测。

残差计算

残差计算单元204可用于通过如下等方式基于图像块203和预测块265(下文将详细描述预测块265)来计算残差块205(也称为残差205):逐个像素点(逐个像素)从图像块203的像素点值中减去预测块265的像素点值,以获得像素点域中的残差块205。

变换

变换处理单元206可用于对残差块205的像素点值应用离散余弦变换(discretecosine transform,DCT)或离散正弦变换(discrete sine transform,DST)等变换,以获得变换域中的变换系数207。变换系数207也可以称为变换残差系数,表示变换域中的残差块205。

变换处理单元206可用于应用DCT/DST的整数近似法,如针对H.265/HEVC指定的变换。与正交DCT变换相比,该整数近似法通常通过某一因子进行缩放。为了维持经过正变换和逆变换处理的残差块的范数,使用附加缩放因子作为变换过程的一部分。缩放因子通常是基于某些约束条件来选择的,例如缩放因子是用于移位运算的2的幂、变换系数的位深度、准确性与实施成本之间的权衡等。例如,通过逆变换处理单元212等为逆变换(以及在视频解码器30侧,通过逆变换处理单元312等为对应逆变换)指定具体的缩放因子,以及相应地,可以在编码器20侧,通过变换处理单元206等为正变换指定对应的缩放因子。

视频编码器20(具体是变换处理单元206)的实施例可以用于直接或经由熵编码单元270编码或压缩等输出变换参数(例如,一种或多种变换的类型),使得例如视频解码器30可以接收并使用变换参数进行解码。

量化

量化单元208可以用于通过应用标量量化或矢量量化等对变换系数207进行量化,以获得量化系数209。量化系数209也可以称为经量化的变换系数209或经量化的残差系数209。

量化过程可以降低与一些或全部变换系数207相关联的位深度。例如,可以在量化期间将n位变换系数向下舍入到m位变换系数,其中n大于m。可以通过调整量化参数(quantization parameter,QP)修改量化程度。例如,对于标量量化,可以应用不同程度的缩放来实现较细或较粗的量化。较小量化步长对应较细量化,而较大量化步长对应较粗量化。可以通过量化参数(quantization parameter,QP)指示合适的量化步长。例如,量化参数可以是合适的量化步长的预定义集合的索引。例如,小的量化参数可对应精细量化(小的量化步长),大的量化参数可对应粗糙量化(大的量化步长),反之亦然。量化可以包括除以量化步长,而反量化单元210等执行的对应和/或反量化可包括乘以量化步长。根据HEVC等一些标准的实施例可用于使用量化参数来确定量化步长。通常,可以基于量化参数使用包括除法的方程的定点近似来计算量化步长。量化和解量化可以引入附加缩放因子以恢复残差块的范数,由于在量化步长和量化参数的方程的定点近似中使用了缩放,可能会修改残差块的范数。在一种示例性实现方式中,可以合并逆变换和解量化的缩放。或者,可以使用自定义量化表并在码流中等将自定义量化表从编码器信号发送到解码器。量化是有损操作,其中量化步长越大,损耗越大。

视频编码器20(具体是量化单元208)的实施例可以用于直接或经由熵编码单元270编码等输出量化参数(quantization parameter,QP),使得例如视频解码器30可以接收并使用量化参数进行解码。

反量化

反量化单元210用于通过基于或使用与量化单元208相同的量化步长应用量化单元208所应用的量化方案的逆过程等,对量化系数应用量化单元208的反量化,以获得解量化系数211。解量化系数211也可以称为解量化残差系数211,对应于变换系数207,但是由于量化造成的损耗,解量化系数211通常与变换系数不同。

逆变换

逆变换处理单元212用于应用变换处理单元206应用的变换的逆变换,例如,逆离散余弦变换(discrete cosine transform,DCT)、或逆离散正弦变换(discrete sinetransform,DST)、或其他逆变换,以获得像素点域中的重建残差块213(或对应的解量化系数213)。重建残差块213也可称为变换块213。

重建

重建单元214(例如,加法器或求和器214)用于例如通过将重建残差块213的像素点值和预测块265的像素点值逐个像素点相加,将变换块213(即重建残差块213)添加到预测块265,以获得像素点域中的重建块215。

滤波

环路滤波单元220(或简称“环路滤波器”220)用于对重建块215进行滤波以获得滤波块221,或通常用于对重建像素点进行滤波以获得滤波像素点。例如,环路滤波单元用于平滑像素转变或提高视频质量。环路滤波单元220可以包括一个或多个环路滤波器,如去块效应滤波器、像素点自适应偏移(sample-adaptive offset,SAO)滤波器或一个或多个其它滤波器,例如双边滤波器、自适应环路滤波器(adaptive loop filter,ALF)、锐化或平滑滤波器、或协作滤波器、或其任意组合。虽然环路滤波单元220在图2中示为环内滤波器,但是在其它配置中,环路滤波单元220可以实现为后环路滤波器。滤波块221也可以称为滤波重建块221。

视频编码器20(具体是环路滤波单元220)的实施例可用于直接或经由熵编码单元270编码等输出环路滤波器参数(如像素点自适应偏移信息),使得例如解码器30可以接收和使用相同环路滤波器参数或相应的环路滤波器进行解码。

解码图像缓冲器

解码图像缓冲器(decoded picture buffer,DPB)230可以是存储参考图像或通常用于由视频编码器20对视频数据进行编码的参考图像数据的存储器。DPB 230可以由多种存储设备中的任一种组成,如动态随机存取存储器(dynamic random access memory,DRAM),包括同步DRAM(synchronous DRAM,SDRAM)、磁阻RAM(magnetoresistive RAM,MRAM)、电阻RAM(resistive RAM,RRAM)或其它类型的存储设备。解码图像缓冲器(decodedpicture buffer,DPB)230可用于存储一个或多个滤波块221。解码图像缓冲器230还可用于存储同一当前图像或不同图像(例如,先前重建的图像)的其它先前滤波块(例如,先前重建和滤波块221),并且可提供完整的先前重建(即解码)的图像(和对应的参考块和像素点)和/或部分重建的当前图像(和对应的参考块和像素点),用于帧间预测等。例如,在重建块215未被环路滤波单元220滤波时,解码图像缓冲器(decoded picture buffer,DPB)230还可用于存储一个或多个未经滤波的重建块215,或通常存储未经滤波的重建像素点,或重建块或重建像素点的任何其它未经进一步处理的版本。

模式选择(分割和预测)

模式选择单元260包括分割单元262、帧间预测单元244和帧内预测单元254,用于从解码图像缓冲器230或其它缓冲器(例如,线缓冲器,未示出)等接收或获得原始图像数据(例如,原始块203(当前图像17的当前块203))和重建图像数据(例如,相同(当前)图像和/或一个或多个先前解码图像的滤波和/或未经滤波的重建像素点或重建块)。重建图像数据用作参考图像数据进行帧间预测或帧内预测等预测,以获得预测块265或预测值265。

模式选择单元260可用于为当前块预测模式(包括不分割)和预测模式(例如帧内或帧间预测模式)确定或选择分割类型,并生成对应的预测块265,以对残差块205进行计算和对重建块215进行重建。

模式选择单元260的实施例可用于选择分割和预测模式(例如,从模式选择单元260支持或可用于模式选择单元260的预测模式中选择),所述预测模式提供最佳匹配或者说最小残差(最小残差意味着传输或存储中更好的压缩),或提供最小信令开销(最小信令开销意味着传输或存储中更好的压缩),或者同时考虑或平衡以上两者。模式选择单元260可用于基于率失真优化(rate distortion optimization,RDO)确定分割和预测模式,即选择提供最小率失真的预测模式。本上下文中如“最佳”、“最小”、“最优”等术语不一定指总体上“最佳”、“最小”、“最优”等,也可以指满足终止或选择标准,例如,值超过或低于阈值或其它约束条件,可能会进行“次优选择”,但是降低了复杂度和处理时间。

换句话说,分割单元262可以用于将块203分割成更小的分割块或子块(再次形成块),例如,使用四叉树(quad-tree,QT)分割、二叉树(binary-tree,BT)分割或三叉树(triple-tree,TT)分割或其任何组合迭代地进行,并例如,对每个分割块或子块进行预测,其中,所述模式选择包括选择分割块203的树形结构并将预测模式应用于每个分割块或子块。

下文将更详细地解释由示例性视频编码器20执行的分割(例如,由分割单元260执行)和预测处理(由帧间预测单元244和帧内预测单元254执行)。

分割

分割单元262可以将当前块203分割(或划分)成更小的分割块,例如正方形或矩形大小的较小块。可以将这些较小块(也可以称为子块)进一步分割为甚至更小的分割块。这也称为树分割或层次树分割,其中,可以递归地分割例如根树层次0(层次级别0,深度0)的根块,例如分割为两个或两个以上下一较低树层次的块,例如树层次1(层次级别1,深度1)的节点。可以再次将这些块分割为两个或两个以上下一较低层次,例如树层次2(层次级别2、深度2)的块等,直到例如因为满足结束标准,例如达到最大树深度或最小块大小,分割结束。未进一步分割的块也称为树的叶块或叶节点。分割为两个部分的树称为二叉树(binary-tree,BT),分割为三个部分的树称为三叉树(ternary-tree,TT),分割为四个部分的树称为四叉树(quad-tree,QT)。

如前所述,此处使用的术语“块”可以是图像的一部分,特别是正方形或矩形部分。例如,结合HEVC和VVC,块可以为或对应于编码树单元(coding tree unit,CTU)、译码单元(coding unit,CU)、预测单元(prediction unit,PU)和变换单元(transform unit,TU),和/或对应于对应块,例如,编码树块(coding tree block,CTB)、译码块(coding block,CB)、变换块(transform block,TB)或预测块(prediction block,PB)。就双树而言,术语“块”也可以根据所属的对应分量指定,例如,仅包括亮度分量的块为“亮度块”,或者仅包括色度分量的块为“色度块”。例如,结合VVC,亮度块和/或色度块可以为或对应于亮度和/或色度编码树单元(luma and/or chroma coding tree unit,亮度和/或色度CTU)、亮度和/或色度译码单元(luma and/or chroma coding unit,亮度和/或色度CU)、亮度和/或色度预测单元(luma and/or chroma prediction unit,亮度和/或色度PU)以及亮度和/或色度变换单元(luma and/or chroma transform unit,亮度和/或色度TU),和/或对应于对应块,例如亮度和/或色度编码树块(luma and/or chroma coding tree block,亮度和/或色度CTB)、亮度和/或色度译码块(luma and/or chroma coding block,亮度和/或色度CB)、亮度和/或色度变换块(luma and/or chroma transform block,亮度和/或色度TB)或亮度和/或色度预测块(luma and/or chroma prediction block,亮度和/或色度PB)。

例如,编码树单元(coding tree unit,CTU)可以为或包括具有三个像素点阵列的图像的亮度像素点的一个CTB、色度像素点的两个对应CTB,或单色图像或使用用于对像素点进行编码的三个独立颜色平面和语法结构编码的图像的像素点的一个CTB。如果使用双树,则编码树单元(coding tree unit,CTU),编码树单元可以是或包括具有三个像素点阵列的图像的亮度像素点的一个CTB或色度像素点的两个CTB。相应地,编码树块(codingtree block,CTB)可以为N×N个像素点块,其中N可以设为某个值从而将分量划分为多个CTB,这就是分割。译码单元(coding unit,CU)可以为或包括具有三个像素点阵列的图像的亮度像素点的一个译码块、色度像素点的两个对应译码块,或单色图像或使用用于对像素点进行编码的三个独立颜色平面和语法结构编码的图像的像素点的译码块。相应地,译码块(coding block,CB)可以为M×N个像素点块,其中M和N可以设为某个值从而将CTB划分为多个译码块,这就是分割。

在实施例中,例如根据HEVC,可以通过表示为编码树的四叉树结构将编码树单元(coding tree unit,CTU)划分为多个CU。在CU级决定是使用帧间(时间)预测还是帧内(空间)预测对图像区域进行编码。可以根据PU划分类型将每个CU进一步划分为一个、两个或四个PU。一个PU内应用相同的预测过程,并在PU的基础上向解码器传输相关信息。在基于PU划分类型应用预测过程获得残差块之后,可以根据与用于CU的编码树类似的另一种四叉树结构将CU分割为变换单元(transform unit,TU)。

在实施例中,例如根据当前研发的称为通用视频编码(Versatile Video Coding,VVC)的最新视频编码标准,使用四叉树和二叉树(quad-tree and binary tree,QTBT)分割来分割译码块。在QTBT块结构中,CU可以为正方形或矩形。例如,首先通过四叉树结构分割编码树单元(coding tree unit,CTU)。通过二叉树或三叉树(ternary或triple)结构进一步分割四叉树叶节点。分割树叶节点称为译码单元(coding unit,CU),该分段用于预测和变换处理,而不进行任何进一步分割。这意味着在QTBT译码块结构中,CU、PU和TU的块大小相同。同时,还提出将三叉树分割等多重分割与QTBT块结构结合使用。

在一个示例中,视频编码器20的模式选择单元260可以用于执行本文描述的分割技术的任意组合。

如上所述,视频编码器20用于从(预定的)预测模式集合中确定或选择最佳或最优的预测模式。预测模式集合可以包括帧内预测模式和/或帧间预测模式等。

帧内预测

帧内预测模式集合可以包括35种不同的帧内预测模式,例如,如DC(或均值)模式和平面模式等非方向性模式,或如HEVC中定义的方向性模式,或者可以包括67种不同的帧内预测模式,例如,如DC(或均值)模式和平面模式等非方向性模式,或如针对VVC定义的方向性模式。

帧内预测单元254用于根据帧内预测模式集合中的帧内预测模式,使用同一当前图像的相邻块的重建像素点来生成帧内预测块265。

帧内预测单元254(或通常为模式选择单元260)还用于将帧内预测参数(或通常为指示块的所选帧内预测模式的信息)以语法元素266的形式输出到熵译码单元270,以包括到经编码的图像数据21中,使得例如视频解码器30可以接收并使用用于解码的预测参数。

帧内预测单元254可以包括调色板编码方法,该方法通常包括两部分:调色板的编码方法和使用调色板对像素点进行编码的方法。后一部分通常包括调色板索引编码和跳出像素编码。更具体地说,调色板模式在CU级别进行信号发送/推导,然后用于在调色板模式下编码的CU。对于在调色板模式下编码的CU,在码流中信号发送枚举CU内主要颜色的调色板。这里码流中的信令是指能够基于其确定调色板的任何语法元素。

调色板通常实现为颜色查找表,在该颜色查找表中,每个颜色条目都与索引相关联。一旦构建调色板,基于CU内的像素点频率,可以将这些像素点分为两类。属于第一类的像素点与调色板中的条目相同或非常接近。在这种情况下,该像素点可以通过在调色板中其对应条目的索引来表示。解码器可以通过使用对应索引查找调色板条目来重建像素点。这些像素点称为索引像素点,这些索引称为调色板索引。对于属于另一类别的像素点,每个像素点都与调色板中的任何条目明显不同。这些像素点不适合用调色板索引表示,称为跳出像素点。这些像素点的颜色分量值经量化并在码流中显式编码。

在示例性情况下,通常,从信令角度看,调色板编码可以包括一个或多个(或全部)以下在码流中信号发送的语法元素:

–CU调色板模式标志(palette_mode_flag),指示是在CU级启用还是禁用调色板译码工具,该标志在本文中也称为调色板译码控制标志;

–每种或某些颜色分量的一个或多个调色板,表示CU中最频繁的信号信息;

–调色板的预测矢量,允许实施预测机制并为调色板传输节省空间;

–信号跳出标志(signal_escape_flag),指示当前CU中是否有不包括在调色板中的像素;

–调色板索引图(palette_indexes_map),指示CU中每个像素的特定调色板元素;

–扫描顺序类型,指示用于在CU上移动的扫描类型。

然而,由于在VVC标准等视频压缩中引入了双树分割,亮度分量和色度分量可能具有不同的分割模式,会产生不同的块大小和不同的主像素点值,因此不能再以正常方式应用传统的调色板编码。本发明提供了一种对VVC中的双树方案使用调色板编码的可能方法,将在下文详细描述。

帧间预测

(可能的)帧间预测模式的集合取决于可用参考图像(即,例如存储在DPB 230中的先前至少部分解码的图像)和其它帧间预测参数,例如取决于是否使用整个参考图像或只使用参考图像的一部分(例如当前块的区域附近的搜索窗口区域)来搜索最佳匹配参考块,和/或例如取决于是否应用像素内插(例如半像素和/或四分之一像素内插)。

除上述预测模式外,还可以应用跳过模式和/或直接模式。

帧间预测单元244可以包括运动估计(motion estimation,ME)单元和运动补偿(motion compensation,MC)单元(两者在图2中均未示出)。运动估计单元可用于接收或获取图像块203(当前图像17的当前图像块203)和解码图像231,或至少一个或多个先前重建块,例如,一个或多个其它/不同先前解码图像231的重建块,以进行运动估计。例如,视频序列可以包括当前图像和先前解码图像231,或换句话说,当前图像和先前解码图像231可以为形成视频序列的图像序列的一部分或形成该图像序列。

例如,编码器20可用于从多个其它图像中的相同或不同图像的多个参考块中选择参考块,并将参考图像(或参考图像索引)和/或参考块的位置(x坐标、y坐标)与当前块的位置之间的偏移(空间偏移)作为帧间预测参数提供给运动估计单元。该偏移也称为运动矢量(motion vector,MV)。

运动补偿单元用于获取例如接收帧间预测参数,并基于或使用帧间预测参数进行帧间预测,以获得帧间预测块265。由运动补偿单元执行的运动补偿可能涉及基于通过运动估计确定的运动/块矢量来提取或生成预测块,还可能涉及对子像素精度进行内插。内插滤波可以从已知像素的像素点中生成额外像素的像素点,从而可能增加可用于对图像块进行编码的候选预测块的数量。一旦接收到当前图像块的PU的运动矢量,运动补偿单元可以定位在其中一个参考图像列表中运动矢量指向的预测块。

运动补偿单元还可以生成与块和视频条带相关的语法元素,以供视频解码器30用于对视频条带的图像块进行解码。

熵编码

例如,熵译码单元270用于对量化系数209、帧间预测参数、帧内预测参数、环路滤波器参数和/或其它语法元素应用熵编码算法或方案(例如,可变长度编码(variablelength coding,VLC)方案、上下文自适应VLC(context adaptive VLC,CAVLC)方案、算术编码方案、二值化、上下文自适应二进制算术编码(context adaptive binary arithmeticcoding,CABAC)、基于语法的上下文自适应二进制算术编码(syntax-based context-adaptive binary arithmetic coding,SBAC)、概率区间分割熵(probability intervalpartitioning entropy,PIPE)编码或其它熵编码方法或技术)或旁路熵编码算法或方案(不压缩),以获得可以经由输出端272以经编码码流21等形式输出的经编码的图像数据21,使得例如视频解码器30可以接收并使用这些参数进行解码。可以将经编码码流21传输到视频解码器30,或将其存储在存储器中以供后续传输或由视频解码器30检索。

视频编码器20的其它结构变体可用于对视频流进行编码。例如,基于非变换的编码器20可以在没有变换处理单元206的情况下直接量化某些块或帧的残差信号。在另一种实现方式中,编码器20中,量化单元208和反量化单元210可以组合成一个单元。

解码器和解码方法

图3示出了用于实现本申请技术的视频解码器30的示例。视频解码器30用于接收例如由编码器20编码的图像数据21(例如,经编码码流21)以获得解码图像331。经编码的图像数据或码流包括用于对所述经编码的图像数据进行解码的信息,例如表示编码视频条带的图像块的数据和相关的语法元素。

在图3的示例中,解码器30包括熵解码单元304、反量化单元310、逆变换处理单元312、重建单元314(例如求和器314)、环路滤波器320、解码图像缓冲器(decoded picturebuffer,DPB)330、帧间预测单元344和帧内预测单元354。帧间预测单元344可以为或包括运动补偿单元。在一些示例中,视频解码器30可执行通常与针对图2的视频编码器100描述的编码过程相反的解码过程。

如针对编码器20的描述,反量化单元210、逆变换处理单元212、重建单元214、环路滤波器220、解码图像缓冲器(decoded picture buffer,DPB)230、帧间预测单元344和帧内预测单元354还组成视频编码器20的“内置解码器”。相应地,反量化单元310的功能可以与反量化单元110相同;逆变换处理单元312的功能可以与逆变换处理单元212相同;重建单元314的功能可以与重建单元214相同;环路滤波器320的功能可以与环路滤波器220相同;解码图像缓冲器330的功能可以与解码图像缓冲器230相同。因此,针对视频编码器20的相应单元和功能进行的描述对应地适用于视频解码器30的相应单元和功能。

熵解码

熵解码单元304用于解析码流21(或通常为经编码的图像数据21)并例如对经编码的图像数据21执行熵解码,以获得量化系数309和/或经解码的编码参数(图3中未示出)等,例如帧间预测参数(例如参考图像索引和运动矢量)、帧内预测参数(例如帧内预测模式或索引)、变换参数、量化参数、环路滤波器参数和/或其它语法元素中的任一个或全部。熵解码单元304可用于应用与针对编码器20的熵编码单元270所描述的编码方案相对应的解码算法或方案。熵解码单元304还可以用于向模式选择单元360提供帧间预测参数、帧内预测参数和/或其它语法元素,并向解码器30的其它单元提供其它参数。视频解码器30可以接收视频条带级和/或视频块级的语法元素。

反量化

反量化单元310可用于从经编码的图像数据21(例如,通过熵解码单元304等解析和/或解码)接收量化参数(quantization parameter,QP)(或通常为与反量化相关的信息)和量化系数,并基于所述量化参数对经解码的量化系数309应用反量化以获得解量化系数311,所述解量化系数311也可以称为变换系数311。反量化过程可以包括使用视频编码器20对视频条带中的每个视频块确定的量化参数来确定量化程度,同样确定需要应用的反量化的程度。

逆变换

逆变换处理单元312可用于接收解量化系数311,也称为变换系数311,并对解量化系数311应用变换以获得像素点域中的重建残差块213。重建残差块213也可以称为变换块313。变换可以为逆变换,例如逆DCT、逆DST、逆整数变换或概念上类似的逆变换过程。逆变换处理单元312还可以用于从经编码的图像数据21接收变换参数或对应信息(例如,通过熵解码单元304等解析和/或解码),以确定将应用于解量化系数311的变换。

重建

重建单元314(例如,加法器或求和器314)可用于通过例如将重建残差块313的像素点值和预测块365的像素点值相加,将重建残差块313添加到预测块365,以获得像素点域中的重建块315。

滤波

环路滤波单元320(在编码环路中或编码环路之后)用于对重建块315进行滤波,以获得滤波块321,以平滑像素转变或提高视频质量等。环路滤波单元320可以包括一个或多个环路滤波器,如去块效应滤波器、像素点自适应偏移(sample-adaptive offset,SAO)滤波器或一个或多个其它滤波器,例如双边滤波器、自适应环路滤波器(adaptive loopfilter,ALF)、锐化或平滑滤波器、或协作滤波器、或其任意组合。虽然环路滤波单元320在图3中示为环内滤波器,但是在其它配置中,环路滤波单元320可以实现为后环路滤波器。

解码图像缓冲器

然后,将图像的解码视频块321存储在解码图像缓冲器330中,所述解码图像缓冲器330存储作为参考图像的解码图像331,这些参考图像用于其它图像后续运动补偿和/或分别输出到显示器。

解码器30用于经由输出端312等输出解码图像311,向用户呈现或供用户观看。

预测

帧间预测单元344的功能可以与帧间预测单元244(特别是运动补偿单元)相同,帧内预测单元354的功能可以与帧间预测单元254相同,并基于从经编码的图像数据21接收的分割和/或预测参数或相应信息(例如,通过熵解码单元304等解析和/或解码)决定划分或分割并执行预测。模式选择单元360可用于基于重建图像、块或相应像素点(经滤波或未经滤波)对每个块执行预测(帧内或帧间预测),以获得预测块365。

当将视频条带编码为帧内编码(I)条带时,模式选择单元360的帧内预测单元354用于基于信号发送的帧内预测模式和来自当前图像的先前解码块的数据生成当前视频条带的图像块的预测块365。当将视频图像编码为帧间编码(即,B或P)条带时,模式选择单元360的帧间预测单元344(例如,运动补偿单元)用于基于运动矢量和从熵解码单元304接收的其它语法元素产生当前视频条带的视频块的预测块365。对于帧间预测,可从其中一个参考图像列表中的其中一个参考图像产生这些预测块。视频解码器30可以基于存储在DPB330中的参考图像,使用默认构建技术来构建参考帧列表:列表0和列表1。

模式选择单元360用于通过解析运动矢量和其它语法元素来确定当前视频条带的视频块的预测信息,并使用所述预测信息针对所解码的当前视频块生成预测块。例如,模式选择单元360使用接收到的一些语法元素确定用于对视频条带的视频块进行编码的预测模式(例如,帧内预测或帧间预测)、帧间预测条带类型(例如B条带、P条带或GPB条带)、条带的一个或多个参考图像列表的构建信息、条带的每个帧间编码视频块的运动矢量、条带的每个帧间编码视频块的帧间预测状态以及其它信息,以对当前视频条带内的视频块进行解码。

可以使用视频解码器30的其它变体对经编码的图像数据21进行解码。例如,解码器30可以在没有环路滤波单元320的情况下产生输出视频流。例如,基于非变换的解码器30可以在没有逆变换处理单元312的情况下直接对某些块或帧的残差信号进行反量化。在另一种实现方式中,视频解码器30中,反量化单元310和逆变换处理单元312可以组合成一个单元。

应理解,在编码器20和解码器30中,可以对当前步骤的处理结果进一步处理,然后输出到下一步骤。例如,在插值滤波、运动矢量推导或环路滤波之后,可以对插值滤波、运动矢量推导或环路滤波的处理结果进行进一步运算,如裁剪或移位运算。

图4为本发明实施例提供的视频编码设备400的示意图。视频编码设备400用于实现本文描述的所公开实施例。在一个实施例中,视频编码设备400可以是解码器(如图1A的视频解码器30)或编码器(如图1A的视频编码器20)。

视频编码设备400包括:入端口410(或输入端口410)和接收单元(Rx)420,用于接收数据;处理器、逻辑单元或中央处理单元(central processing unit,CPU)430,用于处理数据;发送单元(Tx)440和出端口450(或输出端口450),用于发送数据;存储器460,用于存储数据。视频编码设备400还可包括耦合到入端口410、接收单元420、发送单元440和出端口450的光电(optical-to-electrical,OE)组件和电光(electrical-to-optical,EO)组件,用作光信号或电信号的出口或入口。

处理器430通过硬件和软件实现。处理器430可实现为一个或多个CPU芯片、核(例如,多核处理器)、FPGA、ASIC和DSP。处理器430与入端口410、接收单元420、发送单元440、出端口450和存储器460通信。处理器430包括编码模块470。编码模块470用于实施上述实施例。例如,编码模块470用于实施、处理、准备或提供各种编码操作。因此,包括编码模块470使得视频编码设备400功能得到了显著改进,实现了视频编码设备400不同状态的转换。或者,以存储在存储器460中并由处理器430执行的指令来实现编码模块470。

存储器460可以包括一个或多个磁盘、磁带机和固态硬盘,可用作溢出数据存储设备,以在选择执行程序时存储这类程序,并存储在程序执行期间读取的指令和数据。例如,存储器460可以是易失性和/或非易失性的,并且可以是只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、三态内容寻址存储器(ternarycontent-addressable memory,TCAM)和/或静态随机存取存储器(static random-accessmemory,SRAM)。

图5为示例性实施例提供的装置500的简化框图,其中,装置500可用作图1中的源设备12和目的设备14中的任一个或两个。

装置500中的处理器502可以是中央处理单元。或者,处理器502可以是现有的或今后将研发出的能够操控或处理信息的任何其它类型的设备或多个设备。虽然可以使用如图所示的处理器502等单个处理器来实施所公开的实现方式,但使用一个以上的处理器可以提高速度和效率。

在一种实现方式中,装置500中的存储器504可以是只读存储器(read onlymemory,ROM)设备或随机存取存储器(random access memory,RAM)设备。任何其它合适类型的存储设备都可以用作存储器504。存储器504可以包括处理器502通过总线512访问的代码和数据506。存储器504还可包括操作系统508和应用程序510,其中,应用程序510包括允许处理器502执行本文所述方法的至少一个程序。例如,应用程序510可以包括应用1至N,还可以包括执行本文所述方法的视频编码应用。

装置500还可以包括一个或多个输出设备,如显示器518。在一个示例中,显示器518可以是将显示器与可用于感测触摸输入的触敏元件组合的触敏显示器。显示器518可以经由总线512耦合到处理器502。

虽然装置500的总线512在本文中描述为单个总线,但是总线512可以包括多个总线。此外,辅助储存器514可以直接耦合到装置500的其它组件或可以经由网络访问,并且可以包括存储卡等单个集成单元或多个存储卡等多个单元。因此,装置500可以通过多种配置实现。

双树分割方案中的调色板编码

如前所述,双树分割假设译码块例如CU可以是:单一CU,包括一个亮度译码块(coding block,CB)和两个色度CB;或分离的亮度CU和色度CU,其中,亮度CU包括一个亮度CB,色度CU包括两个色度CB。在解决双树分割方案中CB的多样性问题时,可以根据某个CU的分割类型使用调色板译码方法并进行信号发送。

通常,当每个调色板索引点位于一个颜色分量上(与一个颜色分量相关联)时,可以以分离方式应用调色板译码;或者当每个调色板索引点位于一个以上颜色分量上(与一个以上颜色分量相关联)时以联合方式应用调色板译码。第一种方法(分离方式)称为分离调色板译码,假设对每个颜色分量单独进行调色板索引图的计算和信号发送。第二种方法(联合方式)称为联合调色板译码,假设对一些颜色分量一起进行调色板索引图的计算和信号发送。

应理解,联合调色板译码可以包括不同类型的联合,例如,在Y-Cb-Cr联合的情况下,调色板中的一个调色板索引指向调色板中的Y-Cb-Cr三元组;在Cb-Cr联合的情况下,调色板中的一个调色板索引指向Cb-Cr对。换句话说,Y-Cb-Cr联合将一个调色板索引与三个颜色分量Y、Cb、Cr的一个相应组合相关联。Cb-Cr联合将每个调色板索引与两个颜色分量Cb、Cr的一个相应组合相关联。调色板中的索引数通常少于颜色分量的可能组合数。因此,调色板仅能够对可由颜色分量的可能组合表示的所有颜色的子集进行编码。这样,调色板的索引可以提供更有效的编码,因为其取值范围通常小于颜色分量组合的取值范围。对于一些颜色变化受限的CU,提高了编码效率。然而,除了编码索引图(与CU的像素点相关联的调色板索引)给出的长度之外,还必须考虑附加信令信息的长度。所述信令信息可以包括一个或多个上述参数,如调色板、调色板的长度、跳出标志、调色板译码标志等等。某些参数可以基于与CU相关联的、可在编码器和解码器侧获得的、由标准预定义的或更高级别信号发送的其它参数(条带头、单个图像或多个图像共有的参数集等)来进行推导。

调色板译码的某种方式通常针对编解码器进行预先选择,或根据一些编码参数(如分割、条带类型等)进行选择。

下文对本文采用的术语进行概括:

最近在现代视频编解码标准中引入了一种分离或双编码树方法,相对于普通的单树方法,该方法可以实现有益的效果。该分离树方法假设递归译码块的结构将分别应用于亮度分量和色度分量。使用该方法,以递归方式将每个CTU进一步划分为两个分离的编码树,所述划分可以是四叉树、二叉树、三叉树或任何其它类型的划分。一个树用于亮度分量,包括信号中的Y信息;另一个树用于色度分量,包括信号中的Cb信息和Cr信息。

调色板译码工具可以以几种不同的方式实现,通常包括以下主要组成部分:CU调色板模式标志(palette_mode_flag),指示是在CU级启用还是禁用调色板工具;每种或某些颜色分量的一个或多个调色板,表示CU中最频繁的信号信息;调色板的预测矢量,指示应实施预测机制并为调色板传输节省空间;信号跳出标志(signal_escape_flag),指示当前CU中是否有不包括在调色板中的像素;调色板索引图(palette_indexes_map),指示CU中每个像素的特定调色板元素;扫描顺序类型,指示用于在CU上移动的扫描类型。下文公开了当可能采用分离或双编码树方法时,上述调色板工具组成部分的实现方式。

实施例一

实施例一描述了在允许采用双树分割时,亮度分离树中CU的palette_mode_flag与色度分离树中CU的palette_mode_flag的关系。

在第一种可能方式中,独立地信号发送每个CU的palette_mode_flag。在该方法中,当使用分离树时,独立地信号发送亮度CU的一个palette_mode_flag和色度CU的一个palette_mode_flag。在单树情况下,信号发送包括所有颜色分量(一个亮度CB和两个色度CB)的一个CU的palette_mode_flag。

在第二种可能方式中,无论使用单树还是分离树,总是独立地信号发送亮度分量和色度分量的palette_mode_flag。在该方法中,当使用分离树时,分别信号发送亮度CU的一个palette_mode_flag和色度CU的一个palette_mode_flag。在单树情况下,在一个CU内,信号发送一个亮度译码块的一个palette_mode_flag,并信号发送同一CU内色度译码块的另一个palette_mode_flag。

在第三种可能方式中,仅信号发送亮度CU的palette_mode_flag。在该方法中,推断色度CU的palette_mode_flag为假,并且不使用色度的调色板模式。

在第四种可能方式中,色度CU的palette_mode_flag取决于对应的亮度CU以及亮度CU与当前色度CU的交互(关系)。将亮度覆盖范围设为亮度CU的集合,其并集空间覆盖整个色度块。如果当前色度块有一个以上的覆盖范围,则考虑元素数量最少的一个覆盖范围。

1.如果色度CU完全由一个亮度CU覆盖,则色度CU的palette_mode_flag继承亮度CU的palette_mode_flag。例如,对于同一CU位置,将palette_mode_flag_CbCr(色度)设置为与palette_mode_flag_Y(亮度)值相同的值。

2.如果色度CU由一个以上亮度CU覆盖,并且所有此类亮度CU具有相同的palette_mode_flag,则色度CU的调色板模式继承亮度CU的调色板模式。

3.如果色度CU由一个以上亮度CU覆盖,并且不是所有此类亮度CU具有相同的palette_mode_flag,则:

a.在码流中信号发送色度CU的palette_mode_flag;或

b.基于亮度CU的palette_modes_flags中的多数原则,色度CU的palette_mode_flag继承亮度CU的palette_mode_flag;换句话说,将palette_mode_flag_CbCr设置为覆盖色度CU的亮度CU的标志中出现次数最多的标志;或

c.基于相同值的调色板模式标志的比值(真/假),色度CU的palette_mode_flag继承亮度CU的palette_mode_flag;如果比值高于(超过)某个预定义阈值,则色度CU的palette_mode_flag继承亮度CU中palette_mode_flag的多数值;否则,信号发送色度CU的palette_mode_flag;换句话说,如果具有出现频率最高的标志值的CU数量与具有出现频率最低的标志值的CU数量之间的比值超过预定义阈值,则应用选项(b),否则信号发送色度palette_mode_flag。这里假设标志可以取两个不同值中的一个。然而,通常,调色板模式标志能够信号发送与相应的两个以上调色板模式对应的两个以上值(本发明不限于此);或者

d.基于亮度CU的调色板模式的加权函数,色度CU的palette_mode_flag继承亮度CU的palette_mode_flag,其中,每个亮度CU调色板模式的权重通过当前色度CU与亮度CU之间的空间对应关系确定。

(应注意,在上述选项a-d中,可以通过标准预定义其中一个。或者,选项a-b中的一种可以由编码器设置并且针对一个或多个图像或图像的一部分发送一次信号。只要编码器和解码器能够采用相同的继承规则(a-d中的一个),本发明不受任何特定方法限制。)

4.色度CU的palette_mode_flag继承覆盖色度CU的某个亮度CU,例如覆盖色度CU的左上或中心像素点的亮度CU的palette_mode_flag。

5.例如按以下方式之一,基于覆盖色度CU的某个亮度CU,例如覆盖色度CU的左上或中心像素点的亮度CU,推导出色度CU的palette_mode_flag:

a.如果覆盖亮度CU具有等于0的palette_mode_flag(意味着不对亮度CU应用调色板译码),则推断色度CU的palette_mode_flag为0。

a.如果覆盖亮度CU具有等于0的palette_mode_flag,则在码流中信号发送色度CU的palette_mode_flag/对于解码侧,则从码流中解析色度CU的palette_mode_flag。

b.如果覆盖亮度CU具有等于1的palette_mode_flag,则推断色度CU的palette_mode_flag为1。

c.如果覆盖亮度CU具有等于1的palette_mode_flag,则在码流中信号发送色度CU的palette_mode_flag/对于解码侧,则从码流中解析色度CU的palette_mode_flag。

应注意,在上述示例中,联合处理两个色度分量。然而,在一些示例性实现方式中,也可以单独处理色度分量,即色度分量具有单独的palette_mode_flag、调色板以及上文针对亮度和色度所述的其它相关参数。此外,在本文中,为了简单起见,有时采用术语“palette_mode_flag”或“标志”来表示标志值的含义。

在第五种方法中,使用CABAC来信号发送色度CU的palette_mode_flag,其中,基于对应的亮度块来选择当前色度块的上下文,例如,如果所有对应的亮度块都具有相同的palette_mode_flag,则使用同一个上下文,否则使用其它上下文。

实施例二

该实施例公开了当可能采用双树时,调色板和调色板大小的传输和推导方法,应注意,该实施例可以以任何可能的方式与第一实施例结合。

在第一种可能方式中,无论使用单树还是分离树,始终使用分离调色板。在该方法中,每个Y分量、Cb分量和Cr分量的调色板大小和调色板作为独立的语法元素进行传输。如果使用单树,则每个Y分量、Cb分量和Cr分量的调色板大小和调色板在单一CU中传输。如果使用双树,则Y分量的调色板大小和调色板在亮度CU中传输,Cb分量和Cr分量的调色板大小和调色板在色度CU中传输。作为第一种可能方式的替代方案,如果使用单树,则每个Y分量、Cb分量和Cr分量的调色板大小和调色板分别在单一CU中传输。如果使用双树,则Y分量的调色板大小和调色板在亮度CU中传输,Cb分量和Cr分量的调色板大小和调色板分别在色度CU中传输。

在第二种可能方式中,可以基于某种预定义条件,例如色度的调色板大小可以比亮度的传输调色板大小小2倍,基于一个分量的调色板大小推导出另一个分量的调色板大小。该方法可用于分离调色板方法和联合调色板方法。在该方法中,如果使用单树,则Y分量的调色板大小在单一CU中传输,并基于预定义条件推导出Cb分量和Cr分量的调色板大小;如果使用双树,则Y分量的调色板大小在亮度CU中传输,并且基于预定义条件推导出Cb分量和Cr分量的调色板大小。

在第三种可能方式中,可以在码流中信号发送特殊标志,以指示是否基于一个分量的调色板大小信号发送或推导出另一个分量的调色板大小。上述调色板大小信号发送(编码)方法是示例性的。本发明不限于此。例如,调色板的大小也可以在标准中是固定的,或者可以基于CU大小或其它参数等,根据标准中定义的一些规则推导出来,而无需在编码器与解码器之间进一步进行信号发送。

在第四种可能方式中,Y分量、Cb分量和Cr分量的每个待传输调色板可以按某种预定义的单调顺序进行排序,并且可以传输相邻元素之间的差值。如果使用单树,则在单一CU中传输差值。如果使用双树,则Y分量的差值在亮度CU中传输,Cb分量和Cr分量的差值分别在色度CU中传输。在该方法中,不受一般性限制,假设按单调递增的顺序对调色板进行排序,对于每个分量,从第二个开始的每个调色板元素可以表示为当前调色板元素与前一调色板元素之间的差值。可以使用完整表示对第一个元素进行表示和编码,而不进行任何额外处理。

在第五种可能方式中,Y分量、Cb分量和Cr分量的每个待传输调色板可以按某种预定义的单调顺序进行排序,并且可以传输相邻元素之间的差值。如果使用单树,则在单一CU中传输差值。如果使用双树,则Y分量的差值在亮度CU中传输,Cb分量和Cr分量的差值分别在色度CU中传输。在该方法中,不受一般性限制,假设按递增顺序对调色板进行排序,对于每个分量,从第二个到倒数第二个的每个调色板元素可以表示为当前调色板元素与前一调色板元素之间的差值。可以使用完整表示对第一个元素进行表示和编码,而不进行任何额外处理。可以将最后一个元素表示为最大可能值与自身之间的差值并对其进行编码。

在第六种方法中,无论使用单树还是分离树,始终使用联合CbCr调色板。在该方法中,传输每个单独组的调色板大小和调色板。如果使用单树,则Y分量和联合Cb-Cr分量的调色板大小和调色板分别在单一CU中传输;如果使用双树,则Y分量的调色板大小和调色板在亮度CU中传输,而联合Cb-Cr分量的调色板大小和调色板在色度CU中传输。

在第七种方法中,当使用分离树时,应用联合CbCr调色板;当使用单树时,应用联合YCbCr调色板。如果使用单树,则针对具有Y分量、Cb分量和Cr分量三者的CU传输联合YCbCr的调色板大小和调色板。如果使用双树,则Y分量的调色板大小和调色板在亮度CU中传输,而联合Cb-Cr分量的调色板大小和调色板在色度CU中传输。

在上述两种方法中,如果使用联合调色板,则可以根据元组的某些元素将联合元素作为元组进行排序。例如,如果使用Y-Cb-Cr联合,则可以根据第一Y值对作为调色板元素的Y-Cb-Cr三元组进行排序,Cb值和Cr值将根据Y值进行重新排序。在一个更具体的示例中,如果联合Y-Cb-Cr调色板由以下三元组组成:(100,100,100)、(90,150,150)、(120,200,90),则按第一个(Y分量)排序之后为:(90,150,150)、(100,100,100)、(120,200,90)。

在该方法中,Y调色板可以表示为相邻元素调色板元素之间的差值,如上所述,并且可以完整地表示Cb调色板和Cr调色板,而不进行任何额外处理。在上文给出的具体示例中,表示为:(100,100,100)、(10,100,100)、(10,200,90)。

在另一个示例中,如果使用Cb-Cr联合调色板,则Y调色板以及Cb调色板或Cr调色板中的一个调色板可以表示为相邻元素之间的差值并进行传输,其余调色板部分(例如,剩余调色板)可以进行完整的表示和传输,而不进行额外处理。

实施例三

该实施例描述了在可能采用双树时不同的调色板预测方法。

在第一种可能方式中,如果使用分离调色板,则将分离调色板的预测向量(仅包括值0和1(也称为布尔向量),每个Y、Cb和Cr分量各一个预测向量)作为独立的语法元素进行传输。在该方法中,如果使用单树,则每个Y分量、Cb分量和Cr分量的调色板预测向量在单一CU中传输;如果使用双树,则Y分量的调色板预测布尔向量在亮度CU中传输,Cb分量和Cr分量的调色板预测布尔向量在色度CU中传输。

在第二种可能方式中,如果使用联合调色板,则传输每个单独组的调色板预测布尔向量。例如,就联合Cb-Cr而言,如果使用单树,则Y分量和联合Cb-Cr分量的调色板预测布尔向量在单一CU中传输;如果使用双树,则Y分量的调色板预测布尔向量在亮度CU中传输,而联合Cb-Cr分量的调色板预测布尔向量在色度CU中传输。

在第三种方法中,当使用联合调色板时,传输每个单独组的调色板预测布尔向量。例如,就联合Cb-Cr而言,当使用单树时,Y分量和联合Cb-Cr分量的调色板预测布尔向量在单一CU中传输;当使用双树时,Y分量的调色板预测布尔向量在亮度CU中传输,而联合Cb-Cr分量的调色板预测布尔向量在色度CU中传输。

应注意,第三实施例可以与第一实施例和第二实施例中的一者或两者结合。

实施例四

该实施例描述了在可能采用双树时不同的signal_escape_flag使用方法。

在第一种可能方式中,每个Y分量、Cb分量和Cr分量的signal_escape_flag作为独立的语法元素进行传输。如果使用单树,则Y分量、Cb分量和Cr分量的signal_escape_flag在单一CU中独立传输;如果使用双树,则Y分量的signal_escape_flag在亮度CU中传输,Cb分量和Cr分量的signal_escape_flags在色度CU中独立传输。

在第二种可能方式中,仅在CU中对所有分量传输一个signal_escape_flag。如果使用单树,则在CU中对Y分量、Cb分量和Cr分量传输一个signal_escape_flag。如果使用双树,则在亮度CU中对Y分量传输一个signal_escape_flag,在色度CU中对Cb分量和Cr分量传输一个signal_escape_flag。

在第三种可能方式中,无论使用单树还是分离树,总是对Y分量信号发送一个signal_escape_flag并对Cb分量和Cr分量信号发送一个signal_escape_flag。如果使用单树,则在CU中对Y分量传输一个signal_escape_flag,并对联合Cb分量和Cr分量传输一个signal_escape_flag。如果使用双树,则在亮度CU中对Y分量传输一个signal_escape_flag,在色度CU中对Cb分量和Cr分量传输一个signal_escape_flag。

在第四种可能方式中,可以仅信号发送亮度CU的signal_escape_flag,并且总是推断色度CU的signal_escape_flag为假。

在第五种可能方式中,可以仅信号发送亮度CU的signal_escape_flag,并且按以下方式中的一种或多种推导出色度CU的signal_escape_flag:

1.如果色度CU完全由一个亮度CU覆盖,则色度CU的signal_escape_flag继承亮度CU的signal_escape_flag。

2.如果色度CU由一个以上亮度CU以最小范围覆盖,并且所有此类亮度CU具有相同的signal_escape_flag,则色度CU的调色板模式继承亮度CU的调色板模式。

3.如果色度CU由一个以上亮度CU覆盖,并且不是所有此类亮度CU具有相同的signal_escape_flag,则:

a.在码流中信号发送色度CU的signal_escape_flag;或

b.基于亮度CU的signal_escape_flag中的多数原则,色度CU的signal_escape_flag继承亮度CU的signal_escape_flag;或

c.基于相同值的调色板模式标志的比值(真/假),色度CU的signal_escape_flag继承亮度CU的signal_escape_flag;如果比值高于(超过)某个预定义阈值,则色度CU的signal_escape_flag继承亮度CU中signal_escape_flag的多数值;否则,信号发送色度CU的signal_escape_flag;或

d.基于亮度CU的调色板模式的加权函数,色度CU的signal_escape_flag继承亮度CU的signal_escape_flag,其中,每个亮度CU调色板模式的权重通过当前色度CU与亮度CU之间的空间对应关系确定。

4.色度CU的signal_escape_flag继承覆盖色度CU的某个亮度CU,例如覆盖色度CU的左上或中心像素点的亮度CU的signal_escape_flag。

5.例如按以下方式之一,基于覆盖色度CU的某个亮度CU,例如覆盖色度CU的左上或中心像素点的亮度CU,推导出色度CU的signal_escape_flag:

a.如果覆盖亮度CU具有等于0的signal_escape_flag,则推断色度CU的signal_escape_flag为0。

b.如果覆盖亮度CU具有等于0的signal_escape_flag,则在码流中信号发送色度CU的signal_escape_flag。

c.如果覆盖亮度CU具有等于1的signal_escape_flag,则推断色度CU的signal_escape_flag为1。

d.如果覆盖亮度CU具有等于1的signal_escape_flag,则在码流中信号发送色度CU的signal_escape_flag。

实施例五

该实施例描述了在可能采用双树时不同的调色板索引图使用和信号发送方法。

在第一种可能方式中,如果使用分离调色板,则每个Y分量、Cb分量和Cr分量的palette_indexes_map作为独立的语法元素进行传输。如果使用单树,则每个Y分量、Cb分量和Cr分量的palette_indexes_map分别在单一CU中传输;如果使用双树,则Y分量的palette_indexes_map在亮度CU中传输,Cb分量和Cr分量的palette_indexes_map分别在色度CU中传输。

在第二种可能方式中,如果使用联合调色板,则传输每个单独组的palette_indexes_map。例如,就联合Cb-Cr而言,如果使用单树,则每个Y和Cb-Cr组的palette_indexes_map在单一CU中作为独立的语法元素传输;如果使用双树,则Y分量的palette_indexes_map在亮度CU中传输,而Cb-Cr分量的联合palette_indexes_map在色度CU中传输。

在另一示例中,就联合Y-Cb-Cr而言,如果使用单树,则Y-Cb-Cr组的palette_indexes_map在单一CU中作为独立的语法元素传输;如果使用双树,则Y分量的palette_indexes_map在亮度CU中传输,而Cb-Cr分量的联合palette_indexes_map在色度CU中传输。

应理解,不管索引图表示和编码为何种类型,都可以应用上述方法。例如,可以使用游程编码(run-length coding,RLE)对palette_indexes_map进行表示和编码,所述游程编码又可以包括以下全部或一些语法元素:num_indexes阵列、last_run_type值、s_points阵列、runs阵列等等。在另一个示例中,可以使用特定扫描类型对palette_indexes_map进行直接表示和编码以在二维矩形索引矩阵上移动。

在第三种可能方式中,亮度CU和色度CU的palette_indexes_map可以具有彼此不同的表示和编码。例如,可以使用RLE编码对亮度CU的palette_indexes_map进行表示和编码,所述RLE编码又可以包括以下全部或一些语法元素:num_indexes阵列、last_run_type值、s_points阵列、runs阵列等等;可以使用特定扫描类型对色度CU的palette_indexes_map进行直接表示和编码以在二维矩形索引矩阵上移动。在另一示例中,可以使用亮度CU和色度CU的表示和编码的任何其它组合。

在第四种可能方式中,Y分量、Cb分量和Cr分量的palette_indexes_map可以具有彼此不同的表示和编码。例如,可以使用RLE编码对Y分量的palette_indexes_map进行表示和编码,所述RLE编码又可以包括以下全部或一些语法元素:num_indexes阵列、last_run_type值、s_points阵列、runs阵列等等;可以使用特定扫描类型对Cb分量和Cr分量的palette_indexes_map进行直接表示和编码以在二维矩形索引矩阵上移动。在另一示例中,可以使用不同分量的表示和编码的任何其它组合。

实施例六

该实施例描述了在可能采用双树时palette_scan_order的不同使用方法。

在第一种可能方式中,每个Y分量、Cb分量和Cr分量的palette_scan_order作为独立的语法元素进行传输。如果使用单树,则Y分量、Cb分量和Cr分量的palette_scan_order在单一CU中作为3个语法元素传输;如果使用双树,则Y分量的palette_scan_order在亮度CU中传输,Cb分量和Cr分量的palette_scan_order在色度CU中作为2个语法元素传输。

在第二种可能方式中,如果使用双树,则可以将每个亮度CU和色度CU的palette_scan_order作为独立的语法元素传输一次。

在第三种可能方式中,如果使用双树,则可以仅信号发送亮度CU的palette_scan_order,并且可以推断出色度CU的palette_scan_order的某个预定义值。

或者,可以仅信号发送Y平面的palette_scan_order,并且可以推断出Cb平面和Cr平面的palette_scan_order的某个预定义值。

在第四种可能方式中,可以仅信号发送亮度CU的palette_scan_order,并且按以下方式中的一种或多种推导出色度CU的palette_scan_order。

1.如果色度CU完全由一个亮度CU覆盖,则色度CU的palette_scan_order继承亮度CU的palette_scan_order。

2.如果色度CU由一个以上亮度CU以最小范围覆盖,并且所有此类亮度CU具有相同的palette_scan_order,则色度CU的调色板模式继承亮度CU的调色板模式继承。

3.如果色度CU由一个以上亮度CU以最小范围覆盖,并且不是所有此类亮度CU具有相同的palette_scan_order,则:

a.在码流中信号发送色度CU的palette_scan_order;或

b.基于亮度CU的palette_scan_order中的多数原则,色度CU的palette_scan_order继承亮度CU的palette_scan_order;或

c.基于相同值的调色板模式标志的比值(真/假),色度CU的palette_scan_order继承亮度CU的palette_scan_order;如果比值高于某个预定义阈值,则色度CU的palette_scan_order继承亮度CU中palette_scan_order的多数值;否则,信号发送色度CU的palette_scan_order;或

d.基于亮度CU的调色板模式的加权函数,色度CU的palette_scan_order继承亮度CU的palette_scan_order,其中,每个亮度CU调色板模式的权重通过当前色度CU与亮度CU之间的空间对应关系确定。

4.色度CU的palette_scan_order继承覆盖色度CU的某个亮度CU,例如覆盖色度CU的左上或中心像素点的亮度CU的palette_scan_order。

通过上文公开的实施例,通过实验可以得知性能在以下方面得到提升。

表1–VVC3.0中的调色板译码模拟结果。Y-Cb-Cr联合调色板用于单树

表2-VVC3.0中的调色板译码模拟结果。Y调色板和Cb-Cr联合调色板用于单树

表1示出了VVC 3.0中采用双树分割的调色板译码性能,其中,对于单树,信号发送联合Y-Cb-Cr的调色板索引图;对于双树,信号发送亮度CU的Y调色板索引图和色度CU的联合Cb-Cr调色板索引图。

表2示出了VVC 3.0中采用双树分割的调色板译码性能,其中,对于单树,信号发送联合Y调色板索引图和联合Cb-Cr调色板索引图;对于双树,信号发送亮度CU的Y调色板索引图和色度CU的联合Cb-Cr调色板索引图。

因此,可以表明,使用联合调色板代替分离调色板可以获得有益效果。

尽管本发明实施例主要基于视频编码进行了描述,但应注意的是,编码系统10、编码器20和解码器30(相应地,系统10)的实施例以及本文描述的其它实施例也可以用于静止图像处理或编码,即,对视频编码中独立于任何先前或连续图像的单个图像进行处理或编码。通常,如果图像处理编码限于单个图像17,仅帧间预测单元244(编码器)和344(解码器)不可用。视频编码器20和视频解码器30的所有其它功能(也称为工具或技术)同样可用于静止图像处理,例如残差计算204/304、变换206、量化208、反量化210/310、(逆)变换212/312、分割262/362、帧内预测254/354和/或环路滤波220/320、熵编码270和熵解码304。

编码器20和解码器30等的实施例,以及本文描述的与编码器20和解码器30等有关的功能可以硬件、软件、固件或其任意组合来实现。如果以软件来实现,那么各种功能可作为一个或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读介质可以包括与有形介质(如数据存储介质)对应的计算机可读存储介质,或包括任何便于将计算机程序从一处传送到另一处的介质(例如根据通信协议)的通信介质。以此方式,计算机可读介质通常可以对应(1)非瞬时性的有形计算机可读存储介质,或(2)如信号或载波等通信介质。数据存储介质可以是可由一个或多个计算机或一个或多个处理器访问以检索用于实现本发明中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。

简要总结本发明,在第一示例中,提供了一种编码设备实现的编码方法,包括:将当前编码树单元在单一分割类型中分割成包括一个亮度CB和两个色度CB的单一CU,或在分离分割类型中分割成分离的仅包括亮度CB的亮度CU和仅包括两个色度CB的色度CU;以及根据所述目标CU的所述分割类型,将目标CU和关联的调色板译码信息编码到码流中;和/或基于(所述)码流中所述目标CU的所述分割类型和所述关联的调色板译码信息对目标CU进行解码。根据权利要求1所述的方法,其中,所述关联的调色板译码信息包括:调色板译码控制标志和调色板译码信息语法元素,其中,所述调色板译码控制标志和所述调色板译码信息语法元素是基于所述目标CU的所述分割类型计算和信号发送/解析的。

仍参考所述第一示例,调色板译码信息语法元素可以包括以下各项中的一个或多个(或全部):一个或多个调色板的预测向量、一个或多个调色板的大小、一个或多个调色板、一个或多个跳出标志、一个或多个索引图。

或者(或另外),针对单一CU类型,可以对联合Y-Cb-Cr分量计算并信号发送一次调色板译码控制标志和调色板译码信息语法元素。

或者(或另外),针对单一CU类型,计算并信号发送两次调色板译码控制标志和调色板译码信息语法元素:一次针对Y分量,一次针对联合Cb-Cr分量。

或者(或另外),针对亮度CU,对Y分量计算并信号发送一次调色板译码控制标志和调色板译码信息语法元素。

或者(或另外),在使用双树的情况下,不在色度CU中使用调色板编码。

或者(或另外),在使用双树的情况下,对色度CU中的联合Cb-Cr分量计算并信号发送一次调色板译码控制标志和调色板译码信息语法元素。

或者(或另外),在使用双树的情况下,色度CU的调色板译码控制标志和调色板译码信息语法元素的计算和信号发送取决于一个或多个并置亮度CU的调色板译码控制标志。

例如,在使用双树的情况下,根据以下规则,基于一个或多个并置亮度CU的调色板译码控制标志计算色度CU的调色板译码控制标志:如果所有并置亮度块的调色板译码控制标志都等于1,则计算并信号发送当前色度块的调色板译码控制标志和调色板译码信息语法元素。否则,当前色度块不使用调色板编码。

在另一示例中,在使用双树的情况下,根据以下规则,基于一个或多个并置亮度CU的调色板译码控制标志计算色度CU的调色板译码控制标志:如果所有并置亮度块的调色板译码控制标志都等于1,则推断色度块的调色板译码控制标志等于1,并计算并信号发送调色板译码信息语法元素。否则,计算并信号发送当前色度块的调色板译码控制标志和调色板译码信息语法元素。

根据一个示例性实施例,提供了一种解码设备实现的解码方法,包括:从码流中解析当前译码单元(coding unit,CU)的分割类型,其中,所述分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中为仅包括一个亮度译码块的亮度CU或仅包括两个色度译码块的色度CU;当所述当前CU的所述分割类型为单树分割类型时,从所述码流中解析指示是否允许对所述单一CU进行调色板译码的调色板启用指示符;或当所述当前CU的所述分割类型为所述分离树分割类型时,从所述码流中解析指示是否允许对所述亮度CU进行调色板译码的调色板启用指示符;如果所述调色板启用指示符指示允许进行调色板译码,则使用调色板解码方法对所述当前CU进行解码。

在一些示例性实现方式中,在推断不允许对色度CU进行调色板译码的方法中,该方法包括使用除调色板解码方法之外的解码方法对所述色度CU进行解码。

该方法还可以包括基于与色度CU相关联的亮度CU的调色板启用指示符推导出指示是否允许对色度CU进行调色板译码的调色板启用指示符。

在所述方法中,基于与色度CU相关联的亮度CU的调色板启用指示符推导出指示是否允许对色度CU进行调色板译码的调色板启用指示符可以包括:当所述色度CU由所述亮度CU完全覆盖时,所述色度CU的调色板启用指示符与所述亮度CU的调色板启用指示符相同;或者,当所述色度CU由包括所述亮度CU的一个以上亮度CU以最小范围覆盖,并且所述所有亮度CU的指示符相同(值相同)时,所述色度CU的调色板启用指示符与所述亮度CU的指示符相同;或者,当所述色度CU由包括所述亮度CU的一个以上亮度CU以最小范围覆盖,但不是所有亮度CU都具有相同的指示符时,从所述码流中解析所述色度CU的调色板启用指示符,或将所述色度CU的指示符设置为所述亮度CU主要使用的指示符,或基于预定义条件将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符,或基于亮度CU的指示符的加权函数,将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符,其中,每个亮度CU的指示符的权重通过所述色度CU与所述亮度CU之间的空间对应关系确定;或者,当所述亮度CU覆盖所述色度CU的左上或中心像素点时,将所述亮度CU的指示符设置为所述色度CU的指示符;或者,当所述亮度CU覆盖所述色度CU的左上或中心像素点时,通过以下任一方式推导出所述亮度CU的指示符作为所述色度CU的指示符:(a)当所述亮度CU的调色板启用指示符等于0时,将所述色度CU的指示符设置为0;(b)当所述亮度CU的指示符等于0时,从所述码流中解析所述色度CU的指示符;(c)当所述亮度CU的调色板启用指示符等于1时,将所述色度CU的指示符设置为1;(d)当所述亮度CU的调色板启用指示符等于1时,从所述码流中解析所述色度CU的指示符。

例如,当色度CU由包括亮度CU的一个以上亮度CU以最小范围覆盖,但不是所有亮度CU都具有相同的指示符时,基于预定义条件将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符包括:基于相同值的指示符的比值(真/假),将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符。当该比值高于预定义阈值时,将色度CU的指示符设置为所述亮度CU主要使用的调色板启用指示符。否则,从所述码流中解析所述色度CU的指示符。

在一些实施例中,使用调色板解码方法对当前CU进行解码包括:从码流中推导出单一CU、亮度CU或色度CU的调色板译码信息;通过所述编码信息,使用调色板解码方法对所述当前CU进行解码。

例如,单一CU的调色板译码信息包括:亮度CB和色度CB中的每一个的调色板、和/或亮度CB和色度CB中的每一个的调色板大小、和/或调色板索引图、和/或调色板扫描顺序;或者,单一CU的调色板译码信息包括:亮度CB的调色板、和/或调色板大小、和/或调色板索引图、和/或调色板扫描顺序,色度CB的调色板和/或调色板大小、和/或调色板索引图、和/或调色板扫描顺序;或者,所述单一CU的调色板译码信息包括:亮度CB和色度CB的调色板、和/或调色板大小、和/或调色板索引图、和/或调色板扫描顺序;并且,所述亮度CU的调色板译码信息包括:亮度CB的调色板、和/或亮度CB的调色板大小、和/或调色板索引图、和/或调色板扫描顺序;所述色度CU的调色板译码信息包括:色度CB的调色板、和/或色度CB的调色板大小、和/或调色板索引图、和/或调色板扫描顺序。

根据上述一些实施例和示例,从码流中推导出单一CU、亮度CU或色度CU的调色板译码信息包括:从码流中解析单一CU的亮度CB的调色板大小,并基于所述单一CU的亮度CB的调色板大小推导出所述单一CU的色度CB的调色板大小;或者,从所述码流中解析所述亮度CU的调色板大小,并基于所述亮度CU的调色板大小推导出与所述亮度CU相关联的色度CU的调色板大小。

在一种示例性实现方式中,调色板中的元素按预定义的单调顺序进行排序,并且将这些元素中的初始元素以及这些元素中的初始元素之后的各相邻元素之间的差值作为编码数据包括在所述码流中。

根据一个实施例,提供了一种解码设备实现的解码方法,包括:从码流中解析当前译码单元(coding unit,CU)的分割类型,其中,所述分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中为仅包括一个亮度译码块的亮度CU或仅包括两个色度译码块的色度CU;当所述当前CU的所述分割类型为单树分割类型时,从所述码流中解析指示是否允许对所述亮度译码块进行调色板译码的调色板启用指示符,和指示是否允许对所述色度译码块中的一个进行调色板译码的调色板启用指示符;或当所述当前CU的所述分割类型为所述分离树分割类型时,从所述码流中解析指示是否允许对所述亮度CU进行调色板译码的调色板启用指示符,和指示是否允许对所述色度CU进行调色板译码的调色板启用指示符;如果所述调色板启用指示符指示允许进行调色板译码,则使用调色板解码方法对所述当前CU进行解码。

根据一个实施例,提供了一种解码设备实现的解码方法,包括:从码流中推导出单一CU、亮度CU或色度CU的调色板译码信息;通过所述编码信息,使用调色板解码方法对所述当前CU进行解码。

例如,单一CU的调色板译码信息包括:亮度CB和色度CB中的每一个的调色板、和/或亮度CB和色度CB中的每一个的调色板大小、和/或调色板索引图、和/或调色板扫描顺序;或者,单一CU的调色板译码信息包括:亮度CB的调色板、和/或调色板大小、和/或调色板索引图、和/或调色板扫描顺序,色度CB的调色板、和/或色度CB的调色板大小、和/或调色板索引图、和/或调色板扫描顺序;或者,所述单一CU的调色板译码信息包括:亮度CB和色度CB的调色板、和/或调色板大小、和/或调色板索引图、和/或调色板扫描顺序;或者,所述亮度CU的调色板译码信息包括:亮度CB的调色板、和/或亮度CB的调色板大小、和/或调色板索引图、和/或调色板扫描顺序;所述色度CU的调色板译码信息包括:色度CB的调色板、和/或色度CB的调色板大小、和/或调色板索引图、和/或调色板扫描顺序。

例如,从码流中推导出单一CU、亮度CU或色度CU的调色板译码信息包括:从码流中解析单一CU的亮度CB的调色板大小,并基于所述单一CU的亮度CB的调色板大小推导出所述单一CU的色度CB的调色板大小;或者,从所述码流中解析所述亮度CU的调色板大小,并基于所述亮度CU的调色板大小推导出与所述亮度CU相关联的色度CU的调色板大小。

在一些实施例中,调色板中的元素按预定义的单调顺序进行排序,并且将这些元素中的初始元素以及这些元素中的初始元素之后的各相邻元素之间的差值作为编码数据包括在所述码流中。

在一些实施例中,使用游程编码(run length coding,RLE)方法对调色板索引图进行编码,该编码方法采用包括num_indexes阵列、last_run_type值、s_points阵列和runs阵列的语法中的至少一种。

根据一个实施例,提供了一种解码设备实现的用于对当前译码单元(codingunit,CU)进行解码的解码方法,其中,所述当前CU的分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中是仅包括一个亮度译码块的亮度CU或仅包括两个亮度译码块的色度CU。所述方法包括:针对所述亮度译码块和所述色度译码块中的每一个,从码流中解析指示是否在调色板外对译码块中的关联像素点进行编码的跳出指示符;如果所述跳出指示符指示在调色板外对译码块中的关联像素点进行编码,则使用除所述调色板解码方法之外的译码(coding)方法对所述当前CU的对应译码块进行解码。

提供了另一种解码设备实现的用于对当前译码单元(coding unit,CU)进行解码的解码方法,其中,所述当前CU的分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中为仅包括一个亮度译码块的亮度CU或仅包括两个亮度译码块的色度CU。对于所述亮度译码块和所述色度译码块中的每一个,所述方法包括:当所述当前CU是单一CU时,针对所有所述亮度译码块和所述色度译码块,从码流中解析指示是否在调色板外对译码块中的关联像素点进行编码的跳出指示符;或者当所述当前CU是亮度CU或色度CU时,从码流中解析指示是否在调色板外对译码块中的关联像素点进行译码的跳出指示符;如果所述跳出指示符指示在调色板外对译码块中的关联像素点进行译码,则使用除所述调色板解码方法之外的译码(coding)方法对所述当前CU进行解码。

根据一个实施例,提供了一种解码设备实现的用于对当前译码单元(codingunit,CU)进行解码的解码方法,其中,所述当前CU的分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中为仅包括一个亮度译码块的亮度CU或仅包括两个亮度译码块的色度CU。对于所述亮度译码块和所述色度译码块中的每一个,所述方法包括:当所述当前CU是单一CU时,针对所述当前CU的所述亮度译码块,从码流中解析指示是否在调色板外对译码块中的关联像素点进行编码的跳出指示符,并且针对所述当前CU的所述色度译码块,从码流中解析是否在调色板外对译码块中的关联像素点进行编码的跳出指示符;或者当所述当前CU是亮度CU或色度CU时,从码流中解析指示是否在调色板外对译码块中的关联像素点进行译码的跳出指示符;如果所述跳出指示符指示在调色板外对译码块中的关联像素点进行译码,则使用除所述调色板解码方法之外的译码(coding)方法对亮度译码块或色度译码块,或对所述亮度CU或色度CU进行解码。

根据一个实施例,提供了一种解码设备实现的用于对当前译码单元(codingunit,CU)进行解码的解码方法,其中,所述当前CU的分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中为仅包括一个亮度译码块的亮度CU或仅包括两个亮度译码块的色度CU。对于所述亮度译码块和所述色度译码块中的每一个,所述方法包括:当所述当前CU是亮度CU时,从码流中解析指示是否在调色板外对译码块中的关联像素点进行译码的跳出指示符;如果所述跳出指示符指示在调色板外对译码块中的关联像素点进行译码,则使用除所述调色板解码方法之外的译码(coding)方法对所述亮度CU进行解码。

例如,所述方法还可以包括:基于与所述色度CU相关联的亮度CU的跳出指示符,推导出指示是否在调色板外对译码块中的关联像素点进行译码。

例如,基于与色度CU相关联的亮度CU的跳出指示符推导出指示是否在调色板外对译码块中的关联像素点进行译码的跳出指示符包括:当所述色度CU由所述亮度CU完全覆盖时,所述色度CU的跳出指示符与所述亮度CU的跳出指示符相同;或者,当所述色度CU由包括所述亮度CU的一个以上亮度CU以最小范围覆盖,并且所述所有亮度CU的指示符相同(值相同)时,所述色度CU的跳出指示符与所述亮度CU的指示符相同;或者,当所述色度CU由包括所述亮度CU的一个以上亮度CU以最小范围覆盖,但不是所有亮度CU都具有相同的指示符时,从所述码流中解析所述色度CU的跳出指示符,或将所述色度CU的指示符设置为所述亮度CU主要使用的指示符,或基于预定义条件将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符,或基于亮度CU的指示符的加权函数,将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符,其中,每个亮度CU的指示符的权重通过所述色度CU与所述亮度CU之间的空间对应关系确定;或者,当所述亮度CU覆盖所述色度CU的左上或中心像素点时,将所述亮度CU的指示符设置为所述色度CU的指示符;或者,当所述亮度CU覆盖所述色度CU的左上或中心像素点时,通过以下任一方式推导出所述亮度CU的指示符作为所述色度CU的指示符:(a)当所述亮度CU的跳出指示符等于0时,将所述色度CU的指示符设置为0;(b)当所述亮度CU的指示符等于0时,从所述码流中解析所述色度CU的指示符;(c)当所述亮度CU的跳出指示符等于1时,将所述色度CU的指示符设置为1;(d)当所述亮度CU的跳出指示符等于1时,从所述码流中解析所述色度CU的指示符。

例如,当色度CU由包括亮度CU的一个以上亮度CU以最小范围覆盖,但不是所有亮度CU都具有相同的指示符时,基于预定义条件将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符包括:基于相同值的指示符的比值(真/假),将所述亮度CU中某一亮度CU的指示符设置为所述色度CU的指示符。当该比值高于预定义阈值时,将色度CU的指示符设置为所述亮度CU主要使用的跳出指示符。否则,从所述码流中解析所述色度CU的指示符。

根据一个实施例,提供了一种解码设备实现的解码方法,包括:从码流中解析当前译码单元(coding unit,CU)的分割类型,其中,所述分割类型为单树分割类型或分离树分割类型,当所述分割类型为所述单树分割类型时,所述当前CU为包括一个亮度译码块和两个色度译码块的单一CU,或者当所述分割类型为所述分离树分割类型时,所述当前CU在分离分割类型中为仅包括一个亮度译码块的亮度CU或仅包括两个色度译码块的色度CU;当所述当前CU的所述分割类型为所述单树分割类型时,从所述码流中解析所述亮度译码块和色度译码块中的每一个的调色板扫描顺序;或当所述当前CU的所述分割类型为所述分离树分割类型时,从所述码流中解析所述亮度CU的调色板扫描顺序;基于所述调色板扫描顺序,使用调色板解码方法对所述当前CU进行解码。

例如,该方法还包括推断调色板扫描顺序作为所述色度CU的预定义扫描顺序,并基于所述调色板扫描顺序对所述色度CU进行解码。

该方法还可以包括基于与色度CU相关联的亮度CU的调色板扫描顺序推导出所述色度CU的调色板扫描顺序。

在一种或多种上述方法中,基于与色度CU相关联的亮度CU的调色板扫描顺序推导出所述色度CU的调色板扫描顺序包括:当所述色度CU由所述亮度CU完全覆盖时,色度CU的调色板扫描顺序与所述亮度CU的调色板扫描顺序相同;或者,当所述色度CU由包括所述亮度CU的一个以上亮度CU以最小范围覆盖,并且所述所有亮度CU的调色板扫描顺序相同(值相同)时,所述色度CU的调色板扫描顺序与所述亮度CU的调色板扫描顺序相同;或者,当所述色度CU由包括所述亮度CU的一个以上亮度CU以最小范围覆盖,但不是所有亮度CU都具有相同的调色板扫描顺序时,从所述码流中解析所述色度CU的调色板扫描顺序,或将所述色度CU的调色板扫描顺序设置为所述亮度CU主要使用的调色板扫描顺序,或基于预定义条件将所述亮度CU中某一亮度CU的调色板扫描顺序设置为所述色度CU的调色板扫描顺序,或基于亮度CU的指示符的加权函数,将所述亮度CU中某一亮度CU的调色板扫描顺序设置为所述色度CU的调色板扫描顺序,其中,每个亮度CU的调色板扫描顺序的权重通过所述色度CU与所述亮度CU之间的空间对应关系确定;或者,当所述亮度CU覆盖所述色度CU的左上或中心像素点时,将所述亮度CU的调色板扫描顺序设置为所述色度CU的调色板扫描顺序。

在一些实施例中,当色度CU由包括亮度CU的一个以上亮度CU以最小范围覆盖,但不是所有亮度CU都具有相同的调色板扫描顺序时,基于预定义条件将所述亮度CU中某一亮度CU的调色板扫描顺序设置为所述色度CU的调色板扫描顺序包括:基于相同值的指示符的比值(真/假),将所述亮度CU中某一亮度CU的调色板扫描顺序设置为所述色度CU的调色板扫描顺序。当该比值高于预定义阈值时,将色度CU的调色板扫描顺序设置为所述亮度CU主要使用的调色板扫描顺序。否则,从所述码流中解析所述色度CU的调色板扫描顺序。

根据一个实施例,提供了一种解码设备,包括处理器和与所述处理器耦合并存储指令的存储器,其中,所述指令由所述处理器执行以执行上述任一种解码方法。

作为示例而非限制,这类计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储设备、闪存或可用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴电缆、光缆、双绞线、数字用户线(digitalsubscriber line,DSL)或如红外线、无线电和微波等无线技术从网站、服务器或其它远程资源传输指令,则在介质定义中包括同轴电缆、光缆、双绞线、DSL或如红外线、无线电和微波等无线技术。然而,应理解,计算机可读存储介质和数据存储介质并不包括连接、载波、信号或其它瞬时性介质,而是针对非瞬时性有形存储介质。如本文所使用的,磁盘和光盘包括压缩光盘(compact disc,CD)、激光光盘、光学光盘、数字多功能光盘(digital versatiledisc,DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包括在计算机可读介质的范围内。

可通过如一个或多个数字信号处理器(digital signal processor,DSP)、通用微处理器、专用集成电路(application specific integrated circuit,ASIC)、现场可编程逻辑阵列(field programmable logic array,FPGA)或其它等效集成或离散逻辑电路等一个或多个处理器来执行指令。因此,如本文所使用的术语“处理器”可指前述结构或适合于实施本文描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文描述的各种功能可以提供在用于编码和解码的专用硬件和/或软件模块内,或者并入到组合编解码器中。而且,所述技术可以完全在一个或多个电路或逻辑元件中实施。

本发明的技术可以在多种设备或装置中实施,这些设备或装置包括无线手机、集成电路(integrated circuit,IC)或一组IC(例如芯片组)。本发明中描述各种组件、模块或单元是为了强调用于执行所公开技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上所述,各种单元可以结合合适的软件和/或固件组合在编解码器硬件单元中,或者通过互操作硬件单元(包括如上所述的一个或多个处理器)的集合来提供。

总之,本发明涉及解码方法和编码方法、解码装置和编码装置、以及程序。特别地,确定目标译码单元(coding unit,CU)的分割类型。所述分割类型为:译码单元译码块单一分割类型,在所述单一分割类型下,所述目标译码单元被分割成包括一个亮度译码块(coding block,CB)和两个色度CB的单一CU;或译码单元分离分割类型,在所述分离分割类型下,所述目标译码单元被分割成分离的仅包括一个亮度CB的亮度CU和仅包括两个色度CB的色度CU。基于所述目标CU的所述分割类型,从码流中解码出所述目标CU和关联的调色板译码信息(在所述解码方法/装置的情况下),或者将其插入所述码流中(在所述编码方法/装置的情况下)。

下面描述上述实施例中所示的编码方法和解码方法以及使用这些方法的系统的应用。

图6为示出用于实现内容分发业务的内容供应系统3100的框图。该内容供应系统3100包括采集设备3102、终端设备3106,并可选地包括显示器3126。采集设备3102通过通信链路3104与终端设备3106通信。所述通信链路可以包括上述通信信道13。通信链路3104包括但不限于WiFi、以太网、有线、无线(3G/4G/5G)、USB或其任意类型组合等。

采集设备3102用于生成数据,并可通过上文实施例中所示的编码方法对数据进行编码。或者,采集设备3102可以将数据分发到流媒体服务器(图中未示出),该服务器对数据进行编码,并将编码数据传输到终端设备3106。采集设备3102包括但不限于摄像机、智能手机或平板电脑、计算机或笔记本电脑、视频会议系统、PDA、车载设备或其任意组合等。例如,采集设备3102可以包括上述源设备12。当数据包括视频时,采集设备3102中包括的视频编码器20实际上可执行视频编码处理。当数据包括音频(即声音)时,采集设备3102中包括的音频编码器实际上可执行音频编码处理。在一些实际场景中,采集设备3102通过将编码视频数据和编码音频数据复用在一起来分发编码视频数据和编码音频数据。在其它实际场景中,例如在视频会议系统中,不复用编码音频数据和编码视频数据。采集设备3102将编码音频数据和编码视频数据分别分发到终端设备3106。

在内容供应系统3100中,终端设备3106接收并再现编码数据。终端设备3106可以为具有数据接收和恢复能力的设备,如智能手机或平板电脑3108、计算机或膝上型电脑3110、网络视频录像机(network video recorder,NVR)/数字视频录像机(digital videorecorder,DVR)3112、电视3114、机顶盒(set top box,STB)3116、视频会议系统3118、视频监控系统3120、个人数字助理(personal digital assistant,PDA)3122、车载设备3124或其任意组合,或能够对上述编码数据进行解码的此类设备。例如,终端设备3106可以包括上述目的设备14。当编码数据包括视频时,终端设备中包括的视频解码器30优先进行视频解码。当编码数据包括音频时,终端设备中包括的音频解码器优先进行音频解码处理。

对于带显示器的终端设备,如智能手机或平板电脑3108、计算机或膝上型电脑3110、网络视频录像机(network video recorder,NVR)/数字视频录像机(digital videorecorder,DVR)3112、电视3114、个人数字助理(personal digital assistant,PDA)3122、或车载设备3124,终端设备可以将解码数据发送到其显示器。对于不带显示器的终端设备,如STB 3116、视频会议系统3118或视频监控系统3120,将外接显示器3126与终端设备连接,以接收并显示解码数据。

本系统中的各个设备进行编码或解码时,可以使用上述实施例所示的图像编码设备或图像解码设备。

图6为示出终端设备3106的示例结构的示意图。在终端设备3106从采集设备3102接收流后,协议处理单元3202对该流的传输协议进行分析。所述协议包括但不限于实时流传输协议(Real Time Streaming Protocol,RTSP)、超文本传输协议(Hyper TextTransfer Protocol,HTTP)、HTTP直播流传输协议(HTTP Live Streaming protocol,HLS)、MPEG-DASH、实时传输协议(Real-time Transport Protocol,RTP)、实时消息传输协议(Real Time Messaging Protocol,RTMP)或其任意组合等。

在协议处理单元3202对流进行处理之后,生成流文件。将文件输出到解复用单元3204。解复用单元3204可以将复用数据分离为编码音频数据和编码视频数据。如上所述,在一些实际场景中,例如在视频会议系统中,不复用编码音频数据和编码视频数据。在这种情况下,不通过解复用单元3204,将编码数据传输到视频解码器3206和音频解码器3208。

通过解复用处理,生成视频基本码流(elementary stream,ES)、音频ES和可选的字幕。视频解码器3206,包括如上述实施例所解释的视频解码器30,通过如上述实施例所示的解码方法对视频ES进行解码以生成视频帧,并将该数据发送到同步单元3212。音频解码器3208对音频ES进行解码以生成音频帧,并将该数据发送至同步单元3212。或者,可以在将视频帧发送至同步单元3212之前存储在缓冲器(图6中未示出)中。类似地,可以在将音频帧发送至同步单元3212之前存储在缓冲器(图6中未示出)中。

同步单元3212同步视频帧和音频帧,并将视频/音频提供给视频/音频显示器3214。例如,同步单元3212同步视频和音频信息的呈现。信息可以使用与编码音频和可视数据呈现相关的时间戳和与数据流发送相关的时间戳,在语法中进行编码。

如果流中包括字幕,则字幕解码器3210对字幕进行解码,并使字幕与视频帧和音频帧同步,并将视频/音频/字幕提供给视频/音频/字幕显示器3216。

本发明并不限于上述系统,上述实施例中的图像编码设备或图像解码设备都可以包括在汽车系统等其它系统中。

相关技术
  • 使用调色板译码的编码器、解码器和相应方法
  • 编码器、解码器及对应的使用帧内模式译码进行帧内预测的方法
技术分类

06120112617959