导航：首页> 摄影术；电影术；利用了光波以外其他波的类似技术；电记录术；全息摄影术〔4〕>视频编解码中的可缩放性维度信息

视频编解码中的可缩放性维度信息

文献发布时间：2024-04-18 19:58:26

相关申请的交叉引用

本专利申请要求北京字节跳动网络技术有限公司于2021年4月2日提交的、名称为“可缩放性维度信息改进”的国际申请No.PCT/CN2021/085292的优先权，该申请通过引用并入本文。

技术领域

本公开总体上涉及视频编解码，尤其涉及图像/视频编解码中使用的补充增强信息(SEI)消息。

背景技术

数字视频占据了互联网和其他数字通信网络上使用的最大带宽。随着能够接收和显示视频的连接用户设备数量的增加，预计数字视频使用的带宽需求将继续增长。

发明内容

所公开的方面/实施例提供了使用可缩放性维度信息(SDI)视图标识符长度减L语法元素的技术，以防止规定比特流中第i层的视图标识符的SDI视图ID值语法元素的长度为零。所公开的方面/实施例进一步提供当SDI消息不存在于比特流中时防止比特流具有多视图获取信息补充增强信息(SEI)消息或辅助信息SEI消息的技术。所公开的方面/实施例还提供了防止多视图获取信息SEI消息被可缩放嵌套的技术。

第一方面涉及一种处理视频数据的方法。该方法包括：一种处理视频数据的方法，包括：使用可缩放性维度信息(SDI)补充增强信息(SEI)消息来指示SDI视图标识符长度减去L语法元素；和基于SDI SEI消息执行视频媒体文件和比特流之间的转换。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定SDI视图标识符长度减L语法元素被配置为防止规定比特流中第i层的视图标识符的SDI视图标识符值语法元素的长度为零。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定L等于1。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定SDI视图标识符长度减L语法元素被指定为sdi_view_id_len_minus1。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定SDI视图标识符值语法元素被指定为sdi_view_id_val[i]。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定SDI视图标识符长度减L语法元素加1规定了SDI视图标识符值语法元素的长度。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定SDI视图标识符长度减L语法元素被编解码为使用N位的无符号整数。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定N等于4。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定SDI视图标识符长度减L语法元素被编解码为使用N位的固定模式位串、使用N位的有符号整数、截断二进制、有符号整数K阶指数哥伦布编解码的语法元素，其中K等于0，或者无符号整数M阶指数哥伦布编解码的语法元素，其中M等于0。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定比特流是范围内的比特流。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定多视图信息SEI消息和辅助信息SEI消息不存在于编解码视频序列(CVS)中，除非SDI SEI消息存在于CVS中。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定多视图信息SEI消息包括多视图获取信息SEI消息。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定辅助信息SEI消息包括深度表示信息SEI消息。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定辅助信息SEI消息包括α通道信息SEI消息。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定当多视图信息SEI消息或辅助信息SEI消息存在于比特流中时，SDI多视图信息标志和SDI辅助信息标志中的一个或多个等于1。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定多视图信息SEI消息包括多视图获取信息SEI消息，并且其中多视图获取信息SEI消息不是可缩放嵌套的。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定比特流中的并且有效载荷类型等于179的SEI消息被约束不被包括在可缩放嵌套SEI消息中。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定比特流中的并且具有等于3、133、179、180或205的有效载荷类型的SEI消息被约束不被包括在可缩放嵌套SEI消息中。

第二方面涉及一种用于处理视频数据的装置，包括处理器和其上具有指令的非暂时性存储器，其中指令在由处理器执行时使得处理器：使用可缩放性维度信息(SDI)补充增强信息(SEI)消息来指示SDI视图标识符长度减去L语法元素；和基于SDI SEI消息在视频媒体文件和比特流之间进行转换。

第三方面涉及一种非暂时性计算机可读介质，包括供编解码装置使用的计算机程序产品，计算机程序产品包括存储在非暂时性计算机可读介质上的计算机可执行指令，计算机可执行指令在由一个或多个处理器执行时使得编解码装置：使用可缩放性维度信息(SDI)补充增强信息(SEI)消息来指示SDI视图标识符长度减去L语法元素；和基于SDI SEI消息在视频媒体文件和比特流之间进行转换。

第四方面涉及一种存储指令的非暂时性计算机可读存储介质，指令使得处理器：使用可缩放性维度信息(SDI)补充增强信息(SEI)消息来指示SDI视图标识符长度减去L语法元素；和基于SDI SEI消息在视频媒体文件和比特流之间进行转换。

第五方面涉及一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质，其中方法包括：使用可缩放性维度信息(SDI)补充增强信息(SEI)消息来指示SDI视图标识符长度减去L语法元素；和基于SDI SEI消息在视频媒体文件和比特流之间进行转换。

第六方面涉及一种用于存储视频的比特流的方法，包括：使用可缩放性维度信息(SDI)补充增强信息(SEI)消息来指示SDI视图标识符长度减去L语法元素；基于SDI SEI消息生成比特流；和将比特流存储在非暂时性计算机可读记录介质中。

为清晰起见，任何一个前述实施例可与任何一个或多个其他前述实施例组合，以在本公开的范围内形成新的实施例。

从以下结合附图和权利要求的详细说明中，可更清楚地理解这些和其他特征。

附图说明

为了更全面地理解本公开内容，现结合附图和详细说明参考以下简要说明，其中相同的参考数字代表相同的部件。

图1图示了用于空域可缩放性的多层编解码的示例。

图2图示了使用输出层集(OLS)的多层编解码的示例。

图3图示了视频比特流的实施例。

图4是显示示例视频处理系统的框图。

图5是视频处理装置的框图。

图6是图示示例视频编解码系统的框图。

图7是图示视频编码器的示例的框图。

图8是图示视频解码器的示例的框图。

图9是根据本公开的实施例的编解码视频数据方法。

具体实施方式

首先应理解，尽管下文提供了一个或多个实施例的说明性实现方式，但可使用任何数量的技术实现所公开的系统和/或方法，无论是当前已知的还是现有的。本公开不应以任何方式限于以下示出的示例性实现方式、附图和技术，包括在此示出和描述的示例性设计和实现方式，而是可以在所附权利要求及其等同物的全部范围内进行修改。

视频编解码标准主要通过著名的国际电信联盟-电信(ITU-T)和国际标准化组织(ISO)/国际电工委员会(IEC)标准的发展而演变。ITU-T制定了H.261和H.263，ISO/IEC制定了运动图片专家组(MPEG)-1和MPEG-4视频，并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(AVC)和H.265/高效视频编解码(HEVC)标准。参见ITU-T和ISO/IEC，“高效视频编解码”，Rec.ITU-T H.265|ISO/IEC 23008-2(现行版本)。自H.262以来，视频编解码标准基于混合视频编解码结构，其中利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术，视频编解码专家组(VCEG)和MPEG于2015年联合成立了联合视频探索团队(JVET)。此后，JVET采用了许多新方法，并将其输入到名为联合探索模型(JEM)的参考软件中。参见J.Chen，E.Alshina，G.J.Sullivan，J.-R.Ohm，J.Boyce，“联合探索测试模型7(JEM7)的算法描述”，JVET-G1001，2017年8月。当多功能视频编解码(VVC)项目正式启动时，JVET后来更名为联合视频专家团队(JVET)。VVC是新的编解码标准，目标是与HEVC相比降低50％比特率，该标准已由JVET在2020年7月1日结束的第19次会议上最终确定。参见Rec.ITU-T H.266|ISO/IEC 23090-3，“多功能视频编解码”，2020年。

VVC标准(ITU-T H.266|ISO/IEC 23090-3)和相关的多功能补充增强信息(VSEI)标准(ITU-T H.274|ISO/IEC 23002-7)已被设计用于最广泛的应用，包括传统用途(诸如电视广播、视频会议或从存储介质回放)，以及更新和更先进的使用情况(诸如自适应比特率流、视频区域提取、来自多个编解码视频比特流的内容的合成和merging、多视图视频、可缩放分层编解码和视口自适应360°沉浸式媒体)。参见B.Bross，J.Chen，S.Liu，Y.-K.Wang(编辑)，“多功能视频编解码(草案10)”，JVET-S2001，Rec.ITU-T Rec.H.274|ISO/IEC 23002-7，“用于编解码视频比特流的多功能补充增强信息消息”，2020，以及J.Boyce，V.Drugeon，G.Sullivan，Y.-K.Wang(编辑)，“用于编解码视频比特流的多功能补充增强信息消息(草案5)”，JVET-S2007。

基本视频编解码(EVC)标准(ISO/IEC 23094-1)是最近由MPEG开发的另一种视频编解码标准。

图1是图示基于层的预测100的示例的示意图。基于层的预测100与单向帧间预测和/或双向帧间预测兼容，但是也在不同层中的图片之间执行。

基于层的预测100应用于不同层中的图片111、112、113和114与图片115、116、117和118之间。在所示的示例中，图片111、112、113和114是层N+1 132的一部分，并且图片115、116、117和118是层N 131的一部分。诸如层N 131和/或层N+1 132的层是一组图片，它们都与相似的特性值相关联，诸如相似的尺寸、质量、分辨率、信噪比、容量等。在所示的示例中，层N+1 132与比层N 131更大的图片尺寸相关联。因此，在该示例中，层N+1 132中的图片111、112、113和114比层N 131中的图片115、116、117和118具有更大的图片尺寸(例如，更大的高度和宽度，因此有更多的样点)。然而，这样的图片可以通过其他特征在层N+1 132和层N 131之间被分开。虽然仅示出了两层，层N+1 132和层N 131，但是一组图片可以基于相关联的特性被分成任意数量的层。层N+1 132和层N 131也可以由层ID来表示。层ID是与图片相关联的数据项，并且表示该图片是所指示的层的一部分。因此，每个图片111-118可以与对应的层ID相关联，以指示哪个层N+1 132或层N 131包括对应的图片。

不同层131-132中的图片111-118配置为交替显示。这样，不同层131-132中的图片111-118可以共享相同的时域标识符(ID)，并且可以被包括在相同的访问单元(AU)106中。如这里所使用的，AU是与用于从解码图片缓冲器(DPB)输出的相同显示时间相关联的一个或多个编解码图片的集合。例如，如果需要较小的图片，解码器可以在当前显示时间解码并显示图片115，或者如果需要较大的图片，解码器可以在当前显示时间解码并显示图片111。这样，较高层N+1 132处的图片111-114包含与较低层N 131处的对应图片115-118基本相同的图像数据(尽管图片尺寸不同)。具体地，图片111包含与图片115基本相同的图像数据，图片112包含与图片116基本相同的图像数据，等等。

图片111-118可通过参考相同层N 131或N+1 132中的其他图片111-118进行编解码。参考相同层中的另一个图片对图片进行编解码导致帧间预测123，其兼容单向帧间预测和/或双向帧间预测。帧间预测123由实线箭头描绘。例如，图片113可以通过使用层N+1 132中的图片111、112和/或114中的一个或两个作为参考采用帧间预测123来编解码，其中一个图片被参考用于单向帧间预测和/或两个图片被参考用于双向帧间预测。此外，图片117可通过使用层N 131中的图片115、116和/或118中的一个或两个作为参考采用帧间预测123来编解码，其中一个图片被参考用于单向帧间预测和/或两个图片被参考用于双向帧间预测。当执行帧间预测123时，当图片被用作相同层中的另一个图片的参考时，该图片可以被称为参考图片。例如，图片112可为用于根据帧间预测123对图片113进行编解码的参考图片。在多层上下文中，帧间预测123也可以被称为层内预测。这样，帧间预测123是通过参考与当前图片不同的参考图片中的指示样点对当前图片的样点进行编解码的机制，其中参考图片和当前图片在相同层中。

图片111-118也可通过参考不同层中的其他图片111-118进行编解码。这个过程被称为层间预测121，并由虚线箭头表示。层间预测121是通过参考参考图片中的指示样点来编解码当前图片的样点的机制，其中当前图片和参考图片在不同的层中，因此具有不同的层ID。例如，较低层N 131中的图片可以用作参考图片，以对较高层N+1 132中的对应图片进行编解码。作为具体示例，可以根据层间预测121参考图片115对图片111进行编解码。在这种情况下，图片115被用作层间参考图片。层间参考图片是用于层间预测121的参考图片。在大多数情况下，层间预测121受到约束，使得当前图片(例如图片111)只能使用包括在相同AU 106中并且位于较低层的(多个)层间参考图片(例如图片115)。当多个层(例如，多于两个)可用时，层间预测121可以基于比当前图片更低的级别的多个层间参考图片来编码/解码当前图片。

视频编码器可采用基于层的预测100，以经由帧间预测123和层间预测121的多种不同组合和/或排列对图片111-118进行编码。例如，图片115可以根据帧内预测来编解码。然后，通过使用图片115作为参考图片，可以根据帧间预测123对图片116-118进行编解码。此外，可以通过使用图片115作为层间参考图片，根据层间预测121对图片111进行编解码。然后，通过使用图片111作为参考图片，可以根据帧间预测123对图片112-114进行编解码。这样，对于不同的编解码机制，参考图片可以用作单层参考图片和层间参考图片。通过基于较低层N 131图片对较高层N+1 132图片进行编解码，较高层N+1 132可以避免采用帧内预测，帧内预测具有比帧间预测123和层间预测121低得多的编解码效率。这样，帧内预测的低编解码效率可以被限制到最小/最低质量的图片，并且因此被限制到编解码最少量的视频数据。用作参考图片和/或层间参考图片的图片可以在参考图片列表结构中包含的(多个)参考图片列表的条目中指示。

图1中的每个AU 106可包含若干图片。例如，一个AU 106可以包含图片111和115。另一个AU 106可以包含图片112和116。实际上，每个AU 106是与用于从解码图片缓冲器(DPB)输出的相同显示时间(例如，相同的时域ID)相关联的一个或多个编解码图片的集合(例如，用于向用户显示)。每个访问单元定界符(AUD)108是用于指示AU(例如，AU 108)的开始或AU之间的边界的指示符或数据结构。

先前的H.26x视频编解码系列已在与单层编解码的(多个)档次分开的(多个)档次中提供了对可缩放性的支持。可缩放视频编解码(SVC)是AVC/H.264的可缩放扩展，提供对空域、时域和质量可缩放性的支持。对于SVC，在增强层(EL)图片中的每个宏块(MB)中信令通知标志，以指示EL MB是否是使用来自较低层的并置块预测的。来自并置块的预测可以包括纹理、运动矢量和/或编解码模式。SVC的实现方式不能在其设计中直接重用未经修改的H.264/AVC实现方式。SVC EL宏块语法和解码过程不同于H.264/AVC语法和解码过程。

可缩放HEVC(SHVC)是HEVC/H.265标准的扩展，提供对空域和质量可缩放性的支持，多视图HEVC(MV-HEVC)是HEVC/H.265的扩展，提供对多视图可缩放性的支持，并且3DHEVC(3D-HEVC)是HEVC/H.264的扩展，提供对三维(3D)视频编解码的支持，其比MV-HEVC更先进且更有效。注意，时域可缩放性被包括作为单层HEVC编解码器的组成部分。HEVC的多层扩展的设计采用了这样的思想，其中用于层间预测的解码图片仅来自相同的AU，并且被视为长期参考图片(LTRP)，并且与当前层中的其他时域参考图片一起被分配(多个)参考图片列表中的参考索引。通过设置参考索引的值以参考(多个)参考图片列表中的(多个)层间参考图片，在预测单元(PU)级别实现层间预测(ILP)。

值得注意的是，参考图片重采样和空域可缩放性特征均要求对参考图片或其一部分进行重采样。参考图片重采样(RPR)可以在图片级别或编解码块级别实现。然而，当RPR被称为编解码特征时，它是用于单层编解码的特征。即便如此，从编解码器设计的角度来看，对于单层编解码的RPR特征和多层编解码的空域可缩放性特征两者，使用相同的重采样滤波器是可能的或者甚至是优选的。

图2图示了利用输出层集(OLS)的基于层的预测200的示例。基于层的预测100与单向帧间预测和/或双向帧间预测兼容，但是也在不同层中的图片之间执行。图2的基于层的预测类似于图1的预测。因此，为了简洁起见，不再重复对基于层的预测的完整描述。

图2的编解码视频序列(CVS)290中的一些层包含在OLS中。OLS是层集，其中一个或多个层被规定为输出层。输出层是输出的OLS的层。图2描绘了三种不同的OLS，即OLS 1、OLS2和OLS 3。如图所示，OLS 1包括层N 231和层N+1 232。层N 231包括图片215、216、217和218，并且层N+1 232包括图片211、212、213和214。OLS 2包括层N 231、层N+1 232、层N+2233和层N+3 234。层N+2 233包括图片241、242、243和244，并且层N+3 234包括图片251、252、253和254。OLS 3包括层N 231、层N+1 232和层N+2 233。尽管示出了三个OLS，但是在实际应用中可以使用不同数量的OLS。在所图示的实施例中，没有一个OLS包括层N+4 235，其包含图片261、262、263和264。

每个不同的OLS可包含任意数量的层。生成不同的OLS是为了适应具有不同编解码能力的各种不同设备的编解码能力。例如，仅包含两层的OLS 1可以被生成以适应具有相对有限编解码能力的移动电话。另一方面，包含四层的OLS 2可以被生成以适应大屏幕电视，其能够解码比移动电话更高层。包含三层的OLS 3可以被生成以适应个人计算机、膝上型计算机或平板计算机，其可以解码比移动电话更高层，但是不能解码像大屏幕电视那样的最高层。

图2中的层可全部相互独立。也就是说，可以在不使用层间预测(ILP)的情况下对每层进行编解码。在这种情况下，这些层被称为联播层。图2中的一个或多个层也可以使用ILP来编解码。可以通过视频参数集(VPS)中的标志来信令通知这些层是联播层还是使用ILP对一些层进行编解码。当一些层使用ILP时，层之间的层依赖关系也在VPS中信令通知。

在实施例中，当层为联播层时，仅选择一层进行解码和输出。在实施例中，当一些层使用ILP时，所有层(例如，整个比特流)被规定为要被解码，并且这些层中的某些层被规定为输出层。例如，(多个)输出层可以是1)仅最高层，2)所有层，或3)最高层加上指示的较低层的集合。例如，当最高层加上指示的较低层的集合被VPS中的标志规定用于输出时，来自OLS 2的层N+3 234(是最高层)和层N 231和N+1 232(是较低层)被输出。

图2中的一些层可称为主要层，而其他层可称为辅助层。例如，层N 231和层N+1232可以被称为主要层，并且层N+2 233和层N+3 234可以被称为辅助层。辅助层可以被称为α辅助层或深度辅助层。当辅助信息存在于比特流中时，主要层可以与辅助层相关联。

不幸的是，现有标准存在缺陷。1.目前语法元素sdi_view_id_len编解码为u(4)，并且该值要求在0到15(包括端值)的范围内。该值规定sdi_view_id_val[i]语法元素的比特长度，规定比特流中第i层的视图ID。然而，sdi_view_id_val[i]的长度不应等于0，尽管这在当前是允许的。

2.当比特流中存在一些辅助信息时，例如，如SDI SEI消息(也称为可缩放性维度SEI消息)以及深度表示信息SEI消息或α通道信息SEI消息所指示的，不知道辅助信息应用于哪个非辅助层或主要层。

3.如果比特流中不存在可缩放性维度信息SEI消息，则比特流中存在多视图获取信息SEI消息、深度表示信息SEI消息或α通道信息SEI消息是没有意义的。

4.多视图获取信息SEI消息包含比特流中存在的所有视图的信息。因此，在当前允许的情况下，对它进行可缩放嵌套是没有意义的。

本文公开了解决一个或多个前述问题的技术。例如，本公开提供了使用可缩放性维度信息(SDI)视图标识符长度减L语法元素来防止规定比特流中第i层的视图标识符的SDI视图ID值语法元素的长度为零的技术。所公开的方面/实施例进一步提供当SDI消息不存在于比特流中时防止比特流具有多视图获取信息补充增强信息(SEI)消息或辅助信息SEI消息的技术。所公开的方面/实施例还提供了防止多视图获取信息SEI消息被可缩放嵌套的技术。

图3图示了视频比特流300的实施例。如这里所使用的，视频比特流300也可以被称为编解码视频比特流、比特流或其变体。如图3所示，比特流300包括以下一个或多个：解码能力信息(DCI)302、视频参数集(VPS)304、序列参数集(SPS)306、图片参数集(PPS)308、图片标头(PH)312、图片314和SEI消息322。DCI 302、VPS 304、SPS 306和PPS 308中的每一个可以统称为参数集。在实施例中，图3中未示出的其他参数集也可以被包括在比特流300中，例如自适应参数集(APS)，其是包含应用于由在条带标头中找到的零个或多个语法元素确定的零个或多个条带的语法元素的语法结构。

DCI 302，也可称为解码参数集(DPS)或解码器参数集，是包含应用于整个比特流的语法元素的语法结构。DCI 302包括在视频比特流(例如，比特流300)的生命周期内保持不变的参数，其可以转化为会话的生命周期。DCI 302可以包括档次、级别和子档次信息，以确定保证永远不会超过的最大复杂度互操作点，即使视频序列的拼接发生在会话中。它还可选地包括约束标志，该约束标志指示视频比特流将被那些标志的值所指示的某些特征的使用所约束。这样，比特流可以被标记为不使用某些工具，这尤其允许解码器实现中的资源分配。像所有参数集一样，DCI 302在第一次被参考时存在，并且被视频序列中的第一图片参考，这意味着它必须在比特流中的第一网络抽象层(NAL)单元之间发送。虽然比特流中可以有多个DCI 302，但是其中的语法元素的值在被参考时不能不一致。

VPS 304包括用于增强层的参考图片集构建的解码依赖性或信息。VPS 304提供了可缩放序列的整体视图或视图，包括提供了什么类型的操作点、操作点的档次、层次和级别，以及可以用作会话协商和内容选择的基础的比特流的一些其他高级属性等。

在实施例中，当指示某些层使用ILP时，VPS 304指示VPS规定的OLS总数等于层数，指示第i个OLS包括层索引从0到i(包括端值)的层，并指示对于每个OLS，仅输出OLS中的最高层。

SPS 306包含图片序列(SOP)中所有图片共有的数据。SPS 306是包含应用于零个或多个完整CLVS的语法元素的语法结构，如由在PPS中找到的语法元素的内容所确定的，PPS由在每个图片标头中找到的语法元素所参考。相比之下，PPS 308包含整个图片共有的数据。PPS 308是包含应用于零个或多个完整编解码图片的语法元素的语法结构，如在每个图片标头(例如，PH 312)中找到的语法元素所确定的。

DCI 302、VPS 304、SPS 306和PPS 308包含在不同类型的网络抽象层(NAL)单元中。NAL单元是包含要跟随的数据类型的指示(例如，编解码的视频数据)的语法结构。NAL单元被分类为视频编解码层(VCL)和非VCL NAL单元。VCL NAL单元包含表示视频图片中样点的值的数据，而非VCL NAL单元包含任何相关的附加信息，例如参数集(可以应用于多个VCLNAL单元的重要数据)和补充增强信息(定时信息和其他补充数据，其可以增强解码视频信令的可用性，但是对于解码视频图片中的样点值不是必需的)。

在实施例中，DCI 302包含在指定为DCI NAL单元或DPS NAL单元的非VCL NAL单元中。也就是说，DCI NAL单元具有DCI NAL单元类型(NUT),而DPS NAL单元具有DPS NUT。在实施例中，VPS 304包含在被指定为VPS NAL单元的非VCL NAL单元中。因此，VPS NAL单元有VPS NUT。在实施例中，SPS 306是被指定为SPS NAL单元的非VCL NAL单元。因此，SPS NAL单元有SPS NUT。在实施例中，PPS 308包含在被指定为PPS NAL单元的非VCL NAL单元中。因此，PPS NAL单元有PPS NUT。

PH 312是包含应用于编解码图片(例如，图片314)的所有条带(例如，条带318)的语法元素的语法结构。在实施例中，PH 312是指定为PH NAL单元的非VCL NAL单元类型。因此，PH NAL单元具有PH NUT(例如，PH_NUT)。

在实施例中，与PH 312相关的PH NAL单元具有时域ID和层ID。时域ID标识符指示PH NAL单元相对于比特流(例如，比特流300)中其他PH NAL单元的时间位置。层ID指示包含PH NAL单元的层(例如，层131或层132)。在实施例中，时域ID类似于但不同于图片顺序计数(POC)。POC按顺序唯一地标识每个图片。在单层比特流中，时域ID和POC将是相同的。在多层比特流中(例如，参见图1)，相同AU中的图片将具有不同的POC，但是具有相同的时域ID。

在实施例中，PH NAL单元位于包含相关图片314的第一条带318的VCL NAL单元之前。这建立了PH 312和与PH 312相关联的图片314的条带318之间的关联，而不需要具有在PH 312中信令通知的并从条带标头320中被参考的图片标头ID。因此，可以推断两个PH 312之间的所有VCL NAL单元属于相同图片314，并且图片314与两个PH 312之间的第一PH 312相关联。在实施例中，跟随PH 312的第一VCL NAL单元包含与PH 312相关联的图片314的第一条带318。

在实施例中，PH NAL单元遵循图片级别参数集(例如，PPS)或更高级别参数集，例如DCI(又名，DPS)、VPS、SPS、PPS等，具有分别小于PH NAL单元的时域ID和层ID的时域ID和层ID两者。因此，这些参数集不会在图片或访问单元内重复。由于这种排序，PH 312可以立即得到解决。也就是说，包含与整个图片相关的参数的参数集位于比特流中的PH NAL单元之前。任何包含图片部分参数的内容都位于PH NAL单元之后。

在一个备选中，PH NAL单元遵循图片级别参数集和前缀补充增强信息(SEI)消息，或更高级别参数集，例如DCI(也称为DPS)、VPS、SPS、PPS、APS、SEI消息等。

图片314为单色格式的亮度样点的阵列或4：2：0、4：2：2和4：4：4颜色格式的亮度的样点阵列和两个对应的色度样点的阵列。

图片314可以是帧或场。然而，在一个CVS 316中，或者所有图片314都是帧，或者所有图片314都是场。CVS 316是视频比特流300中每个编解码层视频序列(CLVS)的编解码视频序列。值得注意的是，当视频比特流300包括单层时，CVS 316和CLVS是相同的。CVS 316和CLVS仅在视频比特流300包括多个层时不同(例如，如图1和2所示)。

每个图片314包含一个或多个条带318。条带318是图片(例如，图片314)的片内的整数个完整片或整数个连续完整编解码树单元(CTU)行。每个条带318被排他地包含在单个NAL单元(例如，VCL·NAL单元)中。片(未示出)是图片(例如，图片314)中特定片列和特定片行内的CTU的矩形区域。CTU(未示出)是亮度样点的编解码树块(CTB)、具有三个样点阵列的图片的色度样点的两个对应CTB、或者单色图片或者使用三个单独的颜色平面和用于编解码样点的语法结构进行编解码的图片的样点的CTB。CTB(未示出)是对于某个N值的N×N样点块，使得将分量划分为CTB是一种分割。块(未示出)是样点(例如，像素)的MxN(M列乘N行)阵列，或者变换系数的MxN阵列。

在实施例中，每个条带318包含条带标头320。条带标头320是编解码条带318的一部分，其含有与条带318中所表示的片内的所有条带或CTU行相关的数据元素。也就是说，条带标头320包含关于条带318的信息，例如条带类型、将使用哪个参考图片等等。

图片314及其条带318包括与正在编码或解码的图片或视频相关的数据。因此，图片314及其条带318可以被简单地称为比特流300中携带的有效负载或数据。

比特流300还包含一个或多个SEI消息，例如SEI消息322、SEI消息326和SEI消息328。SEI消息包含补充增强信息。SEI消息可以包含各种类型的数据，这些数据指示视频图片的定时，或者描述编解码视频的各种属性，或者如何使用或增强编解码视频。SEI消息也被定义为可以包含任意用户定义的数据。SEI消息不影响核心解码过程，但可以指示建议如何对视频进行后处理或显示。视频内容的一些其他高级属性在视频可用性信息(VUI)中传达，例如用于解释视频内容的颜色空间的指示。随着新的颜色空间的开发，例如高动态范围和宽色域视频，已经添加了附加的VUI标识符来指示它们。

在实施例中，SEI消息322可为SDI SEI消息。当辅助信息存在于比特流中时，SDISEI消息可以用于指示哪些主要层与辅助层相关联。例如，SDI SEI消息可以包括一个或多个语法元素324，以指示当辅助信息存在于比特流中时哪些主要层与辅助层相关联。下面提供了对各种SEI消息和那些SEI消息中包含的语法元素的讨论。

在实施例中，SEI消息326为多视图信息SEI消息，例如多视图获取信息SEI消息。当存在于比特流300中时，多视图信息SEI消息包括一个或多个语法元素324，其规定获取环境的各种参数，例如内部和外部相机参数。这些参数对于视图扭曲和插值非常有用。

在实施例中，SEI消息328可为辅助信息SEI消息，例如深度表示信息SEI消息或α通道信息SEI消息。当存在于比特流300中时，深度表示信息SEI消息包括一个或多个语法元素324，其规定深度视图的各种深度表示，以便在三维(3D)显示器上呈现之前处理解码的纹理和深度视图分量，诸如视图合成。为了随机访问的目的，SEI消息可以与瞬时解码器刷新(IDR)访问单元相关联。当存在于比特流300中时，α通道信息SEI消息包括一个或多个语法元素324，该一个或多个语法元素324提供关于α通道样点值和应用于解码的α平面辅助图片以及一个或多个相关联的主要图片的后处理的信息。混合是将两个图像组合成单个图像的过程。要混合的图像与被标识为α平面的辅助图像相关联。α通道信息SEI消息可以用于规定如何将要混合的图像的像素值转换成包括解释值的另一个图像。

本领域技术人员将意识到，在实际应用中，比特流300可包含其他参数和信息。

为解决上述问题，公开了总结如下的方法。这些技术应该被认为是解释一般概念的示例，而不应该以狭隘的方式来解释。此外，这些技术可以单独应用或以任何方式组合应用。

示例1

1)为解决问题1，在一个示例中，代替例如通过语法元素sdi_view_id_len信令通知视图ID语法元素的长度，例如通过语法元素sdi_view_id_len_minusL信令通知长度减去L(例如L＝1)的值。

a.此外，在一个示例中，可使用N位将语法元素编解码为无符号整数。

i.在一个示例中，N可等于4。

ii.或者，语法可被编解码为使用N位的固定模式位串、或使用N位的带符号整数、或截断二进制、或带符号整数K阶(例如，K＝0)指数哥伦布编解码的语法元素、或无符号整数M阶(例如，M＝0)指数哥伦布编解码的语法元素。

b.在一个示例中，或者，仍通过例如语法元素sdi_view_id_len信令通知长度，但约束语法元素的值不应等于0。

示例2

2)为解决问题2，建议将辅助层(即，对应sdi_aux_id[i]等于1或2的层)应用于一个或多个关联层。

a.在一个示例中，可在可缩放性维度信息SEI消息中信令通知指示每个辅助层的关联层的一个或多个语法元素。

i.在一个示例中，关联层由层ID规定。

ii.在另一示例中，相关联的层由层索引规定。

iii.在另一示例中，辅助层是否被应用于一个或多个关联层的指示可以由关联层的一个或多个语法元素来规定。

1.在一个示例中，语法元素可用于指示辅助层是否应用于所有相关联的层。

2.在一个示例中，语法元素可用于指示辅助层是否被应用于特定的关联层。

a.在一个示例中，一个或多个主要层由语法元素指示。

i.在一个示例中，所有主要层可由语法元素指示。

ii.在一个示例中，语法元素可以仅指示层索引小于辅助层的层索引的主要层。

iii.在一个示例中，语法元素可以仅指示层索引大于辅助层的层索引的主要层。

b.在一个示例中，语法元素被编解码为标志。

b.或者，建议可在未显式信令通知的情况下，导出每个辅助层的相关一层或多层。

i.在一个示例中，每个辅助层的关联层可为nuh_layer_id分别等于辅助层的nuh_layer_id加上N1、N2和Nk的层，其中k为整数，并且对于在1到k(包括端值)的范围内的任意i,j(i！＝j)，Ni！＝Nj。

1.在一个示例中，k等于1，并且N1可以等于1、2或-1或-2。

a.在一个示例中，k等于2，并且N1＝1，N2＝2。

ii.在一个示例中，每个辅助层的关联层可以是层索引分别等于辅助层的层索引加上N1、N2和Nk的层，其中k是整数，并且对于在1到k(包括端值)的范围内的任意i,j(i！＝j)，Ni！＝Nj。

1.在一个示例中，k等于1，并且N1可以等于1、或2、或-1、或-2。

2.在一个示例中，k大于1。

a.在一个示例中，k等于2，并且N1＝1，N2＝2。

c.或者，每个辅助层的关联层的指示可作为可缩放性维度信息SEI消息中的一个或一组语法元素显式信令通知。

d.或者，辅助信息SEI消息(例如，深度表示信息或α通道信息)的关联层的指示可由辅助信息SEI消息中的一个或多个语法元素显式信令通知。

i.在一个示例中，辅助信息SEI消息可指深度表示信息SEI消息或α通道信息SEI消息。

ii.在一个示例中，一个或多个语法元素可以指示相关联的层的层ID值。

1.在一个示例中，由语法元素指示的层ID可能需要小于或等于最大层ID值，即vps_layer_id[vps_max_layers_minus1]或vps_layer_id[sdi_max_layers_minus1]。

iii.在一个示例中，一个或多个语法元素可以指示关联层的层索引值。

1.在一个示例中，由语法元素指示的层索引可能需要小于比特流中的最大层数(例如，sdi_max_layers_minus1加1或vps_max_layers_minus1加1)。

iv.在一个示例中，可以信令通知一个或多个层是否与辅助层相关联的指示。

1.在一个示例中，一个语法元素可用于规定辅助信息SEI消息是否应用于所有层。

a.在一个示例中，auxiliary_all_layer_flag等于X(X为1或0)可规定辅助信息SEI消息应用于所有相关的主要层。

2.在一个示例中，一个或多个语法元素可用于规定辅助信息SEI消息是否被应用于一个或多个层。

a.在一个示例中，N个语法元素可用于规定辅助信息SEI消息是否应用于N层，其中每个语法元素用于每层。

i.在一个示例中，可使用1位将语法元素编解码为标志。

b.在一个示例中，一个语法元素可用于规定辅助信息SEI消息是否应用于一个或多个层。

i.在一个示例中，语法元素可以是第K个(例如，K＝0)指数哥伦布编解码的。

ii.在一个示例中，语法元素等于5规定辅助信息SEI消息被应用于第0层和第2层，但不应用于第1层。

1.或者，将N表示为层数。语法元素等于5规定辅助信息SEI消息应用于第(N-1)层和第(N-3)层，但不应用于第(N-2)层。

c.可有条件地信令通知上述语法元素，例如，仅当辅助信息SEI消息未应用于所有层时，

e.在一个示例中，可在比特流中信令通知一层的辅助图片的关联层数的指示。

f.在一个示例中，可使用使用N位的无符号整数、或使用N位的固定模式位串、或使用N位的有符号整数、或截断二进制、或有符号整数K阶(例如，K＝0)指数哥伦布编解码的语法元素、或无符号整数M阶(例如，M＝0)指数哥伦布编解码的语法元素来信令通知上述语法元素。

g.在一个示例中，可有条件地信令通知辅助图片的关联层数和/或辅助图片的关联层数的指示，例如，仅当bitstreamInScope中的第i层包含辅助图片时(例如，sdi_aux_id[i]>0)。bitstreamInScope(也称为范围内的比特流)被定义为AU序列，该AU序列按照解码顺序包括包含所述SDI SEI消息的初始AU和随后的零个或多个后续AU，该零个或多个后续AU直到但不包括包含另一SDI SEI消息的任何后续AU。

示例3

3)为解决问题3，添加了比特流一致性要求，即多视图或辅助信息SEI消息不应存在于不具有可缩放性维度信息SEI消息的CVS中。

b.此外，辅助信息SEI消息可指深度表示信息SEI消息或α通道信息SEI消息。

c.或者，添加比特流一致性的要求，即当多视图或辅助信息SEI消息存在于比特流中时，要求可缩放维度信息SEI消息的sdi_multiview_info_flag和sdi_auxiliary_info_flag中的至少一个等于1。

示例4

4)为解决问题4，在一个示例中，添加了比特流一致性要求，即多视图获取信息SEI消息不应是可缩放嵌套的。

a.或者，规定payloadType等于179(多视图获取)的SEI消息不应包含在可缩放嵌套SEI消息中。

以下为上文总结的一些示例的一些示例实施例。每个实施例都可以应用于VVC。大多数已被添加或修改的相关部分用粗斜体表示，而一些被删除的部分用斜体表示。可能还有其他一些编辑性的改动，因此没有突出显示。

下述每个可缩放性维度SEI消息语法包括一个或多个语法元素。语法元素可以是例如在此公开的可缩放性维度SEI消息语法中包括的一个或多个值、标志、变量、短语、指示、索引、映射、数据元素或其组合。在实施例中，语法元素可以被组织成一组值、标志、变量、短语、指示、索引、映射和/或数据元素。

实施例1

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

可缩放性维度SEI消息为bitstreamInScope(定义如下)中的每层提供可缩放性维度信息，例如1)当bitstreamInScope可能是多视图比特流时，每层的视图ID；以及2)当bitstreamInScope中可能有一层或多层携带的辅助信息(如深度或alpha)时，每层的辅助ID。

bitstreamInScope是AU序列，该AU序列按照解码顺序包括包含所述SDI SEI消息的初始AU和随后的零个或多个后续AU，该零个或多个后续AU直到但不包括包含另一SDISEI消息的任何后续AU。

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_multiview_info_flag等于1指示bitstreamInScope可能是多视图比特流，并且sdi_view_id_val[]语法元素存在于可缩放性维度SEI消息中。sdi_multiview_flag等于0指示bitstreamInScope不是多视图比特流，并且sdi_view_id_val[]语法元素不存在于可缩放性维度SEI消息中。

sdi_auxiliary_info_flag等于1指示可能存在由bitstreamInScope中的一个或多个层携带的辅助信息，并且sdi_aux_id[]语法元素存在于可缩放性维度SEI消息中。sdi_auxiliary_info_flag等于0指示在bitstreamInScope中没有由一个或多个层携带的辅助信息，并且sdi_aux_id[]语法元素不存在于可缩放性维度SEI消息中。

规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

对于符合此规范的此版本的比特流，sdi_aux_id[i]应在0至2(包括端值)或128至159(包括端值)的范围内。虽然sdi_aux_id[i]的值应在0至2(包括端值)或128至159(包括端值)的范围内，但在此规范的此版本中，解码器应允许sdi_aux_id[i]的值在0至255(包括端值)的范围内。

实施例2

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

指示bitstreamInScope中的最大层数。

规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi aux id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例3

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度(以比特为单位)。

规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例4

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi aux id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例5

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例6

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例7

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例8

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例9

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例10

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例11

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例12

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

注1–α辅助层或深度辅助层适用于其相关的非辅助层的主要层。

表1–sdi_aux_id[i]到辅助图片类型的映射

注1-通过sdi_aux_id值之外的方式规定与128至159(包括端值)的范围内的sdi_aux_id相关联的辅助图片的解释。

实施例13

深度表示信息SEI消息

深度表示信息SEI消息语法

深度表示信息SEI消息语义

深度表示信息SEI消息中的语法元素规定用于类型AUX_DEPTH的辅助图片的各种参数，以便在3D显示器上呈现之前处理解码的主要图片和辅助图片，例如视图合成。具体地，规定深度图片的深度或视差范围。

当存在时，深度表示信息SEI消息应与sdi_aux_id值等于AUX_DEPTH的一个或多个层相关联。以下语义分别应用于深度表示信息SEI消息所应用的nuh_layer_id值中的每个nuh_layer_id targetLayerId。

当存在时，深度表示信息SEI消息可包含在任何访问单元中。建议当存在时，出于随机访问的目的，将SEI消息包括在访问单元中，在该访问单元中，nuh_layer_id等于targetLayerId的编解码图片是帧内随机访问图片(IRAP)图片。

对于sdi_aux_id[targetLayerId]等于AUX_DEPTH的辅助图片，对于在0至2(包括端值)和4至15(包括端值)的范围内的所有j值，相关联的主要图片(如果有的话)是相同访问单元中sdi_aux_id[nuhLayerIdB]等于0的图片，使得ScalabilityId[LayerIdxInVps[targetLayerId]][j]等于ScalabilityId[LayerIdxInVps[nuhLayerIdB]][j]。

SEI消息中指示的信息适用于从包含SEI消息的访问单元开始的nuh_layer_id等于targetLayerId的所有图片，直至但不包括下一个图片，按照解码顺序，与适用于targetLayerId的深度表示信息SEI消息相关联，或直至nuh_layer_id等于targetLayerId的CLVS的末端，以解码顺序中较早者为准。

z_near_flag等于0规定语法结构中不存在规定最近深度值的语法元素。z_near_flag等于1规定语法结构中存在规定最近深度值的语法元素。

z_far_flag等于0规定语法结构中不存在规定最远深度值的语法元素。z_far_flag等于1规定语法结构中存在规定最远深度值的语法元素。

d_min_flag等于0规定语法结构中不存在规定最小视差值的语法元素。d_min_flag等于1规定语法结构中存在规定最小视差值的语法元素。

d_max_flag等于0规定语法结构中不存在规定最大视差值的语法元素。d_max_flag等于1规定语法结构中存在规定最大视差值的语法元素。

depth_representation_type规定如表Y1中规定的辅助图片的解码亮度样点的表示定义。在表Y1中，视差规定两个纹理视图之间的水平位移，而Z值规定距相机的距离。

变量maxVal被设置为等于(1<<(8+sps_bitdepth_minus8))-1，其中sps_bitdepth_minus8是包含在nuh_layer_id等于targetLayerId的层的活动SPS中或为其推断的值。

表Y1–depth_representation_type的定义

disparity_ref_view_id规定了导出视差值所依据的ViewId值。

注1-仅当d_min_flag等于1或d_max_flag等于1时，disparity_ref_view_id才存在，并且对于depth_representation_type值等于1和3有用。

表Y2的x列中的变量从表Y2的s、e、n和v列中的相应变量导出，如下所示：

--如果e的值在0到127(不包括端值)的范围内，则x设置为等于(-1)

--否则(e等于0)，x设置为等于(-1)

注1-上述规范与IEC 60559：1989中的规范类似。

表Y2–深度参数变量和语法元素之间的关联

dmin和DMax值，当存在时，以编解码图片的亮度样点宽度为单位规定，其中ViewId等于辅助图片的ViewId。

当存在时，ZNear和ZFar值的单位相同，但未规定。

depth_nonlinear_representation_num_minus1加2规定用于将深度值映射到根据视差均匀量化的尺度的分段线性片段的数量。

对于范围从0到depth_nonlinear_representation_num_minus1+2(包括端值)的i的depth_nonlinear_representation_model[i]规定用于将辅助图片的解码亮度样点值映射到根据视差均匀量化的尺度的分段线性片段。depth_nonlinear_representation_model[0]和depth_nonlinear_representation_model[depth_nonlinear_representation_num_minus1+2]的值都被推断为等于0。

注2-当depth_representation_type等于3时，辅助图片包含非线性变换的深度样点。如下规定的变量DepthLUT[i]用于将解码的深度样点值从非线性表示变换为线性表示，即均匀量化的视差值。该变换的形状通过二维线性视差到非线性视差空间中的线段近似来定义。曲线的第一个(0，0)和最后一个(maxVal，maxVal)节点是预定义的。附加节点的位置以与直线曲线的偏差(depth_nonlinear_representation_model[i])的形式发送。这些偏差均匀分布在0到maxVal(包括端值)的整个范围内，其间距取决于nonlinear_depth_representation_num_minus1的值。

在0至maxVal(包括端值)的范围内的i的变量DepthLUT[i]规定如下：

当depth_representation_type等于3时，0至maxVal(包括端值)的范围内的辅助图片的所有解码亮度样点值dS的DepthLUT[dS]表示均匀量化到0至maxVal(包括端值)的范围内的视差。

语法结构规定深度表示信息SEI消息中元素的值。

语法结构设置表示浮点值的OutSign、OutExp、OutMantissa和OutManLen变量的值。当该语法结构包含在另一个语法结构中时，变量名OutSign、OutExp、OutMantissa和OutManLen将被解释为被包含该语法结构时使用的变量名称所替换。

da_sign_flag等于0指示浮点值的符号为正。da_sign_flag等于1指示符号为负。变量OutSign被设置为等于da_sign_flag。

da_exponent规定浮点值的指数。da_exponent的值应在0到2

da_mantissa_len_minus1加1规定da_mantissa语法元素中的位数。da_mantissa_len_minus1的值应在0到31(包括端值)的范围内。变量OutManLen被设置为等于da_mantissa_len_minus1+1。

da_mantissa规定浮点值的尾数。变量OutMantissa被设置为等于da_mantissa。

实施例14

深度表示信息SEI消息

深度表示信息SEI消息语法

深度表示信息SEI消息语义

当存在时，深度表示信息SEI消息可包含在任何访问单元中。建议当存在时，出于随机访问的目的，将SEI消息包括在访问单元中，在该访问单元中，nuh_layer_id等于targetLayerId的编解码图片是IRAP图片。

z_near_flag等于0规定语法结构中不存在规定最近深度值的语法元素。z_near_flag等于1规定语法结构中存在规定最近深度值的语法元素。

z_far_flag等于0规定语法结构中不存在规定最远深度值的语法元素。z_far_flag等于1规定语法结构中存在规定最远深度值的语法元素。

d_min_flag等于0规定语法结构中不存在规定最小视差值的语法元素。d_min_flag等于1规定语法结构中存在规定最小视差值的语法元素。

d_max_flag等于0规定语法结构中不存在规定最大视差值的语法元素。d_max_flag等于1规定语法结构中存在规定最大视差值的语法元素。

变量maxVal被设置为等于(1<<(8+sps_bitdepth_minus8))-1，其中sps_bitdepth_minus8是包含在nuh_layer_id等于targetLayerId的层的活动SPS中或为其推断的值。

表Y1–depth_representation_type的定义

disparity_ref_view_id规定了导出视差值所依据的ViewId值。

注1-仅当d_min_flag等于1或d_max_flag等于1时，disparity_ref_view_id才存在，并且对于depth_representation_type值等于1和3有用。

表Y2的x列中的变量从表Y2的s、e、n和v列中的相应变量导出，如下所示：

--如果e的值在0到127(不包括端值)的范围内，则x设置为等于(-1)

--否则(e等于0)，x设置为等于(-1)

注1-上述规范与IEC 60559：1989中的规范类似。

表Y2–深度参数变量和语法元素之间的关联

dmin和DMax值，当存在时，以编解码图片的亮度样点宽度为单位规定，其中ViewId等于辅助图片的ViewId。

当存在时，ZNear和ZFar值的单位相同，但未规定。

depth_nonlinear_representation_num_minus1加2规定用于将深度值映射到根据视差均匀量化的尺度的分段线性片段的数量。

在0至maxVal(包括端值)的范围内的i的变量DepthLUT[i]规定如下：

语法结构规定深度表示信息SEI消息中元素的值。

da_sign_flag等于0指示浮点值的符号为正。da_sign_flag等于1指示符号为负。变量OutSign被设置为等于da_sign_flag。

da_exponent规定浮点值的指数。da_exponent的值应在0到2

da_mantissa_len_minus1加1规定da_mantissa语法元素中的位数。da_mantissa_len_minus1的值应在0到31(包括端值)的范围内。变量OutManLen被设置为等于da_mantissa_len_minus1+1。

da_mantissa规定浮点值的尾数。变量OutMantissa被设置为等于da_mantissa。

实施例15

α通道信息SEI消息

α通道信息SEI消息语法

α通道信息SEI消息语义

α通道信息SEI消息提供关于α通道样点值和应用于在类型AUX_ALPHA的辅助图片和一个或多个相关的主要图片中编解码的解码α平面的后处理的信息。

对于nuh_layer_id等于nuhLayerIdA且sdi_aux_id[nuhLayerIdA]等于AUX_ALPHA的辅助图片，对于在0到2(包括端值)和4到15(包括端值)的范围内的所有j值，相关的主要图片(如果有的话)是相同访问单元中sdi_aux_id[nuhLayerIdB]等于0的图片，使得scalability id[LayerIdxInVps[nuhLayerIdA]][j]等于scalability id[LayerIdxInVps[nuhLayerIdB]][j]。

当访问单元包含nuh_layer_id等于nuhLayerIdA且sdi_aux_id[nuhLayerIdA]等于AUX_ALPHA的辅助图片picA时，picA的α通道样点值按输出顺序持续，直到以下一个或多个条件为真：

--按输出顺序，输出nuh_layer_id等于nuhLayerIdA的下一个图片。

--包含辅助图片picA的CLVS结束。

--比特流结束。

--nuh_layer_id等于nuhLayerIdA的辅助图片层的任何相关主要层的CLVS结束。

以下语义分别应用于α通道信息SEI消息所应用的nuh_layer_id值中的每个nuh_layer_id targetLayerId。

alpha_channel_cancel_flag等于1指示α通道信息SEI消息取消按照应用于当前层的输出顺序的任何先前α通道信息SEI消息的持续性。alpha_channel_cancel_flag等于0指示随后是α通道信息。

设currPic为α通道信息SEI消息所关联的图片。α通道信息SEI消息的语义按照输出顺序持续用于当前层，直到以下一个或多个条件为真：

--当前层的新CLVS开始。

--比特流结束。

--在调用picB的图片顺序计数的解码过程之后，立即输出访问单元中numh_layer_id等于targetLayerId的图片picB，该访问单元包含numh_layer_id等于targetLayerId的α通道信息SEI消息，其PicOrderCnt(picB)大于PicOrderCnt(currPic)，其中PicOrderCnt(picB)和PicOrderCnt(currPic)分别是picB和currPic的PicOrderCntVal值。

alpha_channel_use_idc等于0指示出于α混合目的，在从解码过程输出之后的显示过程中，应当将相关联的主要图片的解码样点乘以辅助编解码图片的解释样点值。alpha_channel_use_idc等于1指示出于α混合的目的，在从解码过程输出之后的显示过程中，相关主要图片的解码样点不应乘以辅助编解码图片的解释样点值。alpha_channel_use_idc等于2指示未规定辅助图片的使用。大于2的alpha_channel_use_idc的值保留给ITU-T|ISO/IEC将来使用。当不存在时，alpha_channel_use_idc的值被推断为等于2。

alpha_channel_bit_depth_minus8加8规定辅助图片的亮度样点阵列的样点的位深度。alpha_channel_bit_depth_minus8应在0到7(包括端值)的范围内。alpha_channel_bit_depth_minus8应等于相关主要图片的bit_depth_luma_minus8。

alpha_transparent_value规定辅助编解码图片亮度样点的解释样点值，对于该辅助编解码图片亮度样点，主要编解码图片的相关亮度和色度样点被认为是透明的，用于α混合的目的。用于表示alpha_transparent_value语法元素的位数是alpha_channel_bit_depth_minus8+9。

alpha_opaque_value规定辅助编解码图片亮度样点的解释样点值，对于该辅助编解码图片亮度样点，主要编解码图片的相关亮度和色度样点被认为是不透明的，用于α混合。用于表示alpha_opaque_value语法元素的位数是alpha_channel_bit_depth_minus8+9。

alpha_channel_incr_flag等于0指示每个解码辅助图片亮度样点值的解释样点值等于出于α混合的目的的解码辅助图片样点值。alpha_channel_incr_flag等于1指示，为了α混合的目的，在解码辅助图片样点之后，任何大于Min(alpha_opaque_value，alpha_transparent_value)的辅助图片亮度样点值应该增加1，以获得辅助图片样点的解释样点值，并且任何小于或等于Min(alpha_opaque_value，alpha_transparent_value)的辅助图片亮度样点值应该被不加改变地用作解码辅助图片样点值的解释样点值。当不存在时，alpha_channel_incr_flag的值被推断为等于0。

alpha_channel_clip_flag等于0指示不应用剪裁操作来获得解码辅助图片的解释样点值。alpha_channel_clip_flag等于1指示解码辅助图片的解释样点值根据由alpha_channel_clip_type_flag语法元素描述的剪辑过程而改变。当不存在时，alpha_channel_clip_flag的值被推断为等于0。

alpha_channel_clip_type_flag等于0指示，出于α混合的目的，在对辅助图片样点进行解码后，将大于(alpha_opaque_value-alpha_transparent_value)/2的任何辅助图片亮度样点设置为等于alpha_opaque_value，以获得辅助图片亮度样点的解释样点值，并且将小于或等于(alpha_opaque_value-alpha_transparent_value)/2的任何辅助图片亮度样点设置为等于alpha_transparent_value，以获得辅助图片亮度样点的解释样点值。alpha_channel_clip_type_flag等于1指示，出于α混合的目的，在解码辅助图片样点之后，大于alpha_opaque_value的任何辅助图片亮度样点被设置为等于alpha_opaque_value，以获得辅助图片亮度样点的解释样点值，并且小于或等于alpha_transparent_value的任何辅助图片亮度样点被设置为等于alpha_transparent_value，以获得辅助图片亮度样点的解释样点值。

注-当alpha_channel_incr_flag和alpha_channel_clip_flag均等于1时，应首先应用由alpha_channel_clip_type_fla规定的剪裁操作，然后应用由alpha_channel_incr_flag规定的变更，以获得辅助图片亮度样点的解释样点值。

实施例16

α通道信息SEI消息

α通道信息SEI消息语法

α通道信息SEI消息语义

α通道信息SEI消息提供关于α通道样点值和应用于在类型AUX_ALPHA的辅助图片和一个或多个相关的主要图片中编解码的解码α平面的后处理的信息。

--按输出顺序，输出nuh_layer_id等于nuhLayerIdA的下一个图片。

--包含辅助图片picA的CLVS结束。

--比特流结束。

--nuh_layer_id等于nuhLayerIdA的辅助图片层的任何相关主要层的CLVS结束。

以下语义分别应用于α通道信息SEI消息所应用的nuh_layer_id值中的每个nuh_layer_id targetLayerId。

设currPic为α通道信息SEI消息所关联的图片。α通道信息SEI消息的语义按照输出顺序持续用于当前层，直到以下一个或多个条件为真：

--当前层的新CLVS开始。

--比特流结束。

实施例17

多视图获取信息SEI消息

多视图获取信息SEI消息语法

多视图获取信息SEI消息语义

多视图获取信息

以下语义分别应用于多视图获取信息SEI消息所应用的nuh_layer_id值中的每个nuh_layer_id targetLayerId。

当存在时，应用于当前层的多视图获取信息SEI消息应包含在包含IRAP图片的访问单元中，该IRAP图片为当前层的CLVS的第一个图片。SEI消息中信令通知的信息应用于CLVS。

当多视图获取信息SEI消息包含在可缩放嵌套SEI消息中时，可缩放嵌套SEI消息中的语法元素sn_ols_flag和sn_all_layers_flag应等于0。

变量numViewsMinus1的导出如下：

--如果多视图获取信息SEI消息未包含在可缩放嵌套SEI消息中，则numViewsMinus1设置为等于0。

--否则(多视图获取信息SEI消息包含在可缩放嵌套SEI消息中)，numViewsMinus1设置为等于sn_num_layers_minus1。

多视图获取信息包含在多视图获取信息SEI消息中的某些视图可能不存在。

在以下语义中，索引i是指应用于nuh_layer_id等于NestingLayerId[i]的层的语法元素和变量。

根据右手坐标系规定外部相机参数，其中图像的左上角为原点，即(0，0)坐标，其中图片的其他角具有非负坐标。根据这些规范，对于第i个相机，将3维世界点wP＝[x y z]映射到2维相机点cP[i]＝[u v 1]，根据：

s*cP[i]＝A[i]*R

其中，A[i]表示内部相机参数矩阵，R

intrinsic_param_flag等于1指示存在内部相机参数。intrinsic_param_flag等于0指示不存在内部相机参数。

extrinsic_param_flag等于1指示存在外部相机参数。extrinsic_param_flag等于0指示不存在外部相机参数。

intrinsic_params_equal_flag等于1指示所有相机的内部相机参数相等，并且仅存在一组内部相机参数。intrinsic_params_equal_flag等于0指示每个相机的内部相机参数不同，并且每个相机都有一组内部相机参数。

prec_focal_length规定由2

prec_principal_point规定由2

prec_skew_factor规定由2

sign_focal_length_x[i]等于0指示第i个相机在水平方向上的焦距的符号为正。sign_focal_length_x[i]等于1指示符号为负。

exponent_focal_length_x[i]规定第i个相机在水平方向上的焦距的指数部分。exponent_focal_length_x[i]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的焦距。

mantissa_focal_length_x[i]规定第i个相机在水平方向上的焦距的尾数部分。mantissa_focal_length_x[i]语法元素的长度是可变的，并且确定如下：

--如果exponent_focal_length_x[i]等于0，则长度为Max(0,prec_focal_length-30)。

--否则(exponent_focal_length_x[i]在0到63(包括端值)的范围内)，长度为Max(0,exponent_focal_length_x[i]+prec_focal_length-31)。

sign_focal_length_y[i]等于0指示第i个相机的垂直方向上的焦距的符号为正。sign_focal_length_y[i]等于1指示符号为负。

exponent_focal_length_y[i]规定第i个相机的垂直方向上的焦距的指数部分。exponent_focal_length_y[i]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的焦距。

mantissa_focal_length_y[i]规定第i个相机的焦距在垂直方向上的尾数部分。

mantissa_focal_length_y[i]语法元素的长度是可变的，并确定如下：

--如果exponent_focal_length_y[i]等于0，则长度为Max(0,prec_focal_length-30)。

--否则(exponent_focal_length_y[i]在0到63(不包括端值)的范围内)，长度为Max(0,exponent_focal_length_y[i]+prec_focal_length-31)。

sign_principal_point_x[i]等于0指示第i个相机的主要点在水平方向上的符号为正。sign_principal_point_x[i]等于1指示符号为负。

exponent_principal_point_x[i]规定第i个相机的主要点在水平方向上的指数部分。exponent_principal_point_x[i]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的主要点。

mantissa_principal_point_x[i]规定第i个相机的主要点在水平方向上的尾数部分。以比特为单位的mantissa_principal_point_x[i]语法元素的长度是可变的，并且确定如下：

--如果exponent_principal_point_x[i]等于0，则长度为Max(0,prec_principal_point-30)。

--否则(exponent_principal_point_x[i]在0到63(不包括端值)的范围内)，长度为Max(0,exponent_principal_point_x[i]+prec_principal_point-31)。

sign_principal_point_y[i]等于0指示第i个相机的主要点在垂直方向上的符号为正。sign_principal_point_y[i]等于1指示符号为负。

exponent_principal_point_y[i]规定第i个相机的主要点在垂直方向上的指数部分。exponent_principal_point_y[i]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的主要点。

mantissa_principal_point_y[i]规定第i个相机的主要点在垂直方向上的尾数部分。以比特为单位的mantissa_principal_point_y[i]语法元素的长度是可变的，并且确定如下：

--如果exponent_principal_point_y[i]等于0，则长度为Max(0,prec_principal_point-30)。

--否则(exponent_principal_point_y[i]在0到63(不包括端值)的范围内)，长度为Max(0,exponent_principal_point_y[i]+prec_principal_point-31)。

sign_skew_factor[i]等于0指示第i个相机的倾斜因子的符号为正。

sign_skew_factor[i]等于1指示符号为负。

exponent_skew_factor[i]规定第i个相机的倾斜因子的指数部分。exponent_skew_factor[i]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的倾斜因子。

mantissa_skew_factor[i]规定第i个相机的倾斜因子的尾数部分。mantissa_skew_factor[i]语法元素的长度是可变的，并且确定如下：

--如果exponent_skew_factor[i]等于0，则长度为Max(0,prec_skew_factor-30)。

--否则(exponent_skew_factor[i]在0到63(不包括端值)的范围内)，长度为Max(0,exponent_skew_factor[i]+prec_skew_factor-31)。

第i个相机的内部矩阵A[i]由下式表示

prec_rotation_param规定由2

prec_translation_param规定由2

sign_r[i][j][k]等于0指示第i个相机的旋转矩阵的(j，k)分量的符号为正。sign_r[i][j][k]等于1指示符号为负。

exponent_r[i][j][k]规定第i个相机的旋转矩阵的(j，k)分量的指数部分。指数r[i][j][k]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的旋转矩阵。

mantissa_r[i][j][k]规定第i个相机的旋转矩阵的(j，k)分量的尾数部分。以比特为单位的mantissa_r[i][j][k]语法元素的长度是可变的，并且确定如下：

--如果exponent_r[i]等于0，则长度为Max(0,prec_rotation_param-30)。

--否则(exponent_r[i]在0到63(不包括端值)的范围内)，长度为Max(0,exponent_r[i]+prec_rotation_param-31)。

第i个相机的旋转矩阵R[i]表示如下：

sign_t[i][j]等于0指示第i个相机的平移矢量的第j个分量的符号为正。sign_t[i][j]等于1指示符号为负。

exponent_t[i][j]规定第i个相机的平移矢量的第j个分量的指数部分。exponent_t[i][j]的值应在0到62(包括端值)的范围内。值63由ITU-T|ISO/IEC保留供将来使用。解码器应将值63视为指示未规定的平移矢量。

mantissa_t[i][j]规定第i个相机的平移矢量的第j个分量的尾数部分。以比特为单位的mantissa_t[i][j]语法元素的长度v是可变的，并且确定如下：

--如果exponent_t[i]等于0，则长度v设置为等于Max(0,prec_translation_param-30)。

--否则(0

第i个相机的平移矢量T[i]由下式表示：

相机参数变量和对应语法元素之间的关联由表ZZ规定。内部矩阵和旋转矩阵的每个分量以及平移矢量从表ZZ中规定的变量中获得，变量x计算如下：

--如果e在0至63(不包括端值)的范围内，则x设置为等于(-1)

--否则(e等于0)，x设置为等于(-1)

注-上述规格类似于IEC 60559:1989的规格。

表ZZ–相机参数变量和语法元素之间的关联。

实施例18

深度表示信息SEI消息

深度表示信息SEI消息语法

深度表示信息SEI消息语义

z_near_flag等于0规定语法结构中不存在规定最近深度值的语法元素。z_near_flag等于1规定语法结构中存在规定最近深度值的语法元素。

z_far_flag等于0规定语法结构中不存在规定最远深度值的语法元素。z_far_flag等于1规定语法结构中存在规定最远深度值的语法元素。

d_min_flag等于0规定语法结构中不存在规定最小视差值的语法元素。d_min_flag等于1规定语法结构中存在规定最小视差值的语法元素。

d_max_flag等于0规定语法结构中不存在规定最大视差值的语法元素。d_max_flag等于1规定语法结构中存在规定最大视差值的语法元素。

变量maxVal被设置为等于(1<<(8+sps_bitdepth_minus8))-1，其中sps_bitdepth_minus8是包含在nuh_layer_id等于targetLayerId的层的活动SPS中或为其推断的值。

表Y1–depth_representation_type的定义

disparity_ref_view_id规定了导出视差值所依据的ViewId值。

注1-仅当d_min_flag等于1或d_max_flag等于1时，disparity_ref_view_id才存在，并且对于depth_representation_type值等于1和3有用。

表Y2的x列中的变量从表Y2的s、e、n和v列中的相应变量导出，如下所示：

--如果e的值在0到127(不包括端值)的范围内，则x设置为等于(-1)

--否则(e等于0)，x设置为等于(-1)

注1-上述规范与IEC 60559：1989中的规范类似。

表Y2–深度参数变量和语法元素之间的关联

dmin和DMax值，当存在时，以编解码图片的亮度样点宽度为单位规定，其中ViewId等于辅助图片的ViewId。

当存在时，ZNear和ZFar值的单位相同，但未规定。

depth_nonlinear_representation_num_minus1加2规定用于将深度值映射到根据视差均匀量化的尺度的分段线性片段的数量。

在0至maxVal(包括端值)的范围内的i的变量DepthLUT[i]规定如下：

语法结构规定深度表示信息SEI消息中元素的值。

da_sign_flag等于0指示浮点值的符号为正。da_sign_flag等于1指示符号为负。变量OutSign被设置为等于da_sign_flag。

da_exponent规定浮点值的指数。da_exponent的值应在0到2

da_mantissa_len_minus1加1规定da_mantissa语法元素中的位数。da_mantissa_len_minus1的值应在0到31(包括端值)的范围内。变量OutManLen被设置为等于da_mantissa_len_minus1+1。

da_mantissa规定浮点值的尾数。变量OutMantissa被设置为等于da_mantissa。

实施例19

深度表示信息SEI消息

深度表示信息SEI消息语法

深度表示信息SEI消息语义

当存在时，深度表示信息SEI消息应与sdi_aux_id值等于AUX_DEPTH的一个或多个层相关联，

z_near_flag等于0规定语法结构中不存在规定最近深度值的语法元素。z_near_flag等于1规定语法结构中存在规定最近深度值的语法元素。

z_far_flag等于0规定语法结构中不存在规定最远深度值的语法元素。z_far_flag等于1规定语法结构中存在规定最远深度值的语法元素。

d_min_flag等于0规定语法结构中不存在规定最小视差值的语法元素。d_min_flag等于1规定语法结构中存在规定最小视差值的语法元素。

d_max_flag等于0规定语法结构中不存在规定最大视差值的语法元素。d_max_flag等于1规定语法结构中存在规定最大视差值的语法元素。

变量maxVal被设置为等于(1<<(8+sps_bitdepth_minus8))-1，其中sps_bitdepth_minus8是包含在nuh_layer_id等于targetLayerId的层的活动SPS中或为其推断的值。

表Y1–depth_representation_type的定义

disparity_ref_view_id规定了导出视差值所依据的ViewId值。

注1-仅当d_min_flag等于1或d_max_flag等于1时，disparity_ref_view_id才存在，并且对于depth_representation_type值等于1和3有用。

表Y2的x列中的变量从表Y2的s、e、n和v列中的相应变量导出，如下所示：

--如果e的值在0到127(不包括端值)的范围内，则x设置为等于(-1)

--否则(e等于0)，x设置为等于(-1)

注1-上述规范与IEC 60559：1989中的规范类似。

表Y2–深度参数变量和语法元素之间的关联

dmin和DMax值，当存在时，以编解码图片的亮度样点宽度为单位规定，其中ViewId等于辅助图片的ViewId。

当存在时，ZNear和ZFar值的单位相同，但未规定。

depth_nonlinear_representation_num_minus1加2规定用于将深度值映射到根据视差均匀量化的尺度的分段线性片段的数量。

在0至maxVal(包括端值)的范围内的i的变量DepthLUT[i]规定如下：

语法结构规定深度表示信息SEI消息中元素的值。

da_sign_flag等于0指示浮点值的符号为正。da_sign_flag等于1指示符号为负。变量OutSign被设置为等于da_sign_flag。

da_exponent规定浮点值的指数。da_exponent的值应在0到2

da_mantissa_len_minus1加1规定da_mantissa语法元素中的位数。da_mantissa_len_minus1的值应在0到31(包括端值)的范围内。变量OutManLen被设置为等于da_mantissa_len_minus1+1。

da_mantissa规定浮点值的尾数。变量OutMantissa被设置为等于da_mantissa。

实施例20

α通道信息SEI消息

α通道信息SEI消息语法

α通道信息SEI消息语义

α通道信息SEI消息提供关于α通道样点值和应用于在类型AUX_ALPHA的辅助图片和一个或多个相关的主要图片中编解码的解码α平面的后处理的信息。

--按输出顺序，输出nuh_layer_id等于nuhLayerIdA的下一个图片。

--包含辅助图片picA的CLVS结束。

--比特流结束。

--nuh_layer_id等于nuhLayerIdA的辅助图片层的任何相关主要层的CLVS结束。

以下语义分别应用于α通道信息SEI消息所应用的nuh_layer_id值中的每个nuh_layer_id targetLayerId。

设currPic为α通道信息SEI消息所关联的图片。α通道信息SEI消息的语义按照输出顺序持续用于当前层，直到以下一个或多个条件为真：

--当前层的新CLVS开始。

--比特流结束。

实施例21

α通道信息SEI消息

α通道信息SEI消息语法

α通道信息SEI消息语义

α通道信息

当访问单元

按输出顺序，输出nuh_layer_id等于nuhLayerIdA的下一个图片。

--包含辅助图片picA的CLVS结束。

--比特流结束。

--nuh_layer_id等于nuhLayerIdA的辅助图片层的任何相关主要层的CLVS结束。

以下语义分别应用于α通道信息SEI消息所应用的nuh_layer_id值中的每个nuh_layer_id targetLayerId。

设currPic为α通道信息SEI消息所关联的图片。α通道信息SEI消息的语义按照输出顺序持续用于当前层，直到以下一个或多个条件为真：

--当前层的新CLVS开始。

--比特流结束。

--在调用picB的图片顺序计数的解码过程之后，立即输出访问单元中

实施例22

可缩放性维度信息(SDI)SEI消息

可缩放性维度SEI消息语法

可缩放性维度SEI消息语义

sdi_max_layers_minus1加1指示bitstreamInScope中的最大层数。

sdi_view_id_len规定sdi_view_id_val[i]语法元素的长度，以位为单位。

sdi_view_id_val[i]规定bitstreamInScope中第i层的视图ID。sdi_view_id_val[i]语法元素的长度为sdi_view_id_len位。当不存在时，sdi_view_id_val[i]的值被推断为等于0。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中指定的bitstreamInScope中第i层中的辅助图片的类型。

sdi_aux_id[i]等于0指示bitstreamInScope中的第i层不包含辅助图片。sdi_aux_id[i]大于0指示如表1中规定的bitstreamInScope中第i层中的辅助图片的类型。