掌桥专利:专业的专利平台
掌桥专利
首页

图像解码和编码设备及发送比特流的设备

文献发布时间:2024-04-18 20:02:18


图像解码和编码设备及发送比特流的设备

本申请是原案申请号为202080041767.2的发明专利申请(国际申请号:PCT/KR2020/007351,申请日:2020年6月5日,发明名称:基于变换的图像编码方法及其装置)的分案申请。

技术领域

本公开涉及一种图像编码技术,并且更具体地,涉及图像编码系统中的用于基于变换对图像进行编码的方法和设备。

背景技术

如今,在各个领域中对诸如4K、8K或更高的超高清(UHD)图像/视频这样的高分辨率和高质量图像/视频的需求已经不断增长。随着图像/视频数据变成更高分辨率和更高质量,与传统图像数据相比,所发送的信息量或比特量增加。因此,当使用诸如传统有线/无线宽带线这样的介质来发送图像数据或者使用现有存储介质来存储图像/视频数据时,其传输成本和存储成本增加。

另外,如今,对于诸如虚拟现实(VR)和人工现实(AR)内容或全息图等这样的沉浸式媒体的兴趣和需求正在增加,并且对具有与诸如游戏图像这样的真实图像不同的图像特征的图像/视频的广播正在增加。

因此,需要有效地压缩并发送或存储以及再现具有如上所述的各种特征的高分辨率和高质量图像/视频的信息的高效图像/视频压缩技术。

发明内容

技术问题

本公开的一技术方面在于提供用于增加图像编码效率的方法和设备。

本公开的另一技术方面在于提供用于增加变换索引编码的效率的方法和设备。

本公开的又一技术方面在于提供用于基于多变换技术对变换索引进行编码的方法和设备。

本公开的又一技术方面在于提供用于限制要应用不可分离的变换的目标块的大小的图像编码方法和设备。

技术方案

根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法可以包括:接收包括残差信息的比特流;基于残差信息来推导目标块的变换系数;基于针对变换系数的逆不可分离的变换来推导修改的变换系数;基于针对修改的变换系数的逆一次变换来推导目标块的残差样本;基于目标块的残差样本来生成重构图片,其中,当目标块的大小等于或小于预定的最大变换应用块的大小时执行逆不可分离的变换。

这里,进一步接收关于最大变换应用块的大小的信息。

是否执行逆不可分离的变换是通过将目标块的宽度或高度中的更大的一者与最大变换应用块的宽度或高度进行比较而推导的,并且最大变换应用块的大小为64×64。

当目标块的大小大于预定的最大变换应用块的大小时,不推导指示用于逆不可分离的变换的预定的变换核矩阵的lfnst索引。

目标块包括亮度编码块和色度编码块,当亮度编码块的大小等于或小于最大变换应用块的大小并且颜色格式为4:2:0时,在色度编码块小于或等于最大变换应用块的大小的1/2时执行逆不可分离的变换。

根据本公开的另一实施方式,提供了一种由编码设备执行的图像编码方法。该方法可以包括:推导目标块的预测样本;基于预测样本来推导目标块的残差样本;基于残差样本的一次变换来推导目标块的变换系数;基于用于非分离的变换的预定的变换核矩阵从变换系数推导修改的变换系数;对量化的残差信息和指示变换核矩阵的lfnst索引进行编码,其中,当目标块的大小等于或小于预定的最大变换应用块的大小时执行不可分离的变换。

根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括根据由编码设备执行的图像编码方法生成的编码的图像信息和比特流的图像数据。

根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括编码的图像信息和比特流的图像数据以使解码设备执行图像解码方法。

技术效果

根据本公开,可以增加整体图像/视频压缩效率。

根据本公开,可以增加变换索引编码的效率。

本公开的技术方面可以提供用于基于多变换技术对变换索引进行编码的方法和设备。

本公开的一技术方面可以提供用于限制要应用不可分离的变换的目标块的大小的图像编码方法和设备。

可以通过本公开的具体示例获得的效果不限于上面列出的效果。例如,可以存在相关领域的普通技术人员可以理解或从本公开推导出的各种技术效果。因此,本公开的特定效果不限于本公开中明确描述的那些,并且可以包括可以根据本公开的技术特征理解或推导出的各种效果。

附图说明

图1示意性地例示了可应用本公开的视频/图像编码系统的示例。

图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。

图3是示意性地例示可应用本公开的视频/图像解码设备的配置的图。

图4示意性地例示根据本文档的实施方式的多变换方案。

图5示意性地示出了65个预测方向的帧内定向模式。

图6是用于说明根据本文档的实施方式的RST的图。

图7是例示根据本公开的实施方式的视频解码设备的操作的流程图。

图8是例示根据本公开的实施方式的视频编码设备的操作的流程图。

图9例示了应用本公开的内容流系统的结构。

具体实施方式

尽管本公开可能易于进行各种修改并且包括各种实施方式,但是其具体实施方式已在附图中通过示例的方式示出,并且现在将对其进行详细描述。然而,这并不旨在将本公开限制于本文公开的具体实施方式。本文中使用的术语只是出于描述特定实施方式的目的,并不旨在限制本公开的技术思路。除非上下文另外清楚指示,否则单数形式可以包括复数形式。诸如“包括”和“具有”之类的术语旨在指示存在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合,因此不应被理解为预先排除了存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。

此外,为了方便描述彼此不同的特性功能,独立地例示了本文中描述的附图上的各组件,然而,并不意指各组件由单独的硬件或软件来实现。例如,可以组合这些组件中的任何两个或更多个以形成单个组件,并且任何单个组件可以被划分成多个组件。其中组件被组合和/或划分的实施方式将属于本公开的专利权的范围,只要它们不脱离本公开的实质即可。

在下文中,将参照附图更详细地说明本公开的优选实施方式。另外,在附图中,相同的附图标号用于相同的组件,并且将省略对相同组件的重复描述。

本文档涉及视频/图像编码。例如,本文档中公开的方法/示例可以涉及VVC(通用视频编码)标准(ITU-T Rec.H.266)、VVC之后的下一代视频/图像编码标准、或其它视频编码相关标准(例如,HEVC(高效视频编码)标准(ITU-T Rec.H.265)、EVC(基本视频编码)标准、AVS2标准等)。

在本文档中,可以提供与视频/图像编码相关的各种实施方式,并且除非相反地指定,否则这些实施方式可以彼此组合并执行。

在本文档中,视频可以是指一段时间内一系列图像的集合。通常,图片是指表示特定时间区域的图像的单元,而条带/贴片是构成图片的一部分的单元。条带/贴片可以包括一个或更多个编码树单元(CTU)。一幅图片可以由一个或更多个条带/贴片组成。一幅图片可以由一个或多个贴片组组成。一个贴片组可以包括一个或更多个贴片。

像素或图元(pel)可以是指构成一幅图片(或图像)的最小单元。另外,“样本”可用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。另选地,样本可以意指空间域中的像素值,或者当该像素值被变换为频域时,其可以意指频域中的变换系数。

单元可以表示图像处理的基本单位。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下,M×N块可以包括由M列和N行组成的样本(或样本阵列)或变换系数的集(或阵列)。

在本文档中,术语“/”和“,”应该被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。另外,“A、B”可以意指“A和/或B”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。

另外,在该文档中,术语“或”应该被解释为指示“和/或”。例如,表述“A或B”可以包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本文档中的术语“或”应该被解释为指示“附加地或另选地”。

在本公开中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B两者”。此外,在本公开中,表述“A或B中的至少一个”或者“A和/或B中的至少一个”可以被解释为“A和B中的至少一个”。

此外,在本公开中,“A、B和C中的至少一个”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。

另外,本公开中使用的括号可以表示“例如”。具体地,当指示为“预测(帧内预测)”时,可以意指“帧内预测”被提出为“预测”的示例。换句话说,本公开的“预测”不限于“帧内预测”,并且“帧内预测”是作为“预测”的示例而提出的。另外,当指示为“预测(即,帧内预测)”时,这也可以意指“帧内预测”被提出为“预测”的示例。

在本公开中的一个附图中单独描述的技术特征可以单独地实现或可以同时实现。

图1示意性地例示了可应用本公开的视频/图像编码系统的示例。

参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传递到接收装置。

源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。

视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以被生成相关数据的处理取代。

编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。

发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并且将接收/提取的比特流发送到解码设备。

解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。

渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。

图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。在下文中,所谓的视频编码设备可以包括图像编码设备。

参照图2,编码设备200可以包括图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234、逆变换器235。残差处理器230可以进一步包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,以上描述的图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或更多个硬件组件(例如,编码器芯片组或处理器)构成。此外,存储器270可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件可以进一步包括作为内部/外部组件的存储器270。

图像划分器210可以将输入到编码设备200的输入图像(或图片或帧)划分为一个或更多个处理单元。作为一个示例,处理单元可以被称为编码单元(CU)。在这种情况下,从编码树单元(CTU)或最大编码单元(LCU)开始,可以根据四叉树二叉树三叉树(QTBTTT)结构来递归地划分编码单元。例如,基于四叉树结构、二叉树结构和/或三叉树结构,一个编码单元可以被划分为深度较深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,并且可以稍后应用二叉树结构和/或三叉树结构。另选地,可以首先应用二叉树结构。可以基于未进一步划分的最终编码单元来执行根据本公开的编码过程。在这种情况下,基于根据图像特性的编码效率,最大编码单元可以直接用作最终编码单元。另选地,可以根据需要将编码单元递归地划分为更深的深度的编码单元,由此可以将最佳大小的编码单元用作最终编码单元。这里,编码过程可以包括诸如预测、变换和重构之类的过程,其将在后面描述。作为另一示例,处理单元可以进一步包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可以与上述最终编码单元分开或划分开。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。

根据情况,可以使用单元和诸如块、区域等之类的术语来代替彼此。在通常情况下,M×N块可以表示由M列和N行构成的样本或变换系数的集。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与一幅图片(或图像)的像素或图元(pel)相对应的术语。

减法器231从输入图像信号(原始块、原始样本阵列)中减去从预测器220输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。预测器220可以对处理目标块(下文称为“当前块”)执行预测,并且可以生成包括当前块的预测样本的预测块。预测器220可以确定是以当前块或CU为基础应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所讨论的,预测器可以生成诸如预测模式信息之类的与预测有关的各种信息,并将所生成的信息发送到熵编码器240。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。

帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而,这仅仅是示例,并且根据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧间预测器221可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参照图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示哪个候选被用于推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳变模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳变模式下,与合并模式不同,不能发送残差信号。在运动信息预测(运动向量预测、MVP)模式的情况下,邻近块的运动向量可以被用作运动向量预测符,并且可以通过发信号通知运动向量差来指示当前块的运动向量。

预测器220可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前块中执行预测,但是其执行方式与帧间预测的相似之处在于,它推导当前块中的参考块。也就是说,IBC可以使用本公开中描述的帧间预测技术中的至少一种。

通过帧间预测器221和/或帧内预测器222生成的预测信号可以被用于生成重构信号或者生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,GBT意指当用曲线图表示像素之间的关系信息时从曲线图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外,变换处理可以被应用于大小相同的正方形像素块,或者可以应用于大小可变的块而非正方形的块。

量化器233可以对变换系数进行量化并且将它们发送到熵编码器240,并且熵编码器240可以对量化后的信号(关于量化变换系数的信息)进行编码并且输出比特流中的编码后的信号。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型的量化变换系数重新布置成一维向量形式,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。熵编码器240可以执行诸如例如指数哥伦布(exponential Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等这样的各种编码方法。熵编码器240可以对除了量化变换系数(例如,语法元素的值等)之外的视频/图像重构所需的信息一起或分别进行编码。编码后的信息(例如,编码后的视频/图像信息)可以以比特流的形式在网络抽象层(NAL)的单元基础上进行发送或存储。视频/图像信息还可以包括关于诸如适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。在本公开中,从编码设备发送到/发信号通知给解码设备的信息和/或语法元素可以被包括在视频/图像信息中。视频/图像信息可以通过上述编码过程进行编码并且被包括在比特流中。可以通过网络传输比特流,或者将其存储在数字存储介质中。这里,网络可以包括广播网络、通信网络和/或类似物,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)或存储其的存储器(未示出)可以被配置为编码设备200的内部/外部元件,或者发送器可以被包括在熵编码器240中。

从量化器233输出的量化变换系数可以被用于生成预测信号。例如,通过利用解量化器234和逆变换器235向量化变换系数应用解量化和逆变换,可以重构残差信号(残差块或残差样本)。加法器155将重构后的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,使得可以生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以被用于目标图片中的下一处理目标块的帧内预测,并且如随后描述的,可以被用于通过滤波进行的下一图片的帧间预测。

此外,在图片编码和/或重构处理中,可以应用具有色度缩放的亮度映射(LMCS)。

滤波器260可以通过向重构信号应用滤波来改善主观/客观视频质量。例如,滤波器260可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片存储在存储器270中,尤其是存储在存储器270的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。如随后在对每种滤波方法的描述中所讨论的,滤波器260可以生成与滤波相关的各种信息,并且将所生成的信息发送到熵编码器240。关于滤波的信息可以在熵编码器240中被编码并且以比特流的形式被输出。

已发送到存储器270的修改后的重构图片可以被用作帧间预测器221中的参照图片。据此,编码设备可以避免在应用帧间预测时编码设备100和解码设备中的预测失配,并且还可以提高编码效率。

存储器270DPB可以存储修改后的重构图片,以便使用它作为帧间预测器221中的参照图片。存储器270可以存储从中已推导(或编码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器221,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器222。

图3是示意性地例示可应用本公开的视频/图像解码设备的配置的图。

参照图3,视频解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括解量化器321和逆变换器322。根据实施方式,上面已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由一个或更多个硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。

当输入包括视频/图像信息的比特流时,解码设备300可以与据此已在图2的编码设备中处理视频/图像信息的处理对应地重构图像。例如,解码设备300可以基于与从比特流获得的与块分割相关的信息来推导单元/块。解码设备300可以通过使用在编码设备中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,可以用编码树单元或最大编码单元顺着四叉树结构、二叉树结构和/或三叉树结构对其进行分割。可以用编码单元推导一个或更多个变换单元。并且,可以通过再现器来再现通过解码设备300解码并输出的重构图像信号。

解码设备300可以以比特流的形式接收从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以对比特流进行解析,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。解码设备可以进一步基于关于参数集的信息和/或常规约束信息对图片进行解码。在本公开中,随后将描述的发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并且从比特流中获得。例如,熵解码器310可以基于诸如指数哥伦布编码、CAVLC、CABAC等这样的编码方法对比特流中的信息进行解码,并且可以输出图像重构所需的语法元素的值和关于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的各语法元素对应的bin,使用解码目标语法元素信息以及邻近和解码目标块的解码信息或者在先前步骤中解码的符号/bin的信息来确定上下文模型,根据所确定的上下文模型来预测bin生成概率并且对bin执行算术解码以生成与每个语法元素值对应的符号。这里,CABAC熵解码方法可以在确定上下文模型之后使用针对下一个符号/bin的上下文模型解码的符号/bin的信息来更新上下文模型。在熵解码器310中解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中已对其执行了熵解码的残差值(即,量化变换系数)和关联的参数信息可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,在熵解码器310中解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,接收从编码设备输出的信号的接收器(未示出)还可以将解码设备300构成为内部/外部元件,并且接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可以被称为视频/图像/图片编码设备,并且解码设备可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。

解量化器321可以通过对量化变换系数进行解量化来输出变换系数。解量化器321可以将量化变换系数重新布置为二维块的形式。在这种情况下,可以基于已在编码设备中执行的系数扫描的顺序来执行重新布置。解量化器321可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。

解量化器321通过对变换系数进行逆变换来获得残差信号(残差块、残差样本阵列)。

预测器可以对当前块执行预测,并且生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且具体地可以确定帧内/帧间预测模式。

预测器可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以针对块的预测执行块内复制(IBC)。块内复制可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前块中执行预测,但是其执行方式与帧间预测的相似之处在于,它推导当前块中的参考块。也就是说,IBC可以使用本公开中描述的帧间预测技术中的至少一种。

帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧间预测器332可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并且基于接收到的候选选择信息来推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。

加法器340可以通过将所获得的残差信号与从预测器330输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。

加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前块中的下一处理目标块的帧内预测,并且如随后描述的,可以通过滤波来输出或者被用于下一图片的帧间预测。

此外,在图片解码处理中,可以应用具有色度缩放的亮度映射(LMCS)。

滤波器350可以通过向重构后的信号应用滤波来改善主观/客观视频质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片发送到存储器360中,尤其是发送到存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。

已存储在存储器360的DPB中的(修改后的)重构图片可以被用作帧间预测器332中的参照图片。存储器360可以存储从中已推导(或解码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器332,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器331。

在本说明书中,在解码设备300的预测器330、解量化器321、逆变换器322和滤波器350中描述的示例可以分别类似地或对应地应用于编码设备200的预测器220、解量化器234、逆变换器235和滤波器260。

如上所述,执行预测,以便提高执行视频编码时的压缩效率。据此,可以生成包括针对作为编码目标块的当前块的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。可以在编码设备和解码设备中相同地推导预测块,并且编码设备可以通过向解码设备发信号通知并非原始块本身的原始样本值而是关于原始块与预测块之间的残差的信息(残差信息)来提高图像编码效率。解码设备可以基于残差信息来推导包括残差样本的残差块,通过将残差块与预测块相加来生成包括重构样本的重构块,并且生成包括重构块的重构图片。

可以通过变换过程和量化过程来生成残差信息。例如,编码设备可以推导原始块与预测块之间的残差块,通过对残差块中所包括的残差样本(残差样本阵列)执行变换过程来推导变换系数,并且通过对变换系数执行量化过程来推导量化变换系数,使得它可以(通过比特流)向解码设备发信号通知关联的残差信息。这里,残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息来执行量化/解量化过程并且推导残差样本(或残差样本块)。解码设备可以基于预测块和残差块来生成重构块。编码设备可以通过对量化变换系数进行解量化/逆变换来推导残差块以便作为下一个图片的帧间预测的参考,并且可以基于此来生成重构图片。

图4示意性地例示了根据本公开的实施方式的多变换技术。

参照图4,变换器可以对应于前述图2的编码设备中的变换器,并且逆变换器可以对应于前述图2的编码设备中的逆变换器、或者图3的解码设备中的逆变换器。

变换器可以通过基于残差块中的残差样本(残差样本阵列)执行一次变换来推导(一次)变换系数(S410)。该一次变换可以被称为核心变换。在本文中,一次变换可以基于多变换选择(MTS),并且当将多变换用作一次变换时,可以将其称为多核心变换。

多核心变换可以表示附加地使用离散余弦变换(DCT)类型2和离散正弦变换(DST)类型7、DCT类型8和/或DST类型1进行变换的方法。也就是说,多核心变换可以表示基于从DCT类型2、DST类型7、DCT类型8和DST类型1当中选择的多个变换核将空间域的残差信号(或残差块)变换为频域的变换系数(或一次变换系数)的变换方法。在本文中,从变换器的视角来看一次变换系数可以称为临时变换系数。

换句话说,当应用常规变换方法时,可以通过基于DCT类型2对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数。与此不同,当应用多核心变换时,可以通过基于DCT类型2、DST类型7、DCT类型8和/或DST类型1对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数(或一次变换系数)。在本文中,DCT类型2、DST类型7、DCT类型8和DST类型1可以被称为变换类型、变换核或变换核心。可以基于基函数来定义这些DCT/DST变换类型。

当执行多核心变换时,可以从变换核当中选择用于目标块的垂直变换核和水平变换核,可以基于垂直变换核对目标块执行垂直变换,并且可以基于水平变换核对目标块执行水平变换。这里,水平变换可以指示对目标块的水平分量的变换,并且垂直变换可以指示对目标块的垂直分量的变换。可以基于包括残差块的目标(CU或子块)的预测模式和/或变换索引来适应性地确定垂直变换核/水平变换核。

此外,根据示例,如果通过应用MTS来执行一次变换,则可以通过将特定基函数设置为预定值并组合要在垂直变换或水平变换中应用的基函数来设置变换核的映射关系。例如,当水平变换核表示为trTypeHor,并且垂直方向变换核表示为trTypeVer时,可以将值为0的trTypeHor或trTypeVer设置给DCT2,将值为1的trTypeHor或trTypeVer设置给DST7,并且将值为2的trTypeHor或trTypeVer可以设置给DCT8。

在这种情况下,MTS索引信息可以被编码并且发信号通知到解码设备以指示多个变换核集中的任何一个。例如,MTS索引0可以指示trTypeHor和trTypeVer值均为0,MTS索引1可以指示trTypeHor和trTypeVer值均为1,MTS索引2可以指示trTypeHor值为2并且trTypeVer值为1,MTS索引为3可以指示trTypeHor值为1并且trTypeVer值为2,而MTS索引4可以指示trTypeHor和trTypeVer值均为2。

在一个示例中,根据MTS索引信息的变换核集在下表中示出。

[表1]

变换器可以通过基于(一次)变换系数执行二次变换来推导修改的(二次)变换系数(S420)。一次变换是从空间域到频域的变换,而二次变换是指通过使用(一次)变换系数之间存在的相关性,变换为更具压缩性的表示。二次变换可以包括不可分离的变换。在这种情况下,二次变换可以称为不可分离的二次变换(NSST)或模式相关的不可分离的二次变换(MDNSST)。不可分离的二次变换可以表示这样的变换,其通过基于不可分离的变换矩阵对通过一次变换推导出的(一次)变换系数进行二次变换来生成针对残差信号的修改的变换系数(或二次变换系数)。此时,垂直变换和水平变换可以不单独应用于(一次)变换系数(或者水平变换和垂直变换可以不独立应用),但是可以基于不可分离的变换一次地应用变换矩阵。换句话说,不可分离的二次变换可以表示这样的变换方法,其中,(一次)变换系数的垂直分量和水平分量不分离,并且例如,将二维信号(变换系数)通过某个确定的方向(例如,行第一方向或列第一方向)重新布置为一维信号,然后基于不可分离的变换矩阵生成修改的变换系数(或二次变换系数)。例如,根据行优先顺序,M×N个块以第一行、第二行、...和第N行的顺序设置成排。根据列优先顺序,M×N个块以第一列、第二列、…和第M列的顺序设置成排。不可分离的二次变换可以应用于配置有(一次)变换系数的块(在下文中,可以称为变换系数块)的左上区域。例如,如果变换系数块的宽度(W)和高度(H)均等于或大于8,则可以将8×8不可分离的二次变换应用于变换系数块的左上8×8区域。此外,如果变换系数块的宽度(W)和高度(H)均等于或大于4,并且变换系数块的宽度(W)或高度(H)小于8,那么可以将4×4不可分离的二次变换应用于变换系数块的左上min(8,W)×min(8,H)区域。然而,实施方式不限于此,并且例如,即使仅满足变换系数块的宽度(W)或高度(H)等于或大于4的条件,4×4不可分离的二次变换也可以应用于变换系数块的左上min(8,W)×min(8,H)区域。

具体地,例如,如果使用4×4输入块,则不可分离的二次变换可以如下执行。

4×4输入块X可以表示如下。

[式1]

如果X以向量的形式表示,则向量

[式2]

在式2中,向量

在这种情况下,可以如下计算不可分离的二次变换。

[式3]

在此式中,

通过前述式3,可以推导16×1变换系数向量

此外,在不可分离的二次变换中,可以将变换核(或变换核心、变换类型)选择为模式相关。在这种情况下,模式可以包括帧内预测模式和/或帧间预测模式。

如上所述,可以基于以变换系数块的宽度(W)和高度(H)为基础确定的8×8变换或4×4变换来执行不可分离的二次变换。8×8变换是指当W和H二者都等于或大于8时可应用于变换系数块中包含的8×8区域的变换,并且8×8区域可以是变换系数块中的左上8×8区域。类似地,4×4变换是指当W和H二者都等于或大于4时可应用于变换系数块中包含的4×4区域的变换,并且4×4区域可以是变换系数块中的左上4×4区域。例如,8×8变换核矩阵可以是64×64/16×64矩阵,而4×4变换核矩阵可以是16×16/8×16矩阵。

这里,为了选择模式相关的变换核,可以针对8×8变换和4×4变换二者配置用于不可分离的二次变换的每个变换集二个不可分离的二次变换核,并且可以存在四个变换集。也就是说,可以针对8×8变换配置四个变换集,并且可以针对4×4变换配置四个变换集。在这种情况下,针对8×8变换的四个变换集中的每个变换集可以包括二个8×8变换核,并且针对4×4变换的四个变换集中的每个变换集可以包括二个4×4变换核。

然而,随着变换的大小(即,变换所应用于的区域的大小)可以为例如除了8×8或4×4之外的大小,集的数量可以是n,并且每个集中的变换核的数量可以是k。

变换集可以被称为NSST集或LFNST集。可以例如基于当前块(CU或子块)的帧内预测模式来选择变换集当中的特定集。低频不可分离的变换(LFNST)可以是缩减不可分离的变换的示例,其将稍后描述,并且表示用于低频分量的不可分离的变换。

作为参考,例如,帧内预测模式可以包括两个非定向(或非角度)帧内预测模式和65个定向(或角度)帧内预测模式。非定向帧内预测模式可以包括0号的平面帧内预测模式和1号的DC帧内预测模式,并且定向帧内预测模式可以包括2号至66号的65个帧内预测模式。然而,这是示例,并且即使帧内预测模式的数量不同也可以应用本文档。此外,在一些情况下,还可以使用67号帧内预测模式,并且67号帧内预测模式可以表示线性模型(LM)模式。

图5示意性地示出了65个预测方向的帧内定向模式。

参照图5,基于具有左上对角预测方向的帧内预测模式34,帧内预测模式可以划分为具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。在图5中,H和V分别标示水平方向性和垂直方向性,并且数字-32至32指示样本网格位置上的1/32单位的位移。这些数字可以表示对于模式索引值的偏移。帧内预测模式2至33具有水平方向性,并且帧内预测模式34至66具有垂直方向性。严格地说,帧内预测模式34可以被视为既不是水平的也不是垂直的,但在确定二次变换的变换集时可以被分类为属于水平方向性。这是因为输入数据被转置以用于基于帧内预测模式34对称的垂直定向模式,并且针对水平模式的输入数据对准方法用于帧内预测模式34。对输入数据进行转置意指将二维的M×N块数据的行和列切换成N×M数据。帧内预测模式18和帧内预测模式50可以分别表示水平帧内预测模式和垂直帧内预测模式,并且帧内预测模式2可以被称为右上对角帧内预测模式,因为帧内预测模式2具有左参考像素并且在右上方向上执行预测。类似地,帧内预测模式34可以被称为右下对角帧内预测模式,而帧内预测模式66可以被称为左下对角帧内预测模式。

根据示例,可以映射根据帧内预测模式的四个变换集,例如,如下表所示。

[表2]

如表2所示,根据帧内预测模式,四个变换集中的任何一个,即,lfnstTrSetIdx,可以映射到四个索引(即,0至3)中的任何一个。

当确定特定集用于不可分离的变换时,可以通过不可分离的二次变换索引来选择特定集中的k个变换核之一。编码设备可以基于率失真(RD)校验来推导指示特定变换核的不可分离的二次变换索引,并且可以将不可分离的二次变换索引发信号通知给解码设备。解码设备可以基于不可分离的二次变换索引来选择特定集中的k个变换核中的一个。例如,lfnst索引值0可以指代第一不可分离的二次变换核,lfnst索引值1可以指代第二不可分离的二次变换核,lfnst索引值2可以指代第三不可分离的二次变换核。另选地,lfnst索引值0可以指示第一不可分离的二次变换没有被应用于目标块,并且lfnst索引值1至3可以指示三个变换核。

变换器可以基于所选择的变换核来执行不可分离的二次变换,并且可以获得修改的(二次)变换系数。如上所述,修改的变换系数可以被推导为通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并且被传送到编码设备中的解量化器/逆变换器。

此外,如上所述,如果省略了二次变换,则可以将作为一次(可分离的)变换的输出的(一次)变换系数推导为如上所述通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并传送到编码设备中的解量化器/逆变换器。

逆变换器可以与在上述变换器中已经执行的顺序相反的顺序执行一系列过程。逆变换器可以接收(解量化的)变换系数,并且通过执行二次(逆)变换来推导(一次)变换系数(S450),并且可以通过对(一次)变换系数执行一次(逆)变换来获得残差块(残差样本)(S460)。就此而言,从逆变换器的视角来看,一次变换系数可以被称为修改的变换系数。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。

解码设备还可以包括二次逆变换应用确定器(或用于确定是否应用二次逆变换的元件)和二次逆变换确定器(或用于确定二次逆变换的元件)。二次逆变换应用确定器可以确定是否应用二次逆变换。例如,二次逆变换可以是NSST、RST或LFNST,并且二次逆变换应用确定器可以基于通过解析比特流而获得的二次变换标志来确定是否应用二次逆变换。在另一示例中,二次逆变换应用确定器可以基于残差块的变换系数来确定是否应用二次逆变换。

二次逆变换确定器可以确定二次逆变换。在这种情况下,二次逆变换确定器可以基于根据帧内预测模式指定的LFNST(NSST或RST)变换集来确定应用于当前块的二次逆变换。在实施方式中,可以取决于一次变换确定方法来确定二次变换确定方法。可以根据帧内预测模式来确定一次变换和二次变换的各种组合。此外,在示例中,二次逆变换确定器可以基于当前块的大小来确定应用二次逆变换的区域。

此外,如上所述,如果省略二次(逆)变换,则可以接收(解量化的)变换系数,可以执行一次(可分离的)逆变换,并且可以获得残差块(残差样本)。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。

此外,在本公开中,可以在NSST的概念中应用其中减小了变换矩阵(核)的大小的缩减二次变换(RST),以便减少不可分离的二次变换所需的计算量和存储量。

此外,本公开中描述的变换核、变换矩阵以及构成变换核矩阵的系数,即,核系数或矩阵系数,可以以8比特来表示。这可以是在解码设备和编码设备中实现的条件,并且与现有的9比特或10比特相比,可以减少存储变换核所需的存储量,并且可以合理地适应性能劣化。另外,以8比特表示核矩阵可以允许使用小的乘法器,并且可以更适合于用于最佳软件实现的单指令多数据(SIMD)指令。

在本说明书中,术语“RST”可以是指基于大小根据缩减因子而减小的变换矩阵来对目标块的残差样本执行的变换。在执行缩减变换的情况下,由于变换矩阵的大小的减小,可以减少变换所需的计算量。也就是说,RST可以用于解决在大小大的块的变换或不可分离的变换时发生的计算复杂性问题。

RST可以被称为诸如缩减变换、缩减二次变换、缩小变换、简化变换和简单变换等之类的各种术语,并且RST可以被称为的名称不限于所列示例。另选地,由于RST主要在变换块中的包括非零系数的低频区域中执行,因此它可以被称为低频不可分离的变换(LFNST)。变换索引可以被称作LFNST索引。

此外,当基于RST执行二次逆变换时,编码设备200的逆变换器235和解码设备300的逆变换器322可以包括:逆缩减二次变换器,其基于变换系数的逆RST来推导修改的变换系数;以及逆一次变换器,其基于修改的变换系数的逆一次变换来推导目标块的残差样本。逆一次变换是指应用于残差的一次变换的逆变换。在本公开中,基于变换推导变换系数可以是指通过应用变换来推导变换系数。

图6是例示根据本公开的实施方式的RST的图。

在本公开中,“目标块”可以指代要编码的当前块,残差块或变换块。

在根据示例的RST中,可以将N维向量映射到位于另一个空间中的R维向量,从而可以确定缩减变换矩阵,其中R小于N。N可以是指应用了变换的块的侧边的长度的平方,或与应用了变换的块相对应的变换系数的总数,并且缩减因子可以是指R/N值。缩减因子可以被称为缩减因子、缩小因子、简化因子、简单因子或其它各种术语。此外,R可以被称为缩减系数,但是根据情况,缩减因子可以是指R。此外,根据情况,缩减因子可以是指N/R值。

在示例中,可以通过比特流来用信号通知缩减因子或缩减系数,但是示例不限于此。例如,可以在编码设备200和解码设备300中的每一个中存储针对缩减因子或缩减系数的预定值,并且在这种情况下,可以不单独发信号通知缩减因子或缩减系数。

根据示例的缩减变换矩阵的大小可以是小于N×N(常规变换矩阵的大小)的R×N,并且可以如下面的式4所限定。

[式4]

图6的(a)中所示的缩减变换块中的矩阵T可以是指式4的矩阵T

在示例中,如果应用了变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图6的(a)的RST可以被表示为以下式5所示的矩阵运算。在这种情况下,存储和乘法计算可以通过缩减因子缩减至大约1/4。

在本公开中,矩阵运算可以理解为通过将列向量与设置在列向量的左侧的矩阵相乘来获得列向量的运算。

[式5]

在式6中,r

[式6]

作为式6的计算的结果,可以推导目标块的变换系数c

当从变换矩阵的大小的视角考虑时,常规变换矩阵的大小为64×64(N×N),但缩减变换矩阵的大小缩减为16×64(R×N),因此与执行常规变换的情况相比,执行RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规变换矩阵的情况下的乘法计算的数量N×N相比时,使用缩减变换矩阵可以将乘法计算的数量(R×N)减小R/N比率。

在示例中,编码设备200的变换器232可以通过对目标块的残差样本执行一次变换和基于RST的二次变换来推导目标块的变换系数。这些变换系数可以被传送到解码设备300的逆变换器,并且解码设备300的逆变换器322可以基于针对变换系数的逆缩减二次变换(RST)来推导修改的变换系数,并且可以基于针对修改的变换系数的逆一次变换来推导目标块的残差样本。

根据示例的逆RST矩阵T

图6的(b)所示的缩减逆变换块中的矩阵T

更具体地,当逆RST被用作二次逆变换时,当逆RST矩阵T

在示例中,如果应用逆变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图6的(b)的RST可以被表示为以下式7所示的矩阵运算。

[式7]

在式7中,c

[式8]

作为式8的计算的结果,可以推导表示目标块的修改的变换系数或目标块的残差样本的r

表2所示的变换集配置也可以应用于8×8RST。也就是说,可以根据表2中的变换集来应用8×8RST。由于根据帧内预测模式,一个变换集包括两个或三个变换(核),因此可以将其配置为选择包括在不应用二次变换的情况下在内的至多四个变换中的一个。在不应用二次变换的变换中,可以考虑应用恒等矩阵(identity matrix)。假设分别将索引0、1、2和3分配给四个变换(例如,可以将索引0分配给应用恒等矩阵的情况,即,不应用二次变换的情况),可以针对每个变换系数块发信号通知作为语法元素的变换索引或lfnst索引,由此指定要应用的变换。也就是说,针对左上8×8块,通过变换索引,可以指定RST配置中的8×8NSST,或者当应用LFNST时可以指定8×8lfnst。8×8lfnst和8×8RST指代当要变换的目标块的W和H均等于或大于8时可应用于变换系数块中包括的8×8区域的变换,并且8×8区域可以是变换系数块中的左上8×8区域。类似地,4×4lfnst和4×4RST指代当目标块的W和H均等于或大于4时可应用于变换系数块中包括的4×4区域的变换,并且4×4区域可以是变换系数块中的左上4×4区域。

根据本公开的实施方式,对于编码过程中的变换,可以仅选择48条数据,并且可以向其应用最大16×48变换核矩阵,而不是将16×64变换核矩阵应用于形成8×8区域的64条数据。此处,“最大”意味着m在m×48变换核矩阵中具有最大值16以用于生成m个系数。也就是说,当通过将m×48变换核矩阵(m≤16)应用于8×8区域来执行RST时,输入48条数据,并且生成m个系数。当m是16时,输入48条数据并且生成16个系数。也就是说,假设48条数据形成48×1向量,16×48矩阵和48×1向量依次相乘,由此生成16×1向量。这里,形成8×8区域的48条数据可以被适当地布置,由此形成48×1向量。例如,可以基于构成8×8区域当中的除了右下4×4区域之外的区域的48条数据来构造48×1向量。这里,当通过应用最大16×48变换核矩阵来执行矩阵运算时,生成16个修改的变换系数,并且可以根据扫描顺序将16个修改的变换系数布置在左上4×4区域中,并且可以用零填充右上4×4区域和左下4×4区域。

对于解码过程中的逆变换,可以使用前述变换核矩阵的转置矩阵。也就是说,当在由解码设备执行的逆变换过程中执行逆RST或LFNST时,根据预定布置顺序在一维向量中配置应用逆RST的输入系数数据,并且可以根据预定布置顺序将通过将一维向量与在一维向量左侧的对应的逆RST矩阵相乘而获得的修改的系数向量布置到二维块中。

总之,在变换过程中,当RST或LFNST被应用于8×8区域时,在8×8区域的除了右下区域之外的左上区域、右上区域和左下区域中的48个变换系数与16×48变换核矩阵的矩阵运算。对于矩阵运算,以一维阵列输入48个变换系数。当执行矩阵运算时,推导出16个修改的变换系数,并且可以将修改的变换系数布置于8×8区域的左上区域中。

相反,在逆变换过程中,当将逆RST或LFNST应用于8×8区域时,可以根据扫描顺序以一维阵列输入8×8区域中的变换系数当中的对应于8×8区域的左上区域的16个变换系数,并且可以经历与48×16变换核矩阵的矩阵运算。也就是说,矩阵运算可以表示为(48×16矩阵)*(16×1变换系数向量)=(48×1修改的变换系数向量)。这里,n×1向量可以被解释为具有与n×1矩阵相同的含义,并且因此可以被表示为n×1列向量。此外,*表示矩阵乘法。当执行矩阵运算时,可以推导出48个修改的变换系数,并且可以将48个修改的变换系数布置在8×8区域中的除了右下区域之外的左上区域、右上区域和左下区域中。

当二次逆变换基于RST时,编码设备200的逆变换器235和解码设备300的逆变换器322可以包括用于基于对变换系数的逆RST推导修改的变换系数的逆缩减二次变换器以及用于基于对修改的变换系数的逆一级变换来推导目标块的残差样本的逆一次变换器。逆一次变换指代应用于残差的一次变换的逆变换。在本公开中,基于变换推导变换系数可以指代通过应用变换来推导变换系数。

另一方面,当应用LFNST时,可以限制要应用不可分离的二次变换的目标块的最大大小。

例如,可以提出仅当目标块(例如,编码单元、编码块、变换单元或变换块)的高度和宽度等于或小于64时应用LFNST的方法。

另选地,根据另一示例,可以提出仅当目标块的大小小于128×128时应用LFNST的方法。也就是说,宽度和高度中的至少一个小于128,并且可以提出仅将LFNST应用于宽度和高度二者都等于或小于128的情况的方法。

另选地,根据示例,应用LFNST的最大应用块的大小可以限于诸如max_width和max_height之类的信息而不是特定值。也就是说,可以配置为仅在宽度<=max_width和高度<=max_height时应用LFNST。在这种情况下,可以从编码设备向解码设备发信号通知关于max_width的信息和/或关于max_height的信息。

这样,在应用LFNST的目标块的大小的情况下的规范文本如下。

[表3]

如表3所示,lfnst_idx[x0][y0]可以在编码单元语法中发信号通知。lfnst_idx[x0][y0]可以指示变换集中包括的两个变换核矩阵中的任何一个,并且当lfnst_idx为0时,它可以指示不可分离的二次变换,也就是说,不应用LFNST。当lfnst_idx[x0][y0]不存在时,它可以被推断为值0。

另外,lfnst_idx[x0][y0]可以被编码的最大编码块大小被限制为64×64(Max(cbWidth,cbHeight)<=64)。也就是说,通过在编码ifnst_idx的if从句条件中加上Max(cbWidth,cbHeight)<=64,最大应用块的大小被限制为64×64。

在本实施方式中,由于编码块的宽度(cbWidth)和编码块的高度(cbHeight)分别指示亮度分量的编码块的宽度和编码块的高度,在色度分量的情况下,LFNST可以根据图像颜色格式(例如,4:2:0)应用于具有更小的大小的每个块。

具体地,如表3所示,如果目标块的树类型为双树色度,则LFNST可以应用于大小除以SubWidthC和SubHeight的色度块,其指示亮度编码块的大小中的色度格式的变量[lfnstWidth=(treeType==DUAL_TREE_CHROMA)?cbWidth/SubWidthC:cbWidth,lfnstHeight=(treeType==DUAL_TREE_CHROMA)?cbHeight/SubHeightC:cbHeight]。

如果颜色格式为4:2:0,则由于SubWidthC和SubHeight为2,LFNST可以应用于具有通过将亮度块的宽度和高度除以2而获得的宽度和高度的色度块。因此,由于当亮度块的大小等于或小于64×64块时可以应用LFNST,所以当颜色格式为4:2:0时,可以在色度块的大小等于或小于32×32块时应用LFNST。

此外,在本文档中,当块A的水平长度和垂直长度分别为Wa和Ha并且块B的水平长度和垂直长度分别为Wb和Hb时,块A小于块B意指Wa等于或小于Wb且Ha等于或小于Hb,并且Wa与Wb不相等或者Ha与Hb不相等。另外,块A小于或等于块B的含义指示Wa等于或小于Wb并且Ha等于或小于Hb。

总之,当目标块的大小等于或小于预设的最大大小时,可以应用LFNST,该最大大小可以应用于亮度块的大小,并且相应地,可以推导出可以应用LFNST的色度块的最大大小。

另一方面,与表3不同,LFNST应用于亮度分量和色度分量的最大块大小条件可以通过单独的语法信息单独提供。也就是说,对于亮度分量和色度分量,可以单独发信号通知可以应用LFNST的最大大小信息。

根据另一示例,如果仅对于目标块的宽度和高度二者均为128的编码块不应用LFNST,也就是说,如果配置为仅将LFNST应用于小于128×128的块,则if从句可以配置如下。

[表4]

根据另一示例,该lfnst_idx可以在变换单元级别发信号通知。

[表5]

如表5所示,lfnst_idx[x0][y0]的编码部分可以从编码单元语法移动到变换单元语法。也就是说,lfnst_idx[x0][y0]可以以变换单元层级发信号通知。

应用LFNST的目标块的宽度(lfnstWidth)和高度(lfnstHeight)可以根据树类型而变化。在双树色度块的情况下,目标块的宽度(lfnstWidth)和高度(lfnstHeight)被设置为色度变换块的宽度(wC)和色度变换块的高度(hC),并且在其它情况下,目标块的宽度(lfnstWidth)和高度(lfnstHeight)可以被变换块的宽度(tbWidth)或高度(tbHeight)限制[lfnstWidth=(treeType==DUAL_TREE_CHROMA)?wC:tbWidth,lfnstHeight=(treeType==DUAL_TREE_CHROMA)?hC:tbHeight]。在这种情况下,色度变换块的宽度wC和色度变换块的高度hC基于SubWidthC和SubHeightC而被校正以反映颜色格式。

当LFNST索引的编码和信令移动到变换单元层级时,在较大大小的编码单元被划分为若干个变换单元的情况下,例如,当128×128大小的编码单元被划分为四个64×64变换单元时,因为最大可变换块的大小是64,也就是说,当变换单元贴片发生时,LFNST可以应用于对应的变换单元,并且由于LFNST索引是针对每个变换单元发信号通知的,所以不同的变换核可以应用于每个变换单元。

另选地,根据示例,如上所述,LFNST索引可以以编码单元层级发信号通知,并且应用LFNST的目标块的宽度和高度可以限制为变换块的大小,例如,变换块的最大大小。

变换块的最大大小可以从编码设备显式地发信号通知给解码设备,或者可以隐式地推导出。例如,可以发信号通知用于信令变换块的最大大小的索引信息或标志信息,并且当基于该信息推导出变换块的最大大小时,可以基于此来执行LFNST。

下表示出了这一点作为示例。

[表6]

如表6所示,仅当编码单元的宽度和高度的最大值等于或小于变换块的最大大小时才发信号通知lfnst_idx并且可以对目标块执行LFNST[Max(cbWidth,cbHeight)<=MaxTbSizeY]。

这种变换块的最大大小(MaxTbSizeY)可以从诸如序列参数集()之类的更高层级的标志信息(例如,诸如sps_max_luma_transform_size_64_flag的语法信息)推导出。根据示例,变换块的最大大小可以是64×64或32×32。

提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的特定名称或特定信号/消息/字段的名称是为了例示而提供的,所以本公开的技术特征不限于在以下附图中使用的特定名称。

图7是例示根据本公开的实施方式的视频解码设备的操作的流程图。

图7所示的每个操作可以由图3所示的解码设备300执行。具体地,S710可以由图3所示的熵解码器310执行,S720可以由图3所示的解量化器321执行,并且S730和S740可以由图3所示的逆变换器322执行,并且S750可以由图3所示的加法器340执行。根据S710至S750的操作基于参照图4至图6解释的前述细节中的一些。因此,将省略或将简要地描述与上文参照图3至图6解释的那些细节重叠的具体细节的描述。

根据实施方式的解码设备300可以接收包括残差信息的比特流并且从比特流中推导出目标块的量化变换系数(S710)。

更具体地,解码设备300可以从比特流解码关于目标块的量化变换系数的信息,并且可以基于关于目标块的量化变换系数的信息来推导目标块的量化变换系数。关于目标块的量化变换系数的信息可以包括在序列参数集(SPS)或条带报头中,并且可以包括关于是否应用缩减变换(RST)的信息、关于简化因子的信息、关于应用缩减变换的最小变换大小的信息、关于应用缩减变换的最大变换大小的信息、缩减逆变换大小、以及关于指示包括在变换集中的任何一个变换核矩阵的变换索引的信息中的至少一者。

解码设备300还从比特流接收关于LFNST索引和帧内预测模式的信息。此外,解码设备300还可以接收指示逆一次变换的变换核的MTS索引信息。

LFNST索引信息作为语法信息被接收并且语法信息作为包括0和1的二值化bin串被接收。

根据本实施方式的LFNST索引的语法元素可以指示是否应用逆LFNST或逆不可分离的变换以及变换集中包括的变换核矩阵中的任何一个,并且变换集包括两个变换核矩阵。在这种情况下,变换索引的语法元素可以具有三个值。

也就是说,根据实施方式,LFNST索引的语法元素值可以包括0、1和2,0指示逆LFNST没有应用于目标块的情况,1指示变换核矩阵当中的第一变换核矩阵,2指示变换核矩阵当中的第二变换核矩阵。

根据实施方式的解码设备300可以通过对目标块的量化变换系数执行解量化来推导变换系数(S720)。

根据实施方式的解码设备300,在目标块的大小等于或小于预定的最大变换应用块的大小时,可以基于对变换系数的逆不可分离的变换或逆LFNST来推导修改的变换系数(S730)。

解码设备300还可以接收关于最大变换应用块的大小的信息,并且可以在序列参数集层级用诸如sps_max_luma_transform_size_64_flag之类的语法来发信号通知该信息。

此外,最大变换应用块的大小可以被设置为变换块的大小,例如,变换块的最大大小。例如,如果最大变换块的大小为64×64,则最大变换应用块的大小设置为64×64或64,而如果最大变换块的大小为32×32,则最大变换应用块的大小可以设置为32×32或32。

解码设备300可以通过将目标块的宽度或高度中的任何一个(例如,较大的值)与最大变换应用块的大小(即,最大变换应用块的宽度或高度)进行比较来确定是否执行逆不可分离的变换。

另选地,如果目标块的大小大于预定的最大变换应用块的大小,则可以不推导指示用于逆不可分离的变换的预定的变换核矩阵的lfnst索引。也就是说,如果目标块的大小大于预定的最大变换应用块的大小,则可以不发信号通知lfnst索引。如果未推导lfnst索引,则将lfnst索引推断为0,并且不对目标块应用LFNST。

此外,目标块可以是根据示例的编码块,并且可以是根据颜色索引的色度编码块和亮度编码块。根据示例,如果亮度编码块的大小小于或等于最大变换应用块的大小并且颜色格式为4:2:0,则当色度编码块小于或等于最大变换应用块的大小的1/2时可以对色度编码块执行逆不可分离的变换。也就是说,可以将逆LFNST应用于具有通过将亮度块的宽度和高度除以二而获得的宽度和高度的色度块。例如,由于当亮度块的大小等于或小于64×64块时可以应用逆LFNST,因此当颜色格式为4:2:0时在色度块的大小等于或小于32×32块时可以应用逆LFNST。

解码设备300的逆变换器322可以根据应用于目标块的帧内预测模式基于映射关系确定变换集,并且可以基于变换集和LFNST索引的语法元素的值来执行逆LFNST,即,逆不可分离的变换。

如上所述,可以根据要变换的变换块的帧内预测模式确定多个变换集,并且可以基于由LFNST索引指示的包括在变换集中的变换核矩阵中的任何一个来执行逆LFNST。

在一个示例中,可以基于逆LFNST矩阵执行逆不可分离的变换或逆LFNST,并且逆LFNST矩阵可以是列数小于行数的非正方形矩阵。

在一个实施方式中,S730可以包括对变换索引进行解码,基于变换索引(即,LFNST索引)确定其是否对应于应用逆RST的条件,当满足应用逆LFNST的条件时,选择变换核矩阵并基于选择的变换核矩阵和/或简化因子对变换系数应用逆LFNST。在这种情况下,可以基于简化因子来确定简化逆变换矩阵的大小。

另一方面,当不应用LFNST时,如下在逆变换过程中可以仅应用基于MTS的一次逆变换过程。也就是说,解码设备可以如在上述实施方式中那样确定LFNST是否被应用于当前块,并且当没有应用LFNST时,解码设备可以通过一次逆变换从变换系数推导出残差样本。

一次逆变换过程可以被称为逆一次变换过程或逆MTS变换过程。在一些情况下也可以省略这种基于MTS的一次逆变换过程。

根据实施方式的解码设备300可以基于修改的变换系数的逆一次变换来推导目标块的残差样本(S740)。

解码设备300可以对目标块的修改的变换系数执行逆一次变换。在这种情况下,可以将简化的逆变换应用于逆一次变换,或者可以使用传统的可分离的变换。

根据实施方式的解码设备300可以基于目标块的残差样本和目标块的预测样本生成重构样本(S750)。

参照S730,可以确认,基于目标块的变换系数的逆LFNST来推导出目标块的残差样本。关于逆变换矩阵的大小,一般逆变换矩阵的大小为N×N,而逆LFNST矩阵的大小被缩减为N×R,因此与执行一般变换时相比,在执行逆LFNST时可以使存储器占用减少R/N比率。此外,与当使用一般逆变换矩阵时的乘法运算的数量N×N相比,当使用逆LFNST矩阵时,可以将乘法运算的数量减少R/N比率(到N×R)。另外,由于在应用逆LFNST时仅需要解码R个变换系数,所以与应用其中需要解码N个变换系数的一般逆变换相比,目标块的变换系数的总数量可以从N减小到R,因此增加解码效率。也就是说,根据S730,解码设备300的(逆)变换效率和解码效率可以通过逆LFNST增加。

提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的特定名称或特定信号/消息/字段的名称是为了例示而提供的,所以本公开的技术特征不限于在以下附图中使用的特定名称。

图8是例示根据本公开的实施方式的视频编码设备的操作的流程图。

图8所示的每个操作可以由图2所示的编码设备200执行。具体地,S810可以由图2所示的预测器执行,S820可以由由图2所示的减法器231执行,S830和S840可以由图2所示的变换器232执行,并且S850可以由图2所示的量化器233和熵编码器240执行。根据S810至S850的操作基于在图4至图6中描述的内容中的一些。因此,将省略或将简要描述与上文参照图2和图4至图6解释的那些细节重叠的具体细节的描述。

根据实施方式的编码设备200可以基于应用于目标块的帧内预测模式来推导预测样本(S810)。

根据实施方式的编码设备200可以基于预测样本来推导目标块的残差样本(S820)。

根据实施方式的编码设备200可以基于残差样本的一次变换来推导目标块的变换系数(S830)。

可以通过多个变换核来执行一次变换,并且在这种情况下,可以基于帧内预测模式来选择变换核。

编码设备200可以对目标块的变换系数执行二次变换或不可分离的变换,特别是LFNST。

当目标块的大小等于或小于预定的最大变换应用块的大小时,根据实施方式的编码设备200可以基于针对变换系数的LFNST来推导目标块的修改的变换系数(S840)。

最大变换应用块的大小可以被设置为变换块的大小,例如,变换块的最大大小。例如,如果最大变换块的大小为64×64,则最大变换应用块的大小设置为64×64或64,而如果最大变换块的大小为32×32,则最大变换应用块的大小可以设置为32×32或32。

编码设备200可以通过将目标块的宽度或高度中的任何一个(例如,较大的值)与最大变换应用块的大小(即,最大变换应用块的宽度或高度)进行比较来确定是否执行不可分离的变换。

另选地,如果目标块的大小大于预定的最大变换应用块的大小,则可以不推导指示用于不可分离的变换的预定的变换核矩阵的lfnst索引。也就是说,如果目标块的大小大于预定的最大变换应用块的大小,则可以不发信号通知lfnst索引。如果未推导lfnst索引,则将lfnst索引推断为0,并且不对目标块应用LFNST。

此外,目标块可以是根据示例的编码块,并且可以是根据颜色索引的色度编码块和亮度编码块。根据示例,如果亮度编码块的大小小于或等于最大变换应用块的大小并且颜色格式为4:2:0,则当色度编码块小于或等于最大变换应用块的大小的1/2时可以对色度编码块执行不可分离的变换。也就是说,可以将LFNST应用于具有通过将亮度块的宽度和高度除以二而获得的宽度和高度的色度块。例如,由于当亮度块的大小等于或小于64×64块时可以应用逆LFNST,因此当颜色格式为4:2:0时在色度块的大小等于或小于32×32块时可以应用LFNST。

在一个示例中,LFNST可以基于简化的变换矩阵或变换核矩阵来执行,并且简化的变换矩阵可以是其中行数小于列数的非正方形矩阵。

在一个实施方式中,S840可以包括确定是否满足应用LFNST的条件,并且当满足应用LFNST的条件时,基于该确定生成和编码LFNST索引,选择变换核矩阵并且基于选择的变换核矩阵和/或简化因子将LFNST应用于残差样本。在这种情况下,可以基于简化因子来确定简化变换矩阵的大小。

另一方面,当不应用LFNST时,如下在变换过程中可以仅应用基于MTS的一次变换过程。也就是说,编码设备可以如在上述实施方式中那样确定LFNST是否被应用于当前块,并且当没有应用LFNST时,编码设备可以通过一次变换从残差样本推导出变换系数。

该一次变换过程可以被称为一次变换过程或MTS变换过程。在一些情况下也可以省略这种基于MTS的一次变换过程。

根据实施方式的编码设备200可以通过基于目标块的修改的变换系数执行量化来推导量化变换系数,并且可以对关于量化变换系数和LFNST索引的信息进行编码(S850)。也就是说,编码设备可以生成包括关于量化变换系数的信息的残差信息。残差信息可以包括上述变换相关信息/语法元素。编码设备可以对包括残差信息的图像/视频信息进行编码并且以比特流的形式输出编码的图像/视频信息。

更具体地,编码设备200可以生成关于量化变换系数的信息并且对关于所生成的量化变换系数的信息进行编码。

在一个示例中,关于量化变换系数的信息可以包括关于是否应用LFNST的信息、关于简化因子的信息、关于应用LFNST的最小变换大小的信息和关于应用LFNST的最大变换大小的信息中的至少一者。

此外,编码设备200可以在序列参数集层级编码关于最大变换应用块的大小的信息,例如,诸如sps_max_luma_transform_size_64_flag之类的标志信息。

参见S840,可以确认,目标块的变换系数是基于针对残差样本的LFNST来推导的。关于变换核矩阵的大小,一般变换核矩阵的大小是N×N,而简化的变换矩阵的大小被缩减为R×N,因此与执行一般变换时相比,在执行RST时可以使存储器占用减少R/N比率。此外,与当使用一般变换矩阵时的乘法运算的数量N×N相比,当使用简化的变换核矩阵时,可以将乘法运算的数量减少R/N比率(到N×R)。另外,由于在应用RST时仅需要推导R个变换系数,所以与应用其中推导N个变换系数的一般变换相比,目标块的变换系数的总数量可以从N减小到R,因此减少由编码设备200发送到解码设备300的数据量。也就是说,根据S840,编码设备200的变换效率和编码效率可以通过LFNST增加。

在本公开中,可以省略量化/解量化和/或变换/逆变换中的至少一者。当省略量化/解量化时,可以将量化变换系数称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表述一致性仍可以被称为变换系数。

另外,在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在此情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)来推导变换系数,并且可以通过变换系数的逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。这些细节也可以在本公开的其它部分中应用/表达。

在上述实施方式中,借助于一系列步骤或方框基于流程图解释了方法,但是本公开不限于步骤的顺序,并且可以按与上述顺序或步骤不同的顺序或步骤来执行某一步骤,或某一步骤与其它步骤并发地执行。此外,本领域普通技术人员可以理解,流程图中所示的步骤不是排它的,并且在不影响本公开的范围的情况下,可以并入另一步骤或者可以删除流程图中的一个或更多个步骤。

根据本公开的上述方法可以被实现为软件形式,并且根据本公开的编码设备和/或解码设备可以被包括在诸如电视、计算机、智能电话、机顶盒和显示装置等之类的用于图像处理的设备中。

当本公开中的实施方式通过软件来实施时,上述方法可以被实施为用于执行上述功能的模块(步骤、功能等)。这些模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部,并且可以以各种众所周知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。也就是说,本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上实施和执行。例如,每个附图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实施和执行。

此外,应用本公开的解码设备和编码设备可以包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、实时通信装置(诸如视频通信)、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、视频电话视频装置、和医疗视频装置,并且可以用于处理视频信号或数据信号。例如,顶置(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。

另外,应用本公开的处理方法可以以由计算机执行的程序的形式来生产,并且可以存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的各种存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,互联网上的传输)形式实施的介质。另外,通过编码方法所生成的比特流可以存储在计算机可读记录介质中,或者通过有线或无线通信网络来传输。另外,本公开的实施方式可以通过程序代码被实施为计算机程序产品,并且程序代码可以按照本公开的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。

图9例示了应用本公开的内容流系统的结构。

此外,应用本公开的内容流系统可以大致包括编码服务器、流服务器、web服务器、媒体存储装置、用户设备和多媒体输入装置。

编码服务器用于将从诸如智能电话、相机、摄像机等的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且向流服务器发送它。作为另一示例,在诸如智能电话、相机、摄像机等的多媒体输入装置直接生成比特流的情况下,可以省略编码服务器。可以通过应用本公开的编码方法或比特流生成方法来生成比特流。并且流服务器可以在发送或接收比特流的过程期间临时存储比特流。

流服务器基于用户的请求通过web服务器向用户装置发送多媒体数据,web服务器用作向用户通知存在什么服务的器具。当用户请求用户想要的服务时,web服务器将请求传送至流服务器,并且流服务器向用户发送多媒体数据。在此而言,内容流系统可以包括单独的控制服务器,并且在这种情况下,控制服务器用于控制内容流系统中的相应装置之间的命令/响应。

流服务器可以从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收内容的情况下,可以实时地接收内容。在这种情况下,为了平稳地提供流服务,流服务器可以存储比特流达预定时间。

例如,用户装置可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、板式PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。内容流系统中的各个服务器可以作为分布式服务器操作,并且在这种情况下,由各个服务器接收到的数据可以用分布式方式进行处理。

本文所公开的权利要求可以以各种方式组合。例如,本公开的方法权利要求的技术特征可以被组合以在设备中实现或执行,并且设备权利要求的技术特征可以被组合以在方法中实现或执行。此外,方法权利要求和设备权利要求的技术特征可以被组合以在设备中实现或执行,并且方法权利要求和设备权利要求的技术特征可以被组合以在方法中实现或执行。

相关技术
  • 一种自动触发快门及补光的监控拍摄设备
  • 摄像头模组、电子设备及拍摄方法
  • 拍摄方法和装置、电子设备、计算机可读存储介质
  • 一种多焦距图像拍摄方法、电子设备、存储介质
  • 拍摄装置、补光方法、补光装置及电子设备
  • 拍摄补光方法、装置、电子设备及计算机可读存储介质
技术分类

06120116576819