掌桥专利:专业的专利平台
掌桥专利
首页

帧内亮度模式信号

文献发布时间:2023-06-19 09:49:27


帧内亮度模式信号

相关申请案交叉申请

本发明要求阿南德-梅赫-科特拉等人于2019年7月11日递交的申请号为62/696,739,发明名称为“帧内亮度模式信号的改进(Luma Intra Mode SignalingImprovements)”的美国临时申请的优先权,其全部内容通过引用结合在本发明中。

技术领域

本发明涉及视频编码,具体涉及帧内亮度模式信号。

背景技术

即便是较短的视频也需要很大的视频数据量来进行描述,这可能导致在对所述数据进行流式传输或通过带宽容量有限的通信网络进行传送时产生困难。因此,在现代电信网络中传送视频数据之前通常会压缩所述视频数据。由于内存资源可能有限,在存储设备上存储视频时,所述视频的大小也可能成为问题。在传输或存储视频数据之前,视频压缩设备通常在信源处利用软件和/或硬件对所述视频数据进行编码,从而减少表示数字视频图像所需的数据量。然后,对所述视频数据进行解码的视频解压缩设备在目的地接收所述压缩后数据。由于网络资源有限以及对更高视频质量的需求日益增长,需要一种改进的压缩和解压缩技术,以在牺牲很小的图像质量或不牺牲图像质量的情况下提高压缩比。

发明内容

第一方面涉及一种由编码装置实现的编码方法。所述方法包括:所述编码装置为当前块选择帧内预测模式;当所述选择的帧内预测模式为剩余模式时,所述编码装置利用截断二进制编码对所述选择的帧内预测模式进行编码。在一个实施例中,所述方法包括:确定所述选择的帧内预测模式在剩余模式列表中。

下文将更充分地解释,该方法改进了现有帧内模式的信号机制。实施例可用于利用截断的二值化对所有剩余的帧内模式进行编码,例如,不在最可能模式(most probablemode,MPM)列表中的且在比特流中传递的所有帧内模式(又称为“非MPM模式”)。通过对剩余模式使用截断的二值化,可以更高效地使用码字。

在根据第一方面所述的方法的第一种实现方式中,所述方法还包括:确定所述选择的帧内预测模式不在所述MPM列表中。

在根据第一方面或第一方面的上述实现方式所述的方法的第二种实现方式中,所述方法还包括:当所述选择的帧内预测模式为多个剩余模式的前三种模式之一时,利用5个比特对所述选择的帧内预测模式进行编码。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第三种实现方式中,所述方法还包括:当所述选择的帧内预测模式包含在多个剩余模式的第一部分中时,使用N个比特对所述选择的帧内预测模式进行编码;以及当所述选择的帧内预测模式包含在多个剩余模式的第二部分中时,使用N+1个比特对所述选择的帧内预测模式进行编码。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第四种实现方式中,所述方法还包括:当所述选择的帧内预测模式不是多个剩余模式的前三种模式时,利用6个比特对所述帧内预测模式进行编码。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第五种实现方式中,所述剩余模式是61个剩余模式中的一个。

根据第一方面或第一方面的任一前述实现方式所述的方法的第六种实现方式中,所述MPM列表包含6个模式,且所述剩余模式为61个剩余模式中的一个。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第七种实现方式中,所有模式属于所述MPM列表或者属于所述剩余模式。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第八种实现方式中,利用截断二进制编码对所有剩余模式进行编码。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第九种实现方式中,所述方法还包括:利用预定的默认模式列表填充在剩余模式列表中的初始模式。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第十种实现方式中,所述预定的默认模式列表包括平面模式(PLANAR_IDX)、直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2),垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)。

根据第一方面或第一方面的任一前述实现方式所述的方法的第十一种实现方式中,所述方法还包括:使用相对于所述MPM列表中包括的角度模式的偏移量填充所述剩余模式列表中的初始模式。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第十二种实现方式中,所述偏移量为+/–N,其中N为1、2、3或4。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第十三种实现方式,仅将所述偏移量添加到所述MPM列表中的角度模式中的两个中的第一个。

根据第一方面或第一方面的任一前述实现方式所述的方法的第十四种实现方式中,所述方法还包括:利用不与所述当前块直接相邻的相邻块的模式填充剩余模式列表中的初始模式。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第十五种实现方式中,所述方法还包括:利用所述当前块的第二级邻居的模式而不是第一级邻居的模式填充剩余模式列表中的初始模式。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第十六种实现方式中,所述方法还包括:基于所述MPM列表中大多数模式相对于平面模式(PLANAR_IDX)、直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2)、垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)中一个的位置填充所述剩余模式列表中的初始模式。

在根据第一方面或第一方面的任一前述实现方式所述的方法的第十七种实现方式中,所述方法还包括:通过以下操作填充所述剩余模式列表中的初始模式:将所述MPM列表中的各个模式与默认模式列表中不同模式的位置进行比较;确定所述默认模式列表中的不同模式中的获胜的模式与所述MPM列表中的大多数模式最接近;以及利用与所述默认模式列表中的所述不同模式中的获胜的模式最接近的模式填充所述剩余模式列表中的前三个模式。

第二方面涉及一种由解码装置实现的解码方法。所述方法包括:所述解码装置获取截断的二进制码;所述解码装置对所述截断的二进制码进行解码,以获得包括剩余模式的帧内预测模式;以及所述解码装置利用所述获得的帧内预测模式生成当前块。

下文将更充分地解释,该方法改进了现有帧内模式的信号机制。实施例可以用于对所述截断的二进制码进行解码,以获得帧内预测模式,其中所述帧内预测模式为利用截断二进制编码编码的剩余模式中的一个。通过对剩余模式使用截断的二值化,可以更高效地使用码字。

在根据第二方面所述的方法的第一种实现方式中,所述方法还包括:确定所述帧内预测模式不在MPM列表中。

在根据第二方面或第二方面的上述实现方式所述的方法的第二种实现方式中,所述方法还包括:当所述帧内预测模式为多个剩余模式的前三种模式之一时,利用5个比特对所述帧内预测模式进行解码。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第三种实现方式中,所述方法还包括:当所述帧内预测模式不是多个剩余模式的前三种模式时,利用6个比特对所述帧内预测模式进行解码。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第四种实现方式中,所述剩余模式是61个剩余模式中的一个。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第五种实现方式中,所述MPM列表中有6个模式,且所述剩余模式中有61个模式。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第六种实现方式中,所有帧内预测模式属于所述MPM列表或者属于所述多个剩余模式。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第七种实现方式中,利用所述截断二进制编码对所有剩余模式进行编码。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第八种实现方式中,剩余模式列表中的初始模式来自预定的默认模式列表。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第九种实现方式中,所述预定的默认模式列表包括平面模式(PLANAR_IDX)、直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2),垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十种实现方式中,所述剩余模式列表中的初始模式基于相对于所述MPM列表中包括的角度模式的偏移量。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十一种实现方式中,所述偏移量为+/–N,其中N为1、2、3或4。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十二种实现方式中,仅将所述偏移量添加到所述MPM列表中的角度模式中的两个中的第一个。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十三种实现方式中,所述剩余模式列表中的初始模式基于不与所述当前块直接相邻的相邻块的模式。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十四种实现方式中,所述剩余模式列表中的初始模式基于所述当前块的第二级邻居的模式而不是第一级邻居的模式。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十五种实现方式中,所述剩余模式列表中的初始模式基于所述MPM列表中大多数模式相对于平面模式(PLANAR_IDX)、直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2)、垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)中一个的位置。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十六种实现方式中,所述剩余模式列表中的初始模式是通过以下操作确定的:将所述MPM列表中的各个模式与在默认模式列表中不同模式的位置进行比较;确定所述默认模式列表中的不同模式中的获胜的模式与所述MPM列表中的大多数模式最接近;以及利用与所述默认模式列表中的所述不同模式中的获胜的模式最接近的模式填充所述剩余模式列表中的前三个模式。

在根据第二方面或第二方面的任一前述实现方式所述的方法的第十七种实现方式中,模式类别中的所述不同模式包括平面模式(PLANAR_IDX)、直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2)、垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)。

第三方面涉及一种用于执行上述任一编码方法的编码装置。

第四方面涉及一种用于执行上述任一解码方法的解码装置。

第五方面涉及一种编码装置,包括:存储器;以及与所述存储器耦合的处理器,其中,所述处理器用于:为当前块选择帧内预测模式;以及当所述选择的帧内预测模式为剩余模式时,利用截断二进制编码对所述选择的帧内预测模式进行编码。

在根据第五方面所述的编码装置的第一种实现方式中,所述编码装置包括:与所述处理器耦合的发送器,其中,所述发送器用于向解码装置发送所述已编码的选择的帧内预测模式。

在根据第五方面或第五方面的上述实现方式所述的编码装置的第二种实现方式中,所述处理器用于实现上述方面或实现方式中的一个或多个。

所述编码装置的进一步的实现方式对应根据第一方面所述的编码方法的对应的实现方式。

第六方面涉及一种解码装置,包括:接收器,用于获取截断的二进制码;与所述接收器耦合的处理器,其中,所述处理器用于:对所述截断的二进制码进行解码,以获取包括剩余模式的帧内预测模式;以及利用所述获得的帧内预测模式生成当前块。

在根据第六方面所述的解码装置的第一种实现方式中,所述解码装置包括:与所述处理器耦合的显示器,其中,所述显示器用于显示利用所述当前块生成的图像。

在根据第六方面或第六方面的上述实现方式所述的编码装置的第二种实现方式中,所述处理器用于实现上述方面或实现方式中的一个或多个。

所述解码装置的进一步的实现方式对应根据第二方面的所述解码方法的对应的实现方式。

为了描述清晰,上述实施例中的任一项可以与上述其他实施例中的一个或多个结合,以在本发明的范围内构创建的实施例。在具体实施方式中进一步详述了所述实施例。

附图说明

为了更透彻地理解本发明,现参阅结合附图和具体实施方式而描述的以下简要说明,其中的相同参考标号表示相同部分。

图1为可以使用上下文建模技术的示例编码系统的框图;

图2为可以实现上下文建模技术的示例视频编码器的框图;

图3为可以实现上下文建模技术的示例视频解码器的框图;

图4为当前编码单元和5个相邻块的示意图;

图5为当前编码单元、第一级邻居和第二级邻居的示意图;

图6为67个帧内预测模式的示例的示意图;以及

图7为示例视频编解码设备的示意图。

具体实施方式

首先应当理解的是,可以通过任意数量的当前已知的或现有的技术来实现所公开的系统和/或方法。本发明决不应限于下文所述的说明性实现方式、附图和技术,包括本文说明和描述的示例性设计和实现方式。

图1为适于实现各种视频编码、预测或压缩技术的示例编码系统10的框图。如图1所示,所述编码系统10包括源设备12,其中所述源设备12提供目的设备14稍后将解码的已编码视频数据。具体而言,所述源设备12可以通过计算机可读介质16向所述目的设备14提供所述视频数据。所述源设备12和所述目的设备14可包括各种设备中的任一种,包括台式计算机、笔记本(例如,膝上型计算机)、平板电脑、机顶盒、电话听筒,例如所谓的“智能”电话、所谓“智能”平板,电视,相机,显示设备,数字媒体播放器,视频游戏控制台,视频流设备等。在一些情况下,可以配备所述源设备12和所述目的设备14进行无线通信。

所述目的设备14可通过所述计算机可读介质16接收所述待解码的已编码视频数据。所述计算机可读介质16可以包括任何类型的能够将所述已编码视频数据从所述源设备12移动到所述目的设备14的介质或设备。在一个示例中,所述计算机可读介质16可以包括使所述源设备12直接将所述已编码视频数据实时传输至所述目的设备14的通信介质。可以根据无线通信协议等通信标准对所述已编码视频数据进行调制,并将所述已编码视频数据传输至所述目的设备14。所述通信介质可包括任何无线或有线通信介质,例如,射频(radiofrequency,RF)频谱或一个或多个物理传输线路。所述通信介质可以构成分组网络的一部分,所述分组网络例如可以为局域网、广域网或诸如互联网之类的全球网络。所述通信介质可以包括路由器、交换机、基站或有利于从所述源设备12到所述目的设备14的通信的任何其它设备。

在某些示例中,已编码数据可以从输出接口22输出到存储设备。类似地,输入接口可以从所述存储设备访问所述已编码数据。所述存储设备可以包括各种分布式或本地访问的数据存储介质中的任何一种,例如,硬盘、蓝光光盘、数字视频光盘(digital videodisk,DVD)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、闪存、易失性或非易失性存储器或用于存储已编码视频数据的任何其它合适的数字存储介质。在进一步的示例中,所述存储设备可对应于文件服务器或可存储由所述源设备12生成的已编码视频的另一中间存储设备。所述目的设备14可以通过流式传输或下载从所述存储设备访问存储的视频数据。所述文件服务器可以是任何类型的服务器,能够存储已编码视频数据并将所述已编码视频数据传输到所述目的设备14。示例文件服务器包括网络服务器(例如,用于网站)、文件传输协议(file transfer protocol,FTP)服务器、网络附加存储(network attachedstorage,NAS)设备或本地磁盘驱动器。所述目的设备14可以通过包括因特网连接的任何标准数据连接访问所述已编码视频数据。可以包括无线信道(例如,无线保真(wirelessfidelity,Wi-Fi)连接)、有线连接(例如,数字用户线路(digital subscriber line,DSL)、线缆调制解调器等)或两者的组合,所述组合适于访问存储在文件服务器上存储的已编码视频数据。所述存储设备中的所述已编码视频数据的传输可以是流式传输、下载传输或其组合

本发明的技术并不一定限于无线应用或设置。这些技术可应用于视频编码以支持各种多媒体应用中的任一种,例如无线电视广播、有线电视传输、卫星电视传输、互联网流媒体视频传输,例如超文本传输协议动态自适应流媒体(dynamic adaptive streamingover hypertext transfer protocol,DASH)、编码在数据存储介质上的数字视频、存储在数据存储介质上的数字视频的解码或其它应用。在某些示例中,所述编码系统10可用于支持单向或双向视频传输以支持诸如视频流式传输、视频播放、视频广播和/或视频电话等应用。

在图1的示例中,所述源设备12包括视频源18、视频编码器20和输出接口22。所述目的设备14包括输入接口28、视频解码器30和显示设备32。根据本发明,所述源设备12的所述视频编码器20和/或所述目的设备14的所述视频解码器30可用于应用双向预测技术。在其它示例中,源设备和目的设备可以包括其它组件或布置。例如,所述源设备12可以从外部摄像机等外部视频源接收视频数据。同样地,所述目的设备14可以与外部显示设备连接,而不包括集成显示设备。

图1的所述编码系统10只是一个示例。所述双向预测技术可以由任何数字视频编码和/或解码设备执行。尽管本发明的技术通常由视频编码设备执行,但所述技术也可以由视频编码器/解码器执行,通常称为“编解码器”。此外,本发明的技术还可以由视频预处理器执行。所述视频编码器和/或解码器可以是图形处理器(graphics processing unit,GPU)或类似设备。

所述源设备12和所述目的设备14仅仅是该编码设备的示例,其中,所述源设备12生成已编码视频数据以传输到所述目的设备14。在某些示例中,所述源设备12和所述目的设备14可以以基本上对称的方式操作,使得所述源设备12和所述目的设备14分别包括视频编码和解码组件。因此,所述编码系统10可以支持所述视频设备12和14之间的单向或双向视频传输,例如用于视频流式传输、视频播放、视频广播或视频电话。

所述源设备12的所述视频源18可以包括摄像机等视频捕获设备、包含先前捕获的视频的视频库和/或用于从视频内容供应商接收视频的视频馈送接口。在另一替代方案中,所述视频源18可以生成基于计算机图形的数据作为所述源视频,或者生成直播视频、存档视频和计算机生成的视频的组合。

在某些情况下,当所述视频源18为摄像机时,所述源设备12和所述目的设备14可以形成所谓的拍照手机或视频话机。然而,如上所述,本发明中所描述的技术通常可以应用于视频编码,并且可以应用于无线和/或有线应用。在每种情况下,可由所述视频编码器20对所捕获、预捕获或计算机生成的视频进行编码。然后,可以通过所述输出接口22将已编码视频信息输出到所述计算机可读介质16上。

所述计算机可读介质16可包括瞬时介质,例如无线广播或有线网络传输,或存储介质(即,非瞬时性存储介质),例如硬盘、闪存盘、光盘、DVD、蓝光光盘、或其他计算机可读介质。在某些示例中,网络服务器(未示出)可以从所述源设备12接收已编码视频数据,并且例如通过网络传输向所述目的设备14提供所述已编码视频数据。类似地,盘冲压设施等媒体生产设施的计算设备可从所述源设备12接收已编码视频数据,并生产包含所述已编码视频数据的盘。因此,在各种示例中,所述计算机可读介质16可理解为包括一个或多个各种形式的计算机可读介质。

所述目的设备14的所述输入接口28接收来自所述计算机可读介质16的信息。所述计算机可读介质16的信息可以包括由所述视频编码器20定义的语法信息,该信息也由视频解码器30使用,且包括描述块和诸如图像组(group of Picture,GOP)等其它编码单元的特征和/或处理的语法元素。所述显示设备32向用户显示已解码视频数据,且可以包括各种显示设备中的任一种,例如阴极射线管(cathode ray tube,CRT)、液晶显示器(liquidcrystal display,LCD)、等离子显示器、有机发光二极管(organic light emittingdiode,OLED)显示器、或其他类型的显示设备。

所述视频编码器20和所述视频解码器30可根据诸如目前正在开发的高效视频编码(high efficiency video coding,HEVC)标准等视频编码标准进行操作,并且可符合HEVC测试模型(HEVC Test Model,HM)。可替代地,所述视频编码器20和所述视频解码器30可以根据其他专属或行业标准进行操作,例如,国际电信联盟电信标准化部门(International Telecommunications Union Telecommunication StandardizationSector,ITU-T)H.264标准,或称为运动图像专家组(Moving Picture Expert Group,MPEG)-4,第10部分、高级视频编码(advanced video coding,AVC)、H.265/HEVC或其扩展标准。然而,本发明的技术不限于任何特定的编码标准。视频编码标准的其他示例包括MPEG-2和ITU-T H.263。尽管图1没有示出,但是在某些方面,所述视频编码器20和所述视频解码器30可以分别与音频编码器和解码器集成在一起,并且可以包括适当的复用器-解复用器(multiplexer-demultiplexer,MUX-DEMUX)单元,或者其他硬件和软件,以处理共同数据流或单独数据流中的音频和视频的编码。如果适用,所述MUX-DEMUX单元可以符合ITU H.223复用器协议,或其他协议,例如,用户数据报协议(user datagram protocol,UDP)。

所述视频编码器20和所述视频解码器30各自可以实现为各种合适的编码电路中的任一个,例如,一个或多个微处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field programmable Gate array,FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分在软件中实现时,设备可以将所述软件的指令存储在合适的非瞬时性计算机可读介质中,并且利用一个或多个处理器在硬件中执行所述指令,以执行本发明的技术。所述视频编码器20和所述视频解码器30均可包括在一个或多个编码器或解码器中,其中所述编码器或者所述解码器可作为组合式编码器/解码器(combined encoder/decoder,CODEC)的一部分而集成在相应设备中。包括所述视频编码器20和/或所述视频解码器30的设备可以包括集成电路、微处理器和/或无线通信设备,例如蜂窝电话。

图2为可以实现双向预测技术的视频编码器20的示例的框图。所述视频编码器20可对视频分片内的视频块执行帧内和帧间编码。帧内编码依赖于空间预测以减少或移除给定视频帧或图像内的视频中的空间冗余。帧间编码依赖于时间预测以减少或移除视频序列中的相邻帧或图像内的视频中的时间冗余。帧内模式(I模式)可以是指几种基于空间的编码模式中的任何一种。单向预测(P模式)或双向预测(B模式)等帧间模式可以示指几种基于时间的编码模式中的任一种。

如图2所示,所述视频编码器20接收待编码视频帧内的当前视频块。在图2的示例中,所述视频编码器20包括模式选择单元40、参考帧存储器64、加法器50、变换处理单元52、量化单元54和熵编码单元56。所述模式选择单元40依次包括运动补偿单元44、运动估计单元42、帧内预测单元46和划分单元48。对于视频块重建,所述视频编码器20还包括反量化单元58、反变换单元60和加法器62。还可以包括去块效应滤波器(图2中未示出),用于过滤块边界以去除重建视频中块效应。如果需要,所述去块效应滤波器通常会过滤所述加法器62的输出。除所述去块效应滤波器外,还可以使用附加滤波器(环内或环后)。为了简洁,未示出此类滤波器,但是如果需要,所述滤波器(作为环内滤波器)可以过滤所述加法器50的输出。

在编码过程中,所述视频编码器20接收待编码的视频帧或分片。所述帧或分片可以被划分为多个视频块。所述运动估计单元42和所述运动补偿单元44相对于一个或多个参考帧中的一个或多个块对所述接收的视频块执行帧间预测编码以提供时间预测。所述帧内预测单元46还可以相对于与待编码块位于同一帧或分片内的一个或多个相邻块对所述接收到的视频块进行帧内预测编码以提供空间预测。所述视频编码器20可以执行多个编码通道,例如,从而为视频数据的每个块选择适当的编码模式。

此外,所述划分单元48可以基于在先前编码通道中对先前划分方案的评估将视频数据的块划分成子块。例如,所述划分单元48最初可以将帧或分片划分成最大编码单元(largest coding unit,LCU),并且基于率失真分析(例如,率失真优化)将每个所述LCU划分为子编码单元(coding unit,CU)。所述模式选择单元40可进一步产生指示将LCU划分为子CU的四叉树数据结构。所述四叉树的叶子节点CU可以包括一个或多个预测单元(prediction unit,PU)和一个或多个变换单元(transform unit,TU)。

本发明中使用术语“块”来指代HEVC上下文中的CU、PU或TU中的任一个,或其它标准上下文中的类似数据结构(例如,H.264/AVC中的宏块及其子块)。CU包括编码节点以及与所述编码节点相关的PU和TU。所述CU的大小对应于所述编码节点的大小,并且是正方形。所述CU的大小范围可以是从8×8像素到树块的大小,最大值为64×64像素或更大。每个CU可以包含一个或多个PU以及一个或多个TU。例如,与CU相关的语法数据可以描述将CU划分成一个或多个PU。根据对CU进行省略或直接模式编码、帧内预测模式编码或帧间预测模式编码,划分模式可以不同。可以将PU进行划分为非正方形。例如,与CU相关的语法数据还可以描述根据四叉树将所述CU划分成一个或多个TU。TU可以是正方形或非正方形(例如,矩形)。

所述模式选择单元40,例如,可基于误差结果选择帧内或帧间编码模式中的一个模式,并将得到的帧内或帧间编码块提供给所述加法器50以生成残差块数据,并提供给所述加法器62来重构所述已编码块以用作参考帧。所述模式选择单元40还为所述熵编码单元56提供语法元素,例如,运动向量、帧内模式指示符、划分信息和其它此类语法信息。

所述运动估计单元42和所述运动补偿单元44可高度集成,但是出于概念目的而分别说明。所述运动估计单元42执行的运动估计是生成运动向量的过程,这些运动向量估计视频块的运动。例如,运动向量可指示当前视频帧或图像内的视频块的PU相对于参考帧(或其它编码单元)内的预测块的位移,其中所述参考帧内的预测块是相对于所述当前帧(或其它编码单元)内正在被编码的当前块而言的。预测块是发现的在像素差方面与待编码的块紧密匹配的块,该像素差可通过绝对差和(sum of absolute difference,SAD)、平方差和(sum of square difference,SSD)或其它差值度量进行确定。在某些示例中,所述视频编码器20可计算所述参考帧存储器64中存储的参考图像的子整数像素位置的值。例如,所述视频编码器20可插入所述参考图像的四分之一像素位置、八分之一像素位置、或其他分数像素位置的值。因此,所述运动估计单元42可执行针对全像素位置和分数像素位置的运动搜索,并输出具有分数像素精度的运动向量。

所述运动估计单元42通过将PU的位置与参考图像中的预测块的位置进行比较来计算已经进行帧间编码的分片中视频块的PU的运动向量。可从第一参考图像列表(列表0)或第二参考图像列表(列表1)中选择参考图像,每个列表都标识了存储在所述参考帧存储器64中的一个或多个参考图像。所述运动估计单元42向所述熵编码单元56和所述运动补偿单元44发送所述计算出的运动向量。

所述运动补偿单元44执行的运动补偿可包括基于所述运动估计单元42确定的所述运动向量获取或生成预测块。此外,在某些示例中,所述运动估计单元42与所述运动补偿单元44可进行功能性的集成。在接收到所述当前视频块的所述PU的所述运动向量之后,所述运动补偿单元44可以定位一个所述参考图像列表中所述运动向量所指向的所述预测块。所述加法器50通过从正在被编码的所述当前视频块的所述像素值中减去所述预测块的像素值来形成残差视频块,从而形成像素差值,如下所述。一般情况下,所述运动估计单元42执行相对于亮度分量的运动估计,所述运动补偿单元44对色度分量和亮度分量使用基于亮度分量计算得到的运动向量。所述模式选择单元40还可生成与所述视频块和所述视频分片相关联的语法元素,以供所述视频解码器30在解码视频分片的视频块时使用。

所述帧内预测单元46可以对当前块进行帧内预测,作为由所述运动估计单元42和所述运动补偿单元44执行的帧间预测的替代方案,如上所述。具体而言,所述帧内预测单元46可以确定帧内预测模式,用于对当前块进行编码。在某些示例中,所述帧内预测单元46可在,例如,单独的编码通道中利用各种帧内预测模式对当前块进行编码,而所述帧内预测单元46(或者在某些示例中,所述模式选择单元40)可以从测试的模式中选择要使用的适当的帧内预测模式。

例如,所述帧内预测单元46可利用率失真分析对各种测试的帧内预测模式计算率失真值,并从所述测试的模式中选择具有最佳率失真特性的帧内预测模式。率失真分析通常确定已编码块和原始未编码块之间的失真(或误差)量以及确定用于产生已编码块的比特率(即比特数),其中对所述原始未编码块进行编码来产生所述已编码块。所述帧内预测单元46可以计算各种编码块的失真比率和速率,以确定哪个帧内预测模式显示该块的最佳率失真值。

此外,所述帧内预测单元46可用于利用深度建模模式(depth modeling mode,DMM)对深度图的深度块进行编码。所述模式选择单元40,例如,可通过率失真优化(rate-distortion Optimization,RDO)确定可用的DMM模式是否比帧内预测模式和其他DMM模式产生更好的编码结果。对应于深度图的纹理图像的数据可以存储在所述参考帧存储器64中。所述运动估计单元42和所述运动补偿单元44还可以用于对深度图的深度块进行帧间预测。

在为块选择帧内预测模式(例如,传统的帧内预测模式或所述DMM模式中的一个)后,所述帧内预测单元46可向所述熵编码单元56提供指示所述块的所选择的帧内预测模式的信息。所述熵编码单元56可对指示所选择的帧内预测模式的信息进行编码。所述视频编码器20可在所传输的比特流配置数据中包括各种块的编码上下文的定义以及针对每个上下文的要使用的最可能帧内预测模式、帧内预测模式索引表及修改的帧内预测模式索引表的指示,其中所述比特流配置数据包括:多个帧内预测模式索引表和多个修改的帧内预测模式索引表(也称为码字映射表)。

所述视频编码器20通过从正在被编码的原始视频块中减去来自所述模式选择单元40的预测数据形成残余视频块。所述加法器50表示执行该减法运算的一个或多个组件。

所述变换处理单元52对所述残差块进行变换,例如离散余弦变换(discretecosine transform,DCT)或概念上类似的变换,以生成包括残差变换系数值的视频块。所述变换处理单元52可以执行概念上与所述DCT相似的其它变换。还可利用小波变换、整数变换、子带变换或其它类型的变换。

所述变换处理单元52对所述残差块进行变换,以生成残差变换系数的块。该变换可以将残差信息从像素值域转换到变换域,例如,频域。所述转换处理单元52可向所述量化单元54发送所述生成的变换系数。所述量化单元54对所述变换系数进行量化以进一步降低比特率。所述量化过程可以降低与部分或全部系数相关的比特深度。量化的程度可通过调整量化参数进行修改。在某些示例中,所述量化单元54然后可以对包括已量化变换系数的矩阵执行扫描。可替代地,所述熵编码单元56可以执行所述扫描。

量化后,所述熵编码单元56对所述量化的变换系数进行熵编码。例如,所述熵编码单元56可以执行上下文自适应可变长度编码(context adaptive variable lengthcoding,CAVLC)、上下文自适应二进制算术编码(context adaptive binary arithmeticcoding,CABAC)、基于语法的上下文自适应二进制算术编码(syntax-based context-adaptive binary arithmetic coding,SBAC)、概率区间划分熵(probability intervalpartitioning entropy,PIPE)编码或其它熵编码技术。在基于上下文的熵编码中,上下文可基于相邻块。在通过所述熵编码单元56进行熵编码之后,可以将已编码比特流传输到另一设备(例如,所述视频解码器30)或存档以用于稍后的传输或检索。

所述反量化单元58和所述反变换单元60分别应用反量化和反变换,以重建像素域中的残差块,例如,以后用作参考块。所述运动补偿单元44可以将所述残差块添加到所述参考帧存储器64中的一个帧的预测块中,以计算参考块。所述运动补偿单元44还可以将一个或多个插值滤波器应用于所述重建的残差块以计算子整数像素值,以用于运动估计。所述加法器62将所述重建的残差块添加到由所述运动补偿单元44生成的进行运动补偿后的预测块中,以生成重建的视频块以存储在所述参考帧存储器64中。所述运动估计单元42和所述运动补偿单元44可将所述重建的视频块用作参考块,以对后续视频帧中的块进行帧间编码。

图3为可以实现双向预测技术的视频解码器30的示例的框图。在图3的示例中,所述视频解码器30包括熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考帧存储器82和加法器80。在某些示例中,所述视频解码器30可执行与针对所述视频编码器20(图2)描述的编码通道大致相反的解码通道。所述运动补偿单元72可基于从所述熵解码单元70接收的运动向量生成预测数据,而所述帧内预测单元74可基于从所述熵解码单元70接收的帧内预测模式指示符生成预测数据。

在所述解码过程中,所述视频解码器30从所述视频编码器20接收表示已编码视频分片的视频块的已编码视频比特流以及相关联的语法元素。所述视频解码器30的所述熵解码单元70对所述比特流进行熵解码以生成量化的系数、运动向量或帧内预测模式指示符以及其他语法元素。所述熵解码单元70将所述运动向量和其它语法元素转发给所述运动补偿单元72。所述视频解码器30可接收视频分片级和/或视频块级的语法元素。

当所述视频分片被编码为帧内编码(I)分片时,所述帧内预测单元74可基于传递和接收的帧内预测模式和来自当前帧或图像的先前解码块的数据为当前视频分片的视频块生成预测数据。当所述视频帧被编码为帧间编码(即,B、P或GPB)分片时,所述运动补偿单元72基于从所述熵解码单元70接收的运动向量和其它语法元素为当前视频分片的视频块生成预测块。所述预测块可以从一个所述参考图像列表中的一个参考图像中生成。所述视频解码器30可以基于所述参考帧存储器82中存储的参考图像利用默认构造技术构造所述参考帧列表:列表0和列表1。

所述运动补偿单元72通过解析所述运动向量和所述其它语法元素来确定所述当前视频分片的视频块的预测信息,并利用所述预测信息生成所述正在解码的当前视频块的预测块。例如,所述运动补偿单元72利用所述接收到的语法元素中的一些语法元素来确定用于对所述视频分片的所述视频块进行编码的预测模式(例如,帧内预测或帧间预测)、帧间预测分片类型(例如,B分片、P分片、或GPB分片),分片的一个或多个参考图像列表的构造信息,分片的每个帧间编码的视频块的运动向量,分片的每个帧间编码的视频块的帧间预测状态,以及其它信息,以对所述当前视频分片内的所述视频块进行解码。

所述运动补偿单元72还可以基于插值滤波器进行插值。所述运动补偿单元72可以利用所述视频编码器20在视频块编码期间使用的插值滤波器来计算参考块的子整数像素的插值。在这种情况下,所述运动补偿单元72可从接收到的语法元素中确定所述视频编码器20使用的所述插值滤波器,并利用插值滤波器来生成预测块。

对应于深度图的纹理图像的数据可以存储在所述参考帧存储器82中。所述运动补偿单元72还可用于对深度图的深度块进行帧间预测。

尽管本文中利用分片的概念描述了某些实施例,但是实施例可以利用切片和/或切片组来代替分片,或者除了分片之外,还可以使用切片和/或切片组。

缩略语和术语的定义:

CTU/CTB---编码树单元/编码树块;

CU/CB---编码单元/编码块;

PU/PB---预测单元/预测块;

TU/TB---变换单元/变换块;以及

HEVC---高效视频编码。

根据基于块的混合视频编码的成功原理,设计了诸如H.264/AVC和HEVC等视频编码方案。利用这一原理,首先将图像分割成块,然后利用帧内图像预测或帧间图像预测来预测每个块。

ITU-T VCEG(Q6/16)和ISO/IEC MPEG(JTC 1/SC 29/WG 11)正在研究未来视频编码技术标准化的潜在需求,其压缩能力大大超过目前的HEVC标准(包括其当前的和近期的针对屏幕内容编码和高动态范围编码的扩展)。这些小组正在共同合作开展这项探索活动,称为联合视频探索小组(joint video exploration team,JVET),以评估其专家在这一领域提出的压缩技术设计。

通用测试模型(Versatile Test Model,VTM)标准使用35个帧内模式,而基准集合(基准集合,BMS)使用67个帧内模式。为了对67个帧内模式进行编码,BMS中当前帧内模式编码方案使用了以下方法。

为了适应BMS中定向帧内模式数量的增加,使用了具有6个MPM的帧内模式编码方法。涉及两个主要技术方面。

1)6个MPM的衍生。

2)6个MPM和非MPM模式的熵编码。

在BMS中,MPM列表包含的模式被分为三组:相邻帧内模式、衍生帧内模式和默认帧内模式。

图4描绘了当前编码单元400和5个相邻块402。所述当前编码单元400也可以称为当前编码块。5个相邻的帧内预测模式,即,5个相邻块的帧内预测模式,组成MPM列表。所述5个相邻块的位置与合并模式中使用的那些位置相同,即,图4所示的左(L)、上(A)、左下(BL)、右上(AR)和左上(AL)。初始的MPM列表通过在所述MPM列表中插入5种相邻的帧内模式、平面模式和直流模式组成。剪枝过程用于去除重复的模式,使得所述MPM列表中只包括唯一的模式。初始模式被包括的顺序是:左,上,平面,直流,左下,右上,左上。

如果所述MPM列表未满(即,所述列表中候选MPM少于6个),则增加衍生模式,并将所述MPM列表中已包含的角度模式加–1或+1得到这些帧内模式。不对非角度模式,即,直流或平面模式,进行衍生。

最后,如果所述MPM列表仍然不完整,则按照以下顺序添加默认模式:垂直模式、水平模式、帧内模式2和对角线模式。在图6中,这些模式分别显示为HOR_IDX、DIA_IDX、MODE2和VER_IDX。通过该过程,生成唯一包括6个MPM模式的列表。

对于6个MPM的熵编码,使用MPM的截断一元二值化。利用上下文对前三个二进制值进行编码,所述上下文取决于与当前正在传递的二进制值相关的MPM模式。所述MPM模式分为以下三种中的一种:(a)所述模式是否属于水平类别(MPM模式小于或等于对角线方向)、(b)垂直类别(MPM模式大于对角线方向)或(c)非角(直流和平面)类别。相应地,三个上下文用于传递MPM索引。

如下所述对剩余的61个非MPM进行编码。首先,将所述61个非MPM划分为两个集合:选择的模式集合和未选择的模式集合。所述选择的模式集合包含16个模式,其余45个模式被分配给未选择的模式集合。在码流中用标志标识当前模式所属的模式集合。然后,用4比特定长码传递所述选择的集合中的模式,并用截断的二进制码对所述未选择的集合中的模式进行编码。通过对总共61种非MPM模式进行二次采样,生成所选择的模式集合,如下所述:

选择的模式集合={0,4,8,12,16,20,……,60};以及

未选择的模式集合={1,2,3,5,6,7,9,10,……,59}。

不同帧内模式的信号机制的摘要如表1所示。

表1:BMS中当前帧内亮度模式信号

本发明的目的是改进所述帧内模式的信号机制。

认为目前在BMS中描述的帧内模式编码方案是复杂的,因此需要一个更简洁的解决方案。

所述选择的模式集合的缺点是索引列表始终是恒定的且不基于当前块属性(例如,其相邻块帧内模式)进行自适应。未选择的模式集合的缺点是索引列表始终是恒定的且不基于当前块属性(例如,其相邻块帧内模式)进行自适应。

在本发明中,提出了具有6个MPM和61个剩余模式的帧内模式信令机制,其中利用截断二值化方案对所述61个剩余模式进行编码。MPM也可以称为最可能帧内预测模式,剩余模式也可以称为剩余帧内预测模式。因此,实施例可用于利用截断二值化编码所有剩余帧内模式,即,所有不包括在MPM列表中的并在比特流中传递的帧内模式(简称,非MPM模式)。61个剩余帧内模式也可以利用6比特定长码进行编码,但是利用6比特定长码的缺点是,在64个可能的码字中,仅使用61个码字,而不使用剩余的3个码字。提出了截断二值化而不是定长码,截断二值化将仅利用5个比特来传递前3个剩余模式,然后利用6个比特来对剩余的58个模式进行编码。例如,利用一元编码对所述6个MPM模式进行编码。进一步的实施例可用于使用MPM列表和具有不同数量的帧内模式的剩余模式列表,例如,包括多于或少于6个模式的MPM列表以及包括多于或少于61个模式的剩余模式列表。因为定长编码不会高效地利用所有可能的码字,所以在剩余模式的数量不等于两个幂的情况下,实施例可能特别有利。与剩余模式的其它模式相比,利用截断二进制编码的实施例可以利用较少的比特来传递一些模式,从而更高效地传递剩余模式。

编码方法的实施例可以包括:为当前块选择帧内预测模式;当所述选择的帧内预测模式为剩余模式时,利用截断二进制编码对所述帧内预测模式进行编码。所述剩余模式可以包含在剩余模式集合或多个剩余模式中,或者可以是剩余模式集合或多个剩余模式中的一部分,其中所述剩余模式集合或所述多个剩余模式,例如,是剩余模式列表。所述实施例还可以包括:确定所述帧内预测模式不包括在(或不在)MPM列表中,以及利用截断二进制编码对所述选择的帧内预测模式进行编码。在本实施例中,所选择的帧内预测模式不包括在(或不在)MPM列表中。所述实施例可以包括:MPM列表和所述剩余模式,例如,仅包括所述MPM列表和所述剩余模式(非MPM模式),且不区分用于编码或传递的更多的帧内预测模式集合,其中,所述MPM列表不包括所述剩余模式的帧内预测模式。在本实施例中,所述MPM列表可以包括6个帧内预测模式,所述剩余模式可以包括61个模式。所述实施例可以包括:将截断的二进制码添加到比特流。进一步的实施例包括:编码器,例如,编码装置或设备,用于执行所述编码方法中的任何一项。

解码方法的实施例可以包括:例如,通过解析比特流或通过其它方式获取截断的二进制码;解码所述截断的二进制码,以获取,例如,多个剩余模式或剩余模式的集合中的剩余模式的帧内预测模式;并利用所获得的帧内预测模式生成当前块。结合所述编码方法描述的更多的特征同样或相应地应用于相应的解码实施例。进一步的实施例包括:解码器,例如,解码装置或设备,用于执行所述解码方法中的任一项。

提出了几种解决方案来填充剩余模式列表中的前三种模式。

可以通过几种可能的方式填充所述剩余模式列表中的所述前三种模式。

首先,利用预定的默认模式列表中的模式,其中所述预定的默认模式列表为{平面模式(PLANAR_IDX,对应于索引“0”),直流模式(DC_IDX,对应索引为“1”),垂直模式(VER_IDX),水平模式(HOR_IDX),帧内模式2(MODE2,对应于索引“2”)、垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)}(括号内的术语表示图6中的对应术语,以下为对图6的进一步详细说明,所述默认模式列表仅包括帧内预测模式,也可以称为默认帧内预测模式列表)。

第二,利用相对于角度模式(角帧内预测模式)的偏移量,其中所述角度模式已经在所述MPM列表中。这里的偏移量可以为+/–N,其中N为{1,2,3,4}中可能的整数值。所述偏移量只能添加到所述MPM列表中的前两种角度模式中。

第三,还可以利用非相邻邻居的帧内模式(角帧内预测模式)来填充这三种模式。图5描述了当前编码单元500、第一级邻居502和第二级邻居504。如图5所示,可以使用第二级邻居的帧内模式。

第四,如图6所示,在第一步中,从MPM列表中获取给定模式,并检查该模式是否“接近于”以下模式类别之一:{DC_IDX,HOR_IDX,DIA_IDX,VER_IDX,VDIA_IDX}中。在第二步中,然后根据与其接近的模式的“大多数”来对所述模式类别进行“排序”。在第三步中,通过插入与步骤2中获胜的模式类别靠近的模式来生成所述剩余模式列表。

图6示出了67个帧内预测模式的示例,例如,如针对通用视频编码(versatilevideo coding,VVC)所提出的,67个帧内预测模式中的多个帧内预测模式包括:平面模式(索引0)、直流模式(索引1)和具有索引2至66的角度模式。其中,图3中的左下处的角度模式是指索引2,索引的编号递增,直到索引66,即,图6中的右上处的角度模式。

所述处理电路可以在硬件中实现,或者通过硬件和软件的组合实现,例如,通过软件可编程处理器等实现。

图7为根据本发明实施例的网络设备700的示意图。所述网络设备700适用于实现本文描述的公开实施例。所述网络设备700包括:入端口710和接收器单元(Rx)720,用于接收数据;处理器、逻辑单元或中央处理器(central processing unit,CPU)730,用于处理所述数据;发送器单元(Tx)740和出端口750,用于传输所述数据;以及存储器760,用于存储所述数据。所述网络设备700还可以包括与所述入端口710、所述接收器单元720、所述发送器单元740和所述出端口750耦合的光电(optical-to-electrical,OE)组件和电光(electrical-to-optical,EO)组件,用于光/电信号的出/入。

所述处理器730通过硬件和软件实现。所述处理器730可以实现为一个或多CPU芯片、核芯(例如,多核处理器)、现场可编程门阵列(field-programmable gate array,FPGA)、专用集成电路(application specific integrated circuit,ASIC)和/或数字信号处理器(digital signal processor,DSP)。所述处理器730与所述入端口710、所述接收器单元720、所述发送器单元740、所述出端口750和所述存储器760通信。所述处理器730包括编解码模块770。所述编解码模块770实现上述公开的实施例。例如,所述编解码模块770实现、处理、准备或提供各种组网功能。因此,包括所述编解码模块770大大改进了所述网络设备700的功能,并实现了所述网络设备700向不同状态的转换。可替代地,所述编解码模块770实现为存储在所述存储器760中并由所述处理器730执行的指令。

所述存储器760包括一个或多个磁盘、磁带驱动器和固态硬盘,可用作溢出数据存储设备,以在选择执行程序时存储所述程序,并存储程序执行期间读取的指令和数据。所述存储器760可以是易失性和/或非易失性,并且可以是只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、三态内容寻址存储器(ternarycontent addressable memory,TCAM)和/或静态随机存取存储器(static random-accessmemory,SRAM)。

以下实施例中展示了本发明的额外的细节。

实施例一:一种用于基于MPM列表和具有第一部分和第二部分的剩余模式列表确定所采用的帧内预测模式的装置。所述采用的帧内预测模式是包括多个角帧内预测模式的多个帧内预测模式中的一个,所述角帧内预测模式用于预测当前图像块的采样值。所述装置包括处理电路,用于执行以下操作:通过包括基于所述MPM列表确定的一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分,使得所述剩余模式列表的所述第一部分中的所述一个或多个角帧内预测模式接近所述MPM列表中的对应的角帧内预测模式;如果所述采用的帧内预测模式是所述剩余模式列表的所述第一部分的一部分,与所述采用的帧内预测模式是所述剩余模式列表的所述第二部分的一部分的情况相比,利用更少的用于对所述采用的帧内预测模式进行编码或解码的比特确定所述采用的帧内预测模式。

实施例二:在根据实施例一所述的装置中,所述处理电路用于通过以下方式生成所述剩余模式列表的所述第一部分:根据所述MPM列表中落入每个角帧内预测模式类别内的角帧内预测模式的数量和/或方向对多个角帧内预测模式类别进行排列;以及通过在所述剩余模式列表中包括排名最高的角帧内预测模式类别中的一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分。

实施例三:在根据实施例二所述的装置中,所述剩余模式列表的第一部分是从包括五个角帧内预测模式类别的预定的默认模式列表中获得的,其中,所述预定的默认模式列表为直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2)、垂直对角线模式(VDIA_IDX)和对角线模式DIA_IDX。例如,所述MPM列表中的角帧内预测模式落入每个角帧内预测模式类别中对应于将所述MPM列表中的每个角帧内预测模式与最接近于所述MPM列表中对应的角帧内预测模式的角帧内预测模式类别相关联。

实施例四:在根据实施例二或三所述的装置中,所述处理电路还用于通过利用所述排名第二的角帧内预测模式类别重复步骤(ii)来完成所述剩余模式列表的所述第一部分。

实施例五:在根据实施例二或三所述的装置中,每个帧内预测模式由帧内预测模式索引识别,且所述处理电路用于基于与水平方向、垂直方向和一个或多个对角线方向相关联的相应的角帧内预测模式定义所述多个角帧内预测模式类别。

实施例六:在根据前述实施例中任一实施例所述的装置中,每个帧内预测模式由帧内预测模式索引识别,且所述处理电路用于通过在所述剩余模式列表的所述第一部分中包括一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分,其相应的帧内预测模式索引相对于所述MPM列表中的角帧内预测模式的帧内预测模式索引具有+1、–1、+2、–2、+3、–3、+4或–4的偏移量。

实施例七:在根据实施例中六所述的装置中,所述MPM列表中的每个列表元素由MPM索引识别,且所述处理电路用于通过在所述剩余模式列表的所述第一部分中包括一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分,其相应的帧内预测模式索引相对于所述MPM列表中的角帧内预测模式的帧内预测模式索引具有+1、–1、+2、–2、+3、–3、+4或–4的偏移量。

实施例八:在根据实施例七所述的装置中,所述处理电路用于通过基于处理循环在所述剩余模式列表的所述第一部分中包括一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分,其中所述处理循环从相对于所述MPM列表中的的角帧内预测模式的帧内预测模式索引的偏移量+1开始,且所述偏移量在每个处理循环期间递增,或者所述处理循环从相对于所述MPM列表中的角帧内预测模式的帧内预测模式索引的偏移量–1开始,且所述偏移量在每个处理循环期间递减。

实施例九:在根据实施例八所述的装置中,所述处理电路用于:相对于针对具有大MPM索引的所述MPM列表中的角帧内预测模式的处理循环而言,更经常地重复针对具有小MPM索引的所述MPM列表中的角帧内预测模式的处理循环。

实施例十:在根据实施例中八所述的装置中,所述处理电路用于通过在所述剩余模式列表的所述第一部分中包括一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分,其相应的帧内预测模式索引相对于所述MPM列表中的角帧内预测模式的帧内预测模式索引具有+2、–2、+4、–4、+6、–6、+8或–8的偏移量。

实施例十一:在根据上述实施例中任一实施例所述的装置中,所述处理电路还用于通过在所述剩余模式列表的第二部分中包括所述多个帧内预测模式中的不属于所述MPM列表和所述剩余模式列表的第一部分的帧内预测模式来生成所述剩余模式列表的所述第二部分。

实施例十二:在根据前述实施例中任一实施例所述的装置中,所述处理电路还用于在硬件中或硬件和软件的组合中实现。

实施例十三:在根据上述实施例中任一实施例所述的装置中,所述处理电路还用于利用所述采用的帧内预测模式预测所述当前图像块的采样值,并提供预测的图像块。

实施例十四:在根据实施例十三所述的装置中,所述装置为编码装置,且所述处理电路还用于:基于所述预测的图像块和所述采用的帧内预测模式对所述当前图像块进行编码。

实施例十五:在根据实施例十四所述的装置中,所述处理电路还用于:如果所述帧内预测模式属于所述剩余模式列表,则传递用于所述当前图像块的帧内预测模式的截断的二进制码。

实施例十六:在根据实施例十五所述的装置中,所述装置为解码装置,且所述处理电路还用于:基于所述预测的图像块和所述采用的帧内预测模式对所述当前图像块进行解码。

实施例十七:在根据实施例十六所述的装置中,所述处理电路还用于:如果所述帧内预测模式属于所述剩余模式列表,则解析所述截断的二进制码以确定所述当前图像块的帧内预测模式。

实施例十八:一种用于基于MPM列表和具有第一部分和第二部分的剩余模式列表确定所采用的帧内预测模式的方法。所述采用的帧内预测模式是包括多个用于预测当前图像块的采样值的角帧内预测模式的多个帧内预测模式中的一个。所述方法包括:通过包括基于所述MPM列表确定的一个或多个角帧内预测模式来生成所述剩余模式列表的所述第一部分,使得所述剩余模式列表的所述第一部分中的所述一个或多个角帧内预测模式接近所述MPM列表中的对应的角帧内预测模式;以及如果所采用的帧内预测模式是所述剩余模式列表的第一部分的一部分,与所述采用的帧内预测模式是所述剩余模式列表的所述第二部分的一部分的情况相比,利用更少的用于对所述采用的帧内预测模式进行编码或解码的比特确定所采用的帧内预测模式。

实施例十九:一种计算机程序产品,包括程序代码。所述程序代码用于在由计算机或处理器执行时,执行根据实施例十四所述的方法。

实施例二十:在根据实施例一至十三中任一项所述的装置中,所述处理电路还用于:从包括以下模式的预定的默认模式列表中确定所述剩余模式列表的所述第一部分,其中所述预定的默认模式列表包括平面模式(PLANAR_IDX)、直流模式(DC_IDX)、垂直模式(VER_IDX)、水平模式(HOR_IDX)、帧内模式2(2),垂直对角线模式(VDIA_IDX)和对角线模式(DIA_IDX)。

实施例二十一:在根据实施例一至十三中任一项所述的装置中,所述处理电路还用于通过包括所述当前图像块的第二级邻居的所述帧内预测模式确定所述剩余模式列表的所述第一部分。

实施例二十二:在编码器和解码器处,对非MPM帧内模式利用截断二值化来传递所述帧内模式。

实施例二十三:由于截断二值化用于编码61个非MPM,因此需要5个比特来传递前三个模式,且非MPM列表中的前三个模式是基于已包含在MPM列表中的帧内模式生成的。

虽然本发明中已提供若干实施例,但应理解,在不脱离本发明的精神或范围的情况下,本发明所公开的系统和方法可以以许多其它特定形式来体现。本发明的实例应被视为说明性而非限制性的,且本发明并不限于本文本所给出的细节。例如,各种元件或部件可以在另一系统中组合或合并,或者某些特征可以省略或不实施。

此外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可以与其它系统、模块、技术或方法进行组合或集成。展示或论述为彼此耦合或直接耦合或通信的其它项也可以采用电方式、机械方式或其它方式经由某一接口、设备或中间组件间接地耦合或通信。其他变化、替代和改变的示例可以由本领域的技术人员在不脱离本文精神和所公开的范围的情况下确定。

相关技术
  • 帧内亮度模式信号
  • 改进型帧内亮度预测模式编码方法及装置
技术分类

06120112318756