掌桥专利:专业的专利平台
掌桥专利
首页

视频编码方法

文献发布时间:2023-06-19 12:07:15


视频编码方法

技术领域

本发明属于视频编码技术领域,具体涉及一种视频编码方法。

背景技术

视频技术已经广泛地应用于移动终端、网络直播、家庭影院和远程监控等领域,视频分辨率也逐步从标清(Standard Definition,SD)向高清(High Definition,HD)、超高清(Ultra High-Definition,UHD)进行转变,当前国际常用的视频编解码标准有H.264、H.265/HEVC(High Efficiency Video Coding,高效视频编码)以及国内的AVS(AudioVideo coding Standard,音视频编码标准)、AVS+、AVS2等。

HEVC编码器将每帧图像划分为若干个相同尺寸的CTU(Coding Tree Unit,编码树单元),每个CTU又根据各区域的纹理和运动等信息划分成64x64、32x32、16x16和8x8等不同尺寸的CU(Coding Unit,编码单元),这些不同尺寸的CU对应的CU深度分别为0、1、2、3。较大尺寸的CU通常能够节省较多的码率,但是编码失真较大,而较小的CU尺寸通常消耗较多的码率,但是编码失真较小。

为了兼顾码率和失真,HEVC编码器采用四叉树形式对CU进行递归处理,如图1所示,通过对比各尺寸CU的RDCost(Rate Distortion Cost,率失真代价)来决定CU尺寸,选择出具有最小RDcost的CU尺寸作为最优CU尺寸,上述RDcost的计算为:

RDcost=λ·R+SSD

其中λ为拉格朗日因子,R代表码率,SSD代表编码失真,该方法称之为基于拉格朗日率失真的CU尺寸选择方法,它能够选择出码率消耗少而且编码失真小的CU尺寸,如图2为某视频采用该方法的CU尺寸划分结果,其中黑色平坦的区域通常选择了大尺寸CU,而纹理复杂的区域则通常会选择较小尺寸的CU。

HEVC编码采用了高效的预测编码和变换编码技术,预测编码为利用时、空域上有相关性的CU的像素来预测当前CU的像素,从而减少了当前CU所需要携带的数据信息;变换编码将CU预测像素和CU原始像素相减形成编码残差,并将编码残差进行DCT(DiscreteCosine Transform,离散余弦变换)和量化进一步压缩残差信息。

DCT将编码残差信息的能量大部分集中于频率域的一个小范围内,这样一来,描述不重要的分量只需要很少的比特数,另外,频率域分解映射了人类视觉系统的处理过程,并允许后继的量化过程满足其灵敏度的要求,DCT变换公式为:

其中X为编码残差系数矩阵,Y表示DCT系数矩阵,C为变换矩阵,E为修正矩阵。

传统基于拉格朗日率失真的CU尺寸选择方法虽然选择出码率较小且客观编码失真较小的CU尺寸,但不能选择出最符合人眼主观感受的CU尺寸。对于一个同时包含平坦区域和纹理区域的CU,在HEVC编码器的DCT过程中高频信息分布不够集中,导致量化过程很难消除这些高频信息,在解码重建时高频信息会传递到平坦区域,使平坦区域看起来有明显的噪声,将其称为局部平坦块噪声。

发明内容

针对以上问题,本发明提供了一种视频编码方法。

为解决上述技术问题,本发明采用如下的技术方案:

一种视频编码方法,包括:

步骤1,开始某一CU深度的CU划分判断;

步骤2,求取CU的亮度方差值var1,如果var1大于第一阈值TH1,则执行步骤3,否则执行步骤4;

步骤3,对当前CU的编码残差进行DCT和量化,并统计当前CU中量化系数大于0的个数,标记为N1,如果N1大于第二阈值TH2,则判定当前CU应该划分,否则执行步骤4;

步骤4,根据拉格朗日率失真的CU尺寸选择方法判断是否将当前CU划分,若是则判定当前CU应该划分;若否则判定当前CU不应该划分。

优选地,第一阈值TH1的取值范围在[1,1000]之间。

优选地,第一阈值TH1的取值为600。

优选地,第二阈值TH2的取值范围在[1,20]之间。

优选地,第二阈值TH2的取值为8。

优选地,亮度方差值var1具体为:

其中N表示当前CU中像素的个数,y

优选地,步骤3中,量化系数为:

其中,y(i,j)表示在DCT系数矩阵Y中位置为(i,j)的DCT系数,L(i,j)是位置为(i,j)的量化系数,Q

采用本发明具有如下的有益效果:利用局部平坦块的亮度方差值,并判断如果亮度方差值偏大,则认为其易产生噪声,此时使CU倾向于选择较小尺寸;根据量化后非零系数的个数,并判断如果该数目偏大,则编码失真较大,此时使CU选择较小CU尺寸。通过本发明实施例提供的方法使局部平坦块的CU尺寸更加合理,可以减少局部平坦块噪声,提升视频主观质量。

附图说明

图1为现有技术中CTU的四叉树分割结构示意图;

图2为现有技术中基于拉格朗日率失真的CU尺寸划分示意图;

图3为本发明实施例的视频编码方法的步骤流程图;

图4为以开源x265视频编码器为实验平台和对比平台的图片示意图;

图5为通过本发明实施例的方法进行视频编转码后的图片示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图3,所示为本发明实施例的视频编码方法的步骤流程图,包括:

步骤1,开始某一CU深度的CU划分判断;

步骤2,求取CU的亮度方差值var1,如果var1大于第一阈值TH1,则执行步骤3,否则执行步骤4;其中,阈值TH1的取值范围在[1,1000]之间,典型值为600。

步骤3,对当前CU的编码残差进行DCT和量化,并统计当前CU中量化系数大于0的个数,标记为N1,如果N1大于第二阈值TH2,则判定当前CU应该划分,否则执行步骤4;其中,阈值TH2的取值范围在[1,20]之间,典型值为8。

步骤4,根据拉格朗日率失真的CU尺寸选择方法判断是否将当前CU划分,若是则判定当前CU应该划分;若否则判定当前CU不应该划分。

具体应用实例中,亮度方差值var1具体为:

其中N表示当前CU中像素的个数,y

量化过程实际上就是对DCT系数的一个优化过程,它是利用了人眼对高频部分不敏感的特性来实现数据的大幅简化,量化过程实际上是简单地把频率领域上每个成份,除以一个对于该成份的常数,且接着四舍五入取最接近的整数。具体应用实例中,步骤3中,量化系数为:

其中,y(i,j)表示在DCT系数矩阵Y中位置为(i,j)的DCT系数,L(i,j)是位置为(i,j)的量化系数,Q

以开源x265视频编码器为实验平台和对比平台,利用局部平坦块的亮度方差值和CU在量化后非零系数的个数,使易产生噪声的区域选择较小CU尺寸,从而减少局部平坦块噪声,提升主观质量。如下图4和图5分别为x265方法和本发明方法的编码输出图,可以看出,x265方法中在平坦和纹理交界区域的噪声非常明显,如图4中黑色方框部分,光线的旁边有很多条纹形状的噪声,而本发明方法在平坦和纹理交界区域则噪声很少,说明本发明方法对局部平坦块噪声的改善有明显效果,如图5黑色方框部分。本发明通过高效去除局部平坦块噪声的方法来优化视频主观质量,可应用于H265/HEVC、AVS2等视频压缩标准。

应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。

技术分类

06120113173199