掌桥专利:专业的专利平台
掌桥专利
首页

一种视频压缩方法及装置

文献发布时间:2023-06-19 16:04:54



技术领域

本发明涉及图像处理领域,具体涉及一种视频压缩方法及装置。

背景技术

近年来,随着视频质量要求的提高、视频数据量的激增,对视频压缩编码技术提出了更高的要求,通过引进众多先进的编码工具可以大大提高编码效率,目前,在编码单元(CU)划分快速算法方面,多是基于图像块的空间域特征对编码进行指导的根据划分后的结果进行视频的压缩编码,但随着划分过程中非方形块的出现,视频压缩的复杂度和编码运算量大幅增加。

发明内容

因此,本发明要解决的技术问题在于克服现有技术中的由于非方形图像块的出现导致视频压缩的复杂度和编码运算量大幅增加的缺陷,从而提供一种视频压缩方法及装置。

根据第一方面,本发明实施例提供了一种视频压缩方法,所述方法包括:

获取待压缩视频图像块;

计算所述待压缩视频图像块的变换系数;

基于所述变换系数,确定所述待压缩视频图像块的划分指导方式;

基于所述划分指导方式,对所述待压缩视频图像块进行划分,得到划分结果;

基于所述划分结果,对所述待压缩视频图像块进行压缩。

可选地,所述基于所述变换系数,确定所述待压缩视频图像块的划分指导方式,包括:

基于所述变换系数,计算得到所述待压缩视频图像块的水平频率特征值、垂直频率特征值和结构复杂度;

基于所述水平频率特征值、所述垂直频率特征值和所述结构复杂度,确定所述待压缩视频图像块的划分指导方式。

可选地,所述基于所述水平频率特征值、所述垂直频率特征值和所述结构复杂度,确定所述待压缩视频图像块的划分指导方式,包括:

基于所述结构复杂度确定所述待压缩视频图像块的划分方式;

当所述水平频率特征值大于所述垂直频率特征值时,确定所述待压缩视频图像块的划分方向为水平划分;

当所述水平频率特征值小于所述垂直频率特征值时,确定所述待压缩视频图像块的划分方向为垂直划分。

可选地,所述基于所述划分指导方式,对所述待压缩视频图像块进行划分,得到划分结果,包括:

当所述划分方向为水平划分时,基于所述划分方式沿水平方向对所述待压缩视频图像块进行划分,得到划分结果。

可选地,所述基于所述划分指导方式,对所述待压缩视频图像块进行划分,得到划分结果,还包括:

当所述划分方向为垂直划分时,基于所述划分方式沿垂直方向对所述待压缩视频图像块进行划分,得到划分结果。

可选地,所述计算所述待压缩视频图像块的变换系数,包括:

将所述待压缩视频图像块进行切分,得到方形图像块集合,所述方形图像块集合内包含多目标方形图像块;

依次获取所述目标方形图像块的像素值;

基于各目标方形图像块的像素值,确定所述待压缩视频图像块的变换系数。

可选地,所述将所述待压缩视频图像块进行切分,得到方形图像块集合,所述方形图像块集合内包含多目标方形图像块,包括:

判断所述待压缩视频图像块是否为方形块;

当所述待压缩视频图像块为方形块时,将方形图像块集合确定为所述待压缩视频图像块;

当所述待压缩视频图像块为非方形块时,从所述待压缩视频图像块中提取面积最大的方形区域图像,对所述方形区域图像进行切分,得到方形图像块集合。

根据第二方面,本发明实施例提供了一种视频压缩装置,所述装置包括:

获取模块,用于获取待压缩视频图像块;

第一计算模块,用于计算所述待压缩视频图像块的变换系数;

第二计算模块,用于基于所述变换系数,确定所述待压缩视频图像块的划分指导方式;

第三计算模块,用于基于所述划分指导方式,对所述待压缩视频图像块进行划分,得到划分结果;

压缩模块,用于基于所述划分结果,对所述待压缩视频图像块进行压缩。

根据第三方面,本发明实施例提供了一种电子设备,包括:

存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。

根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。

本发明技术方案,具有如下优点:

本发明提供的视频压缩方法及装置,通过获取待压缩视频图像块;计算所述待压缩视频图像块的变换系数;基于所述变换系数,确定所述待压缩视频图像块的划分指导方式;基于所述划分指导方式,对所述待压缩视频图像块进行划分,得到划分结果;基于所述划分结果,对所述待压缩视频图像块进行压缩。通过利用变换系数确定待压缩视频图像块的划分指导方式,根据划分指导方式对待压缩视频图像块进行划分,最后根据划分结果,对待压缩视频图像块进行压缩,不仅充分考虑了视频图像的频率特征,还在视频压缩过程中在尽可能少损失性能的前提下大幅降低了视频压缩的复杂度,减少了编码运算量。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的视频压缩方法的流程图;

图2为本发明实施例的视频图像块的划分方法流程图;

图3为本发明实施例的视频压缩装置的结构示意图;

图4为本发明实施例的一种电子设备的结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

本发明实施例提供了一种视频压缩方法,如图1所示,该视频压缩方法具体包括如下步骤:

步骤S101:获取待压缩视频图像块。

具体地,在实际应用中,根据通用视频编码标准,如VVC/H.266、AVS3、AV1等,都是以图像块为基本单元进行块划分,并进行后续的帧内或帧间预测模式的选择。不同的视频编解码标准的CU块划分方式有区别,比如VVC的CU块划分方式以四叉树(QT)+二叉树(BT)+三叉树(TT)为主,AVS3的CU块划分方式以四叉树(QT)+二叉树(BT)+扩展四叉树(EQT)为主。但确定一个块最后的划分方式的方法是大体相同的,都要通过率失真优化(RateDistortion Optimization,RDO)遍历计算该块每种划分方式的代价,最后再选择代价最小的划分方式作为该块的划分方式,所以整个过程是很耗时的,因此如何在不影响性能的前提下,

步骤S102:计算待压缩视频图像块的变换系数。

具体地,在实际应用中,视频的频率域可以反映出图像的大量特征信息,包括很多空间域看不到的信息,通过计算得到变换系数,根据变换系数指导视频图像块进行划分,不仅降低了视频压缩的复杂度,还在一定程度上得到优于传统的以空间域特征为基础依据的算法的压缩效果。

优选地,本发明实施例采用离散余弦变换(Discrete Cosine Transform,DCT)系数反映图像频率域特征的方法来反映图像块结构信息,从而指导进行块划分。DCT变换是频率域工具里一个典型代表,效果好且有相应的快速算法,各编\解码框架下也有它的身影,采用图像块DCT变换系数反映的特征信息来指导CU划分会有较好的效果,但实际情况不限于此,为保证准确反映图像块结构信息而选择其它频率域变换工具的情况,也在本发明实施例提供的一种视频压缩方法的保护范围之内。

具体地,在一实施例中,上述步骤S102具体包括如下步骤:

步骤S201:将待压缩视频图像块进行切分,得到方形图像块集合,方形图像块集合内包含多目标方形图像块。

具体地,在一实施例中,上述步骤S201具体包括如下步骤:

步骤S301:判断待压缩视频图像块是否为方形块。

具体地,在实际应用中,待压缩的视频图像块可能为方形图像块或者非方形图像块,不论是方形图像块还是非方形图像块,图像块的长宽比满足1:1、1:2、1:4、1:8其中的一种,因此,通过对待压缩视频图像块进行切分,最终均会得到方形图像块。

步骤S302:当待压缩视频图像块为方形块时,将方形图像块集合确定为待压缩视频图像块。优选地,当待压缩视频图像块为方形块时,为满足不同的压缩品质要求,还可以在获取待压缩视频图像块时,将方形块的尺寸数值进行调整。示例性地,方形块尺寸可以为4×4、8×8等,从而减少编码运算量。

步骤S303:当待压缩视频图像块为非方形块时,从待压缩视频图像块中提取面积最大的方形区域图像,对方形区域图像进行切分,得到方形图像块集合。具体地,当待压缩视频图像块为非方形块时,以视频图像块的最短边为边长,对待压缩视频图像块进行切分,得到若干方形块,若干方形块组成方形图像块集合。

步骤S202:依次获取目标方形图像块的像素值。

步骤S203:基于各目标方形图像块的像素值,确定待压缩视频图像块的变换系数。在实际应用中,基于各目标方形图像块的像素值,对目标方形图像块进行DCT变换,将二维图像从空间域转换到频率域的同时,确定待压缩视频图像块的DCT系数。

步骤S103:基于变换系数,确定待压缩视频图像块的划分指导方式。

具体地,在实际应用中,本发明实施例对于不同尺寸的视频图像块都可以进行操作,对于非方形块先进行拆分再做DCT变换统计分析,然后依据DCT系数为视频图像块的划分进行进一步的划分指导。

具体地,在一实施例中,上述步骤S103具体包括如下步骤:

步骤S401:基于变换系数,计算得到待压缩视频图像块的水平频率特征值、垂直频率特征值和结构复杂度。

具体地,在实际应用中,对图像块做DCT变换后得到的DCT系数蕴含图像的大量特征信息,不同位置的DCT系数可以反映原始图像中不同的方向信息,如果图像块在水平、垂直方向具有明显的边缘特征,那么其变换后的DCT系数将相应地在垂直、水平的值较大,同时,DCT的低频、中频和高频都包含着大量图像结构信息,对于图像结构复杂度的判断也可以起到很好的作用。

具体地,本发明实施例利用各个方形块计算得到的DCT系数组合加权计算得到当前块的结构复杂度,水平频率特征值和垂直频率特征值等。其中,结构复杂度利用DCT的中频和高频系数计算得到,水平频率特征值利用DCT变换的第一列系数计算得到,垂直频率特征值利用DCT变换的第一行系数计算得到。

步骤S402:基于水平频率特征值、垂直频率特征值和结构复杂度,确定待压缩视频图像块的划分指导方式。

具体地,在一实施例中,上述步骤S402具体包括如下步骤:

步骤S501:基于结构复杂度确定待压缩视频图像块的划分方式。在实际应用中,当待压缩图像块的结构复杂度较低时,可以提前终止划分、跳过可能性较小的划分、提前确定划分等,从而减少待压缩视频图像块的划分数量、加速整个块划分过程,并在尽可能少损失性能的前提下大幅降低视频压缩的复杂度,减少编码运算量。

步骤S502:当水平频率特征值大于垂直频率特征值时,确定待压缩视频图像块的划分方向为水平划分。优选地,在实际应用中,当待压缩视频图像块的水平频率特征更显著时,本发明实施例在对该待压缩视频图像块进行划分指导时会选择性跳过垂直划分或禁用垂直划分,从而大幅减少了编码运算量和压缩处理过程,提高了压缩速度。

步骤S503:当水平频率特征值小于垂直频率特征值时,确定待压缩视频图像块的划分方向为垂直划分。优选地,在实际应用中,当待压缩视频图像块的垂直频率特征更显著时,本发明实施例在对该待压缩视频图像块进行划分指导时会选择性跳过水平划分或禁用水平划分,从而大幅减少了编码运算量和压缩处理过程,提高了压缩速度。

步骤S104:基于划分方式,对待压缩视频图像块进行划分,得到划分结果。

具体地,在一实施例中,上述步骤S104具体包括如下步骤:

步骤S601:当划分方向为水平划分时,基于划分方式沿水平方向对待压缩视频图像块进行划分,得到划分结果。优选地,在实际应用中,当划分方向为水平划分时,本发明实施例会对该待压缩视频图像块进行选择性跳过垂直划分或禁用垂直划分的处理过程,从而减少RDO的遍历过程,提高压缩速度。

步骤S602:当划分方向为垂直划分时,基于划分方式沿垂直方向对待压缩视频图像块进行划分,得到划分结果。优选地,在实际应用中,当划分方向为垂直划分时,本发明实施例会对该待压缩视频图像块进行选择性跳过水平划分或禁用水平划分的处理过程,从而减少RDO的遍历过程,提高压缩速度。

步骤S105:基于划分结果,对待压缩视频图像块进行压缩。

进行CU块划分的目的主要是为了后续更好的预测做准备,通过将结构类似、内容类似的视频图像块划在一块,可以得到后续更好的压缩效果,通过利用频率域的信息,可以很好地反映出该块的结构复杂度,以及水平纹理信息和垂直纹理信息,可以很好的指导块划分,也就可以相应的通过提前终止划分、跳过可能性较小的划分、提前确定划分等方式,达到减少或者不做RDO过程中一些遍历的目的,从而可以节省大量递归、计算的时间。

通过执行上述步骤,本发明实施例提供的视频压缩方法,通过获取待压缩视频图像块;计算待压缩视频图像块的变换系数;基于变换系数,确定待压缩视频图像块的划分指导方式;基于划分指导方式,对待压缩视频图像块进行划分,得到划分结果;基于划分结果,对待压缩视频图像块进行压缩。通过利用变换系数确定待压缩视频图像块的划分指导方式,根据划分指导方式对待压缩视频图像块进行划分,最后根据划分结果,对待压缩视频图像块进行压缩,不仅充分考虑了视频图像的频率特征,还在视频压缩过程中在尽可能少损失性能的前提下大幅降低了视频压缩的复杂度,减少了编码运算量。

下面将结合具体应用示例,对本发明实施例提供的视频压缩方法进行详细的说明。

结合图1和图2所示,首先获取当前视频图像块的像素值和长宽比,以视频图像块的最短边为边长拆分成若干个方形做DCT变换,然后利用DCT系数计算出视频图像块的结构复杂度、水平频率特征值和垂直频率特征值等,最后综合利用以上数据以提前终止划分、跳过可能性较小划分、提前确定划分等方式指导当前块的划分。比如,结构复杂度低的,可以考虑不划分,提前终止划分;水平频率特征更强烈的,可以跳过垂直划分方式的选择;垂直频率特征更强烈的,可以跳过水平划分方式的选择等,以达到在尽可能少损失性能的前提下大量减少递归、计算的时间,降低复杂度的作用。通过利用了DCT系数反映图像频率域特征的方法来反映图像块结构信息以指导块划分,同时拆分每个块成方形分别做DCT变换,不仅灵活应对当前通用编解码框架下块划分有大量非方形块的特点,而且由于目前所有块的长宽比都满足1:1,1:2,1:4,1:8其中的一种,采用此方法可以对每个不同尺寸的块都给出划分指导,还可以利用了标准代码中熵编码部分已有的DCT计算模块降低了算法实现复杂度,本发明实施例以此为理论依据设计的视频压缩方法预计将得到的与传统以空间域特征为基础依据的算法的同等效果甚至更优效果。

本发明实施例提供了一种视频压缩装置,如图3所示,该视频压缩装置包括:

获取模块101,用于获取待压缩视频图像块。详细内容参见上述方法实施例中步骤S101的相关描述,在此不再进行赘述。

第一计算模块102,用于计算待压缩视频图像块的变换系数。详细内容参见上述方法实施例中步骤S102的相关描述,在此不再进行赘述。

第二计算模块103,用于基于变换系数,确定待压缩视频图像块的划分指导方式。详细内容参见上述方法实施例中步骤S103的相关描述,在此不再进行赘述。

第三计算模块104,用于基于划分指导方式,对待压缩视频图像块进行划分,得到划分结果。详细内容参见上述方法实施例中步骤S104的相关描述,在此不再进行赘述。

压缩模块105,用于基于划分结果,对待压缩视频图像块进行压缩。详细内容参见上述方法实施例中步骤S105的相关描述,在此不再进行赘述。

上述的视频压缩装置的更进一步描述参见上述视频压缩方法实施例的相关描述,在此不再进行赘述。

通过上述各个组成部分的协同合作,本发明实施例提供的视频压缩装置,通过利用变换系数确定待压缩视频图像块的划分指导方式,根据划分指导方式对待压缩视频图像块进行划分,最后根据划分结果,对待压缩视频图像块进行压缩,不仅充分考虑了视频图像的频率特征,还在视频压缩过程中在尽可能少损失性能的前提下大幅降低了视频压缩的复杂度,减少了编码运算量。

本发明实施例提供了一种电子设备,如图4所示,该电子设备包括处理器901和存储器902,存储器902和处理器901之间互相通信连接,其中处理器901和存储器902可以通过总线或者其他方式连接,图4中以通过总线连接为例。

处理器901可以为中央处理器(Central Processing Unit,CPU)。处理器901还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。

存储器902作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中方法所对应的程序指令/模块。处理器901通过运行存储在存储器902中的非暂态软件程序、指令以及模块,从而执行处理器901的各种功能应用以及数据处理,即实现上述方法实施例中的方法。

存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器901所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至处理器901。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个模块存储在存储器902中,当被处理器901执行时,执行上述方法实施例中的方法。

上述电子设备具体细节可以对应参阅上述方法实施例中对应的相关描述和效果进行理解,此处不再赘述。

本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,实现的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

相关技术
  • 视频压缩方法及视频压缩装置
  • 视频压缩方法与视频压缩装置
技术分类

06120114691012