掌桥专利:专业的专利平台
掌桥专利
首页

图像处理方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 11:29:13


图像处理方法、装置、电子设备及存储介质

技术领域

本公开涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。

背景技术

随着技术的发展,对媒体内容质量要求也越来越高。例如,硬件设备的发展使得高清视频电视逐渐增多,但目前绝大多数媒体内容仍然只支持标准动态范围(SDR,StandardDynamic Range)格式;相较于SDR格式,高动态范围(HDR,High Dynamic Range)格式由于数据存储位数由8bit提升为10bit,颜色空间也从BT709转为BT2020,由此带来的视觉观看提升是巨大且震撼的。因此,在整个智感高清产品的建设中,对图像或视频的转换是不可或缺的一个环节。

以SDR视频转HDR视频为例,目前SDR视频转HDR视频过程有以下几种方式:

第一种,基于多帧不同曝光时间的SDR图像重建HDR图像方案。由于并不是任何场合都具有一张图像的多张不同曝光时间的图像,因此这种方式的应用场景存在限制。

第二种,基于U-网络(U-Net)的单帧SDR图像重建HDR图像方案。这种方式在亮度提升方面效果不佳。

第三种,基于相机响应曲线的SDR图像重建HDR图像方案,这种方式在亮度方面的效果较好,但在色彩提升方面效果较差。

以上以SDR图像向HDR图像转换为例介绍了现有技术的缺点。在对其他类型的图像进行图像转换时,也存在提升效果不佳的问题。

发明内容

本公开提供了一种图像处理方法、装置、电子设备及存储介质。

根据本公开的一方面,提供了一种图像处理方法,包括:

获取待处理图像的粗略特征、细节特征和整体特征;

对该细节特征进行细节提升,得到第一特征;并对该粗略特征进行亮度或色度增强,得到第二特征;

将该整体特征、该第一特征和该第二特征组合,得到第三特征;

利用该第三特征,生成处理后的图像。

根据本公开的另一方面,提供了一种图像处理装置,包括:

特征获取模块,用于获取待处理图像的粗略特征、细节特征和整体特征;

处理模块,用于对该细节特征进行细节提升,得到第一特征;并对该粗略特征进行亮度或色度增强,得到第二特征;

组合模块,用于将该整体特征、该第一特征和该第二特征组合,得到第三特征;

生成模块,用于利用该第三特征,生成处理后的图像。

根据本公开的另一方面,提供了一种电子设备,包括:

至少一个处理器;以及

与该至少一个处理器通信连接的存储器;其中,

该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例中的方法。

根据本公开的技术通过将待处理图像分解为多部分特征,将各部分特征采用专门的子网络分别实现不同的效果提升,使得网络学习可以更精准,因此能够达到更好的图像处理效果。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是本公开的一种图像处理方法实现流程图;

图2是本公开的一种图像处理方法实现框架示意图;

图3是本公开的一种对待处理图像的细节特征进行细节提升的超分网络的结构示意图;

图4是本公开的一种用于获取待处理图像的整体特征的图像重建子网络的结构示意图;

图5是本公开的一种亮度或色彩增强子网络的结构示意图;

图6是本公开的一种图像处理装置600的结构示意图;

图7是本公开的一种图像处理装置700的结构示意图;

图8是用来实现本公开实施例的图像处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

针对相关技术中图像处理时对色彩和亮度的提升无法兼顾的状况,本公开提出一种图像处理方法,基于图像分解对待处理图像进行图像低频特征和高频特征的分离,再利用不同的子网络去解决不同的问题,使得网络可以学习的更精准,也能更好的恢复出缺失的信息和需要补全的信息。

具体地,本公开提出一种图像处理方法,图1是本公开的一种图像处理方法实现流程图,包括:

S101:获取待处理图像的粗略特征、细节特征和整体特征;

S102:对该细节特征进行细节提升,得到第一特征;并对该粗略特征进行亮度或色度增强,得到第二特征;

S103:将该整体特征、该第一特征和该第二特征组合,得到第三特征;

S104:利用该第三特征,生成处理后的图像。

在一些实施方式中,上述待处理图像可以是一个待处理视频中的视频帧图像。对待处理图像中的各个视频帧图像分别采用上述方式进行处理,生成处理后的图像;之后将处理后的图像按照原先的顺序组合,即可生成处理后的视频。

上述方案中,待处理图像的粗略特征可以认为是图像低频特征,待处理图像的细节特征可以认为是图像高频特征。本公开对待处理图像的细节特征进行细节提升,得到细节提升后的特征;对待处理图像的粗略特征进行亮度或色度增强,得到亮度/色彩增强后的特征。之后将细节提升后的特征和亮度/色彩增强后的特征叠加到待处理图像的整体特征上,得到处理后的图像,实现显示效果的整体增强。由于采用专门的子网络分别实现不同的效果提升,因此能够达到更好的图像处理效果。

可选地,上述待处理图像包括SDR图像,上述处理后的图像包括HDR图像。进一步地,待处理图像可以包括SDR视频文件中的一个SDR视频帧,处理后的图像可以包括对应的HDR视频帧。分别对SDR视频文件中的各个SDR视频帧进行处理,得到对应的HDR视频帧;再将HDR视频帧按照SDR视频文件中SDR视频帧的顺序进行组合,即可得到处理后的HDR视频文件,达到更好的显示效果。

图2是本公开的一种图像处理方法实现框架示意图,如图2所示,将输入图像(即待处理图像)划分为三个分支,包括图像细节部分、图像粗略部分和图像本身,对应的特征分别为细节特征、粗略特征和整体特征。对三个分支分别采用对应的子网络进行处理。以下分别介绍图2中的三个分支。

在一些实施方式中,上述获取待处理图像的粗略特征包括:采用预定的滤波算法对该待处理图像进行滤波,得到待处理图像的粗略特征。

可选地,上述滤波可以采用高斯滤波方式,或采用其他滤波方案。将输入的待处理图像(如记为图像I)进行高斯滤波,得到待处理图像的粗略特征(如记为I_base)。I_base可以采用张量(Tensor)的形式表示。待处理图像的粗略特征可以作为后续亮度/色度增强子网络的输入内容。

在一些实施方式中,上述获取待处理图像的细节特征包括:利用待处理图像及待处理图像的粗略特征,生成待处理图像的细节特征。

可选地,分别利用待处理图像中各个像素的值减去粗略特征中各个像素的值,得到待处理图像的细节特征;或者,

分别利用待处理图像中各个像素的值除以粗略特征中各个像素的值,得到待处理图像的细节特征。

例如,待处理图像(即图像I)和待处理图像的粗略特征(即I_base)分别用张量表示,两个张量的阶(rank)及大小相同。分别将I中的各个元素减去I_base中的对应元素,或者将I中的各个元素除以I_base中的对应元素,得到待处理图像的细节特征(如用I_detail表示)。I_detail也可以用张量表示,其阶数和大小与I和I_base相同。待处理图像的细节特征可以作为后续细节提升子网络的输入内容。

在图2所示的第一个分支中,对待处理图像的细节特征进行细节提升,得到第一特征,包括:

将待处理图像的细节特征(如上述I_detail)输入预先设置的超分网络,得到该第一特征;

其中,该超分网络包括卷积层和至少两个残差层;每个残差层包括第一卷积层、激活函数层和第二卷积层。

图3是本公开的一种对待处理图像的细节特征进行细节提升的超分网络的结构示意图。如图3所示,该超分网络的第一层为卷积层、中间层为至少两个残差层、最后一层为卷积层。其中,每个残差层包括输入卷积层、函数激活层和输出卷积层。可选地,前述激活函数层可以具体为线性整流函数层。线性整流函数又称为修正线性单元(ReLU,RectifiedLinear Unit),是一种人工神经网络中常用的激活函数(activation function),通常指代以斜坡函数及其变种为代表的非线性函数。线性整流函数层可以实现对待处理图像的细节特征的显示效果提升。

在一些实施方式中,上述获取待处理图像的整体特征包括:

将待处理图像输入预先设置的图像重建子网络,得到该待处理图像的整体特征;其中,

图像重建子网络包括编码器和解码器;编码器被设置为提取待处理图像的特征数据,解码器被设置为将该特征数据进行图像重建,得到待处理图像的整体特征。

图4是本公开的一种用于获取待处理图像的整体特征的图像重建子网络的结构示意图。如图4所示,该图像重建子网络包括编码器和解码器,其中编码器包括输入卷积层、中间的残差层(如包括2层残差层)、以及输出卷积层。解码器与编码器的结构类似。编码器用于提取待处理图像的特征,解码器用于将提取的特征再进行整合,得到待处理图像的整体特征。以待处理图像为SDR视频帧为例,编码器提取SDR视频帧的图像特征,该图像特征是SDR形式的图像特征;之后,解码器对该SDR形式的图像进行整合,得到HDR形式的图像特征。

对于SDR视频/图像向HDR视频/图像的转换任务来说,不同图像的增强要求是不同的,进一步地,同一张图像不同位置的增强因子也应该不同,这样才能达到很好的色度及亮度增强效果。考虑到需要对同一张图像不同位置设置不同的增强因子,本公开引入动态局部滤波(dynamic local filter),设计如图5所示的亮度或色彩增强子网络。动态局部滤波是一种新型的网络结构,可以利用抽样(sample)文件生成针对各个图像、以及每个图像中每个像素都不同的滤波核。这样构成的滤波核生成网络(Filter-generating network)可以实现对图像的不同部位采用不同的亮度或色彩增强方案,适合例如SDR视频/图像向HDR视频/图像转换这种像素级的视觉任务。

图5是本公开的一种亮度或色彩增强子网络的结构示意图。该亮度或色彩增强子网络包括卷积层和动态局部滤波层,如图5所示,亮度/色度增强子网络的第一层可以为卷积层,后续层可以为多级的卷积层和动态局部滤波层。将待处理图像的粗略特征输入预先设置的亮度或色彩增强子网络,可以得到第二特征,即对亮度或色彩增强后的特征。其中,动态局部滤波层针对输入特征中对应各个像素的特征,采用该像素的亮度或色度增强方案对该特征进行亮度或色度增强。由于各个像素的亮度或色度增强方案不同,因此可以保证对图像不同部分实现不同的亮度或色度增强效果,从而提升整体的图像处理效果。

在一些实施方式中,针对输入特征中对应各个像素的特征,采用该像素的亮度或色度增强方案对该特征进行亮度或色度增强,包括:对输入特征中对应各个像素的特征分别采用该像素对应的滤波核进行处理,得到对该像素的亮度或色度增强结果;其中,不同像素对应不同的滤波核。

如图5所示,动态局部滤波层中,输入内容(Input)分为两路,第一路输入滤波核生成网络(Filter-generating network),该网络可以认为是一种简单的卷积网络,用于对输入特征中对应各个像素的特征分别采用不同的滤波核进行处理,输出对应的处理结果;第二路为上述输入内容。将滤波核生成网络的输出内容与动态局部滤波层的输入内容进行组合,得到最终的输出内容(Output)。前述组合方式可以为相乘、相加等计算方式。

以上完成了图像处理过程中对待处理图像的粗略特征、细节特征的处理,并获取到待处理图像的整体特征;之后将处理之后得到的第一特征和第二特征叠加到整体特征上,得到第三特征。其中,第一特征、第二特征和整体特征均可以为张量,该叠加方式可以为将三个张量的元素进行组合,得到一个新的张量,即第三特征。或者,该叠加方式可以为将三个张量的对应元素分别相加,得到一个新的张量,即第三特征。本公开对具体的组合方式不做限制。

可见,本公开基于图像分解对原始SDR视频帧进行图像低频特征和高频特征的分离,并利用不同的子网络去解决不同的问题,使得网络可以学习的更精准,也能更好的恢复出缺失的信息和需要补全的信息。并且,本公开设计的新的图像亮度/色彩提升子网络,引入动态局部滤波技术,对应每个图像的每一个像素均有一个对应的滤波核,将该处的像素值映射到HDR域中,针对亮度和色彩的调整都做到了局部级别,避免了传统卷积核由于共享权重带来的特异性缺失。

本公开还提出一种图像处理装置,图6是本公开的一种图像处理装置600的结构示意图,包括:

特征获取模块610,用于获取待处理图像的粗略特征、细节特征和整体特征;

处理模块620,用于对该细节特征进行细节提升,得到第一特征;并对该粗略特征进行亮度或色度增强,得到第二特征;

组合模块630,用于将该整体特征、该第一特征和该第二特征组合,得到第三特征;

生成模块640,用于利用该第三特征,生成处理后的图像。

可选地,上述待处理图像包括SDR图像,该处理后的图像包括HDR图像。

图7是本公开的一种图像处理装置700的结构示意图,如图7所示,可选地,上述特征获取模块610包括:

第一获取子模块611,用于采用预定的滤波算法对该待处理图像进行滤波,得到该待处理图像的粗略特征。

如图7所示,可选地,上述特征获取模块610包括:

第二获取子模块612,用于利用该待处理图像及该待处理图像的粗略特征,生成该待处理图像的细节特征。

可选地,上述第二获取子模块612用于:

分别利用该待处理图像中各个像素的值减去该粗略特征中各个像素的值,得到该待处理图像的细节特征;或者,

分别利用该待处理图像中各个像素的值除以该粗略特征中各个像素的值,得到该待处理图像的细节特征。

如图7所示,可选地,上述处理模块620包括:

细节提升子模块621,用于将该细节特征输入预先设置的超分网络,得到该第一特征;

其中,该超分网络包括卷积层和至少两个残差层;每个残差层包括第一卷积层、激活函数层和第二卷积层。

如图7所示,可选地,上述特征获取模块610包括:

第三获取子模块613,用于将待处理图像输入预先设置的图像重建子网络,得到待处理图像的整体特征;其中,

图像重建子网络包括编码器和解码器;编码器被设置为提取待处理图像的特征数据,解码器被设置为将特征数据进行图像重建,得到待处理图像的整体特征。

如图7所示,可选地,上述处理模块620包括:

亮度或色彩增强子模块622,用于将粗略特征输入预先设置的亮度或色彩增强子网络,得到第二特征;其中,

亮度或色彩增强子网络包括卷积层和动态局部滤波层;

动态局部滤波层针对输入特征中对应各个像素的特征,采用像素的亮度或色度增强方案对特征进行亮度或色度增强。

可选地,上述针对输入特征中对应各个像素的特征,采用像素的亮度或色度增强方案对特征进行亮度或色度增强,包括:

对输入特征中对应各个像素的特征分别采用像素对应的滤波核进行处理,得到对像素的亮度或色度增强结果;

其中,不同像素对应不同的滤波核。

本申请实施例各装置中的各模块的功能可以参见上述图像处理方法中的对应描述,在此不再赘述。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或要求的本公开的实现。

如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图像处理方法。例如,在一些实施例中,图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 图像处理方法、存储介质、电子设备及图像处理装置
  • 图像处理方法和图像处理装置及电子设备和存储介质
技术分类

06120112939340