掌桥专利:专业的专利平台
掌桥专利
首页

一种图像处理方法、装置、电子设备及介质

文献发布时间:2023-06-19 18:29:06


一种图像处理方法、装置、电子设备及介质

技术领域

本公开实施例涉及计算机技术,尤其涉及一种图像处理方法、装置、电子设备及介质。

背景技术

随着深度学习技术的快速发展,其应用于众多领域,特别是在计算机视觉领域与自然语言处理领域。就计算机视觉领域而言,可继续细分为low-level领域(即低级领域)与high-level领域(即高级领域)。其中,high-level领域主要是提取图像的高级语义信息,如人脸检测、识别或图像分类等任务;这类任务更关注图像中的语义信息,对单个的像素信息并不太在意。对于low-level领域的任务,如图像超分、去雾、去模糊和增强等任务,对图像的像素信息较为关注。

由于图形处理器(Graphics Processing Unit,GPU)显存和算力的限制,以及low-level任务的特性,对图像处理模型的输入图像的尺寸大小有限制;目前所有针对low-level领域的任务,例如图像超分或增强等任务,并非将整个图像输入对应的图像处理模型,都是在整个图像中随机裁剪一个固定大小的图像块(即patch),然后将这一patch输入图像处理模型中进行相应的处理。这就限制了图像处理模型的处理性能。

发明内容

本公开提供一种图像处理方法、装置、电子设备及介质,以提高图像处理的可靠性。

第一方面,本公开实施例提供了一种图像处理方法,所述方法包括:

确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像;

确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零;

将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

第二方面,本公开实施例还提供了一种图像处理装置,所述装置包括:

第一确定模块,用于确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像;

第二确定模块,用于确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零;

处理模块,用于将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

第三方面,本公开实施例还提供了一种电子设备,包括:

一个或多个处理装置;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现本公开实施例提供的图像处理方法。

第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理装置执行时用于执行本公开实施例提供的图像处理方法。

本公开实施例,首先确定待处理子图像,待处理子图像为待处理图像的待处理区域内的图像;然后确定辅助图像,辅助图像与待处理子图像尺寸相等,辅助图像内像素数据为零;最后将待处理子图像和辅助图像串联后输入至图像处理模型,得到待处理图像的处理后的目标图像,待处理子图像和辅助图像的个数与图像处理模型在训练阶段作为输入的图像的个数均为设定个数。该方法通过确定待处理子图像和辅助图像,辅助图像作为输入能够辅助扩大图像处理模型的感受野,通过将待处理子图像和辅助图像串联后输入至图像处理模型以得到目标图像,采用图像串联的方式能够使得输入至图像处理模型的多个图像块的尺寸没有增加,避免了由于增加输入图像处理模型的图像块尺寸的大小而导致增加GPU显存占用与算力的问题,提高了图像处理模型的处理性能,从而提高了图像处理的可靠性。

附图说明

结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。

图1为本公开实施例所提供的一种图像处理方法的流程示意图;

图2为本公开实施例所提供的另一种图像处理方法的流程示意图;

图3为本公开实施例提供的一种样本图像的实现示意图;

图4为本公开实施例提供的一种辅助子图像水平对称翻转的实现示意图;

图5为本公开实施例提供的一种辅助子图像垂直对称翻转的实现示意图;

图6为本公开实施例提供的一种样本图像的实现示意图;

图7为本公开实施例提供的一种图像处理模型训练的实现示意图;

图8为本公开实施例提供的另一种图像处理模型训练的实现示意图;

图9为本公开实施例所提供的一种图像处理装置的结构示意图;

图10为本公开实施例所提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。

应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。

可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。

例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的终端设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。

作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向终端设备提供个人信息的选择控件。

可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。

为了更好地理解本公开实施例,下面对相关术语进行介绍。

像素:是影像显示的基本单位,也可以是指在由一个数字序列表示的图像中的一个最小单位。在整个图像中,可以将像素看作一个颜色单一并且不能再分割成更小元素或单位的小格,单位面积内的像素越多代表分辨率越高,所显示的影像就越清晰。

感受野(Receptive Field),指的是神经网络中神经元“看到的”输入区域,在卷积神经网络中,特征图(feature map)上某个元素的计算受输入图像上某个区域的影响,这个区域即该元素的感受野。

通过一个patch作为输入输入至图像处理模型中进行相应的处理,在该过程中,会由于GPU显存和算力的限制,使得图像处理模型的感受野被限制在了所裁剪得到的这一patch之内,这一patch之外的信息在处理过程中无法看到,进而使得这一限制影响了图像处理模型的处理性能。在本公开实施例中,可以通过扩大patch的大小来提升图像处理模型的算法能力,但是patch的大小也会受限于GPU的显存与算力,因此扩大patch的大小的方法也具有一定的限制。

为解决上述技术问题,图1为本公开实施例所提供的一种图像处理方法的流程示意图,本公开实施例适用于对图像进行处理以提高图像处理可靠性的情形,该方法可以由图像处理装置来执行,该图像处理装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是手机、计算机或服务器等。

如图1所示,所述方法包括:

S110、确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像。

本实施例中,待处理图像可理解为待处理的图像,此处对待处理图像不作具体限定,如可以是待进行像素处理的图像;其中对图像的像素处理可以包括图像超分、图像增强、图像去模糊和图像去雾等处理。

待处理子图像可理解为待处理图像的待处理区域内的图像。待处理区域可理解为待处理图像内待处理的图像区域;此处对待处理区域不作具体限定,可根据实际需求进行灵活设定。

此处对如何确定待处理子图像不作具体限定。如,可以根据预先设定的尺寸阈值,从待处理图像的待处理区域内随机裁剪一块尺寸为该尺寸阈值大小的图像来作为待处理子图像,或者也可以是将这整个待处理图像作为待处理子图像。尺寸可理解为图像的宽度和高度大小。

S120、确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零。

本实施例中,辅助图像可理解为用于辅助处理待处理子图像的图像;其中,辅助图像与待处理子图像尺寸相等,即辅助图像的尺寸与待处理子图像的尺寸相等;辅助图像内像素数据可以为零。像素数据可理解为表征像素的数据,如像素值。

此处对如何确定辅助图像不作限定;如,可以在确定待处理子图像之后,自动生成至少一个尺寸与待处理子图像尺寸一致的像素数据为零的图像,来作为辅助图像。

S130、将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

本实施例中,图像处理模型可理解为用于图像处理的模型,此处对图像处理模型不作具体限定,如可以是基于深度学习的网络模型。目标图像可理解为对待处理图像进行处理后所得到的图像,如可以是对待处理图像的像素进行处理后的图像。训练阶段可理解为图像处理模型被训练的阶段。

可理解的是,在图像处理模型的训练阶段,图像处理模型的输入可以是图像。相应的,在图像处理模型被应用的时候,所确定的待处理子图像和辅助图像的个数,与图像处理模型在训练阶段作为输入的图像的个数是相同的,即可以均为设定个数。其中,设定个数可理解为预先设定的图像个数,此处对设定个数的具体数值不作限定,如可以是5个或9个等。

串联,可理解为图像处理中的concatenate操作,是指将要串联的各个图像所对应的各个层,后面的层与前面的层建立一个连接,以在维度上将各个图像进行一个特征联合,如可以是指针对所确定的待处理子图像和辅助图像,一层一个图像,一层一个图像,这样一层一层地将待处理子图像和辅助图像叠加联合在一起,也就是串联在了一起。此处对如何将待处理子图像和辅助图像进行串联不作具体限定。

在确定待处理子图像和辅助图像之后,先将待处理子图像和辅助图像进行串联处理,在此基础上,可以将串联后的待处理子图像和辅助图像作为输入数据,输入至已训练好的图像处理模型中,以得到待处理图像的处理后的目标图像。此处对图像处理模型如何处理待处理子图像和辅助图像以得到目标图像不作具体限定。

本公开实施例提供了一种图像处理方法,首先确定待处理子图像,待处理子图像为待处理图像的待处理区域内的图像;然后确定辅助图像,辅助图像与待处理子图像尺寸相等,辅助图像内像素数据为零;最后将待处理子图像和辅助图像串联后输入至图像处理模型,得到待处理图像的处理后的目标图像,待处理子图像和辅助图像的个数与图像处理模型在训练阶段作为输入的图像的个数均为设定个数。该方法通过确定待处理子图像和辅助图像,辅助图像作为输入能够辅助扩大图像处理模型的感受野;通过将待处理子图像和辅助图像串联后输入至图像处理模型以得到目标图像,采用图像串联的方式能够使得输入至图像处理模型的多个图像块的尺寸没有增加,避免了由于增加输入图像处理模型的图像块尺寸的大小而导致增加GPU显存占用与算力的问题,提高了图像处理模型的处理性能,从而提高了图像处理的可靠性。

可选的,待处理图像为待进行像素处理的图像,目标图像为进行像素处理后的图像。

本公开可以是低级领域内对图像的处理。本实施例中,像素处理可理解为对图像的像素的处理,如像素处理可以是图像超分、图像增强和图像去雾等处理。

待处理图像可理解为待进行像素处理的图像,目标图像可理解为进行像素处理后的图像。如,若待处理图像为待进行图像超分处理的图像,则对应的目标图像可以为进行图像超分处理后所得到的图像;若待处理图像为待进行图像增强处理的图像,则对应的目标图像可以为进行图像增强处理后所得到的图像;以此类推。

可选的,图像处理模型的训练阶段包括如下步骤:

获取样本集,样本集包括多个样本对,各样本对分别包括各自所对应的串联后的多个样本子图像和处理后图像,处理后图像为目标子图像处理后的图像,目标子图像为多个样本子图像中的待进行处理的一个样本子图像,各样本对间,目标子图像与所对应的其余样本子图像的相对位置关系相同;

基于样本集对待训练的图像处理模型进行训练,得到训练后的图像处理模型。

本实施例中,样本集可理解为由用于训练图像处理模型的多个样本对所构成的集合。样本集中可包括多个样本对。各样本对可分别包括各自所对应的串联后的多个样本子图像和处理后图像,也就是说,一个样本对包括有自己所对应的串联后的多个样本子图像和处理后图像。样本子图像可理解为从一个样本图像中所裁剪出的子图像;每个样本对中的多个样本子图像可对应一个样本图像,也就是说,每个样本对中的多个样本子图像可以是从所对应样本图像中所裁剪得到的多个不同的子图像。处理后图像可理解为目标子图像处理后的图像。目标子图像可理解为多个样本子图像中的待进行处理的一个样本子图像。

其余样本子图像可理解为每个样本对的多个样本子图像中除目标子图像外的其他样本子图像。相对位置关系可理解为以目标子图像所在位置为参照点,与所对应的其余样本子图像所在位置之间的关系。如,有四个其余样本子图像分别位于目标子图像的正上方、正下方、正左方和正右方,即这就是目标子图像与所对应的其余样本子图像的相对位置关系。

需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系可以为基于附图所示的方位或位置关系。例如,“上”和“下”是沿纸面的页眉和页脚方向而设定的;“左”和“右”是面向纸面的方向而设定的,“前”是垂直于纸面且从纸背向纸面方向;“后”是垂直于纸面且从纸面向纸背方向。这种设定仅是为了便于描述本公开的技术方案,而不是指示所指的内容必须具有特定的方位,因此不能理解为对本公开的限制。

各个样本对间,目标子图像与所对应的其余样本子图像的相对位置关系相同。也就是说,若是有两个样本对,一个样本对的目标子图像与所对应的其余样本子图像的相对位置关系,与另一个样本对的目标子图像与所对应的其余样本子图像的相对位置关系,是相同的。

此处对如何获取样本集不作具体限定,可以先获取多个样本图像,针对每个样本图像,从该样本图像中先随机裁剪出一个子图像作为目标子图像,然后以该目标子图像所在位置为参考点,在该目标子图像周围的预先设定的位置处裁剪多个不同的子图像作为其余样本子图像,其中对预先设定的位置不作具体限定,只要保证每个样本图像提取样本对时所使用的预先设定位置相同即可,如可以是目标子图像的正上方、正下方、正左方和正右方;所裁剪的其余样本子图像的边缘与所对应目标子图像的边缘可以是重合的,也可以是间隔设定距离的,此处对此不作具体限定。最后可以将从该样本图像中所裁剪的多个样本子图像和所对应的处理后图像构成一个样本对;在此基础上,可以将所构成的所有样本对合并为一个样本集。

在获取样本集之后,可以基于样本集对待训练的图像处理模型进行训练,得到训练后的图像处理模型。此处对如何基于样本集对待训练的图像处理模型进行训练不作具体限定。

如,每个样本对的多个样本子图像已预先进行了串联;可以将样本集中串联后的多个样本子图像依次作为输入数据输入至待训练的图像处理模型中,待训练的图像处理模型对样本对中的多个样本子图像进行处理并输出结果,该输出结果可认为是一个图像;基于该输出结果与所对应样本对中的处理后图像进行损失计算,得到损失函数,以用于调整模型参数。在训练结束之后,所得到的图像处理模型即为训练后的图像处理模型。

训练结束条件不作限定,可以基于训练次数确定,也可以基于训练结果的精度确定。

需要说明的是,图像处理模型的训练阶段可以在本公开实施例提供的电子设备上执行,也可以在与本公开实施例提供的电子设备不同的其他电子设备上执行,此处对此不作限定。

图2为本公开实施例所提供的另一种图像处理方法的流程示意图,本实施例在上述各实施例的基础上进行细化。在本实施例中,对图像处理模型的训练阶段的过程进行了具体描述。需要说明的是,未在本实施例中详尽描述的技术细节可参见上述任意实施例。

如图2所示,包括:

S210、获取样本图像。

本实施例中,样本图像可理解为用于训练图像处理模型的图像样本。此处对如何获取样本图像不作具体限定,如可以从相应的提供用于模型训练的样本的数据源中获取多个图像作为样本图像。

S220、从样本图像中获取目标子图像和位于目标子图像设定位置处的辅助子图像,辅助子图像的个数为至少一个,各辅助子图像与目标子图像的相对位置不同。

本实施例中,设定位置可理解为预先设定的位置;此处对设定位置不作具体限定,如可以包括以目标子图像为参考点的,位于目标子图像四周的任意位置。辅助子图像可理解为用于辅助目标子图像训练图像处理模型的子图像。

从样本图像中可以获取目标子图像和位于目标子图像设定位置处的辅助子图像。其中,辅助子图像的个数为至少一个,即辅助子图像的个数可以为一个或多个。各辅助子图像与目标子图像的相对位置不同;也就是说,每个辅助子图像与目标子图像之间的相对位置是不同的。

此处对如何从样本图像中可以获取目标子图像和辅助子图像不作具体限定,如可以先从样本图像中随机裁剪一个设定尺寸的目标子图像,此处对设定尺寸不作限定,可根据实际需求进行灵活设定;在此基础上,从样本图像中位于目标子图像设定位置处裁剪对应的辅助子图像,如可以从目标子图像的正上方、正下方、正左方和正右方位置分别裁剪一个辅助子图像,即各辅助子图像与目标子图像的相对位置不同;需要说明的是,所裁剪的每个辅助子图像的尺寸和目标子图像的尺寸相同。

可理解的是,若是在获取辅助子图像时,所获取的辅助子图像中存在部分图像所在位置或者全部图像所在位置已超出样本图像范围(即处于样本图像边缘外部的范围即可认为是超出样本图像范围),则可将辅助子图像中超出样本图像范围的部分所对应的像素设置为零。

图3为本公开实施例提供的一种样本图像的实现示意图。如图3所示,P表示样本图像,p5表示目标子图像,p1、p2、p3、p4、p6、p7、p8和p9表示辅助子图像,辅助子图像共8个;其中,p2、p4、p6和p8分别位于p5的正上方、正左方、正右方和正下方这四个设定位置处;p1、p3、p7和p9则位于p5的对角线上,即分别位于p5的左上角、右上角、左下角和右下角这四个设定位置处。p1、p2、p3、p4、p6、p7、p8和p9,分别与p5的相对位置之间是不同的。

S230、对辅助子图像进行翻转处理,得到处理后的辅助子图像。

本实施例中,翻转处理可理解为以辅助子图像的垂直中心线为基准线进行水平对称翻转的处理和/或以辅助子图像的水平中心线为基准线进行垂直对称翻转的处理。垂直中心线可理解为垂直方向上的中心线。水平中心线可理解为水平方向上的中心线。

图4为本公开实施例提供的一种辅助子图像水平对称翻转的实现示意图。如图4所示,一个辅助子图像,1表示垂直中心线。在对辅助子图像进行水平对称翻转的处理之前,a、b、c和d分别位于辅助子图像的左上角、右上角、左下角和右下角;在沿着垂直中心线1水平对称翻转辅助子图像之后(即在对辅助子图像进行水平对称翻转的处理之后),a、b、c和d分别位于辅助子图像的右上角、左上角、右下角和左下角。

图5为本公开实施例提供的一种辅助子图像垂直对称翻转的实现示意图。如图5所示,一个辅助子图像,2表示水平中心线。在对辅助子图像进行垂直对称翻转的处理之前,a、b、c和d分别位于辅助子图像的左上角、右上角、左下角和右下角;在沿着水平中心线2垂直对称翻转辅助子图像之后(即在对辅助子图像进行垂直对称翻转的处理之后),a、b、c和d分别位于辅助子图像的左下角右下角、左上角和右上角。

对所获取的辅助子图像进行翻转处理,得到处理后的辅助子图像。此处对如何对辅助子图像进行翻转处理不作具体限定。如,可以基于每个辅助子图像相对于目标子图像的位置来确定每个辅助子图像中与目标子图像相关联的区域以及目标子图像中与每个辅助子图像相关联的区域,并在此基础上翻转处理辅助子图像,以使得每个辅助子图像中与目标子图像相关联的区域在辅助子图像的位置,与目标子图像中与该辅助子图像相关联的区域在目标子图像的位置,是一致的。其中,相关联的区域可理解为辅助子图像与目标子图像相连接的部分。

具体的,如图2所示,p1的右下角区域与p5的左上角区域相连接,即p1的右下角区域为辅助子图像中与目标子图像相关联的区域,p5的左上角区域为目标子图像中与该辅助子图像相关联的区域,此时为了使得p1的右下角区域变为p1的左上角区域,可以对p1进行水平对称翻转和垂直对称翻转的处理。又如,p4的右边缘区域与p5的左边缘区域相连接,此时为了使得p4的右边缘区域变为p4的右边缘区域,可以对p4进行水平对称翻转的处理。以此类推,其他辅助子图像也是进行相应的翻转处理。

S240、将目标子图像和辅助子图像串联,得到串联后的多个样本子图像。

本实施例中,针对每个样本图像,可以将从该样本图像中所获取的目标子图像和辅助子图像串联,以得到串联后的多个样本子图像;也就是说,目标子图像和辅助子图像可以认为是样本子图像。此处对如何将目标子图像和辅助子图像串联不作赘述,可参见上述实施例。

每个样本图像可对应一串联后的多个样本子图像;不同的样本图像中的多个样本子图像在进行串联时的串联顺序是相同的;也就是说,假设一个样本图像的多个样本子图像在进行串联时的串联顺序是p1、p2、p3、p4、p5、p6、p7、p8、p9,那么其他样本子图像在进行串联时的串联顺序与之相同,也是p1、p2、p3、p4、p5、p6、p7、p8、p9。

可选的,不同的样本图像的多个样本子图像在进行串联时,各样本子图像间的顺序相同。

其中,每个样本图像的多个样本子图像在进行串联时可以对应一个串联顺序,串联顺序可以表征多个样本子图像串联时的叠加顺序;每个样本图像所对应的串联顺序可以是相同的。

S250、将串联后的多个样本子图像和所对应处理后图像,作为样本图像的样本对。

本实施例中,处理后图像可认为是多个样本子图像中目标子图像处理后的图像。可以将串联后的多个样本子图像和所对应处理后图像,作为样本图像所对应的样本对。

S260、将多个样本对构成对应的样本集。

本实施例中,一个样本图像可对应一个样本对。可以将所得到的多个样本对构成对应的样本集。

S270、基于样本集对待训练的图像处理模型进行训练,得到训练后的图像处理模型。

本公开实施例,具体化了图像处理模型的训练阶段的过程。该方法通过从样本图像中获取目标子图像和辅助子图像,对辅助子图像进行翻转处理,能够以使得每个辅助子图像中与目标子图像相关联的区域在辅助子图像的位置,与目标子图像中与该辅助子图像相关联的区域在目标子图像的位置是一致的,从而增加了目标子图像和辅助子图像之间的相关性。还通过将串联后的目标子图像和辅助子图像,以及所对应处理后图像来作为样本集中的样本对,基于样本集进行图像处理模型的训练,能够扩大图像处理模型的感受野,从而提高了图像处理模型图像处理的性能。

可选的,对辅助子图像进行翻转处理,得到处理后的辅助子图像,包括:针对每个辅助子图像,基于辅助子图像相对于目标子图像的位置,确定翻转方式;采用翻转方式,翻转辅助子图像。

本实施例中,翻转方式可理解为翻转处理的方式;如翻转方式可以包括水平对称翻转和垂直对称翻转。辅助子图像相对于目标子图像的位置也可认为是辅助子图像与目标子图像的相对位置。

针对每个辅助子图像,基于辅助子图像相对于目标子图像的位置,确定翻转方式。此处对如何确定翻转方式不作具体限定,如基于辅助子图像相对于目标子图像的位置,可以确定辅助子图像与目标子图像间的相关联的区域(即可包括辅助子图像中与目标子图像相关联的区域以及目标子图像中与辅助子图像相关联的区域);通过使得辅助子图像中与目标子图像相关联的区域在辅助子图像的位置,与目标子图像中与该辅助子图像相关联的区域在目标子图像的位置,是一致的,来确定辅助子图像的翻转方式。此处对如何具体基于辅助子图像与目标子图像间的相关联的区域确定辅助子图像的翻转方式不作赘述,可参见上述实施例中S230所述内容。

在确定翻转方式之后,可以采用翻转方式,翻转辅助子图像,以使得该辅助子图像中与目标子图像相关联的区域在辅助子图像的位置,与目标子图像中与该辅助子图像相关联的区域在目标子图像的位置,是一致的。

可选的,基于辅助子图像相对于目标子图像的位置,确定翻转方式,包括:在辅助子图像位于目标子图像的水平中心线所在直线上,则确定辅助子图像的翻转方式为水平对称翻转;在辅助子图像位于目标子图像的垂直中心线所在直线上,则确定辅助子图像的翻转方式为垂直对称翻转;在辅助子图像位于目标子图像的对角线所在直线上,则确定辅助子图像的翻转方式为水平对称翻转和垂直对称翻转。

图6为本公开实施例提供的一种样本图像的实现示意图。如图6所示,P表示样本图像,p1、p2、p3、p4、p6、p7、p8和p9表示辅助子图像,p5表示目标子图像,3表示目标子图像的对角线,4表示目标子图像的垂直中心线所在直线,5表示目标子图像的水平中心线所在直线。

本实施例中,在辅助子图像位于目标子图像p5的水平中心线所在直线上,即辅助子图像p4和p6位于目标子图像p5的水平中心线所在直线5上,则确定辅助子图像的翻转方式为水平对称翻转。

在辅助子图像位于目标子图像p5的垂直中心线所在直线上,即辅助子图像p2和p8位于目标子图像p5的垂直中心线所在直线4上,则确定辅助子图像的翻转方式为垂直对称翻转。

在辅助子图像位于目标子图像p5的对角线所在直线上,即辅助子图像p1、p3、p7和p9位于目标子图像p5的对角线所在直线3上,则确定辅助子图像的翻转方式为水平对称翻转和垂直对称翻转。

以下对本公开进行示例性说明。

图7为本公开实施例提供的一种图像处理模型训练的实现示意图。如图7所示,从样本图像中随机裁剪一个patch作为图像处理模型训练过程中的输入图像,经过图像处理模型得到图像处理模型的输出图像。

图8为本公开实施例提供的另一种图像处理模型训练的实现示意图。如图8所示,从样本图像中获取一个目标子图像p5和多个辅助子图像(即p1、p2、p3、p4、p6、p7、p8和p9),将目标子图像和辅助子图像串联,得到串联后的多个样本子图像作为图像处理模型训练过程中的输入图像,经过图像处理模型得到图像处理模型的输出图像。

以基于图像超分的图像处理模型训练为例进行说明。上述如图7所示图像处理模型的训练方法,是基于patch的训练方法,在训练时使用低分辨的patch与其对应高分辨率的patch分别作为网络的输入与标签进行训练,但是这一方法存在感受野受限的问题。如图8所示,为解决感受野受限的问题,本公开提出一种多patch的训练方法,与图7所示的方法的区别在于输入的不同,多patch的训练方法中,输入是串联后的多个patch(即串联后的多个样本子图像)。

如图8所示,在本公开实施例中,考虑到各个样本子图像之间的空间相关性,可以根据各个patch(即辅助子图像,p1、p2、p3、p4、p6、p7、p8和p9)与中心patch(即目标子图像p5)的相对位置,对各个辅助子图像分别进行了相应的翻转操作;具体的,对p1、p3、p7和p9这四个patch分别进行垂直对称翻转和水平对称翻转,对p2和p8分别进行垂直对称翻转,对p4和p6分别进行水平对称翻转。将中心的patch与周围8个翻转后的patch进行串联操作,得到最终的输入信息(即将目标子图像和辅助子图像串联,得到串联后的多个样本子图像)。

本公开所提出的多patch的训练方法,能够解决low-level任务中patch大小受限于GPU算力与显存的问题,还能够在不增加GPU算力与显存的情况下有效的提升图像处理模型的感受野,从而有效提升了图像处理模型的图像处理性能。

图9为本公开实施例所提供的一种图像处理装置的结构示意图,如图9所示,包括:

第一确定模块310,用于确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像;

第二确定模块320,用于确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零;

处理模块330,用于将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

本公开实施例所提供的技术方案,首先通过第一确定模块310,确定待处理子图像,待处理子图像为待处理图像的待处理区域内的图像;然后通过第二确定模块320,确定辅助图像,辅助图像与待处理子图像尺寸相等,辅助图像内像素数据为零;最后通过处理模块330,将待处理子图像和辅助图像串联后输入至图像处理模型,得到待处理图像的处理后的目标图像,待处理子图像和辅助图像的个数与图像处理模型在训练阶段作为输入的图像的个数均为设定个数。该装置通过确定待处理子图像和辅助图像,辅助图像作为输入能够辅助扩大图像处理模型的感受野,通过将待处理子图像和辅助图像串联后输入至图像处理模型以得到目标图像,采用图像串联的方式能够使得输入至图像处理模型的多个图像块的尺寸没有增加,避免了由于增加输入图像处理模型的图像块尺寸的大小而导致增加GPU显存占用与算力的问题,提高了图像处理模型的处理性能,从而提高了图像处理的可靠性。

可选的,所述待处理图像为待进行像素处理的图像,目标图像为进行像素处理后的图像。

可选的,该装置包括训练模块,所述训练模块用于:

获取模块,用于获取样本集,所述样本集包括多个样本对,各所述样本对分别包括各自所对应的串联后的多个样本子图像和处理后图像,所述处理后图像为目标子图像处理后的图像,所述目标子图像为所述多个样本子图像中的待进行处理的一个样本子图像,各样本对间,目标子图像与所对应的其余样本子图像的相对位置关系相同;

训练模块,用于基于所述样本集对待训练的图像处理模型进行训练,得到训练后的图像处理模型。

可选的,获取模块,包括:

第一获取单元,用于获取样本图像;

第二获取单元,用于从所述样本图像中获取目标子图像和位于所述目标子图像设定位置处的辅助子图像,所述辅助子图像的个数为至少一个,各辅助子图像与所述目标子图像的相对位置不同;

翻转单元,用于对所述辅助子图像进行翻转处理,得到处理后的辅助子图像;

串联单元,用于将所述目标子图像和所述辅助子图像串联,得到串联后的多个样本子图像;

样本对确定单元,用于将所述串联后的多个样本子图像和所对应处理后图像,作为所述样本图像的样本对。

可选的,不同的样本图像的多个样本子图像在进行串联时,各样本子图像间的顺序相同。

可选的,翻转单元,包括:

确定子单元,用于针对每个辅助子图像,基于所述辅助子图像相对于所述目标子图像的位置,确定翻转方式;

翻转子单元,用于采用所述翻转方式,翻转所述辅助子图像。

可选的,确定子单元,具体用于:

在所述辅助子图像位于所述目标子图像的水平中心线所在直线上,则确定所述辅助子图像的翻转方式为水平对称翻转;

在所述辅助子图像位于所述目标子图像的垂直中心线所在直线上,则确定所述辅助子图像的翻转方式为垂直对称翻转;

在所述辅助子图像位于所述目标子图像的对角线所在直线上,则确定所辅助子图像的翻转方式为水平对称翻转和垂直对称翻转。

本公开实施例所提供的图像处理装置可执行本公开任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。

值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。

图10为本公开实施例所提供的一种电子设备的结构示意图。下面参考图10,其示出了适于用来实现本公开实施例的电子设备400的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图10所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。编辑/输出(I/O)接口405也连接至总线404。

通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。

本公开实施例提供的电子设备与上述实施例提供的图像处理方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。

本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理装置执行时实现上述实施例所提供的图像处理方法。

需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是,但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像;确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零;将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取样本图像的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

根据本公开的一个或多个实施例,示例1提供了一种图像处理方法,包括:

确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像;

确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零;

将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

根据本公开的一个或多个实施例,示例2根据示例1所述的方法,

所述待处理图像为待进行像素处理的图像,目标图像为进行像素处理后的图像。

根据本公开的一个或多个实施例,示例3根据示例1所述的方法,

所述图像处理模型的训练阶段包括如下步骤:

获取样本集,所述样本集包括多个样本对,各所述样本对分别包括各自所对应的串联后的多个样本子图像和处理后图像,所述处理后图像为目标子图像处理后的图像,所述目标子图像为所述多个样本子图像中的待进行处理的一个样本子图像,各样本对间,目标子图像与所对应的其余样本子图像的相对位置关系相同;

基于所述样本集对待训练的图像处理模型进行训练,得到训练后的图像处理模型。

根据本公开的一个或多个实施例,示例4根据示例3所述的方法,

所述获取样本集,包括:

获取样本图像;

从所述样本图像中获取目标子图像和位于所述目标子图像设定位置处的辅助子图像,所述辅助子图像的个数为至少一个,各辅助子图像与所述目标子图像的相对位置不同;

对所述辅助子图像进行翻转处理,得到处理后的辅助子图像;

将所述目标子图像和所述辅助子图像串联,得到串联后的多个样本子图像;

将所述串联后的多个样本子图像和所对应处理后图像,作为所述样本图像的样本对。

根据本公开的一个或多个实施例,示例5根据示例4所述的方法,

不同的样本图像的多个样本子图像在进行串联时,各样本子图像间的顺序相同。

根据本公开的一个或多个实施例,示例6根据示例4所述的方法,

所述对所述辅助子图像进行翻转处理,得到处理后的辅助子图像,包括:

针对每个辅助子图像,基于所述辅助子图像相对于所述目标子图像的位置,确定翻转方式;

采用所述翻转方式,翻转所述辅助子图像。

根据本公开的一个或多个实施例,示例7根据示例6所述的方法,

所述基于所述辅助子图像相对于所述目标子图像的位置,确定翻转方式,包括:

在所述辅助子图像位于所述目标子图像的水平中心线所在直线上,则确定所述辅助子图像的翻转方式为水平对称翻转;

在所述辅助子图像位于所述目标子图像的垂直中心线所在直线上,则确定所述辅助子图像的翻转方式为垂直对称翻转;

在所述辅助子图像位于所述目标子图像的对角线所在直线上,则确定所辅助子图像的翻转方式为水平对称翻转和垂直对称翻转。

根据本公开的一个或多个实施例,示例8提供了一种图像处理装置,包括:

第一确定模块,用于确定待处理子图像,所述待处理子图像为待处理图像的待处理区域内的图像;

第二确定模块,用于确定辅助图像,所述辅助图像与所述待处理子图像尺寸相等,所述辅助图像内像素数据为零;

处理模块,用于将所述待处理子图像和所述辅助图像串联后输入至图像处理模型,得到所述待处理图像的处理后的目标图像,所述待处理子图像和所述辅助图像的个数与所述图像处理模型在训练阶段作为输入的图像的个数均为设定个数。

根据本公开的一个或多个实施例,示例9提供了一种电子设备,包括:

一个或多个处理装置;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如示例1-7中任一所述的图像处理方法。

根据本公开的一个或多个实施例,示例10提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理装置执行时用于执行如示例1-7中任一所述的图像处理方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

相关技术
  • 图像处理方法、装置、电子设备及存储介质
  • 图像处理方法、装置、计算机可读存储介质和电子设备
  • 图像处理方法、装置、计算机可读存储介质和电子设备
  • 图像处理方法和装置、电子设备、计算机可读存储介质
  • 图像处理方法和装置、电子设备、计算机可读存储介质
  • 图像预处理方法和装置、图像处理方法、电子设备及介质
  • 一种图像处理方法、图像处理装置、电子设备和存储介质
技术分类

06120115586774