掌桥专利:专业的专利平台
掌桥专利
首页

一种图像超分辨率方法、图像超分辨率装置及终端设备

文献发布时间:2023-06-19 11:22:42


一种图像超分辨率方法、图像超分辨率装置及终端设备

技术领域

本申请属于图像处理技术领域,尤其涉及一种图像超分辨率方法、图像超分辨率装置、终端设备及计算机可读存储介质。

背景技术

随着深度学习技术的快速发展,基于深度卷积神经网络的图像超分辨率方法在图像处理技术领域得到了越来越多的关注。

但是,这种图像超分辨率方法有一个不可忽视的缺陷是,它们通常只能得到过于平滑的超分辨图像。

因此,现有技术有待进一步改进。

发明内容

有鉴于此,本申请提供了一种图像超分辨率方法、图像超分辨率装置、终端设备及计算机可读存储介质,可以有效地恢复低分辨图像中的高频信息,解决了超分辨率图像过于平滑的问题。

第一方面,本申请实施例提供了一种图像超分辨率方法,包括:

将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;

恢复上述深度特征图的局部高频信息得到第一复原特征图;

将上述第一复原特征图的分辨率放大到预定大小;

对预定大小的第一复原特征图进行重建得到超分辨图像。

第二方面,本申请实施例提供了一种图像超分辨率装置,包括:

特征提取单元,用于将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;

高频恢复单元,用于恢复上述深度特征图的局部高频信息得到第一复原特征图;

放大单元,用于将上述第一复原特征图的分辨率放大到预定大小;

重建单元,用于对预定大小的第一复原特征图进行重建得到超分辨图像。

第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面所提供的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如第一方面所提供的方法。

第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中所提供的方法。

由上可见,本申请方案中首先将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;然后恢复上述深度特征图的局部高频信息得到第一复原特征图;再将上述第一复原特征图的分辨率放大到预定大小;最后对预定大小的第一复原特征图进行重建得到超分辨图像。采用上述方法使得在图像超分辨率过程中增大了图像中的高频分量,可以有效地恢复低分辨图像中的高频信息,提高超分辨率图像的视觉效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的图像超分辨率方法所适用于的手机的结构示意图;

图2是本申请实施例提供的图像超分辨率方法的流程示意图;

图3是本申请实施例提供的局部注意力模块的处理流程示意图;

图4是本申请实施例提供的全局注意力模块的处理流程示意图;

图5是本申请实施例提供的微结构的示意图;

图6是本申请实施例提供的卷积神经网络的结构示意图;

图7是本申请实施例提供的图像超分辨率装置的结构示意图;

图8是本申请实施例提供的终端设备的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

本申请实施例提供的图像超分辨率方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。

例如,上述终端设备可以是WLAN中的站点(STAION,ST),可以是蜂窝电话、无绳电话、会话启动协议(Session InitiationProtocol,SIP)电话、无线本地环路(WirelessLocal Loop,WLL)站、个人数字处理(Personal Digital Assistant,PDA)设备、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、车联网终端、电脑、膝上型计算机、手持式通信设备、手持式计算设备、卫星无线设备、无线调制解调器卡、电视机顶盒(set top box,STB)、用户驻地设备(customer premise equipment,CPE)和/或用于在无线系统上进行通信的其它设备以及下一代通信系统,例如,5G网络中的移动终端或者未来演进的公共陆地移动网络(Public Land Mobile Network,PLMN)网络中的移动终端等。

作为示例而非限定,当上述终端设备为可穿戴设备时,该可穿戴设备还可以是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,如眼镜、手套、手表、服饰及鞋等。可穿戴设备即直接穿在身上,或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅仅是一种硬件设备,更是通过软件支持以及数据交互、云端交互来实现强大的功能。广义穿戴式智能设备包括功能全、尺寸大、可不依赖智能手机实现完整或者部分的功能,如智能手表或智能眼镜等,以及只专注于某一类应用功能,需要和其它设备如智能手机配合使用,如各类进行体征监测的智能手环、智能首饰等。

以上述终端设备为手机为例。图1示出的是与本申请实施例提供的手机的部分结构的框图。参考图1,手机包括:射频(Radio Frequency,RF)电路110、存储器120、输入单元130、显示单元140、传感器150、音频电路160、无线保真(wireless fidelity,WiFi)模块170、处理器180、以及电源190等部件。本领域技术人员可以理解,图1中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图1对手机的各个构成部件进行具体的介绍:

RF电路110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器180处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路110还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。

存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元130可用于接收输入的数字或字符信息,以及产生与手机100的用户设置以及功能控制有关的键信号输入。具体地,输入单元130可包括触控面板131以及其他输入设备132。触控面板131,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板131上或在触控面板131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板131。除了触控面板131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元140可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元140可包括显示面板141,可选的,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板141。进一步的,触控面板131可覆盖显示面板141,当触控面板131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图1中,触控面板131与显示面板141是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板131与显示面板141集成而实现手机的输入和输出功能。

手机100还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在手机移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路160、扬声器161,传声器162可提供用户与手机之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一手机,或者将音频数据输出至存储器120以便进一步处理。

WiFi属于短距离无线传输技术,手机通过WiFi模块170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块170,但是可以理解的是,其并不属于手机100的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器180是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理单元;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。

手机100还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出,手机100还可以包括摄像头。可选地,摄像头在手机100的上的位置可以为前置的,也可以为后置的,本申请实施例对此不作限定。

可选地,手机100可以包括单摄像头、双摄像头或三摄像头等,本申请实施例对此不作限定。

例如,手机100可以包括三摄像头,其中,一个为主摄像头、一个为广角摄像头、一个为长焦摄像头。

可选地,当手机100包括多个摄像头时,这多个摄像头可以全部前置,或者全部后置,或者一部分前置、另一部分后置,本申请实施例对此不作限定。

另外,尽管未示出,手机100还可以包括蓝牙模块等,在此不再赘述。

图2示出了本申请实施例提供的一种图像超分辨率方法的流程图,该图像超分辨率方法可应用于终端设备中,详述如下:

步骤201,将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;

在本申请实施例中,待处理图像可通过用户输入得到,此处不对上述待处理图像的数量作出限定。例如,若用户希望提高图像的分辨率,则打开安装在终端设备(如手机)上用于图像超分辨率的应用程序,并将待处理图像输入至该应用程序中。具体地,用于图像超分辨率的应用程序的输入界面上有一“导入图像”按钮,用户通过点击该按钮,可以从终端设备存储的图像中选择待处理图像;或者,终端设备也可以调用摄像头拍摄实时获取待处理图像;或者,终端设备还可以从互联网中获取图像作为待处理图像,此处不做限定。

具体地,将待处理图像从上述卷积神经网络的输入层输入,然后通过卷积核先对上述待处理图像进行浅层特征提取,上述浅层特征包括图像的边缘、纹理以及曲线等图像特征。在提取得到浅层特征图后,通过卷积核对上述浅层特征图进一步处理形成深度特征图。

步骤202,恢复上述深度特征图的局部高频信息得到第一复原特征图;

在本申请实施例中,通过局部注意力机制关注深度特征图的局部区域,对每个局部区域进行处理,恢复局部区域的高频信息,得到第一复原特征图。

可选地,上述步骤202具体包括:

A1、对上述深度特征图进行平均池化得到第一特征图;

A2、对上述第一特征图进行上采样得到第二特征图;

A3、计算上述深度特征图与上述第二特征图对应的张量差;

A4、根据上述张量差恢复上述深度特征图的局部高频信息,得到第一复原特征图。

其中,上述深度特征图经过平均池化操作,使得上述深度特征图的数据量减小,得到第一特征图。该第一特征图的尺寸要小于上述深度特征图的尺寸,上述平均池化将上述深度特征图的宽度和高度按同样的比例缩小,但是不改变深度特征图的通道数。然后对上述第一特征图进行一个上采样操作,将上述第一特征图的尺寸恢复到原来的深度特征图的尺寸,得到第二特征图,即该第二特征图的尺寸等于上述深度特征图的尺寸。且第二特征图指示了上述深度特征图中每个局部区域的平均平滑信息。用上述深度特征图的张量减去上述第二特征图的张量,得到上述深度特征图与上述第二特征图对应的张量差。基于上述张量差对上述深度特征图进行处理,即可恢复上述深度特征图的局部高频信息,得到上述第一复原特征图。

具体地,如图3所示,我们有深度特征图的张量T

可选地,上述步骤A4具体包括:

B1、将经激活函数处理后的张量差与上述深度特征图逐元素相乘;

B2、将逐元素相乘的结果与上述深度特征图逐元素相加以恢复上述深度特征图的局部高频信息,得到第一复原特征图。

其中,上述张量差先经过一个激活函数(如线性整流函数)的处理,经激活函数处理后的张量差与上述深度特征图的张量逐元素相乘,得到逐元素相乘的结果,每个元素为张量中的一个数值。将逐元素相乘的结果与上述深度特征图逐元素相加,就得到上述第一复原特征图,上述第一复原特征图已经恢复了局部高频信息。

还是以上述深度特征图T

可选地,上述步骤A1具体包括:

基于预设的池化条件对上述深度特征图进行平均池化得到第一特征图。

其中,上述预设的池化条件为平均池化的步长等于池化窗口的长度,以得到上述深度特征图中连续且不重叠的局部区域。

步骤203,将上述第一复原特征图的分辨率放大到预定大小;

在本申请实施例中,上述第一复原特征图的分辨率需被放大为预定大小,预定大小的分辨率预先在上述卷积神经网络中设定好。

步骤204,对预定大小的第一复原特征图进行重建得到超分辨图像。

在本申请实施例中,上述卷积神经网络经过大量低分辨率图像和高分辨图像的训练。可以通过上述卷积神经网络将上述预定大小的第一复原特征图进行重建,输出超分辨率图像。

可选地,上述步骤204具体包括:

C1、恢复预定大小的第一复原特征图的全局高频信息得到第二复原特征图;

C2、对第二复原特征图进行重建得到超分辨图像。

具体地,通过全局注意力机制关注上述预定大小的第一复原特征图的全局高频信息,对全局的高频信息进行处理,恢复上述预定大小的第一复原特征图的全局高频信息,得到第二复原特征图。其中,上述第二复原特征图不但恢复了局部高信息,也恢复了全局高频信息,将上述第二复原特征图进行重建得到的超分辨图像有更好的高频细节,视觉效果更好。

可选地,上述步骤C1具体包括:

D1、对预定大小的第一复原特征图进行第一卷积得到第一特征张量;

D2、通过第二卷积减小上述第一特征张量的通道数得到第二特征张量;

D3、通过第三卷积增大上述第二特征张量的通道数得到第三特征张量;

D4、使用上述第三特征张量对上述预定大小的第一复原特征图进行加权得到第二复原特征图。

其中,上述第一卷积的卷积核的尺寸等于上述预定大小的第一复原特征图的尺寸,上述第三特征张量的通道数等于上述第一特征张量的通道数。上述第一卷积通过各个卷积核对预定大小的第一复原特征图进行卷积操作,各个卷积核计算上述预定大小的第一复原特征图的不同层面的全局统计信息,得到第一特征张量。上述第一特征张量的通道数要等于上述预定大小的第一复原特征图的通道数。然后对上述第一特征张量进行第二卷积,使上述第一特征张量的通道数按预设的比例减小,得到第二特征张量。对上述第二特征张量进行第三卷积,将上述第二特征张量的通道数恢复为上述第一特征张量的通道数,得到第三特征张量。使用上述第三特征张量对上述预定大小的第一复原特征图进行加权,即可恢复上述预定大小的第一复原特征图的全局高频信息,得到第二复原特征图。

具体地,如图4所示,我们有预定大小的第一复原特征图的张量T

可选地,上述图像超分辨率方法还包括:

上述卷积神经网络中包括深度特征网络,上述深度特征网络用于恢复上述深度特征图的局部高频信息;上述深度特征网络中的各层采用残差连接和密集连接的方式进行连接。

具体地,图5所示为上述深度特征网络中的部分结构,上述深度特征网络用于恢复上述深度特征图的局部高频信息。上述深度特征网络中的不同层通过残差连接和密集连接的方式进行连接。

如图6所示为上述卷积神经网络的整体网络结构图。上述卷积神经网络包括浅层特征网络、深度特征网络、放大网络、全局注意力网络以及重建网络。低分辨率图为输入的待处理图像。上述浅层特征网络包括一个卷积层,该卷积层有64个卷积核,每个卷积核的尺寸为3×3,步长为1,用于提取待处理图像的浅层特征。上述深度特征网络包括多个LARD块,每个LARD块包括3个微结构,每个微结构包括4个卷积层和3个局部注意力模块;前3个卷积层和3个局部注意力模块一对一通过密集连接的方式进行连接,即1个卷积层和1个局部注意力模块通过密集连接的方式组成密集块,3个密集块依次连接,在最后连接1个卷积层;每个微结构的头和尾通过残差连接的方式连接,每个LARD块的头和尾也通过残差连接的方式连接;每个卷积层有32个尺寸为3×3的卷积核,步长为1,填充为0,每个局部注意力模块的核尺寸为4×4,步长也为4;其中,卷积层用于提取深度特征图,局部注意力模块通过局部注意力机制恢复上述深度特征图的局部高频信息。上述放大网络包括1个上采样层和1个卷积层,该卷积层的卷积核尺寸为3×3,用于将上述第一复原特征图的分辨率放大到预定大小。上述全局注意力网络包括依次连接的卷积层1、全局注意力模块1、卷积层2以及全局注意力模块2,每个卷积层包括6个卷积核,每个卷积核的尺寸为3×3,步长为1,填充为0,用于恢复预定大小的第一复原特征图的全局高频信息。上述重建网络包括2个卷积层,其中一层有64个卷积核,另一层有3个卷积核,并且2个卷积层的核尺寸大小均为3×3,步长为1,填充为0,用于对预定大小的第一复原特征图进行重建得到超分辨图。

由上可见,本申请方案中首先将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;然后恢复上述深度特征图的局部高频信息得到第一复原特征图;再将上述第一复原特征图的分辨率放大到预定大小;最后对预定大小的第一复原特征图进行重建得到超分辨图像。采用上述方法使得在图像超分辨率过程中增大了图像中的高频分量,可以有效地恢复低分辨图像中的高频信息,提高超分辨率图像的视觉效果。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

图7示出了本申请实施例提供的一种图像超分辨率装置的结构示意图,该图像超分辨率装置可应用于终端设备,为了便于说明,仅示出了与本申请实施例相关的部分。

该图像超分辨率装置700包括:

特征提取单元701,用于将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;

高频恢复单元702,用于恢复上述深度特征图的局部高频信息得到第一复原特征图;

放大单元703,用于将上述第一复原特征图的分辨率放大到预定大小;

重建单元704,用于对预定大小的第一复原特征图进行重建得到超分辨图像。

可选地,上述高频恢复单元702还包括:

池化子单元,用于对上述深度特征图进行平均池化得到第一特征图,其中,上述第一特征图的尺寸小于上述深度特征图的尺寸;

上采样子单元,用于对上述第一特征图进行上采样得到第二特征图,其中,上述第二特征图的尺寸等于上述深度特征图的尺寸;

差值计算子单元,用于计算上述深度特征图与上述第二特征图对应的张量差;

局部恢复子单元,用于根据上述张量差恢复上述深度特征图的局部高频信息,得到第一复原特征图。

可选地,上述局部恢复子单元还包括:

乘法子单元,用于将经激活函数处理后的张量差与上述深度特征图逐元素相乘;

加法子单元,用于将逐元素相乘的结果与上述深度特征图逐元素相加以恢复上述深度特征图的局部高频信息,得到第一复原特征图。

可选地,上述池化子单元还包括:

预设池化子单元,用于基于预设的池化条件对上述深度特征图进行平均池化得到第一特征图,其中,上述预设的池化条件为平均池化的步长等于池化窗口的长度。

可选地,上述重建单元704还包括:

全局恢复子单元,用于恢复预定大小的第一复原特征图的全局高频信息得到第二复原特征图;

全局重建子单元,用于对第二复原特征图进行重建得到超分辨图像。

可选地,上述全局恢复子单元还包括:

第一卷积子单元,用于对预定大小的第一复原特征图进行第一卷积得到第一特征张量,其中,第一卷积的卷积核的尺寸等于上述预定大小的第一复原特征图的尺寸;

第二卷积子单元,用于通过第二卷积减小上述第一特征张量的通道数得到第二特征张量;

第三卷积子单元,用于通过第三卷积增大上述第二特征张量的通道数得到第三特征张量,其中,上述第三特征张量的通道数等于上述第一特征张量的通道数;

加权子单元,用于使用上述第三特征张量对上述预定大小的第一复原特征图进行加权得到第二复原特征图。

可选地,上述卷积神经网络中包括深度特征网络,上述深度特征网络用于恢复上述深度特征图的局部高频信息;上述深度特征网络中的各层采用残差连接和密集连接的方式进行连接。

由上可见,本申请方案中首先将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;然后恢复上述深度特征图的局部高频信息得到第一复原特征图;再将上述第一复原特征图的分辨率放大到预定大小;最后对预定大小的第一复原特征图进行重建得到超分辨图像。采用上述方法使得在图像超分辨率过程中增大了图像中的高频分量,可以有效地恢复低分辨图像中的高频信息,提高超分辨率图像的视觉效果。

图8为本申请一实施例提供的终端设备的结构示意图。如图8所示,该实施例的终端设备8包括:至少一个处理器80(图8中仅示出一个)处理器、存储器81以及存储在上述存储器81中并可在上述至少一个处理器80上运行的计算机程序82,上述处理器80执行上述计算机程序82时实现以下步骤:

将待处理图像输入至训练后的卷积神经网络提取特征得到深度特征图;

恢复上述深度特征图的局部高频信息得到第一复原特征图;

将上述第一复原特征图的分辨率放大到预定大小;

对预定大小的第一复原特征图进行重建得到超分辨图像。

假设上述为第一种可能的实施方式,则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,上述恢复上述深度特征图的局部高频信息得到第一复原特征图,包括:

对上述深度特征图进行平均池化得到第一特征图,其中,上述第一特征图的尺寸小于上述深度特征图的尺寸;

对上述第一特征图进行上采样得到第二特征图,其中,上述第二特征图的尺寸等于上述深度特征图的尺寸;

计算上述深度特征图与上述第二特征图对应的张量差;

根据上述张量差恢复上述深度特征图的局部高频信息,得到第一复原特征图。

在上述第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,上述根据上述张量差恢复上述深度特征图的局部高频信息,得到第一复原特征图,包括:

将经激活函数处理后的张量差与上述深度特征图逐元素相乘;

将逐元素相乘的结果与上述深度特征图逐元素相加以恢复上述深度特征图的局部高频信息,得到第一复原特征图。

在上述第二种可能的实施方式作为基础而提供的第四种可能的实施方式中,上述对上述深度特征图进行平均池化得到第一特征图,包括:

基于预设的池化条件对上述深度特征图进行平均池化得到第一特征图,其中,上述预设的池化条件为平均池化的步长等于池化窗口的长度。

在上述第一种可能的实施方式作为基础而提供的第五种可能的实施方式中,上述对预定大小的第一复原特征图进行重建得到超分辨图像,包括:

恢复预定大小的第一复原特征图的全局高频信息得到第二复原特征图;

对第二复原特征图进行重建得到超分辨图像。

在上述第五种可能的实施方式作为基础而提供的第六种可能的实施方式中,上述恢复预定大小的第一复原特征图的全局高频信息得到第二复原特征图,包括:

对预定大小的第一复原特征图进行第一卷积得到第一特征张量,其中,第一卷积的卷积核的尺寸等于上述预定大小的第一复原特征图的尺寸;

通过第二卷积减小上述第一特征张量的通道数得到第二特征张量;

通过第三卷积增大上述第二特征张量的通道数得到第三特征张量,其中,上述第三特征张量的通道数等于上述第一特征张量的通道数;

使用上述第三特征张量对上述预定大小的第一复原特征图进行加权得到第二复原特征图。

在上述第一种可能的实施方式作为基础,或者上述第二种可能的实施方式作为基础,或者上述第三种可能的实施方式作为基础,或者上述第四种可能的实施方式作为基础,或者上述第五种可能的实施方式作为基础,或者上述第六种可能的实施方式作为基础而提供的第七种可能的实施方式中,上述卷积神经网络中包括深度特征网络,上述深度特征网络用于恢复上述深度特征图的局部高频信息;上述深度特征网络中的各层采用残差连接和密集连接的方式进行连接。

上述终端设备8可以是手机、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的举例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。

所称处理器80可以是中央处理单元(Central Processing Unit,CPU),该处理器80还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

上述存储器81在一些实施例中可以是上述终端设备8的内部存储单元,例如终端设备8的硬盘或内存。上述存储器81在另一些实施例中也可以是上述终端设备8的外部存储设备,例如上述终端设备8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述存储器81还可以既包括上述终端设备8的内部存储单元也包括外部存储设备。上述存储器81用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如上述计算机程序的程序代码等。上述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。

需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

相关技术
  • 一种图像超分辨率方法、图像超分辨率装置及终端设备
  • 一种超像元尺度下的多光谱图像超分辨率洪水淹没制图方法
技术分类

06120112899151