掌桥专利:专业的专利平台
掌桥专利
首页

图像处理方法及相关设备

文献发布时间:2024-04-18 19:58:21


图像处理方法及相关设备

技术领域

本申请涉及图像技术领域,尤其涉及一种图像处理方法及相关设备。

背景技术

随着视觉算法的发展,AR(Augmented Reality,增强现实)技术的应用越来越广泛。AR技术可以通过图像分析将真实世界和虚拟世界进行集成,能够应用于室内导航。其中,视觉重定位系统(Visual Positioning System,VPS)是AR技术中的重要技术,可以根据电子设备拍摄的图像或视频对电子设备进行定位。然而,在商场、车库等室内场景,存在大量相似的图像,导致定位准确度较低,导航效果较差。

发明内容

鉴于以上内容,有必要提供一种图像处理方法及相关设备,解决由于室内场景存在大量相似的图像而导致室内导航的定位准确度较低的问题。

第一方面,本申请提供一种图像处理方法,应用于电子设备,所述方法包括:获取查询图像,基于所述查询图像进行图像检索,得到多个候选图像;对所述多个候选图像进行聚类,并选择每个分类的类代表图像;提取所述查询图像和所述类代表图像的颜色特征,并基于所述查询图像和所述类代表图像的颜色特征计算所述查询图像与每个所述类代表图像之间的颜色相似度;计算所述类代表图像的位姿,并基于所述类代表图像的位姿计算所述类代表图像的重投影误差;基于所述查询图像与每个所述类代表图像之间的颜色相似度及所述类代表图像的重投影误差选择多个分类;基于选择的所述多个分类下的候选图像计算所述查询图像的位姿。

通过上述技术方案,基于颜色相似度选择分类,并基于选择的分类对应的图像计算查询图像的位姿,有效避免检索出来的图像的内容相似但是颜色不同而导致图像匹配错误,有效提高定位准确度。

在一种可能的实现方式中,所述基于查询图像进行图像检索,得到多个候选图像,包括:将所述查询图像与当前场景的图像数据库中的图像进行特征匹配,得到所述多个候选图像。

通过上述技术方案,基于特征匹配进行图像检索,可以精确地检索出与查新图像相似的图像,在基于检索得到的候选图像进行定位时,可以提高定位准确度。

在一种可能的实现方式中,所述对多个候选图像进行聚类,包括:通过聚类算法对所述多个候选图像进行聚类,得到所述多个候选图像的多个分类。

通过上述技术方案,基于聚类方法对检索得到的图像进行分类,可以提高分类准确度。

在一种可能的实现方式中,所述选择每个分类的类代表图像,包括:获取一分类中的每个候选图像属于所述分类的特征点数量;基于属于所述分类的特征点数量对所述分类中的多个候选图像进行排序;将排名在前预设数量的候选图像确定为所述分类的类代表图像。

通过上述技术方案,基于每个候选图像属于对应分类的特征点数量确定每个分类的类代表图像,并基于类代表图像进行后续的图像处理,可以减少数据处理量,提高定位效率。

在一种可能的实现方式中,所述提取查询图像和类代表图像的颜色特征,并基于查询图像和类代表图像的颜色特征计算查询图像与每个类代表图像之间的颜色相似度,包括:提取所述查询图像和所述类代表图像的前景区域和背景区域;将所述查询图像和所述类代表图像的背景区域图像转换为HSV图像;提取所述查询图像和所述类代表图像的HSV图像的预设颜色范围,基于所述预设颜色范围形成所述查询图像和所述类代表图像的掩膜图像;基于所述查询图像和所述类代表图像的掩膜图像计算所述查询图像和所述类代表图像的颜色特征向量;计算所述查询图像的颜色特征向量与每个类代表图像的颜色特征向量之间的欧氏距离,得到所述查询图像与每个类代表图像之间的颜色相似度。

通过上述技术方案,基于查询图像和类代表图像的颜色特征计算查询图像与每个类代表图像之间的颜色相似度,基于颜色相似度可以有效地区分内容相同但颜色不同的图像。

在一种可能的实现方式中,所述提取查询图像和类代表图像的前景区域和背景区域,包括:将所述查询图像和所述类代表图像输入显著性检测模型,通过显著性检测模型输出所述前景区域和所述背景区域的分割图。

通过上述技术方案,基于显著性检测模型区分查询图像和类代表图像中的前景区域和背景区域,可以提取出图像中的感兴趣区域,从而提高定位效率。

在一种可能的实现方式中,所述将查询图像和类代表图像的背景区域图像转换为HSV图像,包括:将所述查询图像和所述类代表图像的所述背景区域图像的RGB三通道分量分别转换为HSV三通道分量,得到所述背景区域图像对应的HSV图像。

通过上述技术方案,基于将RGB图像转换为HSV图像,表征图像的色调、饱和度和明度,以便于后续的图像处理,

在一种可能的实现方式中,所述提取查询图像和类代表图像的预设颜色范围,包括:获取当前场景的多个颜色,基于每个颜色提取对应的预设颜色范围,其中,每个颜色的预设颜色范围包括HSV三通道分量的数值范围。

通过上述技术方案,基于提取每个颜色的预设颜色范围,预设颜色范围可以作为是否进行颜色替换的依据,有效提高了颜色替换准确度,并提高图像处理效率。

在一种可能的实现方式中,所述基于颜色范围形成查询图像和类代表图像的掩膜图像,包括:获取所述HSV图像中每个像素点的HSV像素值,判断所述HSV像素值的H值、S值和V值是否均落入所述多个颜色中任一颜色的颜色范围;若所述HSV像素值的H值、S值和V值落入所述颜色的颜色范围,将所述像素点的像素值替换为所述预设颜色的像素值;所述HSV图像中经过颜色替换的所有像素点形成所述HSV图像的掩膜图像。

通过上述技术方案,基于预设颜色范围和每个像素点的HSV像素值对像素点进行颜色替换,形成掩膜图像,可以进一步精确地提取出图像中的感兴趣区域。

在一种可能的实现方式中,所述基于查询图像和类代表图像的掩膜图像计算查询图像和类代表图像的颜色特征向量,包括:统计所述掩膜图像中各所述颜色的像素点数量;计算各所述颜色的像素点数量与所述掩膜图像的总像素点数量的比例;基于预设的颜色顺序和各所述颜色的比例确定所述查询图像和所述类代表图像的颜色特征向量。

通过上述技术方案,基于掩膜图像中的预设颜色顺序和各所述预设颜色的比例确定查询图像和所述类代表图像的颜色特征向量。

在一种可能的实现方式中,所述计算类代表图像的位姿,包括:对所述类代表图像进行特征提取和匹配,确定所述类代表图像中多个2D点分别对应的空间中的3D点;所述类代表图像的多个2D点和所述空间中的多个3D点一一对应形成多组匹配点对;将所述多组匹配点对输入透视n点PnP算法,得到所述类代表图像的位姿。

通过上述技术方案,基于PnP算法可以精确地计算得到类代表图像的位姿。

在一种可能的实现方式中,所述基于类代表图像的位姿计算重投影误差,包括:基于所述类代表图像的位姿将任一空间3D点投影在所述类代表图像上,得到所述空间3D点的投影点;计算所述空间3D点的投影点与所述空间3D点对应的所述类代表图像上的2D点之间的距离,得到所述空间3D点的重投影误差;基于每个分类中的类代表图像的重投影误差,得到所述分类对应的重投影误差。

通过上述技术方案,可以精确地计算得到空间3D点的重投影误差,用作后续类选择的依据。

在一种可能的实现方式中,所述基于查询图像与每个类代表图像之间的颜色相似度及类代表图像的重投影误差选择多个分类,包括:选择所述查询图像与所述类代表图像之间的颜色相似度最大的所述类代表图像所属的分类作为选择的首选类;计算所述首选类的重投影误差,作为参考重投影误差;将重投影误差小于或等于所述参考重投影误差的预设倍数的分类作为选择的剩余类。

通过上述技术方案,从多个分类中选择出用于计算图像位姿的分类,基于选择的分类中的候选图像可以精确地计算得到图像位姿。

在一种可能的实现方式中,所述基于选择的多个分类下的候选图像计算查询图像的位姿,包括:将所述查询图像与选择的多个分类下的候选图像进行投影匹配,确定所述查询图像中2D点与空间3D点的多组匹配点对;将所述多组匹配点对输入PnP算法,得到所述查询图像的位姿。

通过上述技术方案,基于投影匹配确定查询图像中2D点与空间3D点的多组匹配点对,从而精确地计算出图像位姿,实现电子设备的定位。

第二方面,本申请提供一种电子设备,所述电子设备包括存储器和处理器:其中,所述存储器,用于存储程序指令;所述处理器,用于读取并执行所述存储器中存储的所述程序指令,当所述程序指令被所述处理器执行时,使得所述电子设备执行上述的图像处理方法。

第三方面,本申请提供一种芯片,与电子设备中的存储器耦合,所述芯片用于控制所述电子设备执行上述的图像处理方法。

第四方面,本申请提供一种计算机存储介质,所述计算机存储介质存储有程序指令,当所述程序指令在电子设备上运行时,使得所述电子设备执行上述的图像处理方法。

另外,第二方面至第四方面所带来的技术效果可参见上述方法部分各设计的方法相关的描述,此处不再赘述。

附图说明

图1A是本申请一实施例提供的查询图像。

图1B是本申请一实施例提供的基于查询图像检索得到的图像。

图2是本申请一实施例提供的电子设备的软件架构图。

图3是本申请一实施例提供的图像处理方法的流程图。

图4是本申请一实施例提供的颜色相似度计算的流程图。

图5A是本申请一实施例提供的前景背景分割前的查询图像。

图5B是本申请一实施例提供的前景背景分割后的查询图像。

图6A是本申请一实施例提供的原始背景区域图像。

图6B是本申请一实施例提供的原始背景区域图像对应掩膜图像。

图7是本申请另一实施例提供的图像处理方法的流程图。

图8是本申请一实施例提供的电子设备的硬件架构图。

具体实施方式

本申请实施例中所涉及的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请中的技术领域的技术人员通常理解的含义相同。本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。应理解,本申请中除非另有说明,“/”表示或的意思。例如,A/B可以表示A或B。本申请中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B三种情况。“至少一个”是指一个或者多个。“多个”是指两个或多于两个。例如,a、b或c中的至少一个,可以表示:a,b,c,a和b,a和c,b和c,a、b和c七种情况。

在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

随着硬件技术、视觉算法的快速发展,增强现实技术的应用也越来越广泛,例如应用于医疗、军事、视频通讯、导航等领域。其中,视觉重定位系统是增强现实技术中的重要技术,尤其随着室内增强现实导航的兴起,解决了用户在室内复杂环境或者不熟悉环境中寻找目的地困难的问题,例如商场找店、车库找车等。然而,由于商场、车库环境的图像较为相似,图像之间存在大量重复纹理,只有颜色区别,导致视觉定位准确度低,无法有效地利用增强现实完成室内导航。

为了避免由于室内环境的图像较为相似,只有颜色区别,而导致在视觉定位过程中,图像检索结果容易出现错误,导致定位准确度较低,本申请实施例提供一种图像处理方法,通过图像特征的提取和对比,确定与电子设备拍摄的图像相匹配的预设图像,并基于匹配的预设图像和拍摄图像的颜色特征,进行电子设备的定位,有效提高视觉定位的准确度。图像处理方法的详细过程可参考下文各个实施例中的描述。

为了更好地理解本申请实施例提供的图像处理方法,下面结合图1A、图1B对本申请实施例提供的图像处理方法的应用场景进行描述。

用户在室内场景下,采用增强现实进行导航时,通过电子设备拍摄室内场景的图像,并将拍摄得到的图像与该室内场景下的已知图像进行匹配,基于三维空间计算电子设备在地图或已知坐标系中的位置和姿态,从而对电子设备进行定位。

以地下车库场景为例,用户进入地下车库后,使用电子设备拍摄如图1A所示的图像,在预先创建的地下车库的图像数据库中检索与拍摄的图像相似的图像,相似的图像如图1B所示,均包括地下车库的柱子。参阅图1B所示,可以检索得到大量与拍摄的图像相似的图像,但相似的多个图像中的柱子上的贴纸或墙面的颜色往往不同,即,相似的图像中颜色可能不同,如此,图像匹配容易出现误差,导致匹配到的图像对应的位置与电子设备实际的位置不同,进而导致定位不准确。

参阅图2所示,为本申请实施例提供的电子设备的软件架构图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。例如,将安卓系统分为四层,从上至下分别为应用程序层101,框架层102,安卓运行时(Androidruntime)和系统库103,硬件抽象层104,内核层105。

应用程序层101可以包括一系列应用程序包。例如,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息,设备控制服务等应用程序。

框架层102为应用程序层的应用程序提供应用编程接口(ApplicationProgramming Interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。例如,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。

其中,窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。电话管理器用于提供电子设备的通信功能。例如通话状态的管理(包括接通,挂断等)。资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等。通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。

Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。

应用程序层101和框架层102运行在虚拟机中。虚拟机将应用程序层和框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。

系统库103可以包括多个功能模块。例如,表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如SGL)等。

其中,表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。2D图形引擎是2D绘图的绘图引擎。

硬件抽象层104运行于用户空间,对内核层驱动进行封装,向上层提供调用接口。

内核层105是硬件和软件之间的层。内核层105至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。

内核层105是电子设备的操作系统的核心,是基于硬件的第一层软件扩充,提供操作系统最基本的功能,是操作系统工作的基础,负责管理系统的进程、内存、设备驱动程序、文件和网络系统,决定了系统的性能和稳定性。例如,内核可以决定一个应用程序对某部分硬件的操作时间。

内核层105包括与硬件紧密相关的程序,例如中断处理程序、设备驱动程序等,还包括基本的、公共的、运行频率较高的模块,例如时钟管理模块、进程调度模块等,还包括关键性的数据结构。内核层可以设置于处理器中,或固化在内部存储器。

参阅图3所示,为本申请一实施例提供的图像处理方法的流程图。所述方法应用于电子设备中,所述图像处理方法包括:

S101,获取查询图像,基于查询图像进行图像检索,得到多个候选图像。

在本申请的一实施例中,获取查询图像包括:通过电子设备的摄像头拍摄当前场景的图像,作为查询图像。基于查询图像进行图像检索,得到多个候选图像包括:将查询图像与当前场景的图像数据库中的图像进行特征匹配,得到多个候选图像。

在本申请的一实施例中,将查询图像与当前场景的图像数据库中的预设图像进行特征匹配包括:将查询图像与图像数据库中的预设图像输入深度学习模型,通过深度学习模型提取查询图像和预设图像的特征,对提取的查询图像和预设图像的特征进行匹配,得到查询图像和每一预设图像之间的相似度,将所有预设图像中相似度排名在前第一预设数量的预设图像确定为候选图像,从而得到TopN个候选图像,N为第一预设数量。在本申请的一实施例中,第一预设数量为100,在其他实施例中,第一预设数量也可以根据需求设置为其他数值。

在本申请的另一实施例中,将查询图像与当前场景的图像数据库中的预设图像进行特征匹配包括:通过SIFT(Scale-invariant feature transform,尺度不变特征变换)算法对查询图像与当前场景的图像数据库中的预设图像进行特征匹配。

在本申请的所述另一实施例中,通过SIFT算法对查询图像与当前场景的图像数据库中的预设图像进行特征匹配包括:构建高斯尺度空间,产生查询图像和多个预设图像的高斯模糊图像,对高斯模糊图像进行降采样,得到尺寸缩小的图像,通过DOG(Differenceof Gaussian,高斯差分函数)空间极值检测,提取出查询图像和多个预设图像的多个特征点,确定每个特征点的主方向,确定描述子计算区域,并校正特征点的主方向,基于特征点的位置、尺度、主方向和描述子计算区域生成查询图像和多个预设图像的特征点描述子,特征点描述子为SIFT特征向量,计算查询图像的特征点描述子和每个预设图像的特征点描述子之间的欧式距离,得到查询图像与每个预设图像之间的相似度,将所有预设图像中相似度排名在前第一预设数量的预设图像确定为候选图像。

S102,对多个候选图像进行聚类,并选择每个分类的类代表图像。

在本申请的一实施例中,对多个候选图像进行聚类包括:通过聚类算法对多个候选图像进行聚类,得到多个候选图像的多个分类。聚类算法可以是K均值聚类算法、层次聚类算法、密度聚类算法、扩展谱聚类算法等,本申请实施例对此不予限制。

以K均值聚类算法为例,以随机或猜测的方式初始化聚类中心u

在本申请的一实施例中,选择每个分类的类代表图像包括:获取一分类中的每个候选图像属于该分类的特征点(即SIFT算法提取的图像的特征点)数量,基于属于该分类的特征点数量对该分类中的多个候选图像进行排序,将排名在前第二预设数量的候选图像确定为该分类的类代表图像,基于相同的方法确定其他分类的类代表图像,从而得到每个分类的类代表图像。其中,按照属于对应分类的特征点数量从大到小的顺序对各个分类中的多个候选图像进行排序。

S103,提取查询图像和类代表图像的颜色特征,并基于查询图像和类代表图像的颜色特征计算查询图像与每个类代表图像之间的颜色相似度。

在本申请的一实施例中,提取查询图像和类代表图像的颜色特征,并基于查询图像和类代表图像的颜色特征计算查询图像与每个类代表图像之间的颜色相似度的细化流程如图4所示,具体包括:

S1031,提取查询图像和类代表图像的前景区域和背景区域。

在本申请的一实施例中,提取查询图像和类代表图像的前景区域和背景区域包括:将查询图像和类代表图像输入显著性检测模型,通过显著性检测模型输出前景区域和背景区域的分割图,从而分别提取查询图像和类代表图像的前景区域和背景区域。在本申请的其他实施例中,也可以基于分水岭算法、阈值分割算法、K最近邻算法等提取查询图像和类代表图像的前景区域和背景区域。

在本申请的一实施例中,显著性检测模型包括全卷积网络(Fully ConvolutionalNetworks,FCN)模型和全连接条件随机场(dense Conditional Random Field,DenseCRF)模型。查询图像或类代表图像如图5A所示,全卷积网络包括卷积层、池化层和反卷积层,将查询图像和类代表图像输入显著性检测模型后,卷积层提取图像特征和进行特征分类,池化层对图像特征进行降维,反卷积层将记录有分类信息的图像特征上采样为前景区域和背景区域的初步分割图。将前景区域和背景区域的初步分割图输入全连接条件随机场模型,全连接条件随机场模型对初步分割图的像素点进行分类,得到前景区域和背景区域的分割图,分割图如图5B所示。

S1032,将查询图像和类代表图像的背景区域图像转换为HSV(Hue,Saturation,Value)图像。

在本申请的一实施例中,查询图像和类代表图像为RGB色彩空间的图像,即RGB图像,因此,查询图像和类代表图像的背景区域图像也为RGB图像,将RGB色彩空间图像转化为HSV色彩空间图像,得到HSV图像。

在本申请的一实施例中,HSV图像的颜色参数包括色调H、饱和度S和明度V,基于RGB图像的R分量、G分量和B分量计算HSV图像的色调H分量的公式为:

基于RGB图像的R分量、G分量和B分量计算HSV图像的饱和度S分量的公式为:

基于RGB图像的R分量、G分量和B分量计算HSV图像的明度V分量的公式为:

S1033,提取查询图像和类代表图像的预设颜色范围,基于预设颜色范围形成查询图像和类代表图像的掩膜(mask)图像。

在本申请的一实施例中,提取查询图像和类代表图像的预设颜色范围包括:获取当前场景的多个颜色,基于每个颜色提取对应的预设颜色范围。其中,每个颜色的预设颜色范围包括HSV三通道分量的数值范围。例如,一颜色的预设颜色范围包括:H

在本申请的一实施例中,基于预设颜色范围形成查询图像和类代表图像的掩膜图像包括:获取HSV图像中每个像素点的HSV像素值,判断HSV像素值的H值、S值和V值是否均落入多个颜色中任一颜色的预设颜色范围,若HSV像素值的H值、S值和V值均落入一颜色的预设颜色范围,将该像素点的掩膜像素值确定为该颜色的像素值,HSV图像中具有掩膜像素值的所有像素点形成HSV图像的掩膜图像。

在本申请的一实施例中,当前场景的多个颜色可以是当前场景的多个主要颜色,例如,车库场景的多个颜色包括紫色、橙色、绿色、蓝色、红色和其他颜色,紫色在掩膜图像中的像素值为0,橙色在掩膜图像中的像素值为50,绿色在掩膜图像中的像素值为100,蓝色在掩膜图像中的像素值为150,红色在掩膜图像中的像素值为200,其他颜色在掩膜图像中的像素值为255。如此,可以基于以下公式进行确定像素点的掩膜像素值:

在本申请的一实施例中,原始背景区域图像如图6A所示,原始背景区域图像对应的掩膜图像如图6B所示。

S1034,基于查询图像和类代表图像的掩膜图像,计算查询图像和类代表图像的颜色特征向量。

在本申请的一实施例中,基于查询图像和类代表图像的掩膜图像,计算查询图像和类代表图像的颜色特征向量包括:统计掩膜图像中各颜色的像素点数量pixel_color

基于预设的颜色顺序和各颜色的比例确定查询图像和类代表图像的颜色特征向量color_feature=[color_percent

S1035,计算查询图像的颜色特征向量与每个类代表图像的颜色特征向量之间的欧氏距离,得到查询图像与每个类代表图像之间的颜色相似度。

在本申请的一实施例中,假设查询图像的颜色特征向量为color_feature1=[x1,x2,…,xi],类代表图像的颜色特征向量color_feature2=[y1,y2,…,yi],查询图像的颜色特征向量与每个类代表图像的颜色特征向量之间的欧氏距离d的计算公式为:

S104,计算类代表图像的位姿,并基于类代表图像的位姿计算类代表图像的重投影误差。

在本申请的一实施例中,图像位姿可以是拍摄图像的摄像装置的外参。计算类代表图像的位姿包括:对类代表图像进行特征提取和匹配,确定类代表图像中的多个2D点分别对应的空间中的3D点,类代表图像中的多个2D点和空间中的多个3D点一一对应形成多组匹配点对,将多组匹配点对输入PnP(Perspective-n-Point,透视n点)算法,得到类代表图像的位姿。

在本申请的一实施例中,PnP算法是基于给定待处理图像中2D特征点pi(例如p1,p2,p3…)在相机坐标系下的坐标、2D特征点对应的3D点Pi(例如P1,P2,P3…)在世界坐标系中的坐标、以及相机内参,计算待处理图像的位姿。其中,相机内参为预设,通常用矩阵表示,用于描述相机焦距、光轴和图像交点的位置等属性。

例如,待处理图像中2D特征点pi在相机坐标系中的坐标为[u,v]

其中,Z

计算公式8可以变换为以下计算公式:

其中,fij为

Xw+f12·Yw+f13·Zw+f14-(f31·Xw+f32·Yw+f33·Zw+f34)·u=0

Xw+f22·Yw+f23·Zw+f24-(f31·Xw+f32·Yw+f33·Zw+f34)·v=0 (10)。

也就是说,一组2D-3D匹配关系对应计算公式10中的两个方程,共12个(即f11-f34)未知数,因此,需要至少6组2D-3D匹配关系可以计算得到相机外参t和R,从而得到类代表图像的位姿。

在本申请的一实施例中,基于类代表图像的位姿计算类代表图像的重投影误差包括:基于类代表图像的位姿将任一空间3D点投影在类代表图像上,得到该空间3D点的投影点,计算空间3D点的投影点与该空间3D点对应的类代表图像上的2D点之间的距离,得到该空间3D点的重投影误差,基于每个分类中的所有类代表图像的重投影误差的平均值,得到该分类对应的重投影误差。具体地,计算空间3D点的投影点的像素坐标与与该空间3D点对应的类代表图像上的2D点的像素坐标之间的距离,得到该空间3D点的重投影误差。

在本申请的一实施例中,所述方法还包括:基于每个分类的重投影误差确定每个分类的内点数量,其中,内点为候选图像中符合预设条件的2D点,预设条件为该2D点与对应的空间3D点之间的重投影误差小于预设重投影误差。在本申请的另一实施例中,重投影误差的单位为像素点数量,预设重投影误差为5个像素点。在本申请的其他实施例中,预设重投影误差也可以根据需求设置为其他数值。

S105,基于查询图像与每个类代表图像之间的颜色相似度及类代表图像的重投影误差选择多个分类。

在本申请的一实施例中,基于查询图像与每个类代表图像之间的颜色相似度及类代表图像的重投影误差选择多个分类包括:选择查询图像与类代表图像之间的颜色相似度最大的类代表图像所属的分类作为选择的首选类TopClass1;计算首选类TopClass1的重投影误差,作为参考重投影误差;将重投影误差小于或等于参考重投影误差的预设倍数的分类作为选择的剩余类。在本申请的一实施例中,预设倍数为1.2,例如,若首选类TopClass1的重投影误差为2个像素点,则重投影误差小于或等于2.4的分类作为选择的剩余类。在本申请的其他实施例中,预设倍数也可以根据需求设置为其他数值。

S106,基于选择的多个分类下的候选图像计算查询图像的位姿。

在本申请的一实施例中,基于选择的多个分类下的候选图像计算查询图像的位姿包括:将查询图像与选择的多个分类下的候选图像进行投影匹配,确定查询图像中2D点与空间3D点的多组匹配点对,将多组匹配点对输入PnP算法,得到查询图像的位姿,实现电子设备的定位。其中,多组匹配点对大于或等于6组,计算查询图像的位姿的方法与上文中计算类代表图像的位姿的方法相同,在此不作赘述。在本申请的一实施例中,图像位姿为拍摄图像的摄像装置的外参,表示了摄像装置在世界坐标系中的位置和方向,因此,可以作为电子设备的定位位置。

本申请实施例在通过计算图像的位姿而对电子设备进行定位时,在图像检索之后,基于计算查询图像与聚类得到的多个分类的检索图像之间的颜色相似度和多个分类的检索图像的重投影误差,并选择对应分类下的检索图像来计算查询图像的位姿,可以避免检索出大量纹理相似但颜色存在区别的图像对图像位姿的计算造成干扰,有效提高了位姿计算的准确度,进而提高电子设备定位的准确度。

参阅图7所示,为本申请另一实施例提供的图像处理方法的流程图。所述方法应用于电子设备中,所述图像处理方法包括:

S201,获取查询图像。其中,查询图像由用户终端设备获取。

S202,基于查询图像进行图像检索。

S203,对检索到的图像进行TopN结果聚类。

S204,选择类代表。图像检索,并对TopN结果聚类,利用原有流程3D点的数量完成类代表选择。

S205,对类代表图像进行特征提取和匹配。

S206,计算类代表图像的位姿。

S207,提取查询图像的颜色特征。其中,结合显著性检测获取查询图像的背景颜色特征向量。

S208,提取类代表图像的颜色特征。

S209,计算查询图像的颜色特征和类代表图像的颜色特征之间的颜色相似度。其中,获取类代表图像的背景颜色特征向量,将其与查询图像的颜色特征向量对比得到相似度结果。

S210,选择类。对聚类结果进行选择,依据内点重投影误差、内点数以及颜色相似度。

S211,对选择的类对应的检索图像进行投影匹配。

S212,计算查询图像的位姿。其中,类选择后剩余图像进行投影匹配获取所有图像的匹配点,然后进行位姿计算。

本申请实施例还提供一种电子设备100,参阅图8所示,所述电子设备100可以是手机、平板电脑、桌面型计算机、膝上型计算机、手持计算机、笔记本电脑、超级移动个人计算机(Ultra-mobile Personal Computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(Personal Digital Assistant,PDA)、增强现实(Augmented Reality,AR)设备、虚拟现实(Virtual Reality,VR)设备、人工智能(Artificial Intelligence,AI)设备、可穿戴式设备、车载设备、智能家居设备和/或智慧城市设备,本申请实施例对该电子设备100的具体类型不作特殊限制。

电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(Universal Serial Bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(Subscriber Identification Module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。

可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(Application Processor,AP),调制解调处理器,图形处理器(Graphics ProcessingUnit,GPU),图像信号处理器(Image Signal Processor,ISP),控制器,视频编解码器,数字信号处理器(Digital Signal Processor,DSP),基带处理器,和/或神经网络处理器(Neural-network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。

控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。

处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。

在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(Inter-integrated Circuit,I2C)接口,集成电路内置音频(Inter-integrated CircuitSound,I2S)接口,脉冲编码调制(Pulse Code Modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(Mobile Industry Processor Interface,MIPI),通用输入输出(General-PurposeInput/Output,GPIO)接口,用户标识模块(Subscriber Identity Module,SIM)接口,和/或通用串行总线(Universal Serial Bus,USB)接口等。

I2C接口是一种双向同步串行总线,包括一根串行数据线(Serial Data Line,SDA)和一根串行时钟线(Derail Clock Line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。

I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。

PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。

UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。

MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(Camera Serial Interface,CSI),显示屏串行接口(DisplaySerial Interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。

GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。

USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备100,例如AR设备等。

可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。

充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备100供电。

电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。

电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。

移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(Low Noise Amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。

调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。

无线通信模块160可以提供应用在电子设备100上的包括无线局域网(WirelessLocal Area Networks,WLAN)(如无线保真(Wireless Fidelity,Wi-Fi)网络),蓝牙(Bluetooth,BT),全球导航卫星系统(Global Navigation Satellite System,GNSS),调频(Frequency Modulation,FM),近距离无线通信技术(Near Field Communication,NFC),红外技术(Infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。

在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(Global System For Mobile Communications,GSM),通用分组无线服务(General Packet Radio Service,GPRS),码分多址接入(CodeDivision Multiple Access,CDMA),宽带码分多址(Wideband Code Division MultipleAccess,WCDMA),时分码分多址(Time-Division Code Division Multiple Access,TD-SCDMA),长期演进(Long Term Evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(Global Positioning System,GPS),全球导航卫星系统(Global Navigation Satellite System,GLONASS),北斗卫星导航系统(BeidouNavigation Satellite System,BDS),准天顶卫星系统(Quasi-Zenith SatelliteSystem,QZSS)和/或星基增强系统(Satellite Based Augmentation Systems,SBAS)。

电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(Liquid Crystal Display,LCD),有机发光二极管(Organic Light-EmittingDiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(Active-MatrixOrganic Light Emitting Diode的,AMOLED),柔性发光二极管(Flex Light-EmittingDiode,FLED),Miniled,Microled,Micro-OLED,量子点发光二极管(Quantum Dot LightEmitting Diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。

电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。

摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(Charge Coupled Device,CCD)或互补金属氧化物半导体(Complementary Metal-Oxide-Semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。

数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(Moving Picture Experts Group,MPEG)1,MPEG2,MPEG3,MPEG4等。

NPU为神经网络(Neural-Network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。

内部存储器121可以包括一个或多个随机存取存储器(Random Access Memory,RAM)和一个或多个非易失性存储器(Non-Volatile Memory,NVM)。

随机存取存储器可以包括静态随机存储器(Static Random-Access Memory,SRAM)、动态随机存储器(Dynamic Random Access Memory,DRAM)、同步动态随机存储器(Synchronous Dynamic Random Access Memory,SDRAM)、双倍资料率同步动态随机存取存储器(Double Data Rate Synchronous Dynamic Random Access Memory,DDR SDRAM,例如第五代DDR SDRAM一般称为DDR5 SDRAM)等;

非易失性存储器可以包括磁盘存储器件、快闪存储器(flash memory)。

快闪存储器按照运作原理划分可以包括NOR FLASH、NAND FLASH、3DNAND FLASH等,按照存储单元电位阶数划分可以包括单阶存储单元(Single-Level Cell,SLC)、多阶存储单元(Multi-Level Cell,MLC)、三阶储存单元(Triple-Level Cell,TLC)、四阶储存单元(Quad-Level Cell,QLC)等,按照存储规范划分可以包括通用闪存存储(Universal FlashStorage,UFS)、嵌入式多媒体存储卡(embedded Multi Media Card,eMMC)等。

随机存取存储器可以由处理器110直接进行读写,可以用于存储操作系统或其他正在运行中的程序的可执行程序(例如机器指令),还可以用于存储用户及应用程序的数据等。

非易失性存储器也可以存储可执行程序和存储用户及应用程序的数据等,可以提前加载到随机存取存储器中,用于处理器110直接进行读写。

外部存储器接口120可以用于连接外部的非易失性存储器,实现扩展电子设备100的存储能力。外部的非易失性存储器通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部的非易失性存储器中。

内部存储器121或外部存储器接口120用于存储一个或多个计算机程序。一个或多个计算机程序被配置为被该处理器110执行。该一个或多个计算机程序包括多个指令,多个指令被处理器110执行时,可实现上述实施例中在电子设备100上执行的屏幕显示检测方法,以实现电子设备100的屏幕显示检测功能。

电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。

扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。

受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。

麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。

耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备100平台(Open Mobile Terminal Platform,OMTP)标准接口,美国蜂窝电信工业协会(Cellular Telecommunications Industry Association of theUSA,CTIA)标准接口。

按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。

马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。

指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。

SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。本申请实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在电子设备100上运行时,使得电子设备100执行上述相关方法步骤实现上述实施例中的图像处理方法。

本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的图像处理方法。

另外,本申请的实施例还提供一种装置,这个装置具体可以是芯片,组件或模块,该装置可包括相连的处理器和存储器;其中,存储器用于存储计算机执行指令,当装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述各方法实施例中的图像处理方法。

其中,本实施例提供的电子设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

该作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。

相关技术
  • 一种图像处理方法、装置以及相关设备
  • 图像处理方法、图像处理装置和电子设备
  • 一种图像处理方法、图像处理装置及终端设备
  • 一种图像处理方法、图像处理装置及终端设备
  • 图像处理方法、装置、图像识别设备及储存介质
  • 图像处理方法及相关设备、迁移网络训练方法及相关设备
  • 一种图像处理模型的训练方法、图像处理方法及相关设备
技术分类

06120116485344