掌桥专利:专业的专利平台
掌桥专利
首页

海量图像的去重方法和系统、设备及存储介质

文献发布时间:2024-04-18 19:58:21


海量图像的去重方法和系统、设备及存储介质

技术领域

本发明涉及图像处理领域,特别是涉及一种海量图像的去重方法和系统、设备及存储介质。

背景技术

随着自媒体的发展,图像的传播量也在大大增加,图像在传播过程中会出现分辨率、格式、添加水印等变化,同时网络中存在大量内容完全相同或高度相似图像。大量的重复图像增加了数据存储的负担,降低了处理图像的效率,并且增加了图像查找与分析的难度,因此图像去重技术在图像处理中尤为重要。

然而面对海量的图像数据,相关技术在图像去重方面存在抗干扰差、效率低、精度低等问题,不能有效发现并过滤重复图像。

因此,提出一种图像去重方法是亟需解决的问题。

发明内容

有鉴于此,本发明的目的在于提出一种海量图像的去重方法和系统、设备及存储介质,本发明能够针对性的解决在图像去重方面效率低的问题。

基于上述目的,第一方面,本发明提出了一种海量图像的去重方法,所述方法包括:根据去重数据库中保存的图像数据,初始化图像信息网络,所述图像信息网络具有根节点,每一根节点对应有根节点图像;其中,所述图像信息网络是基于所述图像信息空间以多级树集合为基础构造的森林结构,所述多级树包括根节点,任意两个所述根节点对应的图像之间的差异率大于预设阈值,,所述图像信息空间是指图像特征向量所在的多维向量空间,所述图像特征向量为在相同坐标系下对图像提取特征矩阵后计算得到;获取目标图像,所述目标图像为接收到的实时图像数据,对所述目标图像进行预处理并计算其特征数据,所述特征数据包括目标图像的特征数量和特征向量;根据所述目标图像的特征数量和特征向量,遍历所述图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,若是,则计算所述目标图像与所述备选根节点对应的备选根节点图像的图像特征差异率;根据所述图像特征差异率判断所述目标图像与所述备选根节点图像是否相似,若是,则确定目标图像为所述备选根节点图像的重复图像,停止遍历;若否,则遍历下一个根节点;在遍历完所述图像信息网络中的所有根节点之后,若目标图像与任一个根节点对应的根节点图像均不相似,则确定所述目标图像为非重复图像;将目标图像为重复图像或非重复图像作为去重结果输出。

可选地,对所述目标图像进行预处理,包括:对所述目标图像进行幅形比归一化、分辨率归一化和色彩空间转换中的至少一项,归一化后的图像均为YUV色彩空间的图像。

可选地,根据所述目标图像的特征数量和特征向量,遍历所述图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,包括:获取所述目标图像的图像特征矩阵,以及当前遍历到的根节点图像的图像特征矩阵;计算所述目标图像的图像特征矩阵的模,作为所述目标图像的特征数量,计算当前遍历到的根节点图像的图像特征矩阵的模,作为所述当前遍历到的根节点图像的特征数量;根据当前遍历到的根节点图像的特征向量和所述目标图像的特征向量,计算当前遍历到的根节点图像与所述目标图像的特征向量差异率;将所述当前遍历到的根节点图像的特征数量与所述目标图像的特征数量的差值小于等于第一预设阈值作为第一判断条件;将当前遍历到的根节点图像与目标图像的特征向量差异率小于等于第二预设阈值作为第二判断条件;在当前遍历到的根节点同时满足所述第一判断条件和第二判断条件时,确定当前遍历到的所述根节点图像为备选根节点图像。

可选地,所述遍历所述图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,还包括:若所述图像信息网络中的任一根节点均不是备选根节点,则确定所述目标图像为非重复图像,输出所述目标图像为非重复图像的去重结果。

可选地,计算所述目标图像与所述备选根节点对应的备选根节点图像的图像特征差异率,包括:根据所述目标图像的图像特征矩阵和所述备选根节点图像的图像特征矩阵,计算所述目标图像和所述备选根节点图像的特征差异值;根据所述目标图像的图像特征矩阵的模、所述备选根节点图像的图像特征矩阵的模以及所述目标图像和所述备选根节点图像的特征差异值,得到所述图像特征差异率。

可选地,根据所述图像特征差异率判断所述目标图像与所述备选根节点图像是否相似,包括:在所述图像特征差异率与第三预设阈值的关系满足预设条件情况下,确定所述目标图像与所述备选根节点图像相似;在所述图像特征差异率与第三预设阈值的关系不满足预设条件情况下,确定所述目标图像与所述备选根节点图像不相似。

可选地,在所述目标图像为非重复图像的情况下,所述方法还包括:将所述目标图像作为所述图像信息网络的新的根节点,对所述图像信息网络进行更新;将所述目标图像的图像数据保存到所述去重数据库中。

可选地,所述方法还包括:在所述目标图像为重复图像的情况下,生成重复信息,所述重复信息包括所述目标图像的源图像信息。

第二方面,还提供了一种海量图像的去重系统,所述系统包括:初始化模块,用于根据去重数据库中保存的图像数据,初始化图像信息网络,所述图像信息网络具有根节点,每一根节点对应有根节点图像;其中,所述图像信息网络是基于所述图像信息空间以多级树集合为基础构造的森林结构,所述多级树包括根节点,任意两个所述根节点对应的图像之间的差异率大于预设阈值,所述图像信息空间是指图像特征向量所在的多维向量空间,所述图像特征向量为在相同坐标系下根据图像特征矩阵计算得到;图像处理模块,用于获取目标图像,所述目标图像为接收到的实时图像数据,对所述目标图像进行预处理并计算其特征数据,所述特征数据包括目标图像的特征数量和特征向量;计算模块,用于根据所述目标图像的特征数量和特征向量,遍历所述图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,若是,则计算所述目标图像与所述备选根节点对应的备选根节点图像的图像特征差异率;去重分析模块,用于根据所述图像特征差异率判断所述目标图像与所述备选根节点图像是否相似,若是,则确定目标图像为所述备选根节点图像的重复图像,停止遍历;若否,则遍历下一个根节点;在遍历完所述图像信息网络中的所有根节点之后,若目标图像与任一个根节点对应的根节点图像均不相似,则确定所述目标图像为非重复图像;输出模块,用于将目标图像为重复图像或非重复图像作为去重结果输出。

可选地,所述系统还包括:更新模块,用于在所述目标图像为非重复图像的情况下,将所述目标图像作为所述图像信息网络的新的根节点,对所述图像信息网络进行更新,将所述目标图像的图像数据保存到所述去重数据库中;重复信息生成模块,用于在所述目标图像为重复图像的情况下,生成重复信息,所述重复信息包括所述目标图像的源图像信息。

第三方面,还通过一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序以实现第一方面任一项所述的方法。

第四方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行实现第一方面任一项所述的方法。

总的来说,本发明至少存在以下有益效果:

本发明实施例提供的海量图像的去重方法,可以在海量图像集合中对指定的目标图像进行快速比对,判断目标图像是否与图像信息网络中的任一图像重复,且本实施例首先通过图像的特征数量和特征向量遍历视频事件信息网络中的根节点,可快速排除与目标图像不相似的根节点图像,得到可能相似的备选根节点,具有较高的去重效率,在得到备选根节点之后,再计算目标图像与备选根节点图像的图像特征差异率,来判断目标视频事件是否与备选根节点对应的图像相似,具有较高的去重准确率。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1示出本发明一个实施例提供的海量图像的去重方法的应用环境的示意图;

图2示出本发明另一实施例提供的海量图像的去重方法的应用环境的示意图;

图3示出本发明实施例提供的一种图像信息空间的结构示意图;

图4示出本发明实施例提供的一种树形结构的创建过程;

图5示出本发明实施例提供的海量图像的去重方法的步骤流程图;

图6示出本发明实施例提供的海量图像的去重系统的结构示意图;

图7示出本发明实施例提供的海量图像的去重系统的另一结构示意图;

图8示出在一个例子中本发明实施例的电子设备的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

本发明实施例的一个方面,提供了一种海量图像的去重方法,作为一种可选地实施方式,上述海量图像的去重方法可以但不限于应用于如图1所示的应用环境中。该应用环境中包括:与用户进行人机交互的终端设备102、网络104、服务器106。用户108与终端设备102之间可以进行人机交互,终端设备102中运行有海量图像的去重应用程序。上述终端设备102中包括人机交互屏幕1022,第一处理器1024及第一存储器1026。人机交互屏幕1022用于显示图像数据;第一处理器1024用于获取目标图像,以及执行海量图像的去重方法。第一存储器1026用于存储图像数据。

此外,服务器106中包括数据库1062及处理引擎1064,数据库1062中用于存储图像。处理引擎1064用于执行海量图像的去重方法。

在一个或多个实施例中,本发明上述海量图像的去重方法可以应用于图2所示的应用环境中。如图2所示,用户108与用户设备204之间可以进行人机交互。用户设备204中包含有第二存储器206和第二处理器208。本实施例中用户设备204可以但不限于参考执行上述终端设备102所执行的操作,执行海量图像的去重方法。

可选地,上述终端设备102和用户设备204包括但不限于为手机、平板电脑、笔记本电脑、PC机,车载电子设备,可穿戴设备等终端,上述网络104可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器106可以包括但不限于任何可以进行计算的硬件设备。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。

面对海量的图像数据,图像在传播过程中会出现分辨率、格式、添加水印等变化,同时网络中存在大量内容完全相同或高度相似图像。大量的重复图像增加了数据存储的负担,降低了处理图像的效率,并且增加了图像查找与分析的难度,因此图像去重技术在图像处理中尤为重要。然而面对海量的图像数据,相关技术在图像去重方面存在抗干扰差、效率低、精度低等问题,不能有效发现并过滤重复图像。

为了解决上述技术问题,作为一种可选地实施方式,本发明实施例提供了一种海量图像的去重方法、系统、电子设备和介质。

本实施例中,图像信息网络具有根节点,每一根节点对应有根节点图像;其中,图像信息网络是基于图像信息空间以多级树集合为基础构造的森林结构,多级树包括根节点,任意两个根节点对应的图像之间的差异率大于预设阈值,也就是说,任意两个根节点对应的图像不相似。

下面对本实施例的图像信息空间和图像信息网络进行说明:

本实施例中,图像信息空间是指图像特征向量所在的多维向量空间,图像特征向量为在相同坐标系下对图像提取特征矩阵后计算得到。为了确保所有的图像在相同维度的信息空间中,即坐标系相同,本实施例将图像特征向量所在的多维向量空间作为图像信息空间。

在图像信息空间中,每幅图像都有它的坐标,通过坐标可以计算图像间的距离,相同的图像具有相同的坐标,相似图像距离小,不同的图像距离大。通过计算图像的距离我们可以将图像信息空间分为多个区域,每个区域中心位置的图像内容代表整个区域的主要内容,图像信息空间中每一圆形区域的关系包括相离、相切和相交三种关系,相离即区域之间没有共同区域,相切即区域之间有且仅有一个公共点,该点为切点,相交即区域之间有公共区域。

这样可以得到如图3所示的图像信息空间,如图3所示,图3中A、B、C、D四个点为各自圆形区域的中心位置,圆的半径代表图像信息空间中到圆心的最大距离,A、B、C、D的图像内容代表各圆形区域的主要内容。c1、c2为与图像C内容相似的图像,b1、b2为与图像B内容相似的图像,d1、d2、d3为与图像D内容相似的图像,且c1、c2、b1、b2、d1、d2、d3与各自所在区域圆心的距离不大于半径。

基于图3所示的图像信息空间,可以通过选择中心点和指定半径来划分区域,从而将整个图像信息空间区域化,进而可以根据这种区域化特性建立一种树结构来记录区域间的关系,即上述的多级树集合。

图4示出一种树形结构的创建过程,可根据图像信息空间中各区域之间的关系将树结构分为两级,第一级为根节点对应各空间区域的圆心,第二级为子节点对应各空间区域中的非圆心点。若对空间区域再划分多层子区域,树结构也会产生相应的多级子节点。如图4所示,可根据图像信息空间得到多个多级树结构,多级树包括根节点和子节点,以多个多级树结构组成的多级树集合为基础构造的森林结构为图像信息网络。

需要说明的是,树结构的级数与信息空间的空间区域层数相对应,树结构的级数可以是多级,可以是2级,也可以是1级,图像信息网络中的每个子节点至少属于1个根节点,根节点下可以没有子节点。本实施例采用无子节点只有根节点的图像信息网络,即本实施例的图像信息网络是根据1级树结构构建的。

基于上述图像信息空间以及图像信息网络可知,本实施例的图像信息网络是基于图像的相似性而构建的,由图像信息网络的树结构之间的关联关系可知,信息网络中根节点是互不相似的,因此图像信息网络中的图像具有基于图像相似性的关联关系,如此,可基于该图像信息网络执行海量图像的去重方法。

由于图像信息网络中根节点是互不相似的,因此,本实施例可将目标图像依次与图像信息网络中的根节点对应的图像进行比较,在对海量的图像进行分析之前,可先得到目标图像是否为重复图像的检测结果,若目标图像为重复视频事件,则可以不对重复视频事件进行分析,只分析非重复的视频事件即可,提高图像处理的效率。

图5示出根据本发明实施例的海量图像的去重方法的步骤流程图。如图5所示,该海量图像的去重方法包括如下步骤S501~S505:

S501、根据去重数据库中保存的图像数据,初始化图像信息网络。

上文中已对图像信息网络和图像信息空间进行描述,在此不再赘述。

本实施例的去重数据库中存储的任意两个图像互不相似,图像数据包括但不限于互不相似的图像的图像特征向量、图像特征矩阵以及图像特征矩阵的模,以便于在进行图像去重之前,根据图像数据以及上述图像信息网络的创建方法,初始化图像信息网络。

本实施例中,图像信息网络具有根节点,每一根节点对应一个根节点图像,因此在进行图像去重时,可以通过遍历每一根节点以判断目标图像是否与任一根节点对应的根节点图像相似,若相似则确定目标图像是重复图像。

S502、获取目标图像,目标图像为接收到的实时图像数据,对目标图像进行预处理并计算其特征数据。

本实施例中,服务器可以接收到来自多个平台或图像资源库的图像数据,图像资源库可以是一个也可以是多个,图像资源库中存储有海量的图像,即源图像,目标图像为接收到的实时图像,可以实现图像的实时在线去重。

可以理解的是,不同资源库的不同的图像的大小格式等不一定相同,因此,本实施例在获取到目标图像之后,对目标图像进行预处理。

对目标图像进行预处理包括:对目标图像进行幅形比归一化、分辨率归一化和色彩空间转换中的至少一项,归一化后的图像均为YUV色彩空间的图像。使得每一个目标图像都具有相同的图像维度,进而便于在同一坐标系下对海量图像的内容进行分析,也便于根据图像的像素进行不同图像内容之间的相似性分析,加快图像内容的分析速率。

本实施例中,特征数据包括目标图像的特征数量和特征向量,目标图像的特征数量可以用图像特征矩阵的模来表示,图像特征矩阵的模越大表征图像的特征越多,内容越丰富。

目标图像的图像特征向量在图像信息网络坐在的坐标系下对图像提取特征矩阵后计算得到。

S503、根据目标图像的特征数量和特征向量,遍历图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,若是,则计算目标图像与备选根节点对应的备选根节点图像的图像特征差异率。

本实施例中,根据目标图像的特征数量和特征向量,遍历图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,包括:获取目标图像的图像特征矩阵,以及当前遍历到的根节点图像的图像特征矩阵;计算目标图像的图像特征矩阵的模,作为目标图像的特征数量,计算当前遍历到的根节点图像的图像特征矩阵的模,作为当前遍历到的根节点图像的特征数量;根据当前遍历到的根节点图像的特征向量和目标图像的特征向量,计算当前遍历到的根节点图像与目标图像的特征向量差异率;将当前遍历到的根节点图像的特征数量与目标图像的特征数量的差值小于等于第一预设阈值作为第一判断条件;将当前遍历到的根节点图像与目标图像的特征向量差异率小于等于第二预设阈值作为第二判断条件;在当前遍历到的根节点同时满足所述第一判断条件和第二判断条件时,确定当前遍历到的所述根节点图像为备选根节点图像。

本实施例中,图像特征矩阵可以通过图像的低八位特征数据和高八位特征数据,得到十六位特征数据,根据十六位特征数据得到LBP

其中,c为中心像素,i为邻域内的特征点,pixel为像素值。根据中心像素的像素值与邻域内的特征点的像素值之间的大小关系,可以得到邻域内的特征点的LBP

图像特征矩阵的模是通过对图像特征矩阵进行模值计算得到,具体的,图像特征矩阵的模值计算公式为:

modULBPM

其中,i为YUV分量,w

则根据上述公式1和公式2可以分别计算出目标图像的图像特征矩阵的模,以及当前遍历到的根节点图像的图像特征矩阵的模,将目标图像的图像特征矩阵的模作为目标图像的特征数量,将当前遍历到的根节点图像的图像特征矩阵的模作为当前遍历到的根节点图像的特征数量。

本实施例中,图像的特征向量FV表示为:

FV=(v

其中,FV的维度为3481,v

其中,w和h为分量下图像的宽和高,ULBPM(m,n)为图像的特征矩阵ULBPM在(m,n)点处的特征值,VLBP

本实施例中,根据当前遍历到的根节点图像的特征向量和目标图像的特征向量,计算当前遍历到的根节点图像与目标图像的特征向量差异率,其中,当前遍历到的根节点图像与目标图像的图像特征向量的向量差异率计算公式为:

其中,DisFV(p,q)为根节点图像与目标图像的特征向量的向量差异率,min(modFV(p),modFV(q))为目标图像的特征向量的模modFV(p)与根节点图像的特征向量的模modFV(q)的最小值,modFV(p)、modFV(q)作为分母不能为0,若modFV(p),modFV(q)同时为0,则DisFV(p,q)=0。

其中,DiffFV(p,q)为目标图像和备选根节点图像的特征向量的差异值,目标图像与备选根节点图像的特征向量差异值的公式为:

v

因此,基于上述公式6和公式7即可得到目标图像和备选根节点图像的特征向量的向量差异值DiffFV(p,q)。

进一步地,在当前遍历到的根节点图像的特征数量与目标图像的特征数量的差值小于等于第一预设阈值,且当前遍历到的根节点图像与目标图像的特征向量差异率小于等于第二预设阈值,即当前遍历到的根节点图像同时满足所述第一判断条件和第二判断条件时,确定当前遍历到的根节点图像为备选根节点图像。

在根据上述方法确定当前遍历到的根节点是为备选根节点时,为了精确计算备选根节点图像与目标图像是否相似,则计算目标图像与备选根节点对应的备选根节点图像的图像特征差异率,本实施例中图像特征差异率即图像特征矩阵的差异率,以便于根据图像特征差异率判断目标图像与备选根节点图像是否相似。

本实施例中,计算目标图像与备选根节点对应的备选根节点图像的图像特征差异率,包括:根据目标图像的图像特征矩阵和备选根节点图像的图像特征矩阵,计算目标图像和备选根节点图像的特征差异值,根据目标图像的图像特征矩阵的模、备选根节点图像的图像特征矩阵的模以及目标图像和备选根节点图像的特征差异值,得到图像特征差异率。

目标图像和备选根节点图像的特征差异值的计算公式为:

其中,diff(p,q)为目标图像和备选根节点图像在YUV分量下对应的特征差异值,p代表目标图像,q代表备选根节点图像,diffLBP

diffLBP

其中,

进而基于目标图像的图像特征矩阵和备选根节点图像的图像特征矩阵的差异值的计算公式,可以得到目标图像与备选根节点图像的图像特征差异率,目标图像与备选根节点图像的图像特征差异率dis(p,q)的计算公式为:

其中,modULBPM(p),modULBPM(q)作为分母不能为0,当modULBPM(p)与modULBPM(q)均为0时dis(p,q)=0。

基于上述公式,则可以得到目标图像与所述备选根节点对应的备选根节点图像的图像特征差异率,进而根据图像特征差异率判断目标图像与备选根节点图像是否相似,即执行步骤S504。

需要说明的是,遍历图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,还包括:若图像信息网络中的任一根节点均不是备选根节点,则确定目标图像为非重复图像,输出目标图像为非重复图像的去重结果。

当图像信息网络中的所有根节点对应的根节点图像都不能同时满足所述第一判断条件和第二判断条件时,则可以确定目标图像为非重复图像,输出目标图像为非重复图像的去重结果,基于图像的特征数量进行根节点的遍历,无需进一步精确计算,数据计算量小,可以提高图像去重的速率。

S504、根据图像特征差异率判断目标图像与备选根节点图像是否相似,若是,则确定目标图像为所述备选根节点图像的重复图像,停止遍历;若否,则遍历下一个根节点;在遍历完图像信息网络中的所有根节点之后,若目标图像与任一个根节点对应的根节点图像均不相似,则确定目标图像为非重复图像。

本实施例中,根据图像特征差异率判断目标图像与备选根节点图像是否相似,包括:在图像特征差异率与第三预设阈值的关系满足预设条件情况下,确定目标图像与备选根节点图像相似;在图像特征差异率与第三预设阈值的关系不满足预设条件情况下,确定目标图像与备选根节点图像不相似。

在一个例子中,第三预设阈值为dis

dis(p,q)为目标图像与备选根节点图像的图像特征差异率,θ为固有误差,

当dis(p,q)满足预设条件时,表明在误差允许的范围内目标图像与备选根节点图像的图像特征差异率较小,可以确定目标图像与备选根节点图像相似,当dis(p,q)不满足预设条件时,表明目标图像与备选根节点图像的图像特征差异率较大,可以确定目标图像与备选根节点图像不相似。

需要说明的是,本实施例的本质是在检测目标图像是否为图像信息网络中的任一图像的重复图像,则当确定当前遍历到的根节点为备选根节点,且备选根节点对应的备选根节点图像与目标图像相似时,则足以说明目标图像为重复图像,则无需对后续未遍历到的根节点进行遍历,即停止遍历,此时得到的去重结果为目标图像为重复图像。

而当目标图像与备选根节点对应的备选根节点图像不相似时,继续遍历下一个根节点,例如,第一时刻为第二时刻的前一时刻,第二时刻为第三时刻的前一时刻,当目标图像与在第一时刻遍历到的备选根节点图像不相似时,判断第二时刻遍历到的根节点是否为备选根节点,在第二时刻遍历到的根节点为备选根节点时,则计算目标图像与备选根节点图像的图像特征差异率,再根据图像特征差异率判断目标图像是否与备选根节点图像相似,若不相似,则判断第三时刻遍历到的根节点是否为备选根节点,以此类推,直至遍历完图像信息网络中的所有的根节点。

在遍历完图像信息网络中的所有根节点之后,若目标图像与任一个根节点对应的图像均不相似,则说明目标图像与图像信息网络中的任一根节点对应的根节点图像不重复,确定目标图像为非重复图像,输出目标图像为非重复图像的去重结果。

S505、将目标图像为重复图像或非重复图像作为去重结果输出。

在通过步骤S503或S504得到目标图像为重复图像或非重复图像之后,将目标图像为重复图像或非重复图像作为去重结果输出。

通过上述步骤S501-S505可以判断任一目标图像是否为图像信息网络中的重复图像,在一个应用场景中,若图像处理人员需要对目标图像进行审核,则可仅对非重复图像进行处理,可避免对重复的图像进行二次处理,提高图像处理的效率。

可以理解的是,在目标图像为非重复图像时,表示该目标图像是不同于图像信息网络中的任一图像的,则可以通过该非重复图像对图像信息网络进行更新。因此,本实施例的方法还包括在目标图像为非重复图像的情况下,将目标图像作为图像信息网络的新的根节点,对图像信息网络进行更新,具体的更新可根据上述图4所示的方法,将目标图像作为图像信息网络的新的根节点加入树形结构。

本实施例还将目标图像的图像数据保存到去重数据库中,以便于视频事件数据的保存,以便于根据保存后的去重数据库初始化视频事件信息网络。目标图像的图像数据包括目标图像的特征向量、特征向量的模、图像特征矩阵以及图像特征矩阵的模等图像数据。

在一个例子中,为了便于对重复图像的溯源,增加本实施例的应用场景,本实施例的方法还包括:在目标图像为重复图像的情况下,生成重复信息,重复信息包括目标图像的源图像信息。例如,重复信息包括目标图像的源图像ID,以便于获取重复的目标图像在图像资源库中的位置。

以上为本实施例提供的一种海量图像的去重方法,通过去重数据库中保存的图像数据,初始化图像信息网络,根据获取到的实时图像数据作为目标图像,对目标图像进行预处理,根据目标图像的特征数量和特征向量,遍历图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,若是,则计算目标图像与备选根节点对应的备选根节点图像的图像特征差异率,根据图像特征差异率判断目标图像与备选根节点图像是否相似,若是,则确定目标图像为所述备选根节点图像的重复图像,停止遍历;若否,则遍历下一个根节点;在遍历完图像信息网络中的所有根节点之后,若目标图像与任一个根节点对应的根节点图像均不相似,则确定所述目标图像为非重复图像;将目标图像为重复图像或非重复图像作为去重结果输出。本实施例可以在海量图像集合中对指定的目标图像进行快速比对,判断目标图像是否与图像信息网络中的任一图像重复,且本实施例首先通过图像的特征数量和特征向量遍历视频事件信息网络中的根节点,可快速排除与目标图像不相似的根节点图像,得到可能相似的备选根节点,具有较高的去重效率,在得到备选根节点之后,再计算目标图像与备选根节点图像的图像特征差异率,来判断目标视频事件是否与备选根节点对应的图像相似,具有较高的去重准确率。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

下述为本发明一种海量图像的去重系统,可以用于执行本发明方法实施例。对于本发明海量图像的去重系统实施例中未披露的细节,请参照本发明方法实施例。

图6示出了本发明一个示例性实施例提供的海量图像的去重系统的结构示意图。该海量图像的去重系统可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该海量图像的去重系统600包括:

初始化模块601,用于根据去重数据库中保存的图像数据,初始化图像信息网络,所述图像信息网络具有根节点,每一根节点对应有根节点图像;其中,所述图像信息网络是基于所述图像信息空间以多级树集合为基础构造的森林结构,所述多级树包括根节点,任意两个所述根节点对应的图像之间的差异率大于预设阈值,图像信息空间是指图像特征向量所在的多维向量空间,所述图像特征向量为在相同坐标系下对图像提取特征矩阵后计算得到。

图像处理模块602,用于获取目标图像,所述目标图像为接收到的实时图像数据,对所述目标图像进行预处理并计算其特征数据,所述特征数据包括目标图像的特征数量和特征向量;

计算模块603,用于根据所述目标图像的特征数量和特征向量,遍历所述图像信息网络中的根节点,判断当前遍历到的根节点是否为备选根节点,若是,则计算所述目标图像与所述备选根节点对应的备选根节点图像的图像特征差异率;

去重分析模块604,用于根据所述图像特征差异率判断所述目标图像与所述备选根节点图像是否相似,若是,则确定目标图像为所述备选根节点图像的重复图像,停止遍历;若否,则遍历下一个根节点;在遍历完所述图像信息网络中的所有根节点之后,若目标图像与任一个根节点对应的根节点图像均不相似,则确定所述目标图像为非重复图像;

输出模块605,用于将目标图像为重复图像或非重复图像作为去重结果输出。

图7示出了本发明一个示例性实施例提供的海量图像的去重系统的另一结构示意图。本实施例的上述系统还包括:

更新模块606,用于在所述目标图像为非重复图像的情况下,将所述目标图像作为所述图像信息网络的新的根节点,对所述图像信息网络进行更新,将所述目标图像的图像数据保存到所述去重数据库中;

重复信息生成模块607,用于在所述目标图像为重复图像的情况下,生成重复信息,所述重复信息包括所述目标图像的源图像信息。

需要说明的是,上述实施例提供的海量图像的去重系统在执行海量图像的去重方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的海量图像的去重系统与海量图像的去重方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。

本发明实施方式还提供一种与前述实施方式所提供的海量图像的去重方法对应的电子设备,以执行上述海量图像的去重方法。

图8示出根据本发明实施例的电子设备的示意图。如图8所示,所述电子设备900包括:存储器901和处理器902,存储器901中存储有可在所述处理器902上运行的计算机程序,处理器902运行所述计算机程序时执行本发明前述任一实施方式所提供的方法。

可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行上述基于图像事件信息网络的图像内容对比方法的步骤。

可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图8其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图8中所示更多或者更少的组件(如网络接口等),或者具有与图8所示不同的配置。

其中,存储器901可用于存储软件程序以及模块,如本发明实施例中的海量图像的去重方法和系统对应的程序指令/模块,处理器902通过运行存储在存储器901内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的海量图像的去重方法。存储器901可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器901可进一步包括相对于处理器902远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器901具体可以但不限于用于存储图像事件信息网络。作为一种示例,上述存储器901中可以但不限于包括上述基于海量图像的去重系统中的各个模块。此外,还可以包括但不限于上述海量图像的去重系统中的其他模块单元,本示例中不再赘述。

可选地,上述电子设备包括传输装置903,传输装置903用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置903包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置903为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

此外,上述电子设备还包括:显示器904,用于显示上述海量图像的去重的去重结果;和连接总线905,用于连接上述电子设备中的各个模块部件。

本实施例提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述基于图像事件信息网络的图像内容对比方法,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行基于图像事件信息网络的图像内容对比方法各步骤的计算机程序。

可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本发明所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 海量数据存储方法、装置、存储介质及电子设备
  • 手和图像检测方法和系统、手分割方法、存储介质和设备
  • 一种行人重识别方法、系统及电子设备和存储介质
  • 一种海量不完整数据的skyline查询方法,设备及存储介质
  • 海量请求的去重方法、装置、设备及存储介质
  • 海量文本去重筛选的方法、设备和存储介质
技术分类

06120116482101