掌桥专利:专业的专利平台
掌桥专利
首页

图像搜索方法、装置、计算机设备及存储介质

文献发布时间:2024-04-18 19:52:40


图像搜索方法、装置、计算机设备及存储介质

技术领域

本发明涉及图像搜索领域,尤其涉及一种图像搜索方法、装置、计算机设备及存储介质。

背景技术

现有技术中,对待搜索图片进行搜索时,一般提取待搜索图片中目标对象的目标特征,然后使用该目标特征在数据库中进行比对,获得搜索结果。在此处,目标对象可以是人或其他检测对象。

然而,从待搜索图片提取的目标特征,难以代表目标对象的特征,导致搜索结果的召回率较低。

发明内容

基于此,有必要针对上述技术问题,提供一种图像搜索方法、装置、计算机设备及存储介质,以提高搜索结果的召回率。

一种图片搜索方法,包括:

获取待搜索图片,并从所述待搜索图片提取目标对象的目标特征;

从图片数据库查找与所述目标特征匹配的第一搜索结果;所述第一搜索结果包括若干第一图片;所述第一图片与所述待搜索图片的目标相似度大于预设阈值;

提取各个第一图片的多维特征,根据所述目标特征和所有所述多维特征组成第一特征集合;

对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征;

根据所述拟合特征获取所述待搜索图片的第二搜索结果。

一种图片搜索装置,包括:

第一特征提取模块,用于获取待搜索图片,并从所述待搜索图片提取目标对象的目标特征;

第一搜索模块,用于从图片数据库查找与所述目标特征匹配的第一搜索结果;所述第一搜索结果包括若干第一图片;所述第一图片与所述待搜索图片的目标相似度大于预设阈值;

第二特征提取模块,用于提取各个第一图片的多维特征,根据所述目标特征和所有所述多维特征组成第一特征集合;

特征拟合模块,用于对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征;

第二搜索模块,用于根据所述拟合特征获取所述待搜索图片的第二搜索结果。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述图片搜索方法。

一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述图片搜索方法。

上述图片搜索方法、装置、计算机设备及存储介质,通过对第一搜索结果的置信部分(第一图片)进行特征拟合,把对单一特征值的搜索转化为对可信度更高的拟合特征值的二次搜索,提升了第二搜索结果的召回率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中图片搜索方法的一应用环境示意图;

图2是本发明一实施例中图片搜索方法的一流程示意图;

图3是本发明一实施例中图片搜索装置的一结构示意图;

图4是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本实施例提供的图片搜索方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中,如图2所示,提供一种图片搜索方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤S10-S50。

S10、获取待搜索图片,并从所述待搜索图片提取目标对象的目标特征。

可理解地,待搜索图片指的是包含目标对象的图片。目标对象可以是某个人或某个物体。若目标对象为某个人,则目标特征可以是人脸特征。

S20、从图片数据库查找与所述目标特征匹配的第一搜索结果;所述第一搜索结果包括若干第一图片;所述第一图片与所述待搜索图片的目标相似度大于预设阈值。

可理解地,在获得目标特征之后,可以计算目标特征与图片数据库中各个图像之间的目标相似度(如余弦相似度)。在此处,目标相似度指的是待搜索图片中的目标对象与图片数据库图像的比对对象之间的相似度。若标相似度大于预设阈值,则该图像为第一图片。预设阈值可以根据实际需要进行设置。预设阈值可以确保第一图片的对象与目标对象为同一对象。

S30、提取各个第一图片的多维特征,根据所述目标特征和所有所述多维特征组成第一特征集合。

可理解地,可以提取各个第一图片中对象的多维特征,与待搜索图片中目标对象的目标特征组成第一特征集合。目标特征与多维特征的维数相同,可以为n。以人脸为例,第一特征集合可表示为F={f

f

f

f

其中,d

d

d

S40、对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征。

可理解地,可以对第一特征集合中每一维度的特征进行拟合,获得目标对象的拟合特征。在一示例中,拟合特征f

S50、根据所述拟合特征获取所述待搜索图片的第二搜索结果。

可理解地,在获得拟合特征之后,可以使用拟合特征在图片数据库进行二次搜索,获得第二搜索结果。

本实施例通过对第一搜索结果的置信部分(第一图片)进行特征拟合,把对单一特征值的搜索转化为对可信度更高的拟合特征值的二次搜索,提升了第二搜索结果的召回率。

可选地,步骤S40,即所述对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征,包括:

S401、从所述第一特征集合获取指定维度的维度特征集合。

可理解地,指定维度可以是第一特征集合中的任意一个维度,可以是1~n维中的一个维度。指定维度的维度特征集合D可表示为D={d

在确定D中每个元素的权重时,对于任意一个维度元素,在离群值数量较少且离群值相互距离较远的情况下,对拟合值影响足够小。但如果是有一定数量的离群值相互距离较近,说明不能忽视该部分数据,需要对拟合值有一定的影响,比如,维度特征集合1:0.3,0.31,0.32,……,0.39,0.6,0.8。维度特征集合1需要尽可能排除掉0.6和0.8对拟合结果的影响。又如,维度特征集合2:0.3,0.31,0.32,……,0.39,0.8,0.81,0.82。对于维度特征集合2,0.8,0.81,0.82已经形成了足够多的相互距离较近的离群值,需要对拟合值产生足够的影响。

基于上述需要,可以设置如下权重配置规则:

规则1、每个元素的权重都会受到其他所有元素影响;

规则2、其他元素距离目标元素越近,对目标元素的权重影响越大

规则3、其他元素的权重越高,对目标元素的权重影响越大

规则4、一个元素的权重越高,对其他元素的权重影响之和就越高。

基于规则1,

基于规则2和3,

基于规则4,d

需要考虑到,如果维度特征集合中有两个相同元素,如d

W(d

S402、根据所述维度特征集合确定中间矩阵。

可理解地,为了简化步骤S401涉及的公式,可以根据维度特征集合构造中间矩阵R

中间矩阵转换公式包括:

其中,r

d

d

d

D为所述维度特征集合。

S403、获取平滑因子,根据所述中间矩阵和所述平滑因子确定所述指定维度的元素权重矩阵。

可理解地,在获得中间矩阵之后,元素权重矩阵W可表示为:

其中,α为平滑因子;

R为中间矩阵;

p为D的元素个数;

E为p×p维的矩阵,且所有元素的值均为1。

由于权重之和为1,即:∑

因而,可以通过权重矩阵转换公式处理中间矩阵和平滑因子,获得元素权重矩阵。

权重矩阵转换公式包括:

其中,W为所述元素权重矩阵;

J为p×p单位矩阵;

α为所述平滑因子;

R为所述中间矩阵,该矩阵为p×p矩阵;

p为所述维度特征集合的元素个数;

I为所有元素都是1的列向量。

S404、根据所述维度特征集合和所述元素权重矩阵确定所述指定维度的维度拟合特征。

可理解地,在获得元素权重矩阵之后,可以根据维度特征集合和元素权重矩阵计算出指定维度的维度拟合特征。指定维度的维度拟合特征可表示为:

其中,d为维度拟合特征;

d

p为维度特征集合的元素个数;

W(d

在获得各个维度拟合特征之后,可以将它们组合在一起,形成拟合特征。

本实施例中,基于权重配置规则(规则1~4)计算出维度拟合特征,可以降低离群值对维度拟合特征的影响。

可选地,步骤S50,即所述根据所述拟合特征获取所述待搜索图片的第二搜索结果,包括:

S501、对所述拟合特征进行归一化,生成归一化拟合特征;

S502、从所述图片数据库查找与所述归一化拟合特征匹配的所述第二搜索结果。

可理解地,获得拟合特征之后,可以对拟合特征进行归一化,生成归一化拟合特征,可表示为:

其中,

d

d

m的取值为1~n;

n为拟合特征f的元素个数。

然后再从图片数据库查找与归一化拟合特征匹配的第二搜索结果。

本实施例使用归一化拟合特征与图片数据库中图像的多维特征进行比对,可以大大提高图像的查找效率。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种图片搜索装置,该图片搜索装置与上述实施例中图片搜索方法一一对应。如图3所示,该图片搜索装置包括第一特征提取模块10、第一搜索模块20、第二特征提取模块30、特征拟合模块40和第二搜索模块50。各功能模块详细说明如下:

第一特征提取模块10,用于获取待搜索图片,并从所述待搜索图片提取目标对象的目标特征;

第一搜索模块20,用于从图片数据库查找与所述目标特征匹配的第一搜索结果;所述第一搜索结果包括若干第一图片;所述第一图片与所述待搜索图片的目标相似度大于预设阈值;

第二特征提取模块30,用于提取各个第一图片的多维特征,根据所述目标特征和所有所述多维特征组成第一特征集合;

特征拟合模块40,用于对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征;

第二搜索模块50,用于根据所述拟合特征获取所述待搜索图片的第二搜索结果。

可选地,特征拟合模块40包括:

获取维度特征集合单元,用于从所述第一特征集合获取指定维度的维度特征集合;

确定中间矩阵单元,用于根据所述维度特征集合确定中间矩阵;

确定权重矩阵单元,用于获取平滑因子,根据所述中间矩阵和所述平滑因子确定所述指定维度的元素权重矩阵;

确定维度拟合特征单元,用于根据所述维度特征集合和所述元素权重矩阵确定所述指定维度的维度拟合特征。

可选地,确定中间矩阵单元,还用于通过中间矩阵转换公式处理所述维度特征集合,获得所述中间矩阵的元素;所述中间矩阵转换公式包括:

其中,r

d

d

d

D为所述维度特征集合。

可选地,确定权重矩阵单元,还用于通过权重矩阵转换公式处理所述中间矩阵和所述平滑因子,获得所述元素权重矩阵;所述权重矩阵转换公式包括:

其中,W为所述元素权重矩阵;

J为p×p单位矩阵;

α为所述平滑因子;

R为所述中间矩阵,该矩阵为p×p矩阵;

p为所述维度特征集合的元素个数;

I为所有元素都是1的列向量。

可选地,第二搜索模块50包括:

归一化单元,用于对所述拟合特征进行归一化,生成归一化拟合特征;

二次搜索单元,用于从所述图片数据库查找与所述归一化拟合特征匹配的所述第二搜索结果。

关于图片搜索装置的具体限定可以参见上文中对于图片搜索方法的限定,在此不再赘述。上述图片搜索装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储图片搜索方法所涉及的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种图片搜索方法。本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读指令时实现以下步骤:

获取待搜索图片,并从所述待搜索图片提取目标对象的目标特征;

从图片数据库查找与所述目标特征匹配的第一搜索结果;所述第一搜索结果包括若干第一图片;所述第一图片与所述待搜索图片的目标相似度大于预设阈值;

提取各个第一图片的多维特征,根据所述目标特征和所有所述多维特征组成第一特征集合;

对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征;

根据所述拟合特征获取所述待搜索图片的第二搜索结果。

在一个实施例中,提供了一个或多个存储有计算机可读指令的计算机可读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。可读存储介质上存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时实现以下步骤:

获取待搜索图片,并从所述待搜索图片提取目标对象的目标特征;

从图片数据库查找与所述目标特征匹配的第一搜索结果;所述第一搜索结果包括若干第一图片;所述第一图片与所述待搜索图片的目标相似度大于预设阈值;

提取各个第一图片的多维特征,根据所述目标特征和所有所述多维特征组成第一特征集合;

对所述第一特征集合中每一维度的特征进行拟合,获得所述目标对象的拟合特征;

根据所述拟合特征获取所述待搜索图片的第二搜索结果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性可读取存储介质或易失性可读存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术分类

06120116330598