掌桥专利:专业的专利平台
掌桥专利
首页

一种重图识别方法和装置

文献发布时间:2023-06-19 11:03:41


一种重图识别方法和装置

技术领域

本发明涉及计算机技术领域,尤其涉及一种重图识别方法和装置。

背景技术

电商平台中同一物品可能在多家店铺售卖,其中可能存在盗图后的简单修改。从图片角度区分两个店铺所售卖是否为同一物品或近似物品,对于电商运营中的物品维权有很大的意义。

基于人工查找相同物品耗费人力、时间成本较高,由此现有主要利用多层卷积方式对图片进行主体识别,以确定要匹配的物品在图片中的位置,然后提取该位置处图片的特征向量,以此计算不同图片的相似度。

但实现本发明的过程中,发明人发现现有技术至少存在如下问题:

采用的多层卷积方式耗费资源量较大,且需在GPU(Graphics Processing Unit,图形处理器)服务器上运行,而GPU服务器价格昂贵,且复用率低;需要进行图片标注和机器学习,对于新类型的图片需要重新标注和训练,影响图片处理速度。

发明内容

有鉴于此,本发明实施例提供一种重图识别方法和装置,至少能够解决现有算法准确率低、耗费资源多、处理新分类速度慢的问题。

为实现上述目的,根据本发明实施例的一个方面,提供了一种重图识别方法,包括:

确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

可选的,在所述确定图片对之前,还包括:

接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;

根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;

判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;

根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;

提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。

可选的,在所述对所述图片集中各个图片进行灰度处理之前,还包括:获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。

可选的,在所述基于与各个图片对应的像素带,确定所述图片对的重合像素带之前,包括:

获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;

根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;

组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。

可选的,所述根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比,包括:

统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到各个像素带在各个图片中的词频;

获取各个像素带的逆向文件频率,结合各个像素带在各个图片中的词频,得到各个像素带在各个图片中的词频逆向文件频率值,进而统计得到所有像素带在同一图片中的词频逆向文件频率总值;

根据所述词频逆向文件频率总值和所述重合像素带在各个图片中的词频逆向文件频率值,计算所述重合像素带在各个图片中的词频逆向文件频率占比。

可选的,所述获取各个像素带的逆向文件频率,包括:

根据同一像素带在各个图片中的出现次数,确定出现次数不为零的图片的数量,结合图片集中图片的总数量,得到所述总数量与所述数量的比值;

对所述比值取对数,得到所述同一像素带在所述图片集中的逆向文件频率。

可选的,所述基于所述词频逆向文件频率占比生成对比指标向量,还包括:

统计与各个图片对应的像素带的种类数量;以及

统计所述图片对中重合像素带的种类数量和不重合像素带的种类数量;并且

计算所述重合像素带的种类数量在所述像素带的种类数量中的数量占比;

基于所述词频逆向文件频率占比、所述像素带的种类数量、所述重合像素带的种类数量、所述不重合像素带的种类数量和所述数量占比,生成所述对比指标向量。

为实现上述目的,根据本发明实施例的另一方面,提供了一种重图识别装置,包括:

像素带重合模块,用于确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

占比计算模块,用于根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

重图识别模块,用于基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

可选的,还包括图片对组合模块,用于:

接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;

根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;

判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;

根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;

提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。

可选的,所述图片对组合模块,还用于:获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。

可选的,还包括像素带组合模块,用于:

获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;

根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;

组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。

可选的,所述占比计算模块,用于:

统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到各个像素带在各个图片中的词频;

获取各个像素带的逆向文件频率,结合各个像素带在各个图片中的词频,得到各个像素带在各个图片中的词频逆向文件频率值,进而统计得到所有像素带在同一图片中的词频逆向文件频率总值;

根据所述词频逆向文件频率总值和所述重合像素带在各个图片中的词频逆向文件频率值,计算所述重合像素带在各个图片中的词频逆向文件频率占比。

可选的,所述占比计算模块,用于:

根据同一像素带在各个图片中的出现次数,确定出现次数不为零的图片的数量,结合图片集中图片的总数量,得到所述总数量与所述数量的比值;

对所述比值取对数,得到所述同一像素带在所述图片集中的逆向文件频率。

可选的,所述重图识别模块,还用于:

统计与各个图片对应的像素带的种类数量;以及

统计所述图片对中重合像素带的种类数量和不重合像素带的种类数量;并且

计算所述重合像素带的种类数量在所述像素带的种类数量中的数量占比;

基于所述词频逆向文件频率占比、所述像素带的种类数量、所述重合像素带的种类数量、所述不重合像素带的种类数量和所述数量占比,生成所述对比指标向量。

为实现上述目的,根据本发明实施例的再一方面,提供了一种重图识别电子设备。

本发明实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一所述的重图识别方法。

为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一所述的重图识别方法。

根据本发明所述提供的方案,上述发明中的一个实施例具有如下优点或有益效果:以像素分带、图片对的方式进行重图匹配,实现简单、准确率高,无需受限于数据量大小和分类随意变动的问题;无需进行图片标注,因此对于新品类/类型图片的识别无需进行标注和训练操作,以此实现了新品图片的快速响应。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是根据本发明实施例的一种重图识别方法的主要流程示意图;

图2是根据本发明实施例的一种可选的重图识别方法的流程示意图;

图3是本发明提供的待处理图片示意图;

图4是经过裁剪、灰度处理和灰度值比较后的图片示意图;

图5是根据本发明实施例的另一种可选的重图识别方法的流程示意图;

图6是本发明实施例提供的一种像素带分布状态示意图;

图7是根据本发明实施例的又一种可选的重图识别方法的流程示意图;

图8是根据本发明实施例的一种重图识别装置的主要模块示意图;

图9是本发明实施例可以应用于其中的示例性系统架构图;

图10是适于用来实现本发明实施例的移动设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

需要说明的是,本发明实施例目前主要适用于电商平台中的物品重图匹配。其中,重图指在同一张图片上只经过了简单修改和处理所生成的一系列图片,例如,在原图片上加了水印、logo,略微经过移动、明暗度调整,对原图进行了较小范围的覆盖(但是不影响图片突出的主体)后形成的图片。

参见图1,示出的是本发明实施例提供的一种重图识别方法的主要流程图,包括如下步骤:

S101:确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

S102:根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

S103:基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

上述实施方式中,对于步骤S101,本发明中的图片对,为可能是重图的两个图片所组成的对形式。

对于同一颜色,像素值略低的变化不会改变人眼对该颜色的判断。如果两个像素处于像素带的边缘,导致该像素失效,由此设定每个像素对应于两个像素带,以通过重叠方式消除像素带边界影响。

因此,对于图片对中每个图片的像素带,为各个图片中各个像素点的像素值所处的两个像素带。另外,每个像素点针对RGB的像素值不同,由此针对不同颜色通道存有不同的像素带;其中,RGB是工业界的一种颜色标准,通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。

根据不同颜色通道的像素带分布状态,对图片对中两个图片的像素带进行重合分析,以得到重合像素带,例如红20~59像素带。

对于步骤S102,TF-IDF是一种用于信息检索与数据挖掘的常用加权技术,其中:

1)TF为词频(Term Frequency),表示一个词语的出现次数处于该文件中的总词语数;

将词频应用与重图识别中,假设一个图片中像素带的总出现次数为100次,像素带20~59的出现次数为3,则得到像素带20~59在该图片中的词频为3/100=0.03。

2)IDF为逆文本频率指数(Inverse Document Frequency)。

IDF值是由图片集共同算出来的,每个像素带针对图片集只有一个IDF值,而非针对每个图片有一个IDF值。该IDF被存储在HADOOP集群中,针对该图片集中每个图片都可以复用,因此当进行其他图片重图识别时无需重新计算IDF值。具体计算方式参见后续图5所示描述,在此不再赘述。

同样以20~59像素带为例,假设其在图片中的词频为0.03,在图片集中的IDF为4,则其TF-IDF值为0.03*4=0.12。将该0.12与该图片中所有像素带的TF-IDF总值做除数,得到TF-IDF占比。具体计算方式参见后续图5所示描述,同样在此不再赘述。

对于步骤S103,对比指标向量主要为了验证两个图片是否是重图所用。

本发明主要使用逻辑回归模型对该对比指标向量做二分类处理,所得结果中取重图分类卡在一个阈值以上得到最终匹配结果,最终分为重图和非重图两类;其中,逻辑回归模型是一种广义的线性回归分析模型,其参数可以是事先训练得到的,本发明对训练过程不做描述。

除了上述词频逆向文件频率占比之外,本发明对于对比指标向量的组成还包括有:

1)两张图片各自包含的像素带的种类数量;例如,总共设有8种像素带,图片一的像素带占其中3种,图片二占其中5种;

2)两张图片重合的像素带的种类数量;例如图片一和图片二重合像素带20~59,总共一种;

3)两张图片不重合的像素带的种类数量;例如40~79、60~99,总共两种;

4)重合像素带占两张图片各自像素带种类数量的比例;例如,图片一中1/3=0.33,图片2中1/5=0.2。

之后,按照各个维度的排列顺序,对以上8个数据进行排序形成一个8维的向量。输入该8维向量至逻辑回归模型中,得到该图片对的重图分类结果。

进一步的,可以对以上8个数据设定阈值,以作为逻辑回归模型处理向量的前置筛选条件。本发明主要设置有像素带数量阈值、TF-IDF占比和像素带重合比例,例如两张图片各自包含的像素带数都不能低于150,若两张图片或其中一个图片的像素带数量低于150,表明该图片的色彩不够鲜艳,无法更好的代表一张图片,不可以使用逻辑回归模型处理。

上述实施例所提供的方法,通过对每一个图片对中两张图片的像素带进行统计对比,形成对比指标向量,对比指标向量经过几个阀值的筛选和提前训练好的回归模型识别产出重图匹配结果,整体操作简单且准确率较高。

参见图2,示出了根据本发明实施例的一种可选的重图识别方法流程示意图,包括如下步骤:

S201:接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;

S202:根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;

S203:判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;

S204:根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;

S205:提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对;

S206:确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

S207:根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

S208:基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

上述实施方式中,对于步骤S206~S208可参见图1所示步骤S101~S103的描述,在此不再赘述。

上述实施方式中,对于步骤S201和S202,以电商平台为例,图片集(通常为亿级)中的图片具有电商图片的根本特点:

1)物品主体通常位于靠近图片中心的位置处;

2)需要匹配的重图往往是商家在同一图片上经过不同处理(例如PS)而生成的不用图片。为了展示物品本身,商家大多不会在物品主体上处理,而只是对边角位置添加上店铺的商标或促销信息。或者将物品本身缩小,然后将多个缩小后的物品拼接在一张图片上形成一张整合的图片。

需要说明的是,本申请主要侧重于匹配重图,并不需要区别主体,因此无需做主体识别操作。且仅仅是将原图片裁剪或放大至预定尺寸,例如将原图片缩放至350*350尺寸,然后截取中间位置200*200尺寸的图片。另外,截取位置可以仅包含部分主体,无需考虑全部主体。

需要说明的是,本实施方式对于图片的灰度处理以及图片指纹(后续描述),需要对图片进行缩放处理。例如将200*200尺寸的图片缩小10倍,得到20*20尺寸的图片。而对于图1、图5和图7中图片像素值的像素带的处理,使用的图片仍是截取/放大至预定尺寸后的图片,例如200*200尺寸,无需缩放处理。

本发明所提供的图片预处理方式,可以去掉商家对原图的修改,且仅仅是对图片缩放两次,耗费时间较之差值等算法较短,以此降低了计算量,加快了图片重图识别效率。

在将图片截取/放大至指定大小后,可以对图片进行灰度处理,例如,计算图片中每个像素点的灰度值,之后再求和取平均得到该图片的平均灰度值,即同一图片中所有像素点的灰度值之和/像素点总数,以此每个图片均有一个平均灰度值;其中,灰度值是每个像素只有一个采样颜色的图像,这类图像通常显示为从最暗黑色到最亮的白色的灰度。

对于步骤S203和S204,基于每个图片所得平均灰度值,对每个图片中每个像素点的灰度值做比较,大于或等于相应平均灰度值的标1(即第一值,此处仅为示例),小于相应平均灰度值的标0(即第二值,此处仅为示例)。

需要说明的是,在程序中,实际处理的是一个像素矩阵。无论图片尺寸如何,都可以通过遍历像素矩阵得到每一个像素点的像素值或灰度值。

依据图片中各个像素点所处位置和标值,进行图片特征向量构建。以缩放后的20*20尺寸图片为例,单个1*1区域构成一个像素点,最终生成一个20*20=400维由1和0组成的特征向量。进一步的,为便于计算,可以将该20*20维向量转换为1*400维向量。

以图3为例,经过图片裁剪和灰度转换后,得到图4,图中的黑色代表0,白色代表1,之后再将图4转换为一维向量,得到图3的特征向量。

对于步骤S205,为缩减图片匹配量,在实际处理图片过程中,会使用图片指纹方式对图片进行初步筛选;其中,图片指纹是图片布局和造型等基于pixel的搜索,即通过图片本身搜索长得一样的和包含一样细节的图片。例如,基于各个图片的400维向量在HADOOP集群中做JOIN操作,以找出向量相同的图片。

需要说明的是,查找图片所依据的特征向量须完全相同,而非是向量相似度大于一定阈值的方式。

特征向量相同的图片可能是多个,为避免与其他图片混淆,可以将这些图片组合为一个图片组。对同一图片组中的图片进行两两组合,以生成多个图片对,假设5张图片的特征向量相同:

1)首先在5张图片中选取一张图片,之后再在剩余图片中选取一张图片,即5*4=20个图片对;

2)对这5张图片做笛卡尔积,再去掉每张图片自身的匹配,形成两两组合的匹配对,即5*5-5=20个图片对。

上述实施例所提供的方法,通过图片预筛选方式,将特征向量一致的图片分为一组,避免了图片集中图片两两对比的情况,以此缩小了重图匹配范围,降低了计算量;在组内图片数量大于两个时,每个图片都会被比较两次,以此保证了重图识别的准确性,避免疏漏。

参见图5,示出了根据本发明实施例的另一种可选的重图识别方法流程示意图,包括如下步骤:

S501:接收图片集,获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;

S502:根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;其中,所述像素带为像素点的像素值所处的像素分带;

S503:组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合;

S504:确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;

S005:根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

S506:基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

上述实施方式中,对于步骤S504~S506可参见图1所示步骤S101~S103的描述,在此不再赘述。

上述实施方式中,对于步骤S501,对于处理过的图片,即使未处理的部分,也会有一些像素值的改变,例如PS。且有些店铺会稍微调整图片的明暗度,为提高重图识别准确率,需要首先处理这些变化。

对于每个像素点的像素由RGB的3个通道决定,且针对不同通道其像素值都不一致,例如红(R)-89、绿(G)-155、蓝(B)-207。

对于步骤S502,每个像素值会被分配到每个颜色通道的2个像素带中。例如,像素X1的R(红)记为XR,且像素值40<=XR1<59,基于R通道的像素带分布状态,会将该像素点的像素值归至20~59和40~79这2个像素带中,具体参见图6所示。

若另一个像素X2的XR2处于20<=XR2<39范围内,其像素值会分配至0~39与20~59这两个像素带中,与X1存有一个像素带相同20~59,以消除像素带的边界影响。

每个颜色通道的像素带分布状态可以设置相同,也可以不同,例如均为图6所示分布状态,以此针对同一像素点,在R、G、B这三个通道会存有不同的像素值,且各自产生两个像素带。

对于步骤S503,针对每个像素点,对不同颜色通道中的像素带进行组合,得到与每个像素点对应的像素带集,该像素带集中包含有单个颜色通道的两个像素带。

对不同颜色通道中的像素带进行取一操作,得到2*2*2=8种像素带组合。由此可知,通过遍历一次图片的每个像素即可完成图片特征提取,以此加快了图片处理速度。

上述实施例所提供的方法,对图片所有像素点进行分带然后对不同颜色通道中像素带进行组合,以针对同一像素点得到多种像素带组合,消除了像素带的边缘效应。

参见图7,示出了根据本发明实施例的又一种可选的重图识别方法流程示意图,包括如下步骤:

S701:确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

S702:统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到各个像素带在各个图片中的词频;

S703:获取各个像素带的逆向文件频率,结合各个像素带在各个图片中的词频,得到各个像素带在各个图片中的词频逆向文件频率值,进而统计得到所有像素带在同一图片中的词频逆向文件频率总值;

S704:根据所述词频逆向文件频率总值和所述重合像素带在各个图片中的词频逆向文件频率值,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

S705:基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

上述实施方式中,对于步骤S701和S705可参见图1所示步骤S101和S103的描述,在此不再赘述。

上述实施方式中,对于步骤S702,确定每个像素点在不同颜色通道中的像素值,以及该像素值在相应颜色通道中的像素带分布,以此确定各个像素带在该图片中的出现次数,形成图片-单个像素带-出现次数的统计数据,进而统计得到图片-所有像素带-出现次数之和。

对于步骤S703,对于IDF值的具体确定方式为:

步骤一:根据同一像素带在各个图片中的出现次数,确定出现次数不为零的图片的数量,结合图片集中图片的总数量,得到总数量与数量的比值;

步骤二:对比值取对数,得到同一像素带在图片集中的IDF值。

同样以像素带20~59为例,若在1000个图片中出现过,而图片集中图片总数为10000000,则其逆向文件频率IDF为log(10000000/1000)=4。结合步骤S702所得IF值,可得像素带20~59的TF-IDF值为0.03*4=0.12。

重复上述过程,确定各个像素带在不同图片中的TF-IDF值,以此统计同一图片中所有像素带的TF-IDF总值。

对于步骤S704,图片对的TF-IDF相似度,即为两张图片中重合像素带的TF-IDF值在各图片TF-IDF总值中的占比。

以下具体举例,说明本发明具体实施过程:

假设一个字母代表一个像素带,两张图片的重合像素带B在图片集中的IDF值为0.3。

图片一:A B B C D

图片二:X B B Y Z E F G H J

由此可知,字母B在图片一中的IF值为2/5=0.4,TF-IDF值为0.4*0.3=0.12;在图片二中的IF值为2/10=0.2,TF-IDF值为0.2*0.3=0.06。

图片一中共有A、B、C、D四种像素带,根据上述方式同样算出各个像素带的TF-IDF值并累加,假设为0.8(实际结果不一定为1),则重合像素带B的TF-IDF值在图片一所有像素带TF-IDF总值中的占比为:0.12/0.8=0.15;

图片二中共有X、B、Y、Z、E、F、G、H、J九种像素带,根据上述方式算出每个像素带的TF-IDF值并累加,假设为0.7,则重合像素带B的TF-IDF值在图片二所有像素带TF-IDF总值中的占比为:0.06/0.7=0.085。

上述实施例所提供的方法,通过像素带、图片、出现次数三者之间的关系,确定各个像素带在各个图片中的IF值以及在所有像素带中的IDF值。通过以像素分带、图片对的方式进行重图匹配,实现简单、准确率高,无需受限于数据量大小和分类随意变动的问题。

本发明实施例方法,相较于现有技术,具有以下有益效果:

1)对所有图片具有相同效果,无需进行图片标注,因此当遇到新品类/类型的图片时无需进行标注和训练操作,以此实现了新品图片的快速响应;对于业务方可以随时增删减待匹配品类,无需通知算法技术人员;

2)无需考虑图片主体,直接进行裁剪,以此降低了计算量,提高了后续图片匹配速度;

3)不同商家的图片不一定完全相同,以像素分带、图片对的方式进行重图匹配,实现简单、准确率高,无需受限于数据量大小和分类随意变动的问题;

4)以上特点可以使得本方案直接在CPU集群上处理,无需任何专业图处理环境和三方JAR包,直接加载在spark任务中在hadoop集群上处理,无需额外的GPU服务器,大大节省了成本;

5)可以用于实际业务的前期调研,减少外包人员人工压力等的排头兵作用;

6)重图与店铺、平台等具有对应关系,且每张重图都可以映射到其所在店铺售卖的物品,可应用于打假、比价、维权等方面。

参见图8,示出了本发明实施例提供的一种重图识别装置800的主要模块示意图,包括:

像素带重合模块801,用于确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

占比计算模块802,用于根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

重图识别模块803,用于基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

本发明实施装置还包括图片对组合模块804(图中未标出),用于:

接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;

根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;

判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;

根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;

提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。

本发明实施装置中,所述图片对组合模块804,还用于:

获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。

本发明实施装置还包括像素带组合模块805(图中未标出),用于:

获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;

根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;

组合所得像素带以生成与各个像素点对应的像素带集,对所述像素带集中不同颜色通道中的像素带进行组合,得到与各个像素点对应的像素带组合。

本发明实施装置中,所述占比计算模块802,用于:

统计各个像素带在各个图片中的出现次数,确定所有像素带在同一图片中的出现次数之和,计算各个出现次数在相应图片的出现次数之和中的占比,以得到各个像素带在各个图片中的词频;

获取各个像素带的逆向文件频率,结合各个像素带在各个图片中的词频,得到各个像素带在各个图片中的词频逆向文件频率值,进而统计得到所有像素带在同一图片中的词频逆向文件频率总值;

根据所述词频逆向文件频率总值和所述重合像素带在各个图片中的词频逆向文件频率值,计算所述重合像素带在各个图片中的词频逆向文件频率占比。

本发明实施装置中,所述占比计算模块802,用于:

根据同一像素带在各个图片中的出现次数,确定出现次数不为零的图片的数量,结合图片集中图片的总数量,得到所述总数量与所述数量的比值;

对所述比值取对数,得到所述同一像素带在所述图片集中的逆向文件频率。

本发明实施装置中,所述重图识别模块803,还用于:

统计与各个图片对应的像素带的种类数量;以及

统计所述图片对中重合像素带的种类数量和不重合像素带的种类数量;并且

计算所述重合像素带的种类数量在所述像素带的种类数量中的数量占比;

基于所述词频逆向文件频率占比、所述像素带的种类数量、所述重合像素带的种类数量、所述不重合像素带的种类数量和所述数量占比,生成所述对比指标向量。

另外,在本发明实施例中所述装置的具体实施内容,在上面所述方法中已经详细说明了,故在此重复内容不再说明。

图9示出了可以应用本发明实施例的示例性系统架构900。

如图9所示,系统架构900可以包括终端设备901、902、903,网络904和服务器905(仅仅是示例)。网络904用以在终端设备901、902、903和服务器905之间提供通信链路的介质。网络904可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备901、902、903通过网络904与服务器905交互,以接收或发送消息等。终端设备901、902、903上可以安装有各种通讯客户端应用。

终端设备901、902、903可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器905可以是提供各种服务的服务器,例如对用户利用终端设备901、902、903所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。

需要说明的是,本发明实施例所提供的方法一般由服务器905执行,相应地,装置一般设置于服务器905中。

应该理解,图9中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图10,其示出了适于用来实现本发明实施例的终端设备的计算机系统1000的结构示意图。图10示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图10所示,计算机系统1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统1000操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括像素带重合模块、占比计算模块、重图识别模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,重图识别模块还可以被描述为“识别图片对是否为重图的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:

确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;

根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;

基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。

根据本发明实施例的技术方案,相较于现有技术,具有以下有益效果:

1)对所有图片具有相同效果,无需进行图片标注,因此当遇到新品类/类型的图片时无需进行标注和训练操作,以此实现了新品图片的快速响应;对于业务方可以随时增删减待匹配品类,无需通知算法技术人员;

2)无需考虑图片主体,直接进行裁剪,以此降低了计算量,提高了后续图片匹配速度;

3)不同商家的图片不一定完全相同,以像素分带、图片对的方式进行重图匹配,实现简单、准确率高,无需受限于数据量大小和分类随意变动的问题;

4)以上特点可以使得本方案直接在CPU集群上处理,无需任何专业图处理环境和三方JAR包,直接加载在spark任务中在hadoop集群上处理,无需额外的GPU服务器,大大节省了成本;

5)可以用于实际业务的前期调研,减少外包人员人工压力等的排头兵作用。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 一种重图识别方法和装置
  • 一种用于自动售货机的称重图像识别装置
技术分类

06120112786662