掌桥专利:专业的专利平台
掌桥专利
首页

图片处理方法、装置、计算机可读存储介质及电子设备

文献发布时间:2023-06-19 09:55:50


图片处理方法、装置、计算机可读存储介质及电子设备

技术领域

本发明属于网络技术领域,特别是涉及一种图片处理方法、装置、计算机可读存储介质及电子设备。

背景技术

目前,很多场景下需要对图片分类,例如,为了获取图片分类模型,往往需要先对样本图片进行分类,然后根据分类后的样本图片训练获取图片分类模型。

在先技术中,往往是通过人工进行分类。但是,在待选类别之间为相同属性,但表示的属性程度不同的情况下,例如,多个类别均表示图像质量,不同类别表示不同程度的图像质量,或者是,多个类别均表示图像中人物的年龄,不同类别表示不同年龄。由于各个待选类别之间的差异较小,分类难度往往较大,因此会导致分类的准确性较低。

发明内容

有鉴于此,本发明提供一种图片处理方法、装置、计算机可读存储介质及电子设备,在一定程度上解决了分类的准确性较低的问题。

依据本发明的第一方面,提供了一种图片处理方法,该方法可以包括:

获取待选类别对应的至少一张预设标准图片,作为所述待选类别对应的参照图片;

将所述待选类别对应的参照图片与待分类图片进行拼接,得到所述待选类别对应的参照拼接图片;

根据所述待选类别对应的参照拼接图片,确定与所述待分类图片的相似程度满足预设要求的待选类别;

将所述满足预设要求的待选类别,确定为所述待分类图片所属的目标类别。

依据本发明的第二方面,提供了一种图片处理装置,该装置可以包括:

获取模块,用于获取待选类别对应的至少一张预设标准图片,作为所述待选类别对应的参照图片;

拼接模块,用于将所述待选类别对应的参照图片与待分类图片进行拼接,得到所述待选类别对应的参照拼接图片;

第一确定模块,用于根据所述待选类别对应的参照拼接图片,确定与所述待分类图片的相似程度满足预设要求的待选类别;

第二确定模块,用于将所述满足预设要求的待选类别,确定为所述待分类图片所属的目标类别。

第三方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的图片处理方法的步骤。

第四方面,本发明提供了一种电子设备包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如第一方面所述的图片处理方法的步骤。

针对在先技术,本发明具备如下优点:

本发明实施例提供的图片处理方法中,获取待选类别对应的至少一张预设标准图片,作为待选类别对应的参照图片,将待选类别对应的参照图片与待分类图片进行拼接,得到待选类别对应的参照拼接图片,根据待选类别对应的参照拼接图片,确定与待分类图片的相似程度满足预设要求的待选类别,将满足预设要求的待选类别,确定为待分类图片所属的目标类别。由于参照图片可以表征属于待选类别的图片所蕴含的标准信息,这样,通过拼接参照图片与待分类图片得到的参照拼接图片,可以提供更多的参照信息,进而一定程度上可以更便捷准确的确定待分类图片是否属于该待选类别,提高分类准确性。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是本发明实施例提供的一种图片处理方法的步骤流程图;

图2是本发明实施例提供的一种目标拼接图片的示意图;

图3是本发明实施例提供的一种参照拼接图片的示意图;

图4是本发明实施例提供的另一种目标拼接图片的示意图;

图5是本发明实施例提供的又一种目标拼接图片的示意图;

图6是本发明实施例提供的一种判断过程示意图;

图7是本发明实施例提供的另一种判断过程示意图;

图8是本发明实施例提供的一种处理逻辑示意图;

图9是本发明实施例提供的一种处理过程示意图;

图10是本发明实施例提供的一种图片处理装置的框图

图11是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

下面对本发明实施例中的图片处理方法进行详细说明。

实施例一

图1是本发明实施例提供的一种图片处理方法的步骤流程图,如图1所示,该方法可以包括:

步骤101、获取待选类别对应的至少一张预设标准图片,作为所述待选类别对应的参照图片。

本发明实施例中,待选类别可以是图片分类任务中提供的可选择的图片类别。具体的,本发明实施例的图片处理方法可以应用于待选类别具有范围划分比对的图片分类任务。示例的,在根据图片的清晰度进行分类的任务中,待选类别可以为表征不同清晰度的类别。例如,待选类别可以包括高清晰度类别、正常清晰度类别、低清晰度类别。或者,在根据图片的模糊程度进行分类的任务中,待选类别可以为表征不同模糊程度的类别。例如,待选类别可以包括一级模糊程度类别、二级模糊程度类别、三级糊程度类别,其中,级别越高,模糊程度越高。又或者,在根据图片中人物的年龄进行分类的任务中,待选类别可以为表征不同年龄段的类别。例如,待选类别可以包括青年类别、中年类别、老年类别。

进一步地,预设标准图片可以是根据先验知识预先确定的属于该待选类别的标准图片。预设标准图片可以表征属于该待选类别的图片所具备的标准特征。示例的,以待选类别为老年类别为例,预设标准图片可以为包含标准老年人人脸的图片,该预设标准图片中包含的人脸可以为具备典型老年人脸部特征的人脸,例如,皱纹较多且明显,脸部肌肉松弛,等等。

具体地,待选类别对应的预设标准图片的数量可以为一个或多个,具体的数量可以根据实际需求设置,示例的,每个待选类别可以对应的5张预设标准图片。进一步地,在获取待选类别对应的至少一张预设标准图片时,可以是从各个待选类别对应的所有预设标准图片中随机选择,也可以是选择用户指定的,本发明实施例对此不做限定。进一步地,选择的预设标准图片即为该待选类别对应的参照图片。

步骤102、将所述待选类别对应的参照图片与待分类图片进行拼接,得到所述待选类别对应的参照拼接图片。

本发明实施例中,可以直接将参照图片与待分类图片合并为一张同时包含参照图片以及待分类图片的图片,得到参照拼接图片。也可以是将参照图片与待分类图片添加至预设的模板图中,将添加后的模板图作为参照拼接图片。其中,参照图片与待分类图片在参照拼接图片中的相对位置可以根据实际需求设置,示例的,参照图片与待分类图片可以上下拼接,也可以是左右拼接。

步骤103、根据所述待选类别对应的参照拼接图片,确定与所述待分类图片的相似程度满足预设要求的待选类别。

本发明实施例中,预设要求可以根据实际需求设置,示例的,预设要求可以为相似程度最高,也可以为相似程度大于预设阈值。具体的,可以根据参照拼接图片确定待分类图片表征的图片特征与其中的参照图片表征的图片特征之间的相似程度,例如,在待选类别表征不同的年龄范围的情况下,图片特征可以为能够体现图片中人物的年龄的面部特征。相应地,可以是确定待分类图片中人脸的面部特征与参照图片中人脸的面部特征之间的相似程度。在待分类图片的图片特征与待选类别对应的参照图片的图片特征越接近,即,相似程度越高的情况下,可以认为该待分类图片属于该待选类别的概率越大。相应地,该特征之间的相似程度可以作为该待选类别与待分类图片的相似程度。进一步地,可以在确定出各个待选类别与待分类图片的相似程度之后,确定满足预设要求的待选类别。通过将参照图片与待分类图片合并为参照拼接图片,可以便捷的根据参照拼接图片确定参照图片与待分类图片之间的差异,进而一定程度上可以提高确定图片所属类别的效率。

步骤104、将所述满足预设要求的待选类别,确定为所述待分类图片所属的目标类别。

示例的,假设满足预设要求的待选类别为中年类别,那么可以将中年类别作为目标类别,将待分类图片分类至中年类别。

综上所述,本发明实施例提供的图片处理方法中,获取待选类别对应的至少一张预设标准图片,作为待选类别对应的参照图片,将待选类别对应的参照图片与待分类图片进行拼接,得到待选类别对应的参照拼接图片,根据待选类别对应的参照拼接图片,确定与待分类图片的相似程度满足预设要求的待选类别,将满足预设要求的待选类别,确定为待分类图片所属的目标类别。由于参照图片可以表征属于待选类别的图片所蕴含的标准信息,这样,通过拼接参照图片与待分类图片得到的参照拼接图片,可以提供更多的参照信息,进而一定程度上可以更便捷准确的确定待分类图片是否属于该待选类别,提高分类准确性。

同时,由于图片的分类准确性会较大程度的影响到模型训练的精度,因此,本发明实施例中通过提高图片分类的准确性,一定程度上可以提高后续基于分类结果进行模型训练的精度。

实施例二

可选的,在一种实现方式中,本发明实施例中上述获取待选类别对应的至少一张预设标准图片,作为待选类别对应的参照图片的步骤,可以包括下述子步骤:

子步骤(1):针对每个待选类别,从所述待选类别对应的预设标准图片中随机选择一张预设标准图片,作为所述待选类别对应的参照图片。

本步骤中,对于各个待选类别,可以基于预设的随机选择算法,从待选类别对应的预设标准图片中随机选择一张作为参照图片。通过每个待选类别仅选择一张,可以在确保提供参照的同时,最大程度避免引入过多图片信息,进而增加处理难度的问题。同时,通过随机选择一定程度上可以避免每次选择单一固定的预设标准图片作为参照图片,确保每次所选参照图片的丰富程度。

实施例三

可选的,在另一种实现方式中,本实施例中的待分类图片可以为包含人脸的图片,不同待选类别表征不同的年龄范围,相应地,上述获取待选类别对应的至少一张预设标准图片,作为待选类别对应的参照图片的步骤,可以包括下述子步骤:

子步骤(2):确定所述待分类图片中人物的年龄是否属于预设年龄区间;所述预设年龄区间表征的年龄范围为至少两个特定待选类别对应的年龄范围之和。

本步骤中,特定待选类别可以是分类难度高于预设阈值的待选类别,特定待选类别的数量可以小于待选类别的总数量。示例的,假设待选类别包括0类:年龄范围为0~2岁的婴儿类别,1类:年龄范围为3~9岁的幼儿类别,2类:年龄范围为10~13岁的儿童类别,3类:年龄范围为14~17岁的少年类别,4类:年龄范围为18~30岁的成年人类别,5类:年龄范围为31~50岁的中年人类别,6类:年龄范围为50岁以上的老年人类别。由于对于婴儿类别,中年人类别以及老年人类别,根据人脸图片判断人物是否属于这三个年龄段的难度较低,而对于其他类别而言,判断难度则较大。例如,对未成年人的人脸图片分类时容易误判,分类难度较大。因此,可以将1类、2类、3类及4类作为特定待选类别。将3~~30岁作为预设年龄区间表征的年龄范围。需要说明的是,上述年龄范围及类别的划分方式并不唯一,可以根据实际需求调整,本发明实施例对此不作限定。

进一步地,由于预设年龄区间表征年龄范围较宽,因此,可以通过预设的识别算法便捷的确定出待分类图片中人物的年龄是否属于预设年龄区间。或者,也可以是通过人工判断的方式确定是否属于预设年龄区间。

子步骤(3):若所述待分类图片中人物的年龄属于所述预设年龄区间,则从各个所述特定待选类别对应的预设标准图片中选择至少两张预设标准图片,作为所述待选类别对应的参照图片。

如果待分类图片中人物的年龄属于所述预设年龄区间,则可以认为待分类图片较大概率属于特定待选类别,因此,可以仅从部分特定类别,即,特定待选类别,对应的预设标准图片中选择参照图片,以缩小确定范围。进一步地,通过为各个特定待选类别选择多张参照图片,可以为后续操作提供更多的参照信息,以使后续确定的结果更加可靠。

本发明实施例中,通过先大致确定待分类图片中人物的年龄是否属于预设年龄区间,将确定范围缩小至预设年龄区间对应的特定待选类别,减少对照组的数量,进而一定程度上可以减少所需获取的预设标准图片的数量以及后续需比对的类别,提高确定效率。同时,通过缩小范围,一定程度上可以降低对特定待选类别的识别难度,例如,降低未成年人的识别难度,使得未成年人年龄的判断更加客观准确,进而可以提高后续的年龄审核效率。

实施例四

可选的,本实施例中上述根据待选类别对应的参照拼接图片,确定与待分类图片的相似程度满足预设要求的待选类别,可以包括:

子步骤(4):向标注人员输出各个所述待选类别对应的参照拼接图片。

本步骤中,输出参照拼接图片可以是向标注人员显示参照拼接图片。示例的,在本发明实施例提供的图片处理方法由服务器端执行时,服务器端可以将参照拼接图片发送给标注人员所使用的终端,由终端向标注人员进行显示。在本实施例提供的图片处理方法由终端执行时,终端可以通过显示部件直接向标注人员进行显示。其中,该终端可以是标注人员使用的电脑、手机、平板,等等。

子步骤(5):接收所述标注人员返回的判断标识;所述判断标识是所述标注人员根据显示的所述待选类别对应的参照拼接图片生成的,所述判断标识用于表征所述待分类图片是否属于所述待选类别。

本发明实施例中,标注人员在接收到输出的参照拼接图片之后,可以根据参照拼接图片提供的参照比对信息,确定参照拼接图片中的待分类图片与参照拼接图片中的参照图片是否属于同一类别。在确定属于同一类别的情况下,返回表征待分类图片属于该待选类别的判断标识,在确定不属于同一类别的情况下,返回待分类图片不属于该待选类别的判断标识。

示例的,以按照所属年龄范围进行分类为例,标注人员可以根据参照拼接图片中待分类图片中人物的面部特征与参照图片中人物的面部特征,确定待分类图片中人物的年龄是否超出该待选类别对应的年龄范围。具体的,可以在判断出待分类图片中人物的年龄明显大于参照图片中人物的年龄的情况下,确定待分类图片中人物的年龄超出该待选类别对应的年龄范围。进一步地,如果待分类图片中人物的年龄超出该待选类别对应的年龄范围,标注人员可以返回判断标识“1”,如果待分类图片中人物的年龄未超出该待选类别对应的年龄范围,标注人员可以返回判断标识“0”。

子步骤(6):根据所述判断标识,确定与所述待分类图片的相似程度满足预设要求的待选类别。

可选的,可以先判断各个待选类别对应的判断标识是否为特定判断标识,其中,该特定判断标识是表征待分类图片属于待选类别的标识。示例的,该特定判断标识可以为“0”。进一步地,可以将对应的判断标识为特定判断标识的待选类别,确定为满足预设要求的待选类别。其中,对应的判断标识为特定判断标识的待选类别,即为与待分类图片的相似程度最高的待选类别。

本发明实施例中,通过向标注人员输出参照拼接图片,进一步接收标注人员针对各个待选类别返回的判断标识,根据判断标识即可便捷的确定出与待分类图片的相似程度满足预设要求的待选类别,一定程度上可以提高类别确定的效率。同时,通过输出参照拼接图片,使得标注人员可以便捷的通过参照拼接图片提供的参照信息进行比对,进而可以准确的确定待分类图片与参照拼接图片中的参照图片是否属于同一类别,确保返回的判断标识的准确性。

实施例五

可选的,本实施例中上述向标注人员输出各个待选类别对应的参照拼接图片的操作,可以包括:

子步骤(4A):依次显示各个所述待选类别对应的参照拼接图片;或者,对各个所述待选类别对应的参照拼接图片进行拼接,得到目标拼接图片;显示所述目标拼接图片。

假设通过前述相关步骤生成了针对7个待选类别的参照拼接图片,那么可以按照各个待选类别表征的年龄范围的大小依次显示这7张参照拼接图片。或者,也可以是将这7张参照拼接图片拼接为一个整体,得到目标拼接图片,接着直接显示该目标拼接图片。需要说明的是,本发明实施例中,还可以在各个参照拼接图片上添加该参照拼接图片对应的待选类别的类别标识。其中,待选类别的类别标识可以为待选类别的编号,名称,等等。例如,可以为0类、1类,2类,等等。

本发明实施例中,通过将各个待选类别对应的参照拼接图片进一步进行拼接,得到目标拼接图片,直接显示该目标拼接图片。这样,可以向标注人员提供不同待选类别之间的对比,进而一定程度上方便标注人员进行判断,提高判断结果的准确性。或者,也可以不进行拼接,直接依次显示各个待选类别对应的参照拼接图片,以方便标注人员按序进行判断,确保判断操作的便捷性。同时,通过针对各个待选类别提供各自对应的参照图片,可以将主观度量尽可能拆分为各个部分的客观度量,使标注人员的感官对各个待选类别的年龄范围具备的特征更加敏感,对于边界或者容易模糊的年龄范围更加容易判断,进而一定程度上可以避免误判,提高标注效率。

实施例六

可选的,在一种实现方式,本发明实施例中可以按照对应的年龄范围端值由小至大的顺序依次对各个所述待选类别对应的参照拼接图片进行拼接;所述目标拼接图片包括多行参照拼接图片。

其中,年龄范围端值可以是每个待选类别表征的年龄范围的最小值,也可以是每个待选类别表征的年龄范围的最大值。需要说明的是,在按照顺序进行拼接时,针对每个待选类别选择的年龄范围端值为同一属性的端值,例如,均为年龄范围的最小值或均为年龄范围的最大值。在拼接时,可以将一个待选类别对应的参照拼接图片作为一行元素,通过拼接即可得到由多行参照拼接图片组成的目标拼接图片。本发明实施例中,通过按照年龄范围端值的大小依次有序进行拼接,这样,可以使得目标拼接图片中形成有序的待选类别的参照图片之间的对比,进而一定程度上更加可以方便标注人员进行判断,提高判断结果的准确性。示例的,图2是本发明实施例提供的一种目标拼接图片的示意图(图片具体内容未示出),如图2所示,目标拼接图片中包含7个待选类别对应的7张参照拼接图片,每张参照拼接图片中包含待分类图片X以及参照图片。其中,目标拼接图片中包含的参照拼接图片按照0类到6类的顺序(虚线框中的数字表示类别号),依次排列。各个参照拼接图片中包含的参照图片分别为A、B、C、D、E、F、G。对应该目标拼接图片,标注人员可以通过完全对照,进行判断。

进一步地,图3是本发明实施例提供的一种参照拼接图片的示意图,如图3所示,针对特定待选类别:1类,2类,3类及4类对应生成了4张参照拼接图片,其中,每个特定待选类别以选择两张参照图片为例进行示意。进一步地,图4是本发明实施例提供的另一种目标拼接图片的示意图,如图4所示,目标拼接图片中包含4个待选类别对应的4张参照拼接图片,由于目标拼接图片中包含的参照拼接图片的数量变少,行数变少,因此一定程度上可以减少视觉干扰。需要说明的是,本发明实施例在拼接获取目标拼接图片时,可以将各个参照拼接图片中的待分类图片合并为一张。这样,一定程度上可以减少目标拼接图片中包含的重复图片的数量,进而以方便标注人员进行比对判断。示例的,图5是本发明实施例提供的又一种目标拼接图片的示意图,如图5所示,相较于图4中所示的目标拼接图片,图5中所示的目标拼接图片中4张参照拼接图片中的图5被合并为一张。

相应地,接收标注人员返回的判断标识的操作可以具体为:接收标注人员根据目标拼接图片中各行参照拼接图片依次返回的判断标识,其中,标注人员可以在从目标拼接图片中检测到包含的待分类图片与参照图片属于同一待选类别的参照拼接图片之后,停止返回判断标识。示例的,标注人员可以从目标拼接图片中0类所在行开始依次向下看,一行一行的对比其中的待分类图片和参照图片,如果待分类图片中人物的年龄明显大于参照图片中人物的年龄的情况下,即,待分类图片中人物的年龄超出该待选类别对应的年龄范围的情况下,返回判断标识“1”,并继续对下一行进行判断。如果待分类图片中人物的年龄未超出该待选类别对应的年龄范围,返回判断标识“0”。并在确定出判断标识0之后,停止返回判断判断标识的操作,这样,可以避免后续执行不必要的判断操作。

需要说明的是,本发明实施例中还可以将标注人员返回的判断结果进行相加,作为待分类图片的类别标签。示例的,图6是本发明实施例提供的一种判断过程示意图,如图6所示,假设待分类图片中人物的年龄落入目标拼接图片中第4行对应的待选类别的年龄范围,那么标注人员可以返回判断结果:1,1,1,0,相应地,可以对判断结果进行相加,得到类别标签“3类”,其中,“3类”刚好指向第4行对应的待选类别。进一步地,本发明实施例中通过设置两种生成参照拼接图片的实现方式,使得实际应用时,可以根据实际需求去选择所使用的实现方式,例如,可以根据标注人员的个人喜好选择生成参照拼接图片的实现方式,这样,可以使得标注人员可以以更适合自己的标注方式进行标注,进而可以使得标注操作更具灵活性以及适应性,减少标注人员的疲惫感。

实施例七

可选的,本发明实施例中还可以在向标注人员输出各个待选类别对应的参照拼接图片之后,执行下述步骤:

步骤A、在接收到所述标注人员返回的辅助信息显示请求的情况下,向所述标注人员输出预设的类别特征对比表;其中,所述类别特征对比表用于表征各个所述待选类别对应的预设标准图片的图片特征信息。

本步骤中,类别特征对比表的具体内容可以是预先根据属于各个待选类别的预设标准图片所具备的特征生成的。具体的,类别特征对比表中可以存储有各个待选类别对应的预设标准图片中人脸的外貌特征信息,即,属于各个待选类别的年龄范围的人群所具备的外貌特征信息。示例的,这些特征信息可以是文本类型的信息。示例的,该预设的类别特征对比表可以如下表1所示:

表1

本发明实施例中,通过显示类别特征对比表,可以向标注人员提供的更丰富的参照信息,进而方便标注人员进行判断。需要说明的是,实际应用场景中,为了提高类别特征对比表的作用,也可以在显示目标拼接图片的同时,直接向标注人员显示类别特征对比表,以向标注人员提供更多维度的参照信息,进行方便标注人员进行比对。例如,可以直接在针对特定待选类别选择多张参照图片生成参照拼接图片的情况下,向标注人员显示类别特征对比表。相应地,在该情况下,标注人员进行标注时,对于可以根据类别特征对比表中的信息,确定待分类图片中人物是否属于非特定待选类别,以确保针对非特定待选类别的分类准确性。例如,可以直接根据类别特征对比表中的外貌特征信息,确定待分类图片是否属于0类,5类或6类。对于特定待选类别:1类,2类,3类或4类,仅利用外貌特征很容易出现混淆,因此,可以目标拼接图片作为参考组,从第一行的参照组开始,观察待分类图片中人物的年龄是否明显大于参照图片中人物的年龄,即,待分类图片中人物的年龄超出该待选类别对应的年龄范围,如果是则可以返回判断标识“1”,并继续对下一行进行判断。如果待分类图片中人物的年龄未超出该待选类别对应的年龄范围,则可以返回判断标识“0”。并在确定出判断标识0之后,停止返回判断判断标识的操作,以避免后续执行不必要的判断操作。在判断过程中,如果仅根据目标拼接图片无法得出判断结果则可以以表中的外貌特征信息作为参考来辅助判断,从而得到一个较为客观精准的结果。

示例的,图7是本发明实施例提供的另一种判断过程示意图,如图7所示,如果利用外貌特征信息判断出当前的待分类图片不属于0,5,6类,则可以进一步从第一行开始进行判断,在判断出待分类图片中人物的年龄明显大于第一行中参照图片中人物的年龄的情况下,可以继续向下一行进行判断,最终,可以结合类别特征对比表中的外貌特征信息,确定待分类图片属于3类:年龄范围为14~17岁的少年类别。

实施例八

可选的,本发明实施例中上述根据待选类别对应的参照拼接图片,确定与待分类图片的相似程度满足预设要求的待选类别的操作,也可以通过下述子步骤(7)~子步骤(9)所示的实现方式实现:

子步骤(7):对于每个所述待选类别对应的参照拼接图片,利用预设的相似度算法,确定所述参照拼接图片中包含的图片之间的相似度。

本步骤中,预设的相似度算法可以用于提取参照拼接图片中参照图片的图片特征以及待分类图片的图片特征,计算提取到的图片特征之间的特征距离,根据特征距离确定两者的相似度。具体的,预设相似度算法的具体类型可以根据实际需求设置,本发明实施例对此不作限定。

子步骤(8):根据所述相似度,确定所述待分类图片相对所述待选类别的判断标识;所述判断标识用于表征所述待分类图片是否属于所述待选类别。

本步骤中,可以在相似度大于预设相似度阈值的情况下,确定待分类图片属于该待选类别,相应地,将判断标识设置为表示属于该待选类别的标识。反之,可以在相似度不大于预设相似度阈值的情况下,确定待分类图片不属于该待选类别,相应地,将判断标识设置为表示不属于该待选类别的标识。示例的,以按照所属年龄范围进行分类为例,如果相似度不大于预设相似度阈值,可以确定待分类图片中人物的年龄不在该待选类别对应的年龄范围,相应地,可以确定判断标识为“1”。进一步地,如果相似度大于预设相似度阈值,可以确定待分类图片中人物的年龄在该待选类别对应的年龄范围,相应地,可以确定判断标识为“0”。

子步骤(9):根据所述判断标识,确定与所述待分类图片的相似程度满足预设要求的待选类别。

具体的,本步骤的实现方式可以参照前述相关步骤的实现方式,本发明实施例在此不作赘述。

本发明实施例中,通过结合预设的相似度算法,自动确定判断标识,并根据判断标识确定与待分类图片的相似程度满足预设要求的待选类别。这样,无需标注人员参与,可以实现自动化的图片分类,进而一定程度上可以提高分类效率,降低分类成本。进一步地,通过将待分类图片与参照图片拼接为参照拼接图片之后,使用相似度算法进行确定,可以减少相似度算法的输入数量,进而一定程度上提高处理效率。

实施例九

可选的,本发明实施例中的标注人员可以为多个,相应地,判断标识可以包括多个标注人员返回的判断标识,目标类别可以包括根据多个标注人员返回的判断标识确定的多个目标类别。其中,标注人员的数量可以根据实际情况设置。示例的,标注人员可以为2个,也可以3个,相应地,可以是根据一个标注人员返回的判断标识确定一个目标类别,在存在多个标注人员返回的判断标识的情况下,会得到多个目标类别,例如,可以得到2个或3个目标类别。在该场景中,还可以在将满足预设要求的待选类别,确定为待分类图片所属的目标类别之后,执行下述步骤:

步骤B、判断每个标注人员对应的目标类别是否相同;所述标注人员对应的目标类别是根据所述标注人员返回的判断标识确定的。

本发明实施例中,根据一个标注人员返回的判断标识确定一个目标类别,根据该标注人员返回的判断标识确定的目标类别即为该标注人员对应的目标类别。进一步地,由于不同标注人员的判断标注可能会存在偏差,因此,可以检测每个标注人员对应的目标类别是否相同,以检验在不同判断标准下得到的目标类别是否相同,进而确定检测结果的可信度。

步骤C、若每个标注人员对应的目标类别均不相同,则将所述待分类图片删除。

本步骤中,如果每个标注人员对应的目标类别均不相同,则可以认为该待分类图片的分类结果的置信度较低,该待分类图片的分类结果不具有普遍意义,因此可以将该待分类图片挑出,以优化后续的训练集的质量。

步骤D、若存在至少一个相同的目标类别,则将出现次数满足预设条件的目标类别确定为所述待分类图片的训练标签,并将所述待分类图片加入训练集;根据所述训练集中的图片及所述图片的训练标签,训练图片分类模型。

如果存在至少一个相同的目标类别,则说明该分类结果具有一定置信度,因此可以将待分类图片加入训练集。进一步地,训练标签也可以称为类别标签,可以用于表征该待分类图片所属的类别。具体在设置待分类图片的训练标签时,出现次数满足预设条件可以是出现次数最多,即,可以选择多个目标类别中的众数作为该待分类图片的类别标签。根据训练集中的图片及图片的训练标签,训练图片分类模型时,可以是利用预设的模型训练方法进行训练,例如,梯度下降法,等等,本发明实施例对此不作限定。

本发明实施例中,通过采用多个标注人员确定多个目标类别,根据多个目标类别选择置信度较高的待分类图片作为样本图片并加入训练集中,可以确保训练集中图片及图片的训练标签的置信程度,实现精准客观的对待分类图片进行高效率的标注,进而可以确保后续训练的图片分类模型的精度。需要说明的是,本发明实施例中还可以将目标类别均不相同的待分类图片作为问题图片,向标注人员反馈问题图片的相关信息,以使标注人员可以相应调整判断标准,进而更新标注人员标注的准确度。

示例的,图8是本发明实施例提供的一种处理逻辑示意图,如图8所示,该处理过程包括三个环节:标注前:生成目标拼接图片、标注中:基于多个标注人员进行标注以及标注后:对多个标注人员对应的目标类别进行统计,如果均不相同则丢弃该待分类图片。同时可以针对最后一个环节的结果进行反馈。本发明实施例中通过将处理过程划分为标注前,标注中,标注后,从各个环节出发,在各个环节中均减少误判的可能,使得的标注逻辑更加清晰,标注结果更加准确。示例的,在某些标注场景下,通过该处理过程可以订正约60%的标注错误。需要说明的是,本发明的另一可选实施例中,也可以利用多个不同精度的相似度算法,针对待分类图片确定多个目标类别,然后在各个目标类别均不相同的情况下,将所述待分类图片删除。或者,在存在至少一个相同的目标类别的情况下,则将出现次数满足预设条件的目标类别确定为待分类图片的训练标签,并将待分类图片加入训练集;根据训练集中的图片及图片的训练标签,训练图片分类模型。

进一步地,在待分类图片为包含人脸的图片,不同待选类别表征不同的年龄范围,图片分类模型用于将图片分类至不同的年龄范围类别的场景中,本发明实施例中还可以执行下述步骤:

步骤E、对于待审核图片,将所述待审核图片输入所述图片分类模型,以获取所述图片分类模型输出的所述待审核图片对应的待选类别。

本步骤中,图片分类模型可以为年龄预测模型,待审核图片可以是需要确定图片中人物的年龄的图片。示例的,待审核图片可以是用户提交至视频平台的视频中的图片,也可以是用户提交至视频平台的图片。通过将待审核图片输入图片分类模型,图片分类模型可以将待审核图片分类至对应的待选类别中。

步骤F、根据所述待审核图片对应的待选类别表征年龄范围,对所述待审核图片进行处理。

本步骤中,执行的处理操作的具体内容可以根据实际需求设置。示例的,进行的处理可以为未成年人单独出镜审核、针对儿童的违规动作审核。具体的,可以根据待审核图片对应的待选类别表征的年龄范围,确定待审核图片中的人物是否为未成年人或儿童。如果待审核图片中的人物为未成年人且待审核图片中仅包含一个人物,则可以判定该待审核图片所属视频中存在未成年人单独出镜的情况。如果待审核图片中的人物为儿童,则可以进一步识别待审核图片中是否存在其他人物,且其他人物与当前识别的人物之间是否存在违规动作。如果存在则可以判定该待审核图片所属视频中存在违规行为。这样,根据图片分类模型的分类结果可以准确的确定出待审核图片中人物的年龄范围,进而可以确保准确的对待审核图片进行审核。同时,本发明实施进行审核时,无需人工参与,因此一定程度上可以提高审核效率,减少违规审核员的审核量。需要说明的是,本发明实施例中待选类别表征的年龄范围可以为一个单一的年龄值,这样,可以使得训练出的图片分类模型能够学习到确定图片中人物的具体年龄的能力,进而提高年龄确定的精度。

进一步地,进行的处理也可以为人脸属性编辑。具体的,本发明实施例中可以根据待审核图片对应的待选类别表征的年龄范围,对待审核图片中该人物的面部特征进行调整,以模拟不同年龄的面部(人脸变老或变年龄等),形成年龄变化特效。通过特效玩法可以增加趣味性,进而可以进一步提高应用端的日活量,提升用户对于产品的黏度。

示例的,图9是本发明实施例提供的一种处理过程示意图,如图9所示,可以先从网站/应用获取数据,然后将数据提交到标注平台,接着,可以通过多个标注人员(图中以3个为例)结合上述提供的对比标注方案,得出准确的带标签的年龄数据(即,上述的训练集中的图片及该图片的训练标签)。接着可以通过年龄数据训练得到年龄模型,利用该年龄模型预测年龄。进一步地,预测的年龄可以作为年龄信号,用于后续的未成年人单独出镜审核、针对儿童的违规动作审核以及人脸变龄玩法。

本发明实施例中,可以服务于根据年龄信号(即,人物所属的年龄范围)进行处理的业务场景。由于图片分类模型是通过上述步骤训练得到的精度更高的分类模型,因此,基于该图片分类模型确定的待审核图片对应的年龄范围类别可以更加准确,即,可以提供更加准确的年龄信号。相应地,可以确保后续能够准确的根据待审核图片对应的年龄范围类别进行合适的处理,进而提高后续处理的准确性和合理性。

进一步地,随着人工智能技术的发展,许多技术越发成熟,年龄预测技术也越来越普及。由于标注时对于人脸的年龄具有极大的主观性,因此,直接根据待分类图片进行数据标注时的误差会较大,例如,在人脸存在光照不足,头部偏转等情况时候,仅依靠待分类图片本身误判几率会较大,因此,虽然有标注规则,但标注结果仍会存在很大的误差,进而会影响后续训练的图片分类模型的精度和性能。本发明实施例在人脸年龄预测的背景下,针对标注年龄不准确,主观性导致偏差等问题,通过提供参照,利用多标注主体从多维度进行标注,一定程度上可以提高年龄标注的准确度,降低年龄标注的主观性,进而提高图片分类模型的精确度。这样,从数据源头入手去校准模型的预测精度,一定程度上可以确保校准效果。同时可以提高标注人员的标注效率,提升标注效率,以及降低返工率。

实施例十

图10是本发明实施例提供的一种图片处理装置的框图,如图10所示,该装置20可以包括:

获取模块201,用于获取待选类别对应的至少一张预设标准图片,作为所述待选类别对应的参照图片。

拼接模块202,用于将所述待选类别对应的参照图片与待分类图片进行拼接,得到所述待选类别对应的参照拼接图片。

第一确定模块203,用于根据所述待选类别对应的参照拼接图片,确定与所述待分类图片的相似程度满足预设要求的待选类别。

第二确定模块204,用于将所述满足预设要求的待选类别,确定为所述待分类图片所属的目标类别。

本发明实施例提供的图片处理装置具备执行图片处理方法相应的功能模块,可执行本发明实施例一到实施例九任一实施例所提供的图片处理方法,且能达到相同的有益效果。

在本发明提供的又一实施例中,还提供了一种电子设备,电子设备可以包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图片处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。示例的,如图11所示,该电子设备具体可以包括:处理器401、存储装置402、具有触摸功能的显示屏403、输入装置404、输出装置405以及通信装置406。该电子设备中处理器401的数量可以是一个或者多个,图11中以一个处理器401为例。该电子设备的处理器401、存储装置402、显示屏403、输入装置404、输出装置405以及通信装置406可以通过总线或者其他方式连接。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图片处理方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图片处理方法。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

相关技术
  • 图片处理方法及装置、计算机可读存储介质、电子设备
  • 图片处理方法、装置、计算机可读存储介质及电子设备
技术分类

06120112352966