掌桥专利:专业的专利平台
掌桥专利
首页

图像分类模型生成方法、装置、计算机设备及存储介质

文献发布时间:2024-04-18 20:01:55


图像分类模型生成方法、装置、计算机设备及存储介质

技术领域

本发明涉及图像分类技术领域,尤其涉及一种图像分类模型生成方法、装置、计算机设备及存储介质。

背景技术

目前,图像分类技术已经应用到不同场景中,例如,在人脸识别场景中,可以采用图像分类技术对人脸图像进行多种属性类别的分类预测,例如,对人脸图像进行年龄、情绪和性别等多种属性类别的分类预测,即实现对人脸图像进行多属性分类。

现有技术中,图像分类技术多数基于卷积神经网络的监督学习方法实现,需要数据标签进行用于图像分类的分类网络模型的训练,才能执行对应的分类任务。但是,数据标签通常存在无法避免的噪声数据,该噪声数据会对分类网络模型的训练产生负面影响,降低模型的鲁棒性。

综上所述,如何提升用于图像分类的分类网络模型的鲁棒性,是现有技术中亟待解决的技术问题。

发明内容

本发明实施例提供一种图像分类模型生成方法、装置、计算机设备及存储介质,以解决如何提升用于图像分类的分类网络模型的鲁棒性的问题。

本申请实施例的第一方面提供一种图像分类模型生成方法,包括:

对训练图像进行不同程度的增广处理,确定所述训练图像对应的第一增广图像和第二增广图像;

将所述第一增广图像和所述第二增广图像输入至分类网络模型,获取所述分类网络模型对应的第一损失函数值和第二损失函数值;

将所述第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取所述分类网络模型对应的第三损失函数值;

根据所述分类网络模型对应的第一损失函数值、第二损失函数值和第三损失函数值,确定目标损失函数值;

在所述目标损失函数值未满足收敛条件时,更新所述分类网络模型的模型参数;

在所述目标损失函数值满足收敛条件时,将所述分类网络模型确定为目标分类模型。

本申请实施例的第二方面提供一种图像分类模型生成装置,包括:

增广图像确定模块,用于对训练图像进行不同程度的增广处理,确定所述训练图像对应的第一增广图像和第二增广图像;

第一和第二损失函数值获取模块,用于将所述第一增广图像和所述第二增广图像输入至分类网络模型,获取所述分类网络模型对应的第一损失函数值和第二损失函数值;

第三损失函数值获取模块,用于将所述第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取所述分类网络模型对应的第三损失函数值;

目标损失函数值确定模块,用于根据所述分类网络模型对应的第一损失函数值、第二损失函数值和第三损失函数值,确定目标损失函数值;

模型参数更新模块,用于在所述目标损失函数值未满足收敛条件时,更新所述分类网络模型的模型参数;

目标分类模型确定模块,用于在所述目标损失函数值满足收敛条件时,将所述分类网络模型确定为目标分类模型。

本申请实施例的第三方面提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图像分类模型生成方法的步骤。

本申请实施例的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像分类模型生成方法的步骤。

上述图像分类模型生成方法、装置、计算机设备及存储介质,将第一增广图像和第二增广图像输入至分类网络模型,获取分类网络模型对应的第一损失函数值和第二损失函数值,便于分类网络模型进行模型训练,实现模型收敛;将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第三损失函数值,得到分类网络模型与带动量更新的分类网络模型之间的分类预测差异,以确定分类网络模型受到数据噪声影响的分类预测误差;在确定目标损失函数值时,将第一增广图像的训练损失、第二增广图像的训练损失以及分类网络模型的分类预测误差对应的损失考虑在内,使目标损失的计算更加符合训练的实际情况;根据目标损失函数值更新分类网络模型的模型参数,将第一增广图像的训练损失、第二增广图像的训练损失以及分类网络模型的分类预测误差对应的损失考虑在内,能够提升分类网络模型的鲁棒性,并且,在目标损失函数值满足收敛条件时,将分类网络模型确定为目标分类模型,并未对分类网络模型的训练设置特定分类场景,能够使训练得到的目标分类模型的应用场景具有广泛性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中图像分类模型生成方法的一应用环境示意图;

图2是本发明一实施例中图像分类模型生成方法的一流程图;

图3是本发明一实施例中图像分类模型生成方法的另一流程图;

图4是本发明一实施例中图像分类模型生成方法的另一流程图;

图5是本发明一实施例中图像分类模型生成方法的另一流程图;

图6是本发明一实施例中图像分类模型生成方法的另一流程图;

图7是本发明一实施例中图像分类模型生成方法的另一流程图;

图8是本发明一实施例中图像分类模型生成方法的另一流程图;

图9是本发明一实施例中图像分类模型生成装置的一示意图;

图10是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的图像分类模型生成方法,该图像分类模型生成方法可应用如图1所示的应用环境中。具体地,该图像分类模型生成方法应用在图像分类模型生成系统中,该系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于实现提升用于图像分类的分类网络模型的鲁棒性的目的。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。本发明实施例中,客户端用于获取训练图像,服务器用于基于训练图像对图像分类模型进行训练,实现提升图像分类模型的鲁棒性的目的。

在一实施例中,如图2所示,提供一种图像分类模型生成方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:

S201:对训练图像进行不同程度的增广处理,确定训练图像对应的第一增广图像和第二增广图像;

S202:将第一增广图像和第二增广图像输入至分类网络模型,获取分类网络模型对应的第一损失函数值和第二损失函数值;

S203:将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第三损失函数值;

S204:根据分类网络模型对应的第一损失函数值、第二损失函数值和第三损失函数值,确定目标损失函数值;

S205:在目标损失函数值未满足收敛条件时,更新分类网络模型的模型参数;

S206:在目标损失函数值满足收敛条件时,将分类网络模型确定为目标分类模型。

其中,训练图像是指对分类网络模型进行训练的图像。分类网络模型是指需要采用训练图像进行训练的图像分类模型,是未经训练的图像分类模型。第一增广图像和第二增广图像是对训练图像进行增广后的图像。

作为一示例,步骤S201中,服务器对获取到的N张(N≥2)训练图像{N

其中,第一损失函数值是第一增广图像在分类网络模型进行训练时产生的损失函数值。第二损失函数值是第二增广图像在分类网络模型进行训练时产生的损失函数值。

作为一示例,步骤S202中,服务器将每一张训练图像增广后产生的第一增广图像和第二增广图像分别输入至分类网络模型中进行训练,得到第一增广图像在分类网络模型中训练产生的第一损失函数值L

其中,带动量更新的分类网络模型是指在分类网络模型中加入动量机制并按预设更新规则更新动量的分类网络模型。其中,预设更新规则包括定时更新动量。第三损失函数值是第一增广图像分别在分类网络模型和带动量更新的分类网络模型中进行训练时,分类网络模型和带动量更新的分类网络模型之间分类预测的损失函数值。

作为一示例,步骤S203中,服务器将每一训练图像对应的第一增广图像分别输入至分类网络模型和带动量更新的分类网络模型中进行训练,并计算第一增广图像分别在分类网络模型和带动量更新的分类网络模型时,分类网络模型和带动量更新的分类网络模型之间产生的分类预测损失,作为第三损失函数值L

其中,目标损失函数值是指分类网络模型整体的训练损失函数值。

作为一示例,步骤S204中,服务器在得到第一损失函数值L

其中,收敛条件是用于判断分类网络模型是否训练完成的预设条件。可理解地,可以通过判断目标损失函数值是否低于预设收敛值,确定目标损失函数值是否达到收敛条件。其中,预设收敛值是用于判断目标损失函数值是否达到收敛条件的预设值。也可以通过判断目标损失函数值是否趋于稳定,确定目标损失函数值是否到达到收敛条件。还可以通过判断目标损失函数值的获取次数(即通过目标损失函数值的获取次数确定分类网络模型的训练次数),确定分类网络模型是否满足停止训练的收敛条件。

作为一示例,步骤S205中,服务器根据目标损失函数值更新分类网络模型,在确定分类网络模型对应的目标损失函数值不满足收敛条件时,继续基于训练得到的目标损失函数值对分类网络模型进行更新。例如,服务器在目标损失函数值不低于预设收敛值时,确定目标损失函数值不满足收敛条件。例如,服务器在目标损失函数值未趋于稳定时,确定目标损失函数值不满足收敛条件。其中,若相邻两次获取到的目标损失函数值的差值小于预设差值,则确定目标损失函数值趋于稳定;若相邻两次获取到的目标损失函数值的差值不小于预设差值,则确定目标损失函数值未趋于稳定。又例如,服务器在目标损失函数值的获取次数小于预设次数时,确定分类网络模型的训练次数小于预设次数,此时,服务器确定分类网络模型不满足停止训练的收敛条件,需要继续对分类网络模型进行更新。其中,预设次数是指预先设定的分类网络模型的训练次数。例如,服务器在确定目标损失函数值不收敛时,继续更新分类网络模型。本示例中,在目标损失函数值未满足收敛条件时,根据目标损失函数值更新分类网络模型的模型参数,便于提升分类网络模型的鲁棒性。

其中,目标分类模型是指对分类网络模型训练完成后得到的用于进行图像分类的模型。

作为一示例,步骤S206中,服务器确定对分类网络模型进行训练后得到的目标损失函数值满足收敛条件时,停止对分类网络模型进行更新,将最近一次更新的分类网络模型确定为目标分类模型。例如,服务器在目标损失函数值低于预设收敛值时,确定目标损失函数值满足收敛条件。例如,服务器在目标损失函数值趋于稳定时,确定目标损失函数值满足收敛条件。其中,若相邻两次获取到的目标损失函数值的差值小于预设差值,则确定目标损失函数值趋于稳定;若相邻两次获取到的目标损失函数值的差值不小于预设差值,则确定目标损失函数值未趋于稳定。又例如,服务器在目标损失函数值的获取次数不小于预设次数时,确定分类网络模型的训练次数不小于预设次数,此时,服务器确定分类网络模型满足停止训练的收敛条件,停止对分类网络模型进行更新。其中,预设次数是指预先设定的分类网络模型的训练次数。本示例中,根据目标损失函数值更新分类网络模型的模型参数,将第一增广图像的训练损失、第二增广图像的训练损失以及分类网络模型的分类预测误差对应的损失考虑在内,能够提升分类网络模型的鲁棒性,并且,在目标损失函数值满足收敛条件时,将分类网络模型确定为目标分类模型,并未对分类网络模型的训练设置特定分类场景,能够使训练得到目标分类模型适应较多的分类场景,使训练得到的目标分类模型的应用场景具有广泛性。

本实施例所提供的图像分类模型生成方法,将第一增广图像和第二增广图像输入至分类网络模型,获取分类网络模型对应的第一损失函数值和第二损失函数值,便于分类网络模型进行模型训练,实现模型收敛;将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第三损失函数值,得到分类网络模型与带动量更新的分类网络模型之间的分类预测差异,以确定分类网络模型受到数据噪声影响的分类预测误差;在确定目标损失函数值时,将第一增广图像的训练损失、第二增广图像的训练损失以及分类网络模型的分类预测误差对应的损失考虑在内,使目标损失的计算更加符合训练的实际情况;根据目标损失函数值更新分类网络模型的模型参数,将第一增广图像的训练损失、第二增广图像的训练损失以及分类网络模型的分类预测误差对应的损失考虑在内,能够提升分类网络模型的鲁棒性,并且,在目标损失函数值满足收敛条件时,将分类网络模型确定为目标分类模型,并未对分类网络模型的训练设置特定分类场景,能够使目标分类模型的应用场景具有广泛性。

在一实施例中,如图3所示,步骤S201,即对训练图像进行增广处理,确定训练图像对应的第一增广图像和第二增广图像,包括:

S301:对训练图像进行强增广,得到训练图像对应的第一增广图像;

S302:对训练图像进行弱增广,得到训练图像对应的第二增广图像。

其中,强增广是指在对训练图像保留语义信息的前提下,对训练图像进行强度较高的增广处理。

作为一示例,步骤S301中,服务器对每一训练图像进行强增广,得到对每一训练图像进行强增广后得到的第一增广图像。例如,服务器采用随机采样策略在增强类别和增强强度方面对训练图像{N

其中,弱增广是指在对训练图像保留语义信息的前提下,对训练图像进行强度较低的增广处理。

作为一示例,步骤S302中,服务器对每一训练图像进行弱增广,得到对每一训练图像进行弱增广后得到的第二增广图像。例如,服务器对训练图像{N

本实施例所提供的图像分类模型生成方法,对训练图像进行强增广,得到训练图像对应的第一增广图像,对训练图像进行弱增广,得到训练图像对应的第二增广图像,便于后续基于第一增广图像和第二增广图像进行半监督的分类网络模型训练,提高模型的鲁棒性。

在一实施例中,如图4所示,步骤S202,即将第一增广图像和第二增广图像输入至分类网络模型,获取分类网络模型对应的第一损失函数值和第二损失函数值,包括:

S401:将第一增广图像和第二增广图像,分别输入至分类网络模型进行特征提取,获取第一增广图像对应的第一映射特征和第二增广图像对应的第二映射特征;

S402:根据第一增广图像对应的第一映射特征和第二增广图像对应的第二映射特征,得到分类网络模型对应的第一损失函数值;

S403:根据分类网络模型对应的第一损失函数值和第一增广图像对应的第一映射特征,确定分类网络模型对应的第二损失函数值。

其中,第一映射特征是指第一增广图像在分类网络模型中进行训练后,提取到的分类网络模型的映射特征。第二映射特征是指第二增广图像在分类网络模型中进行训练后,提取到的分类网络模型的映射特征。

作为一示例,步骤S401中,服务器将第一增广图像{N

作为一示例,步骤S402中,服务器在提取到第一增广图像对应的第一映射特征{Z

作为一示例,步骤S403中,服务器根据分类网络模型对应的第一损失函数值L

本实施例所提供的图像分类模型生成方法,根据第一映射特征和第二映射特征确定第一损失函数值,根据第一损失函数值和第一映射特征确定第二损失函数值,使后续基于第一损失函数值和第二损失函数值确定的目标损失函数值更加精确。

在一实施例中,如图5所示,步骤S402,即根据第一增广图像对应的第一映射特征和第二增广图像对应的第二映射特征,得到分类网络模型对应的第一损失函数值,包括:

S501:将每一训练图像对应的第一映射特征和第二映射特征,确定为正样本对;

S502:将每一训练图像对应的第一映射特征和第二映射特征中的任一个,与其他训练图像对应的第一映射特征和第二映射特征中的任一个组合,确定负样本对;

S503:基于正样本对和负样本对,计算分类网络模型的对比损失,得到第一损失函数值。

其中,正样本对为同一训练图像增广后的第一增广图像和第二增广图像分别输入至分类网络模型后,提取到的第一映射特征和第二映射特征。

作为一示例,步骤S501中,服务器将同一训练图像N

例如,对于N张训练图像:{N

其中,负样本对包括任一训练图像对应的第一映射特征与其余训练图像对应的第一映射特征,任一训练图像对应的第二映射特征与其余训练图像对应的第二映射特征,任一训练图像对应的第一映射特征与其余训练图像对应的第二映射特征以及任一训练图像对应的第二映射特征与其余训练图像对应的第一映射特征。

作为一示例,步骤S502中,服务器将每一训练图像对应的第一映射特征和第二映射特征中的任一个,与其他训练图像对应的第一映射特征和第二映射特征中的任一个组合,确定负样本对。本示例中,服务器将训练图像N

例如,对于N张训练图像:{N

作为一示例,步骤S503中,服务器在获取正样本对和负样本对之后,根据正样本对和负样本对计算分类模型的对比损失,得到第一损失函数值。本示例中,第一损失函数值L

其中,

其中,z

本示例中,获取第一损失函数值,便于后续基于第一损失函数值确定较为精确的目标损失函数值。

本实施例所提供的图像分类模型生成方法,确定正样本对和负样本对,基于正样本对和负样本对,计算分类模型的对比损失,得到第一损失函数值,减小相似性较高的正样本对之间的距离,增大相似度较低的映射特征之间的距离实现目标损失函数值的精确收敛,便于训练分类网络模型进行分类。

在一实施例中,如图6所示,步骤S403,即根据分类网络模型对应的第一损失函数值和第一增广图像对应的第一映射特征,确定分类网络模型对应的第二损失函数值,包括:

S601:对第一增广图像对应的第一映射特征进行预测,获取第一增广图像对应的预测标签值;

S602:根据第一增广图像对应的预测标签值和原始标签值,得到分类网络模型中每一分类任务对应的分类任务损失函数值;

S603:根据分类网络模型对应的第一损失函数值和每一分类任务对应的分类任务损失函数值,确定分类网络模型对应的第二损失函数值。

其中,预测标签值是指对第一映射特征进行分类预测得到的每一类别对应的预测值。

作为一示例,步骤S601中,服务器在分类网络模型中,对第一增广图像对应的第一映射特征进行预测,获取第一增广图像对应的预测标签值。可理解地,在对人脸图像进行多属性的分类预测场景中,可以对人脸图像进行多类别的分类预测,例如,将人脸图像作为训练图像,对人脸图像进行性别分类,得到预测标签值0或者1,代表预测结果为女生或者男生;对人脸图像进行年龄分类,可以得到不同人脸图像对应的不同年龄段的年龄值,作为预测标签值;对人脸图像进行表情分类,得到0、1或者2等预测标签值,代表开心、难过或者愤怒等表情。本示例中,服务器采用多层感知器对第一增广图像对应的第一映射特征进行预测,获取第一增广图像对应的每一分类任务的预测标签值y

其中,原始标签值是指预先标注的每一分类任务对应的标签值。分类任务是指对第一增广图像进行的多种属性的分类。可理解地,在人脸图像的分类预测领域,分类任务包括但不限于性别分类、年龄分类和情绪分类等多种属性的分类任务。

作为一示例,步骤S602中,服务器获取根据第一增广图像进行预测分类得到的预测标签值y

其中,L

作为一示例,步骤S603中,服务器在获取分类网络模型对应的第一损失函数值L

本实施例所提供的图像分类模型生成方法,根据第一增广图像对应的预测标签值和原始标签值,得到分类网络模型中每一分类任务对应的分类任务损失函数值,根据分类网络模型对应的第一损失函数值和每一分类任务对应的分类任务损失函数值,确定分类网络模型对应的第二损失函数值,同时考虑分类网络模型的对比学习损失以及分类预测损失,使得到的第二损失函数值更加符合分类网络模型的实际情况,更加精确。

在一实施例中,如图7所示,步骤S603,即根据分类网络模型对应的第一损失函数值和每一分类任务对应的分类任务损失函数值,确定分类网络模型对应的第二损失函数值,包括:

S701:采用每一分类任务对应的预设修正参数,对预设修正参数对应的分类任务的分类任务损失函数值进行加权,获取加权损失函数值;

S702:采用第一权重对第一损失函数值进行修正,得到第一修正损失函数值;

S703:采用第二权重对加权损失函数值进行修正,得到第二修正损失函数值;

S704:根据第一修正损失函数值和第二修正损失函数值,确定第二损失函数值。

其中,预设修正参数是指预先设置的用于修正对应类别分类任务的分类任务损失函数值的参数。可理解地,在人脸图像的分类预测场景中,性别分类对应的分类任务损失函数值对应一预设修正参数,年龄分类对应的分类任务损失函数值对应另一预设修正参数。加权损失函数值是指采用预设修正参数对相应的分类任务损失函数值进行修正,并对修正后的所有分类任务损失函数值求和后得到的损失函数值。

作为一示例,步骤S701,服务器获取每一分类任务对应的预设修正参数α

其中,m为分类任务的数量,例如,在人脸图像的分类预测场景中,对人脸图像进行性别、年龄和情绪三个属性的分类,则m=3。α

其中,

本示例中,根据预设修正参数对分类任务损失函数值进行加权,使得到的加权损失函数值较为精确。

其中,第一权重是用于修正第一损失函数值的修正参数。第一修正损失函数值是指采用第一权重对第一损失函数值进行修正后得到的损失函数值。

作为一示例,步骤S702,服务器采用第一权重γ对第一损失函数值L

其中,第二权重是用于修正第二损失函数值的修正参数。第二修正损失函数值是指采用第二权重对加权损失函数值进行修正后得到的损失函数值。

作为一示例,步骤S703,服务器采用第二权重β对加权损失函数值L

作为一示例,步骤S704,服务器根据第一修正损失函数值和第二修正损失函数值,确定第二损失函数值。本示例中,服务器将第一修正损失函数值γL

L

其中,γ是第一权重,β是第二权重。本示例中,γ+β=1。本示例中,根据第一修正损失函数值和第二修正损失函数值确定第二损失函数值,便于得到更加精确的第二损失函数值。

本实施例所提供的图像分类模型生成方法,对每一分类任务损失函数值进行加权,得到加权损失函数值,对加权损失函数值进一步修正得到第二修正损失函数值;对对比学习得到的第一损失函数值进行加权,得到第一修正损失函数值;根据第一修正损失函数值和第二修正损失函数值,确定第二损失函数值,该方法同时考虑每一分类任务对应的分类任务损失和对比学习损失,并对分类任务损失和对比学习损失进行修正,能够使得到的第二损失函数值更加符合训练的实际情况,便于后续基于第二损失函数值确定的目标损失函数值更加精确。

在一实施例中,如图8所示,步骤S203,即将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第三损失函数值,包括

S801:将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第一概率分布和带动量更新的分类网络模型对应的第二概率分布;

S802:根据第一概率分布和第二概率分布,获取分类网络模型对应的第三损失函数值。

其中,第一概率分布是指分类网络模型对第一增广图像进行训练时产生的分类结果对应的概率分布。第二概率分布是指带动量更新的分类网络模型对第一增广图像进行训练时产生的分类结果对应的概率分布。

作为一示例,步骤S801,服务器将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第一概率分布和带动量更新的分类网络模型对应的第二概率分布。本示例中,服务器将第一增广图像分别输入至分类网络模型和带动量更新的分类网络模型中,分类网络模型输出预测标签值后,统计得到每一分类任务中的预测标签值对应的概率分布p

作为一示例,步骤S802,服务器根据第一概率分布p

其中,w代表第w个分类任务,m为分类任务中的数量,v代表第w个分类任务中第v个预测标签值,r为第w个分类任务中预测标签值的数量。p

本实施例所提供的方法,获取分类网络模型对应的第一概率分布和带动量更新的分类网络模型对应的第二概率分布,并根据第一概率分布和第二概率分布,获取分类网络模型对应的第三损失函数值,便于根据第三损失函数值更新分类网络模型,使分类网络模型具有较好的鲁棒性。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种图像分类模型生成装置,该图像分类模型生成装置与上述实施例中图像分类模型生成方法一一对应。如图9所示,该图像分类模型生成装置包括增广图像确定模块901、第一和第二损失函数值获取模块902、第三损失函数值获取模块903、目标损失函数值确定模块904、模型参数更新模块905和目标分类模型确定模块906。各功能模块详细说明如下:

增广图像确定模块901,用于对训练图像进行增广处理,确定训练图像对应的第一增广图像和第二增广图像;

第一和第二损失函数值获取模块902,用于将第一增广图像和第二增广图像输入至分类网络模型,获取分类网络模型对应的第一损失函数值和第二损失函数值;

第三损失函数值获取模块903,用于将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第三损失函数值;

目标损失函数值确定模块904,用于根据分类网络模型对应的第一损失函数值、第二损失函数值和第三损失函数值,确定目标损失函数值;

模型参数更新模块905,用于在目标损失函数值未满足收敛条件时,更新分类网络模型的模型参数;

目标分类模型确定模块906,用于在目标损失函数值满足收敛条件时,将分类网络模型确定为目标分类模型。

在一实施例中,增广图像确定模块901包括:

强增广子模块,用于对训练图像进行强增广,得到训练图像对应的第一增广图像;

弱增广子模块,用于对训练图像进行弱增广,得到训练图像对应的第二增广图像。

在一实施例中,第一和第二损失函数值获取模块902包括:

映射特征获取子模块,用于将第一增广图像和第二增广图像,分别输入至分类网络模型进行特征提取,获取第一增广图像对应的第一映射特征和第二增广图像对应的第二映射特征;

第一损失函数值获取子模块,用于根据第一增广图像对应的第一映射特征和第二增广图像对应的第二映射特征,得到分类网络模型对应的第一损失函数值;

第二损失函数值获取子模块,用于根据分类网络模型对应的第一损失函数值和第一增广图像对应的第一映射特征,确定分类网络模型对应的第二损失函数值。

在一实施例中,第一损失函数值获取子模块包括:

正样本对确定单元,用于将每一训练图像对应的第一映射特征和第二映射特征,确定为正样本对;

负样本对确定单元,用于将每一训练图像对应的第一映射特征和第二映射特征中的任一个,与其他训练图像对应的第一映射特征和第二映射特征中的任一个组合,确定负样本对;

第一损失函数值确定单元,基于正样本对和负样本对,计算分类网络模型的对比损失,得到第一损失函数值。

在一实施例中,第二损失函数值获取子模块包括:

预测标签值获取单元,用于对第一增广图像对应的第一映射特征进行预测,获取第一增广图像对应的预测标签值;

分类任务损失函数值获取单元,用于根据第一增广图像对应的预测标签值和原始标签值,得到分类网络模型中每一分类任务对应的分类任务损失函数值;

第二损失函数值确定单元,用于根据分类网络模型对应的第一损失函数值和每一分类任务对应的分类任务损失函数值,确定分类网络模型对应的第二损失函数值。

在一实施例中,第二损失函数值确定单元包括:

加权损失函数值获取子单元,用于采用每一分类任务对应的预设修正参数,对预设修正参数对应的分类任务的分类任务损失函数值进行加权,获取加权损失函数值;

第一修正损失函数值获取子单元,用于采用第一权重对第一损失函数值进行修正,得到第一修正损失函数值;

第二修正损失函数值获取子单元,用于采用第二权重对加权损失函数值进行修正,得到第二修正损失函数值;

第二损失函数值确定子单元,用于根据第一修正损失函数值和第二修正损失函数值,确定第二损失函数值。

在一实施例中,第三损失函数值获取模块903包括:

概率分布获取子模块,用于将第一增广图像分别输入分类网络模型和带动量更新的分类网络模型中,获取分类网络模型对应的第一概率分布和带动量更新的分类网络模型对应的第二概率分布;

第三损失函数值获取子模块,用于根据第一概率分布和第二概率分布,获取分类网络模型对应的第三损失函数值。

关于图像分类模型生成装置的具体限定可以参见上文中对于方法的限定,在此不再赘述。上述图像分类模型生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储执行图像分类模型生成方法过程中采用或者生成的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种方法。

在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中方法,例如图2所示S201-S206,或者图3至图8中所示,为避免重复,这里不再赘述。或者,处理器执行计算机程序时实现图像分类模型生成装置这一实施例中的各模块/单元的功能,例如图9所示的增广图像确定模块901、第一和第二损失函数值获取模块902、第三损失函数值获取模块903、目标损失函数值确定模块904、模型参数更新模块905和目标分类模型确定模块906的功能,为避免重复,这里不再赘述。

在一实施例中,提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中方法,例如图2所示S201-S206,或者图3至图8中所示,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述图像分类模型生成装置这一实施例中的各模块/单元的功能,例如图9所示的增广图像确定模块901、第一和第二损失函数值获取模块902、第三损失函数值获取模块903、目标损失函数值确定模块904、模型参数更新模块905和目标分类模型确定模块906的功能,为避免重复,这里不再赘述。所述计算机可读存储介质可以是非易失性,也可以是易失性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

相关技术
  • 基于3D深度网络的无序分拣方法
  • 一种基于3D相机的无序分拣方法及系统
技术分类

06120116570874