掌桥专利:专业的专利平台
掌桥专利
首页

用于训练图像处理模型和检测图像的方法、装置

文献发布时间:2023-06-19 11:35:49


用于训练图像处理模型和检测图像的方法、装置

技术领域

本公开涉及人工智能技术领域,特别涉及计算机视觉技术和深度学习技术。

背景技术

知识蒸馏(Knowledge Distillation,KD)是模型压缩的一种常用的方法。它是指将教师网络(teacher network)的知识迁移到学生网络(student network)上,使得学生网络的性能表现如教师网络一般。

发明内容

提供了一种用于训练图像处理模型和检测图像的方法、装置、电子设备以及存储介质。

根据第一方面,提供了一种用于训练图像处理模型的方法,该方法包括:获取至少两个第一局部特征和对应的至少两个第二局部特征,其中,第一局部特征基于预先训练的第一图像处理模型针对目标图像中的第一目标区域进行特征提取得到,第二局部特征基于与第一图像处理模型对应的待训练的第二图像处理模型针对目标图像中的第二目标区域进行特征提取得到;将至少两个第一局部特征和对应的至少两个第二局部特征分别输入至相应的待训练的局部关系提取模型,生成第一局部关系特征和第二局部关系特征,其中,第一局部关系特征用于表征至少两个第一局部特征之间的关联关系,第二局部关系特征用于表征至少两个第二局部特征之间的关联关系;利用预设的损失函数,基于第一局部关系特征和第二局部关系特征生成损失值;基于所生成的损失值调整待训练的第二图像处理模型和待训练的局部关系提取模型的网络参数,得到训练完成的第二图像处理模型。

根据第二方面,提供了一种用于检测图像的方法,该方法包括:获取待检测图像;将待检测图像输入至预先训练的图像处理模型,生成与待检测图像对应的对象检测结果,其中,图像处理模型通过如第一方面中任一实现方式所描述的方法训练得到。

根据第三方面,提供了一种用于训练图像处理模型的装置,该装置包括:局部特征获取单元,被配置成获取至少两个第一局部特征和对应的至少两个第二局部特征,其中,第一局部特征基于预先训练的第一图像处理模型针对目标图像中的第一目标区域进行特征提取得到,第二局部特征基于与第一图像处理模型对应的待训练的第二图像处理模型针对目标图像中的第二目标区域进行特征提取得到;关系特征生成单元,被配置成将至少两个第一局部特征和对应的至少两个第二局部特征分别输入至相应的待训练的局部关系提取模型,生成第一局部关系特征和第二局部关系特征,其中,第一局部关系特征用于表征至少两个第一局部特征之间的关联关系,第二局部关系特征用于表征至少两个第二局部特征之间的关联关系;损失值生成单元,被配置成利用预设的损失函数,基于第一局部关系特征和第二局部关系特征生成损失值;参数调整单元,被配置成基于所生成的损失值调整待训练的第二图像处理模型和待训练的局部关系提取模型的网络参数,得到训练完成的第二图像处理模型。

根据第四方面,提供了一种用于检测图像的装置,该装置包括:图像获取单元,被配置成获取待检测图像;检测单元,被配置成将待检测图像输入至预先训练的图像处理模型,生成与待检测图像对应的对象检测结果,其中,图像处理模型通过如第一方面中任一实现方式所描述的方法训练得到。

根据第五方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,存储器存储有可被上述至少一个处理器执行的指令,上述指令被至少一个处理器执行,以使上述至少一个处理器能够执行如第一方面和第二方面中任一实现方式所描述的方法。

根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机能够执行如第一方面和第二方面中任一实现方式所描述的方法。

根据第七方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序在被处理器执行时能够实现如第一方面和第二方面中任一实现方式所描述的方法。

根据本公开的技术实现了通过局部关系提取模型建立目标图像中不同区域所呈现的对象的特征之间的关联关系,并通过对第一图像处理模型对应的第一局部关系特征与待训练的第二图像处理模型对应的第二局部关系特征之间的监督训练第二图像处理模型。从而可以使得作为知识蒸馏中的学生网络的第二图像处理模型更好地学习到作为教师网络的第一图像处理模型对目标图像中各局部特征之间的关联关系的理解能力,弥补了由于现有技术中应用于图像检测任务的知识蒸馏缺乏对检测任务中多目标之间的关联关系的表征能力而造成的不足,从而有效提升应用于图像检测任务的知识蒸馏效果。进而,提升了作为学生网络的图像处理模型的图像检测准确性和效率,并且为高性能、小规模网络的轻量化部署提供技术基础,使得图像处理模型的应用不必受到高性能硬件的严格限制成为可能。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1a、图1b、图1c、图1d、图1e是根据本公开第一实施例的示意图;

图2是根据本公开第二实施例的示意图;

图3是可以实现本公开实施例的用于训练图像处理模型的方法的一个应用场景的示意图;

图4是根据本公开实施例的用于训练图像处理模型的装置的示意图;

图5是根据本公开实施例的用于检测图像的装置的示意图;

图6是用来实现本公开实施例的用于检测图像的方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1a是示出了根据本公开第一实施例的示意图100。该用于训练图像处理模型的方法包括以下步骤:

S101,获取至少两个第一局部特征和对应的至少两个第二局部特征。

在本实施例中,用于训练图像处理模型的方法的执行主体可以通过各种方式获取至少两个第一局部特征和对应的至少两个第二局部特征。其中,上述第一局部特征可以基于预先训练的第一图像处理模型针对目标图像中的第一目标区域进行特征提取得到。上述第二局部特征可以基于与上述第一图像处理模型对应的待训练的第二图像处理模型针对上述目标图像中的第二目标区域进行特征提取得到。

在本实施例中,作为示例,上述执行主体可以从本地获取上述至少两个第一局部特征和对应的至少两个第二局部特征。作为又一示例,上述执行主体可以从通信连接的电子设备(例如用于特征提取的电子设备)获取上述至少两个第一局部特征和对应的至少两个第二局部特征。

需要说明的是,上述第一图像处理模型可以是知识蒸馏中的复杂模型,上述待训练的第二图像处理模型可以是知识蒸馏中与上述第一图像处理模型对应的简化模型。

还需要说明的是,上述第一目标区域和第二目标区域通常相互匹配。作为示例,上述第一目标区域和第二目标区域可以是上述目标图像中的相同区域,也可以是位置相差小于预设阈值的区域。上述第一局部特征和对应的第二局部特征的数目通常一致。

S102,将至少两个第一局部特征和对应的至少两个第二局部特征分别输入至相应的待训练的局部关系提取模型,生成第一局部关系特征和第二局部关系特征。

在本实施例中,上述执行主体可以通过各种方式将步骤S101所获取的至少两个第一局部特征和对应的至少两个第二局部特征分别输入至相应的待训练的局部关系提取模型,生成第一局部关系特征和第二局部关系特征。其中,上述第一局部关系特征可以用于表征上述至少两个第一局部特征之间的关联关系。上述第二局部关系特征可以用于表征上述至少两个第二局部特征之间的关联关系。

在本实施例中,由于上述第一局部特征和第二局部特征分别基于预先训练的第一图像处理模型和对应的待训练的第二图像处理模型针对目标图像中匹配的区域进行特征提取而得到,因此,上述第一局部特征和第二局部特征可以用于表征上述目标图像中某区域所呈现的对象。从而,上述第一局部关系特征可以用于表征上述至少两个第一局部特征所指示的目标图像中不同区域所呈现的对象之间的关联关系。同理,上述第二局部关系特征可以用于表征上述至少两个第二局部特征所指示的目标图像中不同区域所呈现的对象之间的关联关系。

在本实施例中,上述第一图像处理模型和与上述第一图像处理模型对应的待训练的第二图像处理模型可以各自对应有待训练的局部关系提取模型。通常,上述各自对应的局部关系提取模型的结构一致。上述各自对应的局部关系提取模型的网络参数的初始值可以相同,也可以不同。

S103,利用预设的损失函数,基于第一局部关系特征和第二局部关系特征生成损失值。

在本实施例中,上述执行主体可以利用预设的损失函数,基于步骤S103所生成的第一局部关系特征和第二局部关系特征生成损失值。其中,上述损失函数可以包括各种可以用于监督知识蒸馏过程的损失函数,例如L2损失函数。

S104,基于所生成的损失值调整待训练的第二图像处理模型和待训练的局部关系提取模型的网络参数,得到训练完成的第二图像处理模型。

在本实施例中,基于所生成的损失值,上述执行主体可以通过各种方式调整待训练的第二图像处理模型和待训练的局部关系提取模型的网络参数,得到训练完成的第二图像处理模型。作为示例,上述执行主体可以通过反向传播(back propagation)方法调整上述待训练的第二图像处理模型和待训练的局部关系提取模型的网络参数。经过预设迭代轮数等达到训练停止条件后,上述执行主体可以将参数调整后的第二图像处理模型确定为训练完成的第二图像处理模型。

本公开的上述实施例提供的方法,通过局部关系提取模型建立目标图像中不同区域所呈现的对象的特征之间的关联关系,并通过对第一图像处理模型对应的第一局部关系特征与待训练的第二图像处理模型对应的第二局部关系特征之间的监督训练第二图像处理模型。从而可以使得作为知识蒸馏中的学生网络的第二图像处理模型更好地学习到作为教师网络的第一图像处理模型对目标图像中各局部特征之间的关联关系的理解能力,弥补了由于现有技术中应用于图像检测任务的知识蒸馏缺乏对检测任务中多目标之间的关联关系的表征能力而造成的不足,从而有效提升应用于图像检测任务的知识蒸馏效果。进而,提升了作为第二图像处理模型的图像处理模型的图像检测准确性和效率,并且为高性能、小规模网络的轻量化部署提供技术基础,使得图像处理模型的应用不必受到高性能硬件的严格限制成为可能。

在本实施例的一些可选的实现方式中,上述执行主体可以按照如下步骤将至少两个第一局部特征和对应的至少两个第二局部特征分别输入至相应的待训练的局部关系提取模型,生成第一局部关系特征和第二局部关系特征:

第一步,执行以下生成步骤:分别从至少两个第一局部特征和至少两个第二局部特征中选取未被选取过的第一局部特征对和第二局部特征对;生成分别与所选取的第一局部特征对和第二局部特征对对应的第一局部子关系特征和第二局部子关系特征;分别确定至少两个第一局部特征和至少两个第二局部特征中是否存在未被选取过的第一局部特征对和第二局部特征对。

在这些实现方式中,上述执行主体可以执行如上述的生成步骤。上述生成步骤可以包括以下子步骤:

子步骤1,从上述步骤S101获取的至少两个第一局部特征中选取未被选取过的第一局部特征对;以及从上述步骤S101获取的至少两个第二局部特征中选取未被选取过的第二局部特征对;

子步骤2,生成与所选取的第一局部特征对对应的第一局部子关系特征;以及生成与所选取的第二局部特征对对应的第二局部子关系特征;

子步骤3,确定上述步骤S101获取的至少两个第一局部特征中是否存在未被选取过的第一局部特征对;以及确定上述步骤S101获取的至少两个第二局部特征中是否存在未被选取过的第二局部特征对。

在这些实现方式中,上述第一局部子关系特征的数目通常不小于所选取的第一局部特征对的数目。作为示例,当不考虑两者的顺序时,上述第一局部子关系特征的数目可以与所选取的第一局部特征对的数目一致。可选地,上述第一局部子关系特征的数目也可以不大于所选取的第一局部特征对的数目的二倍。作为示例,当考虑两者的顺序时,例如图像中的人对马的影响与马对人的影响不同,则一个第一局部特征对可以对应有两个第一局部子关系特征。第二局部子关系特征的关系也同理可知。

第二步,响应于确定存在,继续执行上述生成步骤。

在这些实现方式中,响应于确定上述子步骤3的确定结果用于指示存在,上述执行主体可以继续执行包括上述子步骤1至子步骤3的生成步骤。从而,本方案中所生成的第一局部子关系特征可以用于表征所获取的第一局部特征中任两个第一局部特征之间的关联关系。同理,本方案中所生成的第二局部子关系特征可以用于表征所获取的第二局部特征中任两个第二局部特征之间的关联关系。

第三步,基于所生成的第一局部子关系特征之间的结合,生成第一局部关系特征。

在这些实现方式中,基于上述第二步所生成的第一局部子关系特征之间的结合,上述执行主体可以通过各种方式生成第一局部关系特征。作为示例,上述执行主体可以将所生成的第一局部子关系特征进行加权求和,以生成第一局部关系特征。作为又一示例,上述执行主体可以将所生成的第一局部子关系特征进行连接,以生成第一局部关系特征。

第四步,基于所生成的第二局部子关系特征之间的结合,生成第二局部关系特征。

在这些实现方式中,基于上述第二步所生成的第二局部子关系特征之间的结合,上述执行主体可以通过各种方式生成第二局部关系特征。作为示例,上述执行主体可以将所生成的第二局部子关系特征进行加权求和,以生成第二局部关系特征。作为又一示例,上述执行主体可以将所生成的第二局部子关系特征进行连接,以生成第二局部关系特征。

基于上述可选的实现方式,本方案可以通过循环执行前述生成步骤,分别为所获取的第一局部特征中的任两个第一局部特征和第二局部特征中的任两个第二局部特征生成对应的第一局部子关系特征和第二局部子关系特征,进而生成第一局部关系特征和第二局部关系特征。从而可以更加全面、细致地表征不同局部特征之间的关联关系,为知识蒸馏效果的提升提供基础。

可选地,基于上述第一步所描述的实现方式,参见图1b和图1c,上述待训练的局部关系提取模型的网络参数可以包括第一权重。上述第一局部特征对和第二局部特征对中可以分别包括第一局部特征和第二局部特征。上述执行主体可以按照如下步骤生成分别与所选取的第一局部特征对和第二局部特征对对应的第一局部子关系特征和第二局部子关系特征:

S1,基于所选取的第一局部特征对中的第一局部特征和所选取的第二局部特征对中的第一局部特征分别与相应的待训练的局部关系提取模型的第一权重的乘积,生成第一局部预处理特征和第二局部预处理特征。

在这些实现方式中,上述第一权重可以在训练过程中进行调整。

S2,基于所选取的第一局部特征对中的第一局部特征与第二局部特征的点积以及所选取的第二局部特征对中的第一局部特征和第二局部特征的点积,分别生成第一预处理特征和第二预处理特征。

S3,基于第一局部预处理特征与第一预处理特征的矩阵乘积以及第二局部预处理特征与第二预处理特征的矩阵乘积,生成分别与所选取的第一局部特征对对应的第一局部子关系特征和与所选取的第二局部特征对对应的第二局部子关系特征。

基于上述可选的实现方式,本方案提供了一种考虑一个局部特征所指示的对象(例如图像中的马)对另一个局部特征所指示的对象(例如图像中的骑马的人)的影响的特征生成方式,从而可以更加全面、细致地表征不同局部特征之间的相互影响关系,为知识蒸馏效果的提升提供基础。

可选地,基于上述步骤S2所描述的实现方式,参见图1d和图1e,上述待训练的局部关系提取模型的网络参数还可以包括第二权重和第三权重。基于所选取的第一局部特征对中的第一局部特征的点积以及所选取的第二局部特征对中的第一局部特征与第二局部特征的点积,上述执行主体可以按照如下步骤分别生成第一预处理特征和第二预处理特征:

S21,基于所选取的第一局部特征对中的第一局部特征和所选取的第二局部特征对中的第一局部特征分别与相应的待训练的局部关系提取模型的第二权重的乘积,生成第一前子特征和第二前子特征。

S22,基于所选取的第一局部特征对中的第二局部特征和所选取的第二局部特征对中的第二局部特征分别与相应的待训练的局部关系提取模型的第三权重的乘积,生成第一后子特征和第二后子特征。

在这些实现方式中,上述第二权重和第三权重可以在训练过程中进行调整。

S23,分别将第一前子特征与第一后子特征的点积和第二前子特征与第二后子特征的点积输入归一化指数函数,分别生成第一预处理特征和第二预处理特征。

基于上述可选的实现方式,本方案提供了另一种考虑一个局部特征所指示的对象(例如图像中的马)对另一个局部特征所指示的对象(例如图像中的骑马的人)的影响的特征生成方式,从而丰富了不同局部特征之间的相互影响关系,进而为知识蒸馏效果的提升提供基础。

在本实施例的一些可选的实现方式中,上述执行主体可以按照如下步骤获取至少两个第一局部特征和对应的至少两个第二局部特征:

第一步,获取第一图像处理模型和待训练的第二图像处理模型分别针对目标图像的特征图。

在这些实现方式中,上述执行主体可以通过各种方式获取第一图像处理模型和待训练的第二图像处理模型分别针对目标图像的特征图。作为示例,上述执行主体可以将上述目标图像分别输入上述第一图像处理模型和待训练的第二图像处理模型,得到上述第一图像处理模型和待训练的第二图像处理模型分别针对目标图像的特征图。

第二步,利用边界框回归(Bounding-Box Regression)技术,生成待训练的第二图像处理模型对应的特征图所对应的至少两个候选框的坐标信息。

在这些实现方式中,上述候选框通常用于指示所检测到的目标的位置。上述目标可以相同(例如多只猫),也可以不同(例如马、牛、人等)。

第三步,根据所生成的坐标信息,生成至少两个掩膜(mask)。

在这些实现方式中,上述掩膜可以与上述候选框的坐标信息相对应。作为示例,上述所生成的掩膜可以与上述候选框一一对应。

第四步,根据所生成的掩膜,从所获取的特征图中分别提取至少两个第一局部特征和对应的至少两个第二局部特征。

在这些实现方式中,上述执行主体可以利用上述第三步所生成的掩膜从所获取的第一图像处理模型针对目标图像的特征图和待训练的第二图像处理模型针对目标图像的特征图中分别提取至少两个第一局部特征和对应的至少两个第二局部特征。作为示例,上述每个掩膜可以与一个所提取的第一局部特征和一个所提取的第二局部特征相对应。

基于上述可选的实现方式,本方案可以利用待训练的第二图像处理模型所生成的候选框的坐标信息从第一图像处理模型和上述第二图像处理模型分别对应的特征图中提取第一局部特征和第二局部特征,从而丰富了第一局部特征和第二局部特征的生成方式,并且通过候选框的坐标信息建立与后续根据第一局部关系特征和第二局部关系特征生成的损失值之间的关联,使得作为学生网络的第二图像处理模型的训练更加具有针对性,有助于提升知识蒸馏的效果,从而提升图像处理模型的检测准确率和速度。

继续参见图2,图2是根据本公开第二实施例的示意图200。该用于检测图像的方法包括以下步骤:

S201,获取待检测图像。

在本实施例中,用于优化位置信息的方法的执行主体可以通过各种方式获取待检测图像。其中,上述待检测图像中通常可以包括至少两个可检测对象。上述可检测对象可以相同(例如多匹马),也可以不同(例如人和马),在此不作限定。

在本实施例中,作为示例,上述执行主体可以从本地或通信连接的电子设备获取上述待检测图像。

S202,将待检测图像输入至预先训练的图像处理模型,生成与待检测图像对应的对象检测结果。

在本实施例中,上述执行主体可以将上述步骤S201所获取的待检测图像输入至预先训练的图像处理模型,生成与待检测图像对应的对象检测结果。其中,上述图像处理模型可以通过如前述实施例中任一实现方式所描述的方法训练得到。上述对象检测结果可以用于指示上述待检测图像中包含的可检测对象。作为示例,上述对象检测结果可以为“人骑马”。

从图2中可以看出,本实施例中的用于检测图像的方法的流程200体现了利用预先训练的图像处理模型进行图像中的对象检测的步骤。由此,本实施例描述的方案可以实现将复杂网络压缩为结构更为简化的网络,同时保证较好的图像检测性能,从而为模型的应用部署和检测速度的提升提供技术基础,进而提升图像中对象检测的检测准确率和速度。

继续参见图3,图3是根据本公开的实施例的用于训练图像处理模型的方法的应用场景的一个示意图。在图3的应用场景中,技术人员可以将至少两个第一局部特征和对应的至少两个第二局部特征301输入服务器(图中未示出)。其中,上述至少两个第一局部特征和对应的至少两个第二局部特征301可以分别基于第一图像处理模型3011和第二图像处理模型3012对骑马图像3013进行特征提取得到。上述服务器可以将上述至少两个第一局部特征和对应的至少两个第二局部特征301分别输入相应的待训练的局部关系提取模型3021、3022,生成作为第一局部关系特征的“人&马关系特征”3031和作为第二局部关系特征的“人&马关系特征”3032。利用预设的损失函数304,上述服务器可以基于根据第一局部关系特征3031和第二局部关系特征3032生成的损失值调整第一图像处理模型3012和待训练的局部关系提取模型3021、3022的网络参数。

目前,现有技术之一通常是直接对图像整理提取特征以作为知识蒸馏的依据,导致现有的蒸馏算法在解决图像检测任务的蒸馏问题时往往效果不佳。而本公开的上述实施例提供的方法,通过局部关系提取模型建立目标图像中不同区域所呈现的对象的特征之间的关联关系,并通过对第一图像处理模型对应的第一局部关系特征与待训练的第二图像处理模型对应的第二局部关系特征之间的监督训练第二图像处理模型。从而可以使得作为知识蒸馏中的学生网络的第二图像处理模型更好地学习到作为教师网络的第一图像处理模型对目标图像中各局部特征之间的关联关系的理解能力,弥补了由于现有技术中应用于图像检测任务的知识蒸馏缺乏对检测任务中多目标之间的关联关系的表征能力而造成的不足,从而有效提升应用于图像检测任务的知识蒸馏效果。进而,提升了作为学生网络的图像处理模型的图像检测准确性和效率,并且为高性能、小规模网络的轻量化部署提供技术基础,使得图像处理模型的应用不必受到高性能硬件的严格限制成为可能。

进一步参考图4,作为对上述各图所示方法的实现,本公开提供了用于训练图像处理模型的装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图4所示,本实施例提供的用于训练图像处理模型的装置400包括局部特征获取单元401、关系特征生成单元402、损失值生成单元403和参数调整单元404。其中,局部特征获取单元401,被配置成获取至少两个第一局部特征和对应的至少两个第二局部特征,其中,第一局部特征基于预先训练的第一图像处理模型针对目标图像中的第一目标区域进行特征提取得到,第二局部特征基于与第一图像处理模型对应的待训练的第二图像处理模型针对目标图像中的第二目标区域进行特征提取得到;关系特征生成单元402,被配置成将至少两个第一局部特征和对应的至少两个第二局部特征分别输入至相应的待训练的局部关系提取模型,生成第一局部关系特征和第二局部关系特征,其中,第一局部关系特征用于表征至少两个第一局部特征之间的关联关系,第二局部关系特征用于表征至少两个第二局部特征之间的关联关系;损失值生成单元403,被配置成利用预设的损失函数,基于第一局部关系特征和第二局部关系特征生成损失值;参数调整单元404,被配置成基于所生成的损失值调整待训练的第二图像处理模型和待训练的局部关系提取模型的网络参数,得到训练完成的第二图像处理模型。

在本实施例中,用于训练图像处理模型的装置400中:局部特征获取单元401、关系特征生成单元402、损失值生成单元403和参数调整单元404的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤S101、S102、S103和S104的相关说明,在此不再赘述。

在本实施例的一些可选的实现方式中,上述关系特征生成单元402可以包括:生成子单元(图中未示出),被配置成执行以下生成步骤:分别从至少两个第一局部特征和至少两个第二局部特征中选取未被选取过的第一局部特征对和第二局部特征对;生成分别与所选取的第一局部特征对和第二局部特征对对应的第一局部子关系特征和第二局部子关系特征;分别确定至少两个第一局部特征和至少两个第二局部特征中是否存在未被选取过的第一局部特征对和第二局部特征对;循环子单元(图中未示出),被配置成响应于确定存在,继续执行上述生成步骤;第一关系特征生成子单元(图中未示出),被配置成基于所生成的第一局部子关系特征之间的结合,生成第一局部关系特征;第二关系特征生成子单元(图中未示出),被配置成基于所生成的第二局部子关系特征之间的结合,生成第二局部关系特征。

在本实施例的一些可选的实现方式中,上述待训练的局部关系提取模型的网络参数可以包括第一权重。上述第一局部特征对和第二局部特征对中可以分别包括第一局部特征和第二局部特征。上述生成子单元可以包括:第一生成模块(图中未示出),被配置成基于所选取的第一局部特征对中的第一局部特征和所选取的第二局部特征对中的第一局部特征分别与相应的待训练的局部关系提取模型的第一权重的乘积,生成第一局部预处理特征和第二局部预处理特征;第二生成模块(图中未示出),被配置成基于所选取的第一局部特征对中的第一局部特征与第二局部特征的点积以及所选取的第二局部特征对中的第一局部特征与第二局部特征的点积,分别生成第一预处理特征和第二预处理特征;第三生成模块(图中未示出),被配置成基于第一局部预处理特征与第一预处理特征的矩阵乘积以及第二局部预处理特征与第二预处理特征的矩阵乘积,生成分别与所选取的第一局部特征对对应的第一局部子关系特征和与所选取的第二局部特征对对应的第二局部子关系特征。

在本实施例的一些可选的实现方式中,上述待训练的局部关系提取模型的网络参数还可以包括第二权重和第三权重。上述第二生成模块可以进一步被配置成:基于所选取的第一局部特征对中的第一局部特征和所选取的第二局部特征对中的第一局部特征分别与相应的待训练的局部关系提取模型的第二权重的乘积,生成第一前子特征和第二前子特征;基于所选取的第一局部特征对中的第二局部特征和所选取的第二局部特征对中的第二局部特征分别与相应的待训练的局部关系提取模型的第三权重的乘积,生成第一后子特征和第二后子特征;分别将第一前子特征与第一后子特征的点积和第二前子特征与第二后子特征的点积输入归一化指数函数,分别生成第一预处理特征和第二预处理特征。

在本实施例的一些可选的实现方式中,上述局部特征获取单元401可以进一步被配置成:获取第一图像处理模型和待训练的第二图像处理模型分别针对目标图像的特征图;利用边界框回归技术,生成待训练的第二图像处理模型对应的特征图所对应的至少两个候选框的坐标信息;根据所生成的坐标信息,生成至少两个掩膜;根据所生成的掩膜,从所获取的特征图中分别提取至少两个第一局部特征和对应的至少两个第二局部特征。

本公开的上述实施例提供的装置,通过关系特征生成单元402利用局部关系提取模型建立局部特征获取单元401所获取的用于指示目标图像中不同区域所呈现的对象的特征之间的关联关系,并通过参数调整单元404利用损失值生成单元403所生成的、用于指示第一图像处理模型对应的第一局部关系特征与待训练的第二图像处理模型对应的第二局部关系特征之间差异的损失值训练第二图像处理模型。从而可以使得作为知识蒸馏中的学生网络的第二图像处理模型更好地学习到作为教师网络的第一图像处理模型对目标图像中各局部特征之间的关联关系的理解能力,弥补了由于现有技术中应用于图像检测任务的知识蒸馏缺乏对检测任务中多目标之间的关联关系的表征能力而造成的不足,从而有效提升应用于图像检测任务的知识蒸馏效果。进而,提升了作为学生网络的图像处理模型的图像检测准确性和效率,并且为高性能、小规模网络的轻量化部署提供技术基础,使得图像处理模型的应用不必受到高性能硬件的严格限制成为可能。

进一步参考图5,作为对上述各图所示方法的实现,本公开提供了用于检测图像的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图5所示,本实施例提供的用于检测图像的装置500包括图像获取单元501和检测单元502。其中,图像获取单元501,被配置成获取待检测图像;检测单元502,被配置成将待检测图像输入至预先训练的图像处理模型,生成与待检测图像对应的对象检测结果,其中,图像处理模型通过如前述实施例中任一实现方式所描述的用于训练图像处理模型的方法训练得到。

在本实施例中,用于检测图像的装置500中:图像获取单元501和检测单元502的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤S201和S202的相关说明,在此不再赘述。

本公开的上述实施例提供的装置,通过利用预先训练的作为学生网络的图像处理模型进行图像中的对象检测,可以实现将复杂网络压缩为结构更为简化的网络,同时保证较好的图像检测性能,从而为模型的应用部署和检测速度的提升提供技术基础。进而,提升了作为学生网络的图像处理模型的图像检测准确性和效率,并且为高性能、小规模网络的轻量化部署提供技术基础,使得图像处理模型的应用不必受到高性能硬件的严格限制成为可能。

本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元606加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如用于训练图像处理模型网络的方法或用于检测图像的方法。例如,在一些实施例中,用于训练图像处理模型的方法或用于检测图像的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的用于训练图像处理模型的方法或用于检测图像的方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行用于训练图像处理模型的方法或用于检测图像的方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 用于训练图像处理模型和检测图像的方法、装置
  • 图像处理模型训练方法、图像处理方法及图像处理装置
技术分类

06120112985172