一种分类模型可迁移性确定方法、装置、设备及存储介质
文献发布时间:2024-04-18 19:58:21
技术领域
本发明涉及分类模型可迁移性评估领域,特别涉及一种分类模型可迁移性确定方法、装置、设备及存储介质。
背景技术
模型可迁移性评估旨在验证已训练好的分类模型在不同领域、任务或数据集中的适应性和泛化能力。分类模型的可迁移性越高则可以认为在新任务中的性能越好。现有技术中对于模型可迁移性的评估是通过直接迁移的方法,将分类模型直接应用到需要分类的新任务中,通过测试准确率和计算评估指标来评估其性能,因为需要计算全部新任务数据,效率较低且耗费计算资源。
发明内容
本发明的目的在于提供一种分类模型可迁移性确定方法、装置、设备及存储介质,应用于分类模型可迁移性评估领域,该方法通过确定分类模型中各类别图像的类别相关卷积核,进而获取各类别图像的特征向量,通过特征向量计算各类别之间的可分离度来评估可迁移性,相比于将新任务数据全部输入分类模型,根据测试结果评估其可迁移性,本发明方法降低了评估时间,节省了计算资源。
为解决上述技术问题,本发明提供一种分类模型可迁移性确定方法,包括:
确定目标任务集中各目标类别的类别相关卷积核;
通过所述类别相关卷积核计算所述目标任务集中图像的特征向量;
根据所述特征向量计算各所述目标类别的类别可分离度;
根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值;
基于所述可迁移数值确定所述分类模型的可迁移性。
可选的,所述确定目标任务集中各目标类别的类别相关卷积核,包括:
从所述目标任务集的各类别图像中选取预设数量的图像构建类别图像集;
计算所述类别图像集在各卷积层的特征图;
根据所述特征图计算各卷积核对所述目标类别的重要度系数;
基于所述重要度系数确定所述目标类别的所述类别相关卷积核。
可选的,所述确定目标任务集中各目标类别的类别相关卷积核,包括:
从目标任务集的各类别图像中选取预设数量的图像构建类别图像集;
计算所述类别图像集在各卷积层的特征图;
根据所述特征图计算各卷积核对所述目标类别的重要度系数;
基于所述重要度系数确定所述目标类别的所述类别相关卷积核。
可选的,所述根据所述特征图计算各卷积核对所述目标类别的重要度系数,包括:
计算预测类别对所述特征图的一阶微分;
将所述一阶微分输入第一模型计算所述卷积核的所述重要度系数,所述第一模型的表达式为:
其中,
可选的,所述根据所述特征向量计算各所述目标类别的类别可分离度,包括:
计算各所述目标类别所包含图像的所述特征向量的均值与方差;
根据所述均值与所述方差计算各所述目标类别之间的Bhattacharyya系数。
可选的,所述计算各所述目标类别所包含图像的所述特征向量的均值与方差,包括:
将各所述目标类别所包含图像的所述特征向量输入第二模型计算所述均值与所述方差,所述第二模型的表达式为:
其中,μ
可选的,所述根据所述均值与所述方差计算各所述目标类别之间的Bhattacharyya系数,包括:
判断所述目标任务集中各所述目标类别是否均服从高斯分布;
若是,根据所述均值与所述方差计算各所述目标类别的高斯分布,将所述高斯分布输入第三模型计算各所述目标类别的所述Bhattacharyya系数,所述第三模型的表达式为:
其中,BC(q
若否,将所述均值与所述方差输入第四模型计算各所述目标类别的Bhattacharyya距离,根据所述Bhattacharyya距离计算各所述目标类别的所述Bhattacharyya系数,所述第四模型的表达式为:
其中,BD(q
可选的,所述根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值,包括:
将所述Bhattacharyya系数输入第五模型计算所述可迁移数值,所述第五模型的表达式为:
其中,BC(q
为解决上述技术问题,本发明提供一种分类模型可迁移性确定装置,包括:
第一模块,用于确定目标任务集中各目标类别的类别相关卷积核;
第二模块,用于通过所述类别相关卷积核计算所述目标任务集中图像的特征向量;
第三模块,用于根据所述特征向量计算各所述目标类别的类别可分离度;
第四模块,用于根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值;
第五模块,用于基于所述可迁移数值确定所述分类模型的可迁移性。
为解决上述技术问题,本发明提供一种分类模型可迁移性确定方法设备,包括:
存储器,用于储存计算机程序;
处理器,用于执行所述计算机程序时实现任一项所述分类模型可迁移性确定方法。
为解决上述技术问题,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,实现任一项所述分类模型可迁移性确定方法。
可见,本发明方法通过确定分类模型中各类别图像的类别相关卷积核,进而获取各类别图像的特征向量,通过特征向量计算各类别之间的可分离度来评估可迁移性,相比于将新任务数据全部输入分类模型,根据测试结果评估其可迁移性,本发明方法降低了评估时间,节省了计算资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种分类模型可迁移性确定方法的流程图;
图2为本发明实施例所提供的一种确定类别相关卷积核的示意图;
图3为本发明实施例所提供的一种提取特征向量的示意图;
图4为本发明实施例所提供的一种分类模型可迁移性确定装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合图1,图1为本发明实施例所提供的一种分类模型可迁移性确定方法的流程图,该方法可以包括:
S101:确定目标任务集中各目标类别的类别相关卷积核。
模型可迁移性评估旨在验证已训练好的分类模型在不同领域、任务或数据集中的适应性和泛化能力。本实施例可以确定目标任务集中各目标类别的类别相关卷积核,对于分类任务,某一特定类别往往只与部分具体的卷积核之间存在高相关性,我们称这类卷积核为类别相关卷积核。相对于使用全部卷积核,通过应用类别相关卷积核,可以获得更加精准的输入图像的特征图。
本实施例并不限定确定各目标类别的类别相关卷积核的具体方式,一般来说,其整体流程可以如图2所示,假设一个输入图像x在网络中第(r-1)层的特征图表示为
其中,
本实施例中的预测类别指的是分类模型对图像的预测的类别,目标类别为图像的真实类别。本实施例中的预测类别可以由该图像输入分类模型的输出值来确定,例如,当第二个预测类别
本实施例可以从目标任务集的各目标类别的图像中选取预设数量的图像来构建类别图像集,进而计算类别图像集中每个图像在各卷积层的特征图。对于预测类别
其中,
根据一阶微分可以进一步计算各卷积核对各目标类别的重要度系数,具体可以将一阶微分输入第一模型计算卷积核的重要度系数,第一模型的表达式为:
其中,
本实施例并不限定根据重要度系数确定类别相关卷积核的具体操作,在本实施例中可以设置重要度系数阈值,当重要度系数
S102:通过类别相关卷积核计算目标任务集中图像的特征向量。
在确定完每个目标类别的类别相关卷积核之后,可以将目标任务集中各目标类别的图像经对应类别相关卷积核输出其特征图,进一步通过特征图提取特征向量,其流程可以如图3所示,假设图像x所对应类别在最后一层卷积层中包含K个类别相关卷积核,则图像x最后一层的特征图
本实施例并不限定各图像特征向量的计算方式,一般可以通过分类模型的图像嵌入函数进行计算:
其中,v
经过图像嵌入函数最终得到目标数据集的特征向量。
S103:根据特征向量计算各目标类别的类别可分离度。
本实施例可以根据特征向量来计算各目标类别的类别可分离度,本实施例并不限定具体计算方式,在统计学中,Bhattacharyya系数是一种衡量两个离散概率分布之间相似度的指标,通常使用Bhattacharyya系数来度量两个统计样本之间的重叠度。本实施例中可以使用Bhattacharyya系数(记为BC)来表示两个类别之间的可分离度,BC系数越大,则认为两个目标类别的重叠度越大,类别可分离度越低。
本实施例可以首先根据各图像的特征向量计算各目标类别的所包含图像的特征向量的均值与方差,具体计算方式可以将各目标类别所包含图像的特征向量输入第二模型计算各目标类别所包含图像的特征向量的均值与方差,第二模型的表达式为:
其中,μ
在计算完成各目标类别对应的均值与方差之后,可以进行BC系数的计算,本实施例并不限定具体的计算方式,一般可以判断目标任务集中的每个目标类别是否服从高斯分布;若是,则可以计算每个目标类别的高斯分布:
其中,p
将高斯分布输入第三模型计算各目标类别的所述Bhattacharyya系数,第三模型的表达式为:
其中,BC(q
若存在目标类别不满足高斯分布,则可以将均值与方差输入第四模型计算各目标类别的Bhattacharyya距离,根据Bhattacharyya距离计算各目标类别的Bhattacharyya系数,第四模型的表达式为:
其中,BD(q
Bhattacharyya距离(记为BD)用于度量两个概率分布的相似性,与Bhattacharyya系数密切相关,本实施例可以通过Bhattacharyya距离来计算Bhattacharyya系数:
BC(q
其中,exp为以自然常数e为底的指数函数。
本实施例中的目标类别q、目标类别q
S104:根据类别可分离度计算分类模型对目标任务集的可迁移数值。
S105:基于可迁移数值确定分类模型的可迁移性。
在本实施例中可以根据类别可分离度计算分类模型对目标任务集的可迁移数值,本实施例并不限定可迁移数值的具体类型,一般可以用OICS(目标数据集整体类间相似度)来表示,将Bhattacharyya系数输入第五模型计算可迁移数值OICS,第五模型的表达式为:
在根据类别可分离度计算分类模型对目标任务数据的可迁移数值OICS之后,本实施例可以通过OICS来进行模型可迁移性的确定,本实施例并不限定具体的确定方式,由于BC系数越大,则认为两个目标类别的重叠度越大,类别可分离度越低,在本实施例中OICS的值越小则认为分类模型到目标数据集的表现越好,分类模型到目标数据集的可迁移性越高。
本实施例并不限定基于可迁移数值确定分类模型的可迁移性具体方式,一般可以直接通过数值的大小表示分类模型到目标数据集的可迁移性,也可以通过设置各等级阈值来划分可迁移性,判断可迁移性分数所属阈值区间,进而确定分类模型可迁移性等级,还可以通过将可迁移数值转换为百分比的形式表征可迁移程度。具体确定方式可以根据实际应用场景及需要进行设定。
本实施例通过确定分类模型中各类别图像的类别相关卷积核,进而获取各类别图像的特征向量,通过特征向量计算各类别之间的可分离度来评估可迁移性,相比于将新任务数据全部输入分类模型,根据测试结果评估其可迁移性,本发明方法降低了评估时间,节省了计算资源。
以下为本发明所提供的一种分类模型可迁移性确定方法的具体实施例,该具体实施例可以包括:
从目标任务集的各类别图像中选取预设数量的图像构建类别图像集;
计算类别图像集在各卷积层的特征图,根据特征图计算各卷积核对目标类别的重要度系数;
基于重要度系数确定目标类别的类别相关卷积核,通过类别相关卷积核计算目标任务集中图像的特征向量;
根据特征向量计算各目标类别的特征向量的方差与均值,并根据方差与均值计算BC系数;
根据BC系数计算OICS数值,并基于OICS数值进行分类模型可迁移性的确定。
以下结合图4,图4为本发明实施例所提供的一种分类模型可迁移性确定装置的结构框图,该装置可以包括:
第一模块100,用于确定目标任务集中各目标类别的类别相关卷积核;
第二模块200,用于通过所述类别相关卷积核计算所述目标任务集中图像的特征向量;
第三模块300,用于根据所述特征向量计算各所述目标类别的类别可分离度;
第四模块400,用于根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值;
第五模块500,用于基于所述可迁移数值确定所述分类模型的可迁移性。
基于上述实施例,本发明通过确定分类模型中各类别图像的类别相关卷积核,进而获取各类别图像的特征向量,通过特征向量计算各类别之间的可分离度来评估可迁移性,相比于将新任务数据全部输入分类模型,根据测试结果评估其可迁移性,本发明方法降低了评估时间,节省了计算资源。
基于上述各实施例,所述第一模块100,可以包括:
类别图像集单元,用于从所述目标任务集的各类别图像中选取预设数量的图像构建类别图像集;
特征图单元,用于计算所述类别图像集在各卷积层的特征图;
重要度系数单元,用于根据所述特征图计算各卷积核对所述目标类别的重要度系数;
确定单元,用于基于所述重要度系数确定所述目标类别的所述类别相关卷积核。
基于上述各实施例,所述重要度系数单元,可以包括:
一阶微分子单元,用于计算预测类别对所述特征图的一阶微分;
第一模型子单元,用于将所述一阶微分输入第一模型计算所述卷积核的所述重要度系数,所述第一模型的表达式为:
其中,
基于上述各实施例,所述第三模块300,可以包括:
均值方差单元,用于计算各所述目标类别所包含图像的所述特征向量的均值与方差;
BC系数单元,用于根据所述均值与所述方差计算各所述目标类别之间的Bhattacharyya系数。
基于上述各实施例,所述均值方差单元,可以包括:
第二模型子单元,用于将所述目标任务集的所述特征向量输入第二模型计算各所述目标类别的所述均值与所述方差,所述第二模型的表达式为:
其中,μ
基于上述各实施例,所述BC系数单元,可以包括:
判断子单元,用于判断所述目标任务集中各所述目标类别是否均服从高斯分布;若是,执行第三模型子单元;若否,执行第四模型子单元;
所述第三模型子单元,用于根据所述均值与所述方差计算各所述目标类别的高斯分布,将所述高斯分布输入第三模型计算各所述目标类别的所述Bhattacharyya系数,所述第三模型的表达式为:
其中,BC(q
所述第四模型子单元,用于将所述均值与所述方差输入第四模型计算各所述目标类别的Bhattacharyya距离,根据所述Bhattacharyya距离计算各所述目标类别的所述Bhattacharyya系数,所述第四模型的表达式为:
其中,BD(q
基于上述各实施例,所述第四模块400,可以包括:
第五模型单元,用于将所述Bhattacharyya系数输入第五模型计算所述可迁移数值,所述第五模型的表达式为:
其中,BC(q
基于上述实施例,本发明还提供了一种设备,该设备可以包括存储器和处理器,其中,该存储器中存有计算机程序,该处理器调用该存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然,该装置还可以包括各种必要的网络接口、电源以及其它零部件等。
本发明还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行终端或处理器执行时可以实现本发明实施例所提供的方法;该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种分类模型可迁移性确定方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
- 一种音频设备的确定方法、装置、设备和存储介质
- 电子装置、基于分类模型的催收员确定方法及存储介质
- 一种问卷调查对象确定方法、装置、电子设备和存储介质
- 一种车位确定方法、装置、电子设备、车辆及存储介质
- 一种类簇中心的确定方法、装置、计算机设备及存储介质
- 客户分类模型确定方法、装置、计算机设备和存储介质
- 分类模型的确定方法、装置、计算机设备和存储介质