掌桥专利:专业的专利平台
掌桥专利
首页

模型训练、图像识别方法、装置、设备及存储介质

文献发布时间:2024-04-18 20:01:23


模型训练、图像识别方法、装置、设备及存储介质

技术领域

本公开涉及信息技术领域,尤其涉及一种模型训练、图像识别方法、装置、设备及存储介质。

背景技术

在海量数据和强大算力的支撑下,机器学习模型例如深度模型在图像识别领域取得了巨大的成功。目前的机器学习模型在被训练完成后,为了避免出现灾难性遗忘的问题、以及过拟合问题,通常会对训练完成的机器学习模型进行冻结,即固定训练完成的机器学习模型的参数。

但是,对训练完成的机器学习模型进行冻结后,会导致该机器学习模型对新类别的图像识别不精准。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种模型训练、图像识别方法、装置、设备及存储介质,以提高对新类别图像的识别精准度。

第一方面,本公开实施例提供一种模型训练方法,包括:

通过待训练的机器学习模型从历史图像集合中抽取历史知识;

通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;

将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;

根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练。

第二方面,本公开实施例提供一种图像识别方法,包括:

获取多个历史类别中每个历史类别对应的第一特征均值,每个历史类别对应的第一特征均值是所述历史类别下的多个历史图像的图像特征均值;

通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征,以及计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值,所述机器学习模型是采用如第一方面所述的方法训练得到的;

根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征;

根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值;

根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别。

第三方面,本公开实施例提供一种基于知识传播的小样本类增量图像识别方法,包括:

获取历史图像集合中的历史知识;

计算训练集中各类样本图像的特征均值、以及计算测试集中待识别图像的目标图像特征;

将所述历史知识传播到所述训练集中各类样本图像的特征均值上,得到所述训练集中各类样本图像更新后的特征均值,以及将所述历史知识传播到所述待识别图像的目标图像特征上,得到所述待识别图像更新后的目标图像特征;

根据所述待识别图像更新后的目标图像特征和所述训练集中各类样本图像更新后的特征均值的相似度,确定所述待识别图像中的内容对应的目标类别。

第四方面,本公开实施例提供一种电子设备,包括:

存储器;

处理器;以及

计算机程序;

其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面、第二方面或第三方面所述的方法。

第五方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面、第二方面或第三方面所述的方法。

本公开实施例提供的模型训练、图像识别方法、装置、设备及存储介质,通过待训练的机器学习模型从历史图像集合中抽取历史知识;通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练,使得训练完成的机器学习模型可以将历史知识传播到新类别图像上,从而增强或补充新类别图像的特征信息,根据新类别图像被增强或补充后的特征信息,可以提高对新类别图像的识别精准度。因此即使冻结该机器学习模型,也可以在新类别图像出现时,通过该训练完成的机器学习模型提高对新类别图像的识别精准度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的模型训练方法流程图;

图2为本公开实施例提供的应用场景的示意图;

图3为本公开实施例提供的模型训练的示意图;

图4为本公开另一实施例提供的模型训练方法流程图;

图5为本公开另一实施例提供的模型推理的示意图;

图6为本公开另一实施例提供的知识传播模块的示意图;

图7为本公开实施例提供的模型训练装置的结构示意图;

图8为本公开实施例提供的图像识别装置的结构示意图;

图9为本公开实施例提供的电子设备实施例的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。

需要说明的是,本申请所涉及的图像数据(包括但不限于历史图像、样本图像、待识别图像等),为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。

另外,本申请提供的模型训练方法或图像识别方法会涉及到如下的几个术语解释,详细内容如下:

终身学习:终身学习是一种高级的机器学习范式,它通过不断学习,从过去的任务当中积累知识,并用这些知识帮助未来的学习。

类增量学习:在类增量学习中,新的类别不断地到来,模型需要正确地将输入分类到其对应地类别当中去,不同任务所包含的类别之间没有重叠。

小样本类增量学习:类增量学习过程中涉及的新类训练样本很少,比如仅有5个样本。

灾难性遗忘:模型学习了新的知识之后,几乎彻底遗忘掉之前训练所学习到的特征和信息。

过拟合:训练样本过少,模型过度拟合训练样本,对测试样本的分类性能很低。

图像识别:对不同图像内容赋予对应类别标签。

原型特征:通常指各类所有样本特征均值。

在海量数据和强大算力的支撑下,机器学习模型例如深度模型在图像识别领域取得了巨大的成功。但是,训练完成的机器学习模型的性能表现(例如可识别的图像类别)限于训练集所包含的图像类别。在实际图像识别场景中,会不断出现新类别(例如机器学习模型没有识别过的类别)的图像,从而对机器学习模型提出了一定的挑战,该挑战往往被称之为类增量学习,具体的,类增量学习不仅要求机器学习模型能够识别新类别的图像,同时还要求机器学习模型防止遗忘旧类别的图像识别能力。但是,由于隐私、设备存储限制以及存储花销大等问题,旧类别的图像(也可称为旧类数据)往往不可得,或者仅可保留少量图像,这使得机器学习模型容易出现灾难性遗忘问题(即对旧类别的图像识别能力下降很大)。现有类增量学习方法通常假设新类别的图像是充足的,但是,在一些场景中,例如稀有鸟类识别、汽车零件缺陷识别等场景中,新的鸟类图像或汽车零件缺陷图像的数量往往很少,这使得现有的一些类增量学习方法在诸如该类场景下的表现乏力。因此,小样本类增量学习应运而生。但是,在小样本类增量学习中,少量的新类别图像不仅仅加剧了灾难性遗忘问题,还易使得机器学习模型在训练数据上过拟合。为了避免出现灾难性遗忘的问题、以及过拟合问题,通常会对训练完成的机器学习模型进行冻结,即固定训练完成的机器学习模型的参数。但是,对训练完成的机器学习模型进行冻结后,会导致该机器学习模型对新类别的图像识别不精准。

针对该问题,本公开实施例提供了一种模型训练方法,下面结合具体的实施例对该方法进行介绍。

图1为本公开实施例提供的模型训练方法流程图。该方法可以由模型训练装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如服务器或终端,其中,终端具体包括手机、电脑或平板电脑等。另外,该模型训练方法可以适用于如图2所示的应用场景,如图2所示,该应用场景中包括终端21和服务器22,其中,服务器22可以采用本实施例所述的模型训练方法对机器学习模型进行训练,进一步,将训练完成的机器学习模型部署到终端21中,使得终端21可以根据该训练完成的机器学习模型进行图像识别,或者,终端21可以将待识别图像发送给服务器22,使得服务器22对该待识别图像进行图像识别。再或者,服务器22可以对来自于本地、其他终端、其他服务器的待识别图像进行图像识别。如图1所示,该方法具体步骤如下:

S101、通过待训练的机器学习模型从历史图像集合中抽取历史知识。

例如,历史图像集合是如图3所示的旧类训练数据,通过待训练的机器学习模型从历史图像集合中抽取相关知识,该相关知识可以记为历史知识。

可选的,所述历史图像集合包括多个历史类别中每个历史类别下的多个历史图像;通过待训练的机器学习模型从历史图像集合中抽取历史知识,包括:针对所述多个历史类别中的每个历史类别,通过所述待训练的机器学习模型,计算所述历史类别下的多个历史图像的图像特征均值,得到所述历史类别对应的第一特征均值。

如图3所示,机器学习模型包括预训练的骨干网络和知识传播模块,其中,预训练的骨干网络可以是编码器,用于将图像编码为一个低维的表示向量。具体的,预训练的骨干网络是采用传统图像分类方法对骨干网络例如深度残差网络ResNet-18等进行预训练完成得到的网络。在对机器学习模型进行训练之前,需要通过如图3所示的1进行库构建。具体的,通过预训练的骨干网络从旧类训练数据中抽取相关知识,其中,旧类训练数据可以是大量的旧类别的图像,旧类别可以记为历史类别,历史类别可以是多个,每个历史类别下的历史图像可以是多个。例如,本实施例涉及到100个历史类别,每个历史类别下包括10个历史图像,因此如图3所示的旧类训练数据是1000个历史图像。预训练的骨干网络可以计算该1000个历史图像中每个历史图像的图像特征,每个历史图像的图像特征不仅可以包括该历史图像中目标对象(例如马、老虎等)的特征信息(例如老虎的条纹信息、马的身体结构信息等),还可以包括该历史图像本身的一些特征信息,例如,该历史图像包括的目标对象的个数、背景特征等。在本实施例中,每个历史图像的图像特征可以是一个低维的表示向量,例如256维的表示向量。另外,预训练的骨干网络还可以针对每个历史类别下的多个历史图像分别对应的图像特征,计算该历史类别下的多个历史图像的图像特征均值,从而得到该历史类别对应的第一特征均值。例如,某个历史类别下包括10个历史图像,该10个历史图像中的每个历史图像对应有一个图像特征,即该10个历史图像对应有10个图像特征,进一步,计算该10个图像特征的均值,该均值也是一个256维的表示向量,该均值记为该历史类别对应的第一特征均值。因此,在本实施例中,预训练的骨干网络从旧类训练数据中抽取的相关知识不仅可以包括该1000个历史图像中每个历史图像的图像特征,还可以包括该100个历史类别中每个历史类别分别对应的第一特征均值。如图3所示,可以构建一个知识库,并将该相关知识存储到该知识库中。同时本实施例还可以初始化一个匹配库,匹配库用于存放后续实施例中涉及到的原型特征。

S102、通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息。

可选的,所述第一子集合包含的图像类别和所述第二子集合包含的图像类别相同,所述第一子集合包含的样本图像和所述第二子集合包含的样本图像不同。

在进行库构建之后,可以通过如图3所示的2进行知识传播训练,具体的,可以从旧类训练数据中抽取若干任务,每个任务包含一个支持集S和一个查询集Q,其中,每个任务可以记为一个元任务,支持集S记为第一子集合,查询集Q记为第二子集合。例如,旧类训练数据包括100个历史类别,从该100个历史类别中随机抽取5个历史类别,该5个历史类别分别记为历史类别A1、历史类别A2、历史类别A3、历史类别A4、历史类别A5,历史类别A1下的10个历史图像记为A101-A110,历史类别A2下的10个历史图像记为A201-A210,历史类别A3下的10个历史图像记为A301-A310,历史类别A4下的10个历史图像记为A401-A410,历史类别A5下的10个历史图像记为A501-A510。进一步,将历史类别A1下的5个历史图像例如A101-A105、历史类别A2下的5个历史图像例如A201-A205、历史类别A3下的5个历史图像例如A301-A305、历史类别A4下的5个历史图像例如A401-A405、历史类别A5下的5个历史图像例如A501-A505构成第一子集合,将历史类别A1下的5个历史图像例如A106-A110、历史类别A2下的5个历史图像例如A206-A210、历史类别A3下的5个历史图像例如A306-A310、历史类别A4下的5个历史图像例如A406-A410、历史类别A5下的5个历史图像例如A506-A510构成第二子集合。另外,本实施例将第一子集合包括的各个历史图像记为样本图像,将第二子集合中包括的各个历史图像也记为样本图像,将第一子集合包括的各个历史类别记为图像类别,将第二子集合包括的各个历史类别也记为图像类别。从而使得所述第一子集合包含的图像类别和所述第二子集合包含的图像类别相同,所述第一子集合包含的样本图像和所述第二子集合包含的样本图像不同。也就是说,针对同一个图像类别而言,所述第一子集合包含的样本图像和所述第二子集合包含的样本图像不重叠。

另外,可以理解的是,针对同一个图像类别而言,所述第一子集合包含的样本图像的个数和所述第二子集合包含的样本图像的个数可以不同。例如,对于历史类别A1而言,第一子集合包含的样本图像可以是3个历史图像例如A101-A103,第二子集合包含的样本图像可以是7个历史图像例如A104-A110。此外,对于不同的图像类别例如历史类别A1和历史类别A2而言,第一子集合包含的历史类别A1下的历史图像的个数和第一子集合包含的历史类别A2下的历史图像的个数可以不同。

可选的,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,包括:计算所述第一子集合中每个图像类别下的多个样本图像的图像特征均值,得到所述第一子集合中每个图像类别对应的第二特征均值。

可选的,计算所述历史图像集合中第二子集合内各个样本图像的特征信息,包括:计算所述第二子集合中每个样本图像的图像特征。

如图3所示,通过预训练的骨干网络可以计算该第二子集合中每个样本图像的图像特征。例如,第二子集合包括5个历史类别,每个历史类别包括5个历史图像,则第二子集合一共包括25个历史图像,通过预训练的骨干网络可以计算该25个历史图像中每个历史图像的图像特征,从而得到25个图像特征。

同时,通过预训练的骨干网络可以计算第一子集合中每个图像类别下的多个样本图像的图像特征均值,得到所述第一子集合中每个图像类别对应的第二特征均值。例如,第一子集合包括5个历史类别,每个历史类别包括5个历史图像,针对该5个历史类别中的每个历史类别,计算该历史类别下的5个历史图像分别对应的图像特征的均值,该均值可以作为该历史类别对应的第二特征均值,从而得到第一子集合中历史类别A1、历史类别A2、历史类别A3、历史类别A4、历史类别A5分别对应的第二特征均值。

S103、将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息。

如图3所示,预训练的骨干网络可以将第一子集合中每个图像类别对应的第二特征均值送入知识传播模块,使得知识传播模块将该历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值。同理,如图3所示,预训练的骨干网络可以将第二子集合中每个样本图像的图像特征送入知识传播模块,使得知识传播模块将该历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息。

可选的,将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,包括:根据所述每个历史类别对应的第一特征均值,对所述第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值。

如图3所示,预训练的骨干网络可以将第一子集合中每个图像类别对应的第二特征均值送入知识传播模块,使得知识传播模块对第一子集合中每个图像类别对应的第二特征均值进行更新。具体的,知识传播模块可以利用知识库中存储的知识(如上所述的相关知识)对第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值。具体的,知识传播模块可以利用知识库中存储的如上所述的100个历史类别中每个历史类别分别对应的第一特征均值,对第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值。

可选的,根据所述每个历史类别对应的第一特征均值,对所述第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值,包括:根据所述第一子集合中任一图像类别对应的第二特征均值分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第一加权结果;将所述第一加权结果和所述任一图像类别对应的第二特征均值相加,得到所述任一图像类别对应的更新后的第二特征均值。

例如,以第一子集合中的历史类别A1为例,计算历史类别A1对应的第二特征均值分别与该100个历史类别中每个历史类别对应的第一特征均值的相似度(也叫相似性),从而得到100个相似度,进一步,根据该100个相似度,对该100个历史类别分别对应的第一特征均值进行加权求和,得到第一加权结果,其中,该100个相似度可以是加权求和过程中的100个权重值,一个相似度可以作为一个权重值,或者通过预设算法对一个相似度进行处理,得到一个权重值。或者,在其他一些实施例中,从该100个相似度中选择出相似度大于或等于预设阈值的若干个相似度,进一步,根据该若干个相似度,对该若干个相似度对应的若干个历史类别分别对应的第一特征均值进行加权求和,得到第一加权结果。可以理解的是,在第一特征均值为256维的表示向量的情况下,该第一加权结果也是256维的表示向量。

进一步,将该第一加权结果和该历史类别A1对应的第二特征均值相加,得到该历史类别A1对应的更新后的第二特征均值,同理,可以得到第一子集合中其他图像类别对应的更新后的第二特征均值。更新后的第二特征均值也是256维的表示向量。

可选的,将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息,包括:根据所述每个历史类别对应的第一特征均值,对所述第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征。

如图3所示,预训练的骨干网络可以将第二子集合中每个样本图像的图像特征送入知识传播模块,使得知识传播模块对第二子集合中每个样本图像的图像特征进行更新。具体的,知识传播模块可以利用知识库中存储的知识(如上所述的相关知识)对第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征。具体的,知识传播模块可以利用知识库中存储的如上所述的100个历史类别中每个历史类别分别对应的第一特征均值,对第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征。

可选的,根据所述每个历史类别对应的第一特征均值,对所述第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征,包括:根据所述第二子集合中任一样本图像的图像特征分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第二加权结果;将所述第二加权结果和所述任一样本图像的图像特征相加,得到所述任一样本图像更新后的图像特征。

例如,以第二子集合中的任一样本图像为例,计算该任一样本图像的图像特征分别与该100个历史类别中每个历史类别对应的第一特征均值的相似度(也叫相似性),从而得到100个相似度,进一步,根据该100个相似度,对该100个历史类别分别对应的第一特征均值进行加权求和,得到第二加权结果。其中,该100个相似度可以是加权求和过程中的100个权重值,一个相似度可以作为一个权重值,或者通过预设算法对一个相似度进行处理,得到一个权重值。或者,在其他一些实施例中,从该100个相似度中选择出相似度大于或等于预设阈值的若干个相似度,进一步,根据该若干个相似度,对该若干个相似度对应的若干个历史类别分别对应的第一特征均值进行加权求和,得到第二加权结果。可以理解的是,在第一特征均值为256维的表示向量的情况下,该第二加权结果也是256维的表示向量。

进一步,将该第二加权结果和该任一样本图像的图像特征相加,得到该任一样本图像更新后的图像特征,同理,可以得到第二子集合中其他样本图像更新后的图像特征。更新后的图像特征也是256维的表示向量。

S104、根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练。

例如,第一子集合包括5个历史类别即图像类别,对该5个图像类别中每个图像类别对应的第二特征均值更新后,一共得到5个更新后的第二特征均值。第二子集合包括25个样本图像,对该25个样本图像中每个样本图像的图像特征进行更新后,一共得到25个更新后的图像特征。具体的,针对25个更新后的图像特征中的任一更新后的图像特征,计算该任一更新后的图像特征分别与该5个中每一个更新后的第二特征均值的相似度,从而一共得到5个相似度,该5个相似度中的每个相似度表示该任一更新后的图像特征对应的样本图像的图像类别是计算该相似度时采用的更新后的第二特征均值对应的图像类别的概率。假设该5个相似度构成一列数据,意味着每个更新后的图像特征对应有这么一列数据,25个更新后的图像特征一共对应有25列数据,该25列数据可以构成一个5*25的矩阵。此处,将该5*25的矩阵记为第一矩阵。也就是说,经过如图3所示的相似性计算后可以得到该第一矩阵,因此,该第一矩阵可以作为待训练的机器学习模型的输出,即该第一矩阵可以作为待训练的机器学习模型的预测结果。根据该预测结果、以及所述第二子集合中每个样本图像的实际类别,对所述机器学习模型进行训练。

可选的,根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练,包括:根据所述第一子集合中每个图像类别对应的更新后的第二特征均值分别与所述第二子集合中每个样本图像更新后的图像特征的相似度、以及所述第二子集合中每个样本图像的实际类别,对所述机器学习模型进行训练。

对于第二子集合来说,在针对机器学习模型的训练阶段中,可以对该第二子集合中的每个样本图像的图像类别进行提前标注,从而标注出第二子集合中每个样本图像的实际类别。由于所述第一子集合包含的图像类别和所述第二子集合包含的图像类别相同,例如,所述第一子集合和所述第二子集合分别包括5个图像类别(例如A1-A5)。针对第二子集合中的任一样本图像而言,若该任一样本图像的实际类别是该5个图像类别中的某个图像类别例如A1,则意味着该任一样本图像的实际类别不会是A2-A5中的任意一个,此时,可以构建一个列向量,该列向量中第一行的元素值是1,第二行到第五行的元素值分别是0。同理,可以针对该第二子集合中的其他每个样本图像,构建一个类似的列向量,从而一共得到25个列向量,该25个列向量构成一个5*25的矩阵。此处,将该5*25的矩阵记为第二矩阵。

可以理解的是,由于从旧类训练数据中可以抽取出若干任务,每个任务包含一个支持集S和一个查询集Q,根据一个支持集S和一个查询集Q,经过如上所述的计算过程可以得到一个第一矩阵和一个第二矩阵,也就是说,针对每个任务可以得到一个第一矩阵和一个第二矩阵。如果将同一个任务对应的一个第一矩阵和一个第二矩阵记为一组数据,那么N个任务就会对应有N组数据,并且根据同一组数据中的第一矩阵和第二矩阵可以计算得到一个交叉熵损失函数值,从而一共得到N个交叉熵损失函数值。进一步,采用该N个交叉熵损失函数值并结合该N个任务对待训练的机器学习模型的参数进行优化即训练。具体的,根据一个交叉熵损失函数值和其对应的一个任务,可以对该待训练的机器学习模型的参数进行一次优化,从而对该待训练的机器学习模型的参数进行N次迭代优化。使得训练完成的机器学习模型能够识别该N个任务中每个任务分别对应的历史类别。

训练完成的机器学习模型包括训练完成的骨干网络和训练完成的知识传播模块。在对训练完成的机器学习模型进行冻结即固定模型参数后,若出现了新类别的多个样本图像,则通过训练完成的骨干网络可以对该新类别的每个样本图像进行编码,得到该新类别的每个样本图像的图像特征,以及该新类别的多个样本图像的图像特征均值。进一步,该训练完成的知识传播模块可以利用知识库中存储的知识对该新类别对应的图像特征均值进行更新(例如增强或补充)。当出现待识别图像时,同样可以通过训练完成的骨干网络可以对该待识别图像进行编码得到该待识别图像的图像特征,进一步,该训练完成的知识传播模块可以利用知识库中存储的知识对该待识别图像的图像特征进行更新(例如增强或补充)。若该待识别图像更新后的图像特征与该新类别对应的更新后的图像特征均值的相似度较高,则可以将该新类别作为该待识别图像的图像类别。

本公开实施例通过待训练的机器学习模型从历史图像集合中抽取历史知识;通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练,使得训练完成的机器学习模型可以将历史知识传播到新类别图像上,从而增强或补充新类别图像的特征信息,根据新类别图像被增强或补充后的特征信息,可以提高对新类别图像的识别精准度。因此即使冻结该机器学习模型,也可以在新类别图像出现时,通过该训练完成的机器学习模型提高对新类别图像的识别精准度。

可以理解的是,训练完成的机器学习模型不仅可以将历史知识传播到新类别图像上,还可以将历史知识传播到旧类别图像上,因此,本实施例所述的方法不仅可以提高对新类别图像的识别精准度,还可以进一步提高对旧类别图像的识别精准度。

图4为本公开另一实施例提供的图像识别方法流程图。该方法可以是如图5所示的模型推理过程,此处的模型是指通过如上所述的模型训练方法训练完成的机器学习模型,如图5所示,该训练完成的机器学习模型包括训练完成的骨干网络和训练完成的知识传播模块。可以理解的是,模型的训练过程和模型的推理过程(即使用过程)可以由同一个执行主体执行,也可以分别由不同的执行主体执行。例如,图2所示的服务器22可以执行模型训练方法,得到训练完成的机器学习模型。训练完成的机器学习模型可以保留在服务器22中,从而使得服务器22可以根据该训练完成的机器学习模型执行图像识别方法,或者服务器22可以将训练完成的机器学习模型部署到其他设备上,使得其他设备通过该训练完成的机器学习模型执行图像识别方法。另外,在本实施例中,还可以对该训练完成的机器学习模型进行冻结,即对该训练完成的机器学习模型的参数进行固定,使得冻结后的机器学习模型可以精准识别新类别的图像。具体的,该图像识别方法具体包括如下几个步骤:

S401、获取多个历史类别中每个历史类别对应的第一特征均值,每个历史类别对应的第一特征均值是所述历史类别下的多个历史图像的图像特征均值。

例如从如上所述的知识库中获取100个历史类别中每个历史类别分别对应的第一特征均值,每个历史类别分别对应的第一特征均值是该历史类别下的多个历史图像的图像特征均值。

另外,可以理解的是,由于该训练完成的机器学习模型包括训练完成的骨干网络和训练完成的知识传播模块,因此,在得到训练完成的骨干网络之后,还可以通过该训练完成的骨干网络重新计算该1000个历史图像中每个历史图像的图像特征,从而重新计算该100个历史类别中每个历史类别分别对应的第一特征均值。因此,本实施例获取的100个历史类别中每个历史类别分别对应的第一特征均值可以是由训练完成的骨干网络重新计算的该100个历史类别中每个历史类别分别对应的第一特征均值。

S402、通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征,以及计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值,所述机器学习模型是采用如上所述的模型训练方法训练得到的。

可选的,所述测试集包含的图像类别和所述训练集包含的图像类别相同,所述测试集包含的待识别图像和所述训练集包含的样本图像不同。

例如,在模型推理阶段中,出现了新任务,该新任务不仅要求训练完成的机器学习模型识别旧类图像,还要求该训练完成的机器学习模型识别新类图像。在这种情况下,针对该新任务,可以构建训练集和测试集,其中,训练集可以包括新类图像和旧类图像,同理,测试集也包括新类图像和旧类图像。只是训练集中的每个图像的类别是已知的,而测试集中的每个图像的类别是未知的即待识别的。在一些实施例中,训练集和测试集之间的关系类似于如上所述的支持集和查询集之间的关系。

在本实施例中,针对训练集中的每个图像类别,可以通过训练完成的骨干网络计算该图像类别下的多个样本图像的图像特征均值,并将该图像特征均值作为该图像类别对应的第三特征均值。例如,训练集中包括斑马的若干个图像、老虎的若干个图像、马的若干个图像,其中,“斑马”是新类别,“老虎”和“马”分别是旧类别。通过训练完成的骨干网络,可以计算出斑马的若干个图像中每个图像的图像特征,进一步,对斑马的若干个图像中每个图像的图像特征求平均,从而得到“斑马”对应的第三特征均值,同理,可以计算出“老虎”对应的第三特征均值和“马”对应的第三特征均值。此处,可以将“斑马”对应的第三特征均值、“老虎”对应的第三特征均值和“马”对应的第三特征均值记为原型特征。同时,通过训练完成的骨干网络,还可以计算测试集中任一待识别图像的图像特征,该待识别图像的图像特征可以记为目标图像特征。该目标图像特征可以是如图5所示的测试特征。

S403、根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征。

例如图5所示,训练完成的骨干网络可以将该目标图像特征送入训练完成的知识传播模块中,使得训练完成的知识传播模块对该目标图像特征进行更新。具体的,训练完成的知识传播模块可以利用知识库中存储的知识,例如如上所述的该100个历史类别中每个历史类别分别对应的第一特征均值,对目标图像特征进行更新,得到更新后的目标图像特征。

可选的,根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征,包括:根据所述目标图像特征分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第三加权结果;将所述第三加权结果和所述目标图像特征相加,得到所述更新后的目标图像特征。

例如,该目标图像特征是一个256维的表示向量,该100个历史类别中每个历史类别分别对应的第一特征均值也是256维的表示向量。计算该目标图像特征分别与该100个历史类别中每个历史类别对应的第一特征均值的相似度,从而得到100个相似度,进一步,根据该100个相似度,对该100个历史类别分别对应的第一特征均值进行加权求和,得到第三加权结果。进一步,将该第三加权结果和目标图像特征相加,得到更新后的目标图像特征。

S404、根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值。

例如图5所示,训练完成的骨干网络可以将原型特征送入训练完成的知识传播模块中,使得训练完成的知识传播模块对该原型特征进行更新。具体的,训练完成的知识传播模块可以利用知识库中存储的知识,例如如上所述的该100个历史类别中每个历史类别分别对应的第一特征均值,对训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值。

例如,训练完成的知识传播模块可以根据如上所述的该100个历史类别中每个历史类别分别对应的第一特征均值,对“斑马”对应的第三特征均值、“老虎”对应的第三特征均值、“马”对应的第三特征均值分别进行更新,得到“斑马”对应的更新后的第三特征均值、“老虎”对应的更新后的第三特征均值、以及“马”对应的更新后的第三特征均值。进一步,将“斑马”对应的更新后的第三特征均值、“老虎”对应的更新后的第三特征均值、以及“马”对应的更新后的第三特征均值存储到匹配库中,即更新后的原型特征被存储到匹配库中。

可选的,根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值,包括:根据所述训练集中任一图像类别对应的第三特征均值分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第四加权结果;将所述第四加权结果和所述任一图像类别对应的第三特征均值相加,得到所述任一图像类别对应的更新后的第三特征均值。

例如,以“斑马”对应的第三特征均值为例,计算“斑马”对应的第三特征均值分别与该100个历史类别中每个历史类别对应的第一特征均值的相似度,从而得到100个相似度,进一步,根据该100个相似度,对该100个历史类别分别对应的第一特征均值进行加权求和,得到第四加权结果。进一步,将第四加权结果和“斑马”对应的第三特征均值相加,得到“斑马”对应的更新后的第三特征均值。同理,计算出“老虎”对应的更新后的第三特征均值、以及“马”对应的更新后的第三特征均值。

S405、根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别。

例如,根据更新后的目标图像特征、以及“斑马”、“老虎”、“马”各自对应的更新后的第三特征均值,确定待识别图像中的内容对应的目标类别是“斑马”、“老虎”、“马”中的哪个。

可选的,根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别,包括:根据所述更新后的目标图像特征分别与所述训练集中每个图像类别对应的更新后的第三特征均值的相似度,从所述训练集中确定出目标图像类别,所述更新后的目标图像特征与所述目标图像类别对应的更新后的第三特征均值的相似度最大;将所述目标图像类别确定为所述待识别图像中的内容对应的目标类别。

例如,计算更新后的目标图像特征和“斑马”对应的更新后的第三特征均值的第一相似度、计算更新后的目标图像特征和“老虎”对应的更新后的第三特征均值的第二相似度、计算更新后的目标图像特征和“马”对应的更新后的第三特征均值的第三相似度。进一步,从第一相似度、第二相似度和第三相似度中选取出最大值,例如,假设第一相似度最大,则将“斑马”确定为训练集中的目标图像类别,并将“斑马”确定为所述待识别图像中的内容对应的目标类别,即“斑马”是针对该待识别图像的识别结果。

由于更新后的原型特征例如“斑马”对应的更新后的第三特征均值、“老虎”对应的更新后的第三特征均值、以及“马”对应的更新后的第三特征均值被存储在匹配库中,因此,在其他实施例中,还可以复制匹配库中存储的更新后的原型特征,得到匹配特征,即匹配特征是更新后的原型特征。在计算更新后的目标图像特征和各个更新后的第三特征均值的相似度时,具体可以计算该更新后的目标图像特征和各个匹配特征之间的相似度。另外,对于训练集中的各个图像类别,可以预先标注上不同的标签。例如,将新类别“斑马”标注为标签1,将旧类别“老虎”标注为标签2,将旧类别“马”标注为标签3。当如上所述的第一相似度最大时,说明待识别图像的类别是“斑马”的概率最大,此时,可以将标签3赋给该待识别图像,从而确定出待识别图像中的内容是斑马。

可以理解的是,对该训练完成的机器学习模型进行冻结后,相当于对训练完成的骨干网络和训练完成的知识传播模块进行了冻结。当训练集中出现新类别例如“斑马”的样本图像时,由于训练完成的骨干网络没有编码过斑马图像,因此,训练完成的骨干网络对斑马图像的识别能力有限,使得训练完成的骨干网络计算出的“斑马”的样本图像的图像特征不健全。由于训练集中“斑马”的样本图像不止一个,例如可以是多个,因此,对训练集中“斑马”的若干个图像中每个图像的图像特征求平均得到“斑马”对应的第三特征均值时,该第三特征均值也是不健全或不够准确的。但是,训练完成的知识传播模块可以根据知识库中存储的历史知识(例如100个历史类别中每个历史类别分别对应的第一特征均值),对“斑马”对应的第三特征均值进行更新,从而对“斑马”对应的第三特征均值进行增强或补充,使得“斑马”对应的更新后的第三特征均值是健全、准确的。例如,该历史知识中包括旧类别“老虎”对应的第一特征均值、以及旧类别“马”对应的第一特征均值。由于“老虎”对应的第一特征均值是“老虎”的大量历史图像的图像特征均值,因此,“老虎”对应的第一特征均值可以包括老虎这个动物种类的特异性信息(老虎独特的外观),例如条纹信息。同理,“马”对应的第一特征均值可以包括马这个动物种类的特异性信息(马独特的外观),例如身体结构信息。根据历史知识对“斑马”对应的第三特征均值进行更新时,可以将老虎的条纹信息和马的身体结构信息传播到“斑马”对应的第三特征均值中,即将老虎的条纹信息和马的身体结构信息补充到“斑马”对应的第三特征均值中,使得“斑马”对应的第三特征均值被增强或补充,因此,“斑马”对应的更新后的第三特征均值可以包括斑马这个动物种类较为健全的特异性信息(例如条纹和身体结构)。同理,训练完成的知识传播模块可以根据历史知识对训练集中旧类别“老虎”对应的第三特征均值进行增强或补充、以及对训练集中旧类别“马”对应的第三特征均值进行增强或补充。

同理,训练完成的知识传播模块根据知识库中存储的历史知识(例如100个历史类别中每个历史类别分别对应的第一特征均值),对待识别图像的图像特征进行更新时,可以对待识别图像的图像特征进行增强或补充,使得待识别图像更新后的目标图像特征是健全、准确的。因此,计算更新后的目标图像特征分别与训练集中每个图像类别对应的更新后的第三特征均值的相似度时,可保证各个相似度的准确性。因此,可以根据各个准确的相似度,从该训练集包括的旧类别和新类别中准确的确定出该待识别图像中的内容对应的目标类别。

也就是说,本实施例从知识传播的角度出发,通过传播历史知识,来帮助被冻结后的机器学习模型适应新类别的图像识别过程。该方法通过获取历史知识,然后通过一个知识传播模块将历史知识传播到新类别图像上,对新类别图像中的内容例如目标对象的特异性进行增强或补充。例如,历史知识包含老虎的条纹信息和马的身体结构信息,当新类别斑马的图像出现时,通过传播该条纹信息和身体结构信息,对斑马的特异性(例如斑马独特的外观)进行增强或补充。由于本实施例所述的方法可以应用于小样本类增量学习,因此,本实施例提供了一种基于知识传播的小样本类增量学习方法,在实现少量内存占用的同时,提高了小样本类增量图像识别性能,即不仅可以提高对新类别图像的识别准确率,还可以提高对旧类别图像的识别准确率。

本实施例通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征,以及计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值。进一步,根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征,使得更新后的目标图像特征健全、准确。根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,使得训练集中每个图像类别对应的第三特征均值健全、准确。进一步,根据更新后的目标图像特征分别与所述训练集中每个图像类别对应的更新后的第三特征均值的相似度,可以从训练集包括的图像类别中准确的确定出待识别图像中的内容对应的目标类别。

下面结合图6对如上所述的知识传播模块进行介绍。如图6所示,假设知识库中存储有100个历史类别中每个历史类别对应的第一特征均值。待更新特征可以是如上所述的第二特征均值、第三特征均值或待识别图像的目标图像特征。知识传播模块可以将该待更新特征输入给知识库,知识库可以计算待更新特征分别与100个历史类别中每个历史类别对应的第一特征均值的相似度,得到100个相似度。进一步,知识库根据该100个相似度,对该100个历史类别中每个历史类别对应的第一特征均值进行加权,得到加权结果,并将该加权结果反馈给知识传播模块中的特征增强单元,该特征增强单元可以将该待更新特征和该加权结果相加,从而得到更新后的特征。

图7为本公开实施例提供的模型训练装置的结构示意图。本公开实施例提供的模型训练装置可以执行模型训练方法实施例提供的处理流程,如图7所示,模型训练装置70包括:

抽取模块71,用于通过待训练的机器学习模型从历史图像集合中抽取历史知识;

计算模块72,用于通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;

知识传播模块73,用于将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;

训练模块74,用于根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练。

可选的,所述历史图像集合包括多个历史类别中每个历史类别下的多个历史图像;抽取模块71通过待训练的机器学习模型从历史图像集合中抽取历史知识时,具体用于:针对所述多个历史类别中的每个历史类别,通过所述待训练的机器学习模型,计算所述历史类别下的多个历史图像的图像特征均值,得到所述历史类别对应的第一特征均值。

可选的,计算模块72计算所述历史图像集合中第一子集合内各类样本图像的特征均值时,具体用于:计算所述第一子集合中每个图像类别下的多个样本图像的图像特征均值,得到所述第一子集合中每个图像类别对应的第二特征均值;计算模块72计算所述历史图像集合中第二子集合内各个样本图像的特征信息时,具体用于:计算所述第二子集合中每个样本图像的图像特征。

可选的,知识传播模块73将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值时,具体用于:根据所述每个历史类别对应的第一特征均值,对所述第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值;知识传播模块73将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息时,具体用于:根据所述每个历史类别对应的第一特征均值,对所述第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征。

可选的,所述第一子集合包含的图像类别和所述第二子集合包含的图像类别相同,所述第一子集合包含的样本图像和所述第二子集合包含的样本图像不同。

可选的,训练模块74根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练时,具体用于:根据所述第一子集合中每个图像类别对应的更新后的第二特征均值分别与所述第二子集合中每个样本图像更新后的图像特征的相似度、以及所述第二子集合中每个样本图像的实际类别,对所述机器学习模型进行训练。

可选的,知识传播模块73根据所述每个历史类别对应的第一特征均值,对所述第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值时,具体用于:

根据所述第一子集合中任一图像类别对应的第二特征均值分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第一加权结果;

将所述第一加权结果和所述任一图像类别对应的第二特征均值相加,得到所述任一图像类别对应的更新后的第二特征均值。

可选的,知识传播模块73根据所述每个历史类别对应的第一特征均值,对所述第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征时,具体用于:

根据所述第二子集合中任一样本图像的图像特征分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第二加权结果;

将所述第二加权结果和所述任一样本图像的图像特征相加,得到所述任一样本图像更新后的图像特征。

图7所示实施例的模型训练装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

图8为本公开实施例提供的图像识别装置的结构示意图。本公开实施例提供的图像识别装置可以执行图像识别方法实施例提供的处理流程,如图8所示,图像识别装置80包括:

获取模块81,用于获取多个历史类别中每个历史类别对应的第一特征均值,每个历史类别对应的第一特征均值是所述历史类别下的多个历史图像的图像特征均值;

计算模块82,用于通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征,以及计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值,所述机器学习模型是采用如上所述的模型训练方法训练得到的;

第一更新模块83,用于根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征;

第二更新模块84,用于根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值;

确定模块85,用于根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别。

可选的,第一更新模块83根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征时,具体用于:

根据所述目标图像特征分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第三加权结果;

将所述第三加权结果和所述目标图像特征相加,得到所述更新后的目标图像特征。

可选的,第二更新模块84根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值时,具体用于:

根据所述训练集中任一图像类别对应的第三特征均值分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第四加权结果;

将所述第四加权结果和所述任一图像类别对应的第三特征均值相加,得到所述任一图像类别对应的更新后的第三特征均值。

可选的,确定模块85根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别时,具体用于:

根据所述更新后的目标图像特征分别与所述训练集中每个图像类别对应的更新后的第三特征均值的相似度,从所述训练集中确定出目标图像类别,所述更新后的目标图像特征与所述目标图像类别对应的更新后的第三特征均值的相似度最大;

将所述目标图像类别确定为所述待识别图像中的内容对应的目标类别。

可选的,所述测试集包含的图像类别和所述训练集包含的图像类别相同,所述测试集包含的待识别图像和所述训练集包含的样本图像不同。

图8所示实施例的图像识别装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

另外,本实施例还提供了一种基于知识传播的小样本类增量图像识别方法,该方法包括如下几个步骤:

S1、获取历史图像集合中的历史知识。

可选的,所述历史图像集合包括多个历史类别中每个历史类别下的多个历史图像;获取历史图像集合中的历史知识,包括:获取多个历史类别中每个历史类别对应的第一特征均值,每个历史类别对应的第一特征均值是所述历史类别下的多个历史图像的图像特征均值。

S2、计算训练集中各类样本图像的特征均值、以及计算测试集中待识别图像的目标图像特征。

可选的,计算训练集中各类样本图像的特征均值,包括:计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值。可选的,计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值,包括:通过训练完成的机器学习模型,计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值。所述机器学习模型是采用如上所述的模型训练方法训练得到的。

可选的,计算测试集中待识别图像的目标图像特征,包括:通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征。

可选的,所述测试集包含的图像类别和所述训练集包含的图像类别相同,所述测试集包含的待识别图像和所述训练集包含的样本图像不同。

S3、将所述历史知识传播到所述训练集中各类样本图像的特征均值上,得到所述训练集中各类样本图像更新后的特征均值,以及将所述历史知识传播到所述待识别图像的目标图像特征上,得到所述待识别图像更新后的目标图像特征。

可选的,将所述历史知识传播到所述待识别图像的目标图像特征上,得到所述待识别图像更新后的目标图像特征,包括:根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征。

可选的,根据所述目标图像特征分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第三加权结果;

将所述第三加权结果和所述目标图像特征相加,得到所述更新后的目标图像特征。

可选的,将所述历史知识传播到所述训练集中各类样本图像的特征均值上,得到所述训练集中各类样本图像更新后的特征均值,包括:根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值。

可选的,根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值,包括:根据所述训练集中任一图像类别对应的第三特征均值分别与所述每个历史类别对应的第一特征均值的相似度,对所述每个历史类别对应的第一特征均值进行加权,得到第四加权结果;将所述第四加权结果和所述任一图像类别对应的第三特征均值相加,得到所述任一图像类别对应的更新后的第三特征均值。

S4、根据所述待识别图像更新后的目标图像特征和所述训练集中各类样本图像更新后的特征均值的相似度,确定所述待识别图像中的内容对应的目标类别。

可选的,根据所述待识别图像更新后的目标图像特征和所述训练集中各类样本图像更新后的特征均值的相似度,确定所述待识别图像中的内容对应的目标类别,包括:根据所述更新后的目标图像特征分别与所述训练集中每个图像类别对应的更新后的第三特征均值的相似度,从所述训练集中确定出目标图像类别,所述更新后的目标图像特征与所述目标图像类别对应的更新后的第三特征均值的相似度最大;将所述目标图像类别确定为所述待识别图像中的内容对应的目标类别。

具体的,S1-S4的实现方式和具体原理如上所述,此处不再赘述。

以上描述了模型训练、图像识别装置的内部功能和结构,该装置可实现为一种电子设备。图9为本公开实施例提供的电子设备实施例的结构示意图。如图9所示,该电子设备包括存储器91和处理器92。

存储器91用于存储程序。除上述程序之外,存储器91还可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。

存储器91可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

处理器92与存储器91耦合,执行存储器91所存储的程序,以用于:

通过待训练的机器学习模型从历史图像集合中抽取历史知识;

通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;

将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;

根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练。

或者,处理器还可以用于:

获取历史图像集合中的历史知识;

计算训练集中各类样本图像的特征均值、以及计算测试集中待识别图像的目标图像特征;

将所述历史知识传播到所述训练集中各类样本图像的特征均值上,得到所述训练集中各类样本图像更新后的特征均值,以及将所述历史知识传播到所述待识别图像的目标图像特征上,得到所述待识别图像更新后的目标图像特征;

根据所述待识别图像更新后的目标图像特征和所述训练集中各类样本图像更新后的特征均值的相似度,确定所述待识别图像中的内容对应的目标类别。

或者,处理器还可以用于:

获取多个历史类别中每个历史类别对应的第一特征均值,每个历史类别对应的第一特征均值是所述历史类别下的多个历史图像的图像特征均值;

通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征,以及计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值,所述机器学习模型是采用如上所述的模型训练方法训练得到的;

根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征;

根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值;

根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别。

进一步,如图9所示,电子设备还可以包括:通信组件93、电源组件94、音频组件95、显示器96等其它组件。图9中仅示意性给出部分组件,并不意味着电子设备只包括图9所示组件。

通信组件93被配置为便于电子设备和其他设备之间有线或无线方式的通信。电子设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件93经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件93还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

电源组件94,为电子设备的各种组件提供电力。电源组件94可以包括电源管理系统,一个或多个电源,及其他与为电子设备生成、管理和分配电力相关联的组件。

音频组件95被配置为输出和/或输入音频信号。例如,音频组件95包括一个麦克风(MIC),当电子设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器91或经由通信组件93发送。在一些实施例中,音频组件95还包括一个扬声器,用于输出音频信号。

显示器96包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。

另外,本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的模型训练方法或图像识别方法。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 生物分子功能性动力学多转变路径的计算方法及系统
  • 生物分子功能性动力学多转变路径的计算方法及系统
技术分类

06120116549868