掌桥专利:专业的专利平台
掌桥专利
首页

图像分类方法、装置、设备、介质和产品

文献发布时间:2024-04-18 19:59:31


图像分类方法、装置、设备、介质和产品

技术领域

本申请涉及人工智能技术领域,特别是涉及一种图像分类方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

VGG模型(Visual Geometry Group,视觉几何组)为一种深度卷积神经网络模型,在现有的VGG模型中,使用最大池化层来提取特征中响应最大、最强烈的部分来输入到下一层。但是在网络较深的地方,特征尺寸比较小,包含的语义信息比较多,因此,在进入全连接层之前的最后一个最大池化层的特征提取能力和降维能力就比较弱,导致后面需要更多的全连接层来提升模型效果,从而使得模型中需要学习的参数数量增加,降低模型的工作效率。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高模型工作效率的图像分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本申请提供了一种图像分类方法,所述方法包括:

获取历史图像数据集和预构建的卷积神经网络,利用所述历史图像数据集对所述预构建的卷积神经网络进行训练,所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;

获取目标图像数据,将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量;

基于所述全连接层和所述特征向量,确定目标图像的目标图像类别。

在其中一个实施例中,所述卷积层的总层数比所述最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,所述全局平均池化层位于最后一层卷积层之后,所述全连接层位于所述全局平均池化层之后。

在其中一个实施例中,所述将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量,包括:

获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图,每层卷积层对应一张特征图;

将所有特征图输入全局平均池化层,得到每张特征图中所有像素的像素平均值;

将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列,得到所述特征向量。

在其中一个实施例中,所述基于所述全连接层和所述特征向量,确定目标图像的目标图像类别,包括:

获取所述全连接层中的权重矩阵,所述权重矩阵中的权重参数与所述特征向量中的元素一一对应;

计算每个元素与相应的权重参数间的乘积,基于所有乘积之和,确定线性变换结果;

利用非线性激活函数,对所述线性变换结果进行非线性处理,得到预测类别向量;

基于所述预测类别向量和归一化指数函数,确定所述目标图像类别。

在其中一个实施例中,所述基于所述预测类别向量和归一化指数函数,确定目标图像的目标图像类别,包括:

基于所述归一化指数函数对所述预测类别向量中的所有元素进行转化,预测类别向量中的元素和图像类别一一对应;

将每个元素的转化结果与所有元素的转化结果之和间的比值,确定为所述元素对应的目标概率;

将最大目标概率相应的图像类别确定为所述目标图像类别。

在其中一个实施例中,所述利用所述历史图像数据集对所述预构建的卷积神经网络进行训练之后,还包括:

判断当前训练轮数是否达到预设训练轮数,若达到,则停止所述预构建的卷积神经网络的训练过程。

第二方面,本申请还提供了一种图像分类装置,所述装置包括:

第一获取模块,用于获取历史图像数据集和预构建的卷积神经网络,利用所述历史图像数据集对所述预构建的卷积神经网络进行训练,所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;

第二获取模块,用于获取目标图像数据,将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量;

确定模块,用于基于所述全连接层和所述特征向量,确定目标图像的目标图像类别。

第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的任意一个实施例中的方法的步骤。

第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。

第五方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。

上述图像分类方法、装置、计算机设备、存储介质和计算机程序产品,获取历史图像数据集和预构建的卷积神经网络,利用历史图像数据集对预构建的卷积神经网络进行训练,预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;获取目标图像数据,将目标图像数据输入训练后的卷积神经网络,得到目标图像数据相应的特征向量;基于全连接层和特征向量,确定目标图像的目标图像类别。本申请提供的方法,由于在模型中设置一层全局平均池化层,因此只需要设置一层全连接层即可完成对目标图像的图像分类,能够大幅度减少模型中需要学习的参数,从而提升模型的工作效率。

附图说明

图1为一个实施例中图像分类方法的流程示意图;

图2为一个实施例中改进前后VGG-19网络模型对比图;

图3为一个实施例中特征向量确定方法的流程示意图;

图4为另一个实施例中图像分类方法的流程示意图;

图5为一个实施例中图像分类装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种图像分类方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:

S102、获取历史图像数据集和预构建的卷积神经网络,利用历史图像数据集对预构建的卷积神经网络进行训练,预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层。

其中,在银行或者金融领域中,本实施例提供的图像分类方法可以用于对不同币种的分类,历史图像数据集可以为不同币种相应特征数据的集合,在其他领域中,图像分类方法也可以用作其他用途,本申请实施例对此不作具体限定;卷积神经网络可以为VGG-19网络;每个卷积层都使用了3x3大小的卷积核和ReLU激活函数,这些卷积层通过不断堆叠来提取输入图像的特征;在每两个卷积层之间,都有一个2x2的最大池化层,用于减小特征图的空间尺寸,并保留主要特征;全局平均池化层用于将卷积神经网络的特征图转化为固定长度的特征向量;全连接层用于将提取的特征映射转换为最终的输出。

具体地,将历史图像数据集输入预构建的卷积神经网络,对卷积神经网络进行训练,在训练过程满足预设条件的情况下,结束训练过程。例如,预设条件可以为训练轮数达到预设轮数、训练损失趋于稳定或者训练损失下降至预设值。

S104、获取目标图像数据,将目标图像数据输入训练后的卷积神经网络,得到目标图像数据相应的特征向量。

其中,在银行或者金融领域中,目标图像数据可以为种类未知的币种的图像数据。

在将目标图像数据输入训练后的卷积神经网络之前,需要对目标图像进行预处理,预处理的内容包括:将目标图像的尺寸调整为训练后的卷积神经网络相应的输入尺寸,将目标图像中的像素进行归一化,并将目标图像转换为模型所需的张量格式。

具体地,将目标图像数据输入训练后的卷积神经网络之后,在多层卷积层中确定特征提取层,利用全局平均池化层对特征提取层输出的特征图进行处理,从而得到目标图像数据相应的特征向量。其中,特征提取层可以为多层卷积层中的至少一层。

S106、基于全连接层和特征向量,确定目标图像的目标图像类别。

具体地,将特征向量输入至全连接层,基于全连接层中的权重矩阵,对特征向量进行线性变换,并基于非线性激活函数,对线性变换的结果进行非线性处理,然后利用归一化指数函数,对非线性处理结果进行处理,最终确定目标图像类别。

上述图像分类方法中,获取历史图像数据集和预构建的卷积神经网络,利用历史图像数据集对预构建的卷积神经网络进行训练,预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;获取目标图像数据,将目标图像数据输入训练后的卷积神经网络,得到目标图像数据相应的特征向量;基于全连接层和特征向量,确定目标图像的目标图像类别。本申请提供的方法,由于在模型中设置一层全局平均池化层,因此只需要设置一层全连接层即可完成对目标图像的图像分类,能够大幅度减少模型中需要学习的参数,从而提升模型的工作效率。

在一些实施例中,卷积层的总层数比最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,全局平均池化层位于最后一层卷积层之后,全连接层位于全局平均池化层之后。

其中,如图2所示,卷积神经网络可以为VGG-19网络模型,图2中左侧为现有的VGG-19的网络结构图,右侧为本实施例中改进后的VGG-19的网络结构图,图中conv为卷积层,Maxpool为最大池化层,Maxpool/2为步幅为2的最大池化层,Fc-4096为具有4096个输出神经元的全连接层,Fc-4为具有4个输出神经元的全连接层,Fc-1000为具有1000个输出神经元的全连接层,GAP为全局平均池化层,Softmax为归一化指数函数。从图2中可知,本实施例中的VGG-19网络模型相较于现有的VGG-19网络模型,利用一层全局平均池化层替代一层最大池化层和一层全连接层,并且,剩余一层全连接层的输出神经元的个数也大幅度降低。

本实施例中,利用一层全局平均池化层替代一层最大池化层和一层全连接层,能够简化网络模型,并且,能够大幅降低全连接层的输出神经元的个数,从而提高网络的运算效率。

在一些实施例中,如图3所示,将目标图像数据输入训练后的卷积神经网络,得到目标图像数据相应的特征向量,包括:

S302、获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图,每层卷积层对应一张特征图。

其中,特征图是卷积神经网络中的一种数据结构,是相应卷积层输出的结果,它是由卷积层中的神经元对输入数据进行卷积操作得到的。

S304、将所有特征图输入全局平均池化层,得到每张特征图中所有像素的像素平均值。

其中,可以通过计算每张特征图中所有像素的像素平均值,将特征图转换为标量值。

S306、将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列,得到特征向量。

其中,可以通过将每个特征图相应的标量值按照顺序进行排列,得到一个固定长度的特征向量。

本实施例中,利用全局平均池化层确定目标图像数据相应的特征向量,能够有效的减小特征图的尺寸,从而减少网络的参数数量和计算量,同时,由于平均池化操作考虑了整个特征图的信息,因此,可以提取到更全局和更抽象的特征。

在一些实施例中,基于全连接层和特征向量,确定目标图像的目标图像类别,包括:获取全连接层中的权重矩阵,权重矩阵中的权重参数与特征向量中的元素一一对应;计算每个元素与相应的权重参数间的乘积,基于所有乘积之和,确定线性变换结果;利用非线性激活函数,对线性变换结果进行非线性处理,得到预测类别向量;基于预测类别向量和归一化指数函数,确定目标图像类别。

其中,对特征向量进行线性变换的过程相当于对特征向量进行一种组合和映射;非线性激活函数的作用是引入非线性,使得全连接层可以学习更复杂的特征和模式,非线性激活函数可以为ReLU(Rectified Linear Unit)函数、Sigmoid函数或者Tanh函数。

本实施例中,在全连接层中依次对特征向量进行线性变换和非线性处理,使得最终的图像类别预测结果更加准确。

在一些实施例中,基于预测类别向量和归一化指数函数,确定目标图像的目标图像类别,包括:基于归一化指数函数对预测类别向量中的所有元素进行转化,预测类别向量中的元素和图像类别一一对应;将每个元素的转化结果与所有元素的转化结果之和间的比值,确定为元素对应的目标概率;将最大目标概率相应的图像类别确定为目标图像类别。

其中,归一化指数函数用于将一个向量的原始输出转化为表示概率分布的向量,归一化指数函数可以为Softmax函数,Softmax函数可以将预测类别向量中的元素转化到指数函数上。

本实施例中,利用Softmax函数将预测类别向量中的元素转化到指数函数上,可以保证最终得到的目标概率的非负性。

在一些实施例中,利用历史图像数据集对预构建的卷积神经网络进行训练之后,还包括:判断当前训练轮数是否达到预设训练轮数,若达到,则停止预构建的卷积神经网络的训练过程。

其中,预设训练轮数是基于历史训练经验和实际需求确定的。

本实施例中,基于预设训练轮数判断是否停止对卷积神经网络的训练,使得对于模型的训练结果更加准确。

在一个实施例中,提供了另一种图像分类方法,如图4所示,该方法包括以下内容:首先构建基于改进后的VGG-19卷积神经网络,接下来用历史图像数据集训练网络,并保存训练好的网络模型,最后将目标图像数据代入模型提取特征向量,并确定目标图像的类别。

其中,改进后的VGG-19卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层,卷积层的总层数比最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,全局平均池化层位于最后一层卷积层之后,全连接层位于全局平均池化层之后。

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的图像分类方法的图像分类装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个图像分类装置实施例中的具体限定可以参见上文中对于图像分类方法的限定,在此不再赘述。

在一个实施例中,如图5所示,提供了一种图像分类装置500,包括:第一获取模块501、第二获取模块502和确定模块503,其中:

第一获取模块501,用于获取历史图像数据集和预构建的卷积神经网络,利用所述历史图像数据集对所述预构建的卷积神经网络进行训练,所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层。

第二获取模块502,用于获取目标图像数据,将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量。

确定模块503,用于基于所述全连接层和所述特征向量,确定目标图像的目标图像类别。

在一些实施例中,图像分类装置500,具体用于卷积层的总层数比所述最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,所述全局平均池化层位于最后一层卷积层之后,所述全连接层位于所述全局平均池化层之后。

在一些实施例中,第二获取模块502,还用于获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图,每层卷积层对应一张特征图;将所有特征图输入全局平均池化层,得到每张特征图中所有像素的像素平均值;将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列,得到所述特征向量。

在一些实施例中,确定模块503,包括:

获取单元,用于获取所述全连接层中的权重矩阵,所述权重矩阵中的权重参数与所述特征向量中的元素一一对应。

计算单元,用于计算每个元素与相应的权重参数间的乘积,基于所有乘积之和,确定线性变换结果。

非线性处理单元,用于利用非线性激活函数,对所述线性变换结果进行非线性处理,得到预测类别向量。

确定单元,用于基于所述预测类别向量和归一化指数函数,确定所述目标图像类别。

在一些实施例中,确定单元,还用于基于所述归一化指数函数对所述预测类别向量中的所有元素进行转化,预测类别向量中的元素和图像类别一一对应;将每个元素的转化结果与所有元素的转化结果之和间的比值,确定为所述元素对应的目标概率;将最大目标概率相应的图像类别确定为所述目标图像类别。

在一些实施例中,图像分类装置500,还用于判断当前训练轮数是否达到预设训练轮数,若达到,则停止所述预构建的卷积神经网络的训练过程。

上述图像分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图像分类方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取历史图像数据集和预构建的卷积神经网络,利用所述历史图像数据集对所述预构建的卷积神经网络进行训练,所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;获取目标图像数据,将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量;基于所述全连接层和所述特征向量,确定目标图像的目标图像类别。

在一个实施例中,处理器执行计算机程序时所实现的卷积层的总层数比所述最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,所述全局平均池化层位于最后一层卷积层之后,所述全连接层位于所述全局平均池化层之后。

在一个实施例中,处理器执行计算机程序时所实现的将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量,包括:获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图,每层卷积层对应一张特征图;将所有特征图输入全局平均池化层,得到每张特征图中所有像素的像素平均值;将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列,得到所述特征向量。

在一个实施例中,处理器执行计算机程序时所实现的基于所述全连接层和所述特征向量,确定目标图像的目标图像类别,包括:获取所述全连接层中的权重矩阵,所述权重矩阵中的权重参数与所述特征向量中的元素一一对应;计算每个元素与相应的权重参数间的乘积,基于所有乘积之和,确定线性变换结果;利用非线性激活函数,对所述线性变换结果进行非线性处理,得到预测类别向量;基于所述预测类别向量和归一化指数函数,确定所述目标图像类别。

在一个实施例中,处理器执行计算机程序时所实现的基于所述预测类别向量和归一化指数函数,确定目标图像的目标图像类别,包括:基于所述归一化指数函数对所述预测类别向量中的所有元素进行转化,预测类别向量中的元素和图像类别一一对应;将每个元素的转化结果与所有元素的转化结果之和间的比值,确定为所述元素对应的目标概率;将最大目标概率相应的图像类别确定为所述目标图像类别。

在一个实施例中,处理器执行计算机程序时所实现的利用所述历史图像数据集对所述预构建的卷积神经网络进行训练之后,还包括:判断当前训练轮数是否达到预设训练轮数,若达到,则停止所述预构建的卷积神经网络的训练过程。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取历史图像数据集和预构建的卷积神经网络,利用所述历史图像数据集对所述预构建的卷积神经网络进行训练,所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;获取目标图像数据,将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量;基于所述全连接层和所述特征向量,确定目标图像的目标图像类别。

在一个实施例中,计算机程序被处理器执行时所实现的卷积层的总层数比所述最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,所述全局平均池化层位于最后一层卷积层之后,所述全连接层位于所述全局平均池化层之后。

在一个实施例中,计算机程序被处理器执行时所实现的将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量,包括:获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图,每层卷积层对应一张特征图;将所有特征图输入全局平均池化层,得到每张特征图中所有像素的像素平均值;将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列,得到所述特征向量。

在一个实施例中,计算机程序被处理器执行时所实现的基于所述全连接层和所述特征向量,确定目标图像的目标图像类别,包括:获取所述全连接层中的权重矩阵,所述权重矩阵中的权重参数与所述特征向量中的元素一一对应;计算每个元素与相应的权重参数间的乘积,基于所有乘积之和,确定线性变换结果;利用非线性激活函数,对所述线性变换结果进行非线性处理,得到预测类别向量;基于所述预测类别向量和归一化指数函数,确定所述目标图像类别。

在一个实施例中,计算机程序被处理器执行时所实现的基于所述预测类别向量和归一化指数函数,确定目标图像的目标图像类别,包括:基于所述归一化指数函数对所述预测类别向量中的所有元素进行转化,预测类别向量中的元素和图像类别一一对应;将每个元素的转化结果与所有元素的转化结果之和间的比值,确定为所述元素对应的目标概率;将最大目标概率相应的图像类别确定为所述目标图像类别。

在一个实施例中,计算机程序被处理器执行时所实现的利用所述历史图像数据集对所述预构建的卷积神经网络进行训练之后,还包括:判断当前训练轮数是否达到预设训练轮数,若达到,则停止所述预构建的卷积神经网络的训练过程。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取历史图像数据集和预构建的卷积神经网络,利用所述历史图像数据集对所述预构建的卷积神经网络进行训练,所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层;获取目标图像数据,将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量;基于所述全连接层和所述特征向量,确定目标图像的目标图像类别。

在一个实施例中,计算机程序被处理器执行时所实现的卷积层的总层数比所述最大池化层的总层数多一层,每两层卷积层间存在一层最大池化层,所述全局平均池化层位于最后一层卷积层之后,所述全连接层位于所述全局平均池化层之后。

在一个实施例中,计算机程序被处理器执行时所实现的将所述目标图像数据输入训练后的卷积神经网络,得到所述目标图像数据相应的特征向量,包括:获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图,每层卷积层对应一张特征图;将所有特征图输入全局平均池化层,得到每张特征图中所有像素的像素平均值;将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列,得到所述特征向量。

在一个实施例中,计算机程序被处理器执行时所实现的基于所述全连接层和所述特征向量,确定目标图像的目标图像类别,包括:获取所述全连接层中的权重矩阵,所述权重矩阵中的权重参数与所述特征向量中的元素一一对应;计算每个元素与相应的权重参数间的乘积,基于所有乘积之和,确定线性变换结果;利用非线性激活函数,对所述线性变换结果进行非线性处理,得到预测类别向量;基于所述预测类别向量和归一化指数函数,确定所述目标图像类别。

在一个实施例中,计算机程序被处理器执行时所实现的基于所述预测类别向量和归一化指数函数,确定目标图像的目标图像类别,包括:基于所述归一化指数函数对所述预测类别向量中的所有元素进行转化,预测类别向量中的元素和图像类别一一对应;将每个元素的转化结果与所有元素的转化结果之和间的比值,确定为所述元素对应的目标概率;将最大目标概率相应的图像类别确定为所述目标图像类别。

在一个实施例中,计算机程序被处理器执行时所实现的利用所述历史图像数据集对所述预构建的卷积神经网络进行训练之后,还包括:判断当前训练轮数是否达到预设训练轮数,若达到,则停止所述预构建的卷积神经网络的训练过程。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 一种内部空气循环流动的冷库
  • 一种基于空气循环流动控热的开关配电柜
  • 一种基于电缆沟空气流动换热的强制通风户外机柜
技术分类

06120116516812