导航：首页> 手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手>一种基于图像特征自适应卷积网络的图像分类方法和系统

一种基于图像特征自适应卷积网络的图像分类方法和系统

文献发布时间：2023-06-19 11:54:11

技术领域

本发明实施例涉及计算机视觉图像识别技术领域，特别涉及一种基于图像特征自适应卷积网络的图像分类方法和系统。

背景技术

近几年以来，随着科学计算机网络及人工智能领域的发展，图形图像数据量逐渐增多，于是，如何从大量的自然图像中快速提取到视觉特征已经成了机器智能学习中的热点研究课题，进而对自然图像的分类必然成为获取自然图像信息的研究重点。

近年来深度学习在学术界、科技界应用广泛，尤其在图像领域，目前已经在图像分类领域取得较大进展，取得不错成效。目前深度学习在学术界研究较多，但工业领域应用较少，因为工业视觉检测领域非常细分，很多非标项目，主流的AlexNet、VGG16、GoogleNet等网络并不能直接应用于工业视觉领域的非标项目中，需要进行实验测试改进网络结构参数才能取得较好效果，但这样会耗费企业大量的人力成本、时间成本。

发明内容

本发明实施例的目的在于提供一种基于图像特征自适应卷积网络的图像分类方法和系统，提高对不同种类相似图像的区分能力，提高网络的图像分类准确率。

为解决上述技术问题，第一方面，本发明的实施例提供了一种基于图像特征自适应卷积网络的图像分类方法，包括：

获取所有待分类样本图像的边缘轮廓平均数，以及所有待分析样本图像的加速稳健特征点平均数；

确定所述边缘轮廓平均数和所述加速稳健特征点平均数之和所处特征量范围，选择与所述特征量范围对应的网络结构模型；

基于所述待分类样本图像和所述网络结构模型进行神经网络训练，得到用于图像分类的分类模型；

基于所述分类模型进行待分类样本的图像分类。

作为优选的，所述特征量选择范围包括第一特征量选择范围、第二特征量选择范围和第三特征量选择范围；

所述第一特征量选择范围为[0，30)；

所述第二特征量选择范围为[30，50)；

所述第三特征量选择范围为[50，+∞)。

作为优选的，所述网络结构模型包括第一网络结构模型、第二网络结构模型和第三网络结构模型；所述第一网络结构模型对应所述第一特征选择范围，所述第二网络结构模型对应所述第二特征选择范围，所述第三网络结构模型对应所述第三特征选择范围。

作为优选的，所述第一网络结构模型包括第一输入层、第一卷积层A、第一最大值池化层A、第一卷积层B、第一最大池化层B、第一全连接层A、第一全连接层B和第一输出层；

所述第一卷积层A的卷积核个数为3，卷积核大小为11*11；

所述第一最大值池化层A的核大小为2*2；

所述第一卷积层B的卷积核个数为3，卷积核大小为11*11；

所述第一最大值池化层B的核大小为2*2；

所述第一全连接层A包括120个神经节点，所述第一全连接层B包括84个神经节点；

所述第一输出层的输出节点为N，其中N为所述待分类样本图像的分类数。

作为优选的，所述第二网络结构模型包括第二输入层、第二卷积层A、第二最大值池化层A、第二卷积层B、第二最大池化层B、第二卷积层C、第二最大池化层C、第二全连接层A、第二全连接层B和第二输出层；

所述第二卷积层A的卷积核个数为6，卷积核大小为7*7；

所述第二最大值池化层A的核大小为2*2；

所述第二卷积层B的卷积核个数为6，卷积核大小为7*7；

所述第二最大值池化层B的核大小为2*2；

所述第二卷积层C的卷积核个数为6，卷积核大小为5*5；

所述第二最大值池化层C的核大小为2*2；

所述第二全连接层A包括120个神经节点，所述第二全连接层B包括84个神经节点；

所述第二输出层的输出节点为N，其中N为所述待分类样本图像的分类数。

作为优选的，所述第三网络结构模型包括第三输入层、第三卷积层A、第三最大值池化层A、第三卷积层B、第三最大池化层B、第三卷积层C、第三最大池化层C、第三卷积层D、第三最大池化层D、第三全连接层A、第三全连接层B和第三输出层；

所述第三卷积层A的卷积核个数为16，卷积核大小为3*3；

所述第三最大值池化层A的核大小为2*2；

所述第三卷积层B的卷积核个数为16，卷积核大小为3*3；

所述第三最大值池化层B的核大小为2*2；

所述第三卷积层C的卷积核个数为16，卷积核大小为3*3；

所述第三最大值池化层C的核大小为2*2；

所述第三卷积层D的卷积核个数为1 6，卷积核大小为3*3；

所述第三最大值池化层D的核大小为2*2；

所述第三全连接层A包括120个神经节点，所述第三全连接层B包括84个神经节点；

所述第三输出层的输出节点为N，其中N为所述待分类样本图像的分类数。

第二方面，本发明实施例提供一种基于图像特征自适应卷积网络的图像分类系统，包括：

特征提取模块，获取所有待分类样本图像的边缘轮廓平均数，以及所有待分析样本图像的加速稳健特征点平均数；

模型选择模块，确定所述边缘轮廓平均数和所述加速稳健特征点平均数之和所处特征量范围，选择与所述特征量范围对应的网络结构模型；

训练模块，基于所述待分类样本图像和所述网络结构模型进行神经网络训练，得到用于图像分类的分类模型；

分类模块，基于所述分类模型进行待分类样本的图像分类。

第三方面，本发明实施例提供一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如本发明第一方面实施例所述基于图像特征自适应卷积网络的图像分类方法的步骤。

第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如本发明第一方面实施例所述基于图像特征自适应卷积网络的图像分类方法的步骤。

本发明实施例提供了一种基于图像特征自适应卷积网络的图像分类方法和系统，通过计算待检测图像的特征信息，自动选择合适的网络结构，在保证图像分类任务的准确率下，提高深度学习网络的应用效率，减少企业人力、时间成本。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1是根据本发明第一实施例的一种基于图像特征自适应卷积网络的图像分类方法示意图；

图2是根据本发明第一实施例的第一网络结构模型结构示意图；

图3是根据本发明第一实施例的第二网络结构模型结构示意图；

图4是根据本发明第一实施例的第三网络结构模型结构示意图；

图5是根据本发明第三实施例的一种服务器示意图。

具体实施例

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施例进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施例中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施例的种种变化和修改，也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便，不应对本发明的具体实现方式构成任何限定，各个实施例在不矛盾的前提下可以相互结合相互引用。

本申请实施例中的术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列部件或单元的系统、产品或设备没有限定于已列出的部件或单元，而是可选地还包括没有列出的部件或单元，或可选地还包括对于这些产品或设备固有的其它部件或单元。本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

下面对本实施例的基于图像特征自适应卷积网络的图像分类方法和系统的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。

本发明的第一实施例涉及一种基于图像特征自适应卷积网络的图像分类方法，如图1中所示，包括：

获取所有待分类样本图像的边缘轮廓平均数，以及所有待分析样本图像的加速稳健特征点平均数；

确定所述边缘轮廓平均数和所述加速稳健特征点平均数之和所处特征量范围，选择与所述特征量范围对应的网络结构模型；

基于所述待分类样本图像和所述网络结构模型进行神经网络训练，得到用于图像分类的分类模型；

基于所述分类模型进行待分类样本的图像分类。

具体的，本实施例以CIFAR-10数据集作一个10分类的问题作实例。CIFAR-10数据集一共有10种图片，包括(飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车)，将CIFAR-10图像集每张图片缩放至100*100，然后划分为训练集、测试集。

提取训练集所有图像的边缘轮廓数平均个数Mean

在上述实施例的基础上，作为一种优选的实施方式，所述特征量选择范围包括第一特征量选择范围、第二特征量选择范围和第三特征量选择范围；

所述第一特征量选择范围为：0≤(Mean

所述第二特征量选择范围为：30≤(Mean

所述第三特征量选择范围为：50≤(Mean

具体的，所述网络结构模型包括第一网络结构模型、第二网络结构模型和第三网络结构模型；所述第一网络结构模型对应所述第一特征选择范围，所述第二网络结构模型对应所述第二特征选择范围，所述第三网络结构模型对应所述第三特征选择范围。

在上述实施例的基础上，作为一种优选的实施方式，如图2中所示，所述第一网络结构模型包括第一输入层、第一卷积层A、第一最大值池化层A、第一卷积层B、第一最大池化层B、第一全连接层A、第一全连接层B和第一输出层；

所述第一卷积层A的卷积核个数为3，卷积核大小为11*11；

所述第一最大值池化层A的核大小为2*2；

所述第一卷积层B的卷积核个数为3，卷积核大小为11*11；

所述第一最大值池化层B的核大小为2*2；

所述第一全连接层A包括120个神经节点，所述第一全连接层B包括84个神经节点；

所述第一输出层的输出节点为N，其中N为所述待分类样本图像的分类数。

在上述实施例的基础上，作为一种优选的实施方式，如图3中所示，所述第二网络结构模型包括第二输入层、第二卷积层A、第二最大值池化层A、第二卷积层B、第二最大池化层B、第二卷积层C、第二最大池化层C、第二全连接层A、第二全连接层B和第二输出层；

所述第二卷积层A的卷积核个数为6，卷积核大小为7*7；

所述第二最大值池化层A的核大小为2*2；

所述第二卷积层B的卷积核个数为6，卷积核大小为7*7；

所述第二最大值池化层B的核大小为2*2；

所述第二卷积层C的卷积核个数为6，卷积核大小为5*5；

所述第二最大值池化层C的核大小为2*2；

所述第二全连接层A包括120个神经节点，所述第二全连接层B包括84个神经节点；

所述第二输出层的输出节点为N，其中N为所述待分类样本图像的分类数。

在上述实施例的基础上，作为一种优选的实施方式，如图4中所示，所述第三网络结构模型包括第三输入层、第三卷积层A、第三最大值池化层A、第三卷积层B、第三最大池化层B、第三卷积层C、第三最大池化层C、第三卷积层D、第三最大池化层D、第三全连接层A、第三全连接层B和第三输出层；

所述第三卷积层A的卷积核个数为16，卷积核大小为3*3；

所述第三最大值池化层A的核大小为2*2；

所述第三卷积层B的卷积核个数为16，卷积核大小为3*3；

所述第三最大值池化层B的核大小为2*2；

所述第三卷积层C的卷积核个数为16，卷积核大小为3*3；

所述第三最大值池化层C的核大小为2*2；

所述第三卷积层D的卷积核个数为1 6，卷积核大小为3*3；

所述第三最大值池化层D的核大小为2*2；

所述第三全连接层A包括120个神经节点，所述第三全连接层B包括84个神经节点；

所述第三输出层的输出节点为N，其中N为所述待分类样本图像的分类数。

Mean

选择好第三网络结构模型后，利用第三网络结构模型对训练集数据进行训练，得到分类模型；

将训练好的分类模型对测试集数据进行分类识别。

本发明实施例的方法与AlexNet、VGG16、GoogleNet基于CIFAR-10数据集对比测试，结果如下表1：

表1四种方法测试结果对比

由上表1可以看出，本发明实施例的方法准确率高于主流深度学习方法AlexNet、VGG16、GoogleNet。

本发明第二实施例提供一种基于图像特征自适应卷积网络的图像分类系统，基于上述各实施例中的基于图像特征自适应卷积网络的图像分类方法，包括：

特征提取模块，获取所有待分类样本图像的边缘轮廓平均数，以及所有待分析样本图像的加速稳健特征点平均数；

模型选择模块，确定所述边缘轮廓平均数和所述加速稳健特征点平均数之和所处特征量范围，选择与所述特征量范围对应的网络结构模型；

训练模块，基于所述待分类样本图像和所述网络结构模型进行神经网络训练，得到用于图像分类的分类模型；

分类模块，基于所述分类模型进行待分类样本的图像分类。

本发明第三实施例涉及一种服务器，如图5所示，包括处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行如上述各实施例所述基于图像特征自适应卷积网络的图像分类方法的步骤。例如包括：

获取所有待分类样本图像的边缘轮廓平均数，以及所有待分析样本图像的加速稳健特征点平均数；

确定所述边缘轮廓平均数和所述加速稳健特征点平均数之和所处特征量范围，选择与所述特征量范围对应的网络结构模型；

基于所述待分类样本图像和所述网络结构模型进行神经网络训练，得到用于图像分类的分类模型；

基于所述分类模型进行待分类样本的图像分类。

其中，存储器和处理器采用通信总线方式连接，通信总线可以包括任意数量的互联的总线和桥，通信总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在通信总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器。

处理器负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。

本发明第四实施例涉及一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现如上述各实施例所述基于图像特征自适应卷积网络的图像分类方法的步骤。例如包括：

获取所有待分类样本图像的边缘轮廓平均数，以及所有待分析样本图像的加速稳健特征点平均数；

确定所述边缘轮廓平均数和所述加速稳健特征点平均数之和所处特征量范围，选择与所述特征量范围对应的网络结构模型；

基于所述待分类样本图像和所述网络结构模型进行神经网络训练，得到用于图像分类的分类模型；

基于所述分类模型进行待分类样本的图像分类。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：徐晨;周松斌;刘伟鑫;
专利申请人：广东省科学院智能制造研究所;

上一篇：一种基于最优训练集的深度学习图像分类方法及系统
下一篇：一种基于智能控制的翻转机构