基于深度学习的图像识别和分类算法

文献发布时间：2024-04-18 19:57:31

技术领域

本发明涉及图像处理技术领域，具体涉及基于深度学习的图像识别和分类算法。

背景技术

深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据，是机器学习中的重要研究方向，为人工智能领域的重要条件。而图像的传统识别流程分为四个步骤：图像采集→图像预处理→特征提取→图像识别，在此过程中，加入深度学习可以使得图像识别更加高效且智能，利用深度学习来进行图像识别和分类是深度学习的一项重要利用方式，图像识别也是人工智能发展的重要数据获取手段。

现有技术中，图像识别和分类依靠深度学习进行发展是一个技术进步的重要研究方向，然而现有的图像识别和分类算法在实际使用时需要依靠大量的图像数据进行算法模型训练，以此来提高算法模型的准确性，但在数据收集过程中的大量数据无法通过人工一一选定，而数据又非常容易出现重复等情况，最终可能导致算法模型训练存在偏差的问题，但少量的数据又会导致算法模型出现漏洞，不利于算法模型的发展，存在改进。

发明内容

针对现有技术所存在的上述缺点，本发明的第一目的在于提供基于深度学习的图像识别和分类算法，解决上述背景技术中的问题。

为实现上述目的，本发明提供了如下技术方案：

基于深度学习的图像识别和分类算法，包括以下步骤：

S1、数据收集，从互联网上收集图像数据，并将其分为训练集、验证集和测试集；

S2、图像预处理，将训练集进行处理；

S3、模型训练，使用预处理后的训练集进行算法优化；

S4、模型评估，使用验证集对算法模型进行评估；

S5、模型应用，将训练好的模型应用于新的图像数据，对图像进行分类和识别。

本发明进一步设置为：所述步骤S2中：

S2.1、利用已有算法对训练集内图像进行分类；

S2.2、对图像训练集中的图像进行镜像处理；

S2.3、关联原图像与镜像图像，并将对应的图像镜像算法标注至镜像图像上；

S2.4、将训练集中的图像特征提取记为a

S2.5、将对应的图像特征标记在对应的图像文件数据上。

本发明进一步设置为：所述步骤S3中：

S3.1、选用算法对训练集图像进行特征提取记为a

S3.2、建立图像坐标模型，将a

S3.3、建立镜像图像坐标模型，将b

S3.4、重新校对a

S3.5、选定对应偏差点位的纠正算法，提高对应算法在对应点位的计算优先级；

S3.6、使用训练集中的其它图像进行多次训练；

S3.7、统计不同图像中相同点位的图像特征提取算法，对图像进行再次特征提取，以准确度重新调整对应算法优先级；

S3.8、以调整优先级后的算法作为基础识别和分类算法；

S3.9、根据提取出的图像特征进行分类；

S3.10、选定算法逻辑，作为图像识别和分类算法。

本发明进一步设置为：所述步骤S4中：

S4.1、使用图像识别和分类算法对验证集图像进行识别和分类；

S4.2、检验验证集图像的识别和分类结果；

S4.3、根据验证集图像分类和识别结果评估算法模型。

本发明进一步设置为：所述步骤2.2中，选用多种图像镜像算法，锚定镜像图像算法与对应生成的镜像图像。

本发明进一步设置为：所述步骤S3.2中，图像坐标模型单独建立，在使用时将图像置于图像坐标模型中，以图像边缘重叠坐标轴为定位方式。

本发明进一步设置为：所述步骤2.4中，每次原图像与镜像图像识别分类完成后，生成日志报告，并关联在对应图像数据上。

本发明的有益效果：本发明通过对训练集图像进行镜像处理，并利用镜像图像与原图像之间的数据联系，来拓展算法模型训练时的训练集的量，通过不同的镜像角度生成不同角度的镜像图像，再利用算法模型对镜像图像进行识别，通过该识别结果与原图的数据进行对比来纠正算法模型中不合适的计算方式，经过多重优化得出最终准确的算法模型，通过该方式来减少训练集中的图像数量，减少人工筛选的工作量，并且由于对图像进行镜像处理可以获得大量的图像供训练使用，所以使用者可以在训练的同时来增加训练集中的图像数量而不影响模型的训练，大大提高了算法模型训练时的均衡性，降低算法模型出现偏差的概率以及算法模型出现漏洞的概率。

附图说明

图1为本发明基于深度学习的图像识别和分类算法的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合实施例对本发明作进一步的描述。

实施例

如图1所示，基于深度学习的图像识别和分类算法，包括以下步骤：

S1、数据收集，从互联网上收集图像数据，并将其分为训练集、验证集和测试集；

其中，使用者在从互联网上收集图像数据时，可以进行首先人工筛选，并直接选定为训练集、验证集或测试集，通过人工筛选的方式使得收集的数据更加均衡或者更加贴合使用目的；

S2、图像预处理，将训练集进行处理，该步骤主要是利用单一图像来生成多种具有精确数据的图像，并且生成的图像与原图像不会出现类型变化的情况，保证了作为训练、验证和测试的图像种类占比不会出现变化，该步骤具体为：

S2.1、利用已有分类算法对训练集内图像进行分类；

其中，该步骤采用的算法包括但不限于：深度优先搜索、广度优先搜索、残差收缩网络等方式，并且在分类前保留人工筛选结果，利用算法对训练集内图像分类后再对比人工筛选与算法分类结果，核对不同图像，根据分类逻辑决定图像最终分类；

S2.2、对图像训练集中的图像进行镜像处理；

其中，镜像处理过程中采用不定对称轴方式进行，具体为首先采用水平镜像算法对图形进行镜像，然后再利用图像旋转算法对图像进行旋转，在镜像后的图像旋转过程中的旋转轴即为对称轴；

S2.3、关联原图像与镜像图像，并将对应的图像镜像算法标注至镜像图像上；

其中，原图像的各特征坐标点数据与镜像图像的对应特征坐标点进行关联，在算法模型对镜像图形进行特征提取时同样提取特征点所在的坐标数据，方便算法模型提取的数据与原镜像图形数据进行对比，观察差异；

S2.4、将训练集中的图像特征提取记为a

首先使用水平图像镜像算法对图像进行镜像处理：

设图像大小为M*N；

x’＝x；

y’＝N-1-y；

得出镜像图像后立即进行图像旋转，图像的旋转计算公式如下：

X’＝X*COSQ—Y*SINQY’＝X*SINQ+Y*COSQ；

上述计算公式计算出的值为小数，而坐标值为正整数，因此采用插值处理。上述计算公式计算的结果值所在范围与原来的值所在的范围不同。

若以(CX，CY)为中心，角度Q逆时针旋转；

X’＝(X—CX)*COSQ—(Y—YC)*SINQ+CX；

Y’＝(X—CX)*SINQ+(Y—YC)*COSQ+CY；

其中，(x,y)为源图像的坐标,(x’,y’)为新图像的坐标；

上述过程中，每次原图像与镜像图像识别分类完成后，生成日志报告，并关联在对应图像数据上，方便使用者对图像识别和分类过程和结果进行检验；

S2.5、将对应的图像特征标记在对应的图像文件数据上；

S3、模型训练，使用预处理后的训练集进行算法优化，利用该方式主要利用训练集中的图像对算法模型进行训练，利用镜像后不同的图像数据来当作训练集的图像量扩充，并且在扩大训练量的同时不改变图像类型占比，使得算法模型对图像的识别和分类训练更加均衡且精准，该步骤具体为：

S3.1、选用算法对训练集图像进行特征提取记为a

S3.2、建立图像坐标模型，将a

S3.3、建立镜像图像坐标模型，将b

S3.4、重新校对a

S3.5、选定对应偏差点位的纠正算法，提高对应算法在对应点位的计算优先级；

S3.6、使用训练集中的其它图像进行多次训练；

S3.7、统计不同图像中相同点位的图像特征提取算法，对图像进行再次特征提取，以准确度重新调整对应算法优先级；

S3.8、以调整优先级后的算法作为基础识别和分类算法；

S3.9、根据提取出的图像特征进行分类；

S3.10、选定算法逻辑，作为图像识别和分类算法；

S4、模型评估，使用验证集对算法模型进行评估，具体为：

S4.1、使用图像识别和分类算法对验证集图像进行识别和分类；

S4.2、检验验证集图像的识别和分类结果；

S4.3、根据验证集图像分类和识别结果评估算法模型；

S5、模型应用，将训练好的模型应用于新的图像数据，对图像进行分类和识别

工作原理：

本发明通过对训练集图像进行镜像处理，并利用镜像图像与原图像之间的数据联系，来拓展算法模型训练时的训练集的量，通过不同的镜像角度生成不同角度的镜像图像，再利用算法模型对镜像图像进行识别，通过该识别结果与原图的数据进行对比来纠正算法模型中不合适的计算方式，经过多重优化得出最终准确的算法模型，通过该方式来减少训练集中的图像数量，减少人工筛选的工作量，并且由于对图像进行镜像处理可以获得大量的图像供训练使用，所以使用者可以在训练的同时来增加训练集中的图像数量而不影响模型的训练，大大提高了算法模型训练时的均衡性，降低算法模型出现偏差的概率以及算法模型出现漏洞的概率。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载