缺陷检测方法、装置、设备及存储介质

文献发布时间：2024-04-18 19:58:53

技术领域

本发明涉及图像检测领域，尤其涉及一种缺陷检测方法、装置、设备及存储介质。

背景技术

产品的质量和可靠性对企业的成功至关重要，目前，图像缺陷检测方法已经应用于产品的检测，它是指利用计算机视觉技术来自动识别和定位图像中的缺陷、异常或不良部分的过程，现有的缺陷检测方法一般是根据大量有效标注数据进行训练，并且通常集中在局部特征的提取。

这种方法会忽略上下文信息和条件信息，从而导致检测精度和速度不高。

发明内容

本发明的主要目的在于提供一种缺陷检测方法、装置、设备及存储介质，旨在解决如何实现检测精度和速度都提高的问题。

为实现上述目的，本发明提供一种缺陷检测方法，所述缺陷检测方法包括以下步骤：

获取第一图像；

将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到缺陷检测的结果；

输出所述缺陷检测的结果。

可选地，所述获取第一图像之前，还包括：

将待检测的图像进行预处理，得到预处理后的图像，所述预处理至少包括mosaic数据增强与自适应锚框计算；

将所述预处理后的图像输入至对抗神经网络模型，得到第一图像。

可选地，所述将所述预处理后的图像输入至对抗神经网络模型之前，还包括：

将所述预处理后的图像输入至对抗神经网络算法中的生成模型，得到虚假的高分辨率图像，根据所述虚假的高分辨率图像和真实的高分辨率图像得到内容损失和对抗损失；

根据所述内容损失和对抗损失构建损失函数；

基于所述损失函数进行模型训练，得到对抗神经网络模型。

可选地，所述根据所述虚假的高分辨率图像和真实的高分辨率图像得到内容损失和对抗损失包括：

将所述虚假高分辨率图像和真实的高分辨率图像输入至VGG网络中进行特征提取，得到特征图以及所述虚假高分辨率图像和所述真实的高分辨率各自对应的特征向量；

基于所述特征图通过MSE均方根误差得到内容损失，并将所述虚假高分辨率图像和所述真实的高分辨率各自对应的特征向量进行比对，得到对抗损失。

可选地，所述将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到所述缺陷检测的结果包括：

将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块调用预设高效长程聚合网络层对第一图像进行处理，得到第二图像；

将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构得到缺陷检测的结果。

可选地，所述将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构得到缺陷检测的结果包括：

将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构；

通过所述加权双向特征金字塔架构对所述第二图像进行权重设置，并通过高效特征融合方式对所述第二图像对应的权重进行自动调整，得到所述缺陷检测的结果。

可选地，所述加权双向特征金字塔架构是通过将所述特征提取网络模块中负责特征信息融合的两条分支末端进行张量拼接操作，并结合加权双向特征金字塔得到的。

此外，为实现上述目的，本发明还提出一种缺陷检测装置，所述缺陷检测装置包括：

获取模块，用于获取第一图像；

检测模块，用于将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到所述缺陷检测的结果；

输出模块，用于输出所述缺陷检测的结果。

此外，为实现上述目的，本发明还提出一种缺陷检测设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的检测程序，所述检测程序配置为实现如上文所述的缺陷检测方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有检测程序，所述检测程序被处理器执行时实现如如上文所述的缺陷检测方法的步骤。

本发明通过获取第一图像；将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到缺陷检测的结果；输出所述缺陷检测的结果。从而根据调用预设高效长程聚合网络层和加权双向特征金字塔架构对图像进行处理。实现了降低成本，更好的联系上下文信息和条件信息，提高检测精度和速度的效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的缺陷检测设备的结构示意图；

图2为本发明缺陷检测方法第一实施例的流程示意图；

图3为本发明缺陷检测方法的生成网络模型结构图；

图4为本发明缺陷检测方法的判别网络模型结构图；

图5为本发明缺陷检测方法的高效长程聚合网络层结构图；

图6为本发明缺陷检测方法的加权双向特征金字塔架构图；

图7为本发明缺陷检测方法的ELAN-T网络结合加权双向特征金字塔架构后的网络架构图；

图8为本发明缺陷检测方法的第二实施例的流程示意图；

图9为本发明缺陷检测方法的算法网络结构图；

图10为本发明缺陷检测装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的缺陷检测设备结构示意图。

如图1所示，该缺陷检测设备可以包括：处理器1001，例如中央处理器(CentralProcessing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity，Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory，RAM)存储器，也可以是稳定的非易失性存储器(Non-Volatile Memory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对缺陷检测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及检测程序。

在图1所示的缺陷检测设备中，网络接口1004主要用于与其他设备进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明缺陷检测设备中的处理器1001、存储器1005可以设置在缺陷检测设备中，所述缺陷检测设备通过处理器1001调用存储器1005中存储的检测程序，并执行本发明实施例提供的缺陷检测方法。

本发明实施例提供了一种缺陷检测方法，参照图2，图2为本发明一种缺陷检测方法第一实施例的流程示意图。

本实施例中，所述缺陷检测方法包括：

步骤S10：获取第一图像。

将经过预处理的图像作为输入被引入到对抗神经网络模型中，这一步骤将产生第一图像，这个图像可能是经过创造性处理的，与原始图像有所不同。其中对抗神经网络模型中包括生成网络模型和判别网络模型，并且对抗神经网络模型是经过训练得到的。

需要说明的是，本实施例的执行主体可为缺陷检测方法设备，还可为其他可实现相同或相似的设备，本实施例对此不作限制，本实施例以缺陷检测方法设备为例进行说明。

进一步地，在一种可行的实施例中，步骤S10包括：

步骤S101：将待检测的图像进行预处理，得到预处理后的图像，所述预处理至少包括mosaic数据增强与自适应锚框计算；

应当理解的是，待检测的图像是指一个需要进行分析、识别、检测或评估的视觉信息的数字表示。这种图像可能是通过照相、扫描或生成等方式获得的，通常以像素阵列的形式存储，每个像素包含有关颜色、亮度和其他视觉属性的信息。待检测的图像可以涵盖各种领域，包括计算机视觉、医学影像、遥感图像、工业质检以及安全监控等。

需要说明的是，Mosaic数据增强是一种在计算机视觉和深度学习中常用的图像增强技术，旨在增强训练数据的多样性和鲁棒性。该技术通过将多张不同的图像合并成一个大的合成图像，从而创建一个更具挑战性的训练样本。Mosaic数据增强一般包括以下步骤：

图像收集：从训练数据集中随机选择四张不同的图像；随机裁剪和缩放：对选定的四张图像进行随机裁剪和缩放，使它们适合在合成图像中拼接。这有助于模拟不同距离和尺度下的真实世界场景；合成图像创建：将经过裁剪和缩放的四张图像拼接成一个大的合成图像。通常，这些图像会在一个2x2的格子中排列，形成一个“马赛克”效果；标签调整：与合成图像中各个子图像对应的标签也需要进行相应的调整。这涉及将物体的位置和边界框信息更新到合成图像的坐标系中。

自适应锚框计算是目标检测算法中的一种技术，用于生成适合不同尺度和比例目标的锚框(也称为锚点或先验框)。锚框是在图像上预定义的矩形框，用于在不同位置、尺度和长宽比情况下尝试匹配图像中的目标。传统的锚框生成方法在固定的尺度和长宽比上生成一组锚框，但现实世界中的目标具有多样性，因此需要更灵活的方法来适应各种目标形状和大小。这就是自适应锚框计算的目的。自适应锚框计算通常涉及以下步骤：

特征图生成：目标检测算法通常会使用卷积神经网络(CNN)生成特征图。这些特征图捕获了图像中不同层次的信息，如边缘、纹理和对象的高级特征；锚框的初始设置：对于每个特征图上的位置，设置一组初始的锚框，这些锚框具有不同的尺度和长宽比；特征图上的预测：在每个特征图上，使用训练得到的模型进行目标预测。这些预测包括目标的类别和位置；锚框的调整：根据特征图上的预测结果，动态地调整锚框的尺度和比例，使其更好地适应目标的实际尺寸和形状。这可以根据预测的目标位置和特征图上的位置来完成；目标匹配：根据调整后的锚框和预测的目标位置，执行目标匹配，将锚框与实际目标关联起来；训练和优化：使用调整后的锚框进行目标检测模型的训练，同时优化模型的参数，使其能够更准确地预测目标位置和类别。

在进行目标检测任务之前，对待检测的图像进行预处理。其中，Mosaic数据增强技术被应用于图像，这将在一个单一的合成图像中融合四幅不同的图像。通过这种方式，图像中的多种场景和物体可以相互交织，为模型提供更丰富的训练样本。这种增强有助于模型更好地应对多样性和复杂性，从而提高其在真实环境中的性能。进一步地，自适应锚框计算被引入以适应目标的多样性尺寸和形状。传统的锚框设置方法往往难以涵盖所有可能的目标，因此自适应锚框计算调整了锚框的尺度和比例，以更好地与目标匹配。这种计算考虑了特征图上的预测结果，以动态地调整每个位置的锚框，从而在不同尺度下更精确地捕捉目标。从而得到预处理后的图像。

步骤S102：将所述预处理后的图像输入至对抗神经网络模型，得到第一图像。

将经过预处理的图像作为输入被引入到对抗神经网络模型中，这一步骤将产生第一图像，这个图像可能是经过创造性处理的，与原始图像有所不同。

其中对抗神经网络模型中包括生成网络模型和判别网络模型。示例性地，参照图3，图3为生成网络模型结构图，其中Input表示输入，LR表示待检测图像，SR表示输出。n表示输出的通道数，s表示步长，conv表示卷积层，ReLU表示函数，可以表示为：

f(x)＝max(0,x)；

其中，x是输入值，f(x)是输出值。BN指的是批量归一化(Batch Normalization)，它是一种深度学习中常用的技术，用于加速神经网络的训练并提高模型的稳定性。Elementwise Sum代表残差结构中的相加结构。PixelShuffler表示一种用于图像超分辨率和生成模型中的技术，通常用于将低分辨率的图像转换成高分辨率的图像。

由图3可知，低分辨率图进入对抗神经网络模型中的生成网络模型后，首先经过卷积网络和ReLU函数，然后经过B个残差网络，每个残差网络包

含两个卷积层、两个标准化、两个ReLU函数和残差边，最后进入上采样部分将长宽放大采样后变成原来的四倍，从而提高分辨率。

参照图4，图4为判别网络模型结构图，其中Input表示输入，Leaky ReLU是一种激活函数，是对传统的ReLU激活函数的扩展。可以表示为：

其中，x是输入，α是一个小的正数，通常接近于0。当x大于零时，函数的行为与ReLU相同；当x小于等于零时，函数允许一个小的负数斜率α。BN指的是批量归一化，Dense指的是全连接层也称为密集层。全连接层是神经网络的一种基本层类型，它的每个神经元都与前一层的每个神经元相连接，形成一个密集的连接结构。示例性地，dense(1024)是指一个神经网络层的配置，其中1024表示该层中的神经元数量。Sigmoid表示一种激活函数。它具有S形曲线，其数学表示如下：

其中，x表示输入，f(x)表示输出，e为自然底数。

判别网络模型的训练是将真实的高分辨率图像和虚假的低分辨率图像传入判别网络中，分别与1和0对比得到损失函数，利用损失函数判别模型。

步骤S20：将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到缺陷检测的结果；

应当理解的是，检测模型包括特征提取网络模块和双向加权特征网络模块，其中特征提取网络模块是由CBL卷积块、预设高效长程聚合网络层(ELAN-T)和MPConv卷积层张量拼接不同特征得到的。双向加权特征网络模块是通过将特征提取网络模块中负责特征信息融合的两条分支末端进行张量拼接操作，并结合加权双向特征金字塔(BiFPN)得到的。通过将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到缺陷检测的结果，结果表示为图片形式，并会携带图片的信息，这些信息可能包括缺陷的位置，也就是图像中具体的坐标或区域，以及缺陷的性质，例如是什么类型的缺陷。此外，还可能包括缺陷的数量，大小，形状等。

需要说明的是，CBL(Convolutional Block Layer，卷积块层)是一种常见的卷积神经网络中的模块，用于在图像处理和计算机视觉任务中提取特征。CBL卷积块通常由多个卷积层、归一化层(Normalization Layer)和激活函数层组成，用来增强网络的特征提取能力。预设高效长程聚合网络(Efficient Long-range Aggregation Network，ELAN)是一种用于图像处理和计算机视觉任务的神经网络层，用于在网络中引入长程依赖关系，以提高特征的感知能力和信息聚合能力。ELAN-T层是ELAN网络的一个变体，ELAN-T层的主要目标是捕获图像中更广阔范围的上下文信息，从而更好地理解图像中的结构和语义。为实现这一目标，ELAN-T层通常会采取一些策略。MPConv卷积层是卷积神经网络(CNN)中的核心组件之一。卷积层用于从输入数据中提取特征，通过对输入数据(通常是图像)应用一组卷积核(或过滤器)，在不同的位置上滑动进行卷积操作，从而提取图像的各种特征，如边缘、纹理、形状等。这些特征的提取是通过计算输入数据和卷积核之间的逐元素乘积并求和来实现的。张量拼接(Tensor Concatenation)是指将多个张量(多维数组)按照某个维度进行连接或拼接，以创建一个更大的张量。这在深度学习中常用于在模型处理数据时，将多个张量组合在一起，以便进行下一步的计算和分析。

进一步地，在一种可行的实施例中，步骤S20包括：

步骤S201：将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块调用预设高效长程聚合网络层对第一图像进行处理，得到第二图像；

将第一图像导入检测模型中，在检测模型内部，通过特征提取网络模块，该模块从图像中抽取出多层次的特征。这些特征可以捕获图像的低级纹理、中级物体形状以及高级语义信息。然后使用预设的高效长程聚合网络层(ELAN-T)来对特征图进行处理。这些层的设计旨在引入图像内部不同区域的长程关联和上下文信息，从而增强图像的表达能力和感知范围。这可以帮助捕获全局信息和跨远距离的关系，从而提升图像处理的质量。从而获得了经过更深度处理的特征图。这些特征包含了更丰富的信息和上下文关联。这些特征被用于生成第二张图像，这张图像可能在质量、内容或者特定任务上与原始图像有所不同。

参照图5，图5为预设的高效长程聚合网络层的结构图，其中CBS表示卷积块，用于处理输入数据并从中提取特征，concat指的是连接操作。

步骤S202：将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构得到缺陷检测的结果。

进一步地，在一种可行的实施例中，步骤S202包括：

步骤S2021：将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构；

将经过预设的高效长程聚合网络层处理后得到的第二图像，经过检测模型中的双向加权特征网络模块的处理。在这个模块中，采用了加权双向特征金字塔架构，该架构结合了来自不同尺度和方向的特征，以构建更丰富的特征表示。这有助于改善特征的准确性和鲁棒性，使模型更好地理解图像中的结构和语义。并且在双向特征传播的基础上，引入了金字塔结构，使特征层能够在不同的尺度上进行信息交互。

步骤S2022：通过所述加权双向特征金字塔架构对所述第二图像进行权重设置，并通过高效特征融合方式对所述第二图像对应的权重进行自动调整，得到所述缺陷检测的结果。

需要说明的是，加权双向特征金字塔架构的作用类似于注意力机制，它拥有复杂的双向融合结构。将输入的第二图像根据输入特征的贡献大小设置不同的权重，并让自动调整权重。因为它采用一种带有权重的高效特征融合方法：快速归一融合，公式如下：

其中，O表示自动调整后的权重，w为权重的参数比例，i和j是特征融合节点输入的层数量且i＝j，ε为一个0.0001的数值，为了避免数值不稳定。I

加权机制则使得不同层次的特征能够根据其重要性进行有效的组合，从而增强了特征的表达能力。以进一步提升第二图像的特征表达能力和视觉信息。从而得到缺陷检测的结果。

参照图6，图6为加权双向特征金字塔结构图，其中P3到P7为输入特征。参照图7，图7为ELAN-T网络结合加权双向特征金字塔架构后的网络结构图，其中CBS表示卷积块，concat指的是连接操作。

步骤S30：输出所述缺陷检测的结果。

在输出阶段，输出的图像将通过三个Rep层(Representation Layers)，Rep层的作用是对输入图像进行特征提取和转换，以获得不同抽象层次的表示。每个Rep层在其内部进行特征抽取，以捕获图像中的各种特征和结构。每个Rep层都产生了一个特征表示，这些特征表示经过一系列操作后被送入CBM(Contextual Bi-directional Message PassingLayer)层。在CBM层中，采用了上下文双向信息传递机制，以引入图像内部不同区域的长程依赖关系。这有助于更好地理解图像中的全局上下文信息。

需要说明的是，Rep层(Representation Layers)是一种用于图像处理和计算机视觉任务的神经网络层，其主要目的是从输入数据中提取和表示有关数据的特征或表示。这些层通常在深度学习模型中用于将原始数据转化为更高级别的表征，以便后续任务如分类、检测或分割等能够更好地进行。CBM层(Contextual Bi-directional Message PassingLayer)是一种在深度学习中应用的神经网络层，用于引入上下文信息的双向消息传递。这种层的设计目的是在处理数据时，让每个数据点能够与其周围的数据点进行信息交流，从而更好地捕获局部和全局关系，增强模型的表征能力。

将处理后的特征表示从Rep层传递到CBM层，以产生三个不同尺度的预测结果。每个尺度的预测结果都基于相应尺度下的特征表示，这使得模型能够在不同层次上预测目标。通过Rep层和CBM层的组合，实现了在不同尺度上生成预测结果的目标。这有助于在图像分析和计算机视觉任务中获得更多元化和全面性的输出。通过将图像特征从不同层次引入到预测过程中，我们能够更好地捕获图像中的细节、结构和上下文信息。

本实施例通过上述方案，具体通过获取第一图像；将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到缺陷检测的结果；输出所述缺陷检测的结果。从而根据调用预设高效长程聚合网络层和加权双向特征金字塔架构对图像进行处理，更好的联系上下文信息和条件信息，从而导致检测精度和速度得到提高。

参照图8，基于上述实施例，在第二实施例中，所述步骤S102之前，还包括：

步骤S1021：将所述预处理后的图像输入至对抗神经网络算法中的生成模型，得到虚假的高分辨率图像，根据所述虚假的高分辨率图像和真实的高分辨率图像得到内容损失和对抗损失；

需要说明的是，对抗神经网络算法是一种机器学习算法，由生成器(Generator)和判别器(Discriminator)两部分组成，用于生成逼真的数据样本，如图像、音频等。对抗神经网络算法的核心思想是让生成器和判别器相互竞争，从而使生成器能够不断提高生成数据的逼真度。虚假的高分辨率图像是指通过图像处理、图像生成或其他技术制造的看似高分辨率的图像，实际上这些图像并没有真实的高质量细节。这种技术可能会通过一些算法和方法使图像看起来更加清晰、细腻，但实际上它们并没有基于原始图像的真实细节生成。真实的高分辨率图像是指通过高质量的设备或采集方式获得的图像，具有更多细节和更高的图像分辨率。这种图像通常能够清晰地展示细微的纹理、边缘和细节，使得观察者能够更准确地识别和理解图像中的内容。

进一步地，在一种可行的实施例中，上述步骤根据所述虚假的高分辨率图像和真实的高分辨率图像得到内容损失和对抗损失的步骤包括：

需要说明的是，VGG网络是一种深度卷积神经网络模型，VGG网络以其简洁的架构和良好的性能而闻名，为深度学习中的卷积神经网络奠定了基础。特征提取是指从原始数据中提取出有用信息或重要特征的过程。在计算机视觉和图像处理领域，特征提取通常是指从图像、视频或其他视觉数据中提取出对于任务重要的视觉特征，以便后续的分析、识别、分类或其他任务。在深度学习领域，特征提取在卷积神经网络(CNN)等模型中起着关键作用。CNN中的卷积层可以自动学习图像的特征，这些特征可以在不同的层次上捕捉图像的边缘、纹理、形状等视觉信息。通过堆叠多个卷积层和池化层，模型可以从原始图像中提取出更高级别的抽象特征，这些特征在后续任务中非常有用。特征图是在深度学习中用来表示从原始数据(如图像)中提取的有用信息或特征的一种形式。在卷积神经网络(CNN)等模型中，特征图是在卷积层经过卷积操作后得到的结果。每个卷积核在图像上滑动，对应位置的数值表示该位置的特定特征的响应程度。特征向量是在线性代数和多元统计中使用的一个重要概念，用于表示向量空间中的一个向量。在数据分析、机器学习和模式识别等领域，特征向量是一个常用的工具，用来表达数据中的重要信息和特征。

具体而言，将虚假高分辨率图像和真实高分辨率图像输入至经过训练的VGG网络，VGG网络在其较早的卷积层中捕获边缘、纹理等低级别特征，而在较深的卷积层中捕获更高级别的语义特征。通过在不同层次上提取特征来理解图像内容，将提取出的有关各种抽象特征的表示整合，从而获得它们在不同卷积层中的特征图。另外，通过对这些特征进行降维和变换，可以获得对应于每个图像的特征向量，这些向量可以用来量化图像的内容和特征。

基于所述特征图通过MSE均方根误差得到内容损失，并将所述虚假高分辨率图像和所述真实的高分辨率各自对应的特征向量进行比对，得到对抗损失。

需要说明的是，MSE(Mean Squared Error，均方误差)是一种常用的衡量预测值与真实值之间差异的评价指标，常用于回归问题中。它计算了预测值与真实值之间差的平方的平均值，用来衡量模型的预测精度。内容损失是将生成器生成的虚假高分辨率图像和真实的高分辨率图像送入VGG19网络中，使用了VGG19网络的前16层输出。其中VGG19网络是一种深度卷积神经网络，是VGG网络家族中的一员，VGG19网络增加了更多的卷积层。

示例性地，根据MSE均方根误差得到内容损失可以表示为：

内容损失为虚假高分辨率图像与真实的高分辨率图像之间的欧式距离，将生成器得到的虚假高分辨率图像和真实的真实的高分辨率图像输入至VGG网络中的VGG19网络，对每一层的特征映射计算欧氏距离。

对抗损失是用于衡量生成模型生成的数据与真实数据之间的差异。生成对抗网络是由生成器和判别器两部分组成的架构，其中生成器试图生成与真实数据相似的虚假数据，而判别器则试图区分真实数据和虚假数据。对抗损失的目标是促使生成器生成的数据在外观和分布上与真实数据尽可能接近，从而提高生成器的生成能力。

示例性地，对抗损失的计算公式如下：

其中的

步骤S1022：根据所述内容损失和对抗损失构建损失函数；

根据所述的内容，可以结合内容损失和对抗损失构建一个综合的损失函数。这适用于生成对抗网络中，其中生成器的目标是生成与真实数据相似的虚假数据，判别器则尝试区分真实数据和虚假数据。

构建的损失函数如下：

步骤S1023：基于所述损失函数进行模型训练，得到对抗神经网络模型。

需要说明的是，根据损失函数进行模型训练，训练的基本步骤包括：

生成器(Generator)：生成器是一个神经网络模型，接受随机噪声作为输入，并尝试生成与真实数据样本相似的新样本。生成器通过不断学习和调整网络权重，逐渐提高其生成的数据的逼真程度。生成器的目标是欺骗判别器，使其无法区分生成的样本与真实样本之间的差异。

判别器(Discriminator)：判别器也是一个神经网络模型，接受真实数据样本和生成器生成的样本作为输入，然后预测输入是真实数据还是生成数据。判别器通过训练识别生成数据与真实数据之间的不同之处，努力使其准确区分这两种类型的输入。

训练过程：训练过程是一个反复迭代的过程。在每个迭代中，生成器产生新样本，判别器评估这些样本，并给出它们的真实度评分。然后，通过比较判别器的预测与实际情况，对生成器和判别器的权重进行调整，以使生成器生成的样本更逼真，判别器更准确。

博弈过程：生成器和判别器之间的博弈过程持续进行，直到生成器能够生成足够逼真的样本，以至于判别器无法轻易分辨真实数据和生成数据。在这种情况下，生成器可以被认为是成功的。

对抗神经网络的训练过程类似于一个“赛跑”的过程，生成器不断努力提高生成的数据质量，同时判别器也在不断适应生成器生成的样本。这种竞争和合作的关系最终使得生成器能够生成非常逼真的数据，甚至难以与真实数据区分开来。

从而得到对抗神经网络模型。

需要说明的是，参照图9，图9为本发明的算法网络结构图。由输入端、特征提取网络、特征融合网络以及输出端四个部分构成。

本实施例通过上述方案，具体通过将所述预处理后的图像输入至对抗神经网络算法中的生成模型，得到虚假的高分辨率图像，根据所述虚假的高分辨率图像和真实的高分辨率图像得到内容损失和对抗损失；根据所述内容损失和对抗损失构建损失函数；基于所述损失函数进行模型训练，得到对抗神经网络模型。从而提高可信度，保证数据集的质量，增强数据的多样性和丰富性，进而减小数据依赖性，降低成本。

此外，为实现上述目的，如图10所示，本发明还提出一种缺陷检测装置，所述缺陷检测装置包括：

获取模块10，用于获取第一图像；

检测模块20，用于将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到所述缺陷检测的结果；

输出模块30，用于输出所述缺陷检测的结果。

本实施例提供的技术方案，通过获取第一图像；将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块和双向加权特征网络模块对第一图像进行缺陷检测，得到缺陷检测的结果；输出所述缺陷检测的结果。从而根据调用预设高效长程聚合网络层和加权双向特征金字塔架构对图像进行处理。实现了降低成本，更好的联系上下文信息和条件信息，提高检测精度和速度的效果。

由于本缺陷检测装置采用了上述所有实施例的全部技术方案，因此至少具有上述实施例的技术方案所带来的所有有益效果，在此不再一一赘述。

可选地，所述获取模块10，还用于将待检测的图像进行预处理，得到预处理后的图像，所述预处理至少包括mosaic数据增强与自适应锚框计算；

将所述预处理后的图像输入至对抗神经网络模型，得到第一图像。

可选地，所述获取模块10，还用于将所述预处理后的图像输入至对抗神经网络算法中的生成模型，得到虚假的高分辨率图像；

根据所述虚假的高分辨率图像和真实的高分辨率图像得到内容损失和对抗损失；

根据所述内容损失和对抗损失构建损失函数；

基于所述损失函数进行模型训练，得到对抗神经网络模型。

可选地，所述获取模块10，还用于将所述虚假高分辨率图像和真实的高分辨率图像输入至VGG网络中进行特征提取，得到特征图以及所述虚假高分辨率图像和所述真实的高分辨率各自对应的特征向量；

基于所述特征图通过MSE均方根误差得到内容损失，并将所述虚假高分辨率图像和所述真实的高分辨率各自对应的特征向量进行比对，得到对抗损失。

可选地，所述检测模块20，还用于将所述第一图像输入到检测模型中，通过所述检测模型中的特征提取网络模块调用预设高效长程聚合网络层对第一图像进行处理，得到第二图像；

将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构得到缺陷检测的结果。

可选地，所述检测模块20，还用于将所述第二图像通过所述检测模型中的双向加权特征网络模块调用加权双向特征金字塔架构；

可选地，所述检测模块20，还用于所述加权双向特征金字塔架构是通过将所述特征提取网络模块中负责特征信息融合的两条分支末端进行张量拼接操作，并结合加权双向特征金字塔得到的。

此外，为实现上述目的，本发明还提出一种缺陷检测设备，所述缺陷检测设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的缺陷检测程序，所述缺陷检测程序配置为实现如上文所述的缺陷检测方法的步骤。

由于本缺陷检测设备采用了上述所有实施例的全部技术方案，因此至少具有上述实施例的技术方案所带来的所有有益效果，在此不再一一赘述。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有缺陷检测程序，所述缺陷检测程序被处理器执行时实现如上文所述的缺陷检测方法的步骤。

由于本存储介质采用了上述所有实施例的全部技术方案，因此至少具有上述实施例的技术方案所带来的所有有益效果，在此不再一一赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载