掌桥专利:专业的专利平台
掌桥专利
首页

一种麦克风缺陷检测方法及装置

文献发布时间:2024-04-18 19:57:50


一种麦克风缺陷检测方法及装置

技术领域

本发明属于麦克风缺陷检测技术领域,具体涉及一种麦克风缺陷检测方法及装置。

背景技术

传统的机器视觉质检方法需要大量的专业领域知识,对特定的产品进行定制化的设计,在实际应用中通用性差、维护困难,如果有其他未知缺陷,往往需要重新进行设计,会耗费大量的人力、物力、财力。随着基于深度学习的缺陷检测技术被越来越广泛的应用在工业质检领域,以卷积神经网络为代表的深度学习方法,获得了更多学术界和工业界的追捧和关注。

目标检测作为计算机视觉的一项重要任务,用于检测图像上特定类型的目标,目前主流的目标检测算法分为两阶段和单阶段算法。其中,单阶段目标检测算法在保持高效率的检测精度的前提下,以实时的处理速度赢得了广泛的工业市场,由此,基于卷积神经网络的单阶段目标检测算法迅速发展,并应用在工业的各个实际生产场景。

虽然已有的单阶段目标检测算法被应用在通用的视觉目标检测任务,但是对于手机麦克风等类似的缺陷检测方法还是通过传统的机器视觉方法,然而手机麦克风产品本身,传统的机器视觉检测容易受到光照、角度等生产关键影响,因此使用传统机器视觉方法对手机麦克风进行缺陷检测不仅存在检测速度慢、检测精度低的问题,而且漏检率和误检率较高,严重影响手机麦克风的生产。

发明内容

为了解决传统机器视觉方式检测手机麦克风速度慢、准确性低的问题,本发明提供了一种麦克风缺陷检测方法,所述方法包括:

根据已知的麦克风缺陷类别对多张麦克风图像进行标注,将标注后的麦克风图像划分为多个数据集;

对单阶段目标检测模型进行改进,并基于所述数据集对改进后的所述单阶段目标检测模型进行训练;改进后的所述模型包括依次连接的以Swin-Transformer作为主干特征提取网络的特征提取模块、特征融合模块、包括包含小目标检测层在内的多个目标检测层的检测层模块;

通过完成训练的所述模型对麦克风图像进行检测,以预测麦克风图像中多种不同大小类型的缺陷。

具体地,所述麦克风缺陷类别包括异物、胶露、划痕、毛刺和污点。

优选地,所述“将标注后的麦克风图像划分为多个数据集”包括:

对标注后的所述麦克风图像进行裁剪、平移、改变亮度、加噪声、旋转角度、镜像方式混合的随机数据增强处理后,将所述麦克风图像按预设比例划分为训练数据集、验证数据集和测试数据集。

进一步地,所述“基于所述数据集对改进后的所述模型进行训练”包括:

基于所述训练数据集对所述模型进行多轮迭代训练;

基于所述验证数据集和预设的评估指标评估各所述模型的性能,若存在满足所述评估指标的模型,获取其中的最优模型;若不存在,基于所述训练数据集对所述模型重新进行迭代训练;

通过测试数据集对所述最优模型进行测试,若测试结果达标,将所述最优模型确定为完成训练的所述模型;若不达标,基于所述训练数据集对所述模型重新进行迭代训练。

具体地,所述评估指标包括精确率、召回率、平均精度和平均精度均值。

优选地,所述“对单阶段目标检测模型进行改进”还包括:

在所述特征提取模块的特征提取层和空间金字塔池化层之间嵌入一层坐标注意力网络层,并在所述特征融合模块嵌入多层坐标注意力网络层;所述特征提取层包括多个用于提取特征信息中局部空间信息的标准卷积块和分别设置于多个通道的Swin-Transformer块。

具体地,所述特征融合模块用于对麦克风图像中的特征进行融合,所述特征融合模块融合特征的方法包括:

在所述特征提取模块对所述麦克风图像提取特征得到特征图像后,分别从水平和竖直方向对所述特征图像进行平均池化;

将水平和竖直方向的所述特征图像在通道维度上进行拼接形成合成图像;

从空间维度将所述合成图像切片得到切片图像,并通过卷积将所述切片图像升维;

基于升维后的所述切片图像得到水平和竖直方向的注意力向量,将水平和竖直方向的注意力向量输入至所述特征图像中,以获取具有空间维度和通道维度注意力的特征图像。

优选地,各所述目标检测层包括通过K均值聚类生成的候选框,多个所述候选框分别用于预测麦克风图像中多种不同大小类型的缺陷。

进一步地,所述检测层模块预测缺陷的方法还包括:

基于非极大值抑制算法进行筛选以抑制重叠的候选框,以保留置信度最高的候选框作为最具代表性的预测缺陷结果。

本发明还提出了一种麦克风缺陷检测装置,所述装置包括:

标注模块,用于根据已知的麦克风缺陷类别对多张麦克风图像进行标注;

划分模块,用于将标注后的麦克风图像划分为多个数据集;

训练模块,用于基于所述数据集对改进后的所述单阶段目标检测模型进行训练;改进后的所述模型包括依次连接的以Swin-Transformer作为主干特征提取网络的特征提取模块、特征融合模块、包括包含小目标检测层在内的多个目标检测层的检测层模块;

检测模块,用于通过完成训练的所述模型对麦克风图像进行检测,以检测出麦克风图像中多种不同大小类型的缺陷。

本发明至少具有以下有益效果:

本方案为模型训练提供了准确的标签和合理的数据分布,能够全面地覆盖各类缺陷问题,提高了检测的广泛性、适应性和检测模型的学习效果,通过改进后的单阶段目标检测模型,能够准确地检测出麦克风图像中多种不同大小类型的缺陷;

进一步地,本方案对标注后的麦克风图像进行了多样化的数据增强处理,包括裁剪、平移、改变亮度、加噪声、旋转角度、镜像等,提升了模型对于不同场景的适应能力和鲁棒性;通过基于训练数据集的多轮迭代训练和评估指标的筛选,提高了模型在验证数据集上的性能,并确保了模型的可靠性和有效性;通过特征融合模块获取具有空间维度和通道维度注意力的特征图像,从而提升了模型对于缺陷的检测能力;利用K均值聚类生成候选框,同时通过非极大值抑制算法进行筛选,保留最具代表性的预测缺陷结果,提高了检测的准确性和效率。

以此,本发明提供了一种麦克风缺陷检测方法及装置,本方案采用基于深度学习的单阶段缺陷检测方法,不需要预先设定感兴趣区域,通过改进模型的方式,在提高了检测麦克风缺陷精度、速度的同时减少了毛刺、污点等微小缺陷漏检和误检情况,极大地提高了手机麦克风生产效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为实施例1提供的麦克风缺陷检测方法的整体流程示意图;

图2为改进后的单阶段目标检测模型的网络架构示意图;

图3为Swin-Transformer的结构示意图;

图4为坐标注意力网络的架构示意图;

图5为基于数据集对改进后的模型进行训练的流程示意图;

图6为特征融合模块融合特征的方法流程示意图;

图7为实施例2提供的麦克风缺陷检测装置的模块结构示意图;

图8为特征融合模块的模块结构示意图。

附图标记

21-标注模块;22-划分模块;23-训练模块;24-检测模块;231-训练单元;232-评估单元;233-测试单元;234-确定单元;301-平均池化单元;302-合成单元;303-切片单元;304-获取单元。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在下文中,将更全面地描述本发明的各种实施例。本发明可具有各种实施例,并且可在其中做出调整和改变。然而,应理解:不存在将本发明的各种实施例限于在此公开的特定实施例的意图,而是应将本发明理解为涵盖落入本发明的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。

在下文中,可在本发明的各种实施例中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在本发明的各种实施例中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

在本发明的各种实施例中,表述“或”或“A或/和B中的至少一个”包括同时列出的文字的任何组合或所有组合。例如,表述“A或B”或“A或/和B中的至少一个”可包括A、可包括B或可包括A和B二者。

在本发明的各种实施例中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施例中的各种组成元件,不过可不限制相应组成元件。例如,以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如,第一用户装置和第二用户装置指示不同用户装置,尽管二者都是用户装置。例如,在不脱离本发明的各种实施例的范围的情况下,第一元件可被称为第二元件,同样地,第二元件也可被称为第一元件。

应注意到:在本发明中,除非另有明确的规定和定义,“安装”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接、也可以是可拆卸连接、或者一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也是可以通过中间媒介间接相连;可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,本领域的普通技术人员需要理解的是,文中指示方位或者位置关系的术语为基于附图所示的方位或者位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或者元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本发明的各种实施例。如在此所使用,单数形式意在也包括复数形式,除非上下文清楚地另有指示。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施例中被清楚地限定。

实施例1

本实施例提出了一种麦克风缺陷检测方法,该方法使用了单阶段目标检测模型,本实施例中单阶段目标检测模型使用了YOLOv5算法,模型具体包括依次连接的特征提取模块、特征融合模块和检测层模块。参见图1,本实施例提出的方法包括:

S100:根据已知的麦克风缺陷类别对多张麦克风图像进行标注,将标注后的麦克风图像划分为多个数据集。

步骤S100中使用的麦克风图像可通过工业相机获取,已知的麦克风缺陷包括但不限于异物、胶露、划痕、毛刺和污点等类别,本实施例中,通过LabelImg根据麦克风缺陷类别对麦克风图像进行标注。

需要说明的是,LabelImg是一个用于图像标注的开源工具,可以用于创建目标检测、图像分割和图像分类等各种任务所需的标注数据集。LabelImg提供了一个用户友好的图形界面,使用户能够在图像上绘制边界框或多边形,并为目标对象添加标签。

S200:对单阶段目标检测模型进行改进,并基于训练数据集对改进后的单阶段目标检测模型进行训练。

深层的网络能学习到更多的语义信息、浅层的网络可以保留更多的空间位置信息,随着网络的加深,输入特征图的尺寸在减小、特征图的通道数在增加,需要使特征提取模块通过卷积神经网络学习输入图像的目标特征。

具体地,请参考图2-4,改进后的单阶段目标检测模型中,使用Swin-Transformer作为主干特征提取网络,它基于具有全局信息建模能力的Transformer来构建分层特征图,同时将自注意力计算限制在无重叠的窗口区域内并允许各个移动窗口之间进行特征交互;

特征提取模具体包括特征提取层和空间金字塔池化层(Spatial PyramidPooling-Fast,SPPF),特征提取层包括多个标准卷积块(Convolutional Layers)和分别设置于多个通道的多个Swin-Transformer块,标准卷积块用于提取特征信息中的局部空间信息,蝉式注意力网络块用于提取不同尺度的特征图像;

Swin-Transformer块(Swin-Transformer Block)由窗口多头注意力机制和移动窗口多头注意力机制两个模块组成,公式为:

head

MultiHead(Q,K,V)=Concat(head

其中,Q(Query,查询)表示输入矩阵经过线性变换的查询矩阵,它用于衡量输入矩阵中每个位置与其他位置的相关性;K(Key,键)表示输入矩阵经过线性变换的每个位置的关键信息;V(Value,权重)表示输入矩阵经过线性变换的特征表示;

head用于标识多头注意力(multi-head attention)模块中head的个数;Attention代表注意力权重,用于表示不同位置之间的相关性或权重分配;Softmax函数用于将注意力权重进行归一化使其总和为1,以便进行加权平均;MultiHead代表多头注意力机制,用于并行计算多个注意力头的权重;Concat代表拼接操作,用于将多个多头注意力的输出特征连接起来形成最终的表示;

W为权重矩阵,用于将输入序列进行线性变换以生成Q、K和V的表示;T用于表示矩阵的转置;d用于表示模型的缩放系数;B用于表示偏置,即向每个头部位置添加相对位置偏差。

具体地,特征提取模块中,标准卷积块用于提取输入特征中的局部空间信息,包括卷积(Convolution)、归一化层(Batch Normalization,BN)和非线性激活函数;卷积通过操作卷积核以一定的步长与卷积核对应的特征图窗口进行卷积操作,从而获取输入特征;归一化层用于规范神经网络中的特征值分布,可以加速模型训练速度,同时提高模型的泛化能力,并对每个通道上的特征进行标准化处理;非线性激活函数用于给神经网络引入非线性变换能力。

需要说明的是,Swin-Transformer是一种用于图像分类任务的深度学习模型,它基于Transformer结构进行设计,并在计算机视觉领域取得了显著的突破和性能提升。

Swin-Transformer的核心思想是将图像分割成若干个相对较小的区域,然后在这些区域上应用Transformer结构进行特征提取和建模。与传统的全局Transformer不同,Swin-Transformer引入了分层的注意力机制。它通过堆叠多个图像块(image blocks)来构建网络层,每个图像块内部使用局部注意力机制,而图像块之间则使用全局注意力机制。

Swin-Transformer通过将输入图像划分为不同的小块(或称为"局部窗口"),并在每个窗口中进行特征提取。然后,通过多层级的Transformer编码器对这些小块进行处理,以捕捉全局和局部特征之间的关系,这种分层的设计能够有效地处理大尺度的图像,并且允许模型在获得全局信息的同时保持了更高的计算效率。

Swin-Transformer在计算机视觉任务中表现出色,例如图像分类、目标检测和语义分割等。它在多个公开的视觉基准数据集上超越了其他传统的网络架构,并且在资源受限的环境下仍然能够获得竞争性的性能。

特征融合模块用于利用不同分辨率的特征图所具有的空间和语义信息进行特征融合,以获取更加丰富的特征信息。优选地,本实施例中特征融合模块引入了坐标注意力(Coordinate Attention,CA)机制,具体为在特征融合模块嵌入多层坐标注意力网络层,同时在特征提取模块的特征提取层和空间金字塔池化层之间嵌入一层坐标注意力网络层;

特征融合模块具体包括特征金字塔结构(Feature Pyramid Network,FPN)、路径聚合结构(Path Aggregation Network,PAN)和多个坐标注意力模块,坐标注意力模块用于引入多个方向的空间位置信息和对通道维度的注意力,嵌入坐标方向注意力的公式为:

其中,x为输入特征向量;y为具有空间位置信息和通道信息的注意力权重特征向量;z为对输入特征在空间位置上的编码操作,代表分别在水平和竖直方向上对通道进行编码;c为特征图的通道数;H(Height)代表特征图的高度,W(Width)代表特征图的宽度;g为经过激活函数后的空间位置注意力权重特征向量。

具体地,特征金字塔结构通过上采样和分辨率更高的特征图融合,自顶向下实现不同层次融合;路径聚合结构通过自低向上将特征金字塔输入的底部特征图进行下采样和语义信息更强的特征图进行融合,增强定位信息;坐标注意力主要是通过引入水平和竖直方向的空间位置信息和对通道维度的注意力,来加强特征信息的融合。

检测层模块则用于对主干特征提取网络提取的不同尺度的特征图进行目标检测,本实施例中检测层模块包括包含小目标检测层在内的多个目标检测层,检测层模块具体包括预选框(Anchors)、卷积层(Convolutional Layers)、预测层(Prediction Layers)和非极大值抑制(Non-Maximum Suppression,NMS);

具体地,预选框是通过K均值聚类方法(K-means聚类)得到一组边界框,用于在特征图上生成候选框;卷积层通过调整通道数和卷积核大小来适应不同的检测任务,多个候选框分别用于预测麦克风图像中多种不同大小类型的缺陷;预测层中,每一个预测层负责预测一组边界框和类别,通常由一个卷积层和输出层组成,输出层的通道数和形状决定了预测的边界框数量和类别数量;

本实施例中,在特征图上输出的所有候选框根据非极大值抑制算法来进行筛选抑制重叠的候选框,以保留置信度最高的候选框作为最具代表性的作为预测缺陷结果。

S300:通过完成训练的模型对麦克风图像进行检测,以预测麦克风图像中多种不同大小类型的缺陷。

示例性地,检测层模块通过K均值算法聚类设计生成符合手机麦克风缺陷的四个候选框,预设的候选框形状大小依次递增,四类候选框分别用来预测大型缺陷、中型缺陷、小型缺陷、较小型缺陷;

在一个具体实施例中,用于检测大型目标的预选框参数为[8,9,13,12,10,17],用于检测中型目标的预选框参数为[19,10,15,15,12,23],用于检测小型目标的预选框参数为[21,14,29,13,19,21],用于检测较小型目标的预选框参数为[16,29,26,22,36,31]。

优选地,步骤S100中对标注后的麦克风图像进行数据增强处理后,再将其按预设比例划分为训练数据集、验证数据集和测试数据集;本实施例中,数据增强的方式包括裁剪、平移、改变亮度、加噪声、旋转角度、镜像等方式混合的随机数据增强。

需要说明的是,训练数据集(Training Dataset)用于模型的参数学习和训练过程,对模型的构建和调整起到关键的作用,模型通过观察训练数据集中的样本来学习特征和模式,并进行参数更新,以优化模型的性能;

验证数据集(Validation Dataset)用于模型的超参数选择和调优,能够帮助用户选择最佳的模型架构和超参数配置,以提高模型的泛化能力,在训练过程中可以使用验证数据集来评估模型的性能,并根据验证结果进行超参数的调整,例如调整模型的学习率、正则化参数等;

测试数据集(Test Dataset)用于评估模型的性能和泛化能力,测试数据集的结果通常被视为模型实际应用性能的指标,在完成模型训练和验证后,可以使用测试数据集来衡量模型对未见过的新数据的预测能力。

本实施例中测试数据集与训练数据集和验证数据集相互独立,由此可以确保对模型进行客观的评估。

示例性地,划分训练数据集、验证数据集和测试数据集的预设比例为8:1:1,在一个具体实施例中,5980张麦克风图像可以按此比例划分为具有4737张麦克风图像的训练数据集、具有605张麦克风图像的验证数据集和具有638张麦克风图像的测试数据集。

具体地,参见图5,步骤S200中所述的“基于数据集对改进后的单阶段目标检测模型进行训练”包括:

S210:基于训练数据集对模型进行多轮迭代训练。

S220:基于验证数据集和预设的评估指标评估各模型的性能,判断是否存在满足评估指标的模型。

若存在,执行步骤S230;若不存在,重新执行步骤S210。

需要说明的是,本实施例中的评估指标采用精确率(Precision,P)、召回率(Recall,R)、平均精度(Average Precision,AP)、平均精度均值(mean AveragePrecision,mAP)等评价指标来评价;

精确率是指预测出的正样本除以所有预测出正样本的总数;召回率是指预测出的正样本除以原始数据集中正样本的总数;平均精度是指P-R曲线面积;平均精度均值是指所有缺陷类别的平均AP值;示例性地,IoU(Intersection over Union)分别设为0.5、0.75时,mAP0.5、mAP0.75指分别计算每一类的所有图像的AP后对所有类别求平均,mAP0.5:0.95是指对IoU阈值在0.5:0.95(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)区间内,对所有类别求平均。具体公式为:

其中,N表示总类别数,即所有缺陷类别种类;TP(True Positive)表示模型正确地将正样本判定为正样本的数量,即正确预测到的目标框数;FP(False Positive)表示模型错误地将负样本判定为正样本的数量,即错误预测的目标框数;TN(True Negative)表示模型正确地将负样本判定为负样本的数量,即正确排除的背景框数;FN(False Negative)表示模型错误地将正样本判定为负样本的数量,即未检测到的目标框数。

S230:获取其中的最优模型,并通过测试数据集对最优模型进行测试,判断测试结果是否达标。

若达标,执行步骤S240;若不达标,重新执行步骤S210。

S240:将该最优模型确定为完成训练的模型。

具体地,参见图4、6,特征融合模块融合特征的方法包括:

S211:在特征提取模块对麦克风图像提取特征得到特征图像后,分别从水平和竖直方向对特征图像进行平均池化。

S212:将水平和竖直方向的特征图像在通道维度上进行拼接形成合成图像。

S213:从空间维度将合成图像切片得到切片图像,并通过卷积将切片图像升维。

S214:基于升维后的切片图像得到水平和竖直方向的注意力向量,将水平和竖直方向的注意力向量输入至特征图像中,以获取具有空间维度和通道维度注意力的特征图像。

为验证本方案改进措施的有效性,通过在测试数据集的基础上分别在不同条件下进行消融试验,得到的各项性能的结果如表1所示:

各项改进性能比较表-表1

相较于原始模型,本方案的检测方法所使用的算法在mAP0.5提高了1.6%,在mAP0.75提高了6.8%,在mAP0.5:0.9提高了5.1%,由此可见,本方案的算法检测手机麦克风外观缺陷效果更好,不仅提升了微小目标的检测能力,而且大幅度减少了缺陷漏检、误检情况。

实施例2

本实施例提出了一种麦克风缺陷检测装置,用于实现实施例1中提出的方法,本实施例中单阶段目标检测模型同样使用了YOLOv5算法,模型具体包括依次连接的特征提取模块、特征融合模块和检测层模块。参见图7,所述装置包括:

标注模块21,用于根据已知的麦克风缺陷类别对多张麦克风图像进行标注;

划分模块22,用于将标注后的麦克风图像划分为多个数据集;

训练模块23,用于基于数据集对改进后的单阶段目标检测模型进行训练;

检测模块24,用于通过完成训练的模型对麦克风图像进行检测,以检测出麦克风图像中多种不同大小类型的缺陷。

具体地,训练模块23包括:

训练单元231,用于基于训练数据集对模型进行多轮迭代训练;

评估单元232,用于基于验证数据集和预设的评估指标评估各模型的性能;

测试单元233,用于获取其中的最优模型,并通过测试数据集对最优模型进行测试;

确定单元234,用于将该最优模型确定为完成训练的模型。

其中,若不存在满足评估单元222的评估指标的模型,则使训练单元221重新执行预设的步骤;若测试单元223对最优模型进行测试的结果不达标,同样使训练单元221重新执行预设的步骤。

具体地,特征融合模块包括特征金字塔结构(Feature Pyramid Network,FPN)、路径聚合结构(Path Aggregation Network,PAN)和多个坐标注意力模块,坐标注意力模块用于引入多个方向的空间位置信息和对通道维度的注意力;

本实施例中,特征金字塔结构通过上采样和分辨率更高的特征图融合,自顶向下实现不同层次融合;路径聚合结构通过自低向上将特征金字塔输入的底部特征图进行下采样和语义信息更强的特征图进行融合,增强定位信息;坐标注意力主要是通过引入水平和竖直方向的空间位置信息和对通道维度的注意力,来加强特征信息的融合。由此,参见图8,特征融合模块具体包括:

平均池化单元301,用于在特征提取模块对麦克风图像提取特征得到特征图像后,分别从水平和竖直方向对特征图像进行平均池化;

合成单元302,用于将水平和竖直方向的特征图像在通道维度上进行拼接形成合成图像;

切片单元303,用于从空间维度将合成图像切片得到切片图像,并通过卷积将切片图像升维;

获取单元304,用于基于升维后的切片图像得到水平和竖直方向的注意力向量,将水平和竖直方向的注意力向量输入至特征图像中,以获取具有空间维度和通道维度注意力的特征图像。

综上所述,本发明提供了一种麦克风缺陷检测方法及装置,本方案采用基于深度学习的单阶段缺陷检测方法,不需要预先设定感兴趣区域,通过改进模型的方式,在提高了检测麦克风缺陷精度、速度的同时减少了毛刺、污点等微小缺陷漏检和误检情况,极大地提高了手机麦克风生产效率。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于单目面阵相机的桥梁缺陷检测装置及检测方法
  • 一种彩膜基板缺陷的分析方法、检测修复方法及装置
  • 一种泡罩包装缺陷检测方法、装置及设备
  • 一种工业加工产品的缺陷检测方法、装置及设备
  • 一种液晶屏色偏缺陷检测方法及装置
  • 塑料光纤的芯径测量方法及用于该塑料光纤的芯径测量方法的塑料光纤的芯径测量装置、塑料光纤的缺陷检测方法及用于该塑料光纤的缺陷检测方法的塑料光纤的缺陷检测装置
  • 一种基于麦克风阵列的换流阀设备缺陷局部放电检测装置
技术分类

06120116467471