掌桥专利:专业的专利平台
掌桥专利
首页

检测模型训练方法、装置、设备及可读存储介质

文献发布时间:2023-06-19 11:14:36


检测模型训练方法、装置、设备及可读存储介质

技术领域

本发明涉及光学检测技术领域,尤其涉及一种检测模型训练方法、装置、设备及可读存储介质。

背景技术

目前,一般是直接将图片作为神经网络输入,以供对神经网络进行训练,得到用于自动光学检测的检测模型。训练过程中,神经网络基于输入的图片的图片特征以及训练标签,调整神经元参数取值。其中,对于训练标签相同的图片来说,图片特征也是相同或相近的。但是,由于在发光和成像过程中,存在失真比如畸变、渐晕等,导致同一目标由于在视场(成像)位置不同,得到的图片的图片特征不同,即导致训练标签相同的图片具有不同的图片特征,这样会导致最终得到的检测模型的检测准确率难以满足实际需求。

例如,需要训练用于检测目标边缘是否为直线的检测模型,对一边缘为直线的目标进行多次成像,得到若干图片。由于这些图片都是对同一目标成像得到的,则这些图片的训练标签均为直线。但是由于畸变的影响,若该目标是在视场边缘成像,所得到的图片1中该目标的边缘会有一些弯曲;若该目标是在视场中间成像,所得到的图片2中该目标的边缘为直线。后续,使用图片1和2训练神经网络时,对于神经网络而言,提取的图片1的图片特征与提取的图片2的图片特征会有较大差别,但两者的训练标签又一致,这样就导致神经网络无法将神经元参数调整到最优值,从而导致最终得到的检测模型的检测准确率难以满足实际需求。

发明内容

为解决上述技术问题,本发明提供一种检测模型训练方法、装置、设备及可读存储介质。

第一方面,本发明提供一种检测模型训练方法,所述检测模型训练方法包括:

获取图片以及所述图片上各个像素点的位置信息;

基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练,得到用于自动光学检测的检测模型。

可选的,所述获取图片上各个像素点的位置信息步骤包括:

以图片上任一像素点为原点构建平面直角坐标系,得到所述图片上各个像素点的坐标信息;

将所述图片裁剪为多个子图片,获取图片上各个像素点相对于其所属子图片的边界的最小偏移量;

以所述图片上各个像素点的坐标信息以及相对于其所属子图片的边界的最小偏移量,作为所述图片上各个像素点的位置信息。

可选的,所述基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练的步骤包括:

为所述图片的每个像素点补充对应的位置信息,得到多维的复合图片;

将所述复合图片输入神经网络进行训练。

可选的,所述基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练的步骤包括:

将图片输入第一神经网络;

将所述图片上各个像素点的位置信息输入第二神经网络;

将所述第一神经网络的输出以及所述第二神经网络的输出,输入第三神经网络进行训练。

可选的,所述神经网络为卷积神经网络。

第二方面,本发明还提供一种检测模型训练装置,所述检测模型训练装置包括:

获取模块,用于获取图片以及所述图片上各个像素点的位置信息;

训练模块,用于基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练,得到用于自动光学检测的检测模型。

可选的,所述获取模块,用于:

以图片上任一像素点为原点构建平面直角坐标系,得到所述图片上各个像素点的坐标信息;

将所述图片裁剪为多个子图片,获取图片上各个像素点相对于其所属子图片的边界的最小偏移量;

以所述图片上各个像素点的坐标信息以及相对于其所属子图片的边界的最小偏移量,作为所述图片上各个像素点的位置信息。

可选的,所述训练模块,用于:

为所述图片的每个像素点补充对应的位置信息,得到多维的复合图片;

将所述复合图片输入神经网络进行训练。

第三方面,本发明还提供一种检测模型训练设备,所述检测模型训练设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的检测模型训练程序,其中所述检测模型训练程序被所述处理器执行时,实现如上所述的检测模型训练方法的步骤。

第四方面,本发明还提供一种可读存储介质,所述可读存储介质上存储有检测模型训练程序,其中所述检测模型训练程序被处理器执行时,实现如上所述的检测模型训练方法的步骤。

本发明中,获取图片以及所述图片上各个像素点的位置信息;基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练,得到用于自动光学检测的检测模型。通过本发明,在通过图片训练神经网络时加入图片上各像素点的位置信息,增加了图片数据的维度,使得最终训练得到的检测模型可以结合图片特征以及图片上各像素点的位置信息实现对图片的检测,可避免因图片成像失真导致检测错误的情况发生,提高了光学自动检测的准确率。

附图说明

图1为本发明实施例方案中涉及的检测模型训练设备的硬件结构示意图;

图2为本发明检测模型训练方法一实施例的流程示意图;

图3为一实施例中以图片上一像素点为原点构建平面直角坐标系的场景示意图;

图4为一实施例中对图片进行裁剪的场景示意图;

图5为本发明检测模型训练装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

第一方面,本发明实施例提供一种检测模型训练设备。

参照图1,图1为本发明实施例方案中涉及的检测模型训练设备的硬件结构示意图。本发明实施例中,检测模型训练设备可以包括处理器1001(例如中央处理器CentralProcessing Unit,CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WI-FI接口);存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

继续参照图1,图1中作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及检测模型训练程序。其中,处理器1001可以调用存储器1005中存储的检测模型训练程序,并执行本发明实施例提供的检测模型训练方法。

第二方面,本发明实施例提供了一种检测模型训练方法。

参照图2,图2为本发明检测模型训练方法一实施例的流程示意图。如图2所示,一实施例中,检测模型训练方法包括:

步骤S10,获取图片以及所述图片上各个像素点的位置信息;

本实施例中,根据需要的检测模型的功能获取相应的图片。例如,若是要训练用于检测目标边缘是否为直线的检测模型,则对目标边缘为直线或非直线的目标进行拍摄,得到相应的图片。若是要训练用于检测Mura缺陷的检测模型,则对存在Mura缺陷的画面或不存在Mura缺陷的画面进行拍摄,得到相应的图片。除了获取图片,还需进一步获取图片上各个像素点的位置信息。其中,位置信息用于表征像素点在图片上的具体位置。

进一步地,一实施例中,获取图片上各个像素点的位置信息步骤包括:

步骤S101,以图片上任一像素点为原点构建平面直角坐标系,得到所述图片上各个像素点的坐标信息;

本实施例中,以图片上任一像素点为原点构建平面直角坐标系,结合图片的尺寸,得到图片上各个像素点的坐标信息。参照图3,图3为一实施例中以图片上一像素点为原点构建平面直角坐标系的场景示意图。如图3所示,以图片上左上角的以像素点为原点构建平面直角坐标系,图片尺寸为4×4,则位于第一排第一列的像素点的坐标信息为(0,0),位于第一排第二列的像素点的坐标信息为(1,0),位于第一排第三列的像素点的坐标信息为(2,0),以此类推,即可得到图片上各个像素点的坐标信息。容易理解的是,图3仅为示意性说明,具体以图片上哪个像素点为原点构建平面直角坐标系以及图片尺寸多大均根据实际情况进行选择。

步骤S102,将所述图片裁剪为多个子图片,获取图片上各个像素点相对于其所属子图片的边界的最小偏移量;

本实施例中,将图片裁剪为多个子图片,例如将图片裁剪为N个子图片,N为正整数,N的具体取值根据实际需要进行设置,在此不作限制。参照图4,图4为一实施例中对图片进行裁剪的场景示意图。如图4所示,将一图片裁剪为4个子图片,以子图片1为例,子图片1中像素点与子图片1四条边界的偏移量分别为L1、L2、L3以及L4,则从L1、L2、L3以及L4中选取最小值,例如L1最小,则以L1作为该像素点相对于其所属子图片的边界的最小偏移量。以此类推,即可得到图片上各个像素点相对于其所属子图片的边界的最小偏移量。

步骤S103,以所述图片上各个像素点的坐标信息以及相对于其所属子图片的边界的最小偏移量,作为所述图片上各个像素点的位置信息。

本实施例中,通过步骤S101得到图片上各个像素点的坐标信息,记为(X,Y),通过步骤S102得到图片上各个像素点相对于其所属子图片的边界的最小偏移量,记为L。以图片上各个像素点的坐标信息以及相对于其所属子图片的边界的最小偏移量,作为图片上各个像素点的位置信息,即位置信息记为(X,Y,L)。

步骤S20,基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练,得到用于自动光学检测的检测模型。

本实施例中,基于图片以及图片上各个像素点的位置信息对神经网络进行训练,当然每张图片对应有训练标签。例如,图片是通过对目标边缘为直线的目标进行拍摄得到的,则图片对应的训练标签为“直线”,同理,若图片是通过对非直线的目标进行拍摄得到的,则图片对应的训练标签为“非直线”;图片是通过对存在Mura缺陷的画面进行拍摄得到的,则图片对应的训练标签为“存在Mura缺陷”,同理,图片是通过对不存在Mura缺陷的画面进行拍摄得到的,则图片对应的训练标签为“不存在Mura缺陷”。将图片以及图片上各个像素点的位置信息作为输入,神经网络基于输入的信息提取特征,并结合图片的训练标签,调整内部的神经元参数,直至满足结束条件时,停止训练,并以得到的神经网络作为用于自动光学检测的检测模型。容易理解的是,对神经网络进行训练需要大量的样本,因此,本实施例中所指的图片的数量为多个,即以多个图片以及每张图片上各个像素点的位置信息为训练样本对神经网络进行训练。

以对目标边缘为直线的目标进行拍摄得到的图片为例,由于畸变的影响,若该目标是在视场边缘成像,所得到的图片1中该目标的边缘会有一些弯曲;若该目标是在视场中间成像,所得到的图片2中该目标的边缘为直线。而两者的训练标签又一致,若是按照常规的方式,直接通过图片1和2为训练样本对神经网络进行训练,则会对神经网络造成干扰。因为对图片1而言,其训练标签为直线,而通过其提取图片1的特征进行识别,图片1的特征为非直线对应的特征。为了避免出现这种问题,本实施例中,是通过图片以及图片上各个像素点的位置信息作为输入对神经网络进行训练,即增加了图片数据的维度。如此一来,对于神经网络而言,是综合图片的图像特征以及图片上各像素点的位置信息两个因素输出检测结果,可以避免因成像位置不同导致图片存在失真,从而导致检测结果与真实情况不相符的情况发生。

本实施例中,获取图片以及所述图片上各个像素点的位置信息;基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练,得到用于自动光学检测的检测模型。通过本实施例,在通过图片训练神经网络时加入图片上各像素点的位置信息,增加了图片数据的维度,使得最终训练得到的检测模型可以结合图片特征以及图片上各像素点的位置信息实现对图片的检测,可避免因图片成像失真导致检测错误的情况发生,提高了光学自动检测的准确率。

进一步地,一实施例中,步骤S20包括:

为所述图片的每个像素点补充对应的位置信息,得到多维的复合图片;将所述复合图片输入神经网络进行训练。

本实施例中,图片可以是黑白图片也可以彩色图片,由于位置信息包括(X,Y,L),为图片的每个像素点补充对应的位置信息,相当于为图片增加了三个维度的数据。若图片是黑白图片,则得到的多维的复合图片的数据维度为4维,若图片是彩色图片,则得到的多维的复合图片的数据维度为6维。将多维的复合图片输入神经网络进行训练,由于输出即为输入图片对应的训练标签,即输出是明确的,整个训练过程即对神经网络中的神经元参数进行调整,使得输入与输出形成映射。训练过程为现有技术,在此不做赘述。

进一步地,一实施例中,步骤S20包括:

将图片输入第一神经网络;将所述图片上各个像素点的位置信息输入第二神经网络;将所述第一神经网络的输出以及所述第二神经网络的输出,输入第三神经网络进行训练。

本实施例中,将图片作为第一神经网络的输入输入第一神经网络,且将该图片上各个像素点的位置信息输入第二神经网络;得到第一神经网络的输出以及第二神经网络的输出后,将两个神经网络的输出输入第三神经网络进行训练。其中,第三神经网络的输出结果为输入图片对应的训练标签,即第三神经网络的输出结果是明确的,整个训练过程即调整第一神经网络、第二神经网络以及第三神经网络的神经元参数,使得输入与输出形成映射。

进一步地,一实施例中,所述神经网络为卷积神经网络。

本实施例中,神经网络优选为卷积神经网络。当然,根据实际需要,神经网络还可以选用其他类型的神经网络,例如循环神经网络等。

第三方面,本发明实施例还提供一种检测模型训练装置。

参照图5,图5为本发明检测模型训练装置一实施例的功能模块示意图。如图5所示,在一实施例中,检测模型训练装置包括:

获取模块10,用于获取图片以及所述图片上各个像素点的位置信息;

训练模块20,用于基于所述图片以及所述图片上各个像素点的位置信息对神经网络进行训练,得到用于自动光学检测的检测模型。

进一步地,一实施例中,获取模块10,用于:

以图片上任一像素点为原点构建平面直角坐标系,得到所述图片上各个像素点的坐标信息;

将所述图片裁剪为多个子图片,获取图片上各个像素点相对于其所属子图片的边界的最小偏移量;

以所述图片上各个像素点的坐标信息以及相对于其所属子图片的边界的最小偏移量,作为所述图片上各个像素点的位置信息。

进一步地,一实施例中,训练模块20,用于:

为所述图片的每个像素点补充对应的位置信息,得到多维的复合图片;

将所述复合图片输入神经网络进行训练。

进一步地,一实施例中,训练模块20,用于:

将图片输入第一神经网络;

将所述图片上各个像素点的位置信息输入第二神经网络;

将所述第一神经网络的输出以及所述第二神经网络的输出,输入第三神经网络进行训练。

进一步地,一实施例中,所述神经网络为卷积神经网络。

其中,上述检测模型训练装置中各个模块的功能实现与上述检测模型训练方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

第四方面,本发明实施例还提供一种可读存储介质。

本发明可读存储介质上存储有检测模型训练程序,其中所述检测模型训练程序被处理器执行时,实现如上述的检测模型训练方法的步骤。

其中,检测模型训练程序被执行时所实现的方法可参照本发明检测模型训练方法的各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 一种故障检测模型的训练方法、装置、故障检测方法、电子设备和可读存储介质
  • 文本检测模型的训练方法、装置、可读存储介质及设备
技术分类

06120112857777