掌桥专利:专业的专利平台
掌桥专利
首页

改良机器学习使用数据进行训练的方法及系统

文献发布时间:2023-06-19 13:49:36


改良机器学习使用数据进行训练的方法及系统

技术领域

本发明涉及机器学习(Machine Learning,ML),尤其涉及一种改良机器学习使用数据进行训练的方法及系统。

背景技术

机器学习是人工智能的一个分支,但现有技术需要先有人工来标记大量数据才让机器学习模型进行训练。因此,如何改良机器学习使用数据进行训练则成为本领域的一项重要课题。

发明内容

有鉴于此,本发明实施例提供一种改良机器学习使用数据进行训练的方法,执行于自动光学检测(Automated Optical Inspection,AOI)系统中,所述方法包括如下步骤。首先,将少量的良品数据作为第一训练数据来让机器学习模型进行训练,并让使用第一训练数据所训练完的机器学习模型在收到在线产品数据时,能够自动产生多个机器标记。接着,利用检查电路通过人工的方式来检查这些机器标记,并让机器学习模型再使用具有经检查后的这些机器标记的在线产品数据作为第二训练数据以进行训练。

除此之外,本发明实施例另提供一种改良机器学习使用数据进行训练的系统,执行于AOI系统中,所述系统包括第一层训练电路、检查电路和第二层训练电路。第一层训练电路用来让机器学习模型使用少量的良品数据作为第一训练数据以进行训练,且使用第一训练数据所训练完的机器学习模型在收到在线产品数据时,能够自动产生多个机器标记。检查电路连接第一层训练电路,用来通过人工的方式检查这些机器标记。第二层训练电路连接检查电路,用来让机器学习模型再使用具有经检查后的这些机器标记的在线产品数据作为第二训练数据以进行训练。

为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。

附图说明

图1是本发明实施例所提供改良机器学习使用数据进行训练的方法的步骤流程图。

图2A到图2D是根据图1的方法来表现出新的AOI管线化设计(Pipeline)的示意图。

图3是本发明实施例所提供改良机器学习使用数据进行训练的系统的功能方块图。

具体实施方式

以下是通过特定的具体实施例来说明本发明的实施方式,本领域技术人员可由本说明书所提供的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不悖离本发明的构思下进行各种修改与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所提供的内容并非用以限制本发明的保护范围。

应当理解的是,虽然本文中可能会使用到“第一”、“第二”、“第三”等术语来描述各种组件或者信号,但这些组件或者信号不应受这些术语的限制。这些术语主要是用以区分一组件与另一组件,或者一信号与另一信号。另外,本文中所使用的术语“或”,应视实际情况可能包括相关联的列出项目中的任一个或者多个的组合。

首先,请参阅图1,图1是本发明实施例所提供改良机器学习使用数据进行训练的方法的步骤流程图。需说明的是,图1的方法可以是执行于AOI系统中,但本发明不限制图1的方法仅能够执行于AOI系统中。如图1所示,在步骤S110中,将少量的良品数据作为第一训练数据来让机器学习模型进行训练,并且在步骤S120中,让使用第一训练数据所训练完的机器学习模型在收到在线产品数据时,能够自动产生多个机器标记。也就是说,本发明可以是先将在线产品做良品和不良品的简单分类,所以步骤S110不需要准备大量有标记的数据给机器学习模型来做训练,而是只要将少量的良品数据作为第一训练数据就够。然后,由于不良品比较具有代表性,所以步骤S120的机器学习模型将针对不良品来自动产生多个机器标记。

由此可见,在使用第一训练数据以训练完机器学习模型后,机器学习模型将能够把在线产品数据分类为良品集和不良品集,且这些机器标记就是用来指出机器学习模型所没学习过的至少一瑕疵(Defect)。然而,这些机器标记所指的瑕疵也可能会是机器学习模型的误判(Overkill),所以在步骤S130中,利用检查电路通过人工的方式来检查这些机器标记,并且在步骤S140中,让机器学习模型再使用具有经检查后的这些机器标记的在线产品数据作为第二训练数据以进行训练。也就是说,由于人工仅大部分花在这些机器标记的检查上,所以相较现有技术需要先有人工来标记大量数据才让机器学习模型进行训练,本发明更可节省人力时间。

值得一提的是,这里所谓通过人工的方式来检查这些机器标记,更可指的是通过人工的方式来协助注明这些机器标记所指的瑕疵是什么。因此,即使当这些机器标记所指的瑕疵确实是机器学习模型的误判时,机器学习模型还可在因人工检查完这些机器标记后而学习到新知识,总而言之,在使用第二训练数据以训练完机器学习模型后,机器学习模型将能够辨识在线产品数据的至少一瑕疵位置与/或至少一瑕疵类别。另外,可请一并参阅图2A到图2D,图2A到图2D是根据图1的方法来表现出新的AOI管线化设计的示意图。

如图2A所示,新的AOI管线化设计可为由少量的良品数据来建立一个可判别良品或不良品的异常检测模型(Anomaly Detection Model)M1。接着,如图2B所示,异常检测模型M1可针对在线产品数据自动标记,且新的AOI管线化设计将在通过人工检查标记后建立一个可判别瑕疵位置与/或瑕疵类别的监督式检测模型(Supervised Detection Model)M2。或者是说,如图2C所示,新的AOI管线化设计可为利用异常检测模型M1来协助标记不良品集,并且由具有标记的不良品集来建立监督式检测模型M2,然后可将异常检测模型M1和监督式检测模型M2合并为最终的一个机器学习模型M3。由此可见,如图2D所示,当在线产品又有新瑕疵类别时,新的AOI管线化设计就可只要通过少量标记和短时间训练来让监督式检测模型M2能够快速增加辨识新瑕疵类别的能力。

最后,本发明进一步提供其系统的一种实施方式。请参阅图3,图3是本发明实施例所提供改良机器学习使用数据进行训练的系统的功能方块图。类似地,图3的系统1可以是执行于AOI系统中,但本发明亦不限制图3的系统1仅能够执行于AOI系统中。如图3所示,系统1包括第一层训练电路10、检查电路12和第二层训练电路14,其中第一层训练电路10、检查电路12和第二层训练电路14可以是透过纯硬件来实现,或者是透过硬件搭配固件或软件来实现,总而言之,本发明不限制第一层训练电路10、检查电路12和第二层训练电路14的具体实现方式。除此之外,上述各电路可以是整合或分开设置,但本发明亦不以此为限制。

第一层训练电路10用来让机器学习模型使用少量的良品数据作为第一训练数据以进行训练,且使用第一训练数据所训练完的机器学习模型在收到在线产品数据时,能够自动产生多个机器标记。检查电路12连接第一层训练电路10,用来通过人工的方式检查这些机器标记。第二层训练电路14连接检查电路12,用来让机器学习模型再使用具有经检查后的这些机器标记的在线产品数据作为第二训练数据以进行训练。由于细节已如同前述内容所述,故于此就不再多加赘述。

综上所述,本发明实施例提供一种改良机器学习使用数据进行训练的方法及系统,可以是先将在线产品做良品和不良品的简单分类,所以只要先准备少量的良品数据给机器学习模型进行训练,并且由于不良品比较具有代表性,所以机器学习模型将针对不良品来自动产生多个机器标记,以指出机器学习模型所没学习过的瑕疵。然后,通过人工的方式来检查这些机器标记,并且让机器学习模型再使用具有经检查后的这些机器标记的在线产品数据进行训练,以至于相较现有技术需要先有人工来标记大量数据才让机器学习模型进行训练,本发明更可节省人力时间。

以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的申请专利范围,所以凡是运用本发明说明书及附图内容所做的等效技术变化,均包含于本发明的申请专利范围内。

技术分类

06120113821480