掌桥专利:专业的专利平台
掌桥专利
首页

一种基于多算法集成的分歧介入珍珠分拣方法

文献发布时间:2023-06-19 11:57:35


一种基于多算法集成的分歧介入珍珠分拣方法

技术领域

本发明涉及一种珍珠检测分类方法,适用于利用人的介入方案解决纯深度学习在珍珠分拣精度提升受限的情况。

背景技术

传统珍珠分拣主要通过人工进行,经验丰富的从业人员通过肉眼观察珍珠的颜色、光泽、形状和质地等多种外观特征,然后依照某种事先定好的等级规则进行分类。容易认识到,对大量外观差距可能并不太大的珍珠进行观察分拣是一项重复单调的劳动;而随着时间的增加,人的疲劳也会大大影响分拣的准确度。然而,将高等级珍珠误分为低等级固然会错误的降低售卖价值,反过来将低等级珍珠误分为高等级也会影响产品质量和信誉。因此,为了分拣的高效和稳定,就有必要引入自动化的分拣方法。

由于珍珠分拣主要基于珍珠外观进行,自动化的分拣方法因而大多基于机器视觉的方法和技术。传统计算机视觉方法中珍珠特征的手工标注依赖于专家知识,成本相对较高。近年来,深度学习方法尤其是卷积神经网络CNN在图像分类方面取得了很大的成功,它可以自动生成有用的特征,从而节省大量手工标注工作。目前依靠深度学习方法训练的自动分类系统已经达到了92.57%的分拣精度,但这对企业的要求来讲仍然是不够的。对珍珠生产企业而言,1%的分拣准确度提升也有很大的经济价值。这主要是因为珍珠单价昂贵,不同等级之间价格甚至相差几百倍,把优等珍珠分成次等品会导致利益损失严重,而把有瑕疵珍珠分成上等品会造成产品质量争议和企业信誉受损。这就对珍珠分拣准确度的提升提出了现实的需求。

可以理解的是,在此基础上的准确度的进一步提升存在很大的困难。原因一方面是技术上的,目前基于深度学习的人工智能技术仍存在着难解释,鲁棒性差等缺点,导致难以训练出具有更高精度的算法来,其中存在的错误输出也无法预知。另一方面的原因是成本上的,大量准确标注的珍珠数据集难以获取。上述分析意味着如果需要进一步提升珍珠分拣的准确度,很有可能需要跳出现有的单纯的深度学习技术框架。

发明内容

本发明要克服现有技术的上述缺点,即对珍珠分拣准确度的现实需求和提升准确度在现有框架下的限制,提供一种基于多算法集成的分歧介入珍珠分拣方法。

本发明能够在不改动算法本身的情况下,使用了一种基于多个冗余算法分歧的方法,通过引入冗余的自动分拣算法,将多个算法产生判定分歧的珍珠认定为分拣失误,并以最少的人力成本对分拣失误的部分进行再判定,这对此类珍珠分拣方法的精度提升提供了一种思路。

本发明解决其技术问题所采用的技术方案是:

一种基于多算法集成的分歧介入珍珠分拣方法,含有以下步骤:

步骤一:将珍珠数据集按类别分别记为Class1-7,并给每张图片制定好标签,按6:2:2的比例分成训练集、验证集和测试集;

步骤二:选取目前较为主流先进的三个模型ResNet50、SE-ResNet50和Vgg16进行独立训练,需均能够完成珍珠分拣任务,并分别保存最优模型;

步骤三:将获取的三个最优模型用于仲裁系统,即针对构造后的主、次系统给出的预测结果进行分歧仲裁;

步骤四:在实验验证阶段,我们使用分歧准确指数α和额外成本指数β作为系统分歧的评价指标,评估系统的整体性能;

步骤五:根据步骤四的评价指标,选取既达到分拣精度提升较高又同时所需的人力成本较少的系统组合作为最终的珍珠分拣系统;

步骤六:输出最终分类结果。

本发明提出了能在不改动算法本身的情况下,使用了一种基于多个冗余算法分歧的方法,通过引入冗余的自动分拣算法,将多个算法产生判定分歧的珍珠认定为分拣失误,并以最少的人力成本对分拣失误的部分进行再判定,这对此类珍珠分拣方法的精度提升提供了一种思路。卷积神经网络CNN可以对图片中的特征进行提取,对新的图片中的信息进行识别,因此就可以对大量的已知标签的图片进行训练后,对未知标签的图片进行分类;人的有效介入能够纠正系统自身存在的预测偏差问题。

与现有技术相比,本发明技术方案的优点有:

(1)利用多个冗余算法的分歧能更为简单有效检测出仅使用一类算法预测分类出错的情况;

(2)必要时引入少量的人力成本校正错误分类,有效利用人的优势弥补机器过失,易获得更高的分拣精度。

附图说明

图1:本发明方法的流程图;

图2:本发明方法的分歧仲裁框图;

图3:本发明方法的基于多算法的人的分歧介入框图;

图4:本发明方法的基于算法集成的分歧介入框图;

图5:本发明方法中使用的数据集。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图和实施例对本发明作进一步的详细描述。

一种基于多算法集成的分歧介入珍珠分拣方法,含有以下步骤:

步骤一:将珍珠数据集按类别分别记为Class1-7,并给每张图片制定好标签,按6:2:2的比例分成训练集、验证集和测试集;

步骤二:选取目前较为主流先进的三个模型ResNet50、SE-ResNet50和Vgg16进行独立训练,需均能够完成珍珠分拣任务,并分别保存最优模型:训练模型时设置训练最大次数为10个Epoch,将训练和测试时的单次处理样本数Batch设置为32,学习率为0.0001,使用Adam优化器,并将step-size设置为5,gamma设置为0.1,学习率将在训练过程中经过5次变化逐渐变成0.1,最终得出这三个最优模型的精度分别为91.84%、92.25%、91.29%;

步骤三:将获取的三个最优模型用于仲裁系统,即针对构造后的主、次系统给出的预测结果进行分歧仲裁:若有分歧产生则认为系统分类可能有误,需介入人做最终决策;若无分歧,则保留主算法的预测结果。这里,三个模型两两分组,剩下的一个模型作为主系统,搭配的两模型以集成学习方法构成次系统,其中集成得到的次系统最终预测输出定义为:

其中,h

步骤四:在实验验证阶段,使用分歧准确指数α和额外成本指数β作为系统分歧的评价指标,评估系统的整体性能:分歧准确指数α指的是主算法分类错误后被纠正的图片数目占该模型分类错误的图片总数目的比值,用于评价该方法找出分类错误的能力;额外成本指数β指的是主算法分类正确但交于人进行判断的图片数目占最优模型分类正确的图片总数目的比值,用于表示该方法消耗的无效人力成本;

步骤五:根据步骤四的评价指标,选取既达到分拣精度提升较高又同时所需的人力成本较少的系统组合作为最终的珍珠分拣系统;

步骤六:输出最终分类结果:若仲裁器选取主系统给出的分类结果即为该珍珠类型,反之经由人的判定分类后重新给出预测结果,视该结果为最终类型。

所述的珍珠数据集分类步骤具体包括:首先按粗糙规则分类可大致分为两类:1)一类为价值较低的扁平型或深瑕疵珍珠;2)另一类为瑕疵程度较小的珍珠;其次按更为精细的分类标准,第一大类较差的珍珠分类又可分为三个小类:A1)具有多个平面的珍珠;A2)形状对称的珍珠;A3)其他珍珠;第二大类较好的珍珠分类又可分为四个小类:B1)短半径与长半径之比大于0.7的珍珠;B2)颜色浅淡的珍珠;B3)隐含斑点的珍珠;B4)其余珍珠。

本发文所称的卷积神经网络、珍珠数据集,参见Qi Xuan、Binwei Fang等人发表于IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS 2018的《Automatic PearlClassification Machine Based on a Multistream Convolutional Neural Network》一文。

本发明通过基于多个冗余算法的分歧找出机器分类可能存在的错误预测,并以最少的人力成本介入纠正其预测输出,从而提升整个珍珠分拣的分类精度。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

相关技术
  • 一种基于多算法集成的分歧介入珍珠分拣方法
  • 一种基于人的分歧介入的珍珠分拣方法
技术分类

06120113115829