掌桥专利:专业的专利平台
掌桥专利
首页

基于树型层进网络的不平衡废钢样本判级方法

文献发布时间:2023-06-19 16:06:26



技术领域

本发明涉及金属处理技术领域,具体为一种基于树型层进网络的不平衡废钢样本判级方法。

背景技术

钢铁行业是国民经济发展的支柱产业,能够辐射一系列的下游行业,如房地产、汽车、船舶。其中,废钢的分类判级与回收利用,是整个钢铁行业降本工作的重中之重,对促进钢铁行业整体低碳化发展,提高钢铁再利用水平,具有重要的意义和价值。随着深度学习技术的逐渐发展,其与各产业的结合也更为紧密,钢铁行业也不例外。传统的废钢检验判级主要靠人工目测、卡尺测量及生产厂、技术中心监督员共同判定,其判级步骤繁琐拖沓,且受制于人的主观感知和累积经验,导致在实际判级操作中不仅耗费了大量的人力物力,且存在较多的质量争议判级。

具有鲁棒性和强泛化能力的深度学习模型,必然依赖于一个样本较为充足,且分布相对均衡的大规模数据集。然而,在实际的废钢判级任务中,受制于复杂的检测场景和繁多的废钢种类,现有的方法所构建的废钢分类数据集,往往存在非常严重的长尾分布效应。即只有少部分的类别(头部类别)具有充足且多样化的训练样本,而剩余的大量类别(尾部类别),其可供训练的样本往往非常稀疏。这种极度不平衡的样本数据分布,会导致模型在训练时只关注拟合头部类别的数据,而忽视了对尾部类别的学习,从而导致预测结果的严重偏差,即只有少量的头部类别能被准确预测,而大量的尾部类别被错分或者被忽视。这种预测的偏差,会降低废钢判级的精度,并因误判会给钢铁企业带来严重的经济与效益损失;鉴于此,我们提出了一种基于树型层进网络的不平衡废钢样本判级方法。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种基于树型层进网络的不平衡废钢样本判级方法,解决了上述背景技术提到的问题。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:一种基于树型层进网络的不平衡废钢样本判级方法,该方法包括以下步骤:

S1:构建废钢类型与判别等级的对应关系表,并构建常规的、基于深度学习的废钢分类模型。

S2:迭代地训练废钢分类模型,并据此构建和更新相应的废钢类别树。

S3:搭建并训练基于动态记忆模块的深度学习编码器,以提取并增强废钢样本的差异化特征。

S4:搭建并训练基于树型层进网络的深度学习解码器,以强化整体模型对废钢样本的无偏预测能力,从而提升模型对废钢判级的整体精度与准确性。

S5:获得训练完成的基于动态记忆模块和树型层进网络的深度学习模型,将其用于实际的废钢判级作业中。

优选的,所述S1具体包括以下步骤:

S11:定义该场景下所可能包含的所有废钢类别集合C

C

S12:根据实际生产需求,定义所有的废钢判级类别集合Z;

Z={z

S13:搭建对应的废钢分类数据集;

S14:搭建基于深度学习的常规废钢分类模型Model_N。

优选的,所述S2包括以下步骤:

S21:复制常规废钢分类模型Model_N,获取一个全新的、参数未经过训练和优化的模型Model_N

S22:使用所有的训练集图片样本,训练废钢分类模型Model_N

其中

S23:对每个类别c

优选的,所述S2进一步的包括以下步骤:

S24:对每个训练集的废钢目标标注l

S25:复制常规废钢分类模型Model_N,获取一个全新的、参数未经过训练和优化的模型Model_N

优选的,所述S3具体包括以下步骤:

S31:构建基于目标检测模块Faster R_CNN为基础的视觉特征抽取模型Encoder

S32:构建基于多层感知机的辅助解码器Decoder

S33:构建包含所有M类的废钢类别的动态记忆特征库Memory;

并对应的维护一个M维的记忆系数矩阵COFF;

COFF=[coff

优选的,所述S3进一步的包括以下步骤:

S34:在模型的训练过程中,对输入图片I中每个候选目标所对应的原始视觉特征

S35:根据原始视觉特征

S36:对图I中每个候选目标,结合原始视觉特征

优选的,所述S4具体包括以下步骤:

S41:构建基于多层感知机的父类解码器Decoder

S42:对图I中每个候选目标,首先获取其对应的类别标注,再根据步骤S25中的父类映射函数

S43:根据步骤S36中的增强视觉特征v

S44:根据步骤S36中的增强视觉特征v

S45:整体损失函数的计算公式如下所示:

优选的,S5具体包括以下步骤:

S51:充分训练模型,获得鲁棒的视觉特征抽取模型Encoder

S52:对给定待测试图片I

S53:根据得到的废钢类别预测p

(三)有益效果

本发明提供了一种基于树型层进网络的不平衡废钢样本判级方法。具备以下有益效果:

(1)、该基于树型层进网络的不平衡废钢样本判级方法,能够解决现有废钢判级数据集中所存在的严重长尾效应,从而避免严重偏差的预测结果,提升模型整体预测的无偏性。

(2)、该基于树型层进网络的不平衡废钢样本判级方法,通过融合动态记忆模块中所存储的各类代表性特征,从而增强当前目标的特征表示,进一步提升了整体模型的预测准确度。

(3)、该基于树型层进网络的不平衡废钢样本判级方法,通过树型分类网络显示挖掘不同类别间的显著型差异与微小型差异,提升了模型对尾部谓词的整体泛化能力。

附图说明

图1为本发明整体流程的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种技术方案:一种基于树型层进网络的不平衡废钢样本判级方法,包括以下步骤:

S1:构建废钢类型与判别等级的对应关系表,并构建常规的、基于深度学习的废钢分类模型。

S2:迭代地训练废钢分类模型,并据此构建和更新相应的废钢类别树。

S3:搭建并训练基于动态记忆模块的深度学习编码器,以提取并增强废钢样本的差异化特征。

S4:搭建并训练基于树型层进网络的深度学习解码器,以强化整体模型对废钢样本的无偏预测能力,从而提升模型对废钢判级的整体精度与准确性。

S5:获得训练完成的基于动态记忆模块和树型层进网络的深度学习模型,将其用于实际的废钢判级作业中。

本实施例中,S1具体包括以下步骤:

S11:定义该场景下所可能包含的所有废钢类别集合C

C

其中c

S12:根据实际生产需求,定义所有的废钢判级类别集合Z。

Z={z

其中z

S13:搭建对应的废钢分类数据集。

S14:搭建基于深度学习的常规废钢分类模型Model_N,该模型能够根据输入的图片l,检测其中所有的废钢目标并给出其类别预测集合

其中

本实施例中,步骤S2具体包括以下步骤:

S21:复制常规废钢分类模型Model_N,获取一个全新的、参数未经过训练和优化的模型Model_N

S22:使用所有的训练集图片样本,训练废钢分类模型Model_N

其中

S23:对每个类别c

所对应的类别

S24:对每个训练集的废钢目标标注l

S25:复制常规废钢分类模型Model_N,获取一个全新的、参数未经过训练和优化的模型Model_N

本实施例中,S3具体包括以下步骤:

S31:构建基于目标检测模块Faster R_CNN为基础的视觉特征抽取模型Encoder

S32:构建基于多层感知机的辅助解码器Decoder

S33:构建包含所有M类的废钢类别的动态记忆特征库Memory;

并对应的维护一个M维的记忆系数矩阵COFF;

COFF=[coff

在训练开始时,将动态记忆特征库Memory和对应的记忆系数矩阵COFF中各项均置为0。

S34:在模型的训练过程中,对输入图片I中每个候选目标所对应的原始视觉特征

S35:根据原始视觉特征

S36:对图I中每个候选目标,结合原始视觉特征

其中,tanh(·)代表双曲正切函数,MLP(·)代表多层感知机,代表Hadamard乘积。

本实施例中,步骤S4具体包括以下步骤:

S41:构建基于多层感知机的父类解码器Decoder

S42:对图I中每个候选目标,首先获取其对应的类别标注l

S43:根据步骤S36中的增强视觉特征v

S44:根据步骤S36中的增强视觉特征v

S45:因此,在对整体模型进行训练时,其整体损失函数的计算公式如下所示:

其中B代表所有待训练的候选目标总数。

本实施例中,S5具体包括以下步骤:

S51:充分训练模型,获得鲁棒的视觉特征抽取模型Encoder

S52:对给定待测试图片I

S53:根据得到的废钢类别预测p

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 基于树型层进网络的不平衡废钢样本判级方法
  • 一种类不平衡样本下基于层再生网络的故障智能诊断方法
技术分类

06120114700186