一种基于数据耦合微特征相关性分析的质量缺陷预测方法
文献发布时间:2023-06-19 18:37:28
技术领域
本发明属于制造过程质量预测控制技术领域,具体涉及一种基于数据耦合微特征相关性分析的质量缺陷预测方法。
背景技术
制造过程中的各项特性总是波动的,为了满足人们的需求,需要使其在人们能接受的范围内波动。系统因素和偶然因素给各类质量特性数据带来波动,后者往往是背离制造过程设计初衷的,也是造成质量缺陷的原因。在当下各类传感器与数据库系统的广泛应用的条件下,综合多元的质量特性耦合数据进行质量缺陷分析成为可能。同时,由于制造过程的时序性,借助质量预测模型,在制造过程中对可能出现的质量缺陷进行预防能有效降低制造成本。对导致质量缺陷的因素进行有效解耦,构建质量缺陷预测模型,使用关键质量特性参数进行实时预测,能有效地实现制造质量控制。
针对质量缺陷分析手段,有结合以控制图为代表的SPC手段形成和控制图模式识别方法,有以神经网络判断质量缺陷的方法,有基于GA进行质量缺陷关联规则提取的方法,有结合模糊推理与Stateflow进行质量缺陷分析的方法,有综合CBR(Case BasedReasoning)与KNN(K-Nearest Neighbor Algorithm)算法推测案例的相似性度量,运用案例库进行质量诊断的方法。但较多研究都集中在最终特征输出,模型的解释性较差,不利于质量解耦,其中以神经网络方法尤甚。针对预测模型,已有如贝叶斯网络、随机森林、LGBM(Light Gradient Boost Machine)、多层感知机、RNN(Recurrent Neural Network)、深度神经网络等较为广泛适用的模型,但对于数据的模糊性的处理效果不是很好,而若结合模糊理论进行处理,发现在实际试验过程中可能会产生过多的模糊区间,降低算法效率。
发明内容
为解决上述技术问题,本发明提出了一种基于数据耦合微特征相关性分析的质量缺陷预测方法。
本发明采用的技术方案为:一种基于数据耦合微特征相关性分析的质量缺陷预测方法,具体步骤如下:
S1、构建数据耦合微特征相关性分析方法,对质量特性耦合数据进行区间划分并识别质量特性耦合数据间的关联关系,通过置信阈值高低,从高频微特征项集里面提取显著缺陷特征数据;
S2、搭建基于耦合数据微特征相关性规则的制造过程质量缺陷预测模型,完成对质量缺陷的预测。
进一步地,所述步骤S1中,具体如下:
初始化k个点μ={μ
对于每一个质量缺陷耦合数据微特征样例i,计算其应该属于的特征类,定义损失函数:
其中,c表示类集合,μ表示集合中心点,x
对于每一个样本x
其中,
对于每一个中心点μ
其中,μ表示集合中心点。
在质量特性耦合数据有k个区间的情况下,多次迭代下到特征核心值稳定在小范围内。
在确定质量特性耦合数据微特征区间后,确定微特征相关性的支持域值与置信域值。依据支持域值产生与强相关规则依据置信域值生成微特征高频项集。
支持域值由某项集X的微特征模式数与微特征模式数据库D总数比计算,计算式为:
其中,T表示目标模式数。
最小支持域值是微特征规则项集中的设置的最小支持阈值,记为sup_min,支持域值大于等于sup_min的项集叫做微特征高频项集。
通过置信域值发现强关联规则,其含义是同时包含项集X与Y的微特征模式数与只包含X的微特征模式数的比率,其计算表达式为:
进一步地,所述步骤S1中,质量耦合数据微特征相关性规则分析任务中,具体如下:
产生高频模式项集:对于所有达到最小支持度阈值要求的微特征项集,提取这些微特征项集,并且称这些项集为高频微特征项集。
产生微特征强相关规则:根据置信阈值高低,从高频微特征项集里面提取规则。
进一步地,所述步骤S2中,具体如下:
将耦合数据微特征样本数据映射到多维空间,并进行回归,从而拟合出一个连续函数,即模型函数f(x)=wx+b,表示样本点(x,y)在法向量w,偏移量b的线性面上,以线性函数为中心,其两侧定义“微距区域”,位置在微距区域内的样本,不考虑模糊异常区间;而位置在微距区域之外的,则成为模糊异常区间函数中一员,最后,通过最小化微距区域的宽度,将模糊异常区间降到最低,从而建立最优化预测模型。
引入两隔离变量ξ(正微距区偏移常数)与ξ*(负微距区偏移常数)使模型对样本点有一定清晰度。
其中,f(x)=wx+b是最终要求得的模型函数;f(x)+ε与f(x)-ε表示微距区域的上下界限,ε表示模糊异常区间系数。
可用公式表述为:
其中,ξ
对于任意样本x
最优化预测问题的数学描述可以表示为:
f(x
其中,关键质量特性耦合数据微特征相关性规则构造输入向量,以制造质量为输出,对质量预测模型进行训练。训练过程使用GA对超参数进行优化,优化参数为质量预测模型的相关性系数C和模糊异常区间系数ε。
本发明的有益效果:本发明的方法通过构建数据耦合微特征相关性分析方法,对质量特性耦合数据进行区间划分并识别质量特性耦合数据间的关联关系,通过置信阈值高低,提取显著缺陷特征数据,搭建基于耦合数据微特征相关性规则的制造过程质量缺陷预测模型,完成对质量缺陷的预测。本发明的方法能够实时预测制造质量,对导致输出质量缺陷的关键质量特性数据和对该质量特性有影响作用的制造过程多元输入参数进行分析与预测,利于多元质量特性耦合数据进行质量解耦,发现质量缺陷形成机理,进行多链溯源,具有较好的成因解释性,能有效解决质量特性耦合数据区间划分以及模糊算法在小值域上产生过多的模糊区间的问题。
附图说明
图1为本发明的一种基于数据耦合微特征相关性分析的质量缺陷预测方法的流程图。
图2为本发明实施例中基于耦合数据微特征相关性规则的质量缺陷预测模型构建图。
图3为本发明实施例中模具温度、熔融温度和注射时间的聚类图。
图4为本发明实施例中保压时间和保压温度聚类图。
图5为本发明实施例中GA-MFCCD与GA-ELM对比图。
具体实施方式
下面结合附图与实施例对本发明作进一步的说明。
首先在实施例1中,如图1所示,本发明的一种基于数据耦合微特征相关性分析的质量缺陷预测方法流程图,具体步骤如下:
S1、构建数据耦合微特征相关性分析方法,对质量特性耦合数据进行区间划分并识别质量特性耦合数据间的关联关系,通过置信阈值高低,从高频微特征项集里面提取显著缺陷特征数据;
S2、搭建基于耦合数据微特征相关性规则的制造过程质量缺陷预测模型,完成对质量缺陷的预测。
在本实施例中,所述步骤S1中,具体如下:
初始化k个点μ={μ
对于每一个质量缺陷耦合数据微特征样例i,计算其应该属于的特征类,定义损失函数:
其中,c表示类集合,μ表示集合中心点,x
对于每一个样本x
其中,
对于每一个中心点μ
其中,μ表示集合中心点。
在质量特性耦合数据有k个区间的情况下,多次迭代下到特征核心值稳定在小范围内。
在确定质量特性耦合数据微特征区间后,确定微特征相关性的支持域值(support)与置信域值(confidence)。依据支持域值产生与强相关规则(strong rule)依据置信域值生成微特征高频项集(frequent itemset)。
支持域值由某项集X的微特征模式数与微特征模式数据库D总数比计算,计算式为:
其中,T表示目标模式数。
最小支持域值是微特征规则项集中的设置的最小支持阈值,记为sup_min,支持域值大于等于sup_min的项集叫做微特征高频项集。
通过置信域值发现强关联规则,其含义是同时包含项集X与Y的微特征模式数与只包含X的微特征模式数的比率,其计算表达式为:
在本实施例中,所述步骤S1中,质量耦合数据微特征相关性规则分析任务中,具体如下:
产生高频模式项集:对于所有达到最小支持度阈值要求的微特征项集,提取这些微特征项集,并且称这些项集为高频微特征项集。
产生微特征强相关规则:根据置信阈值高低,从高频微特征项集里面提取规则。
在本实施例中,所述步骤S2中,具体如下:
如图2所示,w表示w的向量形式,将耦合数据微特征样本数据映射到多维空间,并进行回归,从而拟合出一个连续函数,即模型函数f(x)=wx+b,表示样本点(x,y)在法向量w,偏移量b的线性面上,以线性函数为中心,其两侧定义“微距区域”,位置在微距区域内的样本,不考虑模糊异常区间;而位置在微距区域之外的,则成为模糊异常区间函数中一员,最后,通过最小化微距区域的宽度,将模糊异常区间降到最低,从而建立最优化预测模型。
由于质量耦合数据模糊相关性使得微特征模式样本点位置都在微距区域内,为进一步区间清晰化,引入两隔离变量ξ(正微距区偏移常数)与ξ
其中,f(x)=wx+b表示最终要求得的模型函数;f(x)+ε与f(x)-ε表示微距区域的上下界限;ε表示模糊异常区间系数;
可用公式表述为:
其中,ξ
对于任意样本x
最优化预测问题的数学描述可以表示为:
f(x
其中,关键质量特性耦合数据微特征相关性规则构造输入向量,以制造质量为输出,对质量预测模型进行训练。训练过程使用GA(Genetic Algorithm)对超参数进行优化,优化参数为质量预测模型的相关性系数C和糊异常区间系数ε。
本发明还提供了实施例2,对注塑过程中质量缺陷的分析,具体如下:
塑料的注射成型过程中,事前要进行产品缺陷分析,产品质量监测,以及及时改良产品的参数,以满足企业的质量要求。
根据实际注塑生产经验反馈,以下五个是影响注塑过程质量的关键参数:模具温度T1(℃),熔体温度T2(℃),注射时间S1(s),保压时间S2(s),保压压力P(%)。采用高密度聚乙烯HDPE(High-density Polyethylene)作为实验材料,部分原始数据如表1所示:
表1
如图3、图4所示,原数据包含有正常质量产品,出现凹陷产品,出现翘曲产品。因此根据耦合数据微特征相关性分析方法,将影响因素分别聚类可得到影响因素的大致分类。
其中,图3中模具温度为x轴,熔体温度为y轴,注射时间数据分类为z轴;图4中保压时间为x轴,保压压力数据分类为y轴。
由于该分类结果并非最适结果,因此基于后面算法的实现结果,进行了区间范围的调整,调整结果如表2:
表2
由表2可知,共有12个数据区间,因此将数据区间表示如表3所示:
表3
根据耦合数据微特征相关性分析方法,得到不同区间之间以及区间与最终质量结果之间的相关性关联规则,部分关联规则如表4所示:
表4
因此根据耦合数据微特征相关性分析方法所得出的以上三条规则可知:
(1)对于质量正常的产品来说,质量规则为:
(20.1≤T1≤58.3)∩(123.0≤T2≤256.2)∩(0.21≤S1≤1.19)∩(3.1≤S2≤10.2)∩(61.3≤P≤78.1)
(2)对于凹陷产品来说,质量规则为:
(T1>62.1)∩(T2>273.3)∩(P<58.1)
(3)对于翘曲产品来说,质量规则为:
(T1>68.5)∩(S2>17.5)∩(P>84.4)
因此,在注塑产品的生产过程中,要注意控制这些影响因素在合理范围内,从而实现高效率管理。
不考虑干扰等偶然因素的情况下,选取生产过程中产生的100组数据作为训练集和测试集,进行过程质量的预测,并最终得出预测值。
通过MFCCD模型得出了预测结果以及与原数据相比的预测误差百分比。此处与GA进行了优化的隐含层自适应增长极端学习机(GA-ELM)模型进行对比,对比具体如图5及表5所示:
表5
RMSE(Root Mean Square Error)为均方根误差,计算公式为:
其中,n表示样本总数,prediction表示预测值,target表示真实值。
由图及表可知,GA-MFCCD的预测误差相对较小。GA-MFCCD方法预测结果中,最大误差为3.58%,最小为0.87%。总体而言,本发明的方法可以较为准确地预测出注塑凹陷直径。
综上所述,本发明的方法通过构建数据耦合微特征相关性分析方法,对质量特性耦合数据进行区间划分并识别质量特性耦合数据间的关联关系,通过置信阈值高低,从高频微特征项集里面提取显著缺陷特征数据,搭建基于耦合数据微特征相关性规则的制造过程质量缺陷预测模型,完成对质量缺陷的预测。本发明的方法能够实时预测制造质量,对导致输出质量缺陷的关键质量特性数据和对该质量特性有影响作用的制造过程多元输入参数进行分析与预测,利于多元质量特性耦合数据进行质量解耦,发现质量缺陷形成机理,进行多链溯源,具有较好的成因解释性,能有效解决质量特性耦合数据区间划分以及模糊算法在小值域上产生过多的模糊区间的问题。