一种应用于生产管理的数据分类识别方法

文献发布时间：2024-01-17 01:21:27

技术领域

本发明涉及数据处理领域，具体涉及一种应用于生产管理的数据分类识别方法。

背景技术

在工业生产中，自动化生产会出现生产参数，生产出的产品都需要经过质检，检测合格才算是合格的产品。但是在自动化检测中，产品的生产参数数据通常是判断产品好坏的标准。然而在工业生产中，产品往往是批量生产的，大量的生产数据以及生产信息在各部门之间的共享与传递是不通畅的，生产线的生产状态信息反馈到管理部门的过程中存在滞后，导致当产品的生产参数出现异常后，管理部门不能及时发现异常，进而造成巨大的经济损失，由此导致生产管理不顺畅，生产计划不达标，降低了生产线运行效率。

发明内容

本发明提供一种应用于生产管理的数据分类识别方法，以解决现有的信息传递滞后的问题。

本发明的一种应用于生产管理的数据分类识别方法采用如下技术方案：

本发明一个实施例提供了一种应用于生产管理的数据分类识别方法，该方法包括以下步骤：

获取生产线上产品在各个时刻的各个参数数据，得到所述各个时刻的参数序列；

根据设定时间内各个时刻的参数序列得到所述设定时间的数据矩阵；根据数据矩阵中每一行的差值均值得到所述数据矩阵的整体特征；

将数据矩阵转化为数据序列，将参数数据类型的数量作为时间延迟量；根据时间延迟量以及相空间的嵌入维数得到所述相空间的多个相点；根据不同嵌入维数下，相空间中各个维度上所有相点的坐标值得到相空间的分块边长；

将分块边长作为最小空间单元的边长，根据所述最小空间单元内所有相点之间的欧氏距离得到搜索半径的取值范围；根据各个最小空间单元内各个相点之间的欧氏距离以及不同搜索半径得到所述不同搜索半径对应的关联维数；根据每个嵌入维数下，各个搜索半径以及所述各个搜索半径的关联维数得到所述每个嵌入维数的变化曲线；根据所有变化曲线的斜率得到特征区间以及最佳关联维数，所述最佳关联维数以及特征区间构成了所述数据矩阵的局部特征；

使用历史数据中各个设定时间内正常数据所对应的局部特征以及整体特征训练神经网络，得到分类神经网络；将生产过程中每个设定时间内的数据矩阵的局部特征和整体特征，输入到分类神经网络中，得到所述每个设定时间所对应的数据类型。

优选的，所述得到数据矩阵的整体特征的获取方法为：

计算数据矩阵中每一行数据的均值；将数据矩阵中每一行中各个数据的值与所述每一行数据的均值之间差值的累加和，作为所述每一行的整体特征；将数据矩阵中所有行的整体特征构成的一维序列作为所述数据矩阵的整体特征。

优选的，所述根据时间延迟量以及相空间的嵌入维数得到所述相空间的多个相点的方法为：

从数据序列中任意一个数据开始，每间隔一个时间延迟量获取一个数据，共获取的数据个数等于相空间的嵌入维数，以每次获取的数据为相点的一个维度上的坐标值，得到所述相空间中的多个相点，每个相点的坐标维数与相空间的嵌入维数相同。

优选的，所述相空间的分块边长的获取表达式为：

式中，L为相空间的分块边长；N为整个相空间中相点的总个数；

优选的，所述根据所有变化曲线的斜率得到特征区间以及最佳关联维数的方法为：

设置单位区间，获取每个单位区间内，各个变化曲线的斜率；将每个单位区间内，所有变化曲线的斜率之间的均值作为所述每个单位区间的参考斜率；

计算每个单位区间内，所有变化曲线的斜率与参考斜率之间差值的累加和，将所述累加和的绝对值作为所述每个单位区间的饱和性判断指标；以所有变化曲线的个数的倒数为阈值，当每个单位区间的饱和性判断指标小于所述阈值，所述每个单位区间为斜率饱和区间，否则不为斜率饱和区间；

将所有斜率饱和区间中，区间位置最靠前的斜率饱和区间为特征区间，该区间内最大斜率的变化曲线所对应的嵌入维数为最佳关联维数。

本发明的有益效果是：对于生产线数据参数进行采集，将其按照时间构建出了一个数据矩阵，根据每种参数之间的整体特征构建整个数据矩阵的整体特征，通过最佳关联维数以及最先出现的斜率饱和区间构建整个数据矩阵的局部特征，结合历史数据的整体特征和局部特征进行分类神经网络训练，在使用关联维数时要对所有相点两两之间进行求解，需要大量的计算量，本方案针对此构建相空间的最小空间单元，对于不同的搜索半径r对不同单位空间进行搜索，只对最小空间单元内的相点之间的距离进行最佳关联维数的求解，提高了算法效率，降低生产状态信息在传输过程中的滞后时间，且在使用不同r值时求其斜率，根据异常数据和正常数据的不同，对应不同的区间，将该区间也作为特征的一部分，进一步提高数据分类识别的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的一种应用于生产管理的数据分类识别方法的步骤流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种应用于生产管理的数据分类识别方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种应用于生产管理的数据分类识别方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种应用于生产管理的数据分类识别方法的步骤流程图，该方法包括以下步骤：

步骤S001：获取产品生产过程中各个生产线上各个时刻的参数数据，得到所述各个时刻的参数序列。

针对于不同的检测目的采集不同类型的参数数据；以生产线数据为例，在整条数据传输线路中建立一个数据中转站，使用采集装置，如相机或传感器，采集生产线在不同时刻对应的多种参数数据，同一时刻得到的各种参数数据构成了该时刻的参数序列，数据采集完成后，将参数序列存储在数据中转站中，由数据中转站对数据进行识别。

步骤S002：根据设定时间内各个时刻的参数序列得到所述设定时间的数据矩阵；根据数据矩阵中每一行的差值均值得到所述数据矩阵的整体特征。

设生产线的参数共有n种，则第t个时刻采集得到的参数据序列

由此得到各个时刻的参数序列。设置时间长度为T，对该T时间内所产生的参数数据进行分析，T的大小由厂家根据实际情况自行设定，根据

此时该数据矩阵中的每一列为同一时刻采集的各种参数数据；该数据矩阵中的每一行为不同时刻采集的同种参数数据，即该数据矩阵的行数等于生产线参数类型的个数

由于采集到的数据分为两类：异常数据和正常数据，其中正常数据参数在一个范围内波动，而异常数据可能会有较大幅度的变动，如一种参数在某个时刻与其他时刻的数据产生较大差异，因此本发明首先对于数据矩阵的每种参数进行整体分析，即对数据矩阵中的每一行数据进行整体分析：将数据矩阵每一行都进行累加，计算其每一行数据的均值，然后计算数据矩阵A中每一行的各个数据与该行的均值之间的差值，最后计算每一行各个数据对应的差值之间的均值，得到该行数据的整体特征，将所有行的整体特征作为该数据矩阵的整体特征，其中第s行数据的整体特征

使用上述方法得到数据矩阵中每一行数据的整体特征，得到整体特征序列

步骤S003：获取相空间的多个相点，相空间中的最小空间单元；根据各个最小空间单元内各个相点之间的欧氏距离以及相空间的嵌入维数得到最佳关联维数以及特征空间，进而得到数据矩阵的局部特征。

考虑到异常数据可能会出现整体变化，即设定时间段内的每个时刻都为异常数据，使用上述方法得到的每种参数的整体特征就无法分辨出同种参数中的正常数据和异常数据，因此要对数据进行区域分析。即使用关联维数将不同时刻采集的不同类型的所有参数数据进行，根据最优分组结果得到数据对应的最佳维数，该维数就可以反映出数据的局部特征。而异常数据和正常数据根据局部不同所得到的分维效果也不同，此时不同的维数就可以作为局部特征识别数据类型。

对于矩阵数据，令其构建相空间，相空间在数学与物理学中，是一个用以表示出一个系统所有可能状态的空间，相空间的构建本质上是为了挖掘整个序列更多的信息，找到与原始系统在某种意义上等价的另一个新系统，相空间构建方式如下：

首先将数据矩阵转换为数据序列，该数据序列记为

相空间的构建过程中，所需的另一种重要的参数为相空间的嵌入维度，以m作为相空间的嵌入维数，从数据序列中任意一个数据开始，每间隔一个

现有方法中往往使用关联维数来计算嵌入维数，而关联维数最主要的算法即为G-P算法，故本发明使用G-P算法来计算关联维数，G-P算法为现有算法，在此就不做详细赘述，在G-P算法中得到的关联维数记为

因此，本发明首先对相空间进行分块，得到最小空间单元，对各个最小空间单元内的相点进行处理，提高计算效率。根据相空间的嵌入维数以及相空间中各个维度上所有相点的最大坐标值与最小坐标值计算空间分块边长，则当相空间的嵌入维数为m时，得到的空间分块边长为

式中，N为整个相空间中相点的总个数；

由于正常数据的波动幅度较小，因此正常数据所对应的相点之间的整体欧氏距离较小，而异常数据的波动幅度较大，其相点之间的整体欧式距离也会较大。因此需要对r的选取范围进行设定，为了能够更好的区分异常数据和正常数据，在计算关联维数时r的取值范围要较大，因此本发明首先计算嵌入维数为m时所对应的每个最小空间单元中各个相点之间的最小欧氏距离，取所有最小欧氏距离的最小值

然后将各个最小空间单元中任意两个相点之间的欧式距离与搜索半径r的大小，获取各个最小空间单元中欧式距离小于搜索半径的相点对所占的比例，将所有最小空间单元所对应的比例作为整个相空间的最终比例，后续根据该最终比例得到此时的搜索半径值r所对应的关联维数

当嵌入维数为m时，随着r取值范围的变化会得到对应的

关联维数的基本思想就是随着嵌入维数的增加在双对数图中斜率逐渐饱和，因此设置单位区间长度为h，h的经验值为10-15，本发明中设置单位区间长度

其中，

将第k个单位区间上所有变化曲线斜率与参考斜率做差，得到该第k个单位区间的饱和性判断指标：

当

选取区间序号最小，即区间位置最靠前的斜率饱和区间，记为E，选取该斜率饱和区间内所有变化曲线中斜率最大的变化曲线所对应的嵌入维数作为本发明的最佳关联维数，记为m

由此就得到了数据矩阵的局部特征：(m

至此，得到生产线数据矩阵的局部特征。

步骤S004：使用历史数据训练分类神经网络；使用分类神经网络对生产过程中每个设定时间所对应的数据类型进行分类识别。

获取历史时刻中的所有正常参数序列，并获取每T个历史时刻的正常参数序列所组成的数据矩阵，使用上述方法计算所有数据矩阵的局部特征以及整体特征，以各个数据矩阵的局部特征和整体特征作为分类神经网络的输入数据；分类神经网络的输出为数据类型，即数据矩阵中的数据正常数据和异常数据，当数据矩阵中存在异常数据时，认为该数据矩阵为异常数据；由于分类神经网络的目的是分类，因此，在分类神经网络的训练过程中所使用的损失函数为交叉熵损失函数；

将生产过程中每个设定时间内的数据矩阵的局部特征和整体特征，输入到分类神经网络中，得到所述每个设定时间内的生产数据所对应的数据类型。

通过以上步骤，完成生产数据的分类识别。

本发明首先对于生产线数据参数进行采集，将其按照时间构建出了一个数据矩阵，根据每种参数之间的整体特征构建整个数据矩阵的整体特征，通过最佳关联维数以及最先出现的斜率饱和区间构建整个数据矩阵的局部特征，结合历史数据的整体特征和局部特征进行分类神经网络训练，在使用关联维数时要对所有相点两两之间进行求解，需要大量的计算量，本方案针对此构建相空间的最小空间单元，对于不同的搜索半径r对不同单位空间进行搜索，只对最小空间单元内的相点之间的距离进行最佳关联维数的求解，提高了算法效率，降低生产状态信息在传输过程中的滞后时间，且在使用不同r值时求其斜率，根据异常数据和正常数据的不同，对应不同的区间，将该区间也作为特征的一部分，进一步提高数据分类识别的准确性。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：秦炎;
专利申请人：南通二进制软件科技有限公司;

上一篇：一种带自动报警功能的成套接地线接地端
下一篇：由CMC制成的部件和用于制造这种部件的方法