掌桥专利:专业的专利平台
掌桥专利
首页

基于K均值聚类-LSTM的燃气管道腐蚀阶段预测方法

文献发布时间:2024-04-18 19:54:45


基于K均值聚类-LSTM的燃气管道腐蚀阶段预测方法

技术领域

本发明涉及神经网络技术领域,尤其涉及基于K均值聚类-LSTM的燃气管道腐蚀阶段预测方法。

背景技术

管道运输是我国能源运输的主要形式之一,我国的运输管网体量十分庞大,截止2020年底,我国原油和成品油管网里程已超6万千米,天然气管道总里程约11万千米。油气管网覆盖了我国各省市自治区,且有不止60%的管道运行超过20年,因管道老化、工作环境恶劣等原因造成的管道腐蚀泄漏,进而引发的管道事故时有发生。对于老旧管道,需要定期进行检测来确保其是否安全运行,监测管道处于腐蚀的哪个阶段而决定是否需要更换管道更是非常必要的。

随着我国智能化数字建设的发展,人工智能在很多方面都得到了有效应用。LSTM神经网络在自然语言处理、语音识别等时序数据储量方面获得了巨大的成功。而城镇燃气管道腐蚀具有时序性,但国内运用LSTM神经网络对于管道腐蚀阶段方面的研究较少,相关技术还不够成熟。

发明内容

针对现有算法的不足,本发明实现管道腐蚀阶段的准确预测,为管道腐蚀检修提供有利的参考依据。

本发明所采用的技术方案是:一种基于K均值聚类-LSTM的燃气管道腐蚀阶段预测方法,包括以下步骤:

步骤一、对采集到的声发射波形进行尾切处理;

步骤二、利用PCA算法提取信号尾切处理后数据特征值的特征向量,并根据累计贡献率进行排序,实现原始数据降维;

步骤三、利用轮廓系数法作为聚类标准,对步骤二处理后的数据进行聚类判断,得到聚类个数;

进一步的,轮廓系数法的聚类数k为3。

步骤四、根据步骤三得到的聚类个数、腐蚀后的波形图和撞击-时间图,利用K-means聚类算法得到聚类结果;

进一步的,聚类结果包括:初试腐蚀期、加速腐蚀期和平稳腐蚀期。

进一步的,K-means聚类算法具体包括:选择多变量分析,聚类个数选择3,不指定初始聚类中心,并设置最大迭代次数为10次。

步骤五、将步骤四的聚类结果输入LSTM神经网络模型,实现对腐蚀阶段的预测;

进一步的,LSTM神经网络模型包括:输入层、第一LSTM层、第二LSTM层、第一全连接层、Dropout层和第二全连接层,第一LSTM层的神经元数量设为16,第二LSTM层的神经元数量设为32。

步骤六、利用均方根误差、平均绝对误差和混淆矩阵对LSTM神经网络模型进行评价。

本发明的有益效果:

1、本发明可准确、快速地预测城镇燃气管道腐蚀阶段,且可靠性较高,能为管道腐蚀失效风险预警提供科学依据与技术支持;

2、本发明无需对数据进行标注,节省标注的时间开销。

附图说明

图1是本发明的基于K均值聚类-LSTM的燃气管道腐蚀阶段预测方法流程图;

图2是本发明的模拟腐蚀检测系统装置示意图;

图3是本发明的尾切后的波形图;

图4是本发明的轮廓系数图;

图5是本发明的聚类后三个阶段的部分实验数据;

图6是本发明的实验过程中AE信号的撞击数;

图7是本发明的准确率和损失函数曲线图;

图8是混淆矩阵。

具体实施方式

下面结合附图和实施例对本发明作进一步说明,此图为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。

如图2搭建声发射监测管道腐蚀试验装置系统,包括声发射仪器、Q235钢板、砂纸、丙酮、腐蚀液、泡沫板,获取管道腐蚀数据;

具体操作如下:

试验样件采用油气管道设备中常用材料Q235钢;试验前,先用砂纸将样件进行打磨,然后用丙酮清洗并烘干待用;本实验腐蚀液为PH=2,3.5%的NaCl溶液。

在样件中间先用打孔机钻出一个小圆坑,用于滴腐蚀液;为防止试验样件非实验部分产生声发射信号,对其作封样处理;将封好的试样按照图2进行布置,传感器通过凡士林于圆坑两侧进行良好的耦合固定,并通过电缆与声发射仪器的采集通道连接,实时监测来自圆坑内的腐蚀信号;试样与试验台之间衬有3cm厚的泡沫板,用来减少外界的振动干扰。

设置声发射仪阈值为30dB,每个波形记录2048个样本点,在试样圆坑中滴入腐蚀液之后,开启声发射系统监测腐蚀信号。

如图1所示,基于K均值聚类-LSTM的燃气管道腐蚀阶段预测方法,包括以下步骤:

步骤一、对采集到的声发射波形进行尾切处理;其中,尾切处理是切除波形首尾不需要的信号,以便保留波形中尽可能多的有用信息;信号尾切处理后,共有78500个信号,每个信号包含2048个采样点。

图3为尾切后的波形图,可以看出整个腐蚀过程大致可以分成三个阶段,由于刚开始一小段时间信号杂乱弱,进行了数据切除,所以起点不是从零开始,随着腐蚀试验的进行,波幅的整体趋势显示逐渐上升,在某个时间段达到峰值之后,又逐步下降并趋于稳定。为了验证腐蚀阶段的分类问题,接下来用聚类算法对数据进行分类。

步骤二、利用PCA算法,通过计算信号尾切处理后数据特征值的特征向量,并根据累计贡献率进行排序,实现数据的降维;

步骤三、利用轮廓系数法作为聚类标准来判断合适的聚类个数,基于Keras的Anaconda虚拟环境,绘制簇的个数从2到15时的轮廓系数图;如图4,轮廓系数值越高,表示聚类效果越好;所以当k值取3的时候,轮廓系数值最大,说明应该把数据聚为3类比较合理。

步骤四、然后将数据导入OriginPro 2022中进行K-means聚类;在统计中选择多变量分析,聚类个数选择3,不指定初始聚类中心,并设置最大迭代次数为10次,最终得到聚类结果。

本发明通过聚类算法得到聚类结果,解决传统方法的需要大量标注时间的问题,通用性更强。

根据聚类结果,可以将腐蚀过程分为三个阶段:初试腐蚀期、加速腐蚀期、平稳腐蚀期;管道腐蚀声发射信号基本上都是突发型信号,其频谱图上频率都集中在一定的范围内;三个阶段的信号特征差异表明不同腐蚀阶段有自己的特性,不同阶段的波形特征有明显的不同;三种状态下的部分试验数据如图5,图6是试验过程中AE信号的撞击数。

根据图5、6的实验结果,可以得到在第一阶段,试样表面未发生明显腐蚀,产生的少量气泡被吸附、分离和上浮,进行共振撞击,被传感器捕获到单个气泡破裂产生的声发射源信号,撞击次数小于2000次。

第二阶段腐蚀反应在加速腐蚀期越来越明显,试样的钝化膜被破坏,试样表面的许多气泡同时破裂;此外,腐蚀产物的脱落、摩擦和下沉过程导致波幅明显增加,最大撞击次数超过3800次。

第三阶段对应点蚀进入稳定发展阶段,由于腐蚀产物的剥离和金属在坑下的进一步溶解,逐渐形成了新的钝化膜;虽然撞击次数有所减少,但总体仍高于腐蚀初期。

步骤五、通过LSTM神经网络得到训练后的腐蚀阶段预测模型,将测试数据带入训练后的预测模型中,得到是腐蚀阶段预测结果;

具体过程如下:

实验样本总共有78500个信号,对数据进行归一化操作后,将设置实验数据的70%为训练集、30%作为测试集用来腐蚀预测模型的训练和检验;单层的LSTM网络难以学习到高维数据的时序性特征,而多层LSTM网络是将上一层的网络输出h

本发明采用的网络结构为输入层、两层LSTM层、两层全连接层,并添加Dropout层,Dropout层是为了避免模型过拟合;输出值个数设置为3,代表三种腐蚀阶段出现的概率。选用Adam作为优化器,学习率为0.001,设置损失函数为交叉熵损失函数(binary_crossentropy)来搭配Softmax全连接层的激活函数使用,将批处理量设置为30,最大处理批次设置为128。

如表1所示,设置双层LSTM,LSTM层1的神经元数量为16,LSTM层2的神经元数量为32,激活函数设置为ReLU函数,每个世代的训练时间在2~4秒,准确率和损失函数变化曲线见图7,可以看出整体准确率为98.99%,模型整体拟合程度较高,训练集与验证集变化曲线基本持平,损失函数值在0~0.2%,说明模型的鲁棒性较高。

表1模型结构参数

步骤六、对模型进行评价;

网络训练的结果的性能评估有很多种,本发明利用均方根误差(RMSE)、平均绝对误差(MAE)和混淆矩阵来评价;RMSE和MAE指数越接近于0越能说明模型鲁棒性好;本发明设置的模型RMSE为0.0396,MAE为0.0074,混淆矩阵如图8,可以本发明模型仅有少量第一、三阶段的信号混淆。

为验证模型的准确性,又做了两组平行试验;利用训练好的LSTM网络模型对平行试验采集到的声发射信号进行识别并验证,得到准确率分别为96.44%和97.01%,取三次试验准确率的平均值为此模型的准确率97.48%。

以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

技术分类

06120116381207