掌桥专利:专业的专利平台
掌桥专利
首页

一种基于类别不平衡改进孪生支持向量机的流体管道泄漏检测方法

文献发布时间:2023-06-19 19:30:30


一种基于类别不平衡改进孪生支持向量机的流体管道泄漏检测方法

技术领域

本发明属于管道泄漏检测领域,具体涉及一种基于类别不平衡改进孪生支持向量机的流体管道泄漏检测方法。

背景技术

石油、天然气等是城市日常生活和经济发展不可或缺的能源。管道运输系统是保证城市所需能源运输的生命线,在经济发展中起着越来越重要的作用。然而,由于自然腐蚀、外部干扰等因素的影响,管道在运输过程中容易发生泄漏,不仅造成资源的浪费,而且会向环境中释放污染。因此,及时准确地检测管道泄漏状态,对于减少经济损失和保持管道的安全运行具有重要意义。

目前,管道泄漏检测常用的方法有卷积神经网络、残差神经网络等深度学习方法和支持向量机(Support Vector Machine;SVM)、孪生支持向量机(Twin Support VectorMachine)等机器学习方法。由于神经网络需要大量的样本进行训练,而管道泄漏检测研究的数据样本量通常比较小,因此在小样本问题中具有较好泛化性能的SVM、TSVM更适用于管道泄漏检测问题。TSVM通过求解两个二次规划问题来确定正负样本的分类超平面,它不仅继承了SVM的小样本学习和良好的泛化性能的优点,而且训练速度比传统的SVM快4倍。由于大多数时候管道是正常运输状态,管道泄漏样本相对正常样本较少,造成不同类别的样本数量不平衡问题,这对分类问题提出了一重大挑战。对于类不平衡的数据集,TSVM分类模型会变得偏向样本数量占主导地位的类别,从而导致少数类样本的误分类问题,影响管道泄漏检测的准确率。

发明内容

为解决上述技术问题,本发明提出一种基于类别不平衡改进孪生支持向量机的流体管道泄漏检测方法,包括:

S1:采集管道正常运输和泄漏状态两种情形下的管道振动数据,对采集到的管道振动数据进行特征提取并归一化,根据归一化后的数据构建用于管道泄漏检测的训练集;

所述管道振动数据的特征包括:管道振动数据的均值、标准差、峭度、峰峰值、均方根、波形因数、裕度因数、能量特征值;

S2:将训练集作为改进TWSVM模型的输入,训练样本对应的管道状态所属类别作为输出,确定分类超平面,得到基于改进TWSVM的流体管道泄漏检测模型;

S3:利用基于改进TWSVM的流体管道泄漏检测模型对管道泄漏情况进行实时检测,通过决策函数输出样本类别。

本发明的有益效果:

本发明通过添加universum数据为TSVM模型的优化问题构造附加的约束条件,为分类超平面的生成提供与数据相关的先验信息,解决了不同类别样本数量不平衡的问题;同时,利用简化核和最小二乘思想降低了检测模型对核矩阵的存储需求并提高了模型的计算效率,并且,提出的检测模型通过引入正则项以最大化间隔,实现了结构风险最小化原则,保证了矩阵的正定性,这实现了在类不平衡情况下,避免检测模型对样本数量较多的类别的偏向,提高了检测模型的精度和效率。

附图说明

图1为本发明的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于类别不平衡改进孪生支持向量机的流体管道泄漏检测方法,如图1所示,包括:

S1:采集管道正常运输和泄漏状态两种情形下的管道振动数据,对采集到的管道振动数据进行特征提取并归一化,根据归一化后的数据构建用于管道泄漏检测的训练集;

所述管道振动数据的特征包括:管道振动数据的均值、标准差、峭度、峰峰值、均方根、波形因数、裕度因数、能量特征值;

S2:将训练集作为改进TWSVM模型的输入,训练样本对应的管道状态所属类别作为输出,确定分类超平面,得到基于改进TWSVM的流体管道泄漏检测模型;

S3:利用基于改进TWSVM的流体管道泄漏检测模型对管道泄漏情况进行实时检测,通过决策函数输出样本类别。

对提取的管道振动数据的特征归一化处理,包括:

其中,x

记训练样本集T={(x

线性TSVM模型的优化问题如下:

s.t.-(X

s.t.(X

其中,ξ和η表示误差量,

由于TSVM用于类不平衡的管道泄漏检测数据集的检测模型构建时,检测模型会变得偏向样本数量占主导地位的管道状态这一类别,从而导致少数类中泄漏样本的误分类问题,影响管道泄漏检测的准确率。因此,本发明使用随机平均方案选择universum数据,通过添加大小为两类别样本数量之差的universum数据,为TSVM模型构造附加约束以提供关于数据分布的先验信息,解决了管道泄漏检测研究的类不平衡问题。同时,利用简化核和最小二乘思想克服了由于universum数据的添加导致的训练时间较长的缺点。此外,本发明为改进模型引入正则项以最大化间隔,实现了结构风险最小化原则并保证了矩阵的正定性。

基于上述描述提出的改进TSVM模型,对于“类1”超平面,使用随机欠采样方法减少了“类2”的样本点,创建了“类1”超平面的平衡条件。对于“类2”超平面,通过添加universum数据的数量提供了有关数据分布的先验信息,并把添加的universum数据看作属于“类1”,构造了“类2”超平面的平衡条件。这与传统添加universum数据的TSVM相反,在传统添加universum数据的TSVM中,universum数据被看作不属于任何一类,并且不能解决类的不平衡问题。

将管道泄漏状态的数据样本组成的矩阵作为少数类,将管道正常状态的数据样本组成的矩阵作为多数类,通过二值SVM分类器求解两个相关的SVM类型的问题来确定两个非平行超平面,得到TWSVM模型,对TWSVM模型的少数类和多数类两类超平面使用随机平均方案选择两类别样本数量之差的universum数据,并把选择的universum数据添加到少数类数据中,得到两类数据的超平面的平衡条件,得到改进TWSVM模型,通过随机选择的原始核矩阵子集来构造简化的核矩阵,并利用最小二乘思想将检测模型的优化问题由求解二次规划问题转变成求解线性方程组,并引入正则项得到改进TWSVM模型的优化问题,对于非线性情况,引入核函数K,得到非线性情况下的改进TWSVM模型的优化问题。

改进TWSVM模型的优化问题,包括:

线性情况:

受制于

(U

受制于(X

(Uw

其中,ξ、ψ、η、ψ

从“类1”和“类2”的分类超平面对应的优化问题可以看出,利用添加的universum数据为多数类超平面构造了附加约束,使universum数据与分类超平面的距离为(1-ε)。这不仅避免了多数类超平面过于接近少数类,而且提供了有关数据分布的先验信息,从而降低了分类器对多数类的偏向并提高了分类器的泛化性能。然而,由于universum数据的添加,导致分类器的计算成本大大增加。为了克服这一缺点,本发明通过随机选择的原始核矩阵子集来构造简化的核矩阵,并利用最小二乘思想将检测模型的优化问题由求解二次规划问题转变成求解线性方程组,大大降低了核矩阵对存储空间的需求并提高了计算效率。为了分类模型在实现经验风险最小化的同时实现结构风险最小化,基于间隔最大化思想为优化问题引入正则项

对于非线性情况,引入核函数K,为了确定核生成分类超曲面K(x

受制于

(K(U

受制于(K(X

(K(U,C

其中,ξ、ψ、η、ψ

将训练集作为改进TWSVM模型的输入,训练样本对应的管道状态所属类别作为输出,确定分类超平面,得到基于改进TWSVM的流体管道泄漏检测模型,包括:

将训练集作为线性改进TWSVM模型的输入,通过网格搜索法确定惩罚参数{c

通过决策函数输出样本类别,包括:

线性模型的决策函数:

非线性模型的决策函数:

其中,w

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术分类

06120115930378