掌桥专利:专业的专利平台
掌桥专利
首页

基于模型融合的光纤分布式声波传感信号高精度分类识别方法

文献发布时间:2023-06-19 11:29:13


基于模型融合的光纤分布式声波传感信号高精度分类识别方法

技术领域

本发明涉及光纤分布式传感和机器学习技术领域,尤其涉及基于模型融合的光纤分布式声波传感信号分类识别方法。

背景技术

光纤分布式声波传感(DAS)系统在油气勘探等领域已经得到了广泛的应用。通过解调相干瑞利散射光的相位实现对外界扰动信号的探测,不但可以对外界扰动进行定性检测,还可以通过相位幅度的大小来反映外界扰动信号的大小即实现定量测量。

DAS数据的信号处理主要分为三个阶段。第一个阶段主要是以检测与定位为目的,通过经验模态分解、小波变换、希尔伯特黄变换和信号去噪声与分离等预处理手段来提高检测定位信号的信噪比,降低系统自身噪声和环境噪声对检测结果的影响,可以一定程度提升系统的准确率。但是在实际应用中发现,现场的噪声环境复杂多变,系统的误报率主要是对目标时间状态的演变及变化的噪声源识别不足导致。

第二阶段开始探索多域特征分析与识别模型探索。侧重于研究特定应用环境下目标分类识别方法,提取包括时域的信号幅值、水平过零率、频率谱的FFT谱能量分布特征、短时傅里叶变换谱和梅尔倒谱(MFCC)等等特征,然后结合分类器,如神经网络、高斯混合模型(GMM)、支持向量机、随机森林以及隐马尔可夫模型(HMM)等等。但是其特征提取方法主要依据特定环境或者有限的信号样本进行专业的分析和设计,面对实际的复杂应用环境其泛化能力差,且开发周期长又费时费力,很难在复杂背景噪声环境中实现信号的高精度分类识别。

随着人工智能和机器学习等技术的飞速发展,利用深度学习方法可以在不同目标事件信号上实现特征的自动提取,使得DAS信号的特征提取方式获得了突破性进展,事件的识别准确率进一步提升。在信号处理领域深度学习方法提高了目标分类识别系统的正确率,但是其网络复杂且参数众多,需要大量的数据进行模型训练并且训练时间很长。在实际的应用中,很难采集到大量样本,难以支撑深度学习高精度大模型的训练。

发明内容

本发明的目的在于克服现有技术中光纤分布式声波传感(DAS)系统利用深度学习方法进行不同事件识别需要大量样本支撑高精度大模型的训练的问题和利用传统信号处理方法提取信号特征其需要深厚的数字信号处理领域知识的问题,提供了一种基于模型融合的光纤分布式声波传感信号高精度分类识别方法。

本发明的目的是通过以下技术方案来实现的:

步骤1:DAS系统的数据处理单元接收到外界声波信号,构建原始信号的数据库;

步骤2:对于采集到的外界声波信号采用最大-最小值标准化进行数据标准化处理;

步骤3:对经过步骤2标准化处理后的外界声波信号提取时域、频域和变换域的幅频特性,合并得到特征向量a;

步骤4:对于经过步骤3得到的特征向量a利用基于BP算法的ANN自动提取特征对外界声波信号的幅频特性进一步进行挖掘,得到特征向量b以及ANN的预测结果y_hat;具体的在所述步骤3流程后所得到的特征向量a,利用BP算法正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,直到到达了设定的迭代次数或者损失在可接受范围内。在这个训练过程中,模型的权值不断调整,往符合样本真实的方向不断学习。采用ANN对特征向量a进行进一步的特征挖掘,将全连接层后的向量输出,得到一个描述数据特征分布向量b,采用ANN对特征向量a进行进一步的特征挖掘,得到一个描述数据特征分布向量b以及预测y_hat。

步骤5:对经过步骤3得到的特征向量a和经过步骤4进一步挖掘得到的特征向量b进行特征融合得到特征向量W,作为训练集用于第一层基模型的训练得到第一层基模型的预测结果矩阵y_com;

步骤6:对于经过步骤4得到的ANN预测结果y_hat和经过步骤5得到的预测结果矩阵y_com进行合并,作为第二层基模型的训练集进行训练,得到最后集成学习模型最终的预测结果。

具体地,所述步骤1中DAS系统包括光源、调制单元、放大单元、光纤传感单元和数据处理单元。

具体地,所述步骤2经过标准化处理后得到的信号数据库按照7:3的比例划分为训练集和测试集。

具体地,所述步骤3对于标准化处理后的信号提取时域、频域和变换域特征具体为:

所述时域特征包括:信号的脉冲强度、平均幅度、短时能量自相关系数和信号能量;

所述频域特征包括:信号幅度的方差、偏度、峰度、信息熵和平均值;

所述变换域特征包括:梅尔频率倒谱系数。

具体地,所述步骤5具体为:对于所获得的特征向量a和特征向量b进行特征融合作为第一层基模型的输入,利用stacking策略对弱分类器进行增强的特性,将第一层基模型分别进行交叉验证学习,得到其预测,结合ANN的预测y_hat,ANN的预测结果和第一层基模型的预测结果合并得到预测输出y_com;主要利用stacking策略可以对弱分类器进行增强的特性,其第一层基模型分别为DT,RF,SVM,XGB。将特征向量W作为第一层基模型的输入信号,将这四个弱分类器分别进行4折交叉验证的方式,得到训练集和测试集的预测结果,联合上述步骤4所得到的ANN的判别结果y_hat,一共得到五个模型的预测输出y_com,采用按列堆叠合并的方式,分别得到第二层基模型的训练集和测试集。其中训练集用于对第二层基模型(LR)进行训练。利用逻辑回归模型对这五个模型的预测输出进行训练,进一步得到模型的权重向量,从而得到最后的判别结果。

本发明所带来的优点在于:

1.引入stacking策略,提高传统机器学习模型的准确率。

2.利用ANN来对数据进行进一步的特征提取,可以规避掉因为人工选择特征所导致的特征单一及遗漏等问题。

3.利用ANN实现特征的自动提取及分类,相比于通常利用卷积神经网络(CNN)进行特征提取的方法而言,ANN相比于CNN而言减少了卷积池化的操作,其计算量与参数量大大减少,可以规避掉深度学习需要大量样本进行拟合且训练时间较长的问题,在追求实时性的光纤传感领域具有重大意义。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的说明,此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图中:

图1为本发明实施例1的系统框图;

图2为本发明实施例1的方法流程图;

图3为本发明实施例1的网络模型框图;

图4为本发明实施例1所使用的模型的混淆矩阵图。

具体实施方式

下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图的方向或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,属于“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,属于“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

数据处理单元接收到外界声波信号并提取所述外界声波信号的时域、频域和变换域的幅频特性;并利用基于BP算法的人工神经网络(ANN)自动提取特征的特性对信号的幅频特性进一步进行挖掘;对信号的幅频特性和进一步挖掘出的数据特性进行特征融合,首次在DAS信号识别中引入机器学习中的stacking方法,利用该方法对提升传统机器学习分类器的识别准确率,从而实现光纤分布式声波传感信号的高精度分类识别方法。利用数据处理单元采集到外界声波信号,并利用传统数字信号处理方法对每一个样本数据从时域、频域以及变换域提取特征,构造成特征向量a。

利用BP算法正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的。在这个训练过程中,模型的权值不断调整,往符合样本真实的方向不断学习。将特征向量a作为ANN的输入,进行进一步的特征挖掘,得到一个描述数据特征分布向量b。对于所获得的特征向量a和特征向量b进行拼接得到特征向量c作为模型的输入。

具体地,利用stacking策略可以对弱分类器进行增强的特性,其四个弱分类器分别为DT,RF,SVM,XGB。将所得到的特征向量c作为第一层基模型的输入信号,将这四个弱分类器分别进行交叉验证学习,得到其预测。集合上述步骤二所得到的ANN的判别结果,一共得到五个模型的预测输出,利用逻辑回归(LR)模型对这五个模型的预测输出进行训练,进一步得到模型的权重向量,从而得到最后的判别结果。

将stacking策略首次引入DAS信号处理中,利用集成学习方法对弱分类器进行增强。

实施例一

光纤分布式声波传感的通信光缆安全监测系统,系统结构及其工作原理如图1所示。系统硬件由三部分组成,分别为传感光缆、光信号解调设备以及信号处理主机。传感光缆通常利用普通单模通信光缆,光信号解调设备内部组件主要包括光学器件和采集卡等设备。窄线宽激光器产生一路相干光信号经过声光调制器调制为光脉冲信号,光脉冲信号经由掺饵光纤放大器(EDFA)集中放大,放大后的光脉冲信号经过隔离器、环形器1、2端口注入传感光缆;光脉冲信号沿光缆的传输过程产生瑞利散射,其后向瑞利散射光信号沿光缆返回,被环形器的2、3端口接收,利用解调系统对光信号进行解调利用光电探测器转换为电信号,采集系统获取到声波及振动信号在光纤上的作用电信号,通过网络等接口实时传输给信号处理主机。信号处理主机为普通电脑主机或AI芯片,用于光纤探测信号的分析和处理,通过特定的信号处理算法可以得到通信光缆周围的事件信息,可以对感测时间智能分析、处理和分类识别。

基于上述基础,在通信光缆安全监测应用中,构建不同类型时间的样本数据库,所埋设的通信光缆空间分辨率为5.16m,划分成100个传感单元,每条信号的采集时间长度为30s,这也是模型的原始输入数据。

在传输光缆监控中,经常遇到的主要事件有破路机挖掘、挖掘机挖掘、人工挖掘以及背景噪声等四种。其label分别标注为0到3,此外,将原始数据集随机打乱之后按照7:3的比例分为训练集和测试集,所构建的各类事件的数据集如表1所示。

表1

对采集到的时间是胡狙击,对数据集中每一个数据样本进行归一化运算做预处理,随后在时域、频域和变换域上对数据提取如表2所示的十个特征;

表2

同时将预处理后的数据输入至ANN中进行特征提取,其全连接层神经元一共有16个,将这16维ANN特征向量和10维特征进行特征融合作为stacking模型的26维特征向量输入,同时ANN的判定结果也作为stacking模型的第二层输入进行训练。

将softmax层后的ANN的判定结果和stacking第一层基模型的结果一起输入到LR层进行下一步的拟合。最后,采用4折交叉验证的方式进行stacking的训练,通过第一层四个基学习器的预测和ANN的预测结合起来得到的预测输出作为第二层LR的输入,最终LR的输出即为最终的信号识别结果。其整体过程如图3所示。

其利用基于模型融合的光纤分布式声波传感信号高精度分类识别方法对上述数据集进行测试,其混淆矩阵如图4所示,验证了所构建的基于模型融合的光纤分布式声波传感信号高精度分类识别方法具有高识别率的有点,唯一的误判来源于将背景噪声判断为人工触缆,这在实际应用中并不存在对高威胁事件误判的情况。

在本实施例中奖基于传统机器学习方法的DAS信号安全监测的识别结果和本发明中提出的方法识别结果作为对比,验证本发明提出方法的优势和有效性。其具体方法如下:

(1)将特征集输入到传统机器学习模型进行分类识别,传统的机器学习模型选取了4个具有代表性的模型,也是本发明提出方法中的基模型。分别为:支持向量机SVM,随机森林RF,XGBoost模型XGB以及决策树模型DT。

(2)通常情况下,分类中常用的四个标准性能指标(例如准确性(Accuracy),精确性(Precision),召回率(Recall)和F-measure)来评估识别结果,如下所示:

Accuracy=(TP+TN)/(TP+FP+TN+FN)

Precision=(TP+TN)/(TP+FP)

Recall=TP/(TP+FN)

F-measure=2×Precision×Recall/(Precision+Recall)

将所构造好的26维特征向量输入到不同的模型中进行训练,其识别结果如表3所示。

表3

可以看出在其余四个模型中,准确率最高的为随机森林这一模型,其准确率为94.44%,而本文提出的模型准确率高达99.07%。这表现出了本文提出的stacking模型对于DAS信号识别的有效性,远远超过了常用的机器学习分类方法。

对于不同事件类型,stacking模型的识别正确率均高于其他五个模型,并且对于其余四种方法更容易出错的事件2其分类准确率更高,通过比较显示出本文提出的stacking模型的优越性。这是由于基于机器学习的stacking模型利用了多折交叉验证,使得结果更为稳健。说明本发明提出的方法在解决通信光缆安全监测问题中的有效性和突出优势。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

相关技术
  • 基于模型融合的光纤分布式声波传感信号高精度分类识别方法
  • 基于模型融合的光纤分布式声波传感信号高精度分类识别方法
技术分类

06120112944975