掌桥专利:专业的专利平台
掌桥专利
首页

一种应急抢险物资预测分析方法、装置及系统

文献发布时间:2024-04-18 19:58:26


一种应急抢险物资预测分析方法、装置及系统

技术领域

本发明涉及应急抢险物资预测技术领域,具体涉及一种应急抢险物资预测分析方法、装置及系统。

背景技术

随着经济的发展,我国的能源消费量日益增加,天然气的供应量和运输量随之大幅度增加,天然气在国民经济和社会发展中的地位日益重要。我国在加快天然气勘探开发应用力度的同时,大力推进天然气管道建设。天然气管道是运输大量能源产品最安全、最便宜的方式,这对我们的经济至关重要。未来确保天然气管道安全运营的工作更加繁重,压力更加凸显。

在西南地区油气田天然气管道处于相对复杂的地理环境下,在运行过程中由于管道自身原因以及外部环境的影响,都有可能造成管道损坏,严重时会导致管道破裂、断管,造成天然气泄漏甚至引发爆炸事故,不仅影响管道的安全运行,甚至威胁到人民群众的生命财产安全。由于事故的突发性和不确定性,应对时间的紧迫性决定了事故一旦发生,就会迅速蔓延。因此,如何有效地预测判断事故发生的概率,保障应急抢险物资的日常维护和紧急调用,是有效应对突发事件的基础。

现有的应急资源需求量预测方法主要包括两大类方法:第一类方法是案例推理法,通过寻找与当前案例相似的历史案例,利用历史案例中已有的经验或特定知识来解决新问题的一种方法;首先是从案例库中匹配出与当前案例同类型或具有相似特征的历史案例,根据可定量化的特征因素对当前案例和历史案例进行数学表示,计算当前案例与各历史案例的欧式距离以判断当前案例与各历史案例的相似程度。确定当前案例的最佳相似案例后,选定影响需求的关键因素,根据历史案例中需求量与对应影响需求的关键因素,进行各类资源的需求预测。在当前案例结束后,将当前案例的实际情况与实际物资使用量加入到案例库中。但是在数据收集过程中存在信息量大、时间跨度长、工作量大、数据不完整及指标不全等问题,增加了利用案例推理来进行应急抢险物资预测的难度。同时,由于案例推理是在新的应急抢险事件发生后,检索案例库中与目标案例相匹配的案例,并依据匹配案例的结论,进行应急抢险物资需求预测,存在一定的滞后性。

第二类方法是采用单一机器学习算法进行简单应急抢险物资需求预测,但是采用油气田输气管道的历史应急抢险事件数据并不一定能够训练出适应某单一机器学习算法的预测模型,往往会造成某一个固定机器学习算法形成的预测模型预测效果不佳,不能够从较少的数据中挖掘到有效信息,且机器识别效率低等问题。

发明内容

本发明所要解决的技术问题是现有的应急资源需求量预测方法中案例推理法在事件发生后根据事件情况进行求解,存在一定的滞后性;且对数据的要求较高,增加了数据收集难度;同时需要有完备历史案例库,提高了使用门槛。另外,单一机器学习算法进行简单应急抢险物资需求预测,但是采用油气田输气管道的历史应急抢险事件数据并不一定能够训练出适应某单一机器学习算法的预测模型,往往会造成某一个固定机器学习算法形成的预测模型预测效果不佳等问题。

本发明目的在于提供一种应急抢险物资预测分析方法、装置及系统,能够从较少的数据中挖掘到有效信息,预测效果佳;且在事件发生前预测,提高了预见性。

本发明通过下述技术方案实现:

第一方面,本发明提供了一种应急抢险物资预测分析方法,该方法包括:

获取油气田输气管道的历史应急抢险事件数据和应急物资选配数据;其中,油气田输气管道的历史应急抢险事件数据:应急抢险事件发生时间、应急事件类别、应急物资使用记录、管线名称、管线运行年限、事故情况、处理情况及其他;应急物资选配数据:通过向专家请教,根据专家的建议整理不同事件严重程度所需要的应急物资数据;

对所述油气田输气管道的历史应急抢险事件数据进行统计分析,挖掘出油气田输气管道的指标特征,作为第一指标特征;及根据所述应急物资选配数据,建立事件严重程度的物资选配表;

根据所述油气田输气管道的历史应急抢险事件数据,结合油气田输气管道的实际情况,构建事故原因指标体系,作为第二指标特征;

根据所述第一指标特征及第二指标特征,构建事件严重程度预测模型,并进行训练得到训练好的事件严重程度预测模型;将油气田输气管道的待测数据输入训练好的事件严重程度预测模型进行预测,输出事件严重程度预测结果;根据所述事件严重程度预测结果结合物资选配表,实现对未来应急物资预测配置。

工作原理是:本发明首先充分调研、分析油气田输气管道的历史应急物资抢险事件数据,从中挖掘出物资使用情况、事件发生原因及事件严重程度等信息;并结合应急物资选配数据建立事件严重程度的物资选配表。其次,建立完整的事故原因指标体系;对事故情况进行分析,找出事故发生的原因,并建立以第三方破坏、误操作、腐蚀、管道缺陷和自然灾害为事故原因指标体系。然后,构建事件严重程度预测模型,并进行训练得到训练好的事件严重程度预测模型。最后,将事件严重程度预测模型与物资选配表结合,实现了对应急物资预测;首先对下一年应急抢险事件发生次数进行预测,然后对每次事件的严重程度预测,最后结合物资选配表对应急物资进行预测,得到物资配置建议。

本发明能够从较少的数据中挖掘到有效信息,预测效果佳;且在事件发生前预测,提高了预见性。本发明根据历史抢险事件的特性预测未来发生事件的严重程度,以此来了解管道的运行状态和情况,提前做出有效的预防措施,可以减少甚至避免应急抢险事件产生的影响。本发明合理配置应急抢险物资是应对突发事件的有力保障,对抢险物资进行配置具有明显的理论和实际价值。

进一步地,所述事件严重程度预测模型包括基于神经网络的事件发生次数预测子模型,将所述第一指标特征及第二指标特征的训练数据输入所述基于神经网络的事件发生次数预测子模型进行训练,输出事件发生次数训练结果;

并将所述事件发生次数训练结果分别输入到基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型中进行各个模型训练,并进行训练结果比较分析,得到事件严重程度预测效果最好的模型;将事件严重程度预测效果最好的模型联合所述基于神经网络的事件发生次数预测子模型共同作为最终的事件严重程度预测模型。

进一步地,所述基于神经网络的事件发生次数预测子模型中的神经网络是采用时序神经网络,所述基于神经网络的事件发生次数预测子模型的训练步骤为:

将前一时段的应急抢险事件的发生次数作为时序神经网络的输入,将后一时段的应急抢险事件的发生次数作为神经网络的输出,对所述时序神经网络进行训练和修正,得到时序神经网络模型。

进一步地,所述基于神经网络的事件发生次数预测子模型的计算公式为:

y

其中:

a

式中:y

进一步地,所述基于神经网络的事件发生次数预测子模型采用的评价指标为均方根误差。

进一步地,所述的将所述事件发生次数训练结果分别输入到基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型中进行各个模型训练,并进行训练结果比较分析,得到事件严重程度预测效果最好的模型;其中,进行训练结果比较分析,得到事件严重程度预测效果最好的模型中采用的模型评价指标为Macro AUC,Macro AUC的计算公式为:

AUC是一种用来度量二分类模型好坏的一个标准,被定义为ROC曲线下面积。ROC曲线又称作受试者操作特性曲线,是一条以不同阈值下的假正率FPR为横坐标,不同阈值下的召回率Recall为纵坐标的曲线。对某个分类器而言,可以根据其在测试样本上的表现得到一个FPR和Recall点对。这样此分类器就可以映射成ROC平面上的一个点。调整该分类器在分类时使用的阈值,便可以得到一个经过(0,0),(1,1)的曲线,这就是此分类器的ROC曲线。而AUC的值便为ROC曲线下方面积的大小,通常,AUC的值介于0.5到1.0之间,较大的AUC说明模型具有较好的预测效果。

相比于准确率AUC有如下优势:

1、不会受到样本不平衡问题的影响。本项目事件严重程度为不平衡数据,其中管道缺陷共发生133次,而误操作只发生了4次,若采用准确率作为评价指标易受样本不平衡问题的影响,使模型结果更偏向于多数类,而AUC对类别不平衡问题不敏感,不同的样本比例并不会影响AUC的评测结果。

2、使得到的模型更具有鲁棒性。许多机器学习模型对分类问题的预测结果都是概率,一般情况下通过将阈值设为0.5来计算模型的准确率,而在实际应用中该阈值的选取在很大程度上影响了准确率的计算,而AUC为ROC曲线下面积,不会受到阈值的影响,使训练出的模型更加稳健。

进一步地,所述的根据所述事件严重程度预测结果结合物资选配表,实现对未来应急物资预测配置;具体包括:

根据所述事件严重程度预测结果和物资选配表,得到满足事件发生预测次数下,发生该类事件所需应急抢险物资及维抢修机具的类别和数量,即作为对输气管理处的应急物资配置建议;其中,所述物资选配表为不同事件严重程度所需要的应急物资种类及数量的数据。

进一步地,所述第一指标特征包括油气田输气管道的事件发生时间、事故情况、管线情况、物资使用情况和事件严重程度;

所述管线情况包括管线名称、运行年限、管线材料、防腐材料和压力等级;

所述物资使用情况包括物资类别和物资数量,所述物资类别包括安全防护、工程抢险、移动通信、照明设备、防洪防汛、消防环保及其他物资。

进一步地,所述第二指标特征包括一级指标和二级指标;

所述一级指标包括第三方破坏、误操作、腐蚀、管道缺陷和自然灾害;每个一级指标对应若干个二级指标;

所述第三方破坏对应的二级指标包括开挖施工、爆破、违章打压和打孔盗气;

所述误操作对应的二级指标包括埋深不够、错误计算、管体划伤和施工不当;

所述腐蚀对应的二级指标包括内腐蚀、应力腐蚀和外腐蚀;

所述管道缺陷对应的二级指标包括焊接缺陷、材质不合格、管道变形、管道老化和防护措施失效;

所述自然灾害对应的二级指标包括地面沉降、地震波、水体冲刷和地面移动。

第二方面,本发明又提供了一种基于机器学习的应急抢险物资预测分析装置,该装置支持所述的一种应急抢险物资预测分析方法,该装置包括:

获取单元,用于获取油气田输气管道的历史应急抢险事件数据和应急物资选配数据;

第一指标特征分析单元,用于对所述油气田输气管道的历史应急抢险事件数据进行统计分析,挖掘出油气田输气管道的指标特征,作为第一指标特征;

物资选配表建立单元,用于根据所述应急物资选配数据,建立事件严重程度的物资选配表;

第二指标特征分析单元,用于根据所述油气田输气管道的历史应急抢险事件数据,结合油气田输气管道的实际情况,构建事故原因指标体系,作为第二指标特征;

事件严重程度预测模型构建及训练单元,用于根据所述第一指标特征及第二指标特征,构建事件严重程度预测模型,并进行训练得到训练好的事件严重程度预测模型;

事件严重程度预测单元,用于将油气田输气管道的待测数据输入训练好的事件严重程度预测模型进行预测,输出事件严重程度预测结果;

应急物资配置单元,用于根据所述事件严重程度预测结果结合物资选配表,实现对未来应急物资预测配置。

进一步地,所述事件严重程度预测模型包括基于神经网络的事件发生次数预测子模型,将所述第一指标特征及第二指标特征的训练数据输入所述基于神经网络的事件发生次数预测子模型进行训练,输出事件发生次数训练结果;

并将所述事件发生次数训练结果分别输入到基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型中进行各个模型训练,并进行训练结果比较分析,将事件严重程度预测效果最好的模型联合所述基于神经网络的事件发生次数预测子模型共同作为最终的事件严重程度预测模型。

本发明与现有技术相比,具有如下的优点和有益效果:

1、本发明能够从较少的数据中挖掘到有效信息,预测效果佳;且在事件发生前预测,提高了预见性。本发明根据历史抢险事件的特性预测未来发生事件的严重程度,以此来了解管道的运行状态和情况,提前做出有效的预防措施,可以减少甚至避免应急抢险事件产生的影响。本发明合理配置应急抢险物资是应对突发事件的有力保障,对抢险物资进行配置具有明显的理论和实际价值。

2、本发明的事件严重程度预测模型包括基于神经网络的事件发生次数预测子模型,将所述第一指标特征及第二指标特征的训练数据输入所述基于神经网络的事件发生次数预测子模型进行训练,输出事件发生次数训练结果;并将所述事件发生次数训练结果分别输入到基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型中进行各个模型训练,并进行训练结果比较分析,得到事件严重程度预测效果最好的模型;将事件严重程度预测效果最好的模型联合所述基于神经网络的事件发生次数预测子模型共同作为最终的事件严重程度预测模型。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:

图1为本发明一种应急抢险物资预测分析方法流程图。

图2为本发明一种应急抢险物资预测分析方法详细流程框图。

图3为本发明实施例1970年至2020年各类事故原因(I)的数量示意图。

图4为本发明实施例输气管理处每年应急抢险事件发生次数示意图。

图5为本发明实施例基于神经网络的事件发生次数预测子模型的模型结构示意图。

图6为本发明实施例预测效果对比图。

图7为本发明实施例应急物资配置图。

图8为本发明一种基于机器学习的应急抢险物资预测分析系统结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。

实施例1

如图1至图7所示,本发明一种应急抢险物资预测分析方法,该方法包括:

获取油气田输气管道的历史应急抢险事件数据和应急物资选配数据;其中,油气田输气管道的历史应急抢险事件数据:应急抢险事件发生时间、应急事件类别、应急物资使用记录、管线名称、管线运行年限、事故情况、处理情况及其他;应急物资选配数据:通过向专家请教,根据专家的建议整理不同事件严重程度所需要的应急物资数据;

对所述油气田输气管道的历史应急抢险事件数据进行统计分析,挖掘出油气田输气管道的指标特征,作为第一指标特征;及根据所述应急物资选配数据,建立事件严重程度的物资选配表;

根据所述油气田输气管道的历史应急抢险事件数据,结合油气田输气管道的实际情况,构建事故原因指标体系,作为第二指标特征;

根据所述第一指标特征及第二指标特征,构建事件严重程度预测模型,并进行训练得到训练好的事件严重程度预测模型;将油气田输气管道的待测数据输入训练好的事件严重程度预测模型进行预测,输出事件严重程度预测结果;根据所述事件严重程度预测结果结合物资选配表,实现对未来应急物资预测配置。

具体地,所述第一指标特征包括油气田输气管道的事件发生时间、事故情况、管线情况、物资使用情况和事件严重程度;

所述管线情况包括管线名称、运行年限、管线材料、防腐材料和压力等级;

所述物资使用情况包括物资类别和物资数量,所述物资类别包括安全防护、工程抢险、移动通信、照明设备、防洪防汛、消防环保及其他物资。

具体地,所述第二指标特征包括一级指标和二级指标;

所述一级指标包括第三方破坏、误操作、腐蚀、管道缺陷和自然灾害;每个一级指标对应若干个二级指标;

所述第三方破坏对应的二级指标包括开挖施工、爆破、违章打压和打孔盗气;

所述误操作对应的二级指标包括埋深不够、错误计算、管体划伤和施工不当;

所述腐蚀对应的二级指标包括内腐蚀、应力腐蚀和外腐蚀;

所述管道缺陷对应的二级指标包括焊接缺陷、材质不合格、管道变形、管道老化和防护措施失效;

所述自然灾害对应的二级指标包括地面沉降、地震波、水体冲刷和地面移动。

具体地,所述事件严重程度预测模型包括基于神经网络的事件发生次数预测子模型,将所述第一指标特征及第二指标特征的训练数据输入所述基于神经网络的事件发生次数预测子模型进行训练,输出事件发生次数训练结果;

并将所述事件发生次数训练结果分别输入到基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型中进行各个模型训练,并进行训练结果比较分析,得到事件严重程度预测效果最好的模型;将事件严重程度预测效果最好的模型联合所述基于神经网络的事件发生次数预测子模型共同作为最终的事件严重程度预测模型。

各个预测子模型如下:

基于随机森林的事件严重程度预测子模型中随机森林算法,如下:

随机森林是一种并行的集成学习模型,使用决策树为基础分类器,并且其输出的类别是由多个决策树输出的类别的众数而定。随机森林的生成过程可以概括为:首先采用Bootstrap抽样技术,随机地从样本中抽出一条数据,然后再放回。如此重复,直到产生一个训练样本集。重复上述方法N次,得到N个训练样本集,这些样本集是独立同分布的。再用决策树构造算法在每个样本集上训练一棵决策树,把这些角儿书作为基分类器组合在一起,最后通过N个决策树的多数投票决定新样本的最终分类或预测结果。这种平均的思想可以减小选择错误分类器的风险,改善模型的预测精度和可解释性。随机森林的算法流程如下:

基于逻辑回归的事件严重程度预测子模型中逻辑回归算法,如下:

逻辑曲线主要用于研究分类结果与其影响因素之间关系的概率型非线性回归模型。通常况下,用于研究某些因素条件下某个结果是否发生。

逻辑回归模型的系数由最大似然估计获得,这就保证了在所有的可能的组合中,是最佳线性组合,这样保证了得到的特征组合是最优的。而且样本量越大,最大似然估计法估计值与真实值越相近。逻辑回归的算法流程如下:

基于GBDT的事件严重程度预测子模型中GBDT算法,如下:

梯度提升决策树(GBDT)分类算法属于集成学习中的Boosting方法。Boosting方法使用多个弱基分类器,训练基分类器时采用串行的方式,每个基分类器之间有依赖,它的基本思路是将基分类器一个个叠加,每个基分类器在训练的时候,对前一个基分类器分错的样本,给予更高的权重。测试时,根据各个分类器的结果加权得到最终结果。对于具有K个类别的训练样本,GBDT的算法流程如下:

基于支持向量机的事件严重程度预测子模型中支持向量机算法,如下:

支持向量机(SVM)在解决小样本问题上有天然的优势,其通过构造核函数来将在低维空间线性不可分的问题转化到高维空间从而线性可分从而构造出分类超平面来使得样本之间的间隔最大化来实现分类。

SVM的算法流程如下:

基于XGBoost的事件严重程度预测子模型中XGBoost算法,如下:

XGBoost是一个树集成模型,他将K个树的结果进行求和,作为最终的预测值。其算法流程如下:

具体地,所述基于神经网络的事件发生次数预测子模型中的神经网络是采用时序神经网络,所述基于神经网络的事件发生次数预测子模型的训练步骤为:

将前一时段的应急抢险事件的发生次数作为时序神经网络的输入,将后一时段的应急抢险事件的发生次数作为神经网络的输出,对所述时序神经网络进行训练和修正,得到时序神经网络模型。

其中,所述基于神经网络的事件发生次数预测子模型的计算公式为:

y

其中:

a

式中:y

具体地,所述基于神经网络的事件发生次数预测子模型采用的评价指标为均方根误差。

具体地,所述的根据所述事件严重程度预测结果结合物资选配表,实现对未来应急物资预测配置;具体包括:

根据所述事件严重程度预测结果和物资选配表,得到满足事件发生预测次数下,发生该类事件所需应急抢险物资及维抢修机具的类别和数量,即作为对输气管理处的应急物资配置建议;其中,所述物资选配表为不同事件严重程度所需要的应急物资种类及数量的数据。

具体实施时,本实施例以西南油气田分公司的历史应急抢险事件数据来实施:

获取油气田输气管道的历史应急抢险事件数据和应急物资选配数据;

对所述油气田输气管道的历史应急抢险事件数据进行统计分析,挖掘出油气田输气管道的指标特征,作为第一指标特征;所述第一指标特征包括油气田输气管道的事件发生时间、事故情况、管线情况、物资使用情况和事件严重程度;

物资使用情况分析,如下:

由于历史物资使用记录缺失,因此本实施例共收集了川中与重庆气矿共计34次历史应急抢险物资使用情况,按照应急事件类别划分共得到川中气矿管道抢险4次、重庆气矿管道抢险12次、重庆气矿应急发电10次次、重庆气矿换管、排污以及整改等共8次。

其中,川中气矿管道抢险的物资消耗主要集中照明设备与可燃气体检测上,以上4次应急抢险共使用照明设备31次,其中防爆强光电筒19次,自发电升降工作灯4次,移动照明装置8次;共使用便携式可燃气体检测仪14次。

其中,重庆气矿管道抢险的物资使用情况主要集中在维抢修机具上,其中在12次抢险中均用到了抢险车与焊机,同时切割坡口机与普通工具箱也有较高的使用频率,分别达到了11次和8次。

相比于管道抢险,应急发电的物资消耗种类较为单一,主要集中在工器具、电缆线与发电设备上,可以观察到发电设备包括发电车与发电机共使用了10次,工器具8次,以及电缆线6次。

在收集到的重庆气矿30次应急抢险物资使用情况中,由于在30次抢险事件中,管道抢险与应急发电作为发生频率较高的抢险事件,占了其中的22次,所以可以发现抢险车、焊机、工器具、切割坡口机、电缆线、发电箱、工具箱的使用次数明显高于其他物资的使用次数,均在10次以上。因此针对重庆气矿,后续可将管道抢险与应急发电作为物资储备的主要考虑因素。

事件原因即严重程度分析,如下:

目前,输气管理处拥有天然气管网4500多公里,其中有30%管道已运行20年,随着运行时间的增长,积累了多次应急抢先作业的历史数据。根据输气管理处1970年至2020年的历史抢险事件数据中事故情况的描述,分析出每一次应急抢险事件的原因一级指标和二级指标,部分结果如表1所示:

表1输气管理处事件原因分析结果

由上表可知,1970年至2020年输气管理处共进行267次应急抢险作业,图3展示了1970年至2020年导致事故发生的各类事故原因(I)的数量:

从图3可知,1970年至2020年,导致管线泄漏的因素主要有管道缺陷、腐蚀、第三方破坏三个因素。

通过统计,输气管理处每年发生应急抢险事件发生的次数如图4所示:

从统计的历年事故发生次数可以看出,事故主要爆发在两个时间段,一是1979年至1986年之间,二是2000年至2008年之间,数据整体呈下降的趋势。

天然气管道在运行过程中,既可能发生事先难以被人们识别察觉的突发性事件,也存在可能被预见且具有一定征兆的渐发事件。根据以上两种说明,可以总结出管道凹陷、管道减薄属于渐发式泄漏,管道破裂、管道裂口、管道大变形和管道断裂为突发式泄漏。通过对事件严重程度分类的研究,结合上表中对每次应急抢险事件的事故情况说明,按照事故的严重程度将事故后果分为六类,并统计在1970年至2020年间各类事故后果的次数,如表2所示:

2输气管理处事件严重程度分类及数目

事件发生次数是采用基于神经网络的事件发生次数预测子模型进行预测,如下:

由数据可得到输气管理处前51年每年应急抢险事件的发生次数,将其视为时间序列用LSTM神经网络对下一年事故发生次数进行预测。

数据预处理:本实施例得到输气管理处前51年每年事故发生次数,根据数据特征选定时间步长为3,即用第t-3,t-2和t-1年的事故发生次数:x

表3数据集的划分

因此共得到48个样本,将前33个样本作为训练集,将后15个样本作为测试集,并在训练集上训练模型,在测试集上测试模型效果。

预测结果及分析:模型评价指标

为了评价模型对数据的预测情况,本实施例使用均方根误差(RMSE)来评估模型。RMSE是评估预测值和实际值之间差异的常用方法,它被广泛的运用于各种预测模型的优劣评价中。RMSE使用以下公式计算:

模型网络结构

因为数据量较少,所以本实施设置LSTM层数为1,内部神经元个数为100,将LSTM层的输出结果与单个神经元相连接,通过单个神经元输出最终结果,基于神经网络的事件发生次数预测子模型的模型结构如图5所示:

输入为第t-3,t-2和t-1年的事故发生次数:x

y

其中:

a

对于神经网络模型,超参数的选择对模型结果的好坏有着十分重要的影响,往往需要调整的参数包括网络层数、神经元个数、学习率、优化器等,表4记录了部分参数组合下的模型结果:

表4部分参数组合

预测结果:

通过1000次迭代对模型进行训练,若在20次迭代中模型效果无提升,提前终止训练。在496次迭代之后训练停止,训练集的RMSE=4.79,测试集的RMSE=2.03,说明通过前三年的事故发生次数来预测第四年的发生次数的方法是可行的,并且能够取得较好的效果。为了更直观的描述预测值与真实值之间的拟合效果,将预测值与真实值进行了可视化对比,效果如图6所示。

因此使用模型对下一年应急抢险事件的发生次数进行预测,预测结果表明下一年会有3次应急抢险事件发生。

建立事件严重程度预测模型

在事故发生次数预测的基础上,采用基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型训练,对下一年四次事故结果进行预测,并用预测效果最好的方法建立最终的事故后果预测模型。

数据预处理

由于收集到的数据是文本型数据,而建立事故后果预测模型时需要数值型数据。因此,本实施例通过对已有数据进行收集整理,在较为完备的事故原因指标体系基础上,将事故原因二级指标与事件严重程度相结合,事故的发生原因作为特征X,共计14种导致事故发生的原因;将事件严重程度作为Y,共计6种事件严重程度;最终形成了大小为267*15的数据矩阵,如表5所示:

表5用于建模的数据集

注:符号代码说明:

预测结果及分析

进行训练结果比较分析,得到事件严重程度预测效果最好的模型中采用的模型评价指标为Macro AUC,Macro AUC的计算公式为:

AUC是一种用来度量二分类模型好坏的一个标准,被定义为ROC曲线下面积。ROC曲线又称作受试者操作特性曲线,是一条以不同阈值下的假正率FPR为横坐标,不同阈值下的召回率Recall为纵坐标的曲线。对某个分类器而言,可以根据其在测试样本上的表现得到一个FPR和Recall点对。这样此分类器就可以映射成ROC平面上的一个点。调整该分类器在分类时使用的阈值,便可以得到一个经过(0,0),(1,1)的曲线,这就是此分类器的ROC曲线。而AUC的值便为ROC曲线下方面积的大小,通常,AUC的值介于0.5到1.0之间,较大的AUC说明模型具有较好的预测效果。

相比于准确率AUC有如下优势:

1、不会受到样本不平衡问题的影响。本项目事件严重程度为不平衡数据,其中管道缺陷共发生133次,而误操作只发生了4次,若采用准确率作为评价指标易受样本不平衡问题的影响,使模型结果更偏向于多数类,而AUC对类别不平衡问题不敏感,不同的样本比例并不会影响AUC的评测结果。

2、使得到的模型更具有鲁棒性。许多机器学习模型对分类问题的预测结果都是概率,一般情况下通过将阈值设为0.5来计算模型的准确率,而在实际应用中该阈值的选取在很大程度上影响了准确率的计算,而AUC为ROC曲线下面积,不会受到阈值的影响,使训练出的模型更加稳健。

建模效果

将得到的267个样本的百分之八十作为训练集用于训练模型,剩下的百分之二十作为测试集,来验证模型效果。同时训练了随机森林、逻辑回归、GBDT、支持向量机以及XGBoost,并比较分析了各个模型在测试集上的表现,各模型的预测效果如下表6所示:

表6模型预测效果

由上表可以看出,随机森林、GBDT与XGBoost作为树的集成模型效果要明显优于逻辑回归与支持向量机。逻辑回归作为线性模型,在面对非线性数据时效果往往会不尽人意,而支持向量机虽然可以通过核函数处理非线性数据,但是模型效果对核函数的选取十分敏感,并且在实际任务中很难寻找到适合原数据的核函数。相比之下,集成学习模型的效果明显更优,由上表可知,采用Boost策略的GBDT要优于采用Bagging策略的随机森林,而XGBoost作为GBDT的改进模型效果优于其他四个模型,在测试集上的AUC达到0.8924,因此最终选取XGBoost作为事件严重程度的预测模型。

同时记录了XGBoost在各组参数组合下的模型效果,针对XGBoost本文对subsample、colsample_bytree、min_child_weight、gamma、max_delta_step、colsample_bylevel、reg_alpha、reg_lambda总计八个参数进行调整,其中subsample表示每次建树从样本中进行采样的比例,colsample_bytree表示构造每棵树时随机抽样出的特征占所有特征的比例,min_child_weight表示一个叶子节点上所需的最小样本权重,gamma表示在树的叶子节点上进行进一步分枝所需的最小的目标函数下降,max_delta_step表示树的权重估计中允许的单词最大增量,colsample_bylevel表示在树的每一层进行分支时随机抽样的特征占所有特征的比例,reg_alpha用于控制目标函数中L1正则化的强度,reg_lambda用于控制目标函数中L2正则化的强度,部分参数组合结果如下表7所示:

表7部分参数组合

预测下一年事件严重程度

由事故发生次数预测的结果可知,下一年会有3次应急抢险事件发生,因此首先使用LSTM神经网络根据以往事故的发生原因对未来三次事件的发生原因进行预测,以此来构建新的特征矩阵X,模型结构与图5.7类似,模型输入为第t-3,t-2和t-1年的事故的发生原因x

y

其中:

a

选用Adam优化器,经过242次迭代后停止训练,预测结果表明下一年导致3次应急抢险发生的原因分别是内腐蚀与焊接缺陷、内腐蚀、内腐蚀,并由此生成新的特征矩阵如下表8所示:

表8用于预测的数据

在得到上述事故原因数据之后,使用已经训练好的基于GBDT的事件严重程度预测子模型,根据新生成的事故原因X来预测下一年发生事件的严重程度Y,结果表明下一年会发生管道裂缝/沙眼/穿孔三次。

应急抢险物资配置

根据事件严重程度,建立应急抢险物资选配表请专家对表格进行填写,如图7所示;最终整理得到不同事件严重程度所需要的应急物资种类及数量的数据,以管道裂缝/沙眼/穿孔为例,表9和表10分别为为发生该类事件所需应急抢险物资及维抢修机具的类别和数量:

表9应急抢险物资及数量

表10维抢修机具及数量

结合表9和10中不同应急抢险事件的严重程度所需要的应急物资和5.5中事件严重程度的预测结果对物资进行预先配置,使其满足同时发生两次应急抢险事件时的需求量,针对输气管理处的应急物资配置建议如下表所示:

表11应急物资配置建议

/>

同时,对维抢修机具进行配置结果如下:

表12维抢修机具配置建议

工作原理是:本发明首先充分调研、分析油气田输气管道的历史应急物资抢险事件数据,从中挖掘出物资使用情况、事件发生原因及事件严重程度等信息;并结合应急物资选配数据建立事件严重程度的物资选配表。其次,建立完整的事故原因指标体系;对事故情况进行分析,找出事故发生的原因,并建立以第三方破坏、误操作、腐蚀、管道缺陷和自然灾害为事故原因指标体系。然后,构建事件严重程度预测模型,并进行训练得到训练好的事件严重程度预测模型。最后,将事件严重程度预测模型与物资选配表结合,实现了对应急物资预测;首先对下一年应急抢险事件发生次数进行预测,然后对每次事件的严重程度预测,最后结合物资选配表对应急物资进行预测,得到物资配置建议。

本发明能够从较少的数据中挖掘到有效信息,预测效果佳;且在事件发生前预测,提高了预见性。本发明根据历史抢险事件的特性预测未来发生事件的严重程度,以此来了解管道的运行状态和情况,提前做出有效的预防措施,可以减少甚至避免应急抢险事件产生的影响。本发明合理配置应急抢险物资是应对突发事件的有力保障,对抢险物资进行配置具有明显的理论和实际价值。

实施例2

如图8所示,本实施例与实施例1的区别在于,本实施例提供了一种基于机器学习的应急抢险物资预测分析装置,该装置支持实施例1所述的一种应急抢险物资预测分析方法,该装置包括:

获取单元,用于获取油气田输气管道的历史应急抢险事件数据和应急物资选配数据;

第一指标特征分析单元,用于对所述油气田输气管道的历史应急抢险事件数据进行统计分析,挖掘出油气田输气管道的指标特征,作为第一指标特征;

物资选配表建立单元,用于根据所述应急物资选配数据,建立事件严重程度的物资选配表;

第二指标特征分析单元,用于根据所述油气田输气管道的历史应急抢险事件数据,结合油气田输气管道的实际情况,构建事故原因指标体系,作为第二指标特征;

事件严重程度预测模型构建及训练单元,用于根据所述第一指标特征及第二指标特征,构建事件严重程度预测模型,并进行训练得到训练好的事件严重程度预测模型;

事件严重程度预测单元,用于将油气田输气管道的待测数据输入训练好的事件严重程度预测模型进行预测,输出事件严重程度预测结果;

应急物资配置单元,用于根据所述事件严重程度预测结果结合物资选配表,实现对未来应急物资预测配置。

具体地,所述事件严重程度预测模型包括基于神经网络的事件发生次数预测子模型,将所述第一指标特征及第二指标特征的训练数据输入所述基于神经网络的事件发生次数预测子模型进行训练,输出事件发生次数训练结果;

并将所述事件发生次数训练结果分别输入到基于随机森林的事件严重程度预测子模型、基于逻辑回归的事件严重程度预测子模型、基于GBDT的事件严重程度预测子模型、基于支持向量机的事件严重程度预测子模型和基于XGBoost的事件严重程度预测子模型中进行各个模型训练,并进行训练结果比较分析,将事件严重程度预测效果最好的模型联合所述基于神经网络的事件发生次数预测子模型共同作为最终的事件严重程度预测模型。

各个单元的执行过程按照实施例1所述的一种应急抢险物资预测分析方法流程步骤执行即可,此实施例中不再一一赘述。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种用于基坑抢险快速应急斜撑及施工方法
  • 一种用于应急抢险并兼顾波浪供能的防波堤及布置方法
  • 一种煤矿应急救援系统、安全监测方法、装置及存储介质
  • 一种LTE小区容量预测分析方法及装置
  • 一种直升机应急抢险用物资包减震装置
  • 一种应用于应急抢险物资存储的可拆卸式货架
技术分类

06120116488128