导航：首页> 破碎、磨粉或粉碎；谷物碾磨的预处理>一种基于可计算语义网络的管网停开井产量预测方法

一种基于可计算语义网络的管网停开井产量预测方法

文献发布时间：2024-04-18 19:54:45

技术领域

本发明涉及油井产量预测技术领域，尤其涉及一种基于可计算语义网络的管网停开井产量预测方法。

背景技术

随着地下油气的不断开采，生产井的产能逐步下降，部分井已经进入高含水的后期阶段，油田正面临着注水井增多的问题，通常采用关停的方式解决高含水井的问题。另一方面，油田逐步加大油气藏勘探开发力度，大力推进新井建设或老井扩建，提高油气产能和生产力。

集输管网是输送石油、天然气及相关产品的管道网络，通常由主管道、支管道、调节阀、泵站、计量站等组成，是油气工业中重要的输送工具。由于集输管网的拓扑序列复杂，关停或新开油井会影响管网各处的压力和温度，进而对其余井的产量造成一定影响。在稳定的管网系统中，关停部分油井会降低管网回压，在各油井油压不变的前提下，产量会增加；反之，新开部分油井会增加管网回压，会减少其余油井的产量。因此，为了保持油田的高产稳产，研究集输管网停开井后的影响因素并预测各井产量，为油田指定合理的井口关停及生产方案是至关重要的。

近年来，随着人工智能的迅速发展，深度学习方法逐渐用于油井产量预测，例如CN110400006A公开了一种基于深度学习算法的油井产量预测方法，该基于深度学习算法的油井产量预测方法包括：步骤1，获取数据并进行质量检查；步骤2，进行数据处理及划分；步骤3，建立学习模型；步骤4，采用步骤3搭建的模型开展训练，并进行验证；步骤5，预测油井产量。但是现有深度学习方法仅依靠数据驱动，通过提取各生产参数和产量之间的关联关系进行建模，没有考虑储运机理知识和物理学公式的影响，这就造成在利用深度学习模型进行产量预测的过程中存在两个问题，一是采集到的实时生产数据不准确或者存在噪声，导致模型拟合程度差，预测准确率较低；二是不同油井的产量预测可能具有不同的解释方式，导致产量预测的应用存在较大的不确定性。

发明内容

本发明的目的在于克服现有技术存在的缺点，设计提供一种精度高、速度快的基于可计算语义网络的管网停开井产量预测方法。

为实现上述目的，本发明采用以下技术方案实现：

一种基于可计算语义网络的管网停开井产量预测方法，具体步骤如下：

S1、采集原油生产区停开井前后一段时间内的实时生产数据作为可计算语义网络模型的样本数据集，并对样本数据集进行预处理后划分为训练集和测试集；

S2、根据原油生产区的集输管网中所有管道的管道属性，分析同一管道上下游所有节点的回压、温度、流速、流量数据与管道属性的关联关系，得到适用于实际采油集输管网的储运机理知识，并对储运机理知识进行表征得到储运机理知识表征体系；

S3、结合原油生产区的集输管网拓扑图，将集输管网拓扑图中的单井、井组、中心平台作为节点，管道连接关系作为边，构建深度网络框架，并建立节点向量和边向量表示；

S4、根据步骤S3构建的深度网络框架，融合步骤S2储运机理知识的表征结果，通过设计网络参数计算机制，完善网络迭代更新方法，构建可计算语义网络模型；

S5、设置步骤S4得到的可计算语义网络模型的模型参数，并采用训练集对设置好参数的可计算语义网络模型进行训练，训练过程中，不断通过储运机理知识计算管网各处的压力、温度和产量，分析每次迭代时的变化趋势，直到模型训练结束，根据每一次迭代预测的总产量值和中心平台的压力值，得到模型自由参数的最优权重；

S6、基于步骤S5得到的最优权重，使用决定系数、平均绝对误差、平均绝对百分比误差、均方根误差和希尔不等系数作为评价指标对可计算语义网络模型进行评价；

S7、结合步骤S6中的评价结果，将集输管网生产数据输入可计算语义网络模型进行预测，得到停开井集输管网中各井口产量的预测结果。

作为本发明的进一步技术方案，步骤S1所述实时生产数据包括采集时间、井号、油压、回压、套压、温度、耗电量、三相电流、三相电压和日产液量，其中日产液量为原油生产区内所有单井当日的总产液量，通过读取安装在原油生产区内的油井井口的流量计得到；油压、回压、套压、温度、耗电量、三相电流、三相电压利用安装在原油生产现场的传感器获取。

作为本发明的进一步技术方案，步骤S1所述对样本数据集预处理包括重复数据清洗、缺失数据处理和噪声数据清洗，其中重复数据清洗是对数据集中相似重复记录的属性及产生原因进行分析，运用排列合并的清洗思想去重；缺失数据处理解决实时生产数据中由于传感器损坏或数据传输等原因导致数据缺失的问题，通过结合实际生产情况，对原油生产区停开井前后一段时间内的生产参数进行分析，进行删除或补全；噪声数据清洗是通过正态分布公式

作为本发明的进一步技术方案，步骤S1所述训练集和训练集的数量比为7:3。

作为本发明的进一步技术方案，步骤S2所述管道属性包括管道长度、管道内径和内壁粗糙度；储运机理知识包括确定管径，流速、流量和管径之间的关系，雷诺数和摩擦系数的关系，管壁粗糙度的计算，管道压力降和管道属性的关系，对储运机理知识进行表征的结果为：

管径计算公式：

雷诺数计算公式：

管壁粗糙度计算公式：

管道压力降计算公式：

，其中/>

作为本发明的进一步技术方案，步骤S3所述节点向量表示为

作为本发明的进一步技术方案，步骤S4中网络参数计算机制包括前向计算模式和反向传播模式，其中前向计算模式的具体计算过程为：相邻节点参数传递公式

反向传播模式计算过程为：相邻节点反向参数偏导公式

作为本发明的进一步技术方案，步骤S4所述网络迭代更新方法是在原有稳定输油管网系统中增加或者停止某井后，先根据其余各井口参数，通过油井井口产量计算公式

作为本发明的进一步技术方案，步骤S5所述模型参数包括神经元数量、优化器、激活函数和迭代次数，其中神经元数量由节点种类决定，单井节点的神经元数量为10个，井组节点的神经元数量为50个，中心平台节点的神经元数量为70个，优化器采用Adam优化器，激活函数为Sigmoid激活函数，迭代次数为100次。

作为本发明的进一步技术方案，步骤S6所述决定系数、平均绝对误差、平均绝对百分比误差、均方根误差和希尔不等系数的计算公式如下：

决定系数

平均绝对误差

平均绝对百分比误差

均方根误差

希尔不等系数

其中

与现有技术相比，本发明具有以下有益效果如下：

（1）通过使用现场实时生产数据对停开井后输油管网内各单井的日产液量进行预测，为输油管网一体化分析及日产量预测提供一种准确可行的方法。

（2）首创一种融合机理知识的可计算语义网络，网络结构根据油田部署管网拓扑图动态变化，同时考虑生产数据和储运机理知识两大因素，提出“数据+机理”双驱动的网络模型，大幅度提高模型的预测准确度，有利于指导油田生产计划。

（3）设计了一种新型网络参数计算机制，包括前向计算模式和反向传播模式，均将储运机理知识融入到深度学习神经网络相关算法中，优化网络参数的计算方式，同时建立了一种新型网络迭代更新方法，结合油田集输管网系统实际运行规律，通过优化器不断减少损失函数，以中心平台三相分离器最高处理上限作为限制条件，反复计算管网各处数据，提高网络模型迭代收敛效率，更快地输出最优预测结果。

附图说明

图1为本发明所述基于可计算语义网络的管网停开井产量预测方法的流程框图；

图2为本发明实施例所述某油田的集输管网拓扑结构图；

图3为本发明构建的深度网络框架结构图；

图4为本发明实施例中步骤S5训练模型时的准确率曲线图；

图5为本发明实施例中某油田2023年1月至4月的产量预测值和真实值对比图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

实施例：

如图1所示，本实施例提供了一种基于可计算语义网络的管网停开井产量预测方法，主要包括数据集收集和预处理、储运机理知识建立和表征、深度网络框架构建、可计算语义网络模型构建、可计算语义网络模型训练、可计算语义网络模型评价和产量预测六个步骤，具体为：

S1、数据集收集和预处理：

（S11）获取某油田整个集输管网在2020年1月1日至2022年12月31日共3年内每次停井或新开井前后各10天的实时动态生成数据，包括采集时间、井号、油压、回压、套压、温度、耗电量、三相电流、三相电压和日产液量，将其作为数据集

（S12）由于采油现场环境恶劣，电磁干扰较多，获取到的现场数据不够完整甚至存在部分噪音，因此对数据集

（S13）将预处理后的数据集按照7：3的比例划分为训练集和测试集，训练集用于训练可计算语义网络，测试集用于在模型训练结束后测试模型的准确度和可行性；

S2、储运机理知识建立和表征：

油田集输管网拓扑结构图如图2所示，图2中以“BW”开头的节点均为井组，拓扑结构图清晰展示了中心平台及各井组的分布情况，井组与井组、井组与中心平台连接的管道部分标明了管道长度和管道内径大小，该实施例的井组仅包含2-5口单井，井组内部结构简单，故不在拓扑结构图中展示，查询井组内包含的单井信息可参考单井台账表；根据油田的集输管网拓扑结构图，获取同一管线出口端和进口端两侧的压力降、温度降、平均流速、流量数据，与该管线内径、长度、粗糙度建立关联关系，得到储运机理知识，并采用建立数学公式的方法对储运机理知识进行表征得到储运机理知识表征体系，具体包括：

，

其中，

S3、深度网络框架构建：

结合油田集输管网拓扑结构图和单井台账表，将单井、井组、中心平台作为网络的节点，它们之间的管线连接关系作为网络的边，搭建深度网络结构，并基于该网络结构，建立节点和边向量表示，节点向量表示为

S4、可计算语义网络模型构建：

在深度网络结构基础上，融合机理知识表征结果和深度学习参数传递算法，设计前向计算模式、反向传播模式和迭代更新方法，构建可计算语义网络模型，其中前向计算模式相关公式包括：

，

其中，

反向传播模式相关公式包括：

，

其中

网络迭代更新方法是一种根据储运机理模型进行迭代的算法，用于计算在增加或停止某井后，整个稳定输油管网系统中的产量变化和各井口回压数据，具体过程为：在原有稳定输油管网系统中增加或者停止某井后，先根据其余各井口参数，通过油井井口产量计算公式

S5、可计算语义网络模型训练：

设置步骤S4得到的可计算语义网络模型的模型参数，模型参数中神经元数量由节点种类决定，单井节点的神经元数量为10个，井组节点的神经元数量为50个，中心平台节点的神经元数量为70个，优化器采用Adam优化器，激活函数Sigmoid激活函数，迭代次数为100次，采用训练集对设置好参数的可计算语义网络模型进行训练，训练过程中，不断通过储运机理知识计算管网各处的压力、温度和产量，分析每次迭代时的变化趋势，直到模型训练结束，根据每一次迭代预测的总产量值和中心平台的压力值，得到模型自由参数的最优权重；图4为进行迭代和校正过程中的准确率曲线，其中横轴表示迭代和校正的次数，纵轴表示准确率的大小，由图4可以看出，在迭代至40次左右时，准确率仍呈小幅度上升，直到95次左右时，准确率几乎没有变化，因此是合适的产量预测模型，能够获得更准确的预测结果；

S6、可计算语义网络模型评价：

可计算模型训练完成后，使用决定系数R

，

其中，

S6、产量预测：

使用2023年1月1日至4月30日共4个月内的管网生产数据进行预测，从而得到停开井后集输管网中各井口产量的预测结果，预测值和真实值的对比曲线如图5所示，其中横轴表示日期，纵轴表示日产液量数值，由图中可以看出，两者的误差都在5%以内，在油田生产区可接受的误差范围内，因此可以应用于生产环境中。

本实施例通过设计一种融合机理知识的可计算语义网络模型，对管网系统中各单井及管道各处的压力、温度、产量等实时数据进行学习，能够对停开井后的管网系统进行一体化分析，精准预测管网系统内所有单井的生产参数及日产液量，因此不同于以往从单独的某种方法和某种特征的角度来进行某口单井的产量预测，其中，可计算语义网络模型结构是根据管网系统拓扑结构图搭建而成，模型中的节点表示为管网系统中的单井及平台，边表示为单井及平台的输送管道，模型参数计算机制和迭代更新算法是基于深度学习中梯度下降算法、Adam优化算法的非线性求解过程，结合管网系统运行规律和生产现场实际情况，融合储运机理和生产数据进行混合建模。当管网系统内停开某口井后，利用学习生成的语义网络模型对调整后的管网系统进行模拟计算，最终输出各单井的产量值。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围内。

完整全部详细技术资料下载