掌桥专利:专业的专利平台
掌桥专利
首页

一种基于领域知识与深度学习结合的地层岩性预测方法

文献发布时间:2023-06-19 19:07:35


一种基于领域知识与深度学习结合的地层岩性预测方法

技术领域

本发明涉及地质勘探技术领域,具体涉及一种基于领域知识与深度学习结合的地层岩性预测方法。

背景技术

据国家统计局数据显示,2019年我国天然气对外依存度超40%,原油对外依存度超70%。随着工业化进程的加快以及经济规模的进一步扩大,我国能源需求还会持续增加。水力压裂技术使页岩气得以大规模开发。2020年,我国页岩气产量增长至200亿立方米,约占天然气总产量10%。跟其他化石能源相比,天然气具有低碳环保的特点。在“双碳”和能源安全双驱动下,大力开发页岩气、煤层气等非常规油气资源是保障清洁能源供应的有效途径之一。

地层岩性是油藏分析的基础,计算油藏参数、搭建地质模型等都需要知道地层岩性信息。传统获取地层岩性信息的方式主要有分析钻井返回的岩屑、分析岩心、分析传统测井曲线。当数据量增大的时候,采用传统方法获取地层岩性信息就会耗时耗力。

发明内容

为了提高地层岩性信息的获取效率,以及提升模型预测精度和可解释性,本发明提出了一种基于领域知识与深度学习结合的地层岩性预测方法,包括步骤:

S1:基于领域知识构建相应测井曲线与地层岩性变化之间关系的表征矩阵;

S2:根据循环神经网络中隐含层状态与表征矩阵之间的关系获取上下文向量,并基于上下文向量将表征矩阵与目标模型进行结合;

S3:对结合表征矩阵后的目标模型进行训练,并根据训练后的验证集表现进行最优训练方向下的目标模型选取;

S4:通过选取的目标模型对目标样本进行地层岩性的预测。

进一步地,所述S2步骤中,上下文向量的获取具体包括如下步骤:

S21:通过打分函数获取当前时刻隐含层状态与各表征间的关系得分;

S22:根据各表征的关系得分以及权重进行上下文向量的获取。

进一步地,所述S21步骤中,打分函数为如下公式:

式中,t为当前时刻,m为表征矩阵的行数编号,

进一步地,所述S22步骤中,上下文向量的获取表示为如下公式:

式中,

进一步地,所述S2步骤中,目标模型为GRU模型,表征矩阵与目标模型的结合表示为如下公式:

式中,

进一步地,所述测井曲线为伽马曲线。

进一步地,所述S1步骤中,表征矩阵的构建具体包括如下步骤:

S11:通过独热编码对各类地层岩性进行编码划分;

S12:根据自然规律下地层岩性的排布规律,以各相邻地层岩性伽马曲线的变化趋势值,以及对应的独热编码为行矩阵进行表征矩阵构建。

进一步地,所述变化趋势值为根据地层岩性伽马曲线的读数上升下降变化趋势进行设定的预设定值。

还包括一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现一种基于领域知识与深度学习结合的地层岩性预测方法所述的步骤。

还包括一种处理数据的装置,包括:

储存器,其上存储有计算机程序;

处理器,用于执行所述存储器中的所述计算机程序,以实现一种基于领域知识与深度学习结合的地层岩性预测方法所述的步骤。

与现有技术相比,本发明至少含有以下有益效果:

本发明所述的一种基于领域知识与深度学习结合的地层岩性预测方法,考虑到纯数据驱动的模型从数据学习到输入到输出之间的映射关系,但是不能给出模型做出某个具体判断的原因,因此,将领域知识以矩阵的形式表征出来,并通过注意力机制的方式和模型结合,可以让模型不仅仅从样本学习曲线和地层岩性之间的映射关系,还可以基于领域知识学习如何识别地层岩性,在提高了模型预测准确性的同时,也为模型的输出判断给出更为合理的物理解释。

附图说明

图1为一种基于领域知识与深度学习结合的地层岩性预测方法的步骤图;

图2为地层岩性变化与伽马曲线变化关系示意图;

图3为表征矩阵示意图;

图4为模型结合示意图。

具体实施方式

以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。

实施例一

近年来油气行业也尝试采用机器学习的方法来助力油气开发,该方法主要基于学习测井曲线到地层岩性的映射关系,然后在没有地层岩性信息的地方基于测井曲线做出预测,因此其是纯数据驱动的方法。目前纯数据驱动模型在地层岩性应用方面主要存在以下三个问题:(1)样本少,油气行业缺乏大量有地层信息标注的测井曲线。纯数据驱动模型主要从数据提取有用信息。如果标注样本少,模型学习到的信息就少;(2)地层岩性样本存在不平衡性,样本主要为碎屑岩和碳酸盐岩,含少量的泥岩,偶尔会存在煤层以及蒸发矿物,其中砂岩和碳酸盐岩为大多数类,煤层和蒸发矿物为少数类。对于多分类问题,模型假定每类的样本数目相近。如果样本不均衡,模型在少数类上会表现较差,原因为模型训练的时候主要看到大多数类的样本,从少数类学习到的信息较少。(3)地质学家希望模型具有可解释性,而目前的机器学习模型为一个黑箱,没有办法解释输入和输出的内部规律。

基于上述现有技术存在的问题,如图1所示,本发明提出了一种基于领域知识与深度学习结合的地层岩性预测方法,包括步骤:

S11:通过独热编码对各类地层岩性进行编码划分;

S12:根据自然规律下地层岩性的排布规律,以各相邻地层岩性伽马曲线的变化趋势值,以及对应的独热编码为行矩阵进行表征矩阵构建;

S2:根据循环神经网络中隐含层状态与表征矩阵之间的关系获取上下文向量,并基于上下文向量将表征矩阵与目标模型进行结合;

S3:对结合表征矩阵后的目标模型进行训练,并根据训练后的验证集表现进行最优训练方向下的目标模型选取;

S4:通过选取的目标模型对目标样本进行地层岩性的预测。

考虑到油藏的主要岩石组成为沉积岩,而在沉积过程中,沉积物受重力分异作用影响,一般颗粒大、比重大的物质先沉积,颗粒小、比重小的物质后沉积,但是矿物成分以及颗粒大小的变化会比较连续,从砂岩到泥岩之间会有泥质砂岩以及砂质泥岩等中间岩性,因此地层岩性(主要类目为碎屑岩和碳酸盐岩,像砂岩、粉砂岩、泥岩、石灰岩、泥质石灰岩以及泥灰岩等)有顺序性。例如,如果前一个深度的样本是泥岩,那下一个深度的样本很大概率还是泥岩或者砂质泥岩。在样本数据信噪比差的情况下,这种顺序性能够辅助模型更准确地预测岩性类别。基于此,本发明提出了将上述领域知识与机器学习算法结合的方式,对传统机器算法进行改进,以增强模型可解释性以及提升模型性能。

基于沉积岩的连续性特征,如何利用这一特征来识别各类岩性,地质学家有一套基于领域知识的方法,其中伽马曲线,中子孔隙度和密度等都是地质学家常用的判断依据。在这里面,伽马曲线能够反映地层中放射性元素(铀、钍、钾、镭和氡)的含量,而一般认为纯砂岩和碳酸盐岩含放射性元素较低,而泥岩含放射性元素较高,因此伽马曲线能用于识别地层的岩性。本实施例就以伽马曲线为例,解释伽马曲线的变化跟地层岩性变化的关系来约束地层岩性预测以及增强模型可解释性的原理。

当地层样本为砂岩和石灰岩的时候,伽马曲线读数(GR值)通常会很低,基本上在整条伽马曲线的最低值附近波动。以砂岩、粉砂岩、泥岩、石灰岩、泥质石灰岩以及泥灰岩为例,如图2所示,当砂岩慢慢变成粉砂岩最后变成泥岩的时候,伽马曲线会逐渐增高的时候。同样的情形也发生在当石灰岩慢慢变成泥质石灰岩最后变成泥灰岩的时候。我们将地层岩性变化下GR值上升下降趋势的关系以矩阵的形式表示出来,并转换为独热编码(000001至100000)下的表征矩阵(如图3所示,其中,gr代表上升趋势,-gr代表下降趋势),通过注意力机制的形式跟机器学习模型相结合来约束模型的训练。

在实际应用的过程中,gr为自行设定的预设定值。假设一个样本中一共有K类地层岩性,需要表征的地层岩性变化跟伽马曲线变化的关系一共有M条,那么最后得到的表征矩阵维度为M×(2K+1)。图3中包含有六类地层岩性,八条地层岩性变化跟伽马曲线变化的关系,将地层标注为独热编码后,最后得到一个8×13的矩阵。

而在机器学习模型方面,本发明选用GRU(gated recurrent unit)模型。如图4所示,表征矩阵通过注意力机制(Attention)的方式跟模型结合,生成上下文向量(contextvector)

S21:通过打分函数获取当前时刻隐含层状态与各表征间的关系得分;

S22:根据各表征的关系得分以及权重进行上下文向量的获取。

在这里,本发明采用的打分函数为加性模型,如公式(1)所示,

式中,t为当前时刻,m为表征矩阵的行数编号,

需要注意的是,为了让模型能够着重关注局部信息,上下文向量需要为加权的知识表征。这是因为隐含层的状态包含了当前地层应该是的岩性状态,而每一条表征包含的是某A岩性到某B岩性的过度,通过这个加权,就可以告诉模型是否需要这个额外信息,以及需要哪一条过度信息。其中,权重通过如下公式(2)获取,

式中,

最终,通过累加各表征与对应权重的乘积,获得当前时刻的上下文向量,通过如下公式(3)表示。

上下文向量

式中,

在构建完模型的框架后,考虑到所要解决的问题是多标签分类问题,采用神经网络处理这类问题时,输出层包含K个神经元对应K个类别,输出层的激活函数一般采用softmax。而当采用softmax作为输出层激活函数时,我们通过独热编码对原始标注数据编码得到的标注数据,考虑到各标注的特征间互斥作用,每次只有一个激活,因此此处采用交叉熵损失函数进行激活。

最终,通过对目标模型进行不断训练,并根据训练结果的验证结果集,从训练结果中挑选最优训练方向下的目标模型,通过该选取出的目标模型即可对目标样本进行地层岩性的预测。

本发明还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上文所描述预测方法的步骤。

还包括一种处理数据的装置,包括:

储存器,其上存储有计算机程序;

处理器,用于执行所述存储器中的所述计算机程序,以实现上文所描述预测方法的步骤。

综上所述,本发明考虑到纯数据驱动的模型从数据学习到输入到输出之间的映射关系,但是不能给出模型做出某个具体判断的原因,因此,将领域知识以矩阵的形式表征出来,并通过注意力机制的方式和模型结合,可以让模型不仅仅从样本学习曲线和地层岩性之间的映射关系,还可以基于领域知识学习如何识别地层岩性,在提高了模型预测准确性的同时,也为模型的输出判断给出更为合理的物理解释。

需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。

另外,在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

相关技术
  • 一种基于深度学习的电力通信领域知识图谱问答系统的构建方法
  • 一种基于深度学习的机器预测性维护方法
  • 一种碳酸盐岩地层孔隙压力预测方法
  • 一种碳酸盐岩地层超压预测方法
  • 双重孔碳酸盐岩地层已钻井纵横波速度重构方法及基于此的碳酸盐岩地层有效储层预测方法
  • 一种基于元素组分多元回归的灰岩地层可钻性预测方法
技术分类

06120115800556