掌桥专利:专业的专利平台
掌桥专利
首页

一种基于特征张量的高维地震数据插值方法

文献发布时间:2023-06-19 09:24:30


一种基于特征张量的高维地震数据插值方法

技术领域

本发明涉及地震数据处理领域,具体一种基于特征张量的高维地震数据插值方法。

背景技术

目前国民赖以生存的传统能源,如天然气、石油等的开采离不开勘探物理学,采集到的数据被称为地震数据。高密度的完整地震数据在后续偏移成像和多次波压制等步骤中至关重要。但是一方面检波器的布置受到自然条件约束,导致采集的数据出现整列缺失的现象;另一方面为了节省开采成本,会增加相邻检波器之间的距离,造成数据过于稀疏,导致采集的数据出现数据缺失现象。地震数据插值的目的就是将缺失的数据补充完整,或将稀疏的数据通过数学算法进行道加密,将数据高密度化。近年来,勘探行业越来越关注高维地震数据的采集。高维地震数据是指多检波器多炮点在不同时刻采集到的数据。数据空间坐标轴之间的信息在复杂的物理波特性约束下紧密相连,因此高维地震数据能够包含更多的结构信息,为地下介质的正确解释提供更多依据。但是由于经济条件和自然条件的限制,高维地震数据插值重建问题显得尤其重要。

传统算法如稀疏变换、字典学习、张量完备等处理高维地震数据插值问题时,往往依赖于通过展开的方式降维转换,将高维地震数据转换为低维地震数据,采用低维插值算法进行插值,这破坏了地震数据在不同维度间的物理相关性关系,插值效果有待进一步提高。原始机器学习方法往往将高维数据按某一维度展开为向量,这破坏了高维地震数据丰富的多维特性,且随着维度的增加,训练参数也随之增加,导致在训练高维数据时效率不高,插值效果不理想。新兴的机器学习算法展现了对不同类型地震数据的普适性以及强大的学习能力,但仍未达到学习结构信息的能力。在解决高维数据时,仍需展开后采用低维算法进行插值。

近年来,张量回归模型如支持张量机、广义张量线性回归模型、低秩稀疏张量回归模型等,应用于图像领域、神经影像学、高光谱遥感成像等应用领域。借助于张量分解,该模型在高维数据的处理上具有显著优势。而在地震数据插值技术中,现有的算法缺乏对高维数据的普适性能力,适应高维数据的普适性插值算法的研究是有必要的。

发明内容

针对现有技术的不足,本发明拟解决的技术问题是,提供一种基于特征张量的高维地震数据插值方法。

本发明解决所述技术问题的技术方案是,提供一种基于特征张量的高维地震数据插值方法,其特征在于该方法包括以下步骤:

步骤一、数据的预处理:选择原始训练数据,再对原始训练数据进行缺失处理,得到缺失训练数据;再采用插值算法分别对缺失训练数据与缺失地震数据进行预插值处理,得到预插值训练数据和预插值重建数据;

步骤二、训练特征张量的提取:选定步长与规模,分别对预插值训练数据与预插值重建数据进行局部切割处理,得到训练特征张量和预测特征张量;

步骤三、张量回归模型的训练学习:在原始训练数据中确定训练特征张量与原始训练数据的映射点,映射点即为训练标签,得到由训练标签和训练特征张量组成的训练集;每一个训练特征张量和与之对应的训练标签组成训练集中的一组训练点对;将每组训练点对依次输入至张量回归模型,对张量回归模型进行训练学习,得到训练后的张量回归模型;

步骤四、插值重建:将预测特征张量依次输入至训练后的张量回归模型中,得到预测标签集;再根据步骤三确定的训练特征张量与原始训练数据的映射关系,使用预测标签集中的预测标签对缺失地震数据进行插值操作,得到重建地震数据。

与现有技术相比,本发明有益效果在于:

(1)本发明将张量回归模型应用于地震数据插值重建中,以张量作为输入特征进行训练,将原始特征直接输入至张量回归模型,并不破坏高维数据的结构信息,有效保留了原始特征中的结构信息,提高了高维地震数据的结构信息利用率,提高了机器学习方法的插值效果,提高了地震数据的恢复质量,进而提高了地震资料解释的准确性,实现了对不同类型不同维度地震数据的普适能力。

(2)在对高维数据进行插值时,借助于CP分解,在不破坏高维数据结构信息的前提下,分解为若干矩阵,可有效减少训练参数,进而提高插值的效率。

(3)本发明在模型参数训练过程中,采用交替最小二乘法,每一轮对每个维度的相关矩阵进行重新训练,重复考量地震数据的多维结构相关性质,结构信息的利用能力明显提升。

附图说明

图1为本发明实施例1的完整地震数据图;

图2为本发明实施例1的8幅原始训练数据图;

图3为本发明实施例1的采样率为50%的缺失地震数据图;

图4为本发明实施例1的经过Bicubic插值算法后得到的预插值重建数据图;

图5为本发明的数据预处理的流程图;

图6为本发明的张量回归模型的训练学习的流程图;

图7为三维张量的CP分解流程图;

图8为本发明的插值重建的流程图;

图9为本发明实施例1的张量回归算法的恢复结果;

图10为本发明实施例1的支持向量机算法的恢复结果。

具体实施方式

下面给出本发明的具体实施例,具体实施例仅用于进一步详细说明本发明,不限制本申请权利要求的保护范围。

本发明提供了一种基于特征张量的高维地震数据插值方法(简称方法),其特征在于该方法包括以下步骤:

步骤一、数据的预处理:从现有地震数据库中选择原始训练数据,再对原始训练数据进行缺失处理,得到缺失训练数据;再采用插值算法分别对缺失训练数据与缺失地震数据进行预插值处理,得到预插值训练数据和预插值重建数据;

原始训练数据选择规模适当且地貌结构相似的地震数据,原始训练数据的质量与插值的恢复结果密切相关;缺失地震数据是在实际勘探过程中得到的;缺失训练数据的缺失情况与缺失地震数据一致;

步骤二、训练特征张量的提取:选定步长与规模,分别对预插值训练数据与预插值重建数据进行局部切割处理,得到用于训练学习的局部特征张量即训练特征张量和用于插值重建的局部特征张量即预测特征张量;

步骤三、张量回归模型的训练学习:在原始训练数据中确定训练特征张量与原始训练数据的映射点即训练标签,得到由训练标签和训练特征张量组成的训练集;每一个训练特征张量和与之对应的训练标签组成训练集中的一组训练点对;将每组训练点对依次输入至张量回归模型,对张量回归模型的参数进行训练学习即对系数张量与偏置进行调整,得到训练后的张量回归模型;

步骤3.1、在原始训练数据中确定训练特征张量与原始训练数据的映射点,映射点即为训练标签,进而得到由训练标签和训练特征张量组成的训练集

步骤3.2:将每组训练点对依次输入至张量回归模型,对张量回归模型的参数进行训练学习即对系数张量与偏置进行调整,得到训练后的张量回归模型;

张量回归模型的参数的训练学习方法如下:

张量回归模型如式1)所示:

式1)中,

对系数张量

式2)中,

经过对系数张量

通过Khatri-Rao乘积的可分离性,将式2)转换为式3):

式3)中,X

因此,在每次训练学习过程中,无需对系数张量W进行调整,只需对每个因子矩阵W

式4)中,L(·)为损失函数,X

通过交替最小二乘法求解式4)中的n+1个优化问题,得到系数张量的最优估计值

优选地,通过交替最小二乘法求解式4)中的n+1个优化问题的方法如下:

给定误差精度ε,输入误差精度ε与训练集{χ

式6)和7)中,b

在第t轮次的训练中,按照如下公式得到第t轮次的因子矩阵W

计算第t轮次的损失函数值L(b

当L(b

步骤四、插值重建:将预测特征张量依次输入至训练后的张量回归模型中,得到预测标签集;再根据步骤三确定的训练特征张量与原始训练数据的映射关系,使用预测标签集中的预测标签对缺失地震数据进行插值操作,得到重建地震数据。

实施例1

本实施例中,分别使用支持向量机算法(SVR算法)与本插值方法(即张量回归算法(TR算法))对缺失地震数据进行插值操作,分别得到重建地震数据。

SVR算法中,从现有地震数据库中选择一张二维完整地震数据(如图1所示),对其进行缺失处理,得到缺失地震数据。缺失地震数据大小为128×128。从现有地震数据库中选取8幅大小均为128×128且地貌结构与缺失地震数据相似的地震数据作为原始训练数据(如图2所示);由图2可以看出,原始训练数据的地貌结构与完整地震数据相似。

本插值方法中,完整地震数据、缺失地震数据和原始训练数据的选用与SVR算法相同。

本插值方法步骤一中,由图3可以看出,缺失地震数据规则缺失,采样率为1/a=50%;

插值算法采取Bicubic插值技术。由图4可以看出预插值重建数据仅被简单的重建和还原;该步骤得到的预插值重建数据的信噪比S/N为25.03dB,重建结果并不理想,仍需进一步提高;

本插值方法步骤二中,选定步长为1,规模为3×3,对预插值训练数据与预插值重建数据进行局部切割处理,获得训练特征张量127008个与预测特征张量15876个。

根据信噪比量化恢复质量,信噪比计算公式如下:

式中,I为完整地震数据,I

选定采样率为50%,对SVR算法和本发明的TR算法的恢复效果进行了比较,插值结果的信噪比列于表1。

表1

表1中,百分比指对模型的参数进行训练学习的过程中,使用的训练集占全部训练集的百分比比例。由图9可以看出,TR算法在百分比100%的情况下的恢复结果为信噪比S/N=33.9dB,由图10可以看出,SVM算法在百分比100%的情况下的恢复结果为信噪比S/N=32.16dB。由图9、图10的重建结果及表1的信噪比可以看出,以张量为自变量的张量回归算法的重建效果优于以向量为自变量的支持向量机算法的重建效果。

实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

本发明未述及之处适用于现有技术。

相关技术
  • 一种基于特征张量的高维地震数据插值方法
  • 一种基于特征张量的高维地震数据插值方法
技术分类

06120112150719