掌桥专利:专业的专利平台
掌桥专利
首页

一种自监督地震数据去噪方法

文献发布时间:2024-04-18 19:53:33


一种自监督地震数据去噪方法

技术领域

本发明涉及地震勘探领域,特别涉及一种自监督地震数据去噪方法。

背景技术

在反射地震数据采集过程中,由于地表条件、环境干扰和人为因素的影响,地震信号经常被大量的噪声所干扰(例如:随机噪声、面波、工业干扰等)。这些噪声分布范围很广,其频带范围与有效信号相互重叠,严重影响了地震资料的信噪比及后续地震解释、反演的准确性。因此,地震数据的噪声压制一直是地震数据处理的关键步骤。根据地震数据中噪声和信号的性质差异,早期研究人员提出了许多地震数据噪声压制方法,主要包括预测滤波、稀疏变换、模态分解等。然而,这些传统方法往往依赖人工的先验知识选取参数以达到最优的去噪结果,在复杂的地质背景勘探中,参数调试过程往往是一个耗时且费力的工作,这无法满足海量地震数据的处理需求。

近年来,在计算性能和数据可用性大幅提高的推动下,深度学习(DL)方法已经进入了地震勘探领域的每一个子领域(例如:去噪、解释、反演等地震勘探任务),其中在地震去噪任务中,鉴于地震数据与图像数据在结构上具有相似特征,基于有监督DL(卷积神经网络、生成对抗网络、卷积自编码网络)的图像降噪模型在地震去噪任务中得到了快速发展。该类方法是一种经典的函数回归方法,试图从无噪声和噪声训练图像对中学习并建立降噪模型。在DL去噪中,模型的去噪性能起源于训练数据中信号和噪声的统计特征,比依赖噪声或信号统计的先验假设的传统方法更加灵活,然而,其优越性能的泛化性在很大程度上取决于其训练数据对现场数据分布的代表程度。最近,研究人员提出了许多不需要标记数据的无/自监督去噪算法,以解决监督学习的局限性,例如Noise2Noise、Self2Self、Noise2Void等算法都取得了较好的去噪性能,然而,上述方法通常需要对噪声类型具有依赖性限制了其广泛应用,不能很好的适用于实际地震数据的去噪。

因此,提供一种适用于实际地震数据的自监督去噪算法,以克服传统无/自监督去噪算法对噪声类型的依赖性是亟待解决的技术问题。

发明内容

本发明的主要目的在于提供一种适用于实际地震数据的自监督去噪算法,以解决现有方法存在依赖先验假设、适用性较差的技术问题。

为了实现上述目的,本发明提供了一种自监督地震数据去噪方法,包括以下步骤:

地震数据预处理;

将每个预处理后的地震数据依次分成多个斑块,然后随机从每个斑块的相邻位置抽取地震数据,按照斑块顺序分别堆叠生成噪声训练图像对S

构建一种自监督去噪算法;

根据生成的噪声训练图像对S

使用训练完成的自监督去噪网络模型对工区的含噪地震数据进行去噪,获得高信噪比的地震数据。

进一步地,还包括:构建所述自监督去噪算法的定量评价指标,评估地震数据的去噪效果。

进一步地,所述地震数据预处理,包括:

首先对地震数据归一化,将地震数据的振幅值缩放到-1~1之间,随后采用大小为128×128的窗口,对归一化的数据进行裁剪处理,得到预处理后的地震数据。

进一步地,所述构建一种自监督去噪算法,包括:

通过最小化均方误差损失函数来构建有监督的去噪算法,最小化均方误差损失函数为公式一:

其中f代表网络模型,f(x

引入一个趋于零的误差ε,使得x

其中,σ

根据生成的噪声训练图像对S

由于S

E

这里E

公式五转化为公式三的约束条件,故采用以下带有正则化项的损失函数来构建一个自监督去噪网络:

其中,l

进一步地,所述构建所述自监督去噪算法的定量评价指标,评估地震数据的去噪效果,包括:

将地震数据的峰值信噪比PSNR和结构相似性SSIM作为定量评价指标,评估地震数据的去噪效果。

更进一步地,所述构建所述自监督去噪算法的定量评价指标,评估地震数据的去噪效果,包括:将地震数据非监督的均方根误差UMSE和峰值信噪比UPSNR作为定量评价指标,评估地震数据的去噪效果;

其中,非监督的均方根误差UMSE的表达式为:

非监督的峰值信噪比UPSNR的表达式为:

其中,S

进一步地,所述预设的自监督去噪网络模型为U-Net模型。

此外,为了实现上述目的,本发明还提供了一种自监督地震数据去噪装置,包括以下模块:

预处理模块,用于对地震数据预处理;

领域子采样模块,用于将每个预处理后的地震数据依次分成多个斑块,然后随机从每个斑块的相邻位置抽取地震数据,按照斑块顺序分别堆叠生成噪声训练图像对S

算法构建模块,用于构建一种自监督去噪算法;

模型训练模块,用于根据生成的噪声训练图像对S

数据去噪模块,用于使用训练完成的自监督去噪网络模型对工区的含噪地震数据进行去噪,获得高信噪比的地震数据。

此外,为了实现上述目的,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的自监督地震数据去噪方法的步骤。

此外,为了实现上述目的,本发明还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的自监督地震数据去噪方法的步骤。

本发明提供的技术方案具有以下有益效果:

1、本发明利用邻域子采样获得相似但不相等的噪声地震数据作为训练图像对,满足了自监督训练的前提要求,从而实现了一种能够从原始地震数据固有的噪声分布获得降噪能力的自监督算法。避免了传统方法所依赖的先验假设,同时在实际的地震去噪方面也有比监督方法更好的通用性。

2、本发明利用邻域子采样获得噪声参考对没有标签数据(无噪地震数据)无/自监督进行了定量评价,有利于后续的超参实验和模型调整。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1为本发明一种自监督地震去噪方法的总体流程图;

图2为本发明自监督去噪算法示意图;

图3为本发明邻域子采样示意图;

图4为本发明合成地震数据集降噪结果;(a)为纯信号;(d)为噪声地震数据;(b)对应小波阈值去噪算法;(c)对应f-x去卷积;(e)对应DnCNN;(f)对应本发明方法;

图5为本发明有效信号区域降噪结果;(a)为纯信号;(b)为噪声地震数据;(c)、(e)、(h)和(j)分别是使用小波阈值降噪、f-x反卷积、DnCNN和本发明方法进行去噪的结果;(d)、(f)、(i)和(k)是滤除的噪声;

图6为本发明训练过程;(a)MSE和UMSE;(b)PSNR和UPSNR;

图7为本发明实际地震数据降噪结果;(a)和(d)为原始地震数据;(b)和(e)为本发明方法的去噪结果;(c)和(f)为小波阈值算法的去噪结果;

图8为本发明局部放大去噪结果;(a)和(d)为原始地震数据;(b)和(e)为本发明方法的去噪结果;(c)和(f)为小波阈值算法的去噪结果;

图9为本发明一种自监督地震去噪装置的结构示意图;

图10为本发明一种电子设备的结构示意图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。

首先,考虑到传统无/自监督去噪算法对噪声类型的具有依赖性,不能很好的适用于实际的地震去噪问题,本发明实施例能够从原始地震数据固有的噪声分布获得降噪能力的自监督去噪算法,以解决现有方法存在依赖先验假设、适用性较差等问题,如图1所示,本发明实施例提供的自监督地震去噪方法包括:

S1:地震数据预处理;

S2:将每个预处理后的地震数据依次分成多个斑块,然后随机从每个斑块的相邻位置抽取地震数据,按照斑块顺序分别堆叠生成噪声训练图像对S

S3:构建一种自监督去噪算法;

S4:根据生成的噪声训练图像对S

S5:使用训练完成的自监督去噪网络模型对工区的含噪地震数据进行去噪,获得高信噪比的地震数据。

基于但不限于上述方法,预处理步骤包括:首先是地震数据归一化,将地震数据的振幅值缩放到-1~1之间,随后采用大小为128×128的窗口,对归一化的数据进行裁剪处理。

基于但不限于上述方法,构建一种自监督去噪算法的步骤如下:

通过最小化均方误差(MSE)损失函数来构建有监督的去噪算法,最小化均方误差损失函数为公式一:

其中f代表网络模型,f(x

由于在实际地震数据采集中,无法获得高质量的无噪声数据(标记数据)来训练监督网络。因此,本发明引入一个趋于零的误差ε,使得x

其中,σ

为了满足该条件,在之前的步骤S1中,本发明已经采用邻域子采样对地震数据进行处理以满足实验条件,具体来说,从预处理后的地震数据中选择一个地震数据y,首先将该地震数据分为k×k的斑块,本次地震数据大小为128×128,k=2,共获得4096个斑块体。然后随机从每个斑块的相邻位置抽取地震数据,分别叠加生成数据大小为64×64的噪声训练图像对,对每个地震数据均进行上述操作,最终得到每个地震数据y

如图3所示,图3(a)代表邻域子采样示意图,该图以6×6大小的图片为例,使用大小为2×2窗口将该图片分为9个2×2的斑块,随后随机从每个斑块的相邻位置抽取图像值,分别堆叠生成S

根据生成的噪声训练图像对S

由于S

E

这里E

如果直接使用公式三作为损失函数进行网络训练,降噪结果不会产生预期结果,而是过度平滑的数据图像。因此,本发明通过在损失函数中引入正则项来解决上述问题,假设f

公式五转化为公式三的约束条件,故采用以下带有正则化项的损失函数来构建一个自监督去噪网络:

其中,l

基于但不限于上述方法,步骤S4中,预设的自监督去噪网络模型为U-Net模型,如图2所示,U-Net结构由三个部分组成:一个编码器、一个解码器和跳过连接。在编码阶段,要进行五次下采样操作。每个下采样阶段都封装了相同的操作块,包括卷积层、激活函数(LReLU)层和最大池化层。在解码阶段,使用相应的五个阶段的上采样操作。在每个上采样阶段,采用反卷积层将特征图的数量增加一倍。每个解码块包含上采样层、跳过连接结构和LReLU层。跳过连接将编码阶段的对称特征连接到同一层次的解码块上,以生成一个堆叠的特征图。在最后一层,采用卷积层来生成去噪的地震数据。其中所有卷积层的卷积核大小为3,特征层的通道数见图2。

需要说明的是,U-Net模型只是本实施例一种优选的网络模型,在其他实施例中,也可以为降噪卷积神经网络DnCNN等,只需要满足模型的输入和输出大小一致,就满足训练条件。

本发明地震数据降噪方法使用PyTorch深度学习框架,具体来说,模型训练轮数设定为100,批量大小为50,初始学习率为0.0001,每25轮降低到初始值的一半,并Adam算法来优化DL去噪模型,最后分别在合成数据集和现场数据集进行结果测试,并与传统降噪方法(f-x反卷积和小波阈值降噪算法)和有监督方法(去噪卷积神经网络,DnCNN)进行比较。

基于上述方法,且考虑到目前已知的无/自监督算法的定量指标(如信噪比(SNR)和结构相似性(SSIM))通常由合成噪声(如高斯和泊松)的地震数据集所主导,同时,这些需要无噪声数据(标签数据)的监督指标并不适合衡量没有标签数据的无监督算法。在缺乏量化指标的情况下,先前研究往往依靠视觉检查(例如振幅谱、局部相似性和残差图)来评估现场数据的降噪结果,这一点对基于深度学习的地震去噪算法是有限制的,这妨碍了根据定量指标进行的超参数优化和模型调整。因此本发明为无监督去噪方法提供一种新的定量评价指标。

具体地,本发明引入峰值信噪比(PSNR)和结构相似性(SSIM),表达式如下:

其中max{x}代表地震信号的最大值,μ

用公式二减去上式,则非监督的MSE和PSNR可以定义为:

为了获得UMSE和UPSNR所需的噪声参考,本发明采用邻域子采样器,从噪声地震数据中生成四个噪声参考S

基于上述自监督地震数据去噪方法以及上述定量评价指标,在合成数据集和实际地震数据集上的测试结果分别如下:

合成数据集

本发明选取了SEG的公开数据集,包含了七个模型的叠前数据集(单炮记录),训练集为前6个模型,根据以下规则生成,具体来说,本发明选取了炮间隔为50的单炮记录,以避免极其相似的单炮记录。随后,对所选的炮集进行振幅归一化,并用滑动窗口(大小128×128,步长为64)进行裁剪。值得注意的是,裁剪后的数据存在几乎全是零的情况,这对训练过程没有帮助。因此,将每个裁剪数据(无噪数据)的方差与一个预定的阈值进行比较,如果其方差大于阈值,则保留,反之亦然。最后,采用常见的数据增强技术,如水平和垂直翻转,以进一步提高训练集的多样性,这使得训练集的数量增加了两倍。最后,将方差为σ∈(10,40)的高斯噪声添加到裁剪后的无噪地震数据中。按照上述生成规则,生成了10,000个成对的训练集,并采用不同的炮间隔生成了1500个成对的验证集。值得注意的是本发明仅使用训练集的噪声数据进行训练。

图4(a)显示了测试集的无噪声地震数据,加入标准差为25的高斯噪声得到相应的噪声地震数据,PSNR和SSIM分别为20.17和0.32(相对于无噪声数据)(图4(b))。图4(b)、(c)、(e)和(f)显示了通过小波阈值去噪、f-x反卷积、DnCNN和本发明去噪的地震数据,PSNRs分别为25.85、29.01、31.32和30.72,SSIMs分别为0.50、0.75、0.85和0.9。总的来说,所提出的去噪算法在PSNR(30.56)和SSIM(0.9)方面优于传统方法,并且与有监督的DnCNN相比,表现相似性能。接下来,还通过绘制一个感兴趣的信号区域的残差图像(去噪后的结果与噪声数据之间的差异)来进行视觉检查,如图5所示。在观察残差结果时(图5(d),(f)),一些地震事件(有效信号)明显存在于由小波阈值去噪和f-x去卷积算法去除的噪声中。值得注意的是,所提出的自监督和监督的DnCNN方法都成功地减弱了随机噪声,并且在残余图像中没有明显的信号泄漏(地震事件)。

此外,为了说明无监督指标(UMSE和UPSNR)的可行性,本发明在上述合成的训练集进行实验。具体来说,在训练过程中,本发明分别计算了验证集上每轮预测结果的监督指标(MSE和PSNR)和无监督指标(UMSE和UPSNR)。训练过程的评价指标变化如图6所示。可以看出,无监督(UMSE和UPSNR)和有监督指标(MSE和PSNR)之间存在差异。造成这种差异的原因是由邻居子采样产生的每个噪声参考所对应的地面真相的差异。由于地震记录在时间和空间上的相关性,这种差异比自然图像更明显。此外,一个值得注意的发现是,有监督和无监督的指标具有高度相似的训练趋势。因此,无监督指标(UMSE和UPSNR)在实践中可被视为MSE和PSNR的估计者,从而能够对仅由噪声地震数据训练的去噪方法进行无监督评估。

实际地震数据集

本发明选取Penobscot数据集,这是一个由500条主测线和750联络测线组成的三维地震叠后数据集,该数据包含了大量的偏移假像和随机噪声。图7显示了本发明的降噪结果,并将其与传统小波阈值降噪结果进行比较。由于真实数据中不存在无噪声的地震数据,这导致计算PSNR和SSIM并非易事,因此我们采用局部放大的方法来观察去噪结果,并利用无监督的指标(UPSNR)来确定不同方法的噪声衰减能力(图7)。结果表明,使用小波阈值算法的去噪结果仍然包含噪声(图7c、f中UPSNR为24.79),这在图8b和d的局部放大中尤为明显。相比之下,使用所提议算法重建的地震剖面几乎没有噪声(偏移伪影和随机噪声,图7e中UPSNR达到25.75),可以清楚地显示出野外数据中较弱的地震信号(图8中的箭头)。

下面对本发明提供的一种自监督地震数据去噪装置进行描述,下文描述的自监督地震数据去噪装置与上文描述的自监督地震数据去噪方法可相互对应参照。

如图9所示,一种自监督地震数据去噪装置,包括以下模块:

预处理模块001,用于对地震数据预处理;

领域子采样模块002,用于将每个预处理后的地震数据依次分成多个斑块,然后随机从每个斑块的相邻位置抽取地震数据,按照斑块顺序分别堆叠生成噪声训练图像对S

算法构建模块003,用于构建一种自监督去噪算法;

模型训练模块004,用于根据生成的噪声训练图像对S

数据去噪模块005,用于使用训练完成的自监督去噪网络模型对工区的含噪地震数据进行去噪,获得高信噪比的地震数据。

如图11所示,示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610、通信接口620、存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行上述自监督地震去噪方法的步骤,具体包括:地震数据预处理;将每个预处理后的地震数据分成多个斑块,然后随机从每个斑块的相邻位置抽取地震数据,依次分别叠加生成噪声训练图像对S

此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random15 Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

又一方面,本发明实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述自监督地震去噪方法的步骤,具体包括:地震数据预处理;将每个预处理后的地震数据分成多个斑块,然后随机从每个斑块的相邻位置抽取地震数据,依次分别叠加生成噪声训练图像对S

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 多分量地震数据矢量去噪方法及多分量地震数据矢量去噪装置
  • 一种地震记录迭代型组合域去噪方法及系统
  • 一种基于深度张量神经网络的无监督地震数据去噪方法
  • 地震数据去噪的模型训练方法、地震数据去噪方法及装置
技术分类

06120116337000