掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据挖掘的成矿系统源区探测方法、系统及介质

文献发布时间:2024-07-23 01:35:21


基于大数据挖掘的成矿系统源区探测方法、系统及介质

技术领域

本发明涉及地质矿产勘查技术领域,特别是涉及一种基于综合地球物理大数据挖掘的成矿系统源区探测方法、系统及介质。

背景技术

成矿系统是一个综合的、包括各种地球过程和因素的自然系统,通过对成矿系统的研究可以揭示矿床形成的机制和规律,为矿产资源勘查和开发提供科学依据。翟裕生等提出成矿系统是在“一定时空域中由控制矿床形成、变化和保存的全部地质要素和成矿动力学过程,以及所形成的矿床系列、异常系列构成的整体,是具有成矿功能的一个自然系统”,其中包括控矿要素、成矿作用过程、形成矿床以及成矿后变化和保存4个方面基本内容。吕庆田等对国内外学者理论进行梳理,从成矿流体过程、物质汇聚能量、元素富集过程、多要素耦合和成矿动力过程等不同角度系统总结了成矿系统概念(模型),认为其由一系列相互关联的要素组成,包括成矿系统源区、通道和富集场所,定义地球动力学背景或构造事件和有利的岩石圈结构为成矿系统源区。

目前,对成矿系统源区的探测主要包括地质手段和地球物理手段。

地质手段一般利用地球化学主、微量分析、同位素和低温热年代研究找矿区域(即研究区域)地质背景相关信息,利用探槽、钻孔或者地球化学元素异常圈定地表或者近地表元素异常来确定矿产的空间展布,但是这一方法存在以下约束:(1)化探异常需要在地表取样,图幅(即研究区域)范围内取样密度受限,导致异常范围划分不准确;(2)取样主要在地表或近地表,样品易受到早期地质运动作用叠加影响,不能准确反应特定地质年代范围内多期次地质作用,对地球动力学垂直和水平运动过程约束不能综合显示;(3)地表样品可能是转石而非原地,导致样品分析无意义;(4)采样范围受约束,不能全空间范围采样,因此不能完成三维地球化学异常显示;(5)地表露头受到挤压抬升-风化剥蚀影响,也会受到伸展挤压-沉积作用影响,因此同一研究区域范围内,受走滑、抬升和沉降作用影响,难以圈定同一地层存在异常;(6)地球的地质结构和演化过程非常复杂,不同地区的地质背景和构造特征各不相同,因此,针对不同研究区域的成矿系统研究需要考虑到当地的地质复杂性,包括岩性、构造变形、岩浆活动等因素对矿产形成的影响;(7)成矿系统研究往往需要在广阔的时间和空间尺度上进行推断和分析,地质过程的演化和矿床形成的时间跨度可能非常长,并且矿床的空间展布可能呈现出复杂的模式,因此,研究人员需要充分理解和考虑时间和空间尺度上的约束;(8)地质手段所得到的数据和结果通常伴随着一定的不确定性,数据的解释和分析过程中,可能存在多种因素的相互影响和干扰,使得对矿床展布的解释存在一定的模糊性和不确定性。

地球物理手段通常利用重力、磁法、电法、地震等手段对研究区范围内不同属性特征异常进行研究,划分异常空间展布状态,但是这一方法存在以下约束:(1)根据地球物理不同方法波场传播理论,高频分辨率高,但是识别深度浅,低频识别深度深,但是分辨率低;(2)不同地球物理数据对应相同地下结构属性特征有差异;(3)地球物理探测结果主要展示地下结构现今状态,不能直观显示与现有状态相关地质事件;(4)地球物理探测结果不具有地质年代学意义;(5)地球物理受方法约束存在假异常或者异常稳定性及其分辨率不能达到不同勘查阶段需求;(6)已有地球物理手段以显示异常为基础,对研究区的地球动力学背景研究较少;(7)对综合地球物理联合解释研究程度较低。

近年来,随着成矿系统研究的深入,对成矿系统源区的探测至关重要,浅部(场所)服务于找矿勘查,如图1所示,成矿系统源区研究专注于岩石圈结构及其动力学背景,成矿系统源区探测则针对地球动力学背景或构造事件和有利的岩石圈结构服务于在哪里找矿、找什么矿的问题。随着计算机的发展和数据处理方法、技术的提升,利用不同地球物理方法技术组合手段有所发展,但是由于成矿系统源区的差异,综合地球物理探测这一名词所代表的勘查手段差异明显,方法差异较大,且缺少针对海量综合地球物理数据隐含成矿类型、矿种组合和分布关联信息内容的研究。

因此,提供一种有别于综合地球物理找矿概念和技术的基于综合地球物理大数据挖掘的固体金属矿产资源成矿系统源区探测方法是本领域技术人员亟需解决的问题。

发明内容

本发明的目的是提供一种基于大数据挖掘的成矿系统源区探测方法、系统及介质,可确定目标研究区域的岩石圈结构、可能的地球动力学事件和成矿组合及分布,提高了成矿系统源区探测的效率、全面性和准确性,支撑找矿勘查和靶区优选,降低勘探风险。

为实现上述目的,本发明提供了如下方案。

一种基于大数据挖掘的成矿系统源区探测方法,包括:获取在设定时间段内对目标研究区域进行探测所得到的探测数据;所述探测数据包括重力数据、磁力数据、电法数据和地震数据,其中,所述地震数据包括人工地震数据和天然地震数据;对所述目标研究区域进行网格划分,并对所述探测数据进行特征提取,得到所述目标研究区域中每一个网格的位置数据和特征数据;所述位置数据包括所述网格的经度、纬度和深度;所述特征数据包括所述网格的重力特征数据、磁力特征数据、电法特征数据和地震特征数据;对所有所述网格的特征数据进行关联分析,得到若干个关联关系集合;所述关联关系集合包括具有关联关系的多个所述网格的位置数据和特征数据;对于每一所述关联关系集合,对所述关联关系集合进行聚类分析,得到若干个类簇;对于每一所述类簇,以所述类簇作为输入,利用训练好的分类器确定所述类簇对应的探测结果,所有所述类簇的探测结果组成所述目标研究区域的源区探测结果;所述源区探测结果包括所述目标研究区域的岩石圈结构、地球动力学事件和成矿组合及分布。

在一些实施例中,在对所述目标研究区域进行网格划分之前,还包括:对所述探测数据进行数据预处理,得到预处理后数据,并以所述预处理后数据作为新的探测数据;所述数据预处理包括去除异常、缺失和低信噪比数据以及数据格式统一。

在一些实施例中,所述重力特征数据为布格重力异常;所述磁力特征数据为化极后磁异常;所述电法特征数据为电阻率和极化率;所述地震特征数据为速度和振幅。

在一些实施例中,在对所有所述网格的特征数据进行关联分析之前,还包括:对所有所述网格的特征数据进行归一化,得到归一化后数据,并以所述归一化后数据作为新的特征数据。

在一些实施例中,对所有所述网格的特征数据进行关联分析,得到若干个关联关系集合,具体包括:按照预设组合原则确定多个初步组合;对于每一所述初步组合,确定属于所述初步组合的网格,将所有属于所述初步组合的网格的特征数据组成数据集,利用Apriori关联分析算法对所述数据集进行分析,得到支持度和置信度,判断所述支持度是否大于支持度阈值且所述置信度是否大于置信度阈值,若是,则属于所述初步组合的所有网格为具有关联关系的网格,属于所述初步组合的所有网格的位置数据和特征数据组成关联关系集合。

在一些实施例中,对所述关联关系集合进行聚类分析,得到若干个类簇,具体包括:利用层次聚类算法对所述关联关系集合进行聚类分析,得到若干个类簇。

在一些实施例中,所述训练好的分类器为决策树、支持向量机或神经网络。

在一些实施例中,在得到所述源区探测结果之后,还包括:对所述源区探测结果进行可视化展示。

一种计算机系统,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述一种基于大数据挖掘的成矿系统源区探测方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于大数据挖掘的成矿系统源区探测方法的步骤。

根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明用于提供一种基于大数据挖掘的成矿系统源区探测方法、系统及介质,在获取对目标研究区域进行探测所得到的重力数据、磁力数据、电法数据、人工地震数据和天然地震数据后,依次对重力数据、磁力数据、电法数据、人工地震数据和天然地震数据进行特征提取、关联分析、聚类分析和分类处理,得到目标研究区域的源区探测结果,源区探测结果包括目标研究区域的岩石圈结构、地球动力学事件和成矿组合及分布,从而可确定目标研究区域的岩石圈结构、地球动力学事件和成矿组合及分布,基于地球动力学事件和岩石圈结构来解决在哪里找矿、找什么矿的问题,提高了成矿系统源区探测的效率、全面性和准确性,支撑找矿勘查和靶区优选,降低勘探风险。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所提供的成矿系统研究内容示意图。

图2为本发明实施例1所提供的探测方法的方法流程图。

图3为本发明实施例1所提供的探测方法的技术流程示意图。

图4为本发明实施例1所提供的大地电磁方法和人工地震在澳大利亚造山型金矿的成矿系统源区探测结果;其中,图4(a)为60km深度的电阻率;图4(b)为将中心区域扩大到20公里纵深的电阻率;图4(c)为二维地震深度转换图像显示所有主要矿床下反射率降低的区域。

图5为本发明实施例1所提供的综合地球物理探测数据示意图;其中,图5(a)为目标研究区域地质示意图;图5(b)为目标研究区域布格重力异常示意图;图5(c)为目标研究区域化极后磁异常示意图;图5(d)为目标研究区域天然地震数据示意图;图5(e)为目标研究区域电法数据示意图;图5(f)为目标研究区域人工地震数据示意图。

图6为本发明实施例1所提供的层次聚类示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于大数据挖掘的成矿系统源区探测方法、系统及介质,可确定目标研究区域的岩石圈结构、可能的地球动力学事件和成矿组合及分布,提高了成矿系统源区探测的效率、全面性和准确性,支撑找矿勘查和靶区优选,降低勘探风险。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1:本实施例用于提供一种基于大数据挖掘的成矿系统源区探测方法,如图2和图3所示,包括以下步骤。

S1:获取在设定时间段内对目标研究区域进行探测所得到的探测数据;所述探测数据包括重力数据、磁力数据、电法数据和地震数据,其中,所述地震数据包括人工地震数据和天然地震数据。

在地球物理学中,地球重力场数据和磁场的数据均属于位场数据,这两个场都是由地球内部的物质分布引起的,即重力数据和磁力数据属于位场数据。电法数据是通过电法勘探所获得的数据,电法勘探是根据地壳中不同岩层或矿石之间存在的电磁性质差异,利用一系列技术装置观测与研究天然存在的或人工建立的地下电场或电磁场的分布规律,达到研究地质构造、找矿和解决其他地质问题的一组地球物理方法技术。如图4所示,图4(a)、图4(b)、图4(c)中,WW、OD和VC分别代表维尔德井矿(WirrdaWell)、澳大利亚奥林匹克坝(Olympic Dam)和沃肯矿(Vulcan)的主要矿点,R1和R2代表高电阻率区域,C1、C2和C3代表高电导率区域,CDP(Common Depth Points)代表地震共深度点叠加点位号,左侧为太古代高勒克拉通,右侧为元古界活动带,其特点是电阻率非常高,深度超过60公里,高电导率区域C3位于太古代高勒克拉通的边缘,深度为中下地壳15-40公里处,此外,三个狭窄的高电导率区域(低电阻率区域)C2从高电导率区域C3延伸到地表,将下地壳与主要矿床连接起来。基于图4可知,大地电磁方法可以用于进行成矿系统源区探测。

地震数据包括人工地震数据和天然地震数据。

本实施例搜集地面、航空和海洋探测的重力、磁力、电法和地震(人工地震和天然地震)等地球物理数据,如图5所示,具体可利用不同数据来源获取不同种类的数据,保证数据来源和种类的全面性,完成数据获取和下载过程。

在此,对各种数据详细的数据搜集方式和网站进行介绍:(1)重力数据、磁力数据和天然地震数据可以通过公知网站获取,具体的,通过重力开源数据获取网址(http://icgem.gfz-potsdam.de/home)来获取在设定时间段内对目标研究区域进行探测所得到的重力数据;通过磁力开源数据获取网址(https://www.ncei.noaa.gov/products/earth-magnetic-model-anomaly-grid-2)来获取在设定时间段内对目标研究区域进行探测所得到的磁力数据;在国家地震科学数据中心(网址为https://data.earthquake.cn/)或者美国地质调查局网站(网址为https://earthquake.usgs.gov/earthquakes/search/)下载地震目录文件,通过地震目录文件筛选出目标研究区域在设定时间段内发生的目标地震事件,目标地震事件对应的天然地震数据向地震科学国际数据中心(网址为http://www.esdc.ac.cn/)、国家地震科学数据中心(网址为https://data.earthquake.cn/index.html)、自然资源部深地探测科学数据中心(网址为https://dedc.geoscience.cn/#/home-page)和美国地震学研究联合会(网址为https://ds.iris.edu/ds/nodes/dmc/)申请,以获取在设定时间段内对目标研究区域进行探测所得到的天然地震数据。因为本实施例主要关注岩石圈尺度深部结构和动力学过程,数据开源程度相对较高,只需在相应的数据网页内下载即可,数据有保障。除此之外,另外搜集关于目标研究区域的已公开发表文章中的补充材料中的重力数据、磁力数据和天然地震数据,数据量越多越好。(2)电法数据和人工地震数据可通过自行探测和阅读已公开文献来获取,阅读已公开文献是指搜集关于目标研究区域的已公开发表文章中的补充材料中的电法数据和人工地震数据,以获取电法数据和人工地震数据。通过上述过程,即可完成数据准备。

优选的,在对目标研究区域进行网格划分之前,本实施例的探测方法还可以包括:对探测数据进行数据预处理,得到预处理后数据,并以预处理后数据作为新的探测数据,数据预处理包括去除异常、缺失和低信噪比数据以及数据格式统一。

其中,数据预处理包括数据清洗(即去除异常、缺失和低信噪比数据)和数据格式转换(即数据格式统一)。

数据清洗:在获得探测数据后,先对探测数据进行数据清洗,去除异常、缺失和低信噪比数据,保证数据质量。重力数据、磁力数据和电法数据需要先由时间域转换到频率域,然后再进行数据清洗,地震数据在时间域根据波形、振幅和三分量差异进行数据清洗。对探测数据进行数据清洗的处理软件繁多,可根据个人使用习惯选择合适软件来去除异常、缺失和低信噪比数据,比如,重力数据可使用matlab或者开源程序Tesseroids、GeoBO等去除异常、缺失和低信噪比数据;磁力数据可使用matlab或者开源程序Tesseroids、GeoBO等去除异常、缺失和低信噪比数据;电法数据可利用Maxwell、winglink、AGRS GeoProbe、Resix、UBC等程序去除异常、缺失和低信噪比数据;人工地震数据可使用商业软件Omega或者Geoeast等数据处理软件去除异常、缺失和低信噪比数据;天然地震数据可使用Sac、Obspy或者geopsy等开源软件去除异常、缺失和低信噪比数据。

数据格式转换:由于同种类型数据来源不同,可能格式也存在差异,为了便于后期数据处理,将不同来源的数据格式统一,保证后续数据梳理和处理的便捷性。在完成数据清洗后,重力数据和磁力数据统一为文本文件(ASCAII),包含数据幅值(重力、磁力)和采集坐标,电法数据统一为时间域文本文件(ASCAII),包含数据幅值(电流、电压)和采集坐标,人工地震数据统一为segy格式,天然地震数据统一为sac格式。然后对各类数据进行数据格式转换,以将各类数据的数据格式进行统一,可统一以CSV、Excel或者numpy格式存储。

S2:对所述目标研究区域进行网格划分,并对所述探测数据进行特征提取,得到所述目标研究区域中每一个网格的位置数据和特征数据;所述位置数据包括所述网格的经度、纬度和深度;所述特征数据包括所述网格的重力特征数据、磁力特征数据、电法特征数据和地震特征数据。

本实施例对目标研究区域进行网格划分是对目标研究区域进行三维网格划分,得到多个网格,在完成网格划分后,每一网格都具有位置数据,包括网格的经度、纬度和深度。

在进行特征提取之前,本实施例先进行特征定义:地球物理数据是通过测量不同地区的物理性质来获取的数据,这些数据可以提供有关地下结构和地球物理属性的信息,以及它们隐含的区域地下结构和地球物理属性特征。经过数据预处理后,格式统一的重力、磁力、电法和地震这些地球物理数据中分别隐含有区域地下结构和地球物理属性特征,因此要明确定义综合地球物理数据(即重力数据、磁力数据、电法数据和地震数据)中的特征。按照常规地球物理要求,布格重力异常(Δg)是重力的属性特征、磁场大小(M)是磁力的属性特征、电阻率(Ω)和极化率(H)是电法的属性特征、速度(V)和振幅(A)是地震的属性特征,本实施例中,布格重力异常是做了布格校正后区域异常的总和,是一般重力数据处理的基础,因此定义布格重力异常(Δg

本实施例的特征提取过程包括:利用不同算法和软件分别对各个数据进行特征提取。对于重力数据,本实施例以重力数据为输入,使用Harmonic开源程序获得研究区密度异常分布,即得到重力特征数据(布格重力异常Δg

优选的,在对所有网格的特征数据进行关联分析之前,本实施例的探测方法还包括:对所有网格的特征数据进行归一化,得到归一化后数据,并以归一化后数据作为新的特征数据。

特征归一化的过程具体包括:分别对重、磁、电、震的特征数据进行归一化,使得各类数据特征值范围均为0-1,保证特征数据具有相同的均值和标准差,避免不同特征数据权重大小带来差异。考虑到由于海量综合地球物理数据不一定服从正态分布,为了降低极端异常数据的影响,本实施例选择Robust归一化来对特征数据进行归一化,此方法主要使用特征数据的第一四分位数(Q1,数据大小的前25%)和第三四分位数(Q3,数据大小的前75%),Robust归一化的表达式为:x’=(x-Q1)/(Q3-Q1),其中,x’为归一化后特征数据,x为特征数据,Q1为特征数据的第一四分位数,Q3为特征数据的第三四分位数。基于此,本实施例可对于每一种特征数据(重力特征数据、磁力特征数据、电法特征数据和地震特征数据),利用上述Robust归一化的表达式对该特征数据进行归一化,这样就可以保证各个特征数据种类的权重比例一致,避免了某一特征数据权重过大或者过小的影响,同时可以提升后续算法的实现效率。归一化后数据T

S3:对所有所述网格的特征数据进行关联分析,得到若干个关联关系集合;所述关联关系集合包括具有关联关系的多个所述网格的位置数据和特征数据。

具体的,对所有网格的特征数据进行关联分析,得到若干个关联关系集合,可以包括如下步骤。

(1)按照预设组合原则确定多个初步组合。

如果有n个元素,选取r个进行组合,可记为C(n,r),计算方式为C(n,r)=n!/r!*(n-r)!。根据数学排列组合,初始关联关系集合数目为C(6,2)+C(6,3)+C(6,4)+C(6,5)+C(6,6)=51种,但本实施例要保证重、磁、电、震每类特征数据均需要出现至少一种,即至少同时出现一种重力特征数据、一种磁力特征数据、一种电法特征数据和一种地震特征数据,因此初始关联关系集合数目可达到的上限总数为C(6,4)+C(6,5)+C(6,6)=36种,又考虑每种特征数据都存在高值[0.7,1]、中值(0.3,0.7)和低值[0,0.3],()代表开区间,[]代表闭区间,则初始关联关系集合的上限为C(6,4)*3*3*3*3+C(6,5)*3+C(6,6)*3=456种,本实施例即按照上述原则,确定456种初步组合(即初始关联关系集合)。选择4种特征数据进行关联组合时,C(6,4)需考虑每种特征数据均有高、中、低三种值,因此需要*3*3*3*3,选择5种特征数据进行关联组合时,由于前面C(6,4)已经进行了4种组合关联,C(6,5)只需考虑第五种特征数据的高、中、低三种值,因此需要*3,同理,C(6,6)也只需考虑第六种特征数据的高、中、低三种值,因此需要*3。

(2)对于每一初步组合,确定属于初步组合的网格,将所有属于初步组合的网格的特征数据组成数据集,利用Apriori关联分析算法对数据集进行分析,得到支持度和置信度,判断支持度是否大于支持度阈值且置信度是否大于置信度阈值,若是,则属于初步组合的所有网格为具有关联关系的网格,属于初步组合的所有网格的位置数据和特征数据组成关联关系集合。

本实施例的关联数据挖掘包括:在生成重、磁、电、震的归一化后数据T

设置支持度和置信度阈值:Apriori关联分析算法的基本思想是利用“先验”信息来减少搜索空间,其核心思想有两个关键概念:支持度和置信度,支持度是衡量一个项集A在数据集中出现的频率,支持度越高,说明项集的出现越频繁,支持度(A)=项集A/数据集×100;置信度是衡量如果发生了A,那么B也发生的概率,置信度(A→B)=支持度(A∪B)/支持度(A)×100%。本实施例根据需求和区域综合地球物理数据集的内容来设置合适的支持度阈值和置信度阈值,这样可以控制关联内容的数量和质量,具体的,支持度阈值定义归一化后特征矩阵{T}内各规则所占比例,置信度阈值定义与区间采样数量有关,为排除随机性,本实施例定义支持度阈值为50%,置信度阈值为关联规则中采样数量的75%,即数据集内数据的75%,暗示这一规则存在一定的关联性。

具体的,本实施例对于每一初步组合,如果网格的特征数据与初步组合相符,则认为该网格属于初步组合,比如,初步组合定义需要包括均处于高值区间的布格重力异常、化极后磁异常、电阻率和速度,则若一个网格的特征数据的布格重力异常、化极后磁异常、电阻率和速度均处于高值区间,则该网格属于初步组合。

本实施例在筛选出关联关系集合后,可进一步解释关联关系集合:解释关联关系集合,筛选出不同地球物理属性差异对应成矿系统源区的关系,比如:k>=20km处基性岩体表现出高布格重力异常(Δg

S4:对于每一所述关联关系集合,对所述关联关系集合进行聚类分析,得到若干个类簇。

本实施例中,对关联关系集合进行聚类分析,得到若干个类簇,可以包括:利用层次聚类算法对关联关系集合进行聚类分析,得到若干个类簇。

层次聚类算法具体包括:在对关联关系集合进行聚类分析时,选择层次聚类算法,距离度量方法使用马哈拉诺比斯距离(Mahalanobis Distance),区分多种地球物理数据异常为不同的类别。马哈拉诺比斯距离是一种考虑特征之间相关性的距离度量方法,特别适用于多维数据。利用sklearn.cluster对每一关联关系集合进行聚类分析,具体操作步骤为:(1)将关联关系集合中的每一个网格的特征数据作为一个单独的簇,计算两个簇之间的马哈拉诺比斯距离;(2)对距离最小的两个簇进行合并,构成一个新簇;(3)计算新簇与其他各簇的距离,形成层次结构,直到簇的个数为1,形成一个树状的聚类结构,被称为“树状图”或“树状图谱”,如图6所示。根据聚类结构,可以选择一个合适的层次(即聚类数目)对聚类结构进行切割,来确定最终的类簇。

本实施例中,不同关联关系集合的聚类数目根据需求而定,可以相同,也可以不同。聚类数目的选择过程可以包括:使用不同的聚类数目。针对不同关联关系集合,参考已有地球物理数据处理结果和基础地质资料定义不同聚类数目及其地质学意义。比如,对于全规则{T}=Δg+M+Ω+H+V+A,聚类数目可为2,此时可以用来区分伸展和挤压背景,也可以区分地幔物质底侵和下地壳拆沉,还可以判断地壳的增厚与减薄,对应地质意义需要参考区域基础地质研究;同理,聚类数目可为3,此时可以用来区分幔源物质上涌、下地壳部分熔融、中上地壳多级岩浆房、物质来源(幔源为主、壳源为主和壳幔混合为主)等;对于规则{T

本实施例还可进行聚类结果分析:分析聚类结果,利用特征向量识别相似地质特征的多种地球物理数据结果,综合判断包括但不限于地壳增厚与减薄、中地壳有关的拆离构造、中下地壳有关的深大断裂、下地壳与成矿有关的部分熔融和多级岩浆房、地幔岩浆底侵、岩石圈地幔拆沉、物质来源和与这些地质过程相关的地球动力学背景(伸展、挤压)及其背景转换等内容。

S5:对于每一所述类簇,以所述类簇作为输入,利用训练好的分类器确定所述类簇对应的探测结果,所有所述类簇的探测结果组成所述目标研究区域的源区探测结果;所述源区探测结果包括所述目标研究区域的岩石圈结构、地球动力学事件和成矿组合及分布。

岩石圈位于地球的表层,薄而坚硬。岩石圈在软流圈之上,包含部分上地幔和地壳。地壳在地幔之上,由莫霍不连续面作为分界。根据板块构造学说,岩石圈并非整体一块,而是由许多板块组成。

本实施例中,训练好的分类器为决策树、支持向量机或神经网络。

具体的,分类器选择包括:参考区域地质,使用scikit-learn选择决策树、支持向量机、神经网络等分类方法,这类分类方法都适合高维度、非线性、多类别、大规模数据集。其中,决策树简单直观,易于理解和解释,不需要对数据做严格的预处理,对于非线性关系的建模效果较好,可以使用Python库中scikit-learn提供的DecisionTreeClassifier类来构建决策树;支持向量机(SVM)在高维空间中表现良好,对于非线性问题有较强的泛化能力,可以使用不同的核函数适应不同类型的数据,可以使用Python库中scikit-learn提供的SVC类来构建支持向量机;神经网络可以学习复杂的非线性关系,适用于大规模数据和高维空间,具有较强的泛化能力,可以使用TensorFlow、Keras或者PyTorch库来构建神经网络。基于此,可建立相应的分类器,分类器包括决策树、支持向量机和神经网络。

根据特定目标,参考基础地质资料划分标签,如将不同地质单元划分为地质标签,也可以根据成矿组合分类,划分不同的成矿组合标签,例如Cu、Au及其组合矿床,或者W、Sn、Nb、Ta等矿床,亦或者U、Ag、Pb、Zn等矿床。为了增加可迁移性,对已有聚类结果进行地质标签和成矿组合标签分类,具体将已有研究区域地球物理结果整理为S4的样本类簇和深部地质背景数据标签集(包括地质标签和成矿组合标签),得到综合地球物理数据集,将综合地球物理数据集划分为合适的训练集(占综合地球物理数据集的0.8)和测试集(占综合地球物理数据集的0.2),用来训练和评估分类器,具体使用训练集训练分类器,使用测试集进行模型评估和性能验证,完成模型训练和评估后,即可得到训练好的分类器。

以类簇作为输入,利用训练好的分类器即可确定类簇对应的探测结果,探测结果包括该类簇对应的地质结果和成矿组合结果,地质结果包括岩石圈结构和地球动力学事件,成矿组合结果包括成矿组合及其分布,所有类簇的探测结果组成目标研究区域的源区探测结果,源区探测结果包括目标研究区域的岩石圈结构、地球动力学事件和成矿组合及分布。

本实施例在确定源区探测结果后,即可进行大数据挖掘结果的空间整合,便于进行异常的空间展示和分析,明确与成矿系统源区有关的岩石圈结构、地球动力学事件和矿床组合及分布,比如,矿床组合中Cu、Au及其组合矿床源区对应空间位置分布,地幔底侵和下地壳拆沉区域的空间对应位置。又如,伸展背景环境下,发生地幔上涌(拆沉+底侵)区域易成为Cu、Au成矿系统矿富集区域,与花岗岩有关的下地壳局部熔融区域易成为W、Sn、Nb、Ta等矿床富集区域,活动程度低区域易成为U、Ag、Pb、Zn矿富集区域。还可对地下异常特征及其关联分析内容进行显示,如地幔底侵对应布格重力异常(Δg)增大、波速异常(V)增高、低阻(Ω)特征,拆沉对应地壳低布格重力异常(Δg)、低速(V)、低阻(Ω)特征。

可选的,在得到源区探测结果之后,本实施例的探测方法还包括:对源区探测结果进行可视化展示。具体的,三维建模与可视化包括:大数据挖掘后异常结果的整合,SVG或者.nc或者python下.npy格式保存均可,便于在三维软件中用体像素或者点像素展示,以完成三维建模。再使用三维可视化工具(商业、来源软件均可),直观展示横向分块、纵向分层以及地质异常体的分布状态及其与对应地球动力学事件和可能的成矿组合分布的关系,以完成可视化,实现综合地球物理大数据挖掘的成矿系统源区探测。

现有地质矿产勘查以及深部找矿以见矿为导向,主要关注地表2km以浅区域是否存在金属矿产。对矿产相关的成矿模式研究主要集中在浅部上地壳范围内,而对深部(中、下地壳、岩石圈尺度)有关的物质、流体和能量来源及其相关的地球动力学背景研究甚少,尤其是地壳增厚与减薄、中下地壳有关的深大断裂、下地壳与成矿有关的部分熔融和多级岩浆房、地幔岩浆底侵、岩石圈地幔拆沉和与这些地质过程相关的地球动力学背景及其背景转换等研究程度较低,但上述内容均属于成矿系统源区探测范畴,服务于成矿系统研究。另外,现有“综合地球物理探测”研究表达含义并不一致,其代表的地球物理方法组合各异,未能在实际勘查中进行概念统一和探测方法组合固定,对于不同属性重力、磁法、电法、地震地球物理海量数据及其之间隐藏成矿背景和矿种组合等关联信息尚未有相关研究内容。且传统的综合地球物理探测分别对重力、磁法、电法和地震数据进行单一方法或不同种类方法的组合,并未有统一定义方法组合,也未有对成矿系统源区进行大数据挖掘的先例。

本实施例提供一种有别于传统深部找矿和综合地球物理探测的方法,本实施例以成矿系统理论中源区所包含内容(地球动力学背景或构造事件和有利的岩石圈结构)为探测对象,利用重力、磁法、电法和地震海量综合地球物理数据对深部岩石圈结构尺度进行横向分块、纵向分层以及异常特定地质体研究,并利用大数据挖掘分析不同数据类型之间隐含的结成矿背景和矿种组合等关联信息内容。传统深部探测找矿目标是定位矿体深部延伸方向和空间展布,深度一般不大于2km;本实施例探测内容和目标以地壳及岩石圈地幔为探测尺度,包括但不限于地壳增厚与减薄、中地壳有关的拆离构造、中下地壳有关的深大断裂、下地壳与成矿有关的部分熔融和多级岩浆房、地幔岩浆底侵、岩石圈地幔拆沉和与这些地质过程相关的地球动力学背景及其背景转换等研究。

本实施例公开了一种基于大数据挖掘的综合地球物理成矿系统源区探测方法,该方法利用大数据挖掘手段,研究综合地球物理探测及其数据隐含关联关系,包括重力、磁力、电法、天然地震和人工地震等海量数据,结合区域地质研究基础,对研究区域的成矿系统源区背景进行全面分析和解释,通过对岩石圈三维结构、大尺度异常特征、区域构造特征等因素的综合地球物理大数据挖掘研究,在岩石圈尺度上进行“横向分块”、“纵向分层”和“异常特征”研究,通过大数据挖掘不同属性异常特征及其隐含关联关系探讨可能存在的特定构造背景和地球动力学过程,根据成矿系统源区理论快速确定研究区隐含的成矿背景和成矿组合关联信息。本实施例降低了综合地球物理探测研究的时间和人力成本、降低了人的主观影响;提高了成矿系统源区研究的效率、全面性和准确性;显著增强了综合地球物理数据的隐含关联关系研究;支撑找矿勘查和靶区优选,降低勘探风险。

本实施例的探测方法结合先进的数据处理和分析算法,实现对海量地球物理数据的高效处理和大数据挖掘,提取关键特征及其隐藏域大数据中可能存在的模式和关联关系,建立成矿系统源区的预测模型,实现对潜在矿产资源成矿背景和成矿组合的预测,通过数据可视化和交互式分析工具,可以直观地利用和挖掘地球物理数据,从而有效地指导成矿系统导矿通道和富集场所的研究工作以及后期的找矿勘查和靶区优选。该方法的应用能够提高矿产资源成矿系统探测的效率、全面性和准确性,减少勘查成本和风险,它为成矿系统源区的探测提供了一种先进的技术手段和可迁移技术方法,有助于指导科研单位和地质生产单位的决策制定,优化资源配置,并促进矿产资源的快速开发和可持续利用。

实施例2:本实施例用于提供一种计算机系统,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现实施例1所述一种基于大数据挖掘的成矿系统源区探测方法的步骤。

实施例3:本实施例用于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例1所述一种基于大数据挖掘的成矿系统源区探测方法的步骤。

本说明书中每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 基于大数据的脱硫装置脱水系统优化控制方法、系统及计算机可读介质
  • 基于视频的目标探测追踪方法、系统、介质及设备
  • 基于电力大数据的新型电力系统多源数据挖掘方法
  • 基于多源大数据的时空过程智能分析挖掘方法与系统
技术分类

06120116678201