掌桥专利:专业的专利平台
掌桥专利
首页

一种基于CINet网络模型的陷落柱识别方法、系统及终端设备

文献发布时间:2024-05-31 01:29:11


一种基于CINet网络模型的陷落柱识别方法、系统及终端设备

技术领域

本发明涉及隐蔽致灾体识别领域,尤其涉及一种基于CINet网络模型的陷落柱识别方法、系统及终端设备。

背景技术

矿区地质条件复杂,高效、准确的陷落柱识别至关重要。隐蔽致灾体的识别目前常用的方法是地球物理勘探和地球化学勘探方法。传统三维地震勘探方法得到的多属性数据对隐蔽致灾体的识别提供了参考,但随着勘探规模的扩大、生成数据的不断积累,传统的人工解释难以满足实际生产需要。

近年随着计算机技术的飞速发展,计算机领域与传统地质勘探领域开始交流互通,深度学习进入地质构造勘探领域。技术发展使得获取的地质数据信息愈加丰富,为研究提供了丰富的数据支撑。深度学习算法多适用于图像类型数据,深度学习算法构建的神经网络过深易出现网络退化、难以收敛、参数量大、训练和测试效果更差等问题,在陷落柱识别问题研究中,所获取的数据主要通过物探技术取得的数值型数据。在数据集中,陷落柱异常数据量与非陷落柱类型的数据量比例不均衡,训练模型容易受到类别比例的影响,预测时会侧重于比例大的类别,会出现小型陷落柱容易被忽略。针对上述陷落柱识别精度低、数值型无法直接使用深度学习方法进行研究、网络退化以及类别不均衡等问题。

发明内容

为克服相关技术中存在的问题,本发明提供一种基于CINet网络模型的陷落柱识别方法、系统及终端设备。

根据本发明实施例的第一方面,提供一种基于CINet网络模型的陷落柱识别方法,其中,所述CINet网络模型具有输入层、输出层和隐藏层,所述方法包括:

所述输入层使用K近邻多尺度超球方法对输入的地震数据进行处理;

所述隐藏层使用三个不同的通道对处理后的地震数据进行特征提取,其中,通道一使用两个不同的残差模块进行交替对地震数据进行处理;通道二使用10层不同神经元数量的全连接层对地震数据进行处理;通道三使用不同的卷积层与池化层对地震数据进行处理;

所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果。

进一步,所述输入层使用K近邻多尺度超球方法对输入的地震数据进行处理,具体包括:

对原始训练样本和原始未知样本中的所有属性项进行归一化处理;

选用基于随机森林模型、基于决策树分类模型和基于排列来判断特征的相关性;

根据所述相关性对数据集进行特征筛选,去除对陷落柱影响程度小的特征。

进一步,一个残差模块是在原始的残差模块的输出F(x)基础上添加权重调节,构成权重调节残差模块,计算公式如下:

H(x)=(1-a)×F(x)+a×x

式中,a为权重调节参数,0

另一个残差模块是将F(x)与x进行拼接。

进一步,该方法还包括:所述隐藏层使用Dropout方法,通过设置不同的舍弃概率,以特定几率舍弃部分神经元节点。

进一步,所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果,具体包括:

使用reshape函数转变数据形状,再次使用卷积综合提取三个通道整合后的数据信息,最后扁平化成一维数据,最后使用全连接层进行计算,输出陷落柱识别结果。

根据本发明实施例的第二方面,提供一种基于CINet网络模型的陷落柱识别系统,其中,所述CINet网络模型具有输入层、输出层和隐藏层,所述系统包括:

输入处理模块,用于通过所述输入层使用K近邻多尺度超球方法对输入的地震数据进行处理;

中间处理模块,用于通过所述隐藏层使用三个不同的通道对处理后的地震数据进行特征提取,其中,通道一使用两个不同的残差模块进行交替对地震数据进行处理;通道二使用10层不同神经元数量的全连接层对地震数据进行处理;通道三使用不同的卷积层与池化层对地震数据进行处理;

输出处理模块,用于通过所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果。

进一步,所述输入处理模块,具体用于:

对原始训练样本和原始未知样本中的所有属性项进行归一化处理;

选用基于随机森林模型、基于决策树分类模型和基于排列来判断特征的相关性;

根据所述相关性对数据集进行特征筛选,去除对陷落柱影响程度小的特征。

进一步,所述中间处理模块,还用于:

通过所述隐藏层使用Dropout方法,通过设置不同的舍弃概率,以特定几率舍弃部分神经元节点。

进一步,所述输出处理模块,具体用于:

使用reshape函数转变数据形状,再次使用卷积综合提取三个通道整合后的数据信息,最后扁平化成一维数据,最后使用全连接层进行计算,输出陷落柱识别结果。

根据本发明实施例的第三方面,提供一种终端设备,包括:

处理器;以及

存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。

本发明的实施例提供的技术方案可以包括以下有益效果:

本发明通过使用K近邻多尺度超球方法对数据进行处理,将数据变为均匀的数据,使得卷积操作可以有效的提取局部特征,CINet网络模型可以从原始数据中学习到更加详细的特征信息,提高陷落柱的识别精度,对预防地质灾害的发生具有较好的指导作用。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。

图1是根据本发明一示例性实施例示出的一种基于CINet网络模型的陷落柱识别方法的流程示意图;

图2(a)和图2(b)是两种残差模块的结构图;

图3(a)是基于决策树的重要性排序,图3(b)基于随机森林的重要性排序,图3(c)基于排列的重要性排序;

图4是根据本发明示例性实施例示出的的一种基于CINet网络模型的陷落柱识别系统结构框图;

图5是根据本发明一示例性实施例示出的一种计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的优选实施方式。虽然附图中显示了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。

在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本发明可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

传统机器学习对大规模数据的处理有一定的局限性,面对复杂关系的建模能力也有限,有时候表现不够好。还有残差网络会有过多的不必要的计算,结果也可能会欠拟。DNN网络则需要大量的数据计算资源而且结果难解释。总结一下主要存在以下几个方面的问题:

(1)计算量大问题:

随着样本数量的增加,计算量会变得非常大,导致算法的效率降低。如KNN算法需要计算距离、SVM对随着维度的上升计算量会急剧增加。

(2)欠拟合问题:

残差网络通过引入残差块(ResidualBlock)的方式解决了网络层较深时梯度消失问题,采用批标准化、ReLU等技术。对多种形式的卷积层和激活函数进行选择和组合,增加了网络设计的难度;由于ResNet的深度,训练时需要更多的计算和时间,需要更大的计算资源和更长的时间来训练。在某些场景下,较深的网络并不一定能够提高性能,可能会出现过拟合或性能下降的情况。由于路径决策过于简单,残差网络只是简单地将输入数据与输出数据相加,而忽略了输入数据和输出数据之间的复杂映射关系,可能会导致模型的欠拟合残差块采用了“跳跃连接”,使得网络具有一定的冗余性,这可能会对网络的学习和优化产生一定的影响,也需要对各个参数进行精细调节。

(3)分类过多带来的问题:

传统voting策略只是对T个弱分类器的预测结果做平均或投票。假设现有待预测类别为{c

Stacking策略是基于T个弱分类器生成一个与原始数据集大小相同的新数据集,新数据集与第二层分类器结合,生成新的模型。

多分类的loss下降幅度明显低于二分类的loss变化,收敛速度慢于二分类,且准确率的波动幅度大,二分类的10层全连接层在迭代300次左右趋于收敛,但多分类的全连接明显不稳定,波动变化较大。精准率最高的是多分类为92.54,召回率和F1度量最高的是二分类且层数是10的模型。多分类中的陷落柱识别精度明显低于二分类中陷落柱的识别精度。

基于ResNet网络的多尺度多通道CINet网络模型,通过使用K近邻多尺度超球方法对数据进行处理。将数据变为均匀的数据,使得卷积操作可以有效的提取局部特征。同时使用Dropout方法来防止网络模型过拟合。隐藏层后面使用Dropout方法,通过设置不同的舍弃概率,部分神经元节点将会以特定的几率被舍弃。通过这一操作,使得模型经过大量的迭代训练之后,泛化能力将会得到有效的提升,而且在训练过程中也会有效降低了模型陷入过拟合状态的风险。使用多尺度多通道的结构,从不同角度以不同的形式尽可能的全方位提取数据信息,提高分类识别效果。

本发明要解决的问题是为了提高陷落柱的识别精度,并解决数据中陷落柱与非陷落柱比例高度不平衡问题,使模型朝着正确的方向收敛。

相比于传统的机器学习和残差网络模型,CINet网络模型可以从原始数据中学习到更加详细的特征信息,提高陷落柱的识别精度,F1-Score评分可以达到91.10%,实现了陷落柱快速精准识别,对预防地质灾害的发生具有较好的指导作用。

CINet网络模型的输入和输出数据如下:

输入:原始的n维数据集D={(x

样本之间按照与中心样本之间的距离远近进行排序。定义K维邻域标记样本集D*={(x

输出:对未知样本的分类结果Y

图1是根据本发明一示例性实施例示出的一种基于CINet网络模型的陷落柱识别方法的流程示意图。

CINet网络模型的结构及处理流程,该模型具有输入层、输出层和隐藏层。

参见图1,该方法包括:

110、所述输入层使用K近邻多尺度超球方法对输入的地震数据进行处理。

在一个实施例中,步骤110,具体包括:

1101、对原始训练样本和原始未知样本中的所有属性项进行归一化处理;

1102、选用基于随机森林模型、基于决策树分类模型和基于排列来判断特征的相关性。

1103、根据所述相关性对数据集进行特征筛选,去除对陷落柱影响程度小的特征。

具体的,该步骤中使用K近邻多尺度超球方法对数据进行处理,输入由单一输入改为多头输入,使用三个不同的通道对数据进行特征提取,在中后期通过合并。多尺度邻域是指每条数据都以多种长度进行输入到三个通道中(假设一条数据的特征维度为64,多尺度邻域就是8、16、32、64,以多种不同的特征维度进行训练)。

此外,特征相关性大的特征对于陷落柱致灾体的影响相对较小,通过上述过程,可以在进行特征筛选时可以将其进行去除,提高数据集的可分性。

120、所述隐藏层使用三个不同的通道对处理后的地震数据进行特征提取,其中,通道一使用两个不同的残差模块进行交替对地震数据进行处理;通道二使用10层不同神经元数量的全连接层对地震数据进行处理;通道三使用不同的卷积层与池化层对地震数据进行处理;

具体的,多尺度CINet深度神经网络引入了残差模块,并对其进行改进。改进的方向分为2个,一个是在原始的残差模块的的输出F(x)基础上添加权重调节,如图2(a)所示,最初的残差模块是将F(x)与x简单的进行相加,然后使用激活函数,改进后的权重调节残差模块计算公式如下:

H(x)=(1-a)×F(x)+a×x

式中,a为权重调节参数,0

另一种改进方向是将F(x)与x进行拼接,结构如图2(b)所示。

130、所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果。

具体的,该步骤具体包括:

使用reshape函数转变数据形状,再次使用卷积综合提取三个通道整合后的数据信息,最后扁平化成一维数据,最后使用全连接层进行计算,输出陷落柱识别结果。

下面首先对CINet网络模型的训练过程进行介绍:

步骤1:样本归一化

对原始训练样本和原始未知样本中的所有属性项利用公式(1)进行归一化处理,即:

其中,X是转换后的数据,x为需要转换的数据,x

步骤2:数据特征重要性分析

为进一步探索研究隐蔽致灾体与各个属性特征之间的关联性,选用基于随机森林模型、基于决策树分类模型和基于排列来获取特征对隐蔽致灾体的影响程度。随机森林模型中的每个决策树都基于原始特征的一个随机子集进行训练,通过观察在移除某个特征后模型的性能变化,评估该特征的重要性;决策树分类模型通过观察树的各个节点,使用信息增益、基尼不纯度等度量标准来量化特征的重要性;排列方法通过对特征值进行置换来衡量特征的重要性,通过计算特征与目标变量之间的互信息来评估特征的重要性。权重如图3所示,根据特征重要性分别画出矿区陷落柱的特征权重排序后的柱状图,以此分析影响陷落柱较大的特征。

根据皮尔逊相关系数计算出特征之间的相关系数如表1,横坐标与纵坐标的交叉点的数字表示相关性,越接近1表示两者相关联大;反之,两者相关联小。通过表1可知,在新元四区数据集中平均能量、瞬时振幅、最大振幅、均方根振幅四个特征相关性最大,对于陷落柱致灾体的影响相对较小,在进行特征筛选时可以将其进行去除,提高数据集的可分性。

步骤3:分类模型的构建

将新构建的X

步骤4:对未知样本结果预测

对训练样本集T(x)中的每一个条训练样本,使用步骤3得到的模型M进行预测,预测得到TP。

步骤5:准确率统计

对于分类模型来说,其评估标准有精确率、查全率等。由于在陷落柱识别检测中正负样本不平衡是非常常见的,只简单使用准确率这一单一指标作为评估指标是不合理的,因此,实验所采用的评价指标除了检测查全率(R)、查准率(P)之外,还使用F1度量(F1-Score)作为评估模型性能的评估标准。其中TP代表真正例,FN代表假负例,FP代表假正例,TN代表真负例。

精确率(Precision):实际和预测都为正类的样本占所有被预测为正类的样本的比例。

召回率(Recall):实际和预测都为正类的样本占所有实际为正类样本的比例。

F-score是基于精确率和召回率的调和平均数,β设置为T时,F-score指标变为FT-score。综合权衡准确率与召回率的F-score能展现出模型的整体质量。

可选地,在该实施例中,步骤120还包括:

所述隐藏层使用Dropout方法,通过设置不同的舍弃概率,以特定几率舍弃部分神经元节点。

具体的,针对传统K近邻算法使用欧几里得距离进行度量,对异常值不敏感且对所有的特征的等级或优先级都是相同的,对于距离度量的贡献是一样的。但是在实际的问题中,特征的优先级与贡献度是不同的,提出给不同的特征赋予不同的权重;根据残差网络会出现过拟合或性能下降的情况,使用Dropout层来防止模型过拟合,对残差块进行改进,使得改进后的残差块不仅可以减少计算量,而且可以更好的学习到数据特征,提升网络性能。同时使用多尺度邻域标记,对改进的残差网络进行多通道输入,在深层中多通道合并,实验结果表明收敛速度加快,效果同比较优。

图4是根据本发明示例性实施例示出的的一种基于CINet网络模型的陷落柱识别系统结构框图。

参见图4,该系统包括:

输入处理模块,用于通过所述输入层使用K近邻多尺度超球方法对输入的地震数据进行处理;

中间处理模块,用于通过所述隐藏层使用三个不同的通道对处理后的地震数据进行特征提取,其中,通道一使用两个不同的残差模块进行交替对地震数据进行处理;通道二使用10层不同神经元数量的全连接层对地震数据进行处理;通道三使用不同的卷积层与池化层对地震数据进行处理;

输出处理模块,用于通过所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果。

可选地,在该实施例中,所述输入处理模块,具体用于:

对原始训练样本和原始未知样本中的所有属性项进行归一化处理;

选用基于随机森林模型、基于决策树分类模型和基于排列来判断特征的相关性;

根据所述相关性对数据集进行特征筛选,去除对陷落柱影响程度小的特征。

可选地,在该实施例中,所述中间处理模块,还用于:

通过所述隐藏层使用Dropout方法,通过设置不同的舍弃概率,以特定几率舍弃部分神经元节点。

可选地,在该实施例中,所述输出处理模块,具体用于:

使用reshape函数转变数据形状,再次使用卷积综合提取三个通道整合后的数据信息,最后扁平化成一维数据,最后使用全连接层进行计算,输出陷落柱识别结果。

关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。

图5是根据本发明一示例性实施例示出的一种计算设备的结构示意图。

参见图5,计算设备500包括存储器510和处理器520。

处理器520可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器510可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器510可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器510可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器510上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器520执行上文述及的方法中的部分或全部。

此外,根据本发明的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中部分或全部步骤的计算机程序代码指令。

或者,本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本发明的上述方法的各个步骤的部分或全部。

上文中已经参考附图详细描述了本发明的方案。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。本领域技术人员也应该知悉,说明书中所涉及的动作和模块并不一定是本发明所必须的。另外,可以理解,本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

相关技术
  • 一种用电异常的识别方法、系统及终端设备
  • 一种基于双重限制注意力神经网络模型的人脸识别方法
  • 一种基于多场多特征信息融合的导水陷落柱识别方法
  • 一种基于多场多特征信息融合的导水陷落柱识别方法
技术分类

06120116625608