另一种改进方向是将F(x)与x进行拼接,结构如图2(b)所示。
130、所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果。
具体的,该步骤具体包括:
使用reshape函数转变数据形状,再次使用卷积综合提取三个通道整合后的数据信息,最后扁平化成一维数据,最后使用全连接层进行计算,输出陷落柱识别结果。
下面首先对CINet网络模型的训练过程进行介绍:
步骤1:样本归一化
对原始训练样本和原始未知样本中的所有属性项利用公式(1)进行归一化处理,即:
其中,X是转换后的数据,x为需要转换的数据,x
步骤2:数据特征重要性分析
为进一步探索研究隐蔽致灾体与各个属性特征之间的关联性,选用基于随机森林模型、基于决策树分类模型和基于排列来获取特征对隐蔽致灾体的影响程度。随机森林模型中的每个决策树都基于原始特征的一个随机子集进行训练,通过观察在移除某个特征后模型的性能变化,评估该特征的重要性;决策树分类模型通过观察树的各个节点,使用信息增益、基尼不纯度等度量标准来量化特征的重要性;排列方法通过对特征值进行置换来衡量特征的重要性,通过计算特征与目标变量之间的互信息来评估特征的重要性。权重如图3所示,根据特征重要性分别画出矿区陷落柱的特征权重排序后的柱状图,以此分析影响陷落柱较大的特征。
根据皮尔逊相关系数计算出特征之间的相关系数如表1,横坐标与纵坐标的交叉点的数字表示相关性,越接近1表示两者相关联大;反之,两者相关联小。通过表1可知,在新元四区数据集中平均能量、瞬时振幅、最大振幅、均方根振幅四个特征相关性最大,对于陷落柱致灾体的影响相对较小,在进行特征筛选时可以将其进行去除,提高数据集的可分性。
步骤3:分类模型的构建
将新构建的X
步骤4:对未知样本结果预测
对训练样本集T(x)中的每一个条训练样本,使用步骤3得到的模型M进行预测,预测得到TP。
步骤5:准确率统计
对于分类模型来说,其评估标准有精确率、查全率等。由于在陷落柱识别检测中正负样本不平衡是非常常见的,只简单使用准确率这一单一指标作为评估指标是不合理的,因此,实验所采用的评价指标除了检测查全率(R)、查准率(P)之外,还使用F1度量(F1-Score)作为评估模型性能的评估标准。其中TP代表真正例,FN代表假负例,FP代表假正例,TN代表真负例。
精确率(Precision):实际和预测都为正类的样本占所有被预测为正类的样本的比例。
召回率(Recall):实际和预测都为正类的样本占所有实际为正类样本的比例。
F-score是基于精确率和召回率的调和平均数,β设置为T时,F-score指标变为FT-score。综合权衡准确率与召回率的F-score能展现出模型的整体质量。
可选地,在该实施例中,步骤120还包括:
所述隐藏层使用Dropout方法,通过设置不同的舍弃概率,以特定几率舍弃部分神经元节点。
具体的,针对传统K近邻算法使用欧几里得距离进行度量,对异常值不敏感且对所有的特征的等级或优先级都是相同的,对于距离度量的贡献是一样的。但是在实际的问题中,特征的优先级与贡献度是不同的,提出给不同的特征赋予不同的权重;根据残差网络会出现过拟合或性能下降的情况,使用Dropout层来防止模型过拟合,对残差块进行改进,使得改进后的残差块不仅可以减少计算量,而且可以更好的学习到数据特征,提升网络性能。同时使用多尺度邻域标记,对改进的残差网络进行多通道输入,在深层中多通道合并,实验结果表明收敛速度加快,效果同比较优。
图4是根据本发明示例性实施例示出的的一种基于CINet网络模型的陷落柱识别系统结构框图。
参见图4,该系统包括:
输入处理模块,用于通过所述输入层使用K近邻多尺度超球方法对输入的地震数据进行处理;
中间处理模块,用于通过所述隐藏层使用三个不同的通道对处理后的地震数据进行特征提取,其中,通道一使用两个不同的残差模块进行交替对地震数据进行处理;通道二使用10层不同神经元数量的全连接层对地震数据进行处理;通道三使用不同的卷积层与池化层对地震数据进行处理;
输出处理模块,用于通过所述输出层通过一个神经元数量相同的Dense层将其各通道的数据维度进行统一合并,进行统一处理,输出陷落柱识别结果。
可选地,在该实施例中,所述输入处理模块,具体用于:
对原始训练样本和原始未知样本中的所有属性项进行归一化处理;
选用基于随机森林模型、基于决策树分类模型和基于排列来判断特征的相关性;
根据所述相关性对数据集进行特征筛选,去除对陷落柱影响程度小的特征。
可选地,在该实施例中,所述中间处理模块,还用于:
通过所述隐藏层使用Dropout方法,通过设置不同的舍弃概率,以特定几率舍弃部分神经元节点。
可选地,在该实施例中,所述输出处理模块,具体用于:
使用reshape函数转变数据形状,再次使用卷积综合提取三个通道整合后的数据信息,最后扁平化成一维数据,最后使用全连接层进行计算,输出陷落柱识别结果。
关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图5是根据本发明一示例性实施例示出的一种计算设备的结构示意图。
参见图5,计算设备500包括存储器510和处理器520。
处理器520可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器510可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器510可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器510可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器510上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器520执行上文述及的方法中的部分或全部。
此外,根据本发明的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本发明的上述方法的各个步骤的部分或全部。
上文中已经参考附图详细描述了本发明的方案。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。本领域技术人员也应该知悉,说明书中所涉及的动作和模块并不一定是本发明所必须的。另外,可以理解,本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。