掌桥专利:专业的专利平台
掌桥专利
首页

耦合时空图卷积网络与机理模型的地下水污染预测方法

文献发布时间:2024-04-18 19:59:31


耦合时空图卷积网络与机理模型的地下水污染预测方法

技术领域

本发明涉及地下水污染预测技术领域,特别涉及一种基于时空图卷积网络与三维地下水溶质运移模拟机理模型耦合的地下水污染物浓度预测方法,通过历史地下水污染浓度数据预测得到未来地下水污染物浓度。

技术背景

地下水资源是水资源的重要组成部分,同时也是构成生态环境的重要因素,它在经济社会可持续发展中具有重要的地位。然而,受人类排污活动的影响,地下水质量逐步下降。由于地下水交替程度较弱、自净能力较低,一旦受到污染,污染物将长期滞留于地下水中并对地下水造成污染。同时,随着地下水的迁移,长期滞留于地下水中的污染物将向周围逐步扩散,导致污染面积不断扩大。由于地下水水文地质条件非常复杂,其治理与修复难度较大、修复成本较高、修复周期较长,一旦受到污染,所造成的环境与生态损害往往是不可逆的。

因此,如何实现地下水污染快速预测成为一个亟待解决的问题。目前的技术,如经验学方法,虽然在一定程度上提高了地下水污染快速预测能力,但预测精度低下,工作效率不高。现有技术难以实现对地下水污染物的精准预测和治理,不利于保护水资源,和支撑环境可持续发展。

发明内容

为了解决上述现有技术存在的问题,本发明提出了耦合时空图卷积网络与机理模型的地下水污染预测模型方法,针对污染场地地下水污染物浓度数据,基于三维地下水溶质运移模型与时空图卷积神经网络(STGCN)模型,构建土壤地下水污染物浓度预测模型,实现对地下水污染物浓度的特征提取得到污染物浓度变化趋势,提高对地下水污染浓度预测能力,满足实际应用需求。

在地下水污染模拟预测技术领域,目前大多使用基于地下水动力学原理的机理模型,例如使用数值模拟(GMS)模型软件进行有限元数值模拟。这些机理模型主要用于模拟地下水流动和污染物运移,通常作为污染预测工具。而本发明创新性地提出了耦合时空图卷积网络与机理模型的地下水污染预测模型,其中先利用机理模型进行数据扩充,将这些机理模型用作数据增强的手段,而非仅作为预测工具。再基于机器学习模型进行污染物浓度预测。这种基于机理模型的数据增强方法不仅有效地利用了机理模型的准确性和可靠性,也大大提高了后续时空图卷积网络(STGCN)模型训练的效果和准确性。该模型在处理大量时空数据方面表现出极高的准确度,远远超越了传统方法。它能有效地捕获地下水污染物在时间和空间上的复杂依赖关系,从而实现更精准的预测。通过这种创新性的方法,本发明成功地将传统的机理模型和现代的深度学习方法相结合,为地下水污染物浓度预测提供了一个更为全面和准确的解决方案。

本发明提供了耦合时空图卷积网络与机理模型的地下水污染预测方法,先进行机理模型的数据扩充,再进行机器学习的预测浓度,耦合时空图卷积网络与机理模型进行地下水污染预测,该技术方案具体包括如下步骤:

1)构建地下水文地质概念模型;

首先构建地下水文地质概念模型,包括:概化水文地质条件、概化评估区范围、概化地层结构及属性、概化地下水水流特征、概化水文地质参数;

以某市某化工厂的场地资料及地下水采样数据为基础,根据地下水系统的补径排条件,含水系统实际的边界性质、内部结构,内部地下水运动状态概化水文地质条件;根据污染源、当前污染分布范围、污染受体、地下水环境敏感区域等概化评估区范围;根据水岩组类型,含水介质的均质或非均质性、各向同性或各向异性等概化地层结构及属性;根据地下水水流的时空分布特征,确定评估区水流为稳定流或非稳定流、是否存在越流补给等情况概化地下水水流特征;根据水岩组空间分布特征,包括埋深、厚度、岩性等,地下水流场、水化学场的空间分布特征概化水文地质参数。

2)构建地下水污染物机理模型;

根据已构建的地下水文地质概念模型,依据地下水动力学的原理,并遵循能量守恒和质量守恒的基础上,使用数值模拟软件(GMS软件)构建地下水污染物机理模型,是基于有限元数值模拟方法,进行模拟地下水流动、污染物运移问题。

3)使用地下水污染物机理模型进行数据增强,得到模型训练数据集。

在地下水污染模拟预测技术领域中,现有方法依赖于通过有限元软件构建的基于地下水动力学的机理模型。这些机理模型通常只被用作直接预测地下水污染物的工具。然而,本发明创新性地将机理模型作为数据增强策略的一部分,提升了模型训练数据集的质量和数量。具体来说,根据已构建完成的地下水污染物机理模型,进行数据增强。输入场地中少量的场地月度地下水污染物检测时序数据,进行增强得到每日地下水污染物浓度数值,使数据集大小从12期扩充到365期。场地内水质检测中污染物分别使用对应的地下水污染物机理模型进行扩充数据,使每个污染物的数据得到扩充,作为原始训练数据集。这一数据增强手法不仅充分利用了机理模型的预测准确度,还增强了后续使用神经网络进行预测的有效性和精确性。这种融合传统机理模型与先进神经网络技术的创新方法,为地下水污染预测带来了更高层次的准确性和可靠性。

4)基于时空图卷积网络(STGCN)模型,构建地下水污染物浓度预测耦合模型;

构建的地下水污染物耦合模型的主要结构包含:一个时间卷积-图卷积-时间卷积操作的模块、一个额外的时间卷积模块(TimeBlock)、全连接层。这些模块按照以下顺序串联:首先数据输入到时间卷积-图卷积-时间卷积操作的模块:该模块包含一个时间卷积操作(TimeBlock)、一个图卷积操作和另一个时间卷积操作,主要负责时间和空间特征的提取。具体来说,首先进行时间卷积操作,以分析地下水污染物在时间维度上的连续性和变化趋势。这一步骤作为图卷积之前的预处理步骤,对时间信息进行初步提取。接着进行图卷积操作,以分析地下水系统中不同区域之间的相互关系,并捕捉污染物在空间上的流动和扩散模式。最后,再次进行时间卷积操作,以进一步强化时间特性的提取。

然后输入到额外的时间卷积模块:额外的时间卷积模块是用于进一步强化时间特性的提取。该模块特别设计用于捕捉更复杂、更微妙的时间依赖性,以便更准确地预测地下水污染物的浓度变化。

最后输入到全连接层,其主要作用是综合前面各模块提取的时间和空间特征,通过一系列权重和偏置进行映射,最终生成地下水污染物浓度的预测值。

本发明创新性地将基于时空图卷积网络(STGCN)的神经网络模型应用于地下水污染预测,基于时空图卷积网络(STGCN)构建地下水污染物浓度预测耦合神经网络模型,使得构建的模型高度融合了时间和空间两个通常是分开考虑的维度。本发明模型与传统模型不同,不仅仅是单一维度的分析,而是一个多维度、高度整合的解决方案。地下水污染问题通常具有复杂的时间和空间依赖关系。基于STGCN模型构建地下水污染物浓度预测耦合模型通过结合深度学习方法和图结构,能够从扩充的地下水的大规模数据以及高维度的数据中提取有价值的特征,获取更准确的预测结果。因此,本发明不仅提供了一种全新的视角来理解和解决地下水污染预测,也增加了模型对传统复杂地下水问题的适应能力。

本发明构建的网络模型的第一步是对时间特征的提取,通过时间卷积-图卷积-时间卷积操作的模块中的时间卷积(TimeBlock)模块完成。时间卷积模块包含三个卷积层,每个卷积层都进行卷积运算。一维卷积的卷积,是专门针对时间序列数据设计的。在每个位置上,卷积核会和该位置的数据进行乘积和求和运算,提取出该位置的时间特征;时间卷积(TimeBlock)模块能捕捉到每个时间步的特征,此特征会包含一些历史信息(过去几个时间步的趋势)。将这些卷积层的结果相加和通过非线性激活函数(ReLU函数),生成最终的时间特征。然后进行空间特征的提取,通过图卷积实现。图卷积是将图中每个节点的特征和其邻居的特征结合起来。在图卷积模块中,图卷积的操作被实现为一个“矩阵-矩阵乘法”操作:torch.einsum("ij,jklm->kilm",[A_hat,t.permute(1,0,2,3)])。其中,"torch.einsum"是PyTorch库中用于执行Einstein求和约定的函数。"ij,jklm->kilm"是描述操作的字符串,定义了输入和输出张量的维度。A_hat是邻接矩阵,表示图中每个节点与其他节点的连接关系。t.permute(1,0,2,3)是每个节点的特征。通过这个乘法操作,每个节点的特征被更新为其自身的特征和其所有邻居特征的加权和,权重就是邻接矩阵中的值。然后再次提取时间特征,通过再次应用时间卷积(TimeBlock)模块实现,其与第一步(对时间特征的提取)完全一样,这在提取空间特征之后提取出更高级的时间特征。

5)训练地下水污染物浓度预测耦合模型;包括:

51)用步骤3)扩充处理后的数据构造污染物浓度数据的时空矩阵;

构建地下水污染场地点位之间地理空间特征矩阵,形成二维矩阵,用于描述地下水污染场地中点位之间的地理空间关系。同时构造污染物浓度的时间特征矩阵,形成地下水污染物时空三维矩阵,用于捕捉地下水污染物浓度在点位上随时间的变化。

52)对地下水污染物时空三维矩阵浓度数据按照8:1:1的比例划分为训练集、验证集和测试集;

53)设置模型训练参数:

包括:初始化模型超参数,设置训练1000个世代,批次大小为40,学习率为0.001,输入的时间步长为12,输出的时间步长为3;

54)加载训练集和测试集,对步骤4)构建的地下水污染物浓度预测耦合模型进行训练,主要包含:模型批量训练,在每次参数更新之前,梯度清零模块被用来确保只对当前批次的梯度进行优化。模型在前向传播阶段接收输入数据,该数据流经所有隐藏层并最终到达输出层。在反向传播阶段,损失函数(均方误差)用于量化模型预测与实际观测数据之间的差异。此外,模型还利用了TimeBlock组件,这一组件能够准确地捕获地下水污染物浓度在时间序列中的周期性和趋势性变化。这两个组件—STGCNBlock和TimeBlock—都针对地下水领域的复杂时空关系进行了专门优化,从而增强了模型的预测准确性和可靠性。然后,利用Adam优化器进行模型参数的更新,以最小化损失函数,并通过多次迭代来提高模型的预测性能。

55)最终得到训练好的耦合时空图卷积网络与机理模型的地下水污染预测模型,保存训练过程中效果最佳的神经网络权重文件;

6)使用污染物浓度真实数据作为输入数据,运行已经训练好的耦合时空图卷积网络与机理模型的地下水污染预测模型进行预测,获得未来时刻污该染物在污染场地地下水的未来时刻的浓度数据。

在一个实例中,定义该场地的模型范围和边界条件,该场地第一含水层流场整体由东向西,考虑等水位线分布情况,沿地下水等水位线平行和垂直方向,将东部和西部设为水头边界,南部和北部等水位线相垂直处定义为零流量边界。模拟区潜水埋深较浅,直接接受大气降水和田间灌溉入渗补给,因此定义潜水自由水面为上边界,底部以粉质黏土和黏土为主,定义为隔水边界。垂向由于调查所涉及的地下水埋深在20m以内,即第一含水层组,综合考虑含水层概化需求及水井深度,模型在垂向上控制在20m以内。模拟区第四系含水层在20m深度以下有一层相对隔水层,岩性以粉质黏土和黏土为主。因此模型垂向上概化为一层潜水含水层。

在一个实例中,研究区内地下水系统为第四系松散沉积潜水含水系统。根据研究区内水文地质条件及钻孔资料的调查与分析,模型可概化为一层,即第一含水层系统,深度约为20m。

在一个实例中,研究区地下水整体流向为自东向西。地下水系统遵循质量守恒定律和能量守恒定律,研究区内潜水含水层分布广泛,厚度较大,具有统一且连续的地下水面,地下水运动符合达西渗流定律,将地下水的运动概化为空间三维流。介质的特征因空间位置和方向而异,表现为非均质各向异性;地下水系统的输入输出随时空而变,具有非稳定的特点。综上,地下水系统可概化为三维非均质各向异性非稳定流。

在一个实施例中,研究区地下水系统为非均质各向异性、空间三维结构、非稳定流地下水系统。可由以下微分方程表示:

式中,Kx、Ky、Kz分别为x,y,z方向上的渗透系数(m/d);h为水位(m);P为潜水面蒸发入渗强度等(m/d);μ为给水度;t为时间(d);Γ0为模型上部边界;W为源汇项强度(m/d);Ss为贮水率(1/m);Ω为模型范围;h0为含水层初始水位分布(m);Γ1为一类边界;h1为一类边界上已知水位函数;K为三维空间上的渗透系数张量;Γ2为二类边界;n为边界的外法线方向;q1为二类边界上已知流量函数;α为已知函数;Γ3为三类边界;q2为三类边界上已知流量函数。

在一个实施例中,对地下水污染预测时空图卷积网络(STGCN)模型的训练过程中使用了批量训练模块。将批量训练模块加入到原STGCN模型中,可以更好的适应地下水预测领域。在神经网络训练过程中,采用小批量的方式进行。这意味着在每个训练步骤,不是使用整个数据集来更新模型的参数,而是只使用数据集中的少部分。批量训练方法与地下水污染物浓度预测有很好的结合度,主要体现在以下两个方面:1.计算效率:地下水污染物浓度数据通常具有高度的时间和空间复杂性,数据量可能非常大。通过使用小批量数据进行训练,可以显著提高计算效率。这意味着在每次模型参数更新时,只需要处理一部分数据,从而加速了模型的训练过程。2.模型泛化能力:地下水系统是一个动态变化和高度复杂的系统。使用批量训练方法可以引入一定的随机性,因为每个批次的数据都具有一定的差异性。这有助于提高模型的泛化能力,防止模型过度拟合特定的训练数据,从而使模型更能适应地下水系统中的复杂和多变条件。

在一个实施例中,对地下水污染预测时空图卷积网络(STGCN)模型的训练过程中使用了梯度清零模块。加入到原STGCN模型中增加梯度清零方法,可以更好的适应地下水预测领域。由于地下水污染物的动态性和复杂性,每一批次的数据都具有其独特的特征和重要性。在每次参数更新后,模型需要将梯度清零,以确保只对当前批次的梯度进行优化,而不是累积之前批次的梯度。

在一个实施例中,对地下水污染预测时空图卷积网络(STGCN)模型的训练过程中使用了前向传播和反向传播模块。本发明实例将前向传播和反向传播模块函数单独提取出来,以便进行地下水的参数调整。通过改进了代码的位置,方便调整参数。在前向传播阶段,输入地下水污染物的各种参数和浓度数据,从输入层开始流经所有隐藏层,最终到达输出层。每一层的输出都作为下一层的输入。模型能够逐层提取和分析地下水污染物的时空特征。在反向传播阶段,使用均方误差(MSE)作为损失函数,以量化模型预测与实际观测数据之间的差异。这是至关重要的,特别是在地下水污染物预测的高度敏感和复杂的应用场景中。通过最小化这一损失函数,模型的权重和偏置参数得以更新,从而提高预测地下水污染物浓度的准确性。

在一个实施例中,对地下水污染预测时空图卷积网络(STGCN)模型的训练过程中增加使用了,参数更新模块,更好的适应地下水预测,便于修改参数,调整模型。参数更新是神经网络训练过程中的关键步骤,尤其在地下水污染物预测的复杂和高度敏感的领域。在这个步骤中,模型的参数(权重和偏置)会根据之前计算的梯度进行更新,目的是降低损失函数的值。在本发明中,参数更新通常由优化器(optimizer)对象来完成。优化器对象知道如何根据计算的梯度来修改模型参数。参数更新的过程是通过optimizer.step()这行代码实现,使得模型能够更准确地预测地下水的污染浓度。在调用.step()方法之前,优化器已经知道了模型参数当前的值和梯度,因此它可以根据这些信息来更新参数。具体的更新方式取决于优化器的类型和设置。参数更新的目的是让模型的预测结果尽可能地接近真实的目标值。

在一个实施例中,对地下水污染预测时空图卷积网络(STGCN)模型的训练过程中增加设计使用了,滑动窗口模块,在地下水污染物预测中尤为重要,因为它能将时间序列数据转换为适用于STGCN模型的训练和预测样本。通过滑动窗口机制,每个窗口内的数据被视为一个独立的样本,这不仅大大增加了训练样本的数量,还使模型能够捕捉到数据中的时间依赖性。这意味着模型能够学习如何根据过去的地下水污染数据来预测未来的污染趋势。滑动窗口的大小是可调的,通过调整窗口大小,研究人员可以改变模型学习的时间尺度,进一步优化模型的预测性能。

本发明中,通过构建地下水污染物浓度预测机理模型与时空图卷积网络(STGCN)耦合模型,应用在污染场地地下水污染长期风险管控里,可以解决传统数据量不足,检测数据存在偏差值,实地获取数据困难等相关问题,并且可以充分发挥机理模型的扩充数据效果优异,深度学习网络模型预测准确的结合优势,为场地地下水污染风险管控提供有力技术支撑。

与现有技术相比,本发明的实施例提供的技术方案具有以下有益效果:

本发明数据预处理采用地下水污染物机理模型,对已有的数据进行物理上的解释和推导,这将解决传统数据量不足问题,在传统的地下水污染研究中,由于实地获取数据困难的困难和成本高昂,会出现数据量不足的问题。本发明经过机理模型通过已有的有限数据,对未知数据进行推断,实现数据的扩充,进而解决数据不足以及实地获取数据的依赖性的问题。

本发明采用时空图卷积网络(STGCN),这将解决应对检测数据存在偏差值的问题,污染物浓度的检测数据可能存在仪器的精度、检测方法的局限性或者环境因素的影响等偏差,时空图卷积网络模型可以通过大量数据进行学习并模拟这些偏差,提高模型预测的准确性。

本发明采用时空图卷积网络(STGCN),这是基于深度学习网络的模型这将使得对地下水污染物浓度的预测更加准确,其具有强大的非线性拟合和学习能力,可以有效地基于大量数据模拟地下水污染物浓度的复杂变化规律,从而提高预测的准确性。

本发明构建地下水污染物机理模型与时空图卷积网络(STGCN)耦合模型,机理模型是基于物理、化学等科学原理建立的模型,可以对地下水的动态过程、污染物的迁移和转化过程进行定性和定量的描述。通过机理模型,可以基于物理上的解释推导进行扩充污染物数据。深度学习的时空图卷积网络(STGCN)模型,是一种强大的非线性学习模型,它可以通过自动学习数据中的复杂模式,来弥补机理模型的不足。利用机理模型生成的大量数据进行训练,通过自动学习数据中的地下水污染物浓度变化趋势,提高预测的准确性。深度学习的时空图卷积网络(STGCN)模型对于时空数据的预测很契合,可以有效地捕捉地下水污染物浓度在时空上的变化规律,进一步提高地下水污染浓度预测的精度。

附图说明

图1为构建基于机理模型的三维地下水溶质运移模型流程框图。

图2为本发明提供的耦合时空图卷积网络与机理模型的地下水污染物浓度预测方法流程框图。

图3为本发明提供的耦合时空图卷积网络与机理模型的地下水污染物浓度预测方法的结构框图。

具体实施方式

为了明确本发明的目的和技术路线,以下结合附图对实施例进行进一步的说明。

本发明提供的耦合时空图卷积网络与机理模型的地下水污染预测方法,其流程如图1和图2所示,包括如下步骤:

对于场地污染地下水问题,不仅需要采取有力的防治措施,更需要借助于大数据和人工智能机器学习等新型技术,构建出准确且高效的地下水污染物预测模型,以实现对地下水污染物的精准治理,保护水资源,支撑可持续发展。

在本实例中,获取到监测数据为点源,经过机理模型预处理后将会基于理化性质的公式计算输出面源,并且扩充期数数据。

为了进行数据增强,首先需要构建地下水污染物机理模型,主要为先依据场地水文地质资料构建三维地下水概念模型,其次根据三维地下水概念模型进行构建地下水污染物机理模型,具体操作如下。

(1)分析评估区及其附近地下水系统的内部构造与活动特性,对系统内外地下水的供给和排放条件进行假设和简化。考察地下水系统的含水岩层类型、构造以及空间延展形态。了解系统边界条件和源汇项对地下水系统的影响。并对地下水系统内部的运动状态和参数分布特性进行定性描述。本实例中涉及到的地层主要为第四系洪冲积松散沉积地层,属于大兴隆起的东北端,主要发育有张家湾断裂、燕郊断裂等。第四系沉积物由永定河冲洪积扇和潮白河冲洪积扇构成,其厚度为300~400m左右,颜色以灰色、灰黑色、黄色为主,岩性为粘土、粘质粉土、砂质粉土、粉细砂、中粗砂、砾石等,单层厚度一般不大,为多层含水层和隔水层的组合。

(2)确定评估区范围应能够相对精确地描绘出地下水流动系统的边界,以及源汇项对该系统的影响特性。评估区范围还应包含已知的地下水环境问题的影响区域,如污染源,现有的污染分布区,污染受体以及地下水环境敏感区等。确保评估区满足后续进行地下水污染模拟预测评估工作所需的空间和时间尺度。本实例中,该厂区西部地区地层较为复杂,砂层与粘土层互层较多;西部地区深部的粘土层较浅,厚度较厚,而东部地区深部的粘土层较深,厚度较薄,部分地区甚至缺失。因此,可初步判定厂区西部的粘土层对污染物的隔绝效果更好,东部地区的粘土层对污染物的隔绝作用较弱,污染物更易扩散污染至深部水土中。

(3)对评估区含水岩组进行概化,分析其结构和岩性特征。确定含水岩组的类型,以及含水介质是否均质或非均质,是否各向同性或各向异性。进一步研究含水介质的空间分布,了解含水层渗透系数的空间变化规律,及其与隔水层的接触关系。确认是否存在如“天窗”或断层等特殊结构,这些结构可能导致水分迁移和污染扩散。最后,概念模型需考虑到含水层的非均质性。通过对该地区钻孔资料的分析,在埋深100m左右存在一个相对稳定的隔水层。根据含水层的埋藏深度及水文地质条件,把100m以上的第四系地下水称为浅层地下水,把100m以下的第四系地下水称为深层地下水。

(4)对评估区边界条件设定,基于含水岩组分布、评估区边界上地下水流特性以及地下水和地表水之间的水力联系,把评估区边界概括为以下三类:一类边界是给定地下水水头的边界;二类边界是给定侧向径流量的边界;三类边界是给定地下水侧向流量与水位关系的边界。同时,研究需要明确评估区地下水的源汇项构成及类型,并概算各源汇项流量。研究区主要为浅层地下水,补给来源主要为大气降水补给,其次为地下水侧向径流补给、河流入渗和灌溉回归等。在天然状态下,通州区地下水径流方向为自西北向东南。在开采条件下,不同深度的地下水径流方向有所改变。其中潜水由于不是主要的开采层位,且补给条件较浅层承压水好,目前潜水的径流方向没有大的改变,仍然有西北向东南方向径流。通州区浅层地下水的排泄主要是农业开采和向东南侧径流流出。据此构建地下水概念模型。

(5)基于步骤4)建立的概念模型,利用数值模拟软件GMS,通过构建3D网格,将获取到的该场地附近降雨信息、地下水不同应力期的流场等数据导入数值模拟软件进行演算,进而得到了初步地下水非稳定流数值模型。再将其与真实地下水流场进行对照,利用试点法细致调整参数,进一步使地下水流模型与真实流场拟合,进而得到三维地下水数值模型即地下水污染物机理模型。

(6)在本实例中以污染物苯为例,通过分析获取到的12个月的钻孔监测污染物浓度数据,发现部分点位数据存在波动,得出有源强在参与地下水活动;大部分点位12个月的污染物均为0.5,未达到检出限,可认为其污染程度很轻,不参与后续模拟计算。基于上述分析,在数值模拟软件GMS中设置源强并将场地分区,通过细致调整参数,同时利用MT3DMS模块模拟地下水污染物迁移转化过程,使模型模拟浓度与污染物真实浓度较好的拟合,从而得到地下水污染物迁移转化机理模型。

(7)在本实例中以污染物苯为例,通过已建立的地下水污染物迁移转化机理模型,对已有12个月地下水钻孔监测污染物浓度数据进行导入,并基于物理化学等机理性质进行插值模拟地下水污染物浓度变化情况,插值结果为一年365天的数据,从点源扩散为面源,并将模拟出的相关结果导出。

利用基于机理模型的三维地下水溶质运移模型的方法来对原始数据集进行数据增强,原始地下水污染物浓度监测数据一共11种污染物,每个污染物40个点位,每个点位12期数据,每种污染物分别输入进机理模型,进行数据增强,然后每个污染物每个点位从12期数据增强为365期数据。

然后将上述数据增强过的污染物浓度数据输入到基于深度学习的时空图卷积网络(STGCN)模型进行训练,这个模型能够有效处理同时具有时间和空间依赖性的数据。对于本实例来说,地下水污染物浓度数据都展示出强烈的时空依赖性。这种时空依赖性指的是数据的特性不仅随时间变化,而且还受到空间位置的影响。该模型可以通过结合图卷积和时间卷积,同时从时间和空间两个维度提取特征。同时是一个端到端的模型,能够直接从原始数据中学习到有用的信息,而无需手动特征工程。将数据放入到模型中进行训练,并得出预测结果,具体如图3所示,具体操作如下。

(1)构建地理邻接二维矩阵以及时间三维矩阵,基于步骤(7)导出的地下水污染物信息,通过获取经纬度以及格点信息构建基于地理信息位置的二维矩阵,用于描述地下水污染场地中点位之间的地理空间关系。并进一步构建,基于365天地下水污染物浓度数据,构建时间三维矩阵,用于捕捉地下水污染物浓度在点位上随时间的变化。进而得到用于模型训练的原始样本数据集。

(2)将上步(1)构建的两个矩阵输入进时空图卷积网络(STGCN)模型,首先设置参数,本实例中,参数设置如下:num_timesteps_input=12;num_timesteps_output=3;batch_size=40;epochs=1000;optimizer=torch.optim.Adam(net.parameters(),lr=1e-3)。

(3)对输入的数据进行预处理使用load_metr_la_data()函数来加载数据。这个函数从磁盘上读取预先保存的.npy格式的上步骤中的两个邻接矩阵和节点值。对节点值进行Z-score标准化,消除量纲的影响,即减去均值并除以标准差,使得不同特征之间可比较。其次,调用generate_dataset()函数来生成训练和验证的数据集。这个函数将原始的节点特征数据按照时间滑动窗口的方式进行切片,生成多个样本,每个样本都包括一段连续的输入时间步和对应的输出时间步。

(4)时空图卷积网络(STGCN)模型具体操作,主要包含时间卷积操作,在每个节点上独立应用时间卷积。假设每个节点的特征序列为h_t(t=1,2,...,T),其中T是时间步的总数。一个时间卷积操作具体描述为:h_t'=Σ_j(W[j]*h_{t-j}),其中,*是卷积操作,W[j]是在第j步的卷积核,Σ_j表示对所有的j进行求和。这个操作是在每个节点上分别进行的。还包含图卷积操作,其使用邻接矩阵A和特征矩阵H进行计算。如果我们假设A是邻接矩阵,H是所有节点的特征矩阵,那么图卷积的操作具体描述为:H'=σ(AHΘ),其中,Θ是待学习的权重矩阵,σ是非线性激活函数(比如ReLU)。这个操作帮助我们获取图中节点的空间特征。这两种操作是交替进行的。首先进行时间卷积,然后进行图卷积,然后再进行时间卷积。

(5)训练时空图卷积网络(STGCN)模型,这需要多次周期(epoch),每次周期(epoch)是对整个训练数据集进行一次前向传播和一次反向传播。每次周期(epoch)会将数据分成多个批次进行处理。每个批次的数据会被输入到模型中,计算出预测结果,然后通过损失函数计算出损失。接着,利用反向传播算法计算出损失对每个参数的梯度,然后通过优化器按照这些梯度来更新模型的参数。

(6)验证模型,验证过程发生在每个训练周期(epoch)结束时。此时,我们使用训练好的模型对验证集进行预测,并比较预测结果与验证集的真实结果。为了衡量预测结果的准确性,本实例主要计算,MAE(平均绝对误差),其计算公式具体为:MAE=(1/n)*Σ|y_true-y_pred|这里的y_true表示实际值,y_pred表示预测值,Σ表示求和,||表示绝对值,n表示总的样本数量。该公式首先计算每个预测值与实际值之间的差的绝对值,然后计算所有绝对误差的平均值。以及RMSE(均方根误差)的计算公式为:RMSE=sqrt((1/n)*Σ(y_true-y_pred)^2)这里的y_true表示实际值,y_pred表示预测值,Σ表示求和,sqrt表示平方根,n表示总的样本数量。该公式首先计算每个预测值与实际值之间的差的平方,然后计算所有平方误差的平均值,最后取平均平方误差的平方根。

(7)将训练完毕.pt文件进行保存,其是模型权重的文件格式。在深度学习中,模型权重是模型学习的结果,是模型对输入数据进行转换以进行预测的参数。以便随时加载这权重来恢复模型的状态,而无需从头开始训练。

(8)最后应用实际数据使用模型进行预测,构建真实数据矩阵,使用模型进行预测,保存模型的输出,在本实例中,输入为地下水污染物的12期监测的真实数据,最后输出为之后3期的预测数据,即地下水污染物浓度预测值。

需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

相关技术
  • 用于涂在引导器的医疗器械表面的药物涂层组合物及利用其制备得到的医疗器械
  • 一种医疗器械涂层及其制备方法与含有该涂层的医疗器械
技术分类

06120116525430