掌桥专利:专业的专利平台
掌桥专利
首页

地下水污染自然衰减能力预测方法及模型训练方法

文献发布时间:2023-06-19 19:30:30


地下水污染自然衰减能力预测方法及模型训练方法

技术领域

本发明涉及环保技术领域,特别涉及一种基于微生物群落组成的用于预测地下水污染自然衰减能力的模型训练方法,以及地下水污染自然衰减能力预测方法。

背景技术

监测自然衰减技术(Monitored Natural Attenuation,MNA)是利用污染场地天然存在的自然衰减作用使污染物浓度和总量减小,在合理的时间范围内达到污染修复目标的一种污染修复方法。MNA的基本原理为:通过实施有计划的监控策略,在无人为干预下,依据场地自然发生的物理、化学及生物作用(包括稀释、扩散、挥发、吸附、化学性或生物性稳定、生物降解以及放射性衰减等),使得土壤和地下水中污染物的浓度、毒性、移动性降低到风险可接受水平。适合使用MNA的污染场地广泛,包括地下储油罐泄漏场地、垃圾填埋场地、工业污染场地等。MNA适用的污染物主要为有机污染物,包括苯系物(BTEX)、石油烃、多环芳烃、有机溶剂等。MNA相比其他主动修复手段具有成本较低、操作实施简便、环境影响小、绿色安全以及污染物降解彻底等优势,日益受到重视。

MNA并非是“消极不作为”的场地管理,相反它需要一系列非常专业的技术和方法保障,包括场地调查与概念模型构建、风险评价、自然衰减持续有效性的评价与验证、监测系统的构建等。在实际应用中,如何评估MNA可行性并预测自然衰减趋势成为了该技术普及应用的难题。以地下水污染为例,有机污染物的自然衰减速率受到污染物性质、水文地质条件、功能微生物组成与活性等因素的影响,常规的预测方法需要先获取一段较长时间的监测数据,且其预测结果具有较大的不确定性。因此现阶段还缺乏能够准确预测地下水污染自然衰减能力的有效方法。

发明内容

本发明的目的是针对现有技术存在的问题,提供一种高效、准确的地下水污染自然衰减能力预测方法及模型训练方法。

为达到上述目的,本发明采用的技术方案是:

一种用于预测地下水污染自然衰减能力的模型训练方法,所述模型训练方法包括以下步骤:

S1、以已监测场地多个点位不同时段的污染地下水水样作为待训练样本集,获取每份样本中的微生物群落组成、特征污染物的自然衰减速率及自然衰减显著性;

S2、以所述微生物群落组成为输入值,以自然衰减显著性为输出值,训练随机森林分类模型,得到用于预测地下水污染自然衰减是否可行的第一模型;

S3、以所述微生物群落组成为输入值,以所述自然衰减速率为输出值,训练人工神经网络模型,得到用于预测地下水污染自然衰减速率的第二模型。

在一些实施方式中,在所述S1中,测量每份样本中的特征污染物浓度,在计算所述自然衰减速率时,采用反应动力学方程进行拟合,从拟合结果的绝对误差向量中舍弃离群值样本,获得所述特征污染物的自然衰减速率常数,自然衰减速率=特征污染物浓度×自然衰减速率常数。

在一些实施方式中,在所述S1中,将所述待训练样本集分为显著衰减组和不显著衰减组;在所述S3中,以所述显著衰减组作为第二待训练样本集,按照微生物群落组成重要度排序,挑选数量不超过所述第二待训练样本集大小的重要物种及其相对丰度作为输入值。

在一些实施方式中,在所述S3之前还包括S301:利用随机森林分类模型中的平均精确率减少参数,评价微生物群落组成对自然衰减显著性的重要度。

在一些实施方式中,在所述S1中,测量每份样本中的特征污染物浓度,采用反应动力学方程进行拟合,获得所述特征污染物的自然衰减速率常数,将所述自然衰减速率常数为正且显著性P<0.05的样本划分为所述显著衰减组,将其他样本划分为所述不显著衰减组。

在一些实施方式中,在所述S3中,所述第二待训练样本集中,按照训练集包含80%样本、测试集包含20%样本的方式进行交叉验证,以平均绝对百分比误差评估所述第二模型的准确度。

在一些实施方式中,在所述S3之前还包括S302:对所述人工神经网络模型进行隐藏神经元数和隐藏层数的筛选。

在一些实施方式中,在所述S2中,通过使用袋外样本同步进行模型交叉验证。

在一些实施方式中,在所述S1中,所述特征污染物为有机物,所述待训练样本集中各样本的特征污染物类型基本一致;在所述S2中,所述微生物群落组成为属水平成员的相对丰度。

一种地下水污染自然衰减能力预测方法,所述预测方法包括以下步骤:

T1、采集待预测场地的地下水水样,获取所述水样的微生物群落组成,输入至第一模型中,获得所述待预测场地的特征污染物自然衰减是否可行的预测结果;

T2、提取所述水样的微生物群落组成中的重要物种丰度,输入至第二模型中,获得所述待预测场地的特征污染物自然衰减速率预测结果;

其中,所述第一模型、所述第二模型均采用权利要求1至9任一项所述的用于预测地下水污染自然衰减能力的模型训练方法进行训练。

由于上述技术方案的运用,本发明与现有技术相比具有下列优点:本发明中基于微生物群落组成对污染地下水的自然衰减能力进行预测,由于微生物群落组成受到污染物性质及水文地质条件等环境因素的影响,可同时作为环境因素的响应,因此利用微生物信息对污染物自然衰减能力进行预测具有较高的准确度和可信度。本发明中直接利用已监测场地的地下水数据进行模型训练,得到的预测模型具有广泛适用性,因而无需再事先对待预测场地进行长期监测就能得到预测结果,成本较低、方便便捷、省时省力。本发明中嵌套使用随机森林分类模型和人工神经网络模型进行训练,创新应用于监测自然衰减技术领域,经过试验验证,得到的训练模型能够较为准确地预测污染场地地下水的自然衰减可行性及自然衰减速率,预测结果可靠。

附图说明

图1是为本实施例中地下水污染自然衰减能力预测模型训练方法及预测方法的流程示意图;

图2是为本实施例中随机森林分类模型的准确率测试图;

图3是为本实施例中微生物群落组成重要度排名前15名的属水平成员示意图;

图4是为本实施例中人工神经网络模型的准确率测试图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域的技术人员理解。

本实施例提供一种基于微生物群落组成的地下水污染自然衰减能力预测方法,尤其适用于对有机污染地下水的自然衰减能力预测。该预测方法涉及对随机森林(RandomForest)分类模型及人工神经网络(Artificial Neural Network,ANN)模型的训练,因此本实施例同时提供一种用于预测地下水污染自然衰减能力的模型训练方法。

参见图1所示,本实施例中模型训练方法的基本步骤如下:

S1、以已监测场地多个点位不同时段的污染地下水水样作为待训练样本集,获取每份样本中的微生物群落组成、特征污染物的自然衰减速率及自然衰减显著性;

S2、以微生物群落组成为输入值,以自然衰减显著性为输出值,训练随机森林分类模型,得到用于预测地下水污染自然衰减是否可行的第一模型;

S3、以微生物群落组成为输入值,以自然衰减速率为输出值,训练人工神经网络模型,得到用于预测地下水污染自然衰减速率的第二模型。

基于上述模型训练方法得到的第一模型与第二模型,本实施例中的预测方法如下:

T1、采集待预测场地的地下水水样,获取水样的微生物群落组成,输入至第一模型中,获得待预测场地的特征污染物自然衰减是否可行的预测结果;

T2、提取水样的微生物群落组成中的重要物种丰度,输入至第二模型中,获得待预测场地的特征污染物自然衰减速率预测结果。

参见图2至图4所示,下面进一步以苯系物污染地下水为例,具体阐述本实施例中的模型训练方法。

S1、以已监测场地多个点位不同时段的污染地下水水样作为待训练样本集,待训练样本集中各样本的特征污染物类型基本一致,本实施例中具体包括苯系物污染物浓度及微生物群落组成的长期监测数据,共计454个样本,构成第一待训练样本集。

基于反应动力学方程对各样本的自然衰减趋势进行拟合,并基于离群值检验方法进行自然衰减趋势校正,从拟合结果的绝对误差向量中舍弃离群值样本,以提高拟合精度,获得苯系物的自然衰减速率常数,进而计算得到自然衰减速率。本实施例中具体基于一级反应动力学方程对各样本的自然衰减趋势进行拟合,自然衰减速率=特征污染物浓度×自然衰减速率常数。

进一步地,根据自然衰减趋势拟合结果,将自然衰减速率常数为正且显著性P<0.05的样本划分为显著衰减组,将其他样本划分为不显著衰减组。

S2、以第一待训练样本集的微生物群落组成,即各样本微生物群落中各属水平成员的相对丰度,作为模型输入,以样本中苯系物是否显著衰减作为模型输出,训练随机森林分类模型,得到用于预测地下水污染自然衰减是否可行的第一模型。同时并通过使用袋外(Out-of-Bag)样本同步进行模型交叉验证。如图2所示,第一模型中自然衰减可行性预测准确率达到80%的样本占总样本的76.8%。

S301、利用随机森林分类模型中的平均精确率减少(Mean Decrease Accuracy)参数,评价微生物群落组成对苯系物自然衰减显著性的重要度,筛选出关键物种。图3列举了重要度排名前15名的属水平成员。

S302、在训练人工神经网络模型之前,先进行隐藏神经元数和隐藏层数优选,以降低模型过拟合的可能性。

S3、选取苯系物发生显著衰减的样本,共计204个,作为第二待训练样本集。按照微生物群落组成重要度排序,挑选数量不超过第二待训练样本集大小的重要物种及其相对丰度作为输入值,此处具体以重要度排名前203名的微生物群落成员相对丰度作为模型输入,以苯系物自然衰减速率作为模型输出,训练人工神经网络模型,得到用于预测地下水污染自然衰减速率的第二模型。同时按照训练集包含80%样本、测试集包含20%样本的方式进行交叉验证,以平均绝对百分比误差(MAPE)评估模型准确度,MAPE的计算公式如下:

其中,A

综上所述,本实施例中基于微生物群落组成的地下水污染自然衰减能力的预测方法及模型训练方法,具有广泛适用性,操作简单,耗时较短,能够对各种有机污染地下水自然衰减的可行性及自然衰减速率进行较为准确的预测,具有较好的应用前景。

上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围内。

技术分类

06120115937802