掌桥专利:专业的专利平台
掌桥专利
首页

一种基于机器学习的场地地下水和土壤污染风险诊断与管控方法

文献发布时间:2024-04-18 20:01:23


一种基于机器学习的场地地下水和土壤污染风险诊断与管控方法

技术领域

本发明涉及土壤重金属污染分析技术领域,特别是涉及一种基于机器学习的场地地下水和土壤污染风险诊断与管控方法。

背景技术

随着城市布局调整和产业结构升级,大量化工、石油、塑料、炼焦、热电、钢铁、电镀、有色治炼等重污染企业搬迁或关停,遗留大量的污染场地。污染场地中的重金属或有机污染物对土壤、地下水形成长期污染,极大威胁人类健康。污染场地修复成为环保行业的热点问题。但是,由于场地污染深度大、地理环境特殊等原因,部分污染场地无法在短期内实施达标修复,需采用风险管控方法阻断场地内的污染物迁移或挥发途径,以避免污染物扩散。现有的污染场地风险管控技术无法对中长期场地污染风险进行准确的分类分级,不利于风险管控。

发明内容

本发明的目的是提供一种基于机器学习的场地地下水和土壤污染风险诊断与管控方法,通过建立场地污染风险分类、分级指标体系以及指标规则,明确分类分级标准,并通过BP神经网络和SVM算法,构建分类分级模型,实现快速、准确地场地污染风险分类分级,为风险管控提供可靠参考。

为实现上述目的,本发明提供了如下方案:

一种基于机器学习的场地地下水和土壤污染风险诊断与管控方法,该方法包括以下步骤:

构建场地污染风险分类分级案例库,包括有风险案例和无风险案例;

根据场地污染风险判定需求及场地污染风险分类分级案例,分别建立场地污染风险分类和分级指标体系;

分别确定场地污染风险分类和分级指标规则;

根据场地污染风险分类和分级指标规则,对场地污染风险分类和分级的各指标进行赋分,并运用层次分析法中1~9标度法对各指标的分值进行一致性检验;

通过调整BP神经网络和SVM的各项参数,优化最佳的分类、分级模型,基于BP神经网络进行风险分类,基于SVM进行风险分级,并在MATLAB中完成目标案例的风险分类分级预测,根据风险分类分级的预测结果进行风险管控。

进一步地,所述根据风险分类分级的预测结果进行风险管控,具体包括:

针对在产+高风险场地,从源头污染物减排、生产技术升级改造、污染物治理能力提升三方面开展风险管控;针对在产+低风险场地,进行长期监测,在厂区不同功能区布设长期监测点位并进行样品采集及分析测试;针对具备修复条件的关闭搬迁+高风险场地,从治理修复和被动修复-衰减两方面开展风险管控;针对不具备修复条件的关闭搬迁+高风险场地,采取工程控制、长期监测和制度控制相结合的方法;针对关闭搬迁+低风险场地,采取长期监测和准入管理相结合的方法。

根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于机器学习的场地地下水和土壤污染风险诊断与管控方法,针对污染场地风险管控的技术要求,结合有风险案例和无风险案例,构建场地污染风险分类、分级指标体系以及指标规则,明确分类分级标准,并综合BP神经网络和SVM算法,构建分类、分级模型,大幅减少风险评价指标数量,缩短传统风险评价工作流程(如省去初步调查、详细调查环节),缩减传统风险评价工作量,节省工作成本投入,缩短决策时间,实现快速、智能、准确地场地污染风险分类分级,为风险管控提供可靠参考,本发明操作简单、简单实用、技术可靠、易于工程化实施,可用于有机污染场地、重金属污染场地和复合污染场地的中长期风险管控,具有重要的环保和社会意义。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于机器学习的场地地下水和土壤污染风险诊断与管控方法的流程图;

图2为训练函数对BP神经网络预测准确性的影响示意图;

图3为学习率对BP神经网络预测准确性的影响示意图;

图4为神经元个数对BP神经网络预测准确性的影响示意图;

图5为本发明实施例BP神经网络支持的风险分类结果示意图;

图6为本发明实施例支持向量机支持的风险分类结果示意图;

图7为本发明实施例BP神经网络支持的风险分级结果示意图;

图8为本发明实施例支持向量机支持的风险分级结果示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于机器学习的场地地下水和土壤污染风险诊断与管控方法,通过建立场地污染风险分类、分级指标体系以及指标规则,明确分类分级标准,并通过BP神经网络和SVM算法,构建分类分级模型,实现快速、准确地场地污染风险分类分级,为风险管控提供可靠参考。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示,本发明提供的基于机器学习的场地地下水和土壤污染风险诊断与管控方法,包括以下步骤:

收集和整理场地污染风险分类分级案例,构建场地污染风险分类分级案例库,包括有风险案例和无风险案例;

根据场地污染风险判定需求及场地污染风险分类分级案例,分别建立场地污染风险分类和分级指标体系;

分别确定场地污染风险分类和分级指标规则;

根据场地污染风险分类和分级指标规则,对场地污染风险分类和分级的各指标进行赋分,并运用层次分析法中1~9标度法对各指标的分值进行一致性检验;

通过调整BP神经网络和SVM的各项参数,优化最佳的分类分级模型,基于BP神经网络进行风险分类,基于SVM进行风险分级,并在MATLAB中完成目标案例的风险分类分级预测,根据风险分类分级的预测结果进行风险管控。

示例地,所述收集和整理场地污染风险分类分级案例,具体包括:

借助全国土壤环境信息平台、200个试点示范项目、文献资料等,收集和整理场地土壤污染风险分类分级案例(包括初步调查报告、详细调查报告、风险评估报告),获得274个有风险案例和55个无风险案例,涉及化学原料和化学制品制造业,有色金属冶炼和压延加工业,黑色金属冶炼和压延加工业,金属制品业,医药制造业,石油、煤炭及其他燃料加工业等。

参考《重点行业企业用地调查信息采集技术规定(试行)》附录3中关闭搬迁企业地块信息调查表,确定场地污染风险分类分级案例框架;将收集的案例按照该案例框架进行整理;最后,将所有案例进行汇总形成案例库。

本发明所应用的大数据算法的基本原理如下:

1)BP神经网络

BP是误差反向后传(BackPropagation)的英文缩写,原理是利用输出后的误差估计输出层的直接前导层,再利用这个误差估计更前一层的误差,如此一层层地反传下去,就可以获得所有其他各层的误差估计。

2)支持向量机

SVM是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM采用不同的内积函数(核函数)将导致不同的算法。在使用SVM对数据进行训练时,在准确性符合一定要求条件下模型的泛化能力应尽可能更好,以防止在训练过程中发生过拟合现象。因此,在训练时,需要不断的调整gamma和c值,并对数据不断地进行交叉验证,以找到合适的gamma和c值。gamma值越大,映射的维度越高,训练的结果越好,但是越容易引起过拟合,即泛化能力低;gamma值越小,训练的结果准确率低,拟合程度差。另一方面,c值越大,分类越严格,正确率越高,但相应的泛化能力降低;c值越小,意味着有更大的错误容忍度,但正确率越低。

基于案例库,所述基于机器学习的场地地下水和土壤污染风险诊断与管控方法,具体包括:

1)确定场地污染风险管控源案例

从案例库中选取65个有风险案例和55个无风险案例,作为场地污染风险分类分级源案例,涉及化学原料和化学制品制造业53个,非金属矿物制品业4个,有色金属冶炼和压延加工业8个,黑色金属冶炼和压延加工业12个,金属制品业20个,石油、煤炭及其他燃料加工业3个和其他行业20个。

2)构建场地污染风险分类、分级指标体系

参考《重点行业企业用地调查信息采集技术规定(试行)》(环办土壤〔2017〕67号)中附录3的关闭搬迁企业地块信息调查表,分别建立场地污染风险分类和分级指标体系。

3)确定场地污染风险分类和分级指标规则

基于《土壤环境质量建设用地土壤污染风险管控标准(试行)》(GB 36600-2018),参照《土地利用现状分类》(GB/T 21010-2017)和《地下水水质标准》(DZ/T 0290-2015)中Ⅲ类水标准,分别确定场地污染风险分类和分级指标规则。

4)指标赋分一致性检验

运用层次分析法中1~9标度法(如表1所示)对各指标分值进行一致性检验,通过检验则认为分值可接受。

表1因子相对重要性标度及其对应含义

在MATLAB软件中,根据各特征指标信息的特征值中最大值和特征指标信息的数目计算一致性指标,如公式(1)所示。

式中,I

根据一致性指标和预设随机一致性指标,计算一致性比率,如公式(2)所示:

式中,R

表2随机一致性指标分值

5)大数据算法优化

通过调整BP神经网络和SVM的各项参数,优化最佳的分类和分级模型,并在MATLAB中完成目标案例的分类分级预测。选用相关系数(R

式中:n为测试样本数,A(i)为样本的实测值,P(i)为样本的预测值。

其中,BP神经网络和SVM参数优化的具体过程如下:

(1)BP神经网络优化

选取合适的BP神经网络参数对风险判定结果准确性有重要影响,影响BP神经网络参数有训练函数、学习率、隐含层神经元个数。目前,常用的训练函数有梯度下降法(traingd)、有动量的梯度下降法(traingdm)、自适应学习率梯度下降法(traingda)、自适应学习率动量梯度下降法(traingdx)、共轭梯度法(traincg)、拟牛顿算法(trainbfg)及Levenberg-Marquardt算法(trainlm)等7种。本发明中,训练函数对BP神经网络预测准确性的影响见图2。trainlm具有最新小的MSE(0.00043),且不存在最大错误次数的影响(如图2)。因此,选取trainlm为BP神经网络的训练函数。

学习率对BP神经网络预测准确性的影响见图3。在训练次数接近一致情况下,学习率为0.1时,模型的MSE为0.000289(图3)。因此,选取模型的学习率为0.1。

神经元个数对BP神经网络预测准确性的影响见图4。当隐含层神经元个数为6时,模型均方误差最小(0.000314)(图4)。

综上所述,通过调整模型超参数,在trainlm为训练函数、隐含层神经元取6、学习率取0.1时,模型的性能最好,拟合效果好,收敛速度快。

(2)SVM参数优化

如表3所示,模型2与其他两个模型相比,正确率最高,达73.3%。可见,核函数为linear、cost为1、gamma为0.08时模型效果最好。

表3支持向量机不同参数对比

本发明涉及场地污染风险分类以及场地污染风险分级,采用的指标体系以及模型不同,具体包括:

一、场地污染风险分类

(1)指标体系构建

根据场地污染风险判定需求及收集的有风险案例和无风险案例信息,构建场地污染风险分类指标体系,对场地污染是否存在风险进行判定(表4)。表格中,E

表4风险分类指标体系

(2)计算规则建立

1)干湿指数规则

干湿指数规则见公式(5):

式中,DWI表示干湿指数(无量纲);P表示多年平均降水量(mm);E

2)特征污染物规则

土壤特征污染物和地下水特征污染物中SVOCs、VOCs、重金属和无机物、石油烃主要关注《土壤环境质量建设用地土壤污染风险管控标准(试行)》(GB 36600-2018)中85项污染物。土壤污染物倍数计算见公式(6)。

式中,n为土壤中浓度超过筛选值的污染物种类数量;C

地下水污染物倍数计算见公式(7):

式中,n为地下水中浓度超过筛选值的污染物种类数量;C

3)土地利用规划

基于《土地利用现状分类》(GB/T 21010-2017)和《土壤环境质量建设用地土壤污染风险管控标准(试行)》(GB 36600-2018),根据场地未来规划确定的场地土地利用规划等级建立土地利用规划规则(表5)。

表5土地利用规划规则

4)城市等级

根据《关于调整城市规模划分标准的通知》(国发〔2014〕51号)确定城市等级,其中A类等级城市包括北京、上海、广州和深圳4个;B类等级城市包括重庆、天津、杭州和南京等21个城市;C类等级城市包括太原、呼和浩特、贵阳和兰州等41个城市;D类等级城市包括银川、西宁、拉萨和三亚等62个城市;E类等级城市包括肇庆、清远、汕尾和梅州等190个城市;F类为其他城市(表6)。

表6城市等级赋分规则

5)包气带的影响和潜水含水层的影响

结合源案例和目标案例场地内包气带和潜水含水层实际,确定包气带渗透系数最大的岩性赋分规则和潜水含水层最主要岩性和赋分规则,包气带渗透系数最大的岩性及其赋值的对应关系见表7和表8。

表7包气带渗透系数赋分规则

表8含水层介质规则

(3)指标赋分

根据指标规则,给场地污染风险分类指标进行赋分(表9)。

表9场地污染风险分类指标分值

/>

/>

(4)分值一致性检验

根据风险分类指标赋分一致性检验矩阵,如公式(8),进行判断矩阵的一致性检验,确定一致性指标(I

(5)分类模型筛选

BP神经网络和支持向量机均能较好地进行分类预测,表现为R

表10风险判定误差结果对比

二、场地污染风险分级

(1)指标体系构建

参考《企业地块风险筛查与风险分级技术规定》,分别建立风险分级有关土壤指标体系和地下水指标体系(表11和表12)。

表11风险分级有关土壤指标体系

/>

/>

表12风险分级有关地下水指标体系

/>

(2)指标赋分

参考《企业地块风险筛查与风险分级技术规定》,进行场地污染风险分级有关土壤指标和地下水指标赋分(表13和表14)。

表13风险分级土壤指标赋分

/>

表14风险分级地下水指标赋分

/>

/>

(3)分值一致性检验

根据场地污染风险分级土壤指标赋分检验矩阵,如公式(9),在进行风险分级矩阵一致性检验时,I

(4)场地风险分值计算与分级

根据《企业地块风险筛查与风险分级技术规定》和收集到的污染地块基础信息,计算场地风险分值(公式10),并根据分值将场地分为低风险、中风险和高风险(表15)。

式中:S为地块风险筛查总分,S

表15风险等级划分规则

(5)分级模型筛选

如图7和图8所示,BP神经网络和支持向量机均能较好地进行分类预测,表现为R

表16风险分级误差结果对比

进一步地,所述根据风险分类分级的预测结果进行风险管控,具体包括:

(1)场景1:在产+高风险场地。主要从源头污染物减排、生产技术升级改造、污染物治理能力提升等三方面开展风险管控。其中,源头污染物减排主要采取环保生产原料和辅料替换,从生产线源头减少污染物产生;生产技术改造主要包括生产技术升级、落后产能淘汰、生产设备改造等措施,提高生产效率、减少源头原料用量,从而减少后端污染物产生和排放;污染物治理能力提升包括企业治污设施升级改造、固废堆存场所整治等,降低污染物排放浓度、减少环境扰动。

(2)场景2:在产+低风险场地。主要采取长期监测措施,防止风险发生。在厂区不同功能区布设长期监测点位并进行样品采集及分析测试,实现控制潜在暴露风险的目的。长期监测点位布设时,需在生产车间、固废和原料堆存场所、排污管线布设区域进行加密布点,从而得以及时评估和发现环境风险。

(3)场景3:具备修复条件的关闭搬迁+高风险场地。主要从治理修复和被动修复-衰减两方面开展风险管控。其中,治理修复是利用一系列工程技术开展场地污染治理,具体工程技术包括客土、换土、翻土、热解析、固化稳定化、无害化填埋、土壤淋洗、氧化还原、植物修复等;被动修复-衰减通过利用工程技术及场地内自然条件,依靠自然发生的生物、化学或物理过程对污染物进行固定、削减或去除,具体技术包括渗透反应格栅、强化监测自然衰减等,主要适用于有机污染物迁移较慢、治理修复预算相对较低的场地。

(4)场景4:不具备修复条件的关闭搬迁+高风险场地。主要采取工程控制、长期监测和制度控制相结合的方法,防止风险扩散。其中,工程控制主要利用各种阻隔工程,限制污染物迁移,切断污染源与受体之间的暴露途径,达到降低污染暴露风险和保护受体安全的目的,具体工程控制技术包括泥浆墙、灌浆墙、板桩墙、土壤原位搅拌、土工膜、衬层等;长期监测主要环节与在产低+风险场地长期监测一致,主要区别为关闭搬迁+高风险场地监测点位设置时,需与场地调查结果相结合,在污染物浓度较高的地区加密布点;在采取长期监测措施情况下,同步开展的制度控制包括政府控制、所有权控制、强制与许可制度、信息公开(如设立标识牌)等,确保场地周边土壤环境和人居环境安全。

(5)场景5:关闭搬迁+低风险场地。主要采取长期监测和准入管理相结合的方法,防范环境风险。其中,长期监测点位布设时,需在曾经的生产区、原料堆存区及场地周边敏感目标区域设置监测点位;在用途变更时,需当地生态环境管理部门出具场地无风险证明后,方可进入用地审批程序。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种风力发电机联轴器对中状态智能监测系统及方法
  • 一种智能脱轨器状态监测系统及其组网通信方法
  • 一种换流站设备运行参数及运行环境智能监测系统及方法
  • 一种接地线挂接状态的监测装置及监测方法和接地设备
  • 智能制造下的设备状态监测系统及其监测方法
  • 运动状态监测装置、系统、智能穿戴设备及其监测方法
技术分类

06120116553800