掌桥专利:专业的专利平台
掌桥专利
首页

区域土壤重金属污染指数预测方法及装置

文献发布时间:2023-06-19 13:49:36


区域土壤重金属污染指数预测方法及装置

技术领域

本发明涉及环境污染预测领域,具体涉及一种区域土壤重金属污染指数 预测方法及装置。

背景技术

重金属元素污染土壤的时间周期长,重复采样测取土壤重金属含量,评 估其土壤重金属污染状态的可行性很低,因此需要建立相关预测模型来预测 土壤重金属内梅罗综合污染指数。

发明内容

为了解决上述问题,本发明提出一种区域土壤重金属污染指数预测方法 及装置。

根据本发明,提供一种区域土壤重金属污染指数预测方法,所述区域土 壤重金属污染指数预测方法可包括:获取土壤样本的重金属含量数据;基于 所述重金属含量数据,确定土壤样本的各类重金属元素在不同污染状态下的 贡献程度的排序;以及通过将预定数量的贡献程度排序靠前的重金属元素作 为支持向量回归模型的输入参数,对土壤内梅罗综合污染指数进行预测。

根据本发明的一个实施例,所述污染状态可包括安全状态、尚且安全状 态、轻度污染状态、中度污染状态和重度污染状态。

根据本发明的一个实施例,确定土壤样本的各类重金属元素在不同污染 状态下的贡献程度的排序可包括:将重金属含量数据和污染状态作为随机森 林算法训练样本集,构建随机森林算法污染分类模型以对各类重金属元素在 不同污染状态下的贡献程度进行排序。

根据本发明的一个实施例,所述区域土壤重金属污染指数预测方法还可 包括:利用遗传算法对支持向量回归模型的惩罚函数和核函数参数进行寻优。

根据本发明的一个实施例,利用遗传算法对支持向量回归模型的惩罚函 数和核函数参数进行寻优可包括:设置惩罚函数与核函数参数的取值范围; 对随机产生的一组支持向量回归参数进行编码;确定种群中各个个体的适应 度函数值;对当前种群进行遗传操作,直到当前种群满足收敛条件;将得到 的惩罚函数与核函数参数确定为支持向量回归模型的最优的惩罚函数和核函 数参数,以建立遗传算法-支持向量回归模型;确定遗传算法-支持向量回归模 型是否达到预设的精度,如果确定遗传算法-支持向量回归模型达到预设的精 度,则输出遗传算法-支持向量回归模型,否则重新设置惩罚函数与核函数参 数的取值范围并重新建立遗传算法-支持向量回归模型。

根据本发明的一个实施例,通过计算误差函数值来确定适应度函数值的 大小,将适应度函数值大的个体遗传至下一代,其中,所述误差函数值的大 小与所述适应度函数值的大小成反比。

根据本发明的一个实施例,所述遗传操作可包括选择、交叉和变异中的 至少一种。

根据本发明,提供一种区域土壤重金属污染指数预测装置,所述区域土 壤重金属污染指数预测装置可包括:数据获取单元,用于获取土壤样本的重 金属含量数据;排序单元,用于基于所述重金属含量数据,确定土壤样本的 各类重金属元素在不同污染状态下的贡献程度的排序;以及预测单元,用于 通过将预定数量的贡献程度排序靠前的重金属元素作为支持向量回归模型的 输入参数,对土壤内梅罗综合污染指数进行预测。

根据本发明的一个实施例,所述污染状态可包括安全状态、尚且安全状 态、轻度污染状态、中度污染状态和重度污染状态。

根据本发明的一个实施例,排序单元可被配置为:将重金属含量数据和 污染状态作为随机森林算法训练样本集,构建随机森林算法污染分类模型以 对各类重金属元素在不同污染状态下的贡献程度进行排序。

根据本发明的一个实施例,所述区域土壤重金属污染指数预测装置还可 包括:寻优单元,用于利用遗传算法对支持向量回归模型的惩罚函数和核函 数参数进行寻优。

根据本发明的一个实施例,寻优单元可被配置为:设置惩罚函数与核函 数参数的取值范围;对随机产生的一组支持向量回归参数进行编码;确定种 群中各个个体的适应度函数值;对当前种群进行遗传操作,直到当前种群满 足收敛条件;将得到的惩罚函数与核函数参数确定为支持向量回归模型的最 优的惩罚函数和核函数参数,以建立遗传算法-支持向量回归模型;确定遗传 算法-支持向量回归模型是否达到预设的精度,如果确定遗传算法-支持向量回 归模型达到预设的精度,则输出遗传算法-支持向量回归模型,否则重新设置 惩罚函数与核函数参数的取值范围并重新建立遗传算法-支持向量回归模型。

根据本发明的一个实施例,寻优单元可通过计算误差函数值来确定适应 度函数值的大小,将适应度函数值大的个体遗传至下一代,其中,所述误差 函数值的大小与所述适应度函数值的大小成反比。

根据本发明的一个实施例,所述遗传操作可包括选择、交叉和变异中的 至少一种。

根据本发明,提供一种计算机可读存储介质,所述计算机可读存储介质 上存储有用于执行前述任一实施例所述的区域土壤重金属污染指数预测方法 的计算机程序。

根据本发明,提供一种计算装置,所述计算装置包括存储部件和处理器, 其中,存储部件中存储有计算机可执行指令,当所述计算机可执行指令被所 述处理器执行时,执行前述任一实施例所述的区域土壤重金属污染指数预测 方法。

通过采用本发明,不仅能够通过计算得出各类重金属元素在土壤中的表 象情况,从而根据不同重金属元素的贡献程度来制定不同的治理方案;另外 能够实现通过小样本数据预测土壤重金属污染状况,从而有效地避免数据缺 失或数据不足对污染预测造成的影响。

附图说明

通过下面结合附图描述实施例,本发明的上述和/或其他目的和优点将变 得更加清楚,其中:

图1是根据本发明的实施例的区域土壤重金属污染指数预测方法的流程 图;

图2是根据本发明的实施例的随机森林-遗传算法-支持向量回归模型的 框图;

图3是根据本发明的实施例的利用遗传算法对支持向量回归模型的惩罚 函数和核函数参数进行寻优的流程图;

图4示出了根据本发明的实施例的区域土壤重金属污染指数预测装置的 结构框图;以及

图5示出了根据本发明的实施例的计算装置的结构示意图。

具体实施方式

根据需要,在此公开本发明的具体实施例;然而,应当理解的是,所公 开的实施例仅为本发明的示例,其可以以各种可替代形式实施。附图无需按 比例绘制;可夸大或最小化一些特征以示出特定组件的细节。因此,此处所 公开的具体结构和功能细节不应被解释为限制,而仅仅作为用于教导本领域 技术人员以多种形式利用本发明的代表性基础。

重金属元素污染土壤的时间周期长,重复采样测取土壤重金属含量,评 估其土壤重金属污染状态的可行性低,因此需要建立相关预测模型来计算各 类重金属元素对于土壤污染的贡献程度,并且预测土壤重金属内梅罗综合污 染指数。内梅罗指数法是进行综合污染指数计算的常用方法之一,该方法首 先求出各因子的分指数,然后求出各个分指数的平均值,并且利用最大分指 数和各个分指数的平均值来计算综合污染指数。

获取在不同污染状态时土壤重金属含量数据,定义区域A土壤各个重金 属的含量参数为Z。

在式(1)中,P

在式(2)中,P

土壤中的各种不同的重金属对需要预测的土壤综合污染指数的影响程度 并不相同,因此需要对不同种类的重金属元素在不同污染状态下的重要性评 分(或贡献程度)进行排序,选取重要性评分高的重金属进行后续的回归预 测。具体地,通过使用机器学习中的随机森林算法,首先对土壤中各类重金 属元素进行特征提取及重要性评分排序,之后选取重要性评分高的几种元素 作为支持向量回归算法的输入,从而达到估计土壤内梅罗综合污染指数的目 的。例如,支持向量回归模型可选用径向基函数(RBF),并且可利用遗传算法对支持向量回归算法的参数进行寻优。遗传算法是仿真生物遗传学和自然 选择机理,通过人工方式所构造的一类搜索算法,从某种程度上说遗传算法 是对生物进化过程进行的数学方式仿真。学习的目的是学到隐含在数据背后 的规律,对具有同一规律的学习集以外的数据经过训练的网络也能给出合适 的输出的能力被称为泛化能力,泛化能力可表征算法模型对未知数据的预测 能力,而通过如上所述的利用遗传算法对支持向量回归算法的参数进行寻优 能够提高支持向量回归模型的泛化性。

下面参照附图描述根据本发明的实施例的区域土壤重金属污染指数预测 方法及装置。

首先,参照附图描述根据本发明的实施例的区域土壤重金属污染指数预 测方法,图1是根据本发明的实施例的区域土壤重金属污染指数预测方法的 流程图。

如图1所示,在步骤101,获取土壤样本的重金属含量数据。在步骤102, 基于土壤样本的重金属含量数据,确定土壤样本的各类重金属元素在不同污 染状态下的贡献程度的排序。所述污染状态可包括安全状态、尚且安全状态、 轻度污染状态、中度污染状态和重度污染状态。在示例中,确定土壤样本的 各类重金属元素在不同污染状态下的贡献程度的排序可包括:将重金属含量 数据和污染状态作为随机森林算法训练样本集,构建随机森林算法污染分类 模型以对各类重金属元素在不同污染状态下的贡献程度进行排序。

在步骤103,可利用遗传算法对支持向量回归模型的惩罚函数和核函数 参数进行寻优。具体地,利用遗传算法对支持向量回归模型的惩罚函数和核 函数参数进行寻优可包括:设置惩罚函数与核函数参数的取值范围;对随机 产生的一组支持向量回归参数进行编码;确定种群中各个个体的适应度函数 值;对当前种群进行遗传操作,直到当前种群满足收敛条件;将得到的惩罚 函数与核函数参数确定为支持向量回归模型的最优的惩罚函数和核函数参数, 以建立遗传算法-支持向量回归模型;确定遗传算法-支持向量回归模型是否达 到预设的精度,如果确定遗传算法-支持向量回归模型达到预设的精度,则输 出遗传算法-支持向量回归模型,否则重新设置惩罚函数与核函数参数的取值 范围并重新建立遗传算法-支持向量回归模型。利用遗传算法对支持向量回归 算法的参数进行寻优能够提高支持向量回归模型的泛化性。

遗传算法中以个体适应度的大小来评定各个个体的优劣程度,从而决定 其遗传机会的大小。例如,可将目标函数值取非负值,并且是以求函数最大 值为优化目标,故可直接利用目标函数值作为个体的适应度。在另一示例中, 可通过计算误差函数值来确定适应度函数值的大小,将适应度函数值大的个 体遗传至下一代,其中,所述误差函数值的大小与所述适应度函数值的大小 成反比。种群是初始给定的多个解的集合,它是问题解空间的一个子集。个 体是种群中的单个元素,通常由一个用于描述其基本遗传结构的数据结构来表示,如用0,1组成的长度为l的串来表示个体。染色体是对个体进行编码 后得到的编码串。染色体中的每一位称为基因,若干基因构成的有效信息段 称为基因组。适应度函数是用来对种群中个体的适应性进行度量的函数。

遗传算法是对群体进行的进化操作,需要给其淮备一些表示起始搜索点 的初始群体数据。例如,可将种群规模的大小取为4,即群体由4个个体组 成,每个个体可通过随机方法产生(例如随机产生011101、101011、011100 和111001)。并且遗传操作可包括选择、交叉和变异中的至少一种。选择运算 (或称为复制运算)是将当前种群中适应度较高的个体按某种规则或模型遗 传到下一代种群中。通常,适应度较高的个体将有更多的机会遗传到下一代 种群中。交叉运算是遗传算法中产生新个体的主要操作过程,它以某一概率 相互交换某两个个体之间的部分染色体。在示例中,可采用单点交叉的方法, 其具体操作过程是:先对群体进行随机配对;其次随机设置交叉点位置;最 后再相互交换配对染色体之间的部分基因。变异运算是对个体的某一个或某 一些基因座上的基因值按某一较小的概率进行改变,它也是产生新个体的一 种操作方法。在示例中,可采用基本位变异的方法来进行变异运算,其具体 操作过程是:首先确定出各个个体的基因变异位置;然后依照某一概率将变 异点的原有基因值取反。

在步骤104,可通过将预定数量的贡献程度排序靠前的重金属元素作为 支持向量回归模型的输入参数,对土壤内梅罗综合污染指数进行预测。通过 上述操作,能够利用小样本数据对土壤内梅罗综合污染指数进行准确预测。

另外,应注意的是,图1所示的处理仅仅是示例,本领域技术人员应理 解的是,在不脱离本公开的范围和精神的情况下,可根据需要增加或省略特 定步骤(例如,可省略步骤103)。

图2是根据本发明的实施例的随机森林-遗传算法-支持向量回归模型的 框图。

如图2所示,在201,研究各个样本土壤中的重金属元素数据。污染状 态可包括安全状态、尚且安全状态、轻度污染状态、中度污染状态和重度污 染状态。在202,以各种重金属元素的参数Z和污染状态作为随机森林(RF) 训练样本集,以构建在当前污染状态下的RF污染分类模型(203)。可通过 使用机器学习中的随机森林算法,首先对土壤中各类重金属元素进行特征提 取及重要性评分排序,之后选取重要性评分高的几种元素作为支持向量回归 算法的输入,从而达到估计土壤内梅罗综合污染指数的目的。例如,支持向 量回归模型可选用径向基函数(RBF),并且可利用遗传算法(GA算法)对支 持向量回归算法的参数进行寻优(204)。在205,对随机森林-遗传算法-支持 向量回归模型(RF-GA-SVR模型)进行训练,从而得到满足预定精度的 RF-GA-SVR模型。进而在206,可利用满足预定精度的RF-GA-SVR模型对 土壤内梅罗综合污染指数进行准确地预测。

图3是根据本发明的实施例的利用遗传算法对支持向量回归模型的惩罚 函数和核函数参数进行寻优的流程图。

在步骤301,开始利用遗传算法对支持向量回归模型的惩罚函数和核函 数参数进行寻优的处理。在步骤302,对数据进行采集与处理。在步骤303, 对数据进行随机排序,设置训练集和测试集。在步骤304,对种群数量、最 大迭代数、惩罚因子和函数参数取值范围进行初始化。在步骤305,产生编 码种群。在示例中,每次训练后都会产生一组惩罚函数与核函数参数,对产 生的惩罚函数与核函数参数进行记录。在步骤306,计算个体的适应度。例 如,可计算每一个神经网络在训练集上产生的误差,并以此作为适应度函数。 在步骤307,确定个体的适应度是否满足终止条件。在示例中,可通过设置 最大进化迭代次数来判断个体的适应度是否满足终止条件,例如,可设定最 大进化迭代次数为100,如果模型迭代100次后适应度函数趋于平稳,则可 确定个体的适应度满足收敛条件。如果确定个体的适应度不满足终止条件, 则对个体进行遗传操作(例如,选择、交叉或变异)并重新计算个体的适应 度,重复上述操作直至个体的适应度满足终止条件。在步骤307确定个体的 适应度满足终止条件之后,执行步骤309以输出最优惩罚因子和核函数参数。 在步骤310,对训练集进行训练。在步骤311,确定模型是否达到预定的精度。 如果在步骤311确定模型达到预定的精度,则在步骤312输出模型并在步骤 313结束处理。如果在步骤311确定模型未达到预定的精度,则进行到步骤 304,重新对种群数量、最大迭代数、惩罚因子和函数参数取值范围进行初始 化,并再次执行步骤305至步骤310。在示例中,如果模型迭代了很多次也 不收敛,则说明参数取值范围设置的不合理,此时需要对参数取值范围进行 重新设置。

利用遗传算法优化支持向量回归预测模型的参数,能够降低人为选取参 数时的主观性,从而提高模型预测的精度。

图4示出了根据本发明的实施例的区域土壤重金属污染指数预测装置的 结构框图。

如图4所示,根据本发明的实施例的区域土壤重金属污染指数预测装置 可包括:数据获取单元401,用于获取土壤样本的重金属含量数据;排序单 元402,用于基于所述重金属含量数据,确定土壤样本的各类重金属元素在 不同污染状态下的贡献程度的排序;以及预测单元403,用于通过将预定数 量的贡献程度排序靠前的重金属元素作为支持向量回归模型的输入参数,对 土壤内梅罗综合污染指数进行预测。

所述污染状态可包括安全状态、尚且安全状态、轻度污染状态、中度污 染状态和重度污染状态。

排序单元402可通过如下操作来确定土壤样本的各类重金属元素在不同 污染状态下的贡献程度的排序:将重金属含量数据和污染状态作为随机森林 算法训练样本集,构建随机森林算法污染分类模型以对各类重金属元素在不 同污染状态下的贡献程度进行排序。

所述区域土壤重金属污染指数预测装置还可包括:寻优单元404,用于 利用遗传算法对支持向量回归模型的惩罚函数和核函数参数进行寻优。

在示例中,寻优单元404可通过如下操作来利用遗传算法对支持向量回 归模型的惩罚函数和核函数参数进行寻优:设置惩罚函数与核函数参数的取 值范围;对随机产生的一组支持向量回归参数进行编码;确定种群中各个个 体的适应度函数值;对当前种群进行遗传操作,直到当前种群满足收敛条件; 将得到的惩罚函数与核函数参数确定为支持向量回归模型的最优的惩罚函数 和核函数参数,以建立遗传算法-支持向量回归模型;确定遗传算法-支持向量 回归模型是否达到预设的精度,如果确定遗传算法-支持向量回归模型达到预 设的精度,则输出遗传算法-支持向量回归模型,否则重新设置惩罚函数与核 函数参数的取值范围并重新建立遗传算法-支持向量回归模型。

例如,寻优单元404可通过计算误差函数值来确定适应度函数值的大小, 将适应度函数值大的个体遗传至下一代,其中,所述误差函数值的大小与所 述适应度函数值的大小成反比。在示例中,所述遗传操作可包括选择、交叉 和变异中的至少一种。

以上结合图1至图3示出的具体操作可分别由图4所示的装置中的相应 单元来执行,这里,对于具体操作细节将不再赘述。

图5示出了根据本发明的实施例的计算装置的结构示意图。

如图5所示,根据本发明的实施例提供的计算装置500可包括处理器501 和存储部件502,存储部件502中存储有计算机可执行指令,当所述计算机 可执行指令被处理器501执行时,执行前述任一实施例所述的区域土壤重金 属污染指数预测方法。

另外,根据本发明的实施例还提供一种计算机可读存储介质,所述计算 机可读存储介质上存储有用于执行前述任一实施例所述的区域土壤重金属污 染指数预测方法的计算机程序。

通过采用本发明,不仅能够通过计算得出各类重金属元素在土壤中的表 象情况,从而根据不同重金属元素的贡献程度来制定不同的治理方案;另外 能够实现通过小样本数据预测土壤重金属污染状况,从而有效地避免数据缺 失或数据不足对污染预测造成的影响。

在此公开的处理、方法或算法可被传送到处理装置、控制器或计算机, 或者由处理装置、控制器或计算机来实现,所述处理装置、控制器或计算机 可包括任何现有的可编程电子控制单元或者专用的电子控制单元。类似地, 所述处理、方法或算法可以以多种形式被存储为可由控制器或计算机执行的 数据和指令,所述多种形式包括但不限于信息被永久地存储在非可写存储介 质(诸如,ROM装置)上以及信息被可变地存储在可写存储介质(诸如,软 盘、磁带、CD、RAM装置以及其它磁介质和光学介质)上。所述处理、方 法或算法还可被实现在软件可执行对象中。可选地,所述处理、方法或算法 可使用合适的硬件组件(诸如,ASIC、FPGA、状态机、控制器或其它硬件 组件或装置)或者硬件组件、软件组件和固件组件的组合来被整体或部分地 实现。

虽然以上描述了示例性实施例,但是并不意在这些实施例描述了本发明 的所有可能形式。更确切地,说明书中使用的词语为描述性词语而非限制性 词语,并且应理解,可在不脱离本发明的精神和范围的情况下作出各种改变。 此外,可组合各种实现的实施例的特征以形成本发明的进一步的实施例。

相关技术
  • 区域土壤重金属污染指数预测方法及装置
  • 一种考虑多因素影响的日维度区域交通指数预测方法
技术分类

06120113821215