掌桥专利:专业的专利平台
掌桥专利
首页

基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法

文献发布时间:2024-04-18 19:58:21


基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法

技术领域

本发明属于水质遥感监测领域,具体涉及一种基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法。

背景技术

随着我国城镇化水平的提高以及生产力的快速发展,我国内陆淡水资源的紧缺以及水质污染问题已经引起国家和社会的高度关注。传统的水质采样分析方法,难以获取整体水域的水质情况,且一般要消耗大量人力、物力、财力进行实地采样分析。而利用遥感图像对水质参数进行监测,能获取的水域监测范围更加宏伟。PH值、(DO(mg/L))溶解氧含量、化学需氧量(COD

目前,湖泊的水质预测研究的方法主要有遗传算法、粒子群算法、人工神经网络(BP神经网络)、小波神经网络等。其中BP神经网络具备处理非线性函数的功能,在智能控制、非线性问题求解、数据预测等领域应用广泛,而BP神经神经网络存在易陷入局部最优、训练时间久等缺点。对此,众多研究者提出了不同算法优化的BP神经网络,但此类方法并不能完全避免网络陷入局部最优,且同一研究方法在不同领域针对不同研究对象产生的结果也不一样。

现BP神经网络在网络学习过程中由于连接权值和阈值随机产生,导致网络存在训练时间久,易出现“过拟合”现象和易陷于局部最优等缺点,因此不断有新的方法去优化BP神经网络以提高预测精度。遗传算法具备极强的全局搜索能力,并且具有并行性,具有较好的运行速度和可扩展性,但其局部搜索能力薄弱,易出现早起收敛,许多参数的选取缺乏确切的理论支持。思维进化算法也具有搜索全局最优的能力,可有效的提高神经网络收敛速度和精度,提高故障诊断成功率,但在高纬复杂问题中常遇到早起收敛,易收敛于局部极值而无法找到全局最优。

发明内容

发明目的:本发明的目的在于提供一种基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法,本发明通过改进遗传算法中的交叉和变异算子对BP神经网络进行初次优化,然后再利用思维进化算法进行二次优化GA-BP神经网络,通过联合优化BP神经网络的初始权值和阈值的方法构建一种湖泊水质参数预测模型,以提高模型的准确率和收敛速度。旨在解决利用遥感监测和处理湖泊的水环境生态污染安全预测的问题

技术方案如下:

基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法,包括以下步骤:

(1)收集各站点的卫星影像,对收集到的卫星影像进行数据预处理,数据预处理包括辐射校正和大气校正;从地表水数据库中导出地表水监测站点信息和水质指标信息数据,对地表水数据进行归一化水体指数处理;

(2)剔除明显异常的站点遥感反射率及水质指标异常值,对样本数据进行归一化处理得到归一化处理后的样本数据;

(3)构建GA-BP神经网络模型,将归一化处理的样本数据输入至GA-BP神经网络模型;在变异操作后增加精英保留措施;改进自适应策略调整的交叉算子和遗传算子,调整交叉算子的交叉概率P

(4)采用思维进化算法对GA-BP神经网络模型进行进一步优化训练生成优化后的MEA-GA-BP神经网络模型,并将其作为湖泊水质参数预测模型。

进一步的,步骤(1)中所述辐射校正是将获取的原始航空高光谱数据由DN值转换为传感器入瞳处的辐射亮度值,传感器入瞳处的辐射亮度可以表示为:

L

式中,L

进一步的,步骤(1)中所述大气校正使用envi软件中flaash模块进行航空高光谱数据的大气校正,得到航空高光谱影像反射率数据;计算遥感反射率表示为:

式中,ρ

进一步的,步骤(1)中地表水数据通过归一化水体指数处理,归一化水体指数公式如下:

式中,Rrs

进一步的,步骤(2)中使用狄克逊检验法筛选剔除水质指标异常值,使用光谱匹配法剔除明显异常的站点遥感反射率,并根据剔除异常值后的站点遥感反射率构建遥感反射率曲线集合;

所述光谱匹配法计算光谱最小距离的公式为:

式中,D

进一步的,步骤(3)中构建GA-BP神经网络模型包括:

处理样本数据:进行编码并创建种群;解码得到对应的权值和阈值,并将解码范围控制在所给种群范围;

设计适应度函数:以平均相对误差、决定系数、均方根误差作为评价指标,建立如下所示的适应度函数:

式中:MRE为平均相对误差;R

个体适应度的检测评估:将样本数据带入由初始种群确定权值和阈值的BP神经网络中进行训练,将测试样本中的输入值x

其中,k为比例系数,取值范围为0~1;

轮盘赌选择法操作:在变异操作后增加精英保留措施;

改进自适应策略调整的交叉算子和遗传算子:采用指数函数的自适应策略,对种群进行平滑处理,调整交叉概率P

判断适应度F是否满足结束条件:如果输出值与期望值一致,则训练结束;若输出值与期望值有误差,则通过下列公式计算误差:

调整权值,使其误差E达到最小值,训练结束;若不满足则返回轮盘赌选择法操作步骤,继续训练,若满足则获取最优权值和阈值,获得优化后的GA-BP神经网络。

进一步的,假设种群有N个个体,精英保留的具体过程如下:

1.计算出群体中每个个体的适应度f

2.计算出每个个体被遗传到下一代群体中的概率;计算公式如下所示:

式中,F

3.计算出每个个体的累积概率;计算公式如下所示:

式中q

4.在[0,1]区间产生一个随机分布的随机数R,若R

进一步的,改进的交叉概率公式如下:

P

式中,P

进一步的,改进的变异概率公式如下:

P

式中,P

进一步的,在对湖泊水质参数预测中,使用均方根误差来衡量模型的反演精度,其值越大,偏离实测的数据越远;决定系数来衡量模型的拟合优度,其值与拟合程度成正比;使用平均相对误差来衡量模型的质量,其值越小,说明模型质量越好,预测越准确;模型评价指标计算公式如下:

平均相对误差:

决定系数:

均方根误差:

式中,

有益效果:本发明与现有技术相比具有以下有益效果:

本发明通过改进遗传算法中的交叉和变异算子对BP神经网络进行初次优化,然后再利用思维进化算法进行二次优化GA-BP神经网络,通过联合优化BP神经网络的初始权值和阈值的方法构建一种湖泊水质参数预测模型,以提高模型的准确率和收敛速度。

附图说明

图1是本发明实施例中的基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法的流程图;

图2是本发明实施例中的基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法的设计流程图;

图3是本发明实施例中MEA算法的流程图;

图4是本发明实施例中的优胜子种群趋同得分过程;

图5是本发明实施例中临时子种群趋同得分过程;

图6是算法结果对比图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

本专利提供的基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法的整体流程图如图1所示。本实施例中的基于遥感下的MEA-GA-BP耦合模型的湖泊水质参数预测方法的设计流程图如图2所示。

步骤1:收集各站点的卫星影像,对收集到的卫星影像进行数据预处理;从地表水数据库中导出地表水监测站点信息和水质指标信息数据。

本实例中获取的是Landsat-8航空高光谱数据,包含11个波段,波长范围是350~2500nm,实际应用中也可利用Aisa、Casi/Sasi或其它航空高光谱测量系统获取目标区域航空高光谱数据。

数据预处理主要包括辐射校正、和大气校正。辐射校正是将获取的原始航空高光谱数据由DN值转换为传感器入瞳处的辐射亮度值,传感器入瞳处的辐射亮度可以表示为:

L

大气校正是为了消除大气对原始航空高光谱数据的影响,获得较为准确的反射率数据,具体方法是使用envi软件中flaash模块进行航空高光谱数据的大气校正,得到航空高光谱影像反射率数据。计算遥感反射率可以表示为:

式中,ρ

地表水数据处理主要通过归一化水体指数处理,归一化水体指数公式如下:

式中,Rrs

对数据进行归一化处理,公式如下所示:

式中,y为归一化处理后的数据,x为原始数据,max(x)为原始数据的最大值,min(x)为原始数据的最小值。

本实施例中选取洪泽湖水域2019.6~2020.6年的6个水质监测站点的水质信息,主要包括PH值、(DO(mg/L))溶解氧含量、化学需氧量(COD

表1光谱数据和水质参数相关系数

步骤2:剔除明显异常的站点遥感反射率及水质指标异常值,对样本数据进行归一化处理得到归一化处理后的样本数据。,

六个样本站点总数选择180个,样本数据包括训练样本数据以及测试样本数据,训练样本数据与测试样本数据的比例为4:1。

使用狄克逊检验法筛选剔除水质指标异常值,使用光谱匹配法剔除明显异常的站点遥感反射率,并根据剔除异常值后的站点遥感反射率构建遥感反射率曲线集合。

步骤S2光谱匹配法计算光谱距离的公式为:

D

作为本发明进一步地改进,步骤S2光谱匹配法计算光谱最小距离的公式为:

式中,D

步骤3:构建GA-BP神经网络模型,将归一化处理的样本数据输入至GA-BP神经网络模型。

步骤3-1,设定GA-BP算法中的部分参数。

本实施例中,GA-BP网络参数经过试算,设定隐含层神经元个数为12个,种群进化代数为30,变异率为0.1,交叉率为0.3,种群的规模为1000。样本的输入值为x

步骤3-2,编码,及创建种群:设种群的范围是[a,b],种群个体个数为c,用长度为k的二进制编码表示该参数,二进制编码为随机创建,设一个种群个体的编码为b

步骤3-3、设计适应度函数:对适应度函数的改进通常可以加快遗传算法的收敛速度,增大个体的适应度差距,同时加快速度找到全局最优解。本发明实施例中以平均相对误差、决定系数、均方根误差作为评价指标,建立如下所示的适应度函数:

式中:MRE为平均相对误差;R

步骤3-4,轮盘赌选择法操作:在轮盘选择中对于适应度较低的个体而言比较容易淘汰,而适应度高的个体则容易被选择,导致种群的多样性不足,增加了选择的不确定性,为解决这问题,本发明实例,在变异操作后增加了精英保留措施,使适应度较低的个体也有一定的概率被选中,提高了一定的收敛速度。

基于适应度比例额的选择策略,每个个体i的选择概率p

式中,F

在[0,1]区间产生一个随机分布的随机数R,若R

传统的交叉、变异操作的交叉概率和变异概率以一个恒定值进行进化,这可能导致“早熟”现象,同时也不利于种群多样性。本实施例为了获取更好的优质个体,对劣质个体进行大概率交叉、变异,在遗传算法初期引入人工干预,通过设置较大的交叉概率P

步骤3-5,改进的交叉概率公式如下:

P

式中,P

步骤3-6:改进的变异概率公式如下:

P

式中,P

步骤3-7,计算适应度F是否满足结束条件,若不满足返回步骤3-4,若满足则获取最优权值和阈值,获得第一次优化后的GA-BP神经网络。

步骤4:采用思维进化算法对GA-BP神经网络模型进行第二次优化训练直至生产最优的MEA-GA-BP神经网络模型,并将其作为湖泊水质参数预测模型。

图3是本发明实施例中的MEA算法的流程图。MEA算法(思维进化算法)的过程如下:

步骤4-1,设定MEA算法中的部分参数。

本实施例中,设定MEA算法(思维进化算法)中的种群进化代数为50,变异率为0.1,交叉率为0.3,种群的规模为1000,优胜子种群以及临时子种群的数量均为10,迭代的次数为20。

步骤4-2,首先在选定的测试范围内,对归一化处理的样本数据进行随机选择,然后构成初始种群并将初始种群作为当前种群。

步骤4-3,计算训练样本数据的均方根误差的倒数并将其作为得分标准,对每个个体进行评分。

步骤4-4,对评分最高的个体为中心生成新的个体作为优胜子种群和临时子种群。

图4是本发明实施例中的优胜子种群趋同得分过程,图5是本发明实施例中临时子种群趋同得分过程。

步骤4-5,对优胜子种群以及临时子种群进行趋同,即在一个子种群中个体为成为优胜者相互竞争直至子种群程数,即优胜子种群以及临时子种群中均不在产生优胜者,趋同过程如图4及图5所示。

步骤4-6,在选出最高的个体后,以最高的个体作为子种群得分,对得到的两个种群之间进行异化操作,即在整个解空间中,各子群体为成为优胜者而竞争,不断地探测解空间中新的点。

步骤4-7,重复进行步骤S4-5至步骤S4-6,直到迭代次数达到预定次数,得到最优个体。

步骤4-8,将最优个体作为最优连接权值及阈值分配给GA-BP神经网络模型,得到最优的BP神经网络模型,即湖泊水质参数质量预测模型。

步骤5:对优化后的机器学习模型在平均相对误差、均方根误差和决定系数与原先建立的机器学习模型进行对比,分析其优化后的效果,将最优模型进行线上部署。

在本实施例中,在对湖泊水质参数预测中,使用均方根误差来衡量模型的反演精度,其值越大,偏离实测的数据越远;决定系数来衡量模型的拟合优度,其值与拟合程度成正比;使用平均相对误差来衡量模型的质量,其值越小,说明模型质量越好,预测越准确。模型评价指标计算公式如下:

平均相对误差:

决定系数:

均方根误差:

式中,

实验结果与分析

根据本发明的一种基于多源数据与MEA-GA-BP模型的湖泊水质反演预测方法,将归一化处理的样本数据输入至GA-BP神经网络模型中,采用思维进化算法对该GA-BP神经网络模型进行训练并不断优化直至生成能够预测湖泊水质参数的反演预测模型。由于采用了思维进化算法对BP神经网络模型进行了训练优化,因此使得模型在全局范围内寻找最优解的能力增强,且收敛速度加快,大大提高了湖泊水质参数预测模型的预测精准度。本发明的基于多源数据与MEA-GA-BP模型的湖泊水质参数预测方法可准确、快速的了解湖泊水质质量与污染程度情况,不仅可靠性高,也可以很好的帮助工作人员如何湖泊水体污染情况,而且还能进一步对湖泊水质质量进行预防,为城市提供安全可靠的水源。部分实验结果如图6。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种基于因子定权模型的湖泊水质评价预测系统及方法
  • 一种基于因子定权模型的湖泊水质评价预测系统及方法
技术分类

06120116484357