掌桥专利:专业的专利平台
掌桥专利
首页

高精度叶绿素时间序列分析方法、系统、介质及装置

文献发布时间:2024-04-18 20:02:18


高精度叶绿素时间序列分析方法、系统、介质及装置

技术领域

本申请属于水环境保护水质指标监测评价技术领域,涉及一种时间序列分析方法,特别是涉及一种高精度叶绿素时间序列分析方法、系统、介质及装置。

背景技术

水体富营养化长期以来都是水环境治理的热点问题。人类活动导致氮、磷等营养元素在水体中聚集,引发藻类等浮游生物迅速繁衍,产生水华现象。藻类覆盖在水体表面,不仅影响水体的感官体验,而且使水体中溶解氧含量迅速下降,导致鱼类等其它生物大量死亡,多发生于城市湖泊和平原河网等缓流水体。叶绿素a(Chlorophyll-a,Chl-a)是藻类中最丰富的色素,其浓度水平可以反映以藻类为主的浮游植物生物量的高低。因此,叶绿素a可以直观地描述水体富营养化的状况。

目前,针对叶绿素a浓度的传统监测方法主要是实地采集水样,送往就近实验室经过反复碾磨、萃取、离心和比色等步骤来测量叶绿素a浓度,这种方法虽然能够获取精确的叶绿素a浓度,但耗费了大量人力、物力,而且采样点分布和采样周期均受到限制,数据的频率和时效性远远滞后于水环境管理与决策的需求,既难以反映开阔水面叶绿素a浓度的空间分布和变化状况,也难以捕捉其昼夜变化规律,对一些突发性事件也不能被及时捕捉。基于传统监测方法的叶绿素时间序列分析基本局限在叶绿素的年际变化和季节变化上。

近些年兴起的叶绿素遥感影像反演方法,能够观测大范围水面的叶绿素浓度空间分布,而且具有监测范围广、效率高、获取信息多和便于长期动态监测等优势。但是受多变水体光学性质、卫星数据质量和反演算法的影响,对于二类水体,即有陆源物质输入的近岸或内陆水体,叶绿素浓度估算的稳定性和准确度还有待提高。此外,因受遥感影像日期和气象因素等条件限制,难以获得叶绿素浓度全时段的反演数据,可能错过藻类爆发时的叶绿素浓度监测,因此遥感影像反演方法还不能满足水质实时监控的需求,更适用于大面积水域的水体富营养化调查等工作。基于遥感影像反演的叶绿素浓度分析,其优势在于广阔水域的叶绿素浓度空间分布,以及长时间跨度(几年至几十年)的时间分布特征,叶绿素时间序列分析通常局限于季节变化。近些年随着水色静止轨道卫星发射的增加,这种局限有所改善。

落实到水体“毛细血管”和基层水环境治理时,对水环境的监测工作还是以各种类型的水文水质自动监测平台为主。相比常规采样检测,水质自动监测系统有着高效、快捷、节省人力、能获得高频数据、能够实时监控等特点;相比GOCI遥感影像反演,能完整监测白昼和夜晚的全部动态过程,且对于小微水体的定位更为准确。由于叶绿素a浓度实时人工监测困难,而且通过遥感影像解译叶绿素a浓度的方法还不够稳定和成熟,因此目前高频率水质时间序列数据较少,针对叶绿素a浓度昼夜变化的研究非常有限。

因此,在现有技术中,由于有陆源物质输入的近岸或内陆水体,叶绿素浓度估算的稳定性和准确度较低,以及因受遥感影像日期和气象因素等条件限制,难以获得叶绿素浓度全时段的反演数据,进而可能错过藻类爆发时的叶绿素浓度监测而导致遥感影像反演方法还不能满足水质实时监控的需求的问题。

发明内容

鉴于以上所述现有技术的缺点,本申请的目的在于提供一种高精度叶绿素时间序列分析方法、系统、介质及装置,用于解决现有技术中,由于有陆源物质输入的近岸或内陆水体,叶绿素浓度估算的稳定性和准确度较低,以及因受遥感影像日期和气象因素等条件限制,难以获得叶绿素浓度全时段的反演数据,进而可能错过藻类爆发时的叶绿素浓度监测而导致遥感影像反演方法还不能满足水质实时监控的需求的问题。

为实现上述目的及其他相关目的,第一方面,本申请提供一种高精度叶绿素时间序列分析方法,包括以下步骤:获取目标水域的水文地理基础信息;所述水文地理基础信息包括:自然地理概况、水环境现状、水质检测、水岸植被调查、水生生物调查、水质连续监测情况中的任一种或多种组合;获取目标水域中的叶绿素a在线监测基础数据;基于所述叶绿素a在线监测基础数据计算出叶绿素a时间序列图,得到叶绿素a时平均值序列;基于所述叶绿素a时间序列图识别出监测数据异常值,并对缺失部分进行填充;分析所述叶绿素a时平均值序列,得到叶绿素a浓度平均值昼夜变化规律以及叶绿素a浓度平均值昼夜变化的月平均分布规律;通过叶绿素a浓度与不同季节水质变量的相关性,得到不同季节叶绿素a浓度与水质参数的相关性模型。

在第一方面的一种实现方式中,获取目标水域中的叶绿素a在线监测基础数据包括以下步骤:于一水质自动监测站中,根据用户需求设置数据采集频率,实时采集叶绿素a在线监测基础数据。

在第一方面的一种实现方式中,基于所述叶绿素a在线监测基础数据计算出叶绿素a时间序列图,得到叶绿素a时平均值序列包括以下步骤:基于所述叶绿素a在线监测基础数据计算各不同指标的时平均值序列;基于所述时平均值序列取每日平均值,得到各不同指标的日平均值序列。

在第一方面的一种实现方式中,基于所述叶绿素a时间序列图识别出监测数据异常值,并对缺失部分进行填充包括以下步骤:基于所述叶绿素a时间序列图进行图像分析,识别出监测数据异常值;对水站监测系统进行定期维护,同时根据所述水站监测系统运行情况增加维护次数;基于所述监测数据异常值进行分析,采用箱形图识别出离群值,并对所述离群值进行筛选和剔除;对剔除后的数据的缺失部分进行填补。

在第一方面的一种实现方式中,所述监测数据异常值包括:0值或负值、极端高值;包括:当监测数据值为0值或负值时,则认定该监测数据异常值是因水体自身之外的因素导致的;当监测数据值为极端高值时,则认定水体已经处于富营养化状态。

在第一方面的一种实现方式中,基于所述监测数据异常值进行分析,采用箱形图识别出离群值,并对所述离群值进行筛选和剔除包括以下步骤:对所述叶绿素a在线监测基础数据进行预处理,得到标准化格式的叶绿素a在线监测数据;根据所述标准化格式的叶绿素a在线监测数据制作箱形图,得到离群值,并识别出异常的离群值;对识别出的所述离群值进行筛选,剔除异常的离群值。

在第一方面的一种实现方式中,分析所述叶绿素a时平均值序列,得到叶绿素a浓度平均值昼夜变化规律以及叶绿素a浓度平均值昼夜变化的月平均分布规律包括以下步骤:分析某时间段内水质自动监测站的时平均值序列,得到该时间段内的叶绿素a浓度平均值昼夜变化;基于所述叶绿素a浓度平均值昼夜变化,提取叶绿素a浓度有效数据中每月昼夜变化。

在第一方面的一种实现方式中,通过叶绿素a浓度与不同季节水质变量的相关性,得到不同季节叶绿素a浓度与水质参数的相关性模型包括以下步骤:基于不同季节下的水质自动监测站的叶绿素a与环境因子进行相关性分析;所述环境因子包括:水温、电导率、ORP、DO、浊度中的任一种或多种的组合;采用Spearman秩相关分析法,计算叶绿素a与各所述环境因子的相关系数;采用逐步回归模型分析叶绿素a浓度与水质参数之间的关系,并建立叶绿素a浓度与水质参数的最优的多元线性回归方程,得到绿素a浓度与水质参数的相关性模型;对所述绿素a浓度与水质参数的相关性模型进行优化和检验。

第二方面,本申请提供一种高精度叶绿素时间序列分析系统,包括:调研模块,用于获取目标水域的水文地理基础信息;所述水文地理基础信息包括:自然地理概况、水环境现状、水质检测、水岸植被调查、水生生物调查、水质连续监测情况中的任一种或多种组合;获取模块,用于获取目标水域中的叶绿素a在线监测基础数据;计算模块,用于基于所述叶绿素a在线监测基础数据计算出叶绿素a时间序列图,得到叶绿素a时平均值序列;识别模块,用于基于所述叶绿素a时间序列图识别出监测数据异常值,并对缺失部分进行填充;分析模块,用于分析所述叶绿素a时平均值序列,得到叶绿素a浓度平均值昼夜变化规律以及叶绿素a浓度平均值昼夜变化的月平均分布规律;模型构建模块,用于通过叶绿素a浓度与不同季节水质变量的相关性,得到不同季节叶绿素a浓度与水质参数的相关性模型。

最后一方面,本申请提供一种高精度叶绿素时间序列分析装置,包括:处理器及存储器。所述存储器用于存储计算机程序;所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述高精度叶绿素时间序列分析装置执行所述高精度叶绿素时间序列分析方法。

如上所述,本申请的高精度叶绿素时间序列分析方法、系统、介质及装置,具有以下有益效果:

(1)本申请提供的高精度叶绿素时间序列分析方法,通过运用水质自动监测站监测叶绿素a浓度,能够高效、快捷的获得高频数据,实现实时监控叶绿素a浓度,并能够完整监测白昼和夜晚的全部动态过程,且对于小微水体的定位更为准确;

(2)本申请提供的高精度叶绿素时间序列分析方法,综合时序图、水站维护记录和箱形图识别原始数据的异常值,可以作为水站时间序列数据预处理的一般过程;基于水环境指标时间序列图像的模式识别,并结合水质指标特征、自动监测的特点以及水站维护记录,使得水质时间序列数据的异常值识别更加合理、准确;

(3)本申请提供的高精度叶绿素时间序列分析方法在应用时,需要运用水质自动监测站监测叶绿素a浓度,分析叶绿素a时间序列,掌握不同季节叶绿素a昼夜变化的规律;同时,在对自动水站的时间序列数据进行分析之前,需要结合水质指标特征、自动监测的特点以及水站维护记录,运用异常值筛选方法合理、准确地识别时间序列的异常值。

附图说明

图1显示为本申请所述的高精度叶绿素时间序列分析方法于一实施例中的流程示意图。

图2显示为本申请所述的高精度叶绿素时间序列分析方法中的S13的流程示意图。

图3显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道自动水站叶绿素时平均值序列图。

图4显示为本申请所述的高精度叶绿素时间序列分析方法中的S14的流程示意图。

图5显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道叶绿素a时间序列异常值识别图。

图6显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道叶绿素a箱形分析示意图。

图7显示为本申请所述的高精度叶绿素时间序列分析方法中的S15的流程示意图。

图8显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道叶绿素a浓度平均值昼夜变化示意图。

图9A显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道2019年诸月叶绿素浓度日变化趋势图。

图9B显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道2020年各月及2021年诸月叶绿素浓度日变化趋势图。

图10显示为本申请所述的高精度叶绿素时间序列分析方法中的S16的流程示意图。

图11显示为本申请所述的高精度叶绿素时间序列分析系统于一实施例中的原理结构示意图。

图12显示为本申请所述的高精度叶绿素时间序列分析装置于一实施例中的原理结构示意图。

元件标号说明

111调研模块

112获取模块

113计算模块

114识别模块

115分析模块

116模型构建模块

121处理器

122存储器

S11~S16 步骤

具体实施方式

以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。

需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

下面将结合本申请实施例中的附图,对本申请实施例中所提供的高精度叶绿素时间序列分析方法、系统、介质及装置进行详细描述。

本申请以水质自动监测站对叶绿素a等水质指标进行长时间连续监测的数据为基础,从时间角度研究叶绿素变化规律,对长时间高密度的水质监测数据进行叶绿素时间序列分析,为精准施策提供科学依据。它既是环境保护信息化和经济社会发展的需要,也是从传统环境监测向现代环境监测转变的要求。

请参阅图1,显示为本申请所述的高精度叶绿素时间序列分析方法于一实施例中的流程示意图。如图1所示,本实施例提供一种高精度叶绿素时间序列分析方法。

所述高精度叶绿素时间序列分析方法具体包括以下步骤:

S11,获取目标水域的水文地理基础信息。

本实施例中,所述水文地理基础信息包括但不限于:自然地理概况、水环境现状、水质检测、水岸植被调查、水生生物调查、水质连续监测情况等多种类型的信息。

具体地,现场调查水域地理、生物及水质等水文地理基础信息的情况。调查包括:自然地理概况、水环境现状、水质检测、水岸植被调查、水生生物调查、水质连续监测情况等。

例如,任意选取M地区内各类地表水体以及联合村内水系作为研究对象,对河道、水塘等小微水体开展调查,通过资料搜集、现场水样采集与统计和生物调查等方式获取数据,对联合村水系开展系统的生态系统健康评价。

S12,获取目标水域中的叶绿素a在线监测基础数据。

本实施例中,于一水质自动监测站中,根据用户需求设置数据采集频率,实时采集叶绿素a在线监测基础数据。

具体地,选取收集某个时间段内自动水站的监测数据,监测数据频率优选为每5分钟一次,以叶绿素a的水站在线监测值作为原始数据。

在水质自动监测站安装叶绿素a的在线监测设备,确保设备的准确性和稳定性;并对设备进行配置,如:设备校准、设置监测参数等。然后,启动在线监测设备,开始采集叶绿素a的数据,其中,数据采集频率可以根据实际需求设定,例如每小时、每天或每周采集一次。接着,将采集到的数据通过有线或无线的方式传输至数据中心或云平台上,并在数据中心或云平台上进行数据的处理,包括:数据清洗、格式转换、异常值检测与处理等,然后将处理后的数据进行存储以备用。

例如,接上述实施例,联合村村委河道处的水质自动监测站于2019年4月11日开始工作,至2021年4月20日探头取下,自动水站的监测频率为每5分钟一次(2020年5月28日至2020年10月17日为30分钟一次),选取2019年4月11日至2021年4月20日叶绿素a的水站在线监测值作为原始数据。

S13,基于所述叶绿素a在线监测基础数据计算出叶绿素a时间序列图,得到叶绿素a时平均值序列。请参阅图2,显示为本申请所述的高精度叶绿素时间序列分析方法中的S13的流程示意图。如图2所示,所述S13包含以下步骤:

S131,基于所述叶绿素a在线监测基础数据计算各不同指标的时平均值序列。

请参阅图3,显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道自动水站叶绿素时平均值序列图。

本实施例中,取每小时内叶绿素a的12个监测值的平均值,得到每个指标的时平均值序列。

具体地,对叶绿素a在线监测基础数据进行筛选,包括:监测时间、叶绿素a浓度等信息;再对筛选后的叶绿素a在线监测基础数据进行预处理,如:数据清洗、异常值处理、缺失值填充等步骤,以保证数据的准确性和完整性;然后,将监测时间划分为不同的时间段,例如:每天的24小时、每小时的60分钟等,本实施例优选每小时内取12个监测值,而划分的依据可以根据实际需求自行设定;接着,在每个时间段内,计算叶绿素a浓度的平均值。可以采用算术平均值、几何平均值等方式进行计算;最后,将计算出的各个时段的平均值按照时间顺序排列,生成时平均值序列。

例如,取每小时内12个监测值的平均值(2020年5月28日至2020年10月17日为每小时2个监测值取平均值),得到每个指标的时平均值序列。

S132,基于所述时平均值序列取每日平均值,得到各不同指标的日平均值序列。

本实施例中,对时平均值序列取每日平均值,得到每个指标的日平均值序列。

图3中给出了自动水站所监测叶绿素a在2019年4月11日至2021年4月20日范围内的时平均值序列,由图3可知,水体叶绿素a浓度呈现出一定的周期性变化,在7~8月份夏季浓度较高,且波动更剧烈,而在冬季,浓度较低,且波动较小。冬季叶绿素a浓度在5μg/L左右,而7~8月份叶绿素a浓度大部分时间高于10μg/L,水体处于富营养化状态。

S14,基于所述叶绿素a时间序列图识别出监测数据异常值,并对缺失部分进行填充。请参阅图4,显示为本申请的高精度叶绿素时间序列分析方法中的S14的流程示意图。如图4所示,所述S14包含以下步骤:

本实施例中,基于水环境指标时间序列图像的模式识别,并结合水质指标特征、自动监测的特点以及水站维护记录,识别监测数据异常值,剔除识别出的异常数据后,对缺失部分进行填补。

在对自动水站的时间序列数据进行分析之前,检测时间序列的异常值。一类是水体本身的异常变化,通过某种指标得到体现;另一类是监测过程某环节出现异常,导致某些指标的监测数据出现异常值。如果分析目的是发现叶绿素变化的一般规律,那么这部分数据应当舍去;但若分析目的在于识别河道水华等突发事件,那么这部分数据正是分析所需要的。对于监测过程出现的异常,水质自动监测站通常由水路单元、控制单元、数采单元、数传单元、监测单元和数据中心等若干模块化单元组成,任何一个单元出现故障,都可能导致终端获取的数据出现异常。因此对于监测过程,引起数据异常的原因包括但不限于取水口堵塞、电力中断、探头损坏以及数据接发系统故障等等。

S141,基于所述叶绿素a时间序列图进行图像分析,识别出监测数据异常值。所述监测数据异常值包括:0值或负值、极端高值;包括:当监测数据值为0值或负值时,则认定该监测数据异常值是因水体自身之外的因素导致的;当监测数据值为极端高值时,则认定水体已经处于富营养化状态。

请参阅图5,显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道叶绿素a时间序列异常值识别图。

本实施例中,通过图像初步识别法对异常值作出合理识别。初步识别图像中数据波动幅度增大,有明显的极端高值和低值,使得曲线呈“毛刺状”的部分,用红色区域标出出现的异常数据,该部分数据偏离了数据总体的变化趋势,或者该部分数据的波动幅度明显超过附近数据的波动程度。随后根据气候变化、地理环境等因素进行异常值出现原因的分析,快速提供对数据分布的基本认知。

具体地,叶绿素a数据的波动情况存在同溶解氧类似的季节差异,即:冬季波动幅度小于夏季。就异常数据的识别而言,大致也可分为两类,一类为0值甚至是负值,显然为水体自身之外的因素所导致;另一类为极端高值,最高达到125μg/L。参照美国环保总署(USEPA)有关标准,当水体叶绿素a浓度超过10μg/L时,水体已经处于富营养化状态。此次自动监测所选取的联合村河道,地处农村,周边环境优美,无工业污染,少生活污染;但同时联合村河道与东苕溪以联合闸相隔,上游便是太湖,饱受A湖湖水倒灌侵扰。相关研究表明,A湖湖水的叶绿素a浓度在枯水期(11月)能达到300μg/L,因此若A湖湖水倒灌东苕溪,而联合闸未能及时关闭,那么联合村内河道叶绿素浓度很有可能在短时间内急剧上升。在箱线图法和统计识别法中,这些极大值会被当作异常值舍去。由此可见,基于图像的经验识别法不仅仅作为异常值识别的预阶段,快速提供对数据分布的基本认知,实际上,图像能够给予对数据最直观的感受,尤其在基层水环境管理中,图像经验识别省去了复杂的模型构建和繁琐的数学运算,依然能对异常值作出合理识别,既保证准确性,又方便快捷。

S142,对水站监测系统进行定期维护,同时根据所述水站监测系统运行情况增加维护次数。

本实施例中,维护记录辅助识别,根据维护记录,识别出数据缺失或无效。相关人员会定期对水站监测系统进行维护(通常一月一次),同时根据运行情况增加维护次数,根据各指标时平均序列的图线以及维护记录,识别出较长时间段的数据缺失或无效。

具体地,相关人员会定期对水站监测系统进行维护(一月一次),同时根据运行情况增加维护次数。根据各指标时平均序列的图线以及维护记录,识别出7个较长时间段的数据缺失或无效:2019年5月6日至5月8日,由于设备故障,叶绿素监测数据无效;2019年8月11日至8月31日期间,受台风影响取水管断裂,监测数据无效;2020年3月8日至3月12日、5月4日至5月12日、5月21日至28日,因取水口堵塞,数据缺失;2020年11月17日至11月28日,因取水口堵塞,数据无效;此外还有少数短暂的数据跳跃或缺失的情况,通常由于水站维护、更换探头时需要切断取水所导致。例如2019年6月12日,全部数据缺失近一个小时(11组数据)。内容详见表1。

表1数据异常情况分析表

由表1中的内容可知,不同时段内的数据异常情况及位置分布情况,从而能够准确地识别出数据缺失或无效,进而能够更加精准地维护水质监测站。

S143,基于所述监测数据异常值进行分析,采用箱形图识别出离群值,并对所述离群值进行筛选和剔除。请参阅图6,显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道叶绿素a箱形分析示意图。

本实施例中,对所述叶绿素a在线监测基础数据进行预处理,得到标准化格式的叶绿素a在线监测数据;根据所述标准化格式的叶绿素a在线监测数据制作箱形图,得到离群值,并识别出异常的离群值;对识别出的所述离群值进行筛选,剔除异常的离群值。

具体地,剔除无效数据后,对监测数据作箱形图分析其分布情况,做各指标的箱形图,观察数据分布情况。箱形图识别出的离群值还需要结合指标特性和实际情况综合分析后进行离群值的筛选和剔除。

可以看出,基于图像识别的异常数据基本属于监测过程的异常事件所导致的异常数据,而因水体自身异常变化产生的异常数据一般以尖锐峰的形式呈现。一方面,某些指标,如溶解氧和叶绿素的监测数据在夏季波动剧烈,锯齿状明显,只凭借图像很难确定代表异常数据的尖锐峰;另一方面,不同于维护记录,精确到小时的气象数据、河道异常事件记录等资料难以获取,因而在缺乏相关数据的情况下,异常事件识别异常数据并不容易。

因此,在剔除以上识别的异常数据之后,对监测数据作箱形图分析其分布情况。值得一提的是,采用诸如箱形图和统计识别等数理方法识别异常数据,常常会忽略异常数据背后的异常事件。通常来说,为了获取指标变化的一般规律,或进行时间序列预测,应尽可能排除异常数据;而为了分析指标变化同事件的关系,那么异常数据反而是值得关注的对象。

为进一步分析,做各指标的箱形图,观察数据分布情况。

由箱形图可看出,存在落在Whisker上下限外的“离群值”,离群值的筛选和剔除还需要结合指标特性和实际情况综合分析。参见表2。

表2自动监测水站数据描述性统计表

由此可知,表2给出了各指标的描述性统计。叶绿素a的中位数小于平均值,说明有更多的值聚集在小于平均值的区域,较少的高值分布在远大于平均值的区域,这与其偏度较大相吻合,叶绿素a偏度大于0说明存在偏大的极端值,有一条长尾拖在分布曲线的右端,同时叶绿素a峰度远大于0,说明数据更向平均值聚集,这与箱形图显示的箱形呈扁平状,而离群值分布较广的模式吻合。

S144,对剔除后的数据的缺失部分进行填补。

本实施例中,剔除识别出的异常数据后,对缺失部分进行填补。如果忽视数据缺失的存在,直接对不连续的时间序列进行处理,如统计分析和时间序列预测,取得的结果往往不准确,因为直接去掉不完整的部分,对剩余的数据展开统计分析,会使大量的原始资料信息丢失,不但不利于分析结果的准确性及可靠性的提升,还可能会造成错误结果的出现。因此通常情况下,需要对数据缺失部分进行填补。

具体地,剔除识别出的异常数据后,需要对缺失部分进行处理。对于联合村水站自动监测的水质时间序列数据,短时间的数据跳跃或缺失可以采用临近时间点的平均值来填补。但对于较长时间段的数据缺失或无效,考虑到一方面数据频率高,即便将原始数据进行转换,得到时平均值序列,用一般插值方法填补缺失值显得过于粗糙;另一方面,异常数据跨度少则两三天,长则达二十天甚至一个月,试图填补出每小时数据,实际上相当于预测时间序列,且往后预测几百期以上,准确性可想而知。因此,步骤S14对于水站自动监测的时间序列数据的分析,尽量避开剔除异常数据的部分。

需要注意的是,短时间的数据跳跃或缺失可以采用临近时间点的平均值来填补。而对于较长时间段的数据缺失或无效,考虑到一方面数据频率高,即便将原始数据进行转换,得到时平均值序列,用一般插值方法填补缺失值显得过于粗糙,如果异常数据时间跨度较大,填补数据较多,准确性不可控,因而在这种情况下需要尽量避开剔除异常数据的部分。

S15,分析所述叶绿素a时平均值序列,得到叶绿素a浓度平均值昼夜变化规律以及叶绿素a浓度平均值昼夜变化的月平均分布规律。请参阅图7,显示为本申请所述的高精度叶绿素时间序列分析方法中的S15的流程示意图。如图7所示,所述S15包含以下步骤:

S151,分析某时间段内水质自动监测站的时平均值序列,得到该时间段内的叶绿素a浓度平均值昼夜变化。请参阅图8,显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道叶绿素a浓度平均值昼夜变化示意图。

本实施例中,分析水站运行2年以来获取的时平均值序列,得到2019年4月—2021年4月联合村自动水站监测的叶绿素a浓度平均值昼夜变化。

由图中可知,数据显示,联合村河道叶绿素浓度总体呈现出单峰(单谷)的典型昼夜变化规律。日最小值出现在04:00—05:00之间,约7.2μg/L;此后浓度升高,并于16:00—17:00达到峰值,约11.2μg/L;此后浓度逐渐减小。叶绿素a浓度的昼夜变化规律,与浮游植物的生长有着密切的联系。而光为植物进行光合作用提供能量,因而在浮游植物生长过程中起至关重要的作用(黎安港海水和沉积物中叶绿素a含量及与环境因子的关系分析)。因此,河道叶绿素a浓度自早晨06:00后,随着天亮,日照逐渐增强而逐渐上升;而在夜晚,植物光合作用停止,生长停滞,水体叶绿素a浓度逐渐下降。值得注意的是,通常一天日照最强的时候出现在午后14:00左右,而叶绿素浓度却在16:00左右达到最高值,说明水体叶绿素a浓度存在累积效应,而且相比日照强度变化存在滞后现象。此外,河道叶绿素a浓度在6:00之后迅速上升,随后增长速率越来越慢,在18:00之后迅速下降,随后下降速率越来越慢。如果水体叶绿素a浓度的变化程度与浮游植物的生长速率成正比,那么在6:00天亮之后,日照强度逐渐增强,植物生长速率逐渐加快,叶绿素a浓度应当上升得越来越快,而实际情况却与此相反。这表明水体叶绿素a浓度同浮游植物生长的关系极为复杂。不过,一个合理的猜想是,当浮游植物经过一夜的黑暗环境后,突然的光照能“激活”浮游植物开始较强烈的光合作用,“刺激”浮游植物迅速生长。

S152,基于所述叶绿素a浓度平均值昼夜变化,提取叶绿素a浓度有效数据中每月昼夜变化。请参阅图9A和图9B,分别显示为本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道2019年诸月叶绿素浓度日变化趋势图和本申请所述的高精度叶绿素时间序列分析方法中的M地区的联合村村委河道2020年各月及2021年诸月叶绿素浓度日变化趋势图。

本实施例中,为进一步分析叶绿素浓度昼夜变化的季节差异,提取叶绿素a浓度有效数据中每月昼夜变化。

例如:图9A中,给出了2019年5月~7月,9月~12月的叶绿素a浓度平均昼夜变化曲线,其中8月份大部分时间的监测数据无效,故全部舍去;图9B中,显示了2020年1月~10月,12月及2021年1月~3月的叶绿素a浓度平均昼夜变化曲线,其中2020年11月份的近三分之一的时间数据无效,故整月数据全部舍去。

通过比较各个月份的叶绿素a浓度昼夜变化曲线,可将昼夜变化曲线归纳成三类,分别用实线(Ⅰ)、点画线(Ⅱ)、虚线(Ⅲ)的形式表示。以实线(Ⅰ)显示的曲线,与图8中的平均昼夜变化曲线类似,拥有明显的一峰一谷,叶绿素a浓度在14:00至16:00之间达到峰值,在凌晨4:00左右达到最小值。虚线(Ⅲ)显示的曲线,叶绿素a浓度基本保持不变,且浓度基本在5μg/L以下。点划线(Ⅱ)显示的曲线特征不明显,叶绿素a浓度有较大波动,但均未显示出明显的单峰(单谷)形状。

在图9A中,2019年5月~6月,10月为Ⅱ类曲线,7月,9月为Ⅰ类曲线,11月~12月为Ⅲ类曲线。在图9B中,2020年1月,10月,12月为Ⅲ类曲线,2020年2月~5月,9月为Ⅱ类曲线,2020年6月~8月为Ⅰ类曲线;2021年1月~2月为Ⅲ类曲线,3月为Ⅱ类曲线。图中给出了各个月份叶绿素a浓度昼夜变化曲线的特征情况。

分析三种形状的曲线出现的月份和顺序。Ⅰ类曲线反映的叶绿素a浓度昼夜变化规律通常发生在夏季,主要为7~8月份,6月、9月也有发生。Ⅰ类曲线呈现明显的单峰(单谷)变化规律,表明浮游植物在白天进行光合作用,迅速生长,在夜晚光合作用停止,因而白天叶绿素a浓度逐渐上升,夜晚逐渐下降。Ⅲ类曲线反映的叶绿素a浓度昼夜变化规律通常发生在冬季,主要为12月和来年1月,11月和来年2月也有发生。Ⅲ类曲线呈现出平稳的水平趋势,说明在寒冷的冬季,浮游植物即便在白日,光合作用强度也不高,生长缓慢。联合村河道Ⅱ类曲线出现的月份间隔在Ⅰ类曲线和Ⅲ类曲线之间。通常为春夏之交和秋季。Ⅱ类曲线的趋势杂乱无章,不具备典型特征,这可能与春秋两季复杂的水生生物生命活动有关,同时降雨、骤暖骤寒、大风等多变的天气可能也影响浮游生物的光合作用,从而影响水体中叶绿素a浓度。

联合村河道叶绿素a浓度昼夜变化具有明显的季节差异。夏季,叶绿素a浓度具有明显昼夜变化,昼夜变化曲线呈现典型单峰单谷形状;冬季叶绿素a浓度无明显昼夜差异,保持在5μg/L左右;春秋两季叶绿素a浓度平均昼夜变化存在杂乱无章的波动,但昼夜变化曲线未呈现规律的单峰单谷形状。

S16,通过叶绿素a浓度与不同季节水质变量的相关性,得到不同季节叶绿素a浓度与水质参数的相关性模型。请参阅图10,显示为本申请所述的高精度叶绿素时间序列分析方法中的S16的流程示意图。如图10所示,所述S16包含以下步骤:

S161,基于不同季节下的水质自动监测站的叶绿素a与环境因子进行相关性分析。所述环境因子包括但不限于:水温、电导率、ORP、DO、浊度等多种因子。

本实施例中,对联合村自动水站监测的叶绿素a与其它理化因子,即:水温、电导率、ORP、DO、浊度进行相关性分析。

S162,采用Spearman秩相关分析法,计算叶绿素a与各所述环境因子的相关系数。

本实施例中,由于对异常值进行识别和清除后的数据有较长时间跨度的间断,有效数据主要集中在冬季和夏季,且叶绿素a浓度和其昼夜变化规律在冬季和夏季之间有明显的季节差异,因此选取冬季和夏季月份数据进行相关性分析。由于大多数变量没有通过单样本Kolmogorov-Smirnov检验,采用Spearman秩相关分析法,采用双尾检验,分别在p=0.01和p=0.05显著性水平下计算叶绿素a与5个环境因子之间的相关系数。

S163,采用逐步回归模型分析叶绿素a浓度与水质参数之间的关系,并建立叶绿素a浓度与水质参数的最优的多元线性回归方程,得到绿素a浓度与水质参数的相关性模型。

本实施例中,使用逐步回归模型分析叶绿素a浓度与水质参数之间的关系,并且建立叶绿素a与水质参数的最优的多元线性回归方程,使用参数拟合优度(R2)和显著性检验(P)检验模型的适用性,得到结果如下:

表3使用逐步回归模型分析叶绿素a浓度与水质参数之间的关系

逐步回归分析结果表明,冬、夏两季影响叶绿素a含量的水质参数不同,冬季影响叶绿素a浓度的水质变量多于夏季,且对叶绿素a的拟合程度更好。溶解氧和电导率在冬、夏两季中对叶绿素a影响均较大。

S164,对所述绿素a浓度与水质参数的相关性模型进行优化和检验。

本实施例中,对构建的绿素a浓度与水质参数的相关性模型进行优化,可通过调整参数模型、改变特征选择等方法进行优化处理,以提高该模型的预测精度和稳定性。再使用独立的数据集对优化后的模型进行检验,评估模型的预测性能和泛化能力。然后,根据模型检验的结果,解读绿素a浓度与水质参数之间的关联性,以及模型的预测性能;同时,将模型结果进行可视化展示,以便于用户能够直观理解绿素a浓度与水质参数之间的关联性和模型的预测结果。

本申请提供的高精度叶绿素时间序列分析方法,能够高效、快捷的获得高频数据,实现实时监控叶绿素a浓度,并能够完整监测白昼和夜晚的全部动态过程,且对于小微水体的定位更为准确。本申请提供的高精度叶绿素时间序列分析方法,综合时序图、水站维护记录和箱形图识别原始数据的异常值,可以作为水站时间序列数据预处理的一般过程;基于水环境指标时间序列图像的模式识别,并结合水质指标特征、自动监测的特点以及水站维护记录,使得水质时间序列数据的异常值识别更加合理、准确;进而,本申请提供的高精度叶绿素时间序列分析方法在应用时,需要运用水质自动监测站监测叶绿素a浓度,分析叶绿素a时间序列,掌握不同季节叶绿素a昼夜变化的规律;同时,在对自动水站的时间序列数据进行分析之前,需要结合水质指标特征、自动监测的特点以及水站维护记录,运用异常值筛选方法合理、准确地识别时间序列的异常值。

本申请实施例所述的高精度叶绿素时间序列分析方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本申请的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本申请的保护范围内。

本实施例另外还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所述高精度叶绿素时间序列分析方法。

在任何可能的技术细节结合层面,本申请可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本申请的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在计算机上执行、或者完全在计算机或服务器上执行。在涉及计算机的情形中,计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本申请的各个方面。

本申请实施例还提供一种高精度叶绿素时间序列分析系统,所述高精度叶绿素时间序列分析系统可以实现本申请所述的高精度叶绿素时间序列分析方法,但本申请所述的高精度叶绿素时间序列分析方法的实现装置包括但不限于本实施例列举的高精度叶绿素时间序列分析系统的结构,凡是根据本申请的原理所做的现有技术的结构变形和替换,都包括在本申请的保护范围内。

以下将结合图示对本实施例所提供的高精度叶绿素时间序列分析系统进行详细描述。

本实施例提供一种高精度叶绿素时间序列分析系统,包括:

请参阅图11,显示为本申请所述的高精度叶绿素时间序列分析系统于一实施例中的原理结构示意图。如图11所示,所述高精度叶绿素时间序列分析系统包括:调研模块111、获取模块112、计算模块113、识别模块114、分析模块115、模型构建模型116。

所述调研模块111用于获取目标水域的水文地理基础信息。

本实施例中,所述水文地理基础信息包括但不限于:自然地理概况、水环境现状、水质检测、水岸植被调查、水生生物调查、水质连续监测情况等多种类型的信息。

具体地,现场调查水域地理、生物及水质等水文地理基础信息的情况。调查包括:自然地理概况、水环境现状、水质检测、水岸植被调查、水生生物调查、水质连续监测情况等。

所述获取模块112与所述调研模块111相连,用于获取目标水域中的叶绿素a在线监测基础数据。

本实施例中,于一水质自动监测站中,根据用户需求设置数据采集频率,实时采集叶绿素a在线监测基础数据。

具体地,选取收集某个时间段内自动水站的监测数据,监测数据频率优选为每5分钟一次,以叶绿素a的水站在线监测值作为原始数据。

在水质自动监测站安装叶绿素a的在线监测设备,确保设备的准确性和稳定性;并对设备进行配置,如:设备校准、设置监测参数等。然后,启动在线监测设备,开始采集叶绿素a的数据,其中,数据采集频率可以根据实际需求设定,例如每小时、每天或每周采集一次。接着,将采集到的数据通过有线或无线的方式传输至数据中心或云平台上,并在数据中心或云平台上进行数据的处理,包括:数据清洗、格式转换、异常值检测与处理等,然后将处理后的数据进行存储以备用。

所述计算模块113用于基于所述叶绿素a在线监测基础数据计算出叶绿素a时间序列图,得到叶绿素a时平均值序列。

本实施例中,基于所述叶绿素a在线监测基础数据计算各不同指标的时平均值序列。取每小时内叶绿素a的12个监测值的平均值,得到每个指标的时平均值序列。

具体地,对叶绿素a在线监测基础数据进行筛选,包括:监测时间、叶绿素a浓度等信息;再对筛选后的叶绿素a在线监测基础数据进行预处理,如:数据清洗、异常值处理、缺失值填充等步骤,以保证数据的准确性和完整性;然后,将监测时间划分为不同的时间段,例如:每天的24小时、每小时的60分钟等,本实施例优选每小时内取12个监测值,而划分的依据可以根据实际需求自行设定;接着,在每个时间段内,计算叶绿素a浓度的平均值。可以采用算术平均值、几何平均值等方式进行计算;最后,将计算出的各个时段的平均值按照时间顺序排列,生成时平均值序列。

基于所述时平均值序列取每日平均值,得到各不同指标的日平均值序列。

本实施例中,对时平均值序列取每日平均值,得到每个指标的日平均值序列。

所述识别模块114用于基于所述叶绿素a时间序列图识别出监测数据异常值,并对缺失部分进行填充。

本实施例中,基于水环境指标时间序列图像的模式识别,并结合水质指标特征、自动监测的特点以及水站维护记录,识别监测数据异常值,剔除识别出的异常数据后,对缺失部分进行填补。

在对自动水站的时间序列数据进行分析之前,检测时间序列的异常值。一类是水体本身的异常变化,通过某种指标得到体现;另一类是监测过程某环节出现异常,导致某些指标的监测数据出现异常值。如果分析目的是发现叶绿素变化的一般规律,那么这部分数据应当舍去;但若分析目的在于识别河道水华等突发事件,那么这部分数据正是分析所需要的。对于监测过程出现的异常,水质自动监测站通常由水路单元、控制单元、数采单元、数传单元、监测单元和数据中心等若干模块化单元组成,任何一个单元出现故障,都可能导致终端获取的数据出现异常。因此对于监测过程,引起数据异常的原因包括但不限于取水口堵塞、电力中断、探头损坏以及数据接发系统故障等等。

基于所述叶绿素a时间序列图进行图像分析,识别出监测数据异常值。所述监测数据异常值包括:0值或负值、极端高值;包括:当监测数据值为0值或负值时,则认定该监测数据异常值是因水体自身之外的因素导致的;当监测数据值为极端高值时,则认定水体已经处于富营养化状态。

本实施例中,通过图像初步识别法对异常值作出合理识别。初步识别图像中数据波动幅度增大,有明显的极端高值和低值,使得曲线呈“毛刺状”的部分,用红色区域标出出现的异常数据,该部分数据偏离了数据总体的变化趋势,或者该部分数据的波动幅度明显超过附近数据的波动程度。随后根据气候变化、地理环境等因素进行异常值出现原因的分析,快速提供对数据分布的基本认知。

具体地,叶绿素a数据的波动情况存在同溶解氧类似的季节差异,即:冬季波动幅度小于夏季。就异常数据的识别而言,大致也可分为两类,一类为0值甚至是负值,显然为水体自身之外的因素所导致;另一类为极端高值,最高达到125μg/L。参照美国环保总署(USEPA)有关标准,当水体叶绿素a浓度超过10μg/L时,水体已经处于富营养化状态。此次自动监测所选取的联合村河道,地处农村,周边环境优美,无工业污染,少生活污染;但同时联合村河道与东苕溪以联合闸相隔,上游便是太湖,饱受A湖湖水倒灌侵扰。相关研究表明,A湖湖水的叶绿素a浓度在枯水期(11月)能达到300μg/L,因此若A湖湖水倒灌东苕溪,而联合闸未能及时关闭,那么联合村内河道叶绿素浓度很有可能在短时间内急剧上升。在箱线图法和统计识别法中,这些极大值会被当作异常值舍去。由此可见,基于图像的经验识别法不仅仅作为异常值识别的预阶段,快速提供对数据分布的基本认知,实际上,图像能够给予对数据最直观的感受,尤其在基层水环境管理中,图像经验识别省去了复杂的模型构建和繁琐的数学运算,依然能对异常值作出合理识别,既保证准确性,又方便快捷。

进一步地,对水站监测系统进行定期维护,同时根据所述水站监测系统运行情况增加维护次数。

本实施例中,维护记录辅助识别,根据维护记录,识别出数据缺失或无效。相关人员会定期对水站监测系统进行维护,同时根据运行情况增加维护次数,根据各指标时平均序列的图线以及维护记录,识别出较长时间段的数据缺失或无效。

具体地,相关人员会定期对水站监测系统进行维护,同时根据运行情况增加维护次数。

基于所述监测数据异常值进行分析,采用箱形图识别出离群值,并对所述离群值进行筛选和剔除。

本实施例中,对所述叶绿素a在线监测基础数据进行预处理,得到标准化格式的叶绿素a在线监测数据;根据所述标准化格式的叶绿素a在线监测数据制作箱形图,得到离群值,并识别出异常的离群值;对识别出的所述离群值进行筛选,剔除异常的离群值。

具体地,剔除无效数据后,对监测数据作箱形图分析其分布情况,做各指标的箱形图,观察数据分布情况。箱形图识别出的离群值还需要结合指标特性和实际情况综合分析后进行离群值的筛选和剔除。

可以看出,基于图像识别的异常数据基本属于监测过程的异常事件所导致的异常数据,而因水体自身异常变化产生的异常数据一般以尖锐峰的形式呈现。一方面,某些指标,如溶解氧和叶绿素的监测数据在夏季波动剧烈,锯齿状明显,只凭借图像很难确定代表异常数据的尖锐峰;另一方面,不同于维护记录,精确到小时的气象数据、河道异常事件记录等资料难以获取,因而在缺乏相关数据的情况下,异常事件识别异常数据并不容易。

因此,在剔除以上识别的异常数据之后,对监测数据作箱形图分析其分布情况。值得一提的是,采用诸如箱形图和统计识别等数理方法识别异常数据,常常会忽略异常数据背后的异常事件。通常来说,为了获取指标变化的一般规律,或进行时间序列预测,应尽可能排除异常数据;而为了分析指标变化同事件的关系,那么异常数据反而是值得关注的对象。

为进一步分析,做各指标的箱形图,观察数据分布情况。

由箱形图可看出,存在落在Whisker上下限外的“离群值”,离群值的筛选和剔除还需要结合指标特性和实际情况综合分析。

最后,对剔除后的数据的缺失部分进行填补。

本实施例中,剔除识别出的异常数据后,对缺失部分进行填补。如果忽视数据缺失的存在,直接对不连续的时间序列进行处理,如统计分析和时间序列预测,取得的结果往往不准确,因为直接去掉不完整的部分,对剩余的数据展开统计分析,会使大量的原始资料信息丢失,不但不利于分析结果的准确性及可靠性的提升,还可能会造成错误结果的出现。因此通常情况下,需要对数据缺失部分进行填补。

具体地,剔除识别出的异常数据后,需要对缺失部分进行处理。对于联合村水站自动监测的水质时间序列数据,短时间的数据跳跃或缺失可以采用临近时间点的平均值来填补。但对于较长时间段的数据缺失或无效,考虑到一方面数据频率高,即便将原始数据进行转换,得到时平均值序列,用一般插值方法填补缺失值显得过于粗糙;另一方面,异常数据跨度少则两三天,长则达二十天甚至一个月,试图填补出每小时数据,实际上相当于预测时间序列,且往后预测几百期以上,准确性可想而知。

需要注意的是,短时间的数据跳跃或缺失可以采用临近时间点的平均值来填补。而对于较长时间段的数据缺失或无效,考虑到一方面数据频率高,即便将原始数据进行转换,得到时平均值序列,用一般插值方法填补缺失值显得过于粗糙,如果异常数据时间跨度较大,填补数据较多,准确性不可控,因而在这种情况下需要尽量避开剔除异常数据的部分。

所述分析模块115用于分析所述叶绿素a时平均值序列,得到叶绿素a浓度平均值昼夜变化规律以及叶绿素a浓度平均值昼夜变化的月平均分布规律。

分析某时间段内水质自动监测站的时平均值序列,得到该时间段内的叶绿素a浓度平均值昼夜变化。

本实施例中,分析水站运行2年以来获取的时平均值序列,得到2019年4月—2021年4月联合村自动水站监测的叶绿素a浓度平均值昼夜变化。

可通过数据显示,看到某地区的叶绿素浓度总体呈现出单峰(单谷)的典型昼夜变化规律。

进一步地,基于所述叶绿素a浓度平均值昼夜变化,提取叶绿素a浓度有效数据中每月昼夜变化。

本实施例中,为进一步分析叶绿素浓度昼夜变化的季节差异,提取叶绿素a浓度有效数据中每月昼夜变化。

所述模型构建模块116用于通过叶绿素a浓度与不同季节水质变量的相关性,得到不同季节叶绿素a浓度与水质参数的相关性模型。

本实施例中,基于不同季节下的水质自动监测站的叶绿素a与环境因子进行相关性分析。所述环境因子包括但不限于:水温、电导率、ORP、DO、浊度等多种因子。

本实施例中,对联合村自动水站监测的叶绿素a与其它理化因子,即:水温、电导率、ORP、DO、浊度进行相关性分析。

采用Spearman秩相关分析法,计算叶绿素a与各所述环境因子的相关系数。采用逐步回归模型分析叶绿素a浓度与水质参数之间的关系,并建立叶绿素a浓度与水质参数的最优的多元线性回归方程,得到绿素a浓度与水质参数的相关性模型。

本实施例中,使用逐步回归模型分析叶绿素a浓度与水质参数之间的关系,并且建立叶绿素a与水质参数的最优的多元线性回归方程,使用参数拟合优度(R2)和显著性检验(P)检验模型的适用性。

对所述绿素a浓度与水质参数的相关性模型进行优化和检验。

本实施例中,对构建的绿素a浓度与水质参数的相关性模型进行优化,可通过调整参数模型、改变特征选择等方法进行优化处理,以提高该模型的预测精度和稳定性。再使用独立的数据集对优化后的模型进行检验,评估模型的预测性能和泛化能力。然后,根据模型检验的结果,解读绿素a浓度与水质参数之间的关联性,以及模型的预测性能;同时,将模型结果进行可视化展示,以便于用户能够直观理解绿素a浓度与水质参数之间的关联性和模型的预测结果。

高精度叶绿素时间序列分析模型搭建高精度叶绿素时间序列分析系统,能够高效、快捷的获得高频数据,实现实时监控叶绿素a浓度,并能够完整监测白昼和夜晚的全部动态过程,且对于小微水体的定位更为准确;从而为精准施策提供科学依据。它既是环境保护信息化和经济社会发展的需要,也是从传统环境监测向现代环境监测转变的要求。

需要说明的是,应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述系统的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述系统的存储器中,由上述系统的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。

请参阅图12,显示为本申请所述的高精度叶绿素时间序列分析装置于一实施例中的原理结构示意图。如图12所示,本实施例提供一种高精度叶绿素时间序列分析装置,所述高精度叶绿素时间序列分析装置包括:处理器121、存储器122;所述存储器122用于存储计算机程序;所述处理器121与所述存储器122相连,用于执行所述存储器122存储的计算机程序,以使所述高精度叶绿素时间序列分析装置执行如上所述高精度叶绿素时间序列分析方法的各个步骤。

优选地,存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable GateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

综上所述,本申请提供的高精度叶绿素时间序列分析方法、系统、介质及装置,具有以下有益效果:

本申请提供的高精度叶绿素时间序列分析方法,能够高效、快捷的获得高频数据,实现实时监控叶绿素a浓度,并能够完整监测白昼和夜晚的全部动态过程,且对于小微水体的定位更为准确;从而为精准施策提供科学依据。它既是环境保护信息化和经济社会发展的需要,也是从传统环境监测向现代环境监测转变的要求。本申请综合了时序图、水站维护记录和箱形图识别原始数据的异常值,可以作为水站时间序列数据预处理的一般过程;基于水环境指标时间序列图像的模式识别,并结合水质指标特征、自动监测的特点以及水站维护记录,使得水质时间序列数据的异常值识别更加合理、准确。同样地,本申请提供的高精度叶绿素时间序列分析方法在应用时,需要运用水质自动监测站监测叶绿素a浓度,分析叶绿素a时间序列,掌握不同季节叶绿素a昼夜变化的规律;同时,在对自动水站的时间序列数据进行分析之前,需要结合水质指标特征、自动监测的特点以及水站维护记录,运用异常值筛选方法合理、准确地识别时间序列的异常值。

上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。

技术分类

06120116581451