掌桥专利:专业的专利平台
掌桥专利
首页

一种基于改进师生网络模型的污水处理过程故障检测方法

文献发布时间:2023-06-19 10:00:31


一种基于改进师生网络模型的污水处理过程故障检测方法

技术领域

本发明涉及污水处理领域,更具体的说,涉及一种基于改进师生网络模型的污水处理过程故障检测方法。

背景技术

随着我国城市化的不断发展,城镇人口越来越多,水资源的使用量逐渐增加,与之而来的还有城市污水的排放量不断增加。

为了满足可持续发展的要求,提高城市污水的再生利用率,城市污水处理显得越来越重要。

城市污水中的污染物大致可以分为:固体污染物、有机污染物、营养性污染物、酸碱性污染物、有毒污染物、油类污染物、生物污染物和热污染物。

污水的水质则是用各种指标标准污水的物理、化学或生物性质。常见的指标有酸碱度(PH值)、化学需氧量(COD)、生物需氧量(BOD)、氨氮(NH

污水处理按程度可以划分为四个等级:预处理、一级处理、二级处理和三级处理。

预处理包括沉降、过滤、预曝气等对处理后水质不高的初级处理过程。

一级处理过程是通过格栅、沉砂池、初沉池、气浮池、调节池等去除污水中呈悬浮状态的固体污染物。这一部分主要涉及物理处理。

二级处理则是通过特定的工艺,如活性污泥法、CASS工艺、A

三级处理主要是通过生物脱氮除磷、混凝沉淀法、砂滤法、紫外线臭氧消毒法、离子交换法、电渗分析法等,以此进一步处理难降解的有机物、氮和磷等能导致水体富营养化的可溶性无机物。这一过程主要是化学过程。

目前,城市污水处理所采用的活性污泥方法主要是借助微生物群体吸附和分解能力,对污水中可降解的有机物成分进行氧化,再使用复杂的生物和化学反应以及物理处理,使有机物质被降解并与污水进行分离以净化污水。

对于城市污水处理过程而言,一旦某个过程发生故障就会导致整个污水处理的故障,会给污水厂和社会带来巨大的经济损失和重大环境污染。

因此,对污水处理过程中的异常工况进行在线的故障监测和故障诊断,进而采取必要的措施减少或抑制异常工况的发生就变得非常重要。

城市污水在组分、含量、结构的多样性和复杂性使得污水处理过程具有时变性、时滞性、扰动性以及非线性等特征,这样使得传统的故障检测方法的监控效果较差。

传统的故障检测可以分为基于模型的方法、基于知识的方法、基于数据的方法。由于实际过程中会产生大量的数据,基于数据的方法可以快速地建立复杂的模型,因而。数据驱动的故障检测方法越来越受到大众的关注。

为了更好的处理非线性问题,神经网络被用于提取数据特征获得了较好的效果。但随着数据越来越复杂,神经网络更倾向于生成复杂的模型来获得更高的精度。复杂的模型需要耗费更长的时间和内存,对于一些在线预测任务往往不太适用。

发明内容

本发明的目的是提供一种基于改进师生网络模型的污水处理过程故障检测方法,解决现有技术的污水处理过程故障检测方法检测准确度低、监控效果较差的问题。

为了实现上述目的,本发明提供了一种基于改进师生网络模型的污水处理过程故障检测方法,包括离线训练过程和在线训练过程:

所述离线训练过程,进一步包括以下步骤,

S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的历史数据,作为训练数据集;

S2、将训练数据集中的数据进行预处理;

S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息;

S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程;

S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成;

S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值;

所述在线训练过程,进一步包括以下步骤,

S7、获取污水处理过程的过程变量的实时数据,并进行预处理;

S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差;

S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。

在一实施例中,所述步骤S1中污水处理过程采用的工艺,包括:

异养生物的需氧生长;

异养生物的缺氧生长;

自养生物的需氧生长;

异养生物的衰减;

自养生物的衰减;

可溶性有机氮的氨化;

被吸附的缓慢降解有机碳的水解;

被吸附的缓慢降解有机氮的水解。

在一实施例中,所述步骤S1中的过程变量和质量变量,反映污水处理过程的运行状况,包括但不限于:

溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、pH值、固态悬浮物浓度、水的压力和水温。

在一实施例中,所述步骤S2或步骤S7中,数据进行预处理的方法,包括以下步骤:

去除数据缺失的样本;

去除与其他样本偏差过大的样本;

对数据零均值化,以消除不同量纲的影响。

在一实施例中,所述步骤S3中的师生网络模型,通过以下步骤获得:

将过程变量X作为学生网络的输入;

将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入;

设定教师网络和学生网络网络结构为人工神经网络;

设定教师网络的层数为3层,隐含层的神经元个数为10个;

设定学生网络的层数为3层,隐含层神经元个数为6个;

进行训练所得到的隐含层为对应的表征信息。

在一实施例中,所述步骤S4中的表征信息模块,用于衡量教师网络和学生网络之间的差异,对应的公式表达式为:

其中,z

phase表示该网络是处于训练阶段或测试阶段;

d

在一实施例中,所述步骤S4中,教师网络和学生网络表征信息的差异符合高斯分布,差异参数d

其中,

所述步骤S5中的预设停止条件为,δ<0.01或N

其中,N

在一实施例中,所述步骤S6或步骤S8中,计算残差的方法,进一步包括以下步骤:

根据输入数据对训练完成的教师网络和学生网络的输出进行划分;

将教师网络的输出作为质量相关子空间;

将学生网络的输出作为过程相关子空间;

构建相应的残差,对应的公式表达式为:

其中,D

在一实施例中,所述步骤S6中,计算阈值的方法,进一步包括以下步骤:

计算残差统计量的分布函数

其中,x

将满足

其中,KDE值根据实验或人为设定。

在一实施例中,所述步骤S9,进一步包括以下步骤:

分别在过程相关子空间和质量相关子空间画出过程变量和质量变量的统计图;

将步骤S6中所得的阈值作为控制线,与步骤S8中所得的残差作比较,残差超出控制线则认为发生故障。

本发明提出的一种基于改进师生网络模型的污水处理过程故障检测方法,可以根据污水过程的训练数据,建立轻便学生网络识别故障点,减小教师网络和学生网络的差异,增强模型的泛化能力,提高模型预测的准确性,具有高效、快速、准确、泛化能力强等特点。

本发明提出的基于改进师生网络模型的污水处理过程故障检测方法,具体具有以下有益效果:

1)方法简单、高效、准确性高,利用神经网络建模可以有效地提取数据中的非线性特征,并利用师生网络降低网络复杂性,减少训练时间;

2)与传统的师生网络方法相比,本发明更注重减少师生网络之间的差异,学生网络对教师网络的学习效果更好,显著提高了检测的准确性和高效性;

3)实验过程中不需要先验知识,不需要暂停工业过程,可以根据实际需要和数据的变化更改模型,以实现对工况的实时跟踪,得到更好地预测精度,降低了模型维护的成本。

附图说明

本发明上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变的更加明显,在附图中相同的附图标记始终表示相同的特征,其中:

图1揭示了根据本发明一实施例的基于改进师生网络模型的污水处理过程故障检测方法流程图;

图2揭示了长期型1号基准仿真模型简化流程图;

图3揭示了根据本发明一实施例的改进师生网络模型的不确定建模的框架图;

图4揭示了根据本发明一实施例的改进师生网络模型的不确定建模的迭代训练流程图;

图5揭示了根据本发明一实施例的质量空间检测结果对比图;

图6揭示了根据本发明一实施例的过程空间检测结果对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释发明,并不用于限定发明。

本发明提出的基于改进师生网络模型的污水处理过程故障检测方法,以污水处理过程正常工况下的数据作为训练数据集,通过不确定建模对传统师生网络进行改进,将教师网络和学生网络之间的差异作为噪声,经过采样建模后反馈给教师网络的训练,复杂的教师网络监督轻便的学生网络,从而得到性能更好的学生网络。

在离线过程中,利用学生网络提取数据特征,构建残差统计量和阈值。

在线故障检测过程中,针对实时数据利用学生网络提取特征,并根据提取的特征计算统计量,根据统计量是否超出控制线来判断是否发生故障。

图1揭示了根据本发明一实施例的基于改进师生网络模型的污水处理过程故障检测方法流程图,如图1所示的基于改进师生网络模型的污水处理过程故障检测方法,包括离线训练过程和在线训练过程:

所述离线训练过程,进一步包括以下步骤,

S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的历史数据,作为训练数据集;

S2、将训练数据集中的数据进行预处理;

S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息;

S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程;

S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成;

S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值;

所述在线训练过程,进一步包括以下步骤,

S7、获取污水处理过程的过程变量的实时数据,并进行预处理;

S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差;

S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。

下面详细说明每一步骤。

首先是离线训练过程。

离线过程使用历史数据训练并分别在两个空间中构建残差,然后利用核密度估计确定残差的阈值。

S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的数据,作为训练数据集。

确定污水处理的工艺流程,选择过程变量和质量变量,构建训练数据集。确认污水处理的具体工艺是为了后面选取过程变量和质量变量时能更好的实现监控。

本实施例中的污水处理流程符合如图2所示的仿真模型,图2揭示了长期型1号基准仿真模型简化流程图,该过程由一个生物反应器210和一个二沉池220组成。

生物反应器210由5个池子组成,其中前2个池是无氧的,称为缺氧池211,后3个池是有氧的,称为好氧池212。

在这个过程中,有机物被微生物的生命活动消耗,氮通过好氧池硝化过程和缺氧池反硝化过程被消耗。

二沉池220高10层、4米高,其中没有化学反应发生。

生化反应器210内的污水从第五单元流出,一部分从第六层流入二沉池220,另一部分通过管道回流到生化反应器210入口进行内循环。

二沉池220中将符合污水排放标准的水从顶层的排出,而底部的污水分成两个部分,一部分是返回第一个缺氧的生化池,另一部分抽出剩余污泥。

污水处理过程应大致满足长期型1号基准仿真模型中的动态过程,采用的工艺主要包括:(1)异养生物的需氧生长;(2)异养生物的缺氧生长;(3)自养生物的需氧生长;(4)异养生物的衰减;(5)自养生物的衰减;(6)可溶性有机氮的氨化;(7)被吸附的缓慢降解有机碳的水解;(8)被吸附的缓慢降解有机氮的水解。

选取的过程变量和质量变量,要能反映污水处理过程的运行状况,包括但不限于:化学需氧量(Chemical Oxygen Demand,COD)、生物需氧量(Biological oxygen demand,BOD)、进水量、污泥回流量、出水量、溶解氧浓度、出水氨氮含量、化学需氧量、pH值、固态悬浮物浓度、水的压力和水温。

一般要求数据不少于200组,同时应该包含尽可能多的运行条件,比如干燥天气,潮湿天气,下雨天气等。

S2、将训练数据集中的数据进行预处理。

对数据的预处理的方法,包括以下步骤:

去除数据缺失的样本;

去除与其他样本偏差过大的样本,剔除异常数据;

对数据零均值化,以消除不同量纲的影响。

对数据零均值化方法,进一步包括:

假设有M组样本数据{Xm},每组样本数据是N维,由此组成M×N维的矩阵{X

对数据零均值化公式为:

其中,x

S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息。

师生网络利用复杂的教师网络指导生成简单、能迅速响应的学生网络,这种学生网络在进行在线预测的任务时能够在增加准确性的同时减小所用时间。所以考虑用师生网络来进行建模。

传统的师生网络的训练,采用预训练的教师网络的方法,忽略了学生网络与教师网络之间的差异造成的性能下降问题。此外,传统的师生网络模型的泛化能力较弱,对于未出现过的数据预测性能较弱。

图3揭示了根据本发明一实施例的改进师生网络模型的不确定建模的框架图,如图3所示的改进师生网络模型的网络结构,通过以下步骤获得:

根据已知的师生网络结构,将过程变量X作为学生网络的输入;

将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入;

设定教师网络和学生网络网络结构,可以选择为人工神经网络;

设定教师网络的层数为3层,隐含层的神经元个数为10个;

设定学生网络的层数为3层,隐含层神经元个数为6个。

然后进行训练,所得到的隐含层认为是对应表征信息。

S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程。

利用表征信息模块(REB)和不确定建模方法对教师网络和学生网络的差异进行建模,在教师网络的训练中把建模后的差异作为噪声进行训练,以此减小教师网络和学生网络的差异。

表征信息模块,用于衡量教师网络和学生网络之间的差异,对应的公式表达式为:

其中,z

phase表示该网络是处于训练阶段或测试阶段,使用历史数据时是训练阶段,使用实时数据时是测试阶段;

d

差异参数d

d

其中,δ

S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成。

对教师网络和学生网络同时进行迭代训练,设置预设停止条件为:

δ<0.01或N

其中,N

图4揭示了根据本发明一实施例的改进师生网络模型的不确定建模的迭代训练流程图,如图4所示的迭代训练的过程,在第N次的教师网络的训练中加入第N-1次的扰动,该扰动是由第N-1次教师网络和学生网络隐含层的特征的差异产生,通过对这个差异大小进行评估,并作为噪声的方差,然后,利用高斯采样对噪声进行采样。

学生网络的训练受到教师网络的监督。

S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值。

污水处理过程不仅要关注过程是否发生故障,还要关注污水处理后的水质是否达标,这就涉及到过程相关变量和质量相关变量,需要监控过程相关子空间和质量相关子空间。

主要包括对过程空间和质量空间的构建和残差的计算。

计算残差的方法,进一步包括以下步骤:

根据输入数据,对步骤S5中训练完成的教师网络和学生网络的输出进行划分;

将教师网络的输出作为质量相关子空间;

将学生网络的输出作为过程相关子空间;

构建相应的残差,对应的公式表达式为:;

其中,D

x

计算阈值的方法,进一步包括以下步骤:

计算残差统计量的分布函数

其中,x

将满足

其中,KDE值根据实验或经验人为确定。

较佳的,KDE值设定为99%,累积分布函数不低于99%的点可作为残差统计量的阈值。

下面介绍在线训练过程。

在线过程使用实时数据,并利用离线过程训练好的网络进行特征提取,计算对应的残差,然后画出统计图,若残差超出离线过程设定的阈值,则此时可能发生了故障。

为了同时监控过程相关子空间和质量相关子空间,将过程相关变量作为学生网络的输入,将过程相关变量和质量相关变量的联合变量作为教师网络的输入,根据提取的特征划分质量相关子空间和过程相关子空间。

S7、获取污水处理过程的过程变量的实时数据,并进行预处理。

采集实时的过程变量数据,进行预处理,实时数据的过程变量应与训练数据集中过程变量类别、个数和单位保持一致。

预处理方法与步骤S2的预处理方法一致。

S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差。

进行实时的训练,将处理后的数据输入到学生网络。

虽然只采集了过程变量,但学生网络能够利用过程变量预测出过程变量,因此,可以从学生网络的表征信息中获取过程相关子空间和质量相关子空间的数据。

计算对应空间的残差,通过将表征信息进行解码恢复得到质量相关子空间和过程相关子空间的数据,然后按照步骤S6中的计算残差的方法计算。

S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。

获得检测结果,分别在过程相关子空间和质量相关子空间画出统计量的统计图;

将步骤S6中所得的阈值作为控制线,与步骤S8中计算得到的残差作比较,残差超出控制线则被认为可能发生了故障。

更进一步的,可以调整模型,获得更好的检测效果

步骤S3的网络结构和步骤S4所建立的模型可以根据实际工业过程的数据和精度需要进行更改,步骤S6中根据核密度估计所得的阈值也可以根据精度调整。

本发明提出的一种基于改进师生网络模型的污水处理过程故障检测方法,在进行故障识别时:

首先采用本发明步骤S2中所述的预处理方法对数据进行预处理,然后采用步骤S3所述确定网络结构和步骤S4的网络训练方法进行教师网络和学生网络的训练,并利用步骤S6中所述的方法构建过程相关子空间和质量相关子空间,并计算对应的残差统计量和阈值。

在获取实时过程变量数据后,将其作为学生网络的输入,通过训练得出对应的表征信息,从而实现对过程空间和质量空间的预测,然后按照步骤S6的方法计算残差统计量,画出统计图,识别故障点。

以下以如图1所示的污水处理过程中,长期型1号基准仿真模型即活性污泥1号模型的故障识别的实例来说明本发明具体步骤。

步骤S1、选取表1中所示的14个变量作为过程变量,表2所示的1个变量作为质量变量。

采集污水处理过程正常工况下的数据,采集两周的数据,共1344组,作为训练数据集。

步骤S2、利用

其中,x

步骤S3、将过程变量X作为学生网络的输入,将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入。

设定教师网络和学生网络网络结构,选择人工神经网络,并且设定教师网络的层数为3层,隐含层的神经元个数为10个。

学生网络的层数为3层,隐含层神经元个数为6个。

然后进行训练,所得到的隐含层认为是对应表征信息。

步骤S4、对教师网络和学生网络之间的差异进行建模。

利用表征信息模块(REB)和不确定建模方法对教师网络和学生网络的差异进行建模

步骤S5、对教师网络和学生网络同时进行迭代训练,设置预设停止条件为δ

步骤S6、构建子空间,计算残差统计量和阈值

根据所述的统计量的构建方法构建残差统计量,并根据核密度估计,设定带宽h=0.1,置信度KDE=99%确定阈值。

步骤S7、采集实时的过程变量数据,进行预处理

在污水处理过程中,采集1344组实时数据。

每组数据由表1中所示的14个变量的数据组成。

根据实际运行状况得知从第672组数据开始,会出现表3所示的故障。共有2批数据。

步骤S8、进行实时的训练,将处理后的数据输入到学生网络。

这里虽然只采集了过程变量,但学生网络能够利用过程变量预测出过程变量。因此,可以从学生网络的表征信息中获取过程相关子空间和质量相关子空间的数据。

计算对应空间的残差,通过将表征信息进行解码恢复得到质量相关子空间和过程相关子空间的数据,然后按照步骤S6中的计算残差的方法计算。

步骤S9、获得检测结果,分别在过程相关子空间和质量相关子空间画出统计量的统计图,将步骤S6中所得的阈值作为控制线,与步骤S8中计算得到的残差作比较,超出控制线则被认为可能发生了故障。

使用与实施例1同样的训练数据和检测数据,通过本领域的常规方法TSSAE(Teacher-Student Stacked Autoencoder),SAE(Stacked Autoencoder),PCA(PrincipalComponent Analysis),PLS(Partial Least Squares)进行识别异常检测实验,本发明所提出的方法标识为TSUAE(Teacher-Student Uncertainty Autoencoder),最终的检测结果如表4、表5、图5和图6所示。

表4得到了所有方法的检测率,表5得到了所有方法的漏报率和漏报率,所述检测率和漏报率的计算方式如下:

其中,TP代表检测出是正常的、且实际上是正常的结果数,FN代表检测出是故障的、而实际上是正常的结果数,FP代表检测出是正常的、而实际上是故障的结果数,TN代表检测出是故障的、且实际上是故障的结果数。

就故障的检测结果来说,本发明所提出的方法TSUAE在故障1中过程相关子空间的检测率最高,这是一个明显的过程相关故障。

在故障2中,所有的方法都能检测出过程相关的故障,但本发明的方法能在质量相关子空间中显示这个故障会对污水处理的质量产生影响,需要引起重视。

就漏报率而言,本发明采用的确定控制线的方法都是KDE估计,因而,所有的漏报率都是很低的。

综上所述,本发明提出的方法,不仅能检测明显的过程相关故障(故障1),而且能检测质量相关的故障,并且在与本领域的其他方法对比,本发明提出的方法有更好的检测率,这表明本方法可以及时的发现故障,保障生产的过程。

表1:过程变量的组成

表2:质量变量的组成

表3:故障的设置

表4故障检测的检测率

表5故障检测的误报率

本发明提出的基于改进师生网络模型的污水处理过程故障检测方法,具体具有以下有益效果:

1)方法简单、高效、准确性高,利用神经网络建模可以有效地提取数据中的非线性特征,并利用师生网络降低网络复杂性,减少训练时间;

2)与传统的师生网络方法相比,本发明更注重减少师生网络之间的差异,学生网络对教师网络的学习效果更好,显著提高了检测的准确性和高效性;

3)实验过程中不需要先验知识,不需要暂停工业过程,可以根据实际需要和数据的变化更改模型,以实现对工况的实时跟踪,得到更好地预测精度,降低了模型维护的成本。

尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。

如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。

上述实施例是提供给熟悉本领域内的人员来实现或使用本发明的,熟悉本领域的人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。

相关技术
  • 一种基于改进师生网络模型的污水处理过程故障检测方法
  • 一种基于深度信念网络模型的风机故障检测方法
技术分类

06120112388675