掌桥专利:专业的专利平台
掌桥专利
首页

一种大气污染在线识别评价方法及系统

文献发布时间:2024-07-23 01:35:21


一种大气污染在线识别评价方法及系统

技术领域

本发明涉及数据处理技术领域,特别是指一种大气污染在线识别评价方法及系统。

背景技术

陶瓷生产过程中,常常伴随着各种气体的排放,其中包括一些对环境和人体有害的气体。为了有效控制这些有害气体的排放,及时并准确地识别和评价大气污染状况显得尤为重要。然而,针对陶瓷生产这类复杂多变的气体排放环境,现有的大气污染监测技术有的是基于单一的传感器,其准确性和可靠性受到传感器自身性能和外部环境的严重影响。特别是在复杂的混合气体环境中,单一传感器在识别和量化各种气体组分时会存在一些误差。

此外,传统的监测方法还有缺乏对传感器响应特性的动态调整,不方便根据实时环境条件(如温度、湿度、压力等)和传感器性能的变化来调整的问题,因此,容易导致监测结果存在一些偏差。

发明内容

本发明要解决的技术问题是提供一种大气污染在线识别评价方法及系统,通过设置动态调整因子,能够根据历史数据、实时环境条件以及传感器性能进行动态调整,从而提高了监测结果的准确性和可靠性。

为解决上述技术问题,本发明的技术方案如下:

第一方面,一种大气污染在线识别评价方法,所述方法包括:

采用至少一种传感器,组成传感器阵列;

向传感器阵列中通入单种气体,获取每种传感器对各种气体的响应特性;

获取在各种混合气体环境下,每种传感器的电压值;

根据历史数据、实时环境条件以及传感器性能,计算动态调整因子;

通过响应特性、每种传感器的电压值以及动态调整因子进行计算,以生成各种气体的预测值;

分析各种气体的预测值和真实值,以得到分析结果;

根据对比结果,对大气污染气体进行分析,以得到分析结果。

进一步的,根据历史数据、实时环境条件以及传感器性能,计算动态调整因子,包括:

通过

进一步的,所述环境条件包括外部温度、湿度和风速。

进一步的,通过响应特性、每种传感器的电压值以及动态调整因子进行计算,以生成各种气体的预测值,包括:

根据响应特性和每种传感器的电压值构建特征矩阵;

根据预设的宽度参数σ,通过

根据核向量k(x′,X

进一步的,根据响应特性和每种传感器的电压值构建特征矩阵,包括:

将传感器的电压值与动态调整因子相乘,以得到调整后的电压值;

创建一个特征矩阵,其行数等于传感器数据点的数量,列数为2,第一列用于存储调整后的电压值,第二列用于存储响应时间;

在特征矩阵的第一列中,依次填入每个调整后的电压值,在特征矩阵的第二列中,依次填入与每个电压值相对应的响应时间。

进一步的,分析各种气体的预测值和真实值,以得到分析结果,包括:

对于每一对预测值和真实值,计算预测值和真实值之间的误差;

对所有计算出的误差进行统计分析,以得到分析结果。

进一步的,对所有计算出的误差进行统计分析,以得到分析结果,包括:

计算所有误差的平均值,并计算平均误差;

根据平均误差,计算误差的标准差;

根据所述误差的标准差,确定所有误差中的最大值和最小值。

第二方面,一种大气污染在线识别评价装置,包括:

获取模块,用于采用至少一种传感器,组成传感器阵列;向传感器阵列中通入单种气体,获取每种传感器对各种气体的响应特性;获取在各种混合气体环境下,每种传感器的电压值;根据历史数据、实时环境条件以及传感器性能,计算动态调整因子;

处理模块,用于通过响应特性、每种传感器的电压值以及动态调整因子进行计算,以生成各种气体的预测值;分析各种气体的预测值和真实值,以得到分析结果;根据对比结果,对大气污染气体进行分析,以得到分析结果。

第三方面,一种计算设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现所述的方法。

第四方面,一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,该程序被处理器执行时实现所述的方法。

本发明的上述方案至少包括以下有益效果:

通过使用传感器阵列而非单一传感器,结合多种传感器的响应特性,能够更准确地在复杂的混合气体环境中识别和量化各种气体组分。

本发明通过设置动态调整因子,能够根据历史数据、实时环境条件以及传感器性能进行动态调整,从而提高了监测结果的准确性和可靠性。

附图说明

图1是本发明的实施例提供的一种大气污染在线识别评价方法的流程示意图。

图2是本发明的实施例提供的一种大气污染在线识别评价装置示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

如图1所示,本发明的实施例提出一种大气污染在线识别评价方法,所述方法包括以下步骤:

步骤11,采用至少一种传感器,组成传感器阵列;

步骤12,向传感器阵列中通入单种气体,获取每种传感器对各种气体的响应特性;

步骤13,获取在各种混合气体环境下,每种传感器的电压值;

步骤14,根据历史数据、实时环境条件以及传感器性能,计算动态调整因子;

步骤15,通过响应特性、每种传感器的电压值以及动态调整因子进行计算,以生成各种气体的预测值;

步骤16,分析各种气体的预测值和真实值,以得到分析结果;

步骤17,根据对比结果,对大气污染气体进行分析,以得到分析结果。

在本发明实施例中,步骤11,通过组合多种传感器形成阵列,可以扩大能够检测的气体种类范围,同时利用不同传感器之间的互补性,提高气体识别的精度。步骤12,通过单独测试每种气体对传感器的响应,可以建立起精确的传感器响应模型。步骤13,通过在混合气体环境下测试传感器的响应,可以模拟真实的大气污染状况,使得后续的气体识别更加贴近实际情况。步骤14,利用历史数据、实时环境条件和传感器性能计算出的动态调整因子,可以使识别方法更加灵活和准确,能够适应不断变化的环境条件和传感器状态。步骤15,综合考虑传感器的响应特性、实时电压值和动态调整因子,可以生成更准确的气体预测值,为大气污染监测提供可靠的数据支持。步骤16,通过对比预测值和真实值,可以验证预测方法的准确性,并根据分析结果进行必要的校正,进一步提高识别精度。步骤17,最终的分析结果可以为环境保护部门提供关于大气污染状况的准确信息。

在本发明另一优选的实施例中,上述步骤11,可以包括:

步骤111,对监测区域进行分析,包括监测区域的大小、形状、地形、风向风速环境因素;获取每种传感器的检测范围、精度和响应时间,根据监测区域特点和传感器性能,确定传感器的分布位置;

步骤112,根据传感器的分布位置,对于每个布局,确定传感器的位置和覆盖范围,计算监测区域内每个点被传感器的覆盖率;计算传感器覆盖范围的交集以确定不同传感器之间的重叠覆盖区域;将覆盖率和重叠区域代入目标函数,计算出每个布局的适应度值,其中,目标函数的计算公式为:

步骤113,将所有个体的适应度值进行归一化处理,将每个个体的归一化适应度值累加,以计算每个个体被选择的累积概率;

步骤114,生成一个随机数,根据该随机数落在累积概率区间的位置确定对应的个体,重复多次,以生成足够数量的下一代个体;

步骤115,对选中的个体进行交叉和变异操作,生成新的布局方案;

步骤116,重复上述过程,直到达到预设的进化代数,在优化过程中记录每一代的最优布局方案和对应的适应度值,分析记录的数据,观察适应度值的变化趋势和布局的改进情况,确定适应度值最高的布局方案作为最优布局。

在本发明实施例中,通过对监测区域进行详细分析,并考虑传感器性能和特点,可以更加合理地确定传感器的分布位置,从而确保关键区域的有效覆盖。通过计算覆盖率和重叠区域,可以最大化监测区域的覆盖,并减少传感器之间的不必要重叠,从而提高监测效率和数据准确性。归一化处理适应度值并计算累积概率,确保了在选择过程中每个布局方案都有被选中的机会,实现了布局的多样性。通过随机数选择和累积概率机制,模拟了自然选择和遗传过程,有利于寻找到更优的布局方案。交叉和变异操作能够引入新的布局变化,避免陷入局部最优,有助于找到全局最优解。通过多次迭代和优化,记录并分析每一代的最优布局和适应度值,能够确保算法收敛到最优解。

例如,在某大型陶瓷生产企业中,为了实时监控生产过程中的大气污染情况,并确保生产环境的安全与健康,企业决定在生产车间内部署传感器网络。然而,车间的空间布局复杂,且存在多个潜在的污染源。因此,如何合理布局传感器,以确保全面、准确地监测到各个关键区域的大气污染情况,成了一个亟待解决的问题。

车间的实际情况包括其大小(100m×50m)、生产设备的位置、通风情况、潜在的污染源(如原料堆放区、研磨区、烧结区等)。传感器性能参数主要包括检测范围(例如,某些传感器可能对特定气体有高灵敏度,检测范围可能从几ppm到百分比级别)、精度(传感器读数与实际值的偏差)、响应时间(传感器从接触到目标气体到提供准确读数所需的时间)。

基于车间地图和设备布局,制定了三个初步的传感器布局方案:

方案A:在车间四角及中心位置放置传感器,以最大化覆盖范围和减少盲区。

方案B:在潜在污染源附近(如原料堆放区、烧结炉排风口)增设传感器,以重点监测这些区域。

方案C:结合方案A和B,既考虑全面覆盖也注重重点区域的监测。

以下通过遗传算法进行优化:

每个布局方案被编码为一个字符串,表示传感器的位置和类型,随机生成多个布局方案作为初始种群,根据目标函数计算每个布局的适应度值,目标函数考虑传感器覆盖率、重叠覆盖区域的成本和传感器间距,确保所有关键区域至少被一个传感器覆盖,减少传感器之间的信号重叠,以降低干扰和成本;保持传感器间的合理距离,以平衡覆盖和信号质量,根据适应度值选择优秀的个体进入下一代,通过交叉(交换两个布局方案中的部分传感器位置)和变异(随机改变某个传感器的位置或类型)生成新的布局方案,达到预设的进化代数或适应度值达到某个阈值。

方案实施与验证,根据遗传算法优化后的最优布局方案,在车间内具体位置安装传感器。例如,在车间四角、中心以及重点污染源附近安装传感器,启动传感器网络,进行实时监测和数据收集,将传感器收集的数据与车间内其他独立监测系统(如手持式气体检测仪)的数据进行对比,验证数据的准确性和一致性,经过一段时间的监测,分析数据发现该布局方案能够全面、准确地捕捉到车间内的大气污染情况,包括污染源的识别、污染浓度的变化趋势等。

通过这一系列的步骤,企业不仅成功地优化了传感器的布局,还提高了对陶瓷生产过程中大气污染情况的监控能力,为改善生产环境和提高产品质量提供了有力的数据支持。

在本发明另一优选的实施例中,上述步骤12,可以包括:

步骤121,选择已知的单种气体样本,例如,SO

步骤122,实时监控并记录每个传感器对通入气体的响应数据,包括电阻、电压或电流等参数的变化;对于每种气体和每个传感器,使用图表软件(如Excel、MATLAB、Python的matplotlib等)绘制时间-响应曲线;时间作为x轴,传感器的响应值(如电阻变化、电压变化等)作为y轴;从响应曲线上确定传感器的响应时间,即从气体通入开始到传感器响应达到稳定值所需的时间,对比不同传感器对同一气体的响应时间,以及同一传感器对不同气体的响应时间。计算传感器响应的斜率或变化率,以此作为灵敏度的指标,对比不同传感器对同一气体的灵敏度,以及同一传感器对不同气体的灵敏度。观察传感器对不同气体的响应幅度,评估其对特定气体的选择性,如果某个传感器对某种气体的响应明显强于其他气体,则说明该传感器对这种气体具有良好的选择性。在响应曲线上观察传感器响应的稳定性,即响应值是否随时间波动,分析传感器在不同气体浓度下的稳定性,以及长时间运行后的稳定性。

在本发明实施例中,通过选择已知纯度和浓度的气体样本,并在一个可控且环境条件保持一致的实验环境中进行测试,可以最大限度地减少外部因素对实验结果的影响。这有助于获得更加准确和可靠的数据,从而提高传感器性能评估的精确性。通过实时监控并记录传感器对通入气体的响应数据,包括电阻、电压或电流等参数的变化,可以全面评估传感器的各项性能指标,如响应时间、灵敏度、选择性和稳定性。利用图表软件绘制时间-响应曲线,可以直观地展示传感器对不同气体的响应过程,使得数据分析更加便捷和高效。同时,通过对比不同传感器对同一气体的响应曲线以及同一传感器对不同气体的响应曲线,可以更容易地发现传感器之间的性能差异和优势。

在本发明另一优选的实施例中,上述步骤13,可以包括:

步骤131,将传感器阵列中的每个传感器安装在测试室内,确保它们能够准确感知气体环境的变化,在开始测试之前,对传感器进行校准,以确保其输出的电压值与实际的气体浓度之间具有良好的对应关系。

步骤132,使用精确的气体流量控制器,将配制好的混合气体样本依次通入测试室中,每次通入一种混合气体后,给传感器足够的响应时间,以确保其输出电压值达到稳定状态。

步骤133,使用数据采集设备(如数据采集卡、高精度万用表等)记录每个传感器在不同混合气体环境下的输出电压值,确保数据采集的速率足够快,以捕捉到传感器响应的动态变化,将每种混合气体对应的传感器电压值详细记录,包括混合气体的成分、浓度以及传感器的输出电压值。

在本发明实施例中,通过在开始测试之前对传感器进行校准,可以确保传感器输出的电压值与实际气体浓度之间具有准确的对应关系,这大大提高了测试数据的准确性和可靠性。使用精确的气体流量控制器可以确保每次通入测试室的混合气体样本具有相同的浓度和流量,从而增强了实验的可重复性。数据采集设备以足够快的速率记录传感器的输出电压值,能够捕捉到传感器响应的动态变化。

在本发明一优选的实施例中,上述步骤14,可以包括:

步骤141,通过

在本发明实施例中,本发明综合考虑了多种影响传感器读数的因素,包括传感器历史读数、环境条件、传感器灵敏度和响应时间等,使得调整因子F更具综合性和灵活性,能够更准确地反映传感器的实时状态。通过设置双曲正切函数,该公式能够动态地调整F的值,使其在-1到1之间变化,从而根据各种因素的变化实时调整传感器的输出,提高了传感器的动态适应性。调整因子F公式中包含了传感器历史读数与环境条件的交叉项系数

例如,假设有一个温度传感器网络,用于监测陶瓷生产园区内的温度变化。园区内不同位置的温度可能受到外部温度、湿度、风速以及传感器自身的历史读数、灵敏度和响应时间等多种因素的影响。通过步骤141中的公式,可以为每个传感器计算一个动态调整因子F。例如,当外部温度升高时,某些位置的传感器可能由于太阳直射而读数偏高,此时通过调整因子F可以适当校正这一偏差。同样,如果某个传感器的响应时间变长(可能是由于老化或维护不当),调整因子F也会相应调整以降低其读数的影响。在实际应用中,可以根据历史数据和实时数据来拟合公式中的各个系数,从而得到一个针对特定传感器和环境的动态调整模型。这样,当传感器读数受到各种因素影响时,可以通过计算调整因子F来更准确地估计实际温度值。

在本发明一优选的实施例中,上述步骤15,可以包括:

步骤151,根据响应特性和每种传感器的电压值构建特征矩阵;

步骤152,根据预设的宽度参数σ,通过

步骤153,根据核向量k(x′,X

在本发明实施例中,通过构建特征矩阵并使用核相似度来计算预测的气体浓度值,该方法能够捕捉到传感器数据之间的复杂关系,从而提高气体浓度的预测精度。核岭回归模型对于数据的噪声和异常值具有较强的鲁棒性,能够在复杂多变的环境中提供稳定可靠的预测。通过使用核函数,如高斯核,模型能够处理非线性关系,这使得它在处理传感器数据与气体浓度之间的复杂关系时表现出色。核岭回归模型允许通过调整参数(如核函数的宽度参数σ)来优化模型性能,从而适应不同的应用场景和数据特性。

例如,在大型陶瓷生产企业中,为了确保工人安全和产品质量,需要实时监测窑炉内的某种关键气体的浓度。在生产环境中,已经部署了多个高精度传感器,这些传感器能够测量气体的浓度,并记录响应时间等关键参数。

在步骤151中,根据传感器的响应特性和电压值,构建一个特征矩阵。这个矩阵不仅包含了传感器在各种窑炉工作条件下的读数,还包括对应的响应时间和其他可能影响气体浓度的生产参数,如窑炉温度、湿度等。

接下来,在步骤152中,使用一个预设的宽度参数σ,来计算特征矩阵中的每个传感器数据点与训练数据集中每个点之间的核相似度。这个训练数据集Xi包含了陶瓷生产过程中,历史监测阶段收集到的多个数据点。每个数据点都是一个全面的特征向量,包含了调整后的电压值、响应时间,以及生产过程中的其他相关参数,如原料成分、炉温变化等。

最后,在步骤153中,利用核向量和已经训练好的核岭回归模型进行运算,从而得到预测的气体浓度值。这个预测值是基于当前传感器读数与历史监测数据之间的相似度来计算的,因此它能够更加准确地反映当前窑炉环境中的气体浓度。

通过这种方式,大型陶瓷生产企业可以实时监测窑炉内的关键气体浓度,一旦浓度超过安全阈值,就可以立即触发警报系统,从而保护工人的安全,并确保陶瓷产品的质量和生产的稳定性。这种方法不仅显著提高了气体浓度预测的精度,还极大增强了监测系统的鲁棒性和灵活性,使其能够适应陶瓷生产过程中复杂多变的环境条件。

在本发明一优选的实施例中,上述步骤151,可以包括:

步骤1511,将传感器的电压值与动态调整因子相乘,以得到调整后的电压值;

步骤1512,创建一个特征矩阵,其行数等于传感器数据点的数量,列数为2,第一列用于存储调整后的电压值,第二列用于存储响应时间;

步骤1513,在特征矩阵的第一列中,依次填入每个调整后的电压值,在特征矩阵的第二列中,依次填入与每个电压值相对应的响应时间。

在本发明实施例中,步骤1511,根据之前计算出的动态调整因子F来调整传感器的原始电压值,动态调整因子F考虑了多种因素(如传感器历史读数、环境条件、传感器灵敏度和响应时间等),因此将电压值与F相乘可以校准由于这些因素造成的偏差,使得电压值更加准确。例如,对于每个传感器的电压值V,使用之前计算出的动态调整因子F进行乘法运算,得到调整后的电压值Va

通过动态调整因子校准电压值,能够更准确地反映传感器在实际环境中的读数,从而提高后续预测或分析的准确性。由于考虑了多种影响传感器读数的因素,调整后的电压值在不同条件下的一致性得到增强,有利于机器学习模型的训练和预测。通过创建一个特征矩阵来统一存储调整后的电压值和响应时间,简化了后续数据处理和分析的流程,使用经过校准的数据进行模型训练,有助于提高模型的预测性能和泛化能力。

在本发明一优选的实施例中,上述步骤16,可以包括:

步骤161,对于每一对预测值和真实值,通过e

步骤162,对所有计算出的误差进行统计分析,以得到分析结果,可以包括:

步骤1621,计算所有误差的平均值,并计算平均误差;

步骤1622,根据平均误差,计算误差的标准差;

步骤1623,根据所述误差的标准差,确定所有误差中的最大值和最小值。

在本发明实施例中,在大型陶瓷生产企业中,为了确保工作环境的安全,安装了多个气体传感器,实时监测生产区域内的有害气体浓度。首先,企业收集了一段时间内各个传感器所记录的真实气体浓度数据,并与模型的预测数据进行对比。步骤161,对于每个传感器所采集的数据点,计算了预测气体浓度与真实浓度之间的差异,即预测误差。考虑到陶瓷生产企业内不同区域的重要性可能有所差异(如某些区域可能更接近生产设备或员工聚集区),为每个关键区域分配了一个相应的权重因子。

接下来,进入步骤162,对所有计算出的预测误差进行深入的统计分析。步骤1621,计算了所有误差的平均值,即平均预测误差,从而全面了解模型的整体预测性能。步骤1622,进一步计算了误差的标准差,以评估模型在不同生产条件下的预测稳定性;一个较小的标准差表明模型的预测结果更为可靠和一致。步骤1623,对所有预测误差进行了排序,这有助于直接观察到极端误差值,及时发现异常情况。基于已计算出的误差标准差(σ),设定了一系列阈值来辅助识别异常预测。例如:

正常范围:误差在平均误差的±1σ之内,表明预测相对稳定。

轻度异常:误差超出平均误差的±1σ,但仍在±2σ之内,需要关注但可能不立即构成严重威胁。

重度异常:误差超出平均误差的±2σ,这可能需要立即采取行动以防范潜在风险。

在排序后的误差数据中,特别关注了最大和最小的误差值,这些极端值可能指示了模型的预测失误或是传感器故障。通过对这些预测误差的细致分析,企业能够更准确地评估模型在预测有害气体浓度方面的效能,从而及时识别并应对可能的安全隐患。此外,通过调整权重因子,企业可以更加精准地将资源和关注点分配给关键监测区域,进而提升整个陶瓷生产流程的安全保障水平。

在本发明另一优选的实施例中,上述步骤161中,当在计算预测值和真实值之间的误差时,其预测值具体通过以下步骤来确定:

收集与目标预测变量相关的历史数据,历史数据可以包括时间序列数据、截面数据;对数据进行清洗、转换和预处理,以确保数据的质量和一致性,便于模型训练。

根据数据的特征和问题的性质,确定时间序列模型,如ARIMA(自回归积分滑动平均模型);使用历史数据来训练自回归积分滑动平均模型。在自回归积分滑动平均模型的上下文中,这包括确定模型的参数(p,d,q),这些参数分别代表自回归项的阶数、差分的阶数和移动平均项的阶数,其中,通过最大似然估计模型的参数。

将数据集分为训练集和验证集,训练集用于训练模型,而验证集用于评估模型的性能,使用验证集来检查模型的预测性能,例如,可以计算预测值与真实值之间的误差指标,如均方误差(MSE)或平均绝对误差(MAE);根据验证集的性能调整模型的参数,以找到最佳的预测模型。

根据最佳的预测模型,使用最佳的预测模型来进行预测,将新的输入数据(例如,当前的环境条件、时间戳等)输入到训练好的模型中;模型会根据其学习到的模式和关系生成一个预测值,这个预测值代表了在当前输入条件下有害气体浓度的估计;在获得模型的预测值后,将其与实际观测到的有害气体浓度(真实值)进行比较;计算预测值与真实值之间的误差。

在本发明实施例中,例如,某大型陶瓷生产企业近年来面临着有害气体排放和工作环境安全的挑战。为了改善这一状况,企业决定采用预测模型来实时监测和预测生产区域内的有害气体浓度。

首先收集了过去一年的有害气体浓度数据,这些数据包括每小时的浓度记录、温度、湿度等环境变量,数据清洗阶段发现了一些异常值和缺失值,并进行了相应的处理,如使用均值插补缺失值,删除明显的异常记录;考虑到有害气体浓度受时间因素影响较大,选择了ARIMA时间序列模型进行预测,使用历史数据对ARIMA模型进行训练,通过网格搜索确定了最佳的(p,d,q)参数组合;将数据集分为训练集和验证集,训练集用于训练ARIMA模型,验证集用于评估模型性能,使用验证集计算了模型的均方误差(MSE)和平均绝对误差(MAE),并根据这些指标调整了模型参数,优化了预测性能;利用训练好的ARIMA模型,企业开始对未来几小时内的有害气体浓度进行预测,将模型的预测值与实际观测到的有害气体浓度进行比较,计算预测值与真实值之间的误差。

本发明通过实时监测和预测有害气体浓度,企业能够及时发现潜在的安全隐患,并采取相应的预防措施,从而显著提高工作环境的安全性。准确的预测模型帮助企业更有效地分配资源,如增加通风设备、调整生产流程等,以降低有害气体浓度。通过预测模型,企业可以合理安排生产计划,避免在有害气体浓度较高时进行高风险作业,从而减少生产中断,提高生产效率。

在本发明另一优选的实施例中,上述步骤17,可以包括:

步骤171,获取长时间序列的大气污染数据,包括二氧化氮、二氧化硫、一氧化碳、臭氧、PM2.5和PM10等污染物的浓度数据。

步骤172,从数据中提取出各污染物的日均浓度、月均浓度、最大浓度、最小浓度等统计特征,由于不同污染物的浓度单位和范围可能不同,因此对数据进行标准化处理,使得各污染物在聚类分析中具有相同的权重。

步骤173,设定一个K值的范围,例如K=2到N(N可以是一个上限,如10或数据点数量的平方根);确定一个用于记录每个K值对应轮廓系数的数组或列表;对于每个K值,执行以下操作:运行K-means聚类算法,得到K个聚类,对于每个数据点,计算其到同一聚类内其他点的平均距离a和到最近的不同聚类内所有点的平均距离b;根据

步骤174,从数据集中随机选择K个点作为初始聚类中心,对于数据集中的每个污染物数据点,计算它与各个聚类中心的欧氏距离,将每个数据点分配到距离最近的聚类中心所属的聚类;对于每个聚类,计算所有属于该聚类的数据点的平均值,将计算出的平均值设为新的聚类中心;重复数据点分配和聚类中心更新步骤,直到聚类中心不再发生显著变化或达到预设的迭代次数,记录每个数据点最终所属的聚类标签;输出每个数据点的聚类标签,可视化聚类结果,如使用散点图或热图展示不同聚类的分布情况,使用轮廓系数对聚类效果进行评估,分析每个聚类的特点,如污染物的浓度水平、变化趋势等。

步骤175,根据聚类标签,将污染物数据分为K个群体,对于每个群体,计算各污染物的平均浓度、最大浓度、最小浓度等统计量,绘制每个群体的时间序列图,观察各污染物浓度的变化趋势;计算每个群体内各污染物之间的相关系数,如皮尔逊相关系数,根据相关系数的大小和符号,判断污染物之间的正相关或负相关关系。

在本发明实施例中,通过聚类分析,可以有效地识别出不同的污染模式或群体。轮廓系数的使用避免了主观设定聚类数可能带来的偏差,增加了分析的准确性和可靠性。通过对数据进行标准化处理,使得不同单位和范围的污染物浓度数据在聚类分析中具有相同的权重,确保了聚类结果不会被某一特定污染物的浓度范围所主导,从而提高了聚类的公正性和准确性。通过可视化聚类结果,如使用散点图或热图,可以直观地看到不同聚类的分布情况,有助于更好地理解污染物数据的特点和模式。计算群体内各污染物之间的相关系数,可以揭示污染物之间的相互关系,如是否存在协同污染或相互抵消的效应。

如图2所示,本发明的实施例还提供一种大气污染在线识别评价装置20,包括:

获取模块21,用于采用至少一种传感器,组成传感器阵列;向传感器阵列中通入单种气体,获取每种传感器对各种气体的响应特性;获取在各种混合气体环境下,每种传感器的电压值;根据历史数据、实时环境条件以及传感器性能,计算动态调整因子;

处理模块22,用于通过响应特性、每种传感器的电压值以及动态调整因子进行计算,以生成各种气体的预测值;分析各种气体的预测值和真实值,以得到分析结果;根据对比结果,对大气污染气体进行分析,以得到分析结果。

可选的,根据历史数据、实时环境条件以及传感器性能,计算动态调整因子,包括:

通过

可选的,所述环境条件包括外部温度、湿度和风速。

可选的,通过响应特性、每种传感器的电压值以及动态调整因子进行计算,以生成各种气体的预测值,包括:

根据响应特性和每种传感器的电压值构建特征矩阵;

根据预设的宽度参数σ,通过

根据核向量k(x′,X

可选的,根据响应特性和每种传感器的电压值构建特征矩阵,包括:

将传感器的电压值与动态调整因子相乘,以得到调整后的电压值;

创建一个特征矩阵,其行数等于传感器数据点的数量,列数为2,第一列用于存储调整后的电压值,第二列用于存储响应时间;

在特征矩阵的第一列中,依次填入每个调整后的电压值,在特征矩阵的第二列中,依次填入与每个电压值相对应的响应时间。

可选的,分析各种气体的预测值和真实值,以得到分析结果,包括:

对于每一对预测值和真实值,计算预测值和真实值之间的误差;

对所有计算出的误差进行统计分析,以得到分析结果。

可选的,对所有计算出的误差进行统计分析,以得到分析结果,包括:

计算所有误差的平均值,并计算平均误差;

根据平均误差,计算误差的标准差;

根据所述误差的标准差,确定所有误差中的最大值和最小值。

需要说明的是,该系统是与上述方法相对应的系统,上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。

本发明的实施例还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。

本发明的实施例还提供一种计算机可读存储介质,存储指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用的基本编程技能就能实现的。

因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 一种轨道交通车轮身份和装车位置在线动态识别系统及识别方法
  • 一种大气污染物精准溯源识别系统及方法
  • 一种电能表状态在线评价方法及系统
  • 一种大气污染叠加风险区识别及评价方法
  • 一种大气污染叠加风险区识别及评价方法
技术分类

06120116678045