掌桥专利:专业的专利平台
掌桥专利
首页

一种基于移动站监测数据的污染物空间分布趋势挖掘方法

文献发布时间:2023-06-19 19:30:30


一种基于移动站监测数据的污染物空间分布趋势挖掘方法

技术领域

本发明涉及环境保护技术领域,具体涉及一种基于移动站监测数据的污染物空间分布趋势挖掘方法。

背景技术

近年来针对我国的空气污染问题,随着国家对于环境监测行业的政策倾斜和资金投入加大,各级环保部门采取了多种监测和治理的措施,并取得了较为显著的成效。多地采用基于传感器的小型化监测设备,以实现对目标区域空气污染状况的全天候细粒度监测。

随着大数据、云计算、人工智能、物联网等技术的高速发展,近年来多地在各种交通工具上安装了小型的大气污染移动监测装置,监测其行驶沿途的大气污染状况,保证了监测数据在时间和空间上的覆盖率。

本发明利用车载移动监测站测得数据,有效的挖掘出一段时间以来每种污染物在该地区主要影响的范围和污染的严重程度。确保下一步可以针对不同污染物和不同地区定制对应的环保管控策略,显著提高了执法查处的科学性和效能。

发明内容

针对现有技术中的上述不足,本发明提供了一种基于移动站监测数据的污染物空间分布趋势挖掘方法。

为了达到上述发明目的,本发明采用的技术方案为:

一种基于移动站监测数据的污染物空间分布趋势挖掘方法,包括如下步骤:

S1、获取移动监测站的环境污染检测数据并进行预处理;

S2、根据预处理后的环境污染检测数据进行单个移动监测站单小时数据挖掘,得到单个移动监测站在测量时间段内的打分和均值数据;

S3、重复S1和S2直至得到所有移动监测站的打分和均值数据并进行存储,对多个移动监测站多小时监测数据进行数据挖掘并合并,得到每种污染物热力评分数据。

进一步的,其特征在于,所述S1具体包括如下步骤:

S11、读取移动监测站的环境监测数据并进行格式转换;

S12、对所读取的环境监测数据进行异常数据剔除;

S13、根据剔除异常数据后的环境污染检测数据计算所测得的大气污染六参数据的IAQI值;

S14、根据环境污染检测数据的经纬度信息计算每个测量点所属的网格号。

进一步的,所述S12中异常数据包括监测异常值、清理空值以及不在地理经纬度范围内的数据。

进一步的,所述S2中单个移动监测站单小时数据挖掘的具体方式为:

S21、将单个移动监测站单小时数据按时间进行排序,获得每个移动监测站先后顺序经过的网格号;

S22、对每个网格内的测量数据取均值,其中,IAQI最大的污染物的值为该网格的AQI值;

S23、获取移动监测站每一种污染物在每个网格内的峰值、峰值显著性和峰值参数

S24、按照比例对每个峰值进行打分,并将打分结果和网格内测量数据的均值进行存储。

进一步的,所述S23中峰值参数的计算方式为:

其中,

进一步的,所述S24中按照比例对每个峰值进行打分的具体方式为:

其中,

进一步的,所述S3具体包括如下步骤:

S31、取出所存储的移动监测站的打分结果和网格内测量数据的均值并合并至数据框架中;

S32、按照小时和网格进行聚合,计算每个网格内的总分和打分率;

S33、根据每小时每个网格的总分、打分率和打分数量计算每小时的每个网格3*3范围内的全局平均分、打分率;

S34、根据S33的计算结果统计每个网格出现过的峰值次数并归一化,并计算每个网格在当前时段的总分;

S35、删除总分最高的前0.5%的网格数据,得到污染物在当前时间段内各个区域的污染评分热力数据。

进一步的,所述S32中

每个网格内的总分的计算方式为:

其中,

每个网格内打分率的计算方式为:

其中,

进一步的,所述S33中全局平均分的计算方式为:

其中,

进一步的,所述S34中每个网格在当前时段的总分的计算方式为;

其中,

本发明具有以下有益效果:

本发明利用车载移动监测站测得数据,有效的挖掘出一段时间以来每种污染物在该地区主要影响的范围和污染的严重程度。确保下一步可以针对不同污染物和不同地区定制对应的环保管控策略,显著提高了执法查处的科学性和效能。

附图说明

图1为本发明一种基于移动站监测数据的污染物空间分布趋势挖掘方法流程示意图。

图2为本发明实施例单个移动监测站单小时数据挖掘流程示意图。

图3为本发明实施例多个移动监测站多小时监测数据进行数据挖掘流程示意图。

具体实施方式

下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

一种基于移动站监测数据的污染物空间分布趋势挖掘方法,如图1所示,包括如下步骤:

S1、获取移动监测站的环境污染检测数据并进行预处理;

本实施例里由Python3.7.3实现,使用了numpy、 pandas、 numba、sklearn等包。操作系统为Windows10,硬件环境为i7-10700 8核CPU,16G内存。

在本实施例中,传入任务时间后读取该消失移动监测站的测量数据,将读取的测量数据转换为Pandas DataFrame格式后,进行以下数据预处理。

S2、根据预处理后的数据进行单个移动监测站单小时数据挖掘,得到单个移动监测站在测量时间段内的打分和均值数据;

在本实施例中,根据预处理后的数据计算移动站的速度和加速度,对单个移动监测站每小时测得数据的污染点位挖掘和评分。将一小时的监测数据网格化,求出每个移动站按时间顺序经过每个网格测量的每种污染物的平均值,对所有网格均值进行峰值查找,并得到每个峰值的显著性数据。具体方式如图2所示,包括如下步骤:

S21、将单个移动监测站单小时数据按时间进行排序,获得每个移动监测站先后顺序经过的网格号;

S22、对每个网格内的测量数据取均值,其中,IAQI最大的污染物的值为该网格的AQI值;

S23、获取移动监测站每一种污染物在每个网格内的峰值、峰值显著性和峰值参数,在本实施例里,峰值参数的计算方式为:

其中,

S24、按照比例对每个峰值进行打分,并将打分结果和网格内测量数据的均值进行存储。

本实施例里按照如下的参数比例对峰值进行打分,参数均为显著性数据的一部分,

其中,

S3、重复S1和S2直至得到所有移动监测站的打分和均值数据并进行存储,对多个移动监测站多小时监测数据进行数据挖掘并合并,得到的每种污染物热力评分数据。

多个移动监测站长时间监测数据的挖掘结果合并,生成每种污染物的污染评分热力数据。由于本发明基于一段时间的监测数据进行挖掘,所以需要对多个移动站多小时数据进行合并,为了兼容数据缺失的情况,需要对合并后的数据再次统计出每个网格的总得分和打分率,在最后删除极端异常打分后,得到的便是每个网格的每种污染物评分热力数据,具体流程如图3所示,包括如下步骤:

S31、取出所存储的移动监测站的打分结果和网格内测量数据的均值并合并至数据框架中;

S32、按照小时和网格进行聚合,计算每个网格内的总分和打分率。

在本实施例里,每个网格内的总分的计算方式为:

其中,

通过每小时每个网格的峰值数量与数据总量相除,得到该小时该网格的打分率,计算公式为:

其中,

S33、根据每小时每个网格的总分、打分率和打分数量计算每小时的每个网格3*3范围内的全局平均分、打分率和有效平均分;

在本实施例里,通过网格的总分除以网格的数据总量,得到网格的全局平均分,由于全局平均分中包含了一些不存在峰值的数据,所以全局平均分与前文的平均分数值不同,全局平均分的计算公式为:

其中,

S34、根据S33的计算结果统计每个网格出现过的峰值次数并归一化,并计算每个网格在当前时段的总分;

本实施例里,在求得每个网格附近3*3网格范围内的平均分mean_score和打分率score_count_freq后,统计每个网格有数据的小时数量hour_count并将该数据归一化,根据附近3*3网格范围的平均分和打分率计算这个网格的总分grid_score,计算公式为:

其中,

S35、删除总分最高的前0.5%的网格数据,得到污染物在当前时间段内各个区域的污染评分热力数据。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

相关技术
  • 一种基于桥梁监测数据识别车辆荷载空间分布的方法
  • 一种基于分布式计算的数据依赖挖掘方法及系统
  • 基于移动监测趋势挖掘的大气污染小尺度溯源方法及系统
  • 基于移动监测趋势挖掘的大气污染小尺度溯源方法及系统
技术分类

06120115933485