基于随机森林的气象空间归一化方法及系统

文献发布时间：2023-06-19 18:58:26

技术领域

本发明涉及空气质量评估技术领域，具体而言，涉及一种基于随机森林的气象空间归一化方法及系统。

背景技术

空气污染气象扩散条件是指从气象学角度评价气象条件对空气污染物的稀释、扩散和去除能力。在人类活动日益增加的影响下，区域的人口、交通、城市规划和能源消耗发生了显着变化，导致空气污染问题日益突出。就空气质量而言，除了本地污染物的排放，外来污染源的影响以及化学反应下二次污染物的生成等综合影响以外，气象扩散条件的影响也尤为重要。研究表明，在相对清洁的地区，在大气环境容量允许的范围内，气象条件对空气质量影响的贡献率可达80％～90％。在不同城市间，由于地理位置、地形条件等因素存在不同，各个城市的气象条件不同，导致空气污染气象扩散条件存在显著差异。在排放水平及管理水平相当的情况下，不同城市的空气质量可能有着明显的差距。因此，评估各城市的空气污染气象扩散条件有助于增强对各城市空气污染成因及大气污染物容纳能力的了解，有助于根据各城市的具体情况制定相应的管控方案，为环境管理政策的制定提供一定的参考。

对于城市总体的空气污染气象扩散条件的评估，有学者设计了两种方法分别评估城市的环境气象条件指数(EMI)和气象综合指数(MSI)。EMI指数是指不同年度之间相同月份相互比较时，排放不变条件下气象条件所导致的气溶胶浓度变化率。MSI指数是考虑光化学反应条件(PRC)和物理扩散能力(PDC)的综合性指标。两种指数都是综合评估城市的空气污染气象扩散条件，并可以进行不同城市之间的比较。EMI指数主要用于PM

气象空间归一化方法，通过计算各城市在归一化气象条件下的大气污染物浓度，计算归一化后的大气污染物浓度相对于观测值的变化率，反映不同城市间空气污染气象扩散条件的差异。变化率越大，表明气象扩散条件越好；反之亦然。该气象归一化方法的分析结果对于相关政策的制定有着一定的借鉴意义，并且该方法仅需要常规的气象和空气质量监测数据，计算量较小。

发明内容

本发明提供一种基于随机森林的气象空间归一化方法及系统，用于评估不同城市的气象条件是否有利于大气污染物的消散，比较评估各城市的空气污染气象扩散条件。

本发明的实施例是这样实现的：

第一方面，本发明提供一种基于随机森林的气象空间归一化方法，包括以下步骤：

获取多个目标城市的气象条件及大气污染物浓度数据；

将时间指示变量和每个目标城市的气象变量作为自变量，大气污染物浓度作为因变量，为每个城市构建一个随机森林模型；

针对各目标城市，将其自变量数据集中的气象数据依次替换为其他城市的气象数据，得到多组替换后的自变量数据集；

分别将各目标城市替换后的自变量数据集，输入到相应城市的随机森林模型中，得到多组大气污染物浓度预测值；

计算大气污染物浓度全部预测值的平均值，即气象空间归一化结果，并计算其相对于观测值的变化率，根据相对变化率评估比较各个城市的空气污染气象扩散条件，即相对变化率越大，表明空气污染气象扩散条件越优；

XV＝(AP

其中，XV为大气污染物浓度的气象空间归一化预测值相对于观测值的变化率，AP

本发明提供一种基于随机森林的气象空间归一化方法及系统，用于比较评估不同城市间的空气污染气象扩散条件，即相对变化率越大，表明空气污染气象扩散条件越优。该方法充分考虑各气象因素对城市空气质量的影响，采用气象空间归一化方法，将时间指示变量和气象变量作为自变量，大气污染物浓度作为因变量，构建随机森林模型。针对每一个目标城市，将该城市自变量数据集中的气象数据依次替换为其他城市的气象数据，以获取多组替换后的自变量数据集。将得到的多组替换后的自变量数据集输入至建立的随机森林模型中，得到多组大气污染物浓度预测值。计算各组的均值，作为气象空间归一化预测值，并计算其相对于观测值的变化率，用于评估比较各个城市的空气污染气象扩散条件。本发明可通过计算各城市在归一化气象条件下的大气污染物浓度相对于观测值的变化率，有助于比较评估不同城市的空气污染气象扩散条件。

基于第一方面，在本发明的一些实施例中，所述针对每一个目标城市，将其自变量数据集中的气象数据依次替换为其他城市的气象数据，得到多组替换后的自变量数据集，包括以下步骤：

针对每一个目标城市，将其自变量数据集中的气象数据依次替换为其他城市的气象数据，得到该城市多组替换后的自变量数据集。

基于第一方面，在本发明的一些实施例中，所述目标城市的随机森林模型的表达式为：

Y＝f(W

(4)

其中，Y为该城市的大气污染物(如NO

表1.时间指示变量及气象变量表

基于第一方面，在本发明的一些实施例中，所述自变量包括气象变量和时间指示变量。

第二方面，本发明提供一种基于随机森林的气象空间归一化系统，包括数据获取模块、模型构建模块、数据替换模块、预测分析模块以及评估模块，其中：

数据获取模块，用于获取多个目标城市的气象条件及大气污染物浓度数据；

模型构建模块，用于将时间指示变量和每个目标城市的气象变量作为自变量，大气污染物浓度作为因变量，为每个城市构建一个随机森林模型；

数据替换模块，用于针对各目标城市，将其自变量数据集中的气象数据依次替换为其他城市的气象数据，得到多组替换后的自变量数据集；

预测分析模块，用于分别将各目标城市替换后的自变量数据集，输入到相应城市的随机森林模型中，得到多组大气污染物浓度预测值；

评估模块，用于计算大气污染物浓度全部预测值的平均值，即气象空间归一化预测值，并计算其相对于观测值的变化率，根据相对变化率评估比较各个城市的大气污染物的空气污染扩散气象条件(即相对变化率越大，表明空气污染扩散气象条件越优)；

XV＝(AP

其中，XV为大气污染物浓度的气象空间归一化预测值相对于观测值的变化率，AP

本系统通过数据获取模块、模型构建模块、数据替换模块、预测分析模块以及评估模块等多个模块的配合，充分考虑各气象因素对城市空气污染气象扩散条件的影响，采用气象空间归一化方法，将时间指示变量和气象变量作为自变量，大气污染物浓度作为因变量，构建随机森林模型。针对每一目标城市，将其自变量数据集中的气象数据依次替换为其他各个城市的气象数据；将得到的多组替换后的自变量数据输入至建立的随机森林模型中，得到多组大气污染物浓度预测值，计算其均值作为气象空间归一化结果，并计算其相对于观测值的变化率，评估比较各个城市的空气污染气象扩散条件。本发明可通过计算不同城市在归一化气象条件相对于真实气象条件下大气污染物浓度值的变化率，有助于比较评估不同城市的空气污染气象扩散条件。

本发明至少具有如下优点或有益效果：

本发明实施一种基于随机森林的气象空间归一化方法及系统。该方法及系统综合地考虑多个气象条件对城市空气质量的影响，并通过机器学习方法构建其响应关系。依次将其他城市的气象数据作为该城市的一组替换后的气象数据，以获取多组替换后的自变量数据集；然后，将得到的多组替换后的自变量数据集输入至已建立的随机森林模型中进行计算，得到多组大气污染物浓度预测值。计算各组的均值，作为气象空间归一化预测值，并计算其相对于观测值的变化率，用于评估比较多个城市的空气污染气象扩散条件。本发明可通过计算各城市在归一化气象条件下的大气污染物浓度相对于观测值的变化率，有助于比较评估不同城市间的空气污染气象扩散条件。该方法所需要的数据都是一些常规的气象和空气质量监测数据，且计算量较小。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例一种基于随机森林的气象空间归一化方法的流程图；

图2为本发明实施例一种基于随机森林的气象空间归一化方法中气象归一化的示意图；

图3为本发明实施例一种基于随机森林的气象空间归一化系统的原理框图。

图标：100、数据获取模块；200、模型构建模块；300、数据替换模块；400、预测分析模块；500、评估模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

实施例

如图1-图2所示，第一方面，本发明实施例提供一种基于随机森林的气象空间归一化方法，包括以下步骤：

S1、获取6个主要城市(北京市、上海市、成都市、武汉市、西安市、深圳市)气象数据及NO

S2、基于每个城市的自变量(气象变量和时间变量)和因变量(NO

将时间指示变量和气象变量作为自变量，NO

S3、将气象变量在空间尺度上分别进行多次替换，以得到空间尺度下的多组替换后的气象数据。具体操作是，对于每一个城市，将其他5个城市的气象数据整体替换到该城市，作为该城市的5组替换后的气象数据；

S4、每个城市利用已建立的模型，使用5组替换后的气象数据，每一组气象数据和时间变量一起导入模型都能得到一组预测值，最后将得到5组预测值，这5组预测值按照时间分组计算平均值就得到了该城市空间上气象归一化的浓度。城市之间的空间尺度上的气象归一化是建立在各城市排放条件不变的情况下，计算该城市在一个归一化的气象条件下的NO

S5、计算并将每组NO

本发明实施一种基于随机森林的气象空间归一化方法及系统。该方法及系统综合的考虑了多个气象条件对城市的空气质量的影响，并且通过机器学习的方法构建其响应关系。现有的评估城市空气污染气象扩散条件的方法大多是针对于一种特定的污染物，而本发明提出的方法及系统适用于多种大气污染物。该方法及系统采用气象空间归一化方法，将时间变量和气象变量作为自变量，大气污染物浓度作为因变量构建随机森林模型，采用空间上的数据替换方法对气象数据进行处理，针对每一目标城市，依次将其他城市的气象数据作为该城市的一组替换后的气象数据，以获取多组替换后的自变量数据集；然后，将得到的多组气象数据导入替换后的自变量数据集输入至建立的随机森林模型中进行计算，得到多组大气污染物浓度预测值。计算各组的均值，作为气象空间归一化预测值，并计算其相对于观测值的变化率，用于评估比较各个城市的空气污染气象扩散条件。本发明可通过计算各城市在归一化气象条件下的大气污染物浓度相对于观测值的变化率，有助于比较评估不同城市的空气污染气象扩散条件。该方法所需要到的数据都是一些常规的气象和空气质量监测数据，且计算量较小。

基于第一方面，在本发明的一些实施例中，上述目标随机森林模型的表达式为：Y＝f(X

基于第一方面，在本发明的一些实施例中，该基于随机森林的气象空间归一化方法还包括以下步骤：

S5、结果展示。

气象空间归一化的结果表示不同城市在各自的排放条件下，在一个归一化的气象条件下的NO

表2六个城市各季节空间气象归一化后NO

根据2019年到2021年空间气象归一化预测值相对于观测值的相对变化结果可知，数值越大，表明该城市的气象条件越好，越有利于污染物的扩散，即空气污染扩散气象条件越优，反之亦然。2019年到2021年，深圳市的NO

表3六大主要城市各年空间气象归一化后NO

如图3所示，第二方面，本发明实施例提供一种基于随机森林的气象空间归一化系统，包括数据获取模块100、模型构建模块200、数据替换模块300、预测分析模块400以及评估模块500，其中：

数据获取模块100，用于获取目标城市的气象数据及NO

模型构建模块200，用于将时间变量和目标城市的气象变量作为自变量，NO

数据替换模块300，用于针对每一个目标城市，将其气象数据依次替换为其他城市的气象数据，以得到多组替换后的气象数据；

预测分析模块400，用于分别将空间尺度下的各组替换后的气象变量和对应的时间数据作为多组预测集导入目标随机森林模型中，生成多组NO

评估模块500，用于计算并将每组NO

本系统通过数据获取模块、模型构建模块、数据替换模块、预测分析模块以及评估模块等多个模块的配合，综合地考虑多个气象条件对城市空气质量的影响，并通过机器学习方法构建其响应关系。现有的评估城市空气污染气象扩散条件的方法大多是针对一种特定的大气污染物，而本发明提出的方法及系统适用于多种大气污染物。该系统将时间变量和气象变量作为自变量，大气污染物浓度作为因变量构建随机森林模型，采用空间上的数据替换方法对气象数据进行处理，针对每一目标城市，依次将其他城市的气象数据作为该城市的一组替换后的气象数据，以获取多组替换后的自变量数据集；然后，将得到的多组气象数据导入替换后的自变量数据集输入至建立的随机森林模型中进行计算，得到多组大气污染物浓度预测值。计算各组的均值，作为气象空间归一化预测值，并计算其相对于观测值的变化率，用于评估比较各个城市的空气污染气象扩散条件。本发明可通过计算各城市在归一化气象条件下的大气污染物浓度相对于观测值的变化率，有助于比较评估不同城市的空气污染气象扩散条件。该方法所需要到的数据都是一些常规的气象和空气质量监测数据，且计算量较小。

在本申请所提供的实施例中，应该理解到，所揭露的方法及系统和方法，也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这与所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其它的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：詹宇;朱瑢昕;吴秦慧姿;
专利申请人：四川大学;

上一篇：黑水虻提取物在制备水产动物寄生虫杀虫剂中的应用
下一篇：一种混凝土打磨装置及其使用方法