掌桥专利:专业的专利平台
掌桥专利
首页

一种基于卫星数据反演近地面二氧化氮浓度的方法

文献发布时间:2023-06-19 19:28:50


一种基于卫星数据反演近地面二氧化氮浓度的方法

技术领域

本发明涉及卫星遥感反演领域,具体涉及一种基于卫星数据反演近地面二氧化氮浓度的方法。

背景技术

二氧化氮是大气中一种重要痕量气体,是形成大气颗粒物(PM)、臭氧(O

目前对于近地面二氧化氮气体的监测主要依赖于地面仪器监测,该方法可以获取站点周围较为准确的近地面或者对流层实时二氧化氮气体或者其他污染物的浓度数值情况,但也只能获得小范围的二氧化氮气体或者其他污染物的浓度数值情况,而卫星数据监测则可以进行全天时全天候的监测,监测范围更广,解决了地面站点监测二氧化氮浓度范围小的技术问题。

但由于近地面二氧化氮成因机制复杂,影响因素众多且变化大,传统的线性模型不足以充分解释二氧化氮与影响要素之间的复杂非线性和高阶相互作用关系,因此需要运用一些算法来表示解释二氧化氮与影响要素之间的关系。其中,机器学习方法是当下最流行的一种算法,可以利用这个方法综合影响近地面二氧化氮浓度的各种因素,建立一种非线性反演近地面二氧化氮浓度的模型,从而得到基于机器学习方法反演的近地面二氧化氮浓度。

目前基于机器学习方法的反演模型的输入数据使用最多的是卫星Level2级别对流层二氧化氮柱浓度数据,该数据一般是在卫星过境后1—2天才可以从网站下载获取,但是,输入数据的延迟会导致反演模型输出的近地面二氧化氮浓度数据存在延迟,不能在当天得到近地面二氧化氮浓度分布结果,从而导致近地面二氧化氮浓度数据业务化运行存在时间延迟的缺点。为此,有必要研究能够提高近地面二氧化氮浓度测算时效性和准确性的卫星数据反演方法。

如中国专利CN110389103A,公开日2019年10月29日,一种大气底层二氧化氮浓度反演方法。该方法包括:基于大气辐射传输模型和卫星传感器,采用差分吸收光谱算法,将太阳光谱和对地观测辐射通量差分处理,得到差分吸收光谱;对大气辐射传输模型,计算得到大气转动拉曼散射截面;通过太阳光谱、大气转动拉曼散射截面得到Ring效应差分伪吸收截面;由差分吸收光谱,得到二氧化氮差分吸收截面,并利用Ring效应差分伪吸收截面,得到二氧化氮整层斜柱浓度;将二氧化氮整层斜柱浓度减去二氧化氮顶层至底层的斜柱浓度,得到二氧化氮底层斜柱浓度,实现了大气底层二氧化氮浓度准确快速计算。但是由于影响卫星数据与近地面二氧化氮浓度数据之间关系的因素较多,导致两者的关系并不是简单地线性关系,所以该技术方案中简单的数学统计模型不能充分计算两者之间的联系,而且该技术方案并没有解决卫星数据反演近地面二氧化氮浓度缺乏时效性的技术问题。

发明内容

本发明所要解决的技术问题:目前对于近地面二氧化氮浓度测算存在延迟严重和准确性较差的技术问题,提出了一种基于卫星数据反演近地面二氧化氮浓度的方法,提高近地面二氧化氮浓度测算的时效性,并进一步提高反演结果的准确性。

解决上述技术问题,本发明采用如下技术方案:一种基于卫星数据反演近地面二氧化氮浓度的方法,包括以下步骤:

获取卫星Level1级别通道1至通道6的光谱辐射值数据,对光谱辐射值数据进行预处理,得到卫星一级数据;

获取地面监测的二氧化氮浓度采样数据,对二氧化氮浓度采样数据进行预处理;

获取地面站点的气象数据;

将卫星一级数据、预处理后的二氧化氮浓度采样数据和气象数据匹配成新数据集;

建立随机森林模型,使用新数据集训练随机森林模型中的回归树;

解算由训练完成后的回归树构成的随机森林模型,计算回归树权重,筛选出回归树权重值较大的卫星一级数据所在的通道;

建立反演模型,将筛选出的通道中的光谱辐射值数据作为输入数据,将输入数据输入反演模型,得到近地面二氧化氮的浓度数据。

作为优选,对光谱辐射值数据进行预处理的方法包括:

将光谱辐射值数据划分成若干个3×3的像元区域,计算每个像元区域的标准差σ,

其中,i为当前像元区域中的第i个像元,ρ

判断标准差σ是否大于0.06,若大于,则该像元区域为云体,若小于,则该像元区域不为云体;

对光谱辐射值数据中判断为云体的像元区域进行剔除。

作为优选,对光谱辐射值数据进行预处理的方法还包括:

计算光谱辐射值数据中像元的归一化植被指数NDVI,

其中,ρ

判断归一化植被指数NDVI是否小于0,若小于,则该像元为水体,若大于,则该像元不为水体;

对光谱辐射值数据中判断为水体的像元区域进行剔除。

作为优选,对二氧化氮浓度采样数据进行预处理的方法包括:

将地面监测的二氧化氮浓度采样数据的负值、零值以及缺失值剔除。

作为优选,对二氧化氮浓度采样数据进行预处理后,根据预处理结果保留地面站点,保留的地面站点为每日至少有20个小时平均浓度值、每个月至少有27天平均浓度值且每年至少有324天日平均浓度值的地面站点。

作为优选,将卫星一级数据、预处理后的二氧化氮浓度采样数据和气象数据进行匹配的方法包括:

计算卫星一级数据中离散点到插值点的距离h

其中,(x,y)为地面站点的经纬度,(x

计算距离权重W

其中,p为距离权重参数,n为卫星一级数据中离散点的个数;

根据反距离权重插值法,按照距离权重W

作为优选,距离权重p的值为2。

作为优选,将卫星一级数据、预处理后的二氧化氮浓度采样数据和气象数据进行匹配的方法还包括:

给卫星一级数据添加时间权重系数

其中,

根据卫星过境时间所占的比例A,得到卫星一级数据、预处理后的二氧化氮浓度采样数据和气象数据在时间上匹配的数据结果。

作为优选,建立随机森林模型的方法包括:

对包含有p个特征变量的新训练集采用有放回抽样方法以指定比例进行抽样,随机产生k个训练集θ

从p个特征变量中随机选取固定个数为n的变量作为分类树的分支节点构建回归树,其中n

每个训练集生成相应的回归树{H(X,θ

作为优选,利用随机森林模型计算回归树权重的方法包括:

其中,imp

本发明的有益技术效果包括:采用一种基于卫星数据反演近地面二氧化氮浓度的方法,借助卫星Level1级别数据获取延时短的特点,得到近实时的卫星数据进行反演近地面二氧化氮浓度,在保证精度的同时大大提高反演结果的时效性,确保在当天展示结果,更适用于实际平台应用当中;通过建立随机森林模型,筛选出与地面监测二氧化氮浓度相关性高的卫星一级数据所在的通道,将筛选出的通道中的光谱辐射值数据作为输入数据进行反演近地面二氧化氮浓度,进一步提高了反演结果的准确性;借助改进的卫星过境轨道时间地理加权回归方法,计算出距离权重W

本发明的其他特点和优点将会在下面的具体实施方式、附图中详细的揭露。

附图说明

下面结合附图对本发明做进一步的说明:

图1为本发明实施例基于卫星数据反演近地面二氧化氮浓度的方法流程图。

具体实施方式

下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本发明的保护范围。

在下文描述中,出现诸如术语“内”、“外”、“上”、“下”、“左”、“右”等指示方位或者位置关系仅是为了方便描述实施例和简化描述,而不是指示或暗示所指的装置或者元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在详细说明本实施例技术方案之前,首先对本实施例应用的背景情况进行介绍。

二氧化氮是大气中一种重要痕量气体,是形成大气颗粒物(PM)、臭氧(O

相较而言,卫星遥感技术不受地面监测站点选址的限制,覆盖范围广,时空分辨率高,具有地面监测站点无可比拟的空间覆盖度,为研究大范围区域的大气二氧化氮时空分布提供了可靠技术手段。基于OMI等卫星传感器反演产品,国内外许多学者探讨了区域、全国以及全球尺度的长时间序列大气对流层二氧化氮柱浓度时空分布与变化趋势。然而,较于对流层二氧化氮柱浓度,与人为排放、人体健康更相关的是近地面二氧化氮浓度。该浓度与卫星监测的对流层二氧化氮柱浓度存在一定差异,且易受云雾等不利天气条件、传感器械故障等影响从而出现数据缺失或出错。其中,“近地面”定义为环境空气质量监测站点采样口或监测光束离地面的高度,根据《环境空气质量监测规范(试行)》,其值通常在离地高度3-15m范围。

为了更加可靠获取近地面二氧化氮浓度的时空分布特征,国内外学者研究了系列基于卫星监测的近地面二氧化氮浓度估算模型,主要为物理机理模型和经验统计模型。物理机理模型依赖大气物理化学传输模式耦合卫星观测二氧化氮柱浓度估算近地面二氧化氮浓度,在一定程度上解决了地面监测固有的空间代表性有限、高成本、低效率等技术问题。但该方法模型结构复杂,估算精度和时间分辨率易受硬件计算资源投入、污染物排放清单以及大气物理化学反应过程关键参数设置等影响,在实际的大气污染浓度时空分布模拟中仍受到较多限制。经验统计模型是基于卫星二氧化氮柱浓度与近地面二氧化氮浓度相关性,融合气象等辅助因素开展反演建模。经验统计模型具有数据来源广、获取容易、建模方法灵活、适用性较广等特点,已成为模拟揭示城市尺度大气污染时空分布特征的常用手段。相较于大气污染物单点时间维的预测预报,利用经验统计模型在稀疏地面监测条件下并结合卫星观测与大气污染地理驱动要素模拟估算大气污染物浓度的空间分布,一定程度上能有效弥补稀疏地面监测数据所造成的空间延伸信息匮乏的技术问题。

但是,由于近地面二氧化氮成因机制复杂,影响因素众多且变化大,传统线性模型不足以充分解释二氧化氮与影响要素之间的复杂非线性和高阶相互作用关系,因此需要运用一些算法来表示解释二氧化氮与影响要素之间的关系。其中,机器学习方法是当下最流行的一种算法,可以利用这个方法综合影响近地面二氧化氮浓度的各种因素,建立一种非线性反演近地面二氧化氮浓度的模型,从而得到基于机器学习方法反演的近地面二氧化氮浓度。其中,机器学习中的随机森林模型具有极强的拟合能力与复杂的模型结构,可以用于捕获二氧化氮浓度与影响要素间的非线性、非参数关系,且模型训练速度快,能够高效处理大数据集。同时,不同于其他“黑箱”机器学习算法,随机森林模型可进行预测变量重要性度量评估,模型可解释性较强。

目前基于机器学习方法的反演模型的输入数据使用最多的是卫星Level2级别对流层二氧化氮柱浓度数据,该数据一般是在卫星过境后1—2天才可以从网站下载获取,但是,输入数据的延迟会导致反演模型输出的近地面二氧化氮浓度数据存在延迟,不能在当天得到近地面二氧化氮浓度分布结果,从而导致近地面二氧化氮浓度数据业务化运行存在时间延迟的缺点。因此,有必要研究能够提高近地面二氧化氮浓度测算时效性和准确性的卫星数据反演方法。

为此,本申请实施例提供了一种基于卫星数据反演近地面二氧化氮浓度的方法,请参照附图1,包括以下步骤:

步骤A01)获取卫星Level1级别通道1至通道6的光谱辐射值数据,对光谱辐射值数据进行预处理,得到卫星一级数据。

其中,已知卫星Level1级别数据中的实时数据一般可在卫星过境后四小时后获得,而卫星Level2级别对流层二氧化氮柱浓度数据一般在1-2日后才会发布相应的结果,这之间存在明显时间差。因此,借助卫星Level1级别数据获取延时短的特点,得到近实时的卫星数据进行反演近地面二氧化氮浓度,在保证精度的同时能够大大提高反演结果的时效性,确保在当天展示结果,更适用于实际平台应用当中。

可选地,本实施例下载获取携带TropoMI传感器的Sentinel-5P卫星Level1级别通道1至通道6的光谱辐射值数据。

其中,Sentinel-5P是欧空局(Europe Space Agency,ESA)于2017年10月13日发射的一颗全球大气污染监测卫星。卫星搭载了TropoMI(Tropospheric MonitoringInstrument,对流层观测仪),可以有效的观测全球各地大气中痕量气体组分,包括NO

其中,选择通道1至通道6的原因有两个:首先,TropoMI传感器利用DOAS算法反演二氧化氮总柱浓度时,利用的就是0.3-0.57μm的(中波、长波)紫外和可见光波段的数据;其次,这几个通道的波段内包含了云体和水体像元的检测的部分,云体和水体像元对卫星反演近地面二氧化氮浓度也会产生一定的影响,需要对这部分像元进行剔除,即对光谱辐射值数据进行预处理。

进一步的,将光谱辐射值数据划分成若干个3×3的像元区域,计算每个像元区域的标准差σ,

其中,i为当前像元区域中的第i个像元,ρ

判断标准差σ是否大于0.06,若大于,则该像元区域为云体,若小于,则该像元区域不为云体;

对光谱辐射值数据中判断为云体的像元区域进行剔除。

对比相同时间的云图,阈值0.06可以较为准确的识别出云体像元,可以利用该阈值进行云体像元的剔除。

进一步的,对光谱辐射值数据进行预处理的方法还包括:

计算光谱辐射值数据中像元的归一化植被指数NDVI,

其中,ρ

判断归一化植被指数NDVI是否小于0,若小于,则该像元为水体,若大于,则该像元不为水体;

对光谱辐射值数据中判断为水体的像元区域进行剔除。

绿色波段(0.52-0.66μm)可以很好的反映出水体的很多信息特征。红色波段(0.63-0.69μm)中的0.65-0.7μm波段对叶绿素监测有很好的作用,大多数浮游植物都清晰的展现出第二吸收光谱带,对水特性进行遥感时,必须考虑水的吸收和反射特征。近红外波段(0.76-0.9μm)用于测定生物量和作物的走势,确定水体轮廓,在区别水路交界线和作物分布区域及长势、分类、农作物估产、病虫灾害监测等方面有不可替代的作用。

归一化植被指数(NDVI)即通过测量近红外(植被强烈反射)和红光(植被吸收)之间的差异来量化植被,与其他波长相比,健康的植被(叶绿素)反射更多的近红外和绿光。但是它吸收更多的红色和蓝色光。NDVI公式的结果生成一个介于-1到+1之间的值,如果结果为负值,则可以判断为水体,如果结果接近+1,则可以判断为密集的绿叶。

步骤A02)获取地面监测的二氧化氮浓度采样数据,对二氧化氮浓度采样数据进行预处理。

其中,地面监测二氧化氮小时浓度数据来自中国环境监测总站全国城市空气质量实时发布平台。

进一步的,对二氧化氮浓度采样数据进行预处理的方法包括:将地面监测的二氧化氮浓度采样数据的负值、零值以及缺失值剔除。

进一步的,对二氧化氮浓度采样数据进行预处理后,根据预处理结果保留地面站点,保留的地面站点为每日至少有20个小时平均浓度值、每个月至少有27天平均浓度值且每年至少有324天日平均浓度值的地面站点。

步骤A03)获取地面站点的气象数据。

可选地,气象数据可以包括气温、风向、风速、湿度和气压数据,气象数据收集自中国气象科学数据共享服务网。

步骤A04)将卫星一级数据、预处理后的二氧化氮浓度采样数据和气象数据匹配成新数据集。

进一步的,计算卫星一级数据中离散点到插值点的距离h

其中,(x,y)为地面站点的经纬度,(x

计算距离权重W

其中,p为距离权重参数,n为卫星一级数据中离散点的个数;

根据反距离权重插值法,按照距离权重W

可选地,本实施例中选取距离权重p的值为2。

进一步的,给卫星一级数据添加时间权重系数

/>

其中,

按照卫星过境时间所占的比例A分配,得到卫星一级数据、预处理后的二氧化氮浓度采样数据和气象数据在时间上匹配的数据结果。

对于时间上的匹配,因为卫星数据过境的时间是连续的,但是地面监测站点的浓度数据是非连续的,且近地面二氧化氮浓度受时间的影响也比较大,所以在时间匹配上,也需要给卫星一级数据添加一个时间权重系数

步骤A05)建立随机森林模型,使用新数据集训练随机森林模型中的回归树。

进一步的,建立随机森林模型的方法包括:

对包含有p个特征变量的新训练集采用有放回抽样方法以指定比例进行抽样,随机产生k个训练集θ

从p个特征变量中随机选取固定个数为n的变量作为分类树的分支节点构建回归树,其中n

每个训练集生成相应的回归树{H(X,θ

步骤A06)解算由训练完成后的回归树构成的随机森林模型,计算回归树权重,筛选出回归树权重值较大的卫星一级数据所在的通道。

进一步的,利用随机森林模型计算回归树权重的方法包括:

其中,imp

已知对流层二氧化氮柱浓度数据与卫星一级光谱辐射值数据之间存在着一定的相关性,而卫星一级数据中不同通道的辐射量数据与近地面二氧化氮浓度数据之间的相关性有好有坏,需要通过随机森林模型的变量重要性判断,即计算回归树权重来筛选出与地面监测二氧化氮浓度相关性高的卫星一级数据所在的通道,将筛选出的通道中的光谱辐射值数据作为输入数据进行反演近地面二氧化氮浓度,进一步提高了反演结果的准确性。

步骤A07)建立反演模型,将筛选出的通道中的光谱辐射值数据作为输入数据,将输入数据输入反演模型,得到近地面二氧化氮的浓度数据。

其中,反演模型与相关技术中利用DOAS算法反演二氧化氮总柱浓度的操作类似,本申请实施例对此不再进行详细阐述。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。

相关技术
  • 一种大气近地面二氧化氮浓度反演方法
  • 一种基于Stacking集成模型的近地面二氧化氮浓度估算方法
技术分类

06120115921561