掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的PM2.5高精度时空预测方法

文献发布时间:2023-06-19 09:27:35


一种基于深度学习的PM2.5高精度时空预测方法

技术领域

本发明属于人工智能和信息应用技术领域,具体涉及一种基于深度学习PM

背景技术

PM

但目前基于LSTM模型的相关研究没有将时间依赖性特征与污染物颗粒浓度的空间相关性特征有效地整合在一起,没有长期任务高精度的预报结果,并且目前的研究预测PM

发明内容

本发明的目的在于,针对现有技术的上述不足,提供一种基于深度学习方法,并结合多源数据的PM

本发明的技术方案:一种结合多源数据的PM

步骤1:选取影响PM

步骤2:对所述多源数据进行时空匹配;

步骤3:基于时空相关性将PM

步骤4:利用递归的LSTM模型,对各个聚类站点的PM

步骤5:对预报结果进行精细PM

进一步地,所述步骤1中对多源数据进行预处理的过程具体为:对数据进行异常值剔除和缺失值填补,其中缺失值填补采用前置填补法、后置填补法以及周围站点均值填补法。通过数据预处理过程从而提高数据的质量,包括数据的准确性、完整性、一致性、时效性、可信性和可解释性。

进一步地,所述步骤1中的气象数据包括降水量、气压、相对湿度、日照、温度以及风向风速,空间相关数据和物理特征相关数据包括空间滞后变量数据、建筑用地数据、道路长度数据、人口密度数据、归一化的植被指数数据以及高程数据。通过辅助这些多源数据能够提高模型的准确性。

优选地,所述空间滞后变量主要基于Python进行数据处理和分析,其计算方法的公式如下:

式中:ds表示空间距离,m表示空间邻近网格单元数,w表示权值。

进一步地,步骤2中对多源数据进行时空匹配的具体过程为:采用格网化方式对多源数据进行时空匹配,将范围内覆盖的区域划分为分辨率为n的网格,其中,n由区域大小所确定,其中将覆盖地面监测站的格网作为训练样本输入模型中。通过该步骤对多源数据进行时空匹配从而辅助PM

进一步地,所述步骤3中基于时空相关性,主要以皮尔逊相关系数为衡量标准,对监测站点进行聚类并找到合适的时间滞后值,所述皮尔逊相关系数如下:

式中:X和Y代表两个变量,Cov(X·Y)表示两个变量间的协方差,σ

进一步地,所述步骤4中进行训练前需要先对各个聚类的站点PM

优选地,所述归一化处理为最大最小归一化处理,具体公式如下:

优选地,结合相关辅助数据的具体操作为:将辅助数据进行正则化处理,再结合时间数据进行独热编码。

进一步地,所述步骤4中递归的LSTM模型框架为:

式中:t

实现PM

本发明的优点在于:

1)提出一种基于LSTM新的预报模型,该模型通过时间相关性分析选择合适的时间滞后变量从而捕捉PM

2)通过结合气象数据、空间相关数据以及物理特征数据等多源数据,充分考虑相关特征因素,通过时空格网化实现较为精细的时空PM

附图说明

图1为本发明实施例的流程图。

具体实施方法

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

如附图1所示,本发明提供的基于深度学习PM

步骤1:对地面监测站点PM

式中:ds表示空间距离,m表示空间邻近网格单元数,w表示权值。

步骤2:采用格网化方式对多源数据进行时空匹配,一般根据数据来源时间频率进行。将范围内覆盖的区域划分为分辨率为n的网格,其中,n由区域大小所确定,如全国区域可划分为分辨率为10-15km,其中将覆盖地面监测站的格网作为训练样本输入模型中。此处采用的工具为ESRI的ArcGIS软件中的Arcpy通过反距离加权插值方式以及Python GDAL进行插值处理;

步骤3:基于地面监测站点PM

其中X和Y代表两个变量,Cov(X·Y)表示两个变量间的协方差,σ

步骤4:将各个聚类的地面监测站点PM

其中t

步骤4.1:结合预测模型预训练得出初步的PM

式中:N表示总的样本数目,P

步骤4.2:基于深度学习PM

O

步骤5:对预报结果进行精细PM

本发明基于人工智能技术和大数据的快速发展背景下,考虑到实现PM

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

相关技术
  • 一种基于深度学习的PM2.5高精度时空预测方法
  • 一种基于深度学习的双向长短期记忆网络的PM2.5预测方法
技术分类

06120112169830