掌桥专利:专业的专利平台
掌桥专利
首页

耦合生态过程模型与机器学习算法的高精度时空模拟方法

文献发布时间:2023-06-19 19:28:50


耦合生态过程模型与机器学习算法的高精度时空模拟方法

技术领域

本发明属于生态学、农学、全球变化相关研究领域,具体涉及一种耦合生态过程模型与机器学习算法的高精度时空模拟方法。

背景技术

基于过程的生态系统模型由于综合考虑了生态系统过程与环境(如气候、土壤等)和人类活动(如土地利用、农业管理)的相互作用,是应对全球可持续发展和生态环境挑战(如气候变化、粮食安全、生物多样性保护和自然资源管理)的主要工具。然而,过程模型在大尺度上的应用存在计算成本高、模型不确定性大和数据可用性差的问题,很难在可接受的时间内完成高精度时空分辨率下的快速模拟,限制了这类模型在大尺度上的普适性和操作性。

过程模型使用数学方程对生态系统过程进行简化,需要输入大量的参数才能闭合计算,这些参数是基于野外观测站或田间试验站点试验数据进行估计,但在环境条件更加复杂和多样的大尺度上,一些生态过程参数没法得到很好的估计,模型不确定性大。机器学习在大尺度上可以达到比过程模型更高的精度和模拟效率,但其可能会产生与生态系统过程相悖的结果,需要提供足量高质的训练数据。在此背景下,“耦合过程模型与机器学习集成模拟”法应运而生。过程模型可以首先在站点尺度进行校准,校准后的模型可以在足够多的环境-管理情景下生产大量的模拟数据,为机器学习模型提高了大量优质数据。基于这些过程模型的模拟数据,机器学习模型能够自动学习复杂生态系统过程和环境-管理的内在关系,并可以实现快速泛化模拟。把过程模型隐含的先验知识和机器学习的学习能力相结合,利用少量站点观测数据,即可灵活地实现高分辨率时空尺度的快速模拟。然而不同机器学习方法由于算法的差异,其理解生态过程的能力和模型泛化能力不同。为了尽可能降低机器学习集成的不确定性,本发明使用自适应筛选来淘汰学习能力差的模型,并通过计算不同模型的均方根误差来构建权重,加权平均学习能力强的机器学习模型,从而提高模拟精度,降低集成代理模型的不确定性。

本发明将基于过程的生态系统模型与多种机器/深度学习相结合,通过自适应筛选、加权平均的方式建立最优的集成代理模型,实现高精度时空分辨率的快速、精确模拟,为精细尺度上生态系统的模拟和管理决策提供技术方法。

发明内容

本发明的目的在于克服现有技术中的缺陷,并提供一种耦合生态过程模型与机器学习算法的高精度时空模拟方法。本发明耦合基于过程的生态系统模型与多种机器/深度学习模型,通过自适应筛选、加权平均的方式建立最优的集成代理模型,准确快速地实现高精度时空分辨率的生态系统状态变量的模拟。

本发明所采用的具体技术方案如下:

本发明提供了一种耦合生态过程模型与机器学习算法的高精度时空模拟方法,具体如下:

S1:使用目标研究区内的长期定位试验数据对生态系统过程模型的相关参数进行校准和验证;

S2:在所述研究区内,随机选取能覆盖研究区气候类型和土壤特性空间变异的若干格点,每个格点随机生成一种管理措施和气候变化情景组合;基于各格点对应情景下的土壤数据和历史气候数据,用经步骤S1校验后的生态系统过程模型模拟各格点和情景下的生态系统状态变量变化;

S3:整合步骤S2中生态系统过程模型情景模拟的输入数据和输出数据,用于训练不同类型的机器学习模型,使机器学习模型充分学习和仿真生态系统过程模型模拟的状态变量变化;评估机器学习的表现,自适应地淘汰表现差的机器学习模型,并根据不同模型权重的加权评价法得到最优集成模型;

S4:将所述最优集成模型作为生态系统过程模型的代理模型,基于空间数据,代理模拟并生成高分辨率时空尺度下研究目的所需的高精度数字制图产品。

作为优选,所述步骤S1具体如下:

针对特定的研究目的,确定需要模拟的研究区域和适合的生态系统过程模型;根据生态系统过程模型的需要,获取研究区域内的生态系统原位站点观测数据,使用差分进化算法对生态系统过程模型的关键参数进行校正和验证。

进一步的,所述生态系统原位站点观测数据包括气象数据、土壤属性数据、农田生态系统数据、生态系统状态变量数据中的一种或多种。

更进一步的,所述气象数据包括日值温度、降水和太阳辐射,所述土壤属性数据包括土壤有机碳、pH和土壤容重,所述农田生态系统数据包括播期、施肥、灌溉阶段的管理数据和产量数据,所述生态系统状态变量数据包括土壤有机碳和温室气体排放观测数据。

进一步的,所述关键参数包括农田生态系统中的作物品种参数、土壤有机碳和N

作为优选,所述步骤S2具体如下:

在所述研究区内,根据设定的空间分辨率生成空间网格,从所有网格中随机选取能覆盖研究区气候类型和土壤特性空间变异的若干网格点,每个格点随机生成一种管理措施和气候变化情景组合;搜集和准备与选取网格点对应的土壤数据和历史气候数据,用以驱动所述步骤1中已经校验好的生态系统过程模型,模拟出历史和未来情景下感兴趣的状态变量。

进一步的,所述管理措施情景是指各种可能的人类活动管理,在农田生态系统中,管理措施情景包括作物系统情景、作物播期情景、施肥情景、灌溉情景和秸秆还田情景;所述气候变化情景是指未来气候变化情景,从全球气候模型和共享经济路径排放情景中选择确定。

作为优选,所述步骤S3中,机器学习模型包括LASSO模型、支持向量机、随机森林、XGBoost、卷积神经网络和长短期记忆网络。

作为优选,所述步骤S3中,分别计算均方根误差RMSE和决定系数R

作为优选,所述步骤S4具体如下:

搜集和制备高精度的空间数据,驱动已经构建的所述代理模型,通过并行运算,实现快速模拟,生成研究目的所需的高精度数字制图产品。

本发明相对于现有技术而言,具有以下有益效果:

1)通过获取站点尺度的生态系统观测数据,校准生态系统过程模型,再通过过程模型进行大量的管理-环境情景模拟。使用多种机器学习模型仿真过程模型的情景模拟结果,充分学习过程模型中的内在关系,并通过自适应筛选和加权平均得到最优的集成模型,并最终用于更高分辨率时空尺度上的生态系统状态变量的快速模拟。

2)创新性的采用过程模型与机器学习混合建模,既保证了模型的机理性又提高了模型在精细尺度下的模型精度和模拟效率,采用权重法集成模型,进一步减少系统误差,提高数据精确度及可信度,有利于我们理解及预测模拟未来气候变化和不同管理措施对生态系统造成的影响。

3)本发明适用于任一区域、任一时间、任一生态系统的状态属性模拟,比如可以对全球尺度、全国尺度或者区域尺度,历史或者未来情景的生态系统生产力、作物产量、叶面积指数、土壤有机碳、N

附图说明

图1为本发明方法的流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。

本发明提供了一种耦合生态过程模型与机器学习算法的高精度时空模拟方法,步骤包括:1)使用研究区内的长期定位试验数据对生态系统过程模型的相关参数进行校准;2)在研究区内,随机选取若干格点,覆盖研究区气候类型和土壤特性空间变异,每个格点随机生成一种管理措施和气候变化情景组合,用校准后的过程模型模拟各格点和情景下的生态系统状态变量变化(如农田生态系统中的作物产量、土壤有机碳等);3)整合过程模型情景模拟的输入和输出数据,用于训练不同类型的机器学习模型,使机器学习模型充分学习和仿真过程模型模拟的状态变量变化;评估机器学习的表现,自适应地淘汰表现差的机器学习模型,并根据不同模型权重的加权评价法得到最优集成模型;4)将最优的机器学习集成模型当作过程模型的代理模型,代理模拟高分辨率时空尺度下作物产量和土壤有机碳等变化。

下面将对各步骤进行具体说明。

步骤一:生态系统过程模型的校正与验证

首先针对特定的研究目的,确定需要模拟的研究区域和适合的生态系统过程模拟,根据模型的需要,获取研究区域内的生态系统原位站点观测数据,一般包括日值温度、降水、太阳辐射等气象数据,土壤有机碳、pH、土壤容重等土壤属性数据,对农田生态系统可能还包括播期、施肥、灌溉等管理数据和产量数据,以及其他感兴趣的生态系统状态变量数据(如土壤有机碳和温室气体排放观测数据等)。使用差分进化算法对模型的关键参数(如农田生态系统中的作物品种参数、土壤有机碳和N

步骤二:情景生成与基于生态系统过程模型的模拟

为了让机器学习模型可以充分学习和仿真过程模型的内在关系,需要用站点级别校准好的过程模型模拟足够多的数据。本步骤分为三个子步骤,分别是情景生成、输入数据准备、过程模型模拟与输出。

首先是情景生成,根据设定的空间分辨率生成空间网格,从所有网格中随机选取若干网格点(尽可能覆盖研究区的所有气候类型和土壤特性空间变异),在这些网格点随机生成管理-气候变化情景。管理情景指各种可能的人类活动管理,在农田生态系统中,管理情景包括作物系统情景、作物播期情景、施肥情景、灌溉情景(如灌溉方法、灌溉深度和灌溉时期等)、秸秆还田情景等。气候情景指未来气候变化情景,可以从全球气候模型(GCMs)和共享经济路径排放情景(SSP)中选择确定。其次是搜集和准备与选取网格点对应的土壤数据和历史气候数据,用以驱动步骤一中已经校验好的生态系统过程模型,模拟出历史和未来情景下感兴趣的状态变量如农田生态系统中的作物产量、土壤有机碳含量等结果。

步骤三:机器/深度学习代理模型

本步骤是为了筛选和集成能够代理过程模型的机器/深度学习模型,通过整合步骤二中网格-管理-气候情景组合的输入和输出结果,用于训练机器学习模型(如LASSO模型、支持向量机、随机森林、XGBoost等机器学习和卷积神经网络或长短期记忆网络等深度学习模型),让机器学习模型学习和仿真过程模型的内在关系。模型训练前先进行数据分组,其中80%的数据(即步骤二中过程模型的输出)训练模型、20%数据验证模型。分别计算均方根误差(RMSE)和决定系数(R

步骤四:基于代理模型的快速高精度时空模拟

搜集和制备高精度的空间数据,驱动已经构建的代理模型,通过并行运算,实现快速模拟,生成研究目的所需的高精度数字制图产品。

实施例1

本实施例的研究内容为不同管理模式下华北平原1km空间尺度冬小麦/夏玉米轮作系统作物产量、土壤有机碳变化的模拟,如图1所示,具体包括以下步骤:

1)以我国华北平原冬小麦-夏玉米轮作系统为研究对象,获取辛集、栾城、衡水、莱阳、桓台、徐州等站点尺度的土壤、气候、管理措施和产量、土壤有机碳、N

2)根据华北平原1km空间分辨率生成45万个农田耕地网格,从中随机选取6000个网格,同时每个网格随机生成相应的管理情景和气候情景,管理情景包括播期情景(以1天为间隔,从基准播期前30天到后30天)、氮肥情景(氮肥施氮量以1kg ha

3)使用校准好的校准农业生态系统模型对6000个网格-管理-气候情景组合进行模拟,模拟出小麦和玉米产量、土壤有机碳。

4)整合6000个网格-管理-气候情景组合模拟结果,80%作为训练集、20%作为验证集。在训练集训练6种不同类型的机器学习模型,通过参数优化和超参数的调整,得到训练最优的模型。将训练好的模型去模拟验证集的数据,用于评估模型的表现。

5)基于验证集上过程模型和机器学习的模拟值,计算评价机器学习仿真过程模型表现的统计指标(R

6)准备好历史(1995-2014)和未来(2030s、2060s)华北平原1km尺度网格输入数据,输入数据的格式与机器学习模型的数据保持一致,将准备好的数据驱动最优的机器学习集成模型,同时设置不同的管理水平,模拟得到历史和未来情景下华北平原小麦和玉米产量、土壤有机碳和N

由此可见,通过本发明的方法,能更加快速、高效地预测高时空分辨率下某种生态系统状态变量(如农田生态系统中的作物产量、土壤有机碳等)的时空变化规律及其对不同管理措施和气候变化的响应。

以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

相关技术
  • 一种基于系统耦合的区域生态安全时空模拟模型
  • 耦合时空高斯模型和斑块元胞自动机的城镇扩张模拟方法
技术分类

06120115920989