一种双层优化驱动的动态系统方程发现方法

文献发布时间：2023-06-19 19:30:30

技术领域

本发明涉及机器学习技术领域，更具体的说是涉及一种双层优化驱动的动态系统方程发现方法。

背景技术

微分方程（如常微分方程、偏微分方程）是生物学、天体物理学、流体力学、金融学等众多科学领域中对动态系统进行数学建模的核心工具。传统地，微分方程多由科学家根据领域内现有的科学知识和结论手动推导建立。该过程高度依赖于科学家的经验直觉，以及长期的猜想假设与实验验证。甚至，在多种新兴的多学科交叉领域，如计算神经学，很多动态过程对人类科学家来说仍然处于黑箱状态，能够启发方程建立的领域知识甚少。在上述问题的驱动下，计算科学领域诞生了一批动态系统方程发现方法（下简称方程发现方法），即一类从动态系统的时空测量数据中自动地、定量地逆向构建出该系统服从的微分方程的方法。在方程发现领域，一个重要共识和假设是：真实世界方程往往不存在很多项，即方程具有简明性。

现阶段，方程发现方法主要分为两类，稀疏回归类和遗传算法类。近些年，随着机器学习、深度学习相关理论、工具的广泛应用，一些研究将深度神经网络与稀疏回归或遗传算法进行结合，使用神经网络对动态系统的原始观测数据进行拟合，并利用神经网络的连续可微性直接计算时间导数和库矩阵中的方程项。但是该种方法面临着神经网络的过拟合或者欠拟合问题，需要根据具体问题进行严密地调参，实际应用价值较低。

同时，稀疏回归和遗传算法都具有的一严重缺陷是该两类方法对于存在较大噪声的观测数据或稀疏的观测数据鲁棒性交叉。对于噪声数据和稀疏数据，建立方程左手项时间导数以及右手侧候选方程项时进行的数值计算时会引入更大的误差，导致出现错误方程过拟合该数据集的可能性显著增加。使用深度神经网络预先拟合数据集的做法能够缓解稀疏数据的挑战，但是仍面临该神经网络的过拟合与欠拟合问题。稀疏回归和遗传算法都具有的另一缺陷是对超参数敏感。稀疏回归的主要超参数是抹去小系数项时的阈值；遗传算法的主要的超参数是适应度函数中零范数稀疏性正则项的权重。上述两种超参数均会严重影响方程发现的结果。

因此，如何应对方程发现作为逆问题面临的解的不定性问题，缓解动态系统方程发现过程中的过拟合现象，提高动态系统方程发现过程的鲁棒性，从而解决各科学、工程领域中的动态系统数学建模问题是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提供了一种双层优化驱动的动态系统方程发现方法，通过使两个优化问题形成交叉验证显著提高面对非完美数据的鲁棒性，降低对超参数的敏感性，解决对于一组确定的非完美观测数据集和超参数，很可能存在错误的方程能够过拟合该组数据，使该超参数下的目标函数值达到最优的问题，从而显著提高方程发现技术在真实世界中的应用性，帮助各科学、工程领域技术人员进行数学建模。

为了实现上述目的，本发明采用如下技术方案：

一种双层优化驱动的动态系统方程发现方法，包括以下步骤：

步骤1：获取动态系统观测数据样本；

步骤2：对观测数据样本进行局部多项式拟合，通过数值微分得到偏微分方程，获得动态系统的时间和空间导数；多项式拟合得到多项式函数，对多项式函数再取导数得到时间和空间导数，这个过程称为数值微分；

步骤3：根据时间和空间导数获得库矩阵，从库矩阵中选取方程项选择矩阵，根据微分方程的一般形式构建待发现方程，待发现方程刻画为方程项选择矩阵和方程项系数向量的线性乘积，优化方程项选择矩阵和方程项系数向量得到双层优化范式；

步骤4：通过强化学习相关方法结合传统最小二乘回归求解双层优化范式，获得动态系统的方程。

优选的，待发现方程左手项为观测数据样本的一阶时间导数，右手项为方程项选择矩阵和方程项系数向量的线性乘积；库矩阵包含待发现方程的所有可能方程项，将动态系统的待发现方程的右手项转化为库矩阵中若干方程项的线性组合，表示为方程项选择矩阵和方程项系数向量的线性乘积形式。

优选的，将所述观测数据样本沿方程项选择矩阵的列方向进行划分，划分为两组没有交集的正交数据集，利用两组正交数据集分别优化方程项选择矩阵和方程项系数向量，构建出双层优化范式。

优选的，求解双层优化范式包括内层优化和外层优化；内层优化目标函数为最小二乘回归模型，用于回归出动态系统的形式确定系数未知方程对应的系数；外层优化目标函数为添加稀疏性正则项的回归方程，用于优化方程形式，并将方程项选择矩阵作为循环神经网络的动作输出，将外层优化目标函数值作为循环神经网络的奖励值，使用策略梯度算法更新循环神经网络参数，鼓励智能体挑选目标函数值低的方程项，通过强化学习实现对方程项选择向量的优化。

优选的，所述步骤4的具体过程为：

步骤41：构建循环神经网络，并利用循环神经网络获得动态系统每个时刻输出概率分布，并通过采样选取方程项，获得形式确定系数未知方程；

步骤42：通过双层优化范式的内层优化求解方程系数，结合形式确定系数未知方程，获得发现方程；

步骤43：通过双层优化范式的外层优化，利用强化学习方法更新循环神经网络参数，并返回步骤41，直至循环神经网络参数收敛，对步骤42获得的所有发现方程进行排序，选取最优发现方程为动态系统的方程。

优选的，对一组正交数据集上的内层优化进行求解，根据形式确定系数未知方程中确定的方程项选择矩阵下，采用标准最小二乘回归优化方程系数，获得确定形式确定系数的发现方程。

优选的，步骤43中通过对另一组正交数据集上的外层优化进行求解，利用强化学习方法对循环神经网络参数进行更新，优化发现方程中确定的方程项选择矩阵的概率分布，令外层优化目标函数极小化；利用强化学习方法更新循环神经网络参数具体过程为：

步骤431：计算外层优化目标函数关于循环神经网络参数的梯度，并将外层优化目标函数的相反数作为奖励函数；

步骤432：根据步骤41中采样选取方程项获得多个方程项选择矩阵，结合奖励函数，采用蒙特卡洛方法计算梯度的蒙特卡洛无偏估计；

步骤433：根据蒙特卡洛无偏估计优化外层优化目标函数获得优化式；

步骤443：采用随机梯度下降算法更新优化式，从而更新循环神经网络参数。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种双层优化驱动的动态系统方程发现方法，是一种用于从动态系统的观测数据中逆向提取该系统服从的微分方程的方法。本发明联系方程发现作为逆问题的本质以及现有方程发现方法中存在的问题，重新定义方程发现范式，将方程的形式和系数解耦至两个单独的、相互嵌套的子优化问题，形成一个双层优化框架。该框架的外层优化负责优化方程的形式（即包含哪些方程项），内层优化负责优化确定形式下方程的系数，通过双层优化框架将发现方程的选项和系数回归分解至两个使用正交数据集的相互嵌套的子优化问题中，再通过强化学习相关方法结合传统最小二乘回归对原始目标函数直接进行求解，避免抹去小系数项，并使两个优化问题形成交叉验证显著提高面对非完美数据的鲁棒性，降低对超参数的敏感性，使得该双层优化问题得以求解。相较于已有算法，本发明显著提升了针对噪声数据、稀疏数据、含有小系数项的方程、算法超参数的鲁棒性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的实施例中问题刻画阶段流程图；

图2附图为本发明提供的实施例中求解阶段流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种双层优化驱动的动态系统方程发现方法，从动态系统的观测数据出发，发现该系统服从的微分方程。该过程总共分为1个问题刻画阶段和3个求解阶段，具体过程为：

S1：问题刻画阶段，从动态系统的观测数据出发，利用数值微分手段，将待发现的未知方程写为偏微分方程的标准形式，即：左手项为观测数据的一阶时间导数（列向量）；右手侧建立一个与稀疏回归方法类似的包含所有可能方程项的库矩阵，并将未知方程转化为库矩阵中若干方程项的线性组合；然而，不同于稀疏回归使用一个系数向量对库矩阵中的方程项同时完成选择和回归，将上述两个步骤分开至两个待优化变量：方程项选择矩阵和已选方程项的系数向量，相应地，将上述一组观测数据集沿矩阵列方向分为两组正交数据集（即交集为空），分别用于优化上述两个待优化变量；最终，针对上述两个待优化变量，设计一个双层嵌套的优化框架，具体地，内层优化使用第一组数据集，负责优化已知方程项的系数，目标函数即最小二乘回归；外层优化使用第二组数据集，负责优化方程的形式，本发明采取在最小二乘回归目标函数中添加零范数稀疏性正则项鼓励发现方程的简明性；

S2：针对问题刻画阶段中构建的双层优化框架，使用深度强化学习技术进行求解，针对外层优化中方程项选择矩阵的离散型以及目标函数中零范数稀疏性正则项的不可微性，将方程项选择转化为一个智能体神经网络的动作，而目标函数值则转化为智能体的奖励值（的相反数），对方程项选择矩阵的直接优化也转换为对智能体神经网络的优化；具体地，该双层优化框架地求解过程分为三阶段：

第一阶段中，建立一个智能体神经网络，并使该神经网络在没有任何先验输入的情况下，输出一串库矩阵方程项对应的列号，从而完成了方程项选择，得到一个确定方程形式而未知相应系数的方程；

第二阶段中，本发明进行内层优化，将上述选中的方程项从库矩阵中挑出，并利用第一组数据集向左手项回归，得到确定形式和系数的完全确定的方程；

第三阶段中，本发明进行外层优化，在第二组数据上计算上述得到的确定方程的目标函数值，并在强化学习方法驱动下，将该目标函数值作为奖励值（的相反数）返回给智能体，鼓励其输出高奖励值的动作，从而实现对第一阶段中方程挑选过程的优化；

求解阶段的第一、二、三阶段完成了待发现方程的一轮优化。在实际应用过程中，上述三阶段往复进行，直至智能体神经网络收敛，随后，可通过前两阶段得到最终算法发现的方程。

其中，稀疏回归类方法为现阶段最主流的方程发现手段，得到了大量关注和研究。以一数值仿真的洛伦兹系统为例，该洛伦兹系统用于描述三维空间中某一个物体的混沌运动，该物体在空间中的三维位置坐标（x,y,z）分别服从一个标量常微分方程。现假设上述三个常微分方程是未知的，稀疏回归算法从该系统一段时间t内的原始观测数据X=[x

根据前述“真实方程应不存在很多方程项”的假设，系数向量

实施例

在一个实例中，本发明对液体火箭发动机燃料特性分析过程中的一个二维燃料流场系统实施动态系统方程发现，从观测数据还原该流场系统的速度场服从的物理方程，该过程分为一个问题刻画阶段和三个求解阶段。

在问题刻画阶段，从该流场系统的时空测量数据出发，构建双层优化框架，如图1所示。

本发明首先对上述二维燃料流场的速度场和压力场进行观测，得到速度场和压力场的时空观测数据集，如图1中S1所示，其中：流场的空间坐标记为二维向量x=(x,y)；流场的速度场为二维向量，记为

根据现有领域知识，上述二维流场服从二维纳维尔-斯托克斯方程（Navier-Stokes equation）；因此，该流场的第一个速度场分量真实服从的偏微分方程可写为

（1）

其中左手项

不失一般性地，本发明将上述待发现的未知方程建模为一个一般形式的、非线性的参数化标量偏微分方程；

（2）

其中

为了在没有任何先验知识的情况下，从原始观测数据中发现上述方程，式（2）中

为了得到库向量q中的各阶时间导数和空间导数，采取数值微分手段，对每个流场时空观测数据（速度场数据或压力场数据）进行局部多项式拟合，并从拟合得到的多项式函数解析地得到该点的近似导数。具体地，对速度场观测数据u在时间维度上拟合一个局部的单变量多项式函数，并对该函数取一阶导数，得到左手项时间导数

综上，从一组含有N个时空观测数据的数据集

（3）

其中

为了对

（4）

然而，由于方程发现问题的逆问题本质，解

针对上述问题，本发明将含有N个数据点的回归数据集

（5）

（6）

该双层优化框架的内层优化式（6）是在某确定的方程项选择矩阵

为了对方程项选择矩阵Γ的概率分布进行刻画，利用深度神经网络（Deep NeuralNetwork）对其建模，从而将对Γ的概率分布的直接优化转换为对神经网络参数

在上述双层优化的具体求解中，内层优化为一个简单的连续变量的最小二乘回归问题，该问题存在简单的闭式解。该双层优化的主要求解难点来源于如何利用深度神经网络（Deep Neural Network）对外层优化中方程项选择矩阵

第一阶段为方程项挑选阶段，即利用一神经网络智能体生成方程挑选矩阵

（7）

上述过程得到一个确定形式不确定系数的方程。至此，第一阶段方程项挑选结束。

第二阶段为内层优化阶段。经过第一阶段，待发现方程的形式已经确定，随即在第二阶段中对数据集

（8）

上述过程得到一个确定形式确定系数的方程，即算法发现的方程，如图2中S2所示。至此，第二阶段内层优化结束。

第三阶段为外层优化阶段，在该阶段利用强化学习方法对智能体参数α进行更新，优化其生成方程项选择矩阵Γ的概率分布，从而优化前两个阶段中发现的方程，使式（5）中的目标函数值极小化，如图2中S3所示。为了优化式（5），自然地，求取式（5）关于智能体参数α的梯度，得到

（9）

式（9）符合强化学习理论中策略梯度算法（Policy Gradient）的更新式。相应地，智能体的奖励函数自然定义为目标函数的相反数

（10）

针对式（9）中期望的估计，采用蒙特卡洛（Monte Carlo）方法，在阶段一中一同采样多个方程项选择矩阵

（11）

综上，双层优化范式的外层优化目标函数式（5）可写为

（12）

式（11）给出的优化式关于智能体参数α可导，采用随机梯度下降算法（StochasticGradient Descent，SGD）对该式进行更新，从而达到更新智能体参数，提高其在阶段一种选择高奖励值的方程形式的概率。至此，阶段三外层优化结束。

上述求解过程中描述的三个阶段仅完成一轮智能体训练，因此该三阶段应反复进行，直至智能体神经网络参数达到收敛。作为总结，在第一阶段中，本发明令智能体神经网络进行方程项挑选，得到确定形式、不确定系数的方程；在第二阶段中，本发明对智能体挑选的方程项进行最小二乘回归，完成式（6）中的内层优化，得到确定形式、确定系数的完全确定的方程；在第三个阶段中，本发明利用强化学习方法更新智能体参数，鼓励智能体在下一轮第一阶段挑选能够使外层优化目标函数降低的方程项，也就完成了式（5）中的外层优化。在上述求解过程中，本发明记录每一轮训练中算法发现的方程（即阶段一和阶段二得到的方程），并按照其奖励值进行排序。算法收敛后，将奖励值最高的方程作为最终发现的方程。至此，该实例中对于二位流场的方程发现过程运行完毕。

本发明的有益效果包括：

（1）相较于现有稀疏回归方法和遗传算法，双层优化驱动的方程发现方法在方程发现的问题刻画和求解方面均具有显著的优越性。

（2）将方程的形式解耦至两个单独的子优化问题，并分别采用相互正交的子数据集进行优化求解，两个子优化形成正交的相互验证，显著降低了出现错误的、过拟合数据的方程的可能性，进而显著提升方程发现算法对于观测数据误差、观测数据稀疏性、数值微分计算误差、算法超参数的鲁棒性。

（3）在问题求解过程中，针对零范数不可微问题，采用强化学习方法，将目标函数转化为智能体神经网络的奖励值，从而实现对目标函数进行直接优化，没有采用可微的近似目标函数。而稀疏回归方法采用二范数稀疏性正则项的近似目标函数，并通过重复求解和抹去小系数项近似求解原始目标函数，避免了使用近似目标函数，从而避免了在求解中抹去小系数项，从而提高方程发现对于小系数方程项的鲁棒性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：邓岳;苑会宁;李泽宇;
专利申请人：北京航空航天大学;