掌桥专利:专业的专利平台
掌桥专利
首页

数据驱动识别偏微分方程的序列奇异值过滤方法

文献发布时间:2024-04-18 19:55:00


数据驱动识别偏微分方程的序列奇异值过滤方法

技术领域

本发明属于计算力学领域,具体涉及一种数据驱动识别偏微分方程的序列奇异值过滤方法。

背景技术

近年来,微型机械和纳米结构被应用于医学诊断、药物研发、电子器件、能源催化等各种研究领域。微型机械可以完成常规方法难以完成的微加工、微操作,纳米材料具有高强度、高韧性等优异的力学性能,因此微纳米材料广泛渗透到物理学、化学、材料学、生物医学等领域,微纳米力学目前已成为交叉性的前沿学科,对微纳米材料力学性质的研究具有重要意义。

实验表明,微纳米尺度下材料的力学性能与响应与宏观尺度下有着较大差异,宏观的经典弹性模型不具备描述微纳米材料力学行为的能力。针对微纳米尺度效应,目前提出的各种理论模型是通过引入不同的微观变形机理,从而在经典的二阶微分理论中引入不同的高阶项来预测微纳米材料的力学响应。然而,大量的实验和分子模拟结果表明,这些理论大多只能描述某一种变形机制,并不能准确地预测材料的所有力学行为。建立完整统一的微纳米力学模型,是固体力学领域的重要挑战。

研究表明,数据驱动方法是一种从已知数据中建立模型的有效方法。数据驱动直接从观测的数据出发,为系统建立模型,跳过了人为建模再验证的过程。一些具有代表性的系统识别方法近年来被相继提出,如符号回归、深度学习等,然而将上述方法应用于微纳米尺度力学方程的识别时存在许多问题:它们需要人为地预先提供结构化的先验知识,才能进行有监督地学习,而对于微纳米尺度的控制方程,其个数和具体形式(如待定的左端项)实际上都是未知的;此外,符号回归在处理较多的变量数目和函数库数目时,会陷入局部最优以及面临过拟合的问题;以神经网络为代表的深度学习技术在拟合变量之间非线性关系的能力上占据优势,然而深度学习的可解释性依旧是目前学术界没有攻克的难题,数据驱动得到的结果难以被显式地表达,从而限制了人们的理解和进一步利用。上述问题的存在,使得发展适用于微纳米力学系统的数据驱动识别方法目前仍然存在很大的挑战,具有重要的研究价值。

最近的研究表明,稀疏学习是一种非线性系统建模的有效方法,其通过将稀疏向量的范数加入到优化目标函数中,从而能解决构建非线性函数库面临的维数暴增所带来的矩阵病态问题。Brunton等人于2016年首次将稀疏学习引入到动力系统的方程识别当中(SINDy):对于各个观测量的时间序列数据,使用给定的非线性基函数组成数据矩阵,并使用最小绝对收缩选择算子、阈值最小二乘法等稀疏学习算法寻找稀疏解,以平衡拟合精度与方程复杂程度之间的矛盾。然而该方法也必须预先人为设定控制方程的个数以及为每个方程指定左端项,从而无法用于识别微纳米力学方程。本发明将借鉴其构建非线性函数库并识别稀疏模型的思想,提出奇异值过滤方法,把依赖于先验知识的有监督学习范式转变为不依靠先验知识、自动化的无监督学习,将方法的应用场景扩展至控制方程个数和方程各项完全未知的偏微分方程组的识别问题,从而使得方法能够识别微纳米材料的力学控制方程。

为了能够从数据集中准确地识别微分方程的个数和方程组中存在的所有非线性项,本发明创新性地设计了一套奇异值过滤的算法流程,通过迭代实施奇异值分解方法来识别隐藏在数据集中的本质属性。奇异值分解(SVD)是一种矩阵分解技术,主要用于矩阵的特征分解和降维。其作为很多机器学习算法的基石,能够处理模式识别、数据压缩、信号降噪等问题,并且应用于推荐系统、自然语言处理等机器学习领域。奇异值分解是谱分析理论在任意矩阵上的推广,其主要功能是在平方意义下寻找最为线性无关的一组正交向量,从而张成初始矩阵的原象。因此,奇异值分解具有寻找大数据中隐藏的本征线性结构和计算矩阵的低秩近似的能力。依据各个奇异值的大小关系,算法可以自动判断矩阵中各个模态所占的比重,从而识别控制方程的个数,而不依赖人为的预先设定。

为了确定每个方程的最简形式,使其在拟合精度与方程复杂度之间做出平衡,本发明拟采用处理列子集选择问题的代表性算法:强秩揭示正交三角分解(sRRQR)方法。由于假设存在的非线性函数库会存在大量冗余,随意选取方程的左端项进行回归将无法得到正确的结果。要设计方法使其能够实现自动识别,则这一组左端项应该满足两个条件:一是它们之间不应存在线性相关关系;二是它们应是某种范数意义下最能代表剩余列的一组基向量。这对应线性代数中的列子集选择问题(CSSP),或称为内插分解(ID)。其中,sRRQR在满足上述两个条件的同时,具有较低的计算复杂度,能够保证方法的效率。

目前,对于非线性微分方程组的无监督数据驱动识别的研究还处于发展阶段,应用于微纳米力学方程识别所面临的依赖先验知识、可解释性差等问题尚未被解决。因此,本发明将提出一种数据驱动识别偏微分方程的序列奇异值过滤方法,结合快速高效的先进数值方法,设计鲁棒性强、适用广泛的算法流程,为微纳米力学系统的数据驱动识别提供一种行之有效的途径。

发明内容

本发明要解决的技术问题:本发明基于矩阵的奇异值分解技术,并结合强秩揭示正交三角分解方法,针对微纳米力学系统的数据驱动建模设计算法流程,创新性地提出了一种序列奇异值过滤方法(Sequential singular value filtering method,简称Seq-SVF),其目的在于解决现有技术存在的以下问题:采用奇异值分解克服现有方法需要预先人为设定方程个数的缺点;采用强秩揭示正交三角分解克服现有方法对控制方程结构化先验知识的依赖,使得该方法能够突破其只能应用于动力系统的局限,从而将应用场景扩展到形式完全未知的微纳米力学微分方程组的数据驱动识别问题中;设计自动化的奇异值筛选流程来滤去非线性函数库中的冗余项,减少了矩阵分解的计算复杂度,提高了识别结果的泛化能力。

本发明的技术方案:

数据驱动识别偏微分方程的序列奇异值过滤方法(Seq-SVF),

为了从微纳米尺度材料的位移等数据中提取高阶控制微分方程组,提高计算结果的效率与精度,本发明将设计一套基于奇异值分解方法和强秩揭示正交三角分解方法的算法流程,从测量数据中无监督地提取非线性控制方程组,提供了一种数据驱动识别偏微分方程的序列奇异值过滤方法,具体步骤如下:

步骤1、预处理编码器:设置候选函数库,根据质点位移数据和候选函数库计算数据矩阵,对数据矩阵的每列实施正则化,使用奇异值分解方法识别偏微分方程的个数;

首先,给出本方法识别微纳米力学系统的基本格式;设该微纳米力学系统由一组偏微分方程控制:

其中,X

接着,为了防止各项的数量级相差过大对计算结果造成影响,对数据矩阵A的每一列实施L2范数的归一化;最后,对数据矩阵A实施奇异值分解,通过判断矩阵的小奇异值的数量来确定偏微分方程的个数;

步骤2、函数过滤器:删除候选函数库中冗余的项;

通过删除数据矩阵A中的各列,根据奇异值分解的结果判断该列是否存在于偏微分方程中;具体实现过程如下:

(1)初始化变量,令i=1,k为空向量;P为数据矩阵A中小奇异值的个数;

(2)若i≤数据矩阵A的列数N,开始循环;

(2.1)删掉数据矩阵A的第i列,做奇异值分解,计小奇异值的个数为P

(2.2)如果P

(3)A′=A(:,k),即为过滤掉无关项后的数据矩阵,以供后续步骤使用;

步骤3、线性解耦器:使用强秩揭示正交三角分解方法识别所有左端项在通过步骤2得到的过滤后数据矩阵(A′)中的位置,并更新数据矩阵;

步骤4、稀疏解码器:确定各个偏微分方程中的项并计算各项系数;

对每个偏微分方程各实施一次步骤2,即可在候选项中确定每个偏微分方程的稀疏模型;之后使用最小二乘法计算所有系数;其具体实施过程如下:

(1)初始化变量,令i=1,j=1,K

(2)若i≤P,开始循环;

(2.1)将第i个左端项和所有右端项组成矩阵,即A′

(2.2)若j≤N′-P,开始循环;

(2.2.1)删掉矩阵A′

(2.2.2)如果P

(2.3)令i=i+1,j=1;返回步骤(2)继续循环;

(3)使用最小二乘法计算偏微分方程组所有项的系数。

进一步,在步骤1中,为了防止各项的数量级相差过大对计算结果造成影响,对数据矩阵A的每一列实施L2范数的归一化;具体操作方法为将各列的所有分量平方求和后开根号,即为各列的L2范数,之后令矩阵每个元素除以该列的L2范数即可;归一化后的数据矩阵A每列的L2范数都等于1,保证各列的数量级一致。

进一步,数据驱动识别偏微分方程的序列奇异值过滤方法Seq-SVF的具体实现过程如下:

(1)对各质点的原始质点位移数据进行高斯滤波处理,并计算所有导出项的值,将其组成数据矩阵A,对各列实施L2范数的归一化;对数据矩阵A实施奇异值分解,小奇异值的个数计为P;

(2)初始化变量,令i=1,k为空向量;

(2.1)若i≤矩阵A的列数N,开始循环;

(2.1.1)删掉矩阵A的第i列,做奇异值分解,计小奇异值的个数为P

(2.1.2)如果P

(2.2)A′=A(:,k),即为过滤掉无关项后的数据矩阵;

(3)对A′实施强秩揭示正交三角分解方法,得到置换矩阵n,其后N′-Q列中单位元素所处的行数即为左端项在A′中的列数,将A′中的左端项移至最左侧;

(4)初始化变量,令i=1,j=1,K

(4.1)若i≤P,开始循环;

(4.1.1)将第i个左端项和所有右端项组成矩阵,即A′

(4.1.2)若j≤N′-P,开始循环;

(4.1.2.1)删掉矩阵A′

(4.1.2.2)如果P

(4.1.3)根据K中记录的各偏微分方程对应项的信息,令(=i+1,j=1,返回步骤(3.1)继续循环;

(4.2)使用最小二乘法计算偏微分方程组所有项的系数。

本发明的有益效果:

采用本发明提供的技术方案与现有技术相比,具有如下显著效果:

(1)本发明提供的数据驱动识别偏微分方程的序列奇异值过滤方法,为微纳米力学系统的数据驱动建模提供了一套简便的算法流程。将所有可能存在的质点位移对空间坐标的高阶导数项和非线性项补充至数据集中,有效克服了传统建模方法只能识别线性系统的不足。通过采用奇异值分解、强秩揭示正交三角分解等先进的数值计算方法,保证了计算效率和结果的稳定性。与现有的基于优化范式的系统识别方法相比,能够避免结果陷入局部最优的问题。

(2)本发明提供的数据驱动识别偏微分方程的序列奇异值过滤方法,克服了现有方法过于依赖预先人为地对系统的控制方程个数和方程形式加以限制的不足,将有监督的学习范式转变为无监督的算法流程,将数据驱动识别方法的应用场景从动力系统拓展至由一般非线性偏微分方程组所控制的系统。使用奇异值分解技术自动识别隐藏在数据矩阵中的本征低秩结构,可以避免算法对关于控制方程个数的先验知识的依赖。使用强秩揭示正交三角分解方法可以从函数库中自动提取最具代表性的一组基底作为控制方程的右端项,避免了目前的有监督学习方法对于方程结构的先验知识的依赖。

(3)本发明提供的数据驱动识别偏微分方程的序列奇异值过滤方法,为显式提取微纳米力学控制方程提供了一套自动化的算法流程,克服了现有的深度学习方法可解释性差的不足。创新性地设计了一套奇异值过滤流程,通过矩阵秩的变化情况判断各项与其余项的线性相关关系,能够自动排除与系统无关的干扰变量的影响,有效地确保了模型的稀疏结构,能够确保本发明的鲁棒性和泛化能力,并且为以该结果为基础的后续工作,如分析微纳米力学方程的物理意义和进一步的优化与数值模拟奠定了坚实基础。

附图说明

图1为本发明的一种数据驱动识别偏微分方程的序列奇异值过滤方法(Seq-SVF)的操作流程图;

图2为本发明的实施例1使用Seq-SVF识别三维梁弹性变形控制方程的流程示意图和计算结果;

图3为本发明的实施例2使用Seq-SVF识别纳米铜位移控制方程的流程示意图和计算结果;

图4为本发明的实施例3热力强耦合系统的(a)位移u和(b)温度T关于时间t和坐标x的变化图;

图5为本发明的实施例4使用Seq-SVF识别Lorenz系统控制方程的流程示意图和去噪前后计算结果的对比;

图6为本发明的实施例5二维不可压缩流场在(a)t=0,(b)t=10和(c)t=20时位移u的原始数据云图。

具体实施方式

下面结合附图和实施例对本发明的性能做出进一步详细说明。以下实施例用于说明本发明,但不能用来限制本发明的适用范围。

一种数据驱动识别偏微分方程的序列奇异值过滤方法,步骤如下:

首先,给出序列奇异值过滤方法识别偏微分方程组的基本格式;对于一个在n维的时空坐标(t x

将偏微分方程中所有可能存在的项罗列出来,如式(3)所示:

其中,

其中,X

接着,使用奇异值分解方法来确定偏微分方程的个数,并过滤掉函数库中冗余的项;式(4)表明,由于偏微分方程的存在,使得数据矩阵A分布在低维的子空间上,而不是整个N维空间:对于P个偏微分方程控制的系统,偏微分方程会对数据集产生P维的约束,使得数据矩阵A分布在N-P维的子空间上;使用奇异值分解方法提取出P的值;奇异值分解是将M×N的数据矩阵A分解为正交矩阵U,V和对角矩阵∑的乘积:

A=U∑V

由于采样点个数M远大于函数库的规模N,将上式展开有:

其中,σ

测量数据会受到噪声的影响,并且数值微分也会带来难以避免的数值误差,导致实际的数据矩阵A并不是完全亏秩的,是一个近似奇异的病态矩阵;此时后N-rank(A)个奇异值的大小不严格等于0,是与前面奇异值相比的小量,它们的大小关系取决于噪声的量级大小;当噪声控制在一定范围时,A的后N-rank(A)个奇异值会远小于前面的奇异值,即σ

为了提高后续流程的计算效率和精度,通过设计迭代流程,反复对数据矩阵进行缩减并实施奇异值分解,来筛选所有与偏微分方程相关的项;具体过程如下:依次删掉数据矩阵A中的每一列进行奇异值分解,删掉某列后如果仍然识别出了P个偏微分方程,说明这一列对应的项不包含在偏微分方程组里面;如果识别出了P-1个偏微分方程,说明这项存在于偏微分方程组里面;计算N次后可筛选出N′个与偏微分方程有关的项,将这些项对应的列保留下来得到重构的数据矩阵A′,以供后续步骤使用;

之后,使用强秩揭示正交三角分解方法sRRQR提取每个偏微分方程的左端项;给出sRRQR的计算格式,对于任一数据矩阵A,sRRQR将其分解成式(8)形式:

其中,Q为正交矩阵,R为上三角矩阵,Q

σ(D)≤σ

|(B

其中σ(B)是矩阵B的奇异值,Q是需要预先设定的值,q

最后,使用奇异值分解方法和最小二乘法确定稀疏形式的偏微分方程组;确定偏微分方程稀疏形式的方法与用奇异值分解方法过滤函数库中冗余项的方法相同:将P个左端项分别逐个与N′-P个候选右端项组成矩阵,此时的矩阵受一个偏微分方程控制,即这个左端项对应的偏微分方程;依次删掉每个候选右端项进行奇异值分解,删掉某项后如果仍然识别出了1个偏微分方程,说明这一列对应的项不包含在此偏微分方程里面;如果识别出了0个偏微分方程,说明这项存在于此偏微分方程中;进行P(N′-P)次奇异值分解后,所有偏微分方程的左端项和右端项都已确定;使用最小二乘法计算对应系数,结果如式(12)所示:

根据上述理论推导得出的奇异值分解和强秩揭示正交三角分解方法的基本格式,嵌入到所述的迭代流程,即实现序列奇异值过滤方法,具体步骤如下,

步骤1:根据具体实例的需要设置候选函数库,包括设定导函数的最高阶次,乘积的最高幂次,以及其它非线性函数的形式,根据初始数据和候选函数库计算数据矩阵,对数据矩阵的每列实施正则化,使用奇异值分解方法识别偏微分方程的个数;

步骤2:根据删掉某一项后识别出的偏微分方程个数是否减少判断该项是否存在于偏微分方程组中,并更新数据矩阵;

步骤3:使用强秩揭示正交三角分解方法识别所有左端项在更新后数据矩阵中的位置,并进一步更新数据矩阵;

步骤4:依次将每个左端项与所有右端项组成矩阵,并依次删除每个右端项,根据偏微分方程的个数是0还是1确定该项是否存在于当前左端项对应的偏微分方程中;确定各个偏微分方程中的项之后使用最小二乘法计算各项系数。

为了使本发明的目的、技术方案和具体实施效果展示更加清晰明了,下面通过五个具体实施例结合附图2~6对本发明提出的Seq-SVF方法的准确性和有效性作进一步的详细说明。首先,通过一个三维的经典弹性力学算例验证本发明所提出方法对识别一般微分方程组的准确性和有效性。其次,通过一个纳米铜变形算例验证本发明所提出方法对识别微纳米力学高阶微分方程组的适用性。然后,通过采用热力耦合算例说明本发明提出的Seq-SvF方法识别复杂耦合问题的能力。最后,通过采用非线性动力系统和非线性微分方程控制的流场算例说明本发明提出方法识别非线性系统的能力。

实施例1:三维弹性梁复合加载下的受力变形(附图2)

本实施例为三维弹性体受力变形算例,通过在仿真软件中对弹性梁施加弯扭剪拉多种载荷,使其产生弯曲、扭转、剪切和轴向拉伸多种变形模式,如图2所示,并收集若干离散点的初始位置(x,y,z)和变形后的位置(u,v,w)作为原始数据集。弹性范围内固体的位移受一组微分方程控制:

其中

Seq-SVF假设该系统包含所有0、1、2阶的导数作为函数库,即:

在添加噪声的情况下,Seq-SVF成功从30个候选函数中提取出了15个正确的项,同时将其余无关的项过滤掉,计算结果如(16)所示,各项系数的相对误差在1%以内:

此实施例有效地说明了本发明提出的序列奇异值过滤方法对识别一般偏微分方程组的有效性和准确性。

实施例2:纳米铜梁复合加载下的受力变形(附图3)

本实施例为纳米铜梁受力变形算例,通过分子动力学模拟软件对纳米铜梁施加弯扭剪拉多种载荷,使其产生弯曲、扭转、剪切和轴向拉伸多种变形模式,如图3所示,并收集若干铜原子的初始位置(x,y,z)和变形后的位置(u,v,w)作为原始数据集。

Seq-SVF假设该系统包含位移对空间坐标的所有2阶和4阶导数作为函数库,即:

Seq-SVF成功从60个候选函数中提取出了30个项,同时将其余无关的项过滤掉,计算结果如(18)所示:

u

v

w

(18)

此实施例有效地说明了本发明提出的序列奇异值过滤方法对识别微纳米力学高阶偏微分方程组的适用性。

实施例3:热力强耦合系统的数据驱动控制方程识别(附图4)

本实施例为物体的变形与温度互相影响的耦合算例。Seq-SVF作为一种无监督的偏微分方程识别方法,具有从多个变量中提取方程的能力,在识别复杂耦合微分方程问题方面具有显著优势。下面通过一个热力强耦合算例来说明序列奇异值过滤方法在处理多场问题方面的优势和必要性。如图4所示,考虑一维情况下物体位移(u)和温度的传播(T)。物体在变形过程中,弹性势能不断积累和释放,其中一部分转化为热能,会导致温度的变化;温度的变化会使得应力重新分布,从而反过来影响位移。热力强耦合的控制方程如式(19)所示,其中各物理量经过了无量纲化处理:

Seq-SVF将所有0、1、2阶的导数作为函数库,在添加噪声的情况下,识别出了正确形式的控制方程,并且各项系数的相对误差在0.5%以内,识别结果如(20)所示:

此实例强调了本发明提出的序列奇异值过滤方法对识别耦合多变量系统的有效性。

实施例4:Lorenz系统的数据驱动控制方程识别(附图5)

本实施例为非线性动力系统的验证算例。Lorenz系统是一种典型的非线性系统,在相空间内的轨迹如图5所示,其混沌吸引子具有对数值微扰的极端敏感性,因此成为非线性系统识别的一个经典算例。系统的控制方程如式(21)所示:

本发明提出的序列奇异值过滤方法将非线性函数库设为乘积形式,并将最高阶数假设至2阶,即数据矩阵为

将各变量的一阶导数项移至左侧,以便对比计算结果与真实系数:

其中多出来的一项是由于对矩阵做线性变换所致,其系数可以小到忽略不计。该结果进一步证明了Seq-SVF方法的准确性与鲁棒性。

实施例5:由Navier-Stokes方程控制的二维不可压缩流场(附图6)

最后一个实施例将考察序列奇异值过滤方法对识别一般非线性偏微分方程的有效性。不可压缩流体的行为可以由Navier-Stokes方程来描述。二维流场的N-S方程如式(24)所示:(雷诺数为100)

u

v

u,v为位移,p为压强。当Seq-SVF没有假设非线性项在函数库中时,数据矩阵如下所示:

A=[u,v,p,ut,ux,u

由于数据矩阵中没有非线性项,所以没有识别出N-S方程,而是识别出了不可压缩条件:

u

其理论方程中两项的系数为1。接着,在函数库中添加非线性项:

A=[u,v,p,u

Seq-SVF识别出了正确形式的控制方程,结果如(28)所示:

0.9928u

0.9977v

本实施例进一步说明了本发明提出的序列奇异值过滤方法的通用性和准确性,可以通过实际应用场景的需要合理设计非线性函数库,以求通过序列奇异值过滤方法得到预期的结果。

综上所述,我们首先通过实施三维弹性体位移驱动的偏微分方程的系统识别验证了本发明所提出的序列奇异值过滤方法Seq-SVF在一般微分方程组的系统识别中的重要性和准确性,说明了Seq-SVF从构建数据集到过滤有关项并识别左端项,最后计算方程系数的整体流程。随后,将Seq-SVF应用于一个纳米铜受载变形算例,从铜原子的位移数据中识别出了一组四阶偏微分控制方程组,验证了Seq-SVF对识别微纳米力学高阶控制微分方程组的适用性。之后,考察固体的热力耦合算例,数据驱动地提取出了物体位移与温度变化的显式关系,有效说明了Seq-SVF面对多场耦合系统识别问题的正确性和必要性。接着,通过对非线性Lorenz系统的识别,有效说明了Seq-SVF在识别非线性动力系统问题中的准确性,并通过对比高斯滤波前后的结果说明了本方法对原始数据实施去噪处理的必要性。最后,一个由非线性微分方程组控制的二维流场系统的识别问题被考察,说明了Seq-SVF在识别一般形式的多变量非线性偏微分方程组的通用性和有效性。因此,本发明所提出的序列奇异值过滤方法Seq-SVF是一种极具发展前景的偏微分方程数据驱动识别方法。

本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好的说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

相关技术
  • 数据驱动识别偏微分方程的序列奇异值过滤方法
  • 数据驱动的基于奇异值分解的神经网络声学模型裁剪方法
技术分类

06120116395192