掌桥专利:专业的专利平台
掌桥专利
首页

一种基于多任务学习的卫星热应力热变形快速预测方法

文献发布时间:2024-04-18 19:53:33


一种基于多任务学习的卫星热应力热变形快速预测方法

技术领域

本发明涉及卫星热应力热变形分析技术领域,具体涉及一种基于多任务学习的卫星热应力热变形快速预测方法。

背景技术

随着人工智能的蓬勃发展,以深度神经网络(Deep Neural Network,DNN)为基础的深度学习技术的应用越来越广泛。由于神经网络具有万能逼近性质以及高效计算特点,基于数据驱动的深度学习代理模型技术为高精度物理场代理模型的构建提供了新的思路。例如,目前有相关研究使用特征金字塔(Feature Pyramid Network,FPN)、UNet等神经网络模型来学习卫星热源布局与温度场之间的映射关系,通过以带标签的端到端方式对神经网络模型进行训练,从而建立卫星热源布局到温度场分布的高精度代理模型。

构建基于数据驱动的深度学习代理模型的重点在于对大量有限元或试验数据进行充分挖掘,现有的基于数据驱动的深度学习代理模型通常以单任务学习方式(SingleTask Learning,STL)对单个物理任务进行单独训练,在面对耦合物理量分析任务时,例如对具有耦合关系的热应力场和热变形场进行预测分析时,将耦合物理量拆分成独立的任务进行学习。

然而,将耦合物理量拆分成独立的多个物理量进行单独训练预测时,会占用更多的训练时间及系统内存,导致相应的预测分析成本增加。并且,将耦合物理量拆分成独立的多个物理量进行单独训练预测时,会忽略各个物理量之间的耦合关系,最终训练得到的代理模型的预测精度较低。

发明内容

为解决上述现有技术中存在的部分或全部技术问题,本发明提供一种基于多任务学习的卫星热应力热变形快速预测方法。

本发明的技术方案如下:

提供了一种基于多任务学习的卫星热应力热变形快速预测方法,所述方法包括:

获取训练样本集合,训练样本包括待分析的卫星区域的温度场和其对应的热应力及热变形;

根据热应力及热变形所包含的物理分量,构建多任务学习神经网络模型,所述多任务学习神经网络模型包括多个子任务解码输出层,每个所述子任务解码输出层对应一种物理分量;

构建能够平衡热应力及热变形中不同物理分量的损失差异的多任务学习损失函数;

利用训练样本集合和多任务学习损失函数训练多任务学习神经网络模型以拟合温度场与热应力及热变形的映射关系;

利用训练后的多任务学习神经网络模型进行热应力及热变形预测。

在一些可能的实现方式中,热应力包括物理分量(σ

在一些可能的实现方式中,采用以下方式获取训练样本集合:

确定待分析的卫星区域的温度场,根据卫星区域的温度场所满足的热弹性方程和热平衡方程,利用有限元分析方法计算当前温度场对应的热应力及热变形,得到一个包括待分析的卫星区域的温度场和其对应的热应力及热变形的训练样本;

重复进行训练样本的获取过程直至得到预设数量的训练样本,获取训练样本集合。

在一些可能的实现方式中,所述多任务学习神经网络模型采用UNet网络作为基础结构,包括:

共享编码层,所述共享编码层包括M个下采样层,用于通过池化和卷积操作提取输入图像的多尺度特征,M为预设数值;

多个所述子任务解码输出层,多个所述子任务解码输出层分别与所述共享编码层连接,所述子任务解码输出层包括与M个下采样层一一对应的M个上采样层、M-1个AG网络层和网络预测层,第1个上采样的输入与第M个下采样层的输出连接,第m个AG网络层的输入与第M-m个下采样层的输出和第m个上采样层的输出连接,第M个上采样层的输出与网络预测层的输入连接,上采样层用于将输入的特征与其对应的下采样层中相同尺度的特征进行跳跃拼接并输出,AG网络层用于通过注意力机制门操作从输入的特征中筛选出与当前任务具有相关性的特征并输出,网络预测层用于使用1x1卷积将每个物理分量的特征向量映射到其所对应的类。

在一些可能的实现方式中,所述多任务学习损失函数为:

其中,Θ表示多任务学习神经网络模型的参数,K表示物理分量种类,σ

在一些可能的实现方式中,第k种物理分量对应的模型不确定性σ

其中,N表示训练样本数量,

在一些可能的实现方式中,第k种物理分量对应的输出数据损失L

/>

其中,N表示训练样本数量,

在一些可能的实现方式中,利用训练样本集合和多任务学习损失函数训练多任务学习神经网络模型,包括:

将训练样本中的温度场作为输入,将训练样本中的热应力及热变形作为输出,通过最小化多任务学习损失函数训练多任务学习神经网络模型。

在一些可能的实现方式中,将训练样本中的温度场作为输入,将训练样本中的热应力及热变形作为输出,通过最小化多任务学习损失函数训练多任务学习神经网络模型,包括:

步骤S401,将多个训练样本中的温度场依次输入多任务学习神经网络模型,得到多任务学习神经网络模型输出的对应于热应力及热变形中各种物理分量的预测物理分量;

步骤S402,将多任务学习神经网络模型输出的预测物理分量与训练样本中热应力及热变形的物理分量进行比较,计算多任务学习神经网络模型的预测准确率;

步骤S403,判断预测准确率是否大于预设准确率阈值,若是,则将当前的多任务学习神经网络模型作为完成训练的多任务学习神经网络模型,若否,则利用多任务学习损失函数调整多任务学习神经网络模型的参数,并返回步骤S401。

在一些可能的实现方式中,所述方法还包括:

在利用训练样本集合训练多任务学习神经网络模型之前,分别对训练样本中的温度场、热应力和热变形进行归一化处理。

本发明技术方案的主要优点如下:

本发明的基于多任务学习的卫星热应力热变形快速预测方法能够实现热应力及热变形多个任务的同时训练和预测,减少训练时间以及系统内存需求,降低预测分析成本;并且,能够平衡热应力及热变形多个任务的训练速度以及训练精度,显著提高训练后的模型的预测精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例的基于多任务学习的卫星热应力热变形快速预测方法的流程图;

图2为本发明一实施例的一种多任务学习神经网络模型的结构示意图;

图3为本发明一实施例的一种AG网络层的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

以下结合附图,详细说明本发明实施例提供的技术方案。

参考图1,本发明一实施例提供了一种基于多任务学习的卫星热应力热变形快速预测方法,该方法包括以下步骤S1-S5:

步骤S1,获取训练样本集合,训练样本包括待分析的卫星区域的温度场和其对应的热应力及热变形。

本发明一实施例中,先确定待进行热应力热变形预测分析的卫星区域,然后确定多个不同的包括待分析的卫星区域的温度场和其对应的热应力及热变形的训练样本,获取训练样本集合。

具体地,本发明一实施例中,采用以下方式获取训练样本集合:

确定待分析的卫星区域的温度场,根据卫星区域的温度场所满足的热弹性方程和热平衡方程,利用有限元分析方法计算当前温度场对应的热应力及热变形,得到一个包括待分析的卫星区域的温度场和其对应的热应力及热变形的训练样本;

重复进行训练样本的获取过程直至得到预设数量的训练样本,获取训练样本集合。

本发明一实施例中,训练样本的数量根据实际需求进行确定,例如可以为10000个。通常而言,训练样本越多,训练后的多任务学习神经网络模型的预测精度越高。

本发明一实施例中,卫星区域的温度场所满足的热弹性方程表示为:

卫星区域的温度场所满足的热平衡方程表示为:

其中,(x,y)表示卫星区域内某一点的位置坐标,T表示卫星区域的温度场,σ

其中,卫星区域的二维坐标系可以根据实际情况自行设置。

步骤S2,根据热应力及热变形所包含的物理分量,构建多任务学习神经网络模型,多任务学习神经网络模型包括多个子任务解码输出层,每个子任务解码输出层对应一种物理分量。

本发明一实施例中,多任务学习神经网络模型采用UNet网络作为基础结构,包括:

共享编码层,共享编码层包括M个下采样层,用于通过池化和卷积操作提取输入图像的多尺度特征,M为预设数值,M的具体数值根据实际情况自行设置;

多个子任务解码输出层,多个子任务解码输出层分别与共享编码层连接,子任务解码输出层包括与M个下采样层一一对应的M个上采样层、M-1个AG网络层和网络预测层,第1个上采样的输入与第M个下采样层的输出连接,第m个AG网络层的输入与第M-m个下采样层的输出和第m个上采样层的输出连接,第M个上采样层的输出与网络预测层的输入连接,上采样层用于将输入的特征与其对应的下采样层中相同尺度的特征进行跳跃拼接并输出,AG网络层用于通过注意力机制门操作(Attention Gate)从输入的特征中筛选出与当前任务具有相关性的特征并输出,网络预测层用于使用1x1卷积将每个物理分量的特征向量映射到其所对应的类。

参考图2,附图2示出了一种具有3个子任务解码输出层的多任务学习神经网络模型的结构,该多任务学习神经网络模型中的共享编码层包括3个下采样层,每个子任务解码输出层包括3个上采样层、2个AG网络层和1个网络预测层,其中,网络预测层未示出。

具体地,针对上述具体设定的热应力及热变形所包含的物理分量,则所构建的多任务学习神经网络模型可以包括5个子任务解码输出层,5个子任务解码输出层的输出分别为σ

本发明一实施例中,多任务学习神经网络模型的共享编码层是一个经典的下采样过程,为特征提取部分,其类似于编码过程,通过池化和卷积操作提取输入的温度场图像的多尺度特征。子任务解码输出层则是一个与下采样过程相对应的上采样过程,其类似于解码过程,通过反卷积操作层层还原图像大小,将具有相同尺度的特征图通过跳跃连接并用于后续处理。同时,在高低层特征拼接时,通过注意力机制门操作进行特征选择,以针对不同任务,从共享编码层中提取出与该任务高度相关的共享特征。

本发明一实施例中,所构建的多任务学习神经网络模型能够实现多个任务共享一个模型,所需占用的系统内存量较少,且多个任务可以通过一次前向计算得出结果,有效地增加了推理速度;同时,通过将高低层特征进行“有目的”的结合,以将多任务特征参数进行深度共享,使相关任务相互补充,能够从训练样本中充分提取信息,减少模型训练时间和存储空间,减少模型过拟合现象,提升模型预测效果。

进一步地,假设:需要进行K个任务的学习训练,第m个下采样层表示为f

则第k个任务对应的子任务解码输出层的输出可以表示为:

本发明一实施例中,AG网络层使用了注意力机制门操作,用于针对特定任务,从共享编码层中提取出与该任务具有高相关性的共享特征。该操作可以解释为通过扫描全局图像,对需要重点关注的目标区域进行聚焦,从而筛选出更多与目标具有高相关性的细节信息,对其他信息进行抑制,进而能够利用有限的注意力资源,从海量特征中快速筛选出高价值特征。

参考图3,当AG网络层的输入为第m个下采样层f

由于

其中,

步骤S3,构建能够平衡热应力及热变形中不同物理分量的损失差异的多任务学习损失函数。

本发明一实施例中,多任务学习神经网络模型的训练目标是最小化预测值与真实值之间的差异,使多任务学习神经网络模型能够拟合输入和输出之间的高维非线性映射关系。然而,对于多任务学习来说,由于不同物理分量之间具有不同的尺度和回归方向,这就涉及到多个回归任务的联合学习,而多个任务输出损失的差异往往会引起多个任务之间的竞争,即某个任务精度的提升会降低其他任务的精度。

为了解决该问题,本发明一实施例中,通过构建能够平衡热应力及热变形中不同物理分量的损失差异的多任务学习损失函数,来对多个任务训练速度以及精度进行平衡。

具体地,本发明一实施例中,能够平衡热应力及热变形中不同物理分量的损失差异的多任务学习损失函数的多任务学习损失函数为:

其中,Θ表示多任务学习神经网络模型的参数,K表示物理分量种类,σ

本发明一实施例中,通过利用上述构建的多任务学习损失函数进行模型的训练,能够给予“简单”任务赋予更高的权重,进而通过“简单”任务带动其他任务的学习,提高模型的训练速度和模型对于每个任务的预测精度。

进一步地,第k种物理分量对应的模型不确定性σ

其中,N表示训练样本数量,

第k种物理分量对应的输出数据损失L

其中,N表示训练样本数量,

步骤S4,利用训练样本集合和多任务学习损失函数训练多任务学习神经网络模型以拟合温度场与热应力及热变形的映射关系。

本发明一实施例中,利用训练样本集合和多任务学习损失函数训练多任务学习神经网络模型,包括:

将训练样本中的温度场作为输入,将训练样本中的热应力及热变形作为输出,通过最小化多任务学习损失函数训练多任务学习神经网络模型。

进一步地,本发明一实施例中,将训练样本中的温度场作为输入,将训练样本中的热应力及热变形作为输出,通过最小化多任务学习损失函数训练多任务学习神经网络模型,包括以下步骤S401-S403:

步骤S401,将多个训练样本中的温度场依次输入多任务学习神经网络模型,得到多任务学习神经网络模型输出的对应于热应力及热变形中各种物理分量的预测物理分量。

本发明一实施例中,将训练样本中的卫星区域的温度场从多任务学习神经网络模型的输入端输入,依次经过多任务学习神经网络模型中各层的参数的处理,并从多任务学习神经网络模型中的多个子任务解码输出层的输出端输出,各个子任务解码输出层输出的信息即为对应于热应力及热变形中各种物理分量的预测物理分量。

步骤S402,将多任务学习神经网络模型输出的预测物理分量与训练样本中热应力及热变形的物理分量进行比较,计算多任务学习神经网络模型的预测准确率。

本发明一实施例中,针对每个物理分量,分别计算不同预测物理分量与训练样本中其对应的物理分量的差值和训练样本中其对应的物理分量的比值,将所有训练样本对应的比值的平均值作为当前物理分量的预测准确率。

步骤S403,判断预测准确率是否大于预设准确率阈值,若是,则将当前的多任务学习神经网络模型作为完成训练的多任务学习神经网络模型,若否,则利用多任务学习损失函数调整多任务学习神经网络模型的参数,并返回步骤S401。

本发明一实施例中,可以针对每个物理分量分别设定一个准确率阈值,若连续的至少两次得到的任意一个物理分量的预测准确率均大于该物理分量对应的预设准确率阈值,则将当前的多任务学习神经网络模型作为完成训练的多任务学习神经网络模型,结束多任务学习神经网络模型的训练;否则,则利用多任务学习损失函数调整更新多任务学习神经网络模型的参数,基于调整更新后的多任务学习神经网络模型继续进行多任务学习神经网络模型的训练。

进一步地,本发明一实施例中,可以采用以下公式对多任务学习神经网络模型的参数进行更新:

其中,Θ

进一步地,本发明一实施例中,该步骤S4还包括:

在利用训练样本集合训练多任务学习神经网络模型之前,分别对训练样本中的温度场、热应力和热变形进行归一化处理。

具体地,将温度场数值归一化至[0,1],将热应力数值归一化至[0,1],将热变形数值归一化至[0,1]。

由于多任务学习神经网络模型的输出涉及热应力和热变形,属于多任务学习,若训练样本中的温度场、热应力和热变形不处于同一个数量级,则在进行训练时可能难以进行平衡。通过将温度场、热应力和热变形数据归一化至[0,1],能够进一步调节多个回归任务的训练速度以及训练精度,克服多任务同时训练时存在的“跷跷板”现象。

步骤S5,利用训练后的多任务学习神经网络模型进行热应力及热变形预测。

具体地,当需要进行卫星区域的热应力及热变形预测时,将卫星区域的温度场输入训练好的多任务学习神经网络模型,即可得到多任务学习神经网络模型输出的对应的热应力及热变形。

本发明一实施例提供的基于多任务学习的卫星热应力热变形快速预测方法能够实现热应力及热变形多个任务的同时训练和预测,减少训练时间以及系统内存需求,降低预测分析成本;并且,能够平衡热应力及热变形多个任务的训练速度以及训练精度,显著提高训练后的模型的预测精度。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。

最后应说明的是:以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 一种基于多任务人工神经网络的刑期预测方法
  • 一种基于多任务学习及深度学习模型的水质预测方法
  • 一种基于深度学习网络与多任务学习策略的风电机组振荡模态预测方法及装置
技术分类

06120116338600