掌桥专利:专业的专利平台
掌桥专利
首页

电离层TEC预测方法及装置和计算机设备

文献发布时间:2023-06-19 19:30:30


电离层TEC预测方法及装置和计算机设备

技术领域

本申请涉及电离层技术领域,特别是涉及一种电离层TEC预测方法及装置和计算机设备。

背景技术

电离层是地球近地空间环境的重要组成部分,对其时空变化规律及物理机制的研究具有十分重要的意义。电离层总电子含量(Total Electric Contents,TEC)是表征电离层状态的重要物理参数之一,对其进行准确的建模及预测有助于在科学研究和工程活动中进一步认识电离层,从而更好地避免电离层危害以及利用电离层价值。

近年来计算机技术快速发展,由于神经网络能够很好地学习复杂的非线性关系,利用深度学习对电离层TEC进行建模与预测受到了越来越多学者的青睐。长短期记忆网络(Long Short-Term Memory,LSTM)是常见的一种循环神经网络,其不仅克服了人工神经网络无法将上一时刻状态作为下一时刻输入的缺点,还解决了传统循环神经网络梯度爆炸以及由梯度消失引起的长期依赖问题,这使得LSTM能够具有长期“记忆”。然而现有基于LSTM进行电离层TEC预测的技术,尚不能适用于步长可变的情形。

发明内容

基于此,有必要针对上述技术问题,提供一种能够适用于步长可变的情形的电离层TEC预测方法及装置和计算机设备。

第一方面,本申请提供了一种电离层TEC预测方法。电离层TEC预测方法包括:

获取电离层数据集;

将电离层数据集划分为多个数据子集,多个数据子集分别为训练数据集、验证数据集和测试数据集,且分别对各数据子集进行标准化与归一化;

根据数据特性和实际需求确定步长,步长包括输入序列步长、输出序列步长和输入输出滞后步长;

根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型;

根据所需预测时段的长度,确定预测窗口大小;

根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC。

在其中一个实施例中,电离层数据集包括电离层TEC和特征变量数据;获取电离层数据集,包括:

获取预设区域的预设时段的电离层GIM数据和特征变量数据;

从电离层GIM数据中提取电离层TEC。

在其中一个实施例中,各数据子集分别包括电离层TEC和特征变量数据;分别对各数据子集进行标准化与归一化,包括:

对训练数据集的电离层TEC进行标准化,且对训练数据集的特征变量数据进行归一化;

根据对训练数据集进行标准化的参数分别对验证数据集和测试数据集对应的电离层TEC进行标准化;

根据对训练数据集进行归一化的参数分别对验证数据集和测试数据集对应的特征变量数据进行归一化。

在其中一个实施例中,根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型,包括:

以输入序列步长、输出序列步长和输入输出滞后步长为依据分别划分标准化与归一化后的各数据子集,以分别生成各数据子集对应的输入样本序列和输出样本序列;

根据多个输入样本序列和多个输出样本序列生成电离层TEC预测模型。

在其中一个实施例中,根据多个输入样本序列和多个输出样本序列生成电离层TEC预测模型,包括:

确定LSTM模型和模型超参数;

将训练数据集的输入样本序列和输出样本序列放入LSTM模型中训练直至LSTM模型收敛;

根据验证数据集的输入样本序列和输出样本序列对LSTM模型进行验证,并根据验证结果调整LSTM模型的模型超参数以生成电离层TEC预测模型。

在其中一个实施例中,根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC,包括:

利用电离层TEC预测模型对预测窗口大小的电离层TEC进行滑动预测,以得到初步预测值;

利用对训练数据集进行标准化的参数对初步预测值进行反标准化,以得到所需预测时段的电离层TEC的最终预测值。

在其中一个实施例中,根据以下公式进行反标准化:

式中,σ和μ分别为参数的标准差和平均值,

在其中一个实施例中,电离层TEC预测方法还包括:

将电离层TEC的最终预测值与电离层TEC模型产品进行对比,并利用评价指标对电离层TEC预测模型的预测精度进行评估。

第二方面,本申请还提供了一种电离层TEC预测装置,电离层TEC预测装置包括:

数据集获取模块,用于获取电离层数据集;

数据集划分模块,用于将电离层数据集划分为多个数据子集,多个数据子集分别为训练数据集、验证数据集和测试数据集,且分别对各数据子集进行标准化与归一化;

步长确定模块,用于根据数据特性和实际需求确定步长,步长包括输入序列步长、输出序列步长和输入输出滞后步长;

模型生成模块,用于根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型;

窗口确定模块,用于根据所需预测时段的长度,确定预测窗口大小;

数据预测模块,用于根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC。

第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法的步骤。

上述电离层TEC预测方法及装置和计算机设备,通过获取电离层数据集,并将电离层数据集划分为多个数据子集,且分别对各数据子集进行标准化与归一化。进而,根据数据特性和实际需求确定步长,再基于步长和标准化与归一化后的各数据子集生成电离层TEC预测模型。进一步地,根据所需预测时段的长度,确定预测窗口大小,再基于预测窗口大小和所构建的电离层TEC预测模型滑动预测所需预测时段的电离层TEC。采用上述电离层TEC预测方法,可实时根据实际需求调整不同的步长,进而生成对应的电离层TEC预测模型以对所需预测时段的电离层TEC进行预测,能够实现适用于步长发生变化的情形,且可实时根据所需预测时段的长度调整预测窗口的大小,亦能实现对不同长度的预测时段的电离层TEC进行预测。

附图说明

图1为一个实施例中电离层TEC预测方法的流程示意图;

图2为一个实施例中获取电离层数据集的流程示意图;

图3为一个实施例中分别对各数据子集进行标准化与归一化的流程示意图;

图4为一个实施例中LSTM网络结构示意图;

图5为一个实施例中根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型的流程示意图;

图6为一个实施例中根据多个输入样本序列和多个输出样本序列生成电离层TEC预测模型的流程示意图;

图7为一个实施例中根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC的流程示意图;

图8为一个实施例中电离层TEC预测装置的结构框图;

图9为一个实施例中计算机设备的内部结构图。

附图标号说明:

电离层TEC预测装置:10;数据集获取模块:11;数据集划分模块:12;步长确定模块:13;模型生成模块:14;窗口确定模块:15;数据预测模块:16。

具体实施方式

为了便于理解本申请实施例,下面将参照相关附图对本申请实施例进行更全面的描述。附图中给出了本申请实施例的首选实施例。但是,本申请实施例可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本申请实施例的公开内容更加透彻全面。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请实施例的技术领域的技术人员通常理解的含义相同。本文中在本申请实施例的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请实施例。

可以理解的是,术语“包括/包含”指定所陈述的特征、整体、步骤、操作、组件、部分或它们的组合的存在,但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、组件、部分或它们的组合的可能性。

实施例一

如图1所示,本申请实施例提供了一种电离层TEC预测方法,应用于LSTM。电离层TEC预测方法包括以下步骤110至步骤160。

步骤110,获取电离层数据集。

如图2所示,在其中一个实施例中,电离层数据集包括电离层TEC和特征变量数据;获取电离层数据集,包括以下步骤210至步骤220。

步骤210,获取预设区域的预设时段的电离层GIM数据和特征变量数据。其中,特征变量数据包括但不限于地磁活动指数、太阳活动指数。在本实施例中,因模型训练需要输入大量数据,因此需要获取所需预测时段往前数月甚至数年的数据以供模型进行学习训练。且考虑到地磁变化和太阳活动对电离层的影响,还需要获取诸如地磁Dst指数和太阳活动指数F10.7等的地磁活动指数和太阳活动指数。

步骤220,从电离层GIM数据中提取电离层TEC。在本实施例中,电离层TEC可选用欧洲定轨中心(Center for Orbit Determination in Europe,CODE)提供的GIM模型电离层产品,从中提取所需区域或全球范围内格网点在研究时间范围的电离层TEC,其数据时间分辨率为1小时。需要说明的是,特征变量数据的时间分辨率、时空范围需与电离层TEC的保持一致。若特征变量数据的时间分辨率高于或低于电离层TEC的时间分辨率,可通过间隔取用或插值的方法使特征变量数据的时间分辨率与电离层TEC的保持一致。

获取特征变量数据和电离层TEC后,将所有数据拼接即构成电离层数据集。

步骤120,将电离层数据集划分为多个数据子集,多个数据子集分别为训练数据集、验证数据集和测试数据集,且分别对各数据子集进行标准化与归一化。

在本实施例中,根据训练需求,将电离层数据集按一定比例划分为训练数据集、验证数据集和测试数据集三个数据子集。需要说明的是,模型训练需要大量数据,因此在划分电离层数据集时要保证训练数据集足量,以供模型进行训练。

如图3所示,在其中一个实施例中,各数据子集分别包括电离层TEC和特征变量数据;分别对各数据子集进行标准化与归一化,包括以下步骤310至步骤330。

步骤310,对训练数据集的电离层TEC进行标准化,且对训练数据集的特征变量数据进行归一化。在本实施例中,由于特征变量数据相对来说更为稳定,因此对训练数据集的电离层TEC进行标准化,对特征变量采用归一化。

步骤320,根据对训练数据集进行标准化的参数分别对验证数据集和测试数据集对应的电离层TEC进行标准化。

步骤330,根据对训练数据集进行归一化的参数分别对验证数据集和测试数据集对应的特征变量数据进行归一化。

在本实施例中,保留对训练数据集进行标准化的参数:平均值μ和标准差σ,以及进行归一化的参数:最小值min和最大值max。利用平均值μ和标准差σ对验证数据集和测试数据集对应的电离层TEC进行标准化,利用最小值min和最大值max对验证数据集和测试数据集对应的特征变量进行归一化。需要说明的是,验证数据集和测试数据集是不具有先验分布的未知数据,因此需使用训练数据集的标准化及归一化参数进行预处理,预处理过程简单,无需计算多余系数或参数,且此处理方式能使对各数据子集进行标准化和归一化的过程更加科学。

步骤130,根据数据特性和实际需求确定步长,步长包括输入序列步长、输出序列步长和输入输出滞后步长。

在本实施例中,按照输入和输出值所包含时间步的多少,可将LSTM模型分为one-to-one模型、many-to-one模型(如影评情感分类)、one-to-many模型(如生成音乐、为图片配标题)、many-to-many模型(如机器翻译)。按照输入变量的多少以及输出时间步的多少可将序列预测问题分为单变量单步预测、单变量多步预测、多变量单步预测、多变量多步预测。

尽管本实施例的输出可以是单时间步输出,也可以是多时间步输出,但是由于采用的是序列输出策略,即模型是一次性将多时间步进行输出,而非分段输出,所以本实施例所构建的LSTM模型仍然属于多变量/单变量many-to-one模型,此LSTM模型的网络模型结构如图4所示。其中,X1-Xn表示输入的n个变量,X(1)-X(t

根据数据特性及实际需求,确定输入序列步长t

步骤140,根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型。

如图5所示,在其中一个实施例中,根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型,包括以下步骤510至步骤520。

步骤510,以输入序列步长、输出序列步长和输入输出滞后步长为依据分别划分标准化与归一化后的各数据子集,以分别生成各数据子集对应的输入样本序列和输出样本序列。

在本实施例中,与前述实施例构造一个输入样本序列及其输出样本序列的方法步骤同理,以输入序列步长、输出序列步长和输入输出滞后步长为依据分别划分标准化与归一化后的训练数据集、验证数据集和测试数据集,即分别依次向后滑动以分别构造出训练数据集、验证数据集和测试数据集对应的输入样本序列和输出样本序列。

步骤520,根据多个输入样本序列和多个输出样本序列生成电离层TEC预测模型。

如图6所示,在其中一个实施例中,根据多个输入样本序列和多个输出样本序列生成电离层TEC预测模型,包括以下步骤610至步骤630。

步骤610,确定LSTM模型和模型超参数。

在本实施例中,所确定的LSTM模型有1个输入层、1个LSTM层、1个全连接层、1个回归输出层共四层。所采用的激活函数为sigmoid,损失函数为未由响应数目R进行归一化的半均方误差,即:

式中,t

由于超参数用于控制算法行为,其不能通过算法自身学习得到,需要人为设置。在本实施例中,为使结果最优,经过不断调试,确定的模型超参数和参数以及其最终取值如表1所示。

表1模型超参数和参数列表

需要说明的是,本实施例中所确定的LSTM模型和模型超参数均可根据实际需求进行更改。

步骤620,将训练数据集的输入样本序列和输出样本序列放入LSTM模型中训练直至LSTM模型收敛。在本实施例中,LSTM模型结构简单,收敛速度快;输入参数多源且可调。

步骤630,根据验证数据集的输入样本序列和输出样本序列对LSTM模型进行验证,并根据验证结果调整LSTM模型的模型超参数以生成电离层TEC预测模型。在本实施例中,将验证数据集的输入样本序列和输出样本序列放入LSTM模型验证,并不断调整模型超参数直至使LSTM模型在验证数据集上预测效果最优。使得预测效果最优所对应的模型超参数所构成的LSTM模型,即为电离层TEC预测模型。可以理解的是,根据实际需求所确定的步长影响输入样本序列和输出样本序列的构成,进而影响着模型超参数的调整,进而影响着电离层TEC预测模型的构建。

步骤150,根据所需预测时段的长度,确定预测窗口大小。其中,预测窗口大小决定最终预测图像横坐标的时间长短。

步骤160,根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC。

如图7所示,在其中一个实施例中,根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC,包括以下步骤710至步骤720。

步骤710,利用电离层TEC预测模型对预测窗口大小的电离层TEC进行滑动预测,以得到初步预测值。具体地,将预测窗口大小对应的所需预测时段的输入样本序列放入构建好的电离层TEC预测模型中,使模型输出响应。

步骤720,利用对训练数据集进行标准化的参数对初步预测值进行反标准化,以得到所需预测时段的电离层TEC的最终预测值。

在其中一个实施例中,根据以下公式进行反标准化:

式中,σ和μ分别为参数的标准差和平均值,

在其中一个实施例中,电离层TEC预测方法还包括:将电离层TEC的最终预测值与电离层TEC模型产品进行对比,并利用评价指标对电离层TEC预测模型的预测精度进行评估。

在本实施例中,可以根据需求采用相关系数(Correlation Coefficient,R

式中,

在本实施例中,通过获取电离层数据集,并将电离层数据集划分为多个数据子集,且分别对各数据子集进行标准化与归一化。进而,根据数据特性和实际需求确定步长,再基于步长和标准化与归一化后的各数据子集生成电离层TEC预测模型。进一步地,根据所需预测时段的长度,确定预测窗口大小,再基于预测窗口大小和所构建的电离层TEC预测模型滑动预测所需预测时段的电离层TEC。采用上述电离层TEC预测方法,可实时根据实际需求调整不同的步长,进而生成对应的电离层TEC预测模型以对所需预测时段的电离层TEC进行预测,能够实现适用于步长发生变化的情形,且可实时根据所需预测时段的长度调整预测窗口的大小,亦能实现对不同长度的预测时段的电离层TEC进行预测。

应该理解的是,虽然如上所述的各实施例所涉及的流程图图1-图5和图7中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图图1-图5和图7中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

实施例二

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电离层TEC预测方法的电离层TEC预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电离层TEC预测装置实施例中的具体限定可以参见上文中对于电离层TEC预测方法的限定,在此不再赘述。

如图8所示,本申请实施例还提供了一种电离层TEC预测装置,电离层TEC预测装置10包括数据集获取模块11、数据集划分模块12、步长确定模块13、模型生成模块14、窗口确定模块15和数据预测模块16。数据集获取模块11,用于获取电离层数据集;数据集划分模块12,用于将电离层数据集划分为多个数据子集,多个数据子集分别为训练数据集、验证数据集和测试数据集,且分别对各数据子集进行标准化与归一化;步长确定模块13,用于根据数据特性和实际需求确定步长;模型生成模块14,用于根据步长和标准化与归一化后的各数据子集生成电离层TEC预测模型;窗口确定模块15,用于根据所需预测时段的长度,确定预测窗口大小;数据预测模块16,用于根据预测窗口大小和电离层TEC预测模型滑动预测所需预测时段的电离层TEC。

在其中一个实施例中,电离层数据集包括电离层TEC和特征变量数据;上述数据集获取模块11包括数据获取单元和数据提取单元。数据获取单元,用于获取预设区域的预设时段的电离层GIM数据和特征变量数据;数据提取单元,用于从电离层GIM数据中提取电离层TEC。

在其中一个实施例中,各数据子集分别包括电离层TEC和特征变量数据;上述数据集划分模块12包括第一数据处理单元、第二数据处理单元和第三数据处理单元。第一数据处理单元,用于对训练数据集的电离层TEC进行标准化,且对训练数据集的特征变量数据进行归一化;第二数据处理单元,用于根据对训练数据集进行标准化的参数分别对验证数据集和测试数据集对应的电离层TEC进行标准化;第三数据处理单元,用于根据对训练数据集进行归一化的参数分别对验证数据集和测试数据集对应的特征变量数据进行归一化。

在其中一个实施例中,步长包括输入序列步长、输出序列步长和输入输出滞后步长;上述模型生成模块14包括样本序列生成单元和预测模型生成单元。样本序列生成单元,用于以输入序列步长、输出序列步长和输入输出滞后步长为依据分别划分标准化与归一化后的各数据子集,以分别生成各数据子集对应的输入样本序列和输出样本序列;预测模型生成单元,用于根据多个输入样本序列和多个输出样本序列生成电离层TEC预测模型。

在其中一个实施例中,上述预测模型生成单元还用于构建LSTM模型和模型超参数;将训练数据集的输入样本序列和输出样本序列放入LSTM模型中训练直至LSTM模型收敛;根据验证数据集的输入样本序列和输出样本序列对LSTM模型进行验证,并根据验证结果调整LSTM模型的模型超参数以生成电离层TEC预测模型。

在其中一个实施例中,上述数据预测模块16包括初步预测单元和最终预测单元。初步预测单元,用于利用电离层TEC预测模型对预测窗口大小的电离层TEC进行滑动预测,以得到初步预测值;最终预测单元,用于利用对训练数据集进行标准化的参数对初步预测值进行反标准化,以得到所需预测时段的电离层TEC的最终预测值。

在其中一个实施例中,上述电离层TEC预测装置10还包括精度评估模块,用于将电离层TEC的最终预测值与电离层TEC模型产品进行对比,并利用评价指标对电离层TEC预测模型的预测精度进行评估。

上述电离层TEC预测装置10中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

实施例三

如图9所示,本申请实施例还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述电离层TEC预测方法的步骤。

本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

实施例四

本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述电离层TEC预测方法的步骤。

实施例五

本申请实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述电离层TEC预测方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 客户稳定性的预测方法、装置、计算机设备和存储介质
  • 软件可靠性预测方法、装置、计算机设备和存储介质
  • 短时交通流变化预测方法、装置、计算机设备及存储介质
  • 房屋价值预测方法、装置、计算机设备和存储介质
  • 基于预测模型的健康管理方法、装置和计算机设备
  • 电离层TEC的预测方法、装置、设备及存储介质
  • 电离层电子含量预测模型的训练方法、装置和计算机设备
技术分类

06120115933859