一种基于多基地局部投影特征的雷暴预测方法

文献发布时间：2024-04-18 19:59:31

技术领域

本发明属于气象雷电防御领域。

背景技术

雷暴气候是发生在中小尺度对流体统中的常见天气现象，雷暴天气往往伴随着闪电的活动，可引起森林和油库火灾、造成供电及通讯信息系统故障或损坏，对航天航空、矿山及一些重要而敏感的高技术装备等具有重大威胁。八十年代以后，闪电引起的危害显著增加，特别是与高新技术关系密切的领域，如航空航天、国防、通讯、电力、计算机、电子工业等由于广泛应用对闪电电磁干扰极为敏感的大规模及超大规模集成电路致使遭雷击的几率大大增加。所以对雷暴的预测预警显得尤为重要。

由于业务数值预报模式时空扩展性小以及水平和垂直分辨率较低，雷暴的预警预报成为天气预报中较困难的工作之一。雷暴预报所参考的气象信息数据量较大，依靠预报员主观提取特征量并设置阈值，难以完全发现数据中有价值的细节信息或者细微差别。如果预报员对于强对流发生发展规律认识不够深刻、全面，也会忽视其中的有效信息统，这种传统的方式通常会造成虚警率偏高《The defi-nition of GOES infrared lightninginitiation interest fields》(《Appl Meteor》(2010))。

随着技术的发展，机器学习逐渐运用到雷暴预测中，比如文献《算法的雷电流概率预测研究》(《国外电子测量技术》(2018))，文献《基于多机器学习竞争策略的短时雷电预报》(《计算机应用》(2016))，但机器学习本质在于提取多源数据的特征量及其相互的联系，对数据质量的依赖度较高，若仅仅依靠单站观测站数据进行数据训练则可能提高不了雷暴预报的精度。此外深度训练学习涉及到大量的运算，对显卡或云计算资源的要求较为苛刻，所以需要开发一种新的雷暴预测算法。

发明内容

发明目的：为了解决上述现有技术存在的问题，本发明提供了一种基于多基地局部投影特征的雷暴预测方法。

技术方案：本发明提供了一种基于多基地局部投影特征的雷暴预测方法，具体包括如下方法：

步骤1：采集每个采集站的每个系统垂直层的雷电数据集；

步骤2：每个系统垂直层的雷电数据集作为一个特征节点，该数据集中的数据值作为节点的特征值；

步骤3：基于k近邻算法对所有特征节点构图，将构建的图作为原始空间X,在黎曼空间中对该高维特征的原始空间进行映射，将原始空间映射到低维流形空间Y中，并构建将原始空间X的数据映射到空间Y中的代价函数，求解该代价函数得到多基地高维局部投影矩阵W，基于该多基地高维局部投影矩阵将原始空间X的数据投影到空间Y中，将空间Y中的数据作为新样本数据集；

步骤4：将新样本数据集作为ChOA-ELM算法的输入，得到ELM神经元数目的最优解；从而预测各个基地的雷暴。

进一步的，所述步骤1中将采集站垂直层分成21层，具体为：按照系统垂直层从100hPa开始，每隔50hPa划分一层。

进一步的，所述步骤3中采用线性化逼近的方法将原始空间X的数据投影到空间Y中，则代价函数为：

s.t.tr(W

其中，T表示矩阵转置，L表示拉普拉斯映射矩阵L＝D-S,D＝diag{D

其中，s

进一步的，空间Y的表达式为：Y＝W

有益效果：

1、相较于传统的单站雷暴预测方法，本发明通过分布式的信息采集可以获得更多能够表征雷电信号的有效信息。

2、局部保持投影能够有效的分离高维特征的有效特征空间与无效特征空间，降低雷暴预测所需的特征维度与特征冗余性，增强特征的有效性。

3、ChOA-ELM雷暴预测方法通过苍鹰捕猎方式(不是黑猩猩么)优化ELM神经元数目，增强了ELM对雷暴预测的能力；并降低了过多神经元数目带来的巨大运算矩阵，与或少神经元数目带来的欠拟合问题，保证了多基地雷暴预测系统的预测精度。

附图说明

图1为本发明流程图。

具体实施方式

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

如图1所示，本实施例提供了一种基于多基地局部投影特征的雷暴预测方法，具体包括如下步骤：

步骤一，分布式雷电信号的获取。

采集每个采集站的每个系统垂直层的雷电数据集。

具体为本实施例采集每个采集站的21层的雷电数据集，其中21层为：按照系统垂直层从100hPa开始，每隔50hPa划分一层。水平格局5km×5km。雷电数据集包括17个变量，17个变量主要包括：温度、风、云量、云分类、可降水量、云含水量、相对湿度等因数。

步骤二，多基地高维特征的构建与局部保持投影。

提取多基地信号采集系统、不同系统垂直层、不同时间的气象信息(也即雷电数据集)构成高维特征集；将一个雷电数据集作为一个特征节点，则共有n个节点，一个雷电数据集中的数据值作为节点的特征值。基于k近邻算法对n个节点构图，取每个点的最近k个点作为邻居节点与之相连。若原始点x

其中，x

设原始高维空间为X，映射后的低维流形空间为Y，即x

代价函数理解：若原始空间内x

其中，S＝[s

原优化问题可重新表示为：

s.t.tr(YDY

原始优化问题有多个解。由于是线性映射，若同比例缩小低维样本y

借助广义瑞利商求解优化问题。广义瑞利商：

因此求得，

根据以上推导，可以通过D

所以优化问题变为：

s.t.tr(W

步骤三，基于NGO优化的ELM的构建。

在ChOA中，初始化黑猩猩种群位置更新公式为：

式中，X

在狩猎过程中，黑猩猩个体各司其职，根据猎物的位置相应改变自身的位置，其位置更新公式为：

上式中，X

a＝2·f·r

其中，f是收敛因子，随迭代次数从2.5非线性减少到0，r

d为黑猩猩与猎物之间的距离，如下式所示：

d＝|c·X

其中，c表示在狩猎过程中障碍物对黑猩猩捕猎的影响因子，其计算公式如下式所示：

c＝2·r

其中，r

m是混沌映射矢量，具有一定的遍历性和有序性；其计算公式为：

m＝Chaotic.value

黑猩猩群体搜索猎物数学模型为：

其中，X(t+1)为黑猩猩个体更新后的位置向量，X

其中，X

其中，c

设置隐藏层神经元数目为L，激活函数为g(·)，ELM的数学描述可以表示为：

其中，j＝1,2,…,N，N为样本数，ω

以零误差逼近N个样本(X

上式可简写为

Hβ＝T

其中H为隐藏层的输出矩阵，β为输出权重矩阵，T为期望输出矩阵。则输出权重β＝H

ChOA-ELM的具体流程为：

1设置迭代次数T与种群数目N，维度dim；

2初始化参数f、a、c、m，ELM神经元数目L、输入权重ω初始化；

3输入特征集Y，初始化黑猩猩种群；

4计算每个黑猩猩个体的饥饿值；

5选取饥饿值最小的四个个体，并确定领导者位置；

6更新参数a、c、m、黑猩猩种群位置、领导者位置与所有黑猩猩个体；

7输出ChOA对ELM神经元数目的最优解。

8对多基地雷暴预测问题建模。

本发明相较于传统方法，在特征提取、特征工程与预测方法等方面都有了新的改进与创新，能够提高雷暴预测的精度与鲁棒性。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：南通大学;中国科学院大气物理研究所;

上一篇：一种高度有序介孔生物活性玻璃纳米颗粒及其制备与应用
下一篇：吹奏乐器的可折弯吹嘴结构