掌桥专利:专业的专利平台
掌桥专利
首页

结合机器学习与三维变分同化的二维风场反演方法和装置

文献发布时间:2023-06-19 12:13:22


结合机器学习与三维变分同化的二维风场反演方法和装置

技术领域

本申请涉及遥感技术领域,特别是涉及一种结合机器学习与三维变分同化的二维风场反演方法和装置。

背景技术

三维变分同化法是常用的风场反演方法,其根据观测数据和理论动力模式建立代价函数,通过计算代价函数的极小值反演得到风场。

雷达和测风仪是常用的风场观测设备,雷达遥感获取扫描区域内多个探测点的风速在雷达径向上的投影速度(径向风速),测风仪可以获取所在位置处的横、纵向风速。但是由于雷达和测风仪的观测数据具有空间分布不均匀、与分析网格点不匹配的特点,现有的基于雷达和测风仪的同化方法均需将雷达和测风仪的探测数据插值到统一网格上。采用较多的插值方法有:双线性插值方法、Barnes(巴尼斯)插值方法、先锥面后垂直内插的方法等。其中Barnes插值方法是一种指数加权平均算法,具有易于实现、误差较小且光滑性较好的优点而被广泛采用,但其插值结果与影响半径的选择有较大关系,且会引入一定的插值误差,影响风场反演结果的准确性。同时,三维变分同化法在迭代求解过程中,不断将分析网格的迭代值插值到测风仪处与探测数据比对,具有较大的计算开销。

发明内容

基于此,有必要针对上述技术问题,提供一种结合机器学习与三维变分同化的二维风场反演方法和装置。该方法利用雷达和测风仪探测数据,结合机器学习和三维变分同化法较快速、准确地实现二维风场的反演。

一种结合机器学习与三维变分同化的二维风场反演方法,所述方法包括:

通过雷达和若干个测风仪对待测风场区域进行探测,获取待测风场探测数据;所述待测风场探测数据包括:雷达探测的径向风速探测值以及测风仪探测的横向风速探测值和纵向风速探测值。

将所述待测风场区域划分为均匀的分析网格,并建立xoy坐标系;所述xoy坐标系是在待测风场区域中心设置一台雷达,以雷达位置为中心o,横向为x轴,纵向为y轴建立的。

根据所述径向风速探测值,采用有监督学习方式将所述径向风速探测值插值到所述分析网格上,得到分析网格上的径向风速观测值。

根据分析网格上的所述径向风速观测值,采用半监督学习方式将测风仪探测的所述横向风速探测值和所述纵向风速探测值插值到所述分析网格上,得到分析网格上的横向风速观测值和纵向风速观测值。

根据分析网格上的所述径向风速观测值、所述横向风速观测值以及所述纵向风速观测值,采用三维变分同化法构建代价函数;通过优化求解所述代价函数得到分析网格上二维风场的反演结果。

在其中一个实施例中,通过雷达和若干个测风仪对待测风场区域进行探测,获取待测风场探测数据,包括:

在待测风场区域中心设置一台雷达,通过所述雷达对所述待测风场区域进行平面显示器扫描,扫描方向为顺时针方向,得到径向风速探测值。

在所述待测风场区域布置若干个测风仪,通过所述测风仪探测得到所述测风仪所在位置处的横向风速探测值和纵向风速探测值。

在其中一个实施例中,根据所述径向风速探测值,采用有监督学习方式将所述径向风速探测值插值到所述分析网格上,得到分析网格上的径向风速观测值,包括:

将雷达探测点的位置作为雷达有标记数据的特征。

将所述径向风速探测值作为雷达有标记数据的值。

将分析网格点的位置作为雷达未标记数据的特征。

根据所述雷达有标记数据的特征、所述雷达有标记数据的值以及所述雷达未标记数据的特征构建雷达有标记数据集和雷达未标记数据集;所述雷达有标记数据集和所述雷达未标记数据集的构建公式如下:

其中,

采用最近邻算法学习所述雷达有标记数据集,并按照与距离成反比的权重加权得到雷达未标记数据集的值;所述雷达未标记数据集的值为分析网格上的径向风速观测值。

在其中一个实施例中,根据分析网格上的所述径向风速观测值,采用半监督学习方式将测风仪探测的所述横向风速探测值和所述纵向风速探测值插值到所述分析网格上,得到分析网格上的横向风速观测值和纵向风速观测值,包括:

将测风仪的位置和所述测风仪探测的横向风速探测值和纵向风速探测值投影到雷达径向方向上的速度作为测风仪有标记数据的特征。

将测风仪在其所处位置探测得到的所述横向风速探测值和所述纵向风速探测值作为测风仪有标记数据的值。

将分析网格点的位置坐标和对应位置上的所述分析网格上的径向风速观测值作为测风仪未标记数据的特征。

根据所述测风仪有标记数据的特征、所述测风仪有标记数据的值、所述测风仪未标记数据的特征,构建测风仪有标记数据集和测风仪未标记数据集;所述测风仪有标记数据集和所述测风仪未标记数据集的构建公式如下:

其中,

采用半监督学习中的协同回归法学习所述测风仪有标记数据集,并结合所述测风仪未标记数据集的特征,建立两个不同参数的最近邻算法协同训练,得到测风仪未标记数据集的值;所述测风仪未标记数据集的值为分析网格上的横向风速观测值和纵向风速观测值。

一种结合机器学习与三维变分同化的二维风场反演装置,所述装置包括:

待测风场观测数据获取模块,用于通过雷达和若干个测风仪对待测风场区域进行探测,获取待测风场探测数据;所述待测风场探测数据包括:雷达探测的径向风速探测值以及测风仪探测的横向风速探测值和纵向风速探测值。

网格划分和建立坐标系模块,用于将所述待测风场区域划分为均匀的分析网格,并建立xoy坐标系;所述xoy坐标系是在待测风场区域中心设置一台雷达,以雷达位置为中心o,横向为x轴,纵向为y轴建立的。

雷达探测数据插值模块,用于根据所述径向风速探测值,采用有监督学习方式将所述径向风速探测值插值到所述分析网格上,得到分析网格上的径向风速观测值。

测风仪探测数据插值模块,用于根据分析网格上的所述径向风速观测值,采用半监督学习方式将测风仪探测的所述横向风速探测值和所述纵向风速探测值插值到所述分析网格上,得到分析网格上的横向风速观测值和纵向风速观测值。

二维风场的反演结果确定模块,用于根据分析网格上的所述径向风速观测值、所述横向风速观测值以及所述纵向风速观测值,采用三维变分同化法构建代价函数;通过优化求解所述代价函数得到分析网格上二维风场的反演结果。

在其中一个实施例中,待测风场观测数据获取模块,还用于在待测风场区域中心设置一台雷达,通过所述雷达对所述待测风场区域进行平面显示器扫描,扫描方向为顺时针方向,得到径向风速探测值;在所述待测风场区域布置若干个测风仪,通过所述测风仪探测得到所述测风仪所在位置处的横向风速探测值和纵向风速探测值。

在其中一个实施例中,雷达探测数据插值模块,还用于将雷达探测点的位置作为雷达有标记数据的特征;将所述径向风速探测值作为雷达有标记数据的值;将分析网格点的位置作为雷达未标记数据的特征;根据所述雷达有标记数据的特征、所述雷达有标记数据的值以及所述雷达未标记数据的特征构建雷达有标记数据集和雷达未标记数据集;所述雷达有标记数据集和所述雷达未标记数据集的构建公式如下:

其中,

采用最近邻算法学习所述雷达有标记数据集,并按照与距离成反比的权重加权得到雷达未标记数据集的值;所述雷达未标记数据集的值为分析网格上的径向风速观测值。

在其中一个实施例中,测风仪探测数据插值模块,还用于将测风仪的位置和所述测风仪探测的横向风速探测值和纵向风速探测值投影到雷达径向方向上的速度作为测风仪有标记数据的特征;将测风仪在其所处位置探测得到的所述横向风速探测值和所述纵向风速探测值作为测风仪有标记数据的值;将分析网格点的位置坐标和对应位置上的所述分析网格上的径向风速观测值作为测风仪未标记数据的特征;根据所述测风仪有标记数据的特征、所述测风仪有标记数据的值、所述测风仪未标记数据的特征,构建测风仪有标记数据集和测风仪未标记数据集;所述测风仪有标记数据集和所述测风仪未标记数据集的构建公式如下:

其中,

采用半监督学习中的协同回归法学习所述测风仪有标记数据集,并结合所述测风仪未标记数据集的特征,建立两个不同参数的最近邻算法协同训练,得到测风仪未标记数据集的值;所述测风仪未标记数据集的值为分析网格上的横向风速观测值和纵向风速观测值。

上述结合机器学习与三维变分同化的二维风场反演方法和装置,该方法通过将雷达和测风仪的探测数据插值到分析网格点上,然后利用三维变分同化方法建立代价函数,通过迭代优化求解得到风场反演结果。迭代过程中无需插值,减少了计算量;针对雷达探测数据较密集、测风仪探测数据较稀疏的特点,利用机器学习中成熟的有监督学习方式和半监督学习方式来对雷达数据和测风仪数据进行插值,可以得到较高的准确率,减小插值引入的误差。

附图说明

图1为一个实施例中结合机器学习与三维变分同化的二维风场反演方法的流程示意图;

图2为另一个实施例中雷达扫描和测风仪分布的场景图;

图3为另一个实施例中本发明的方法与传统方法在不同测风仪数量下反演误差的对比结果;

图4为另一个实施例中本发明的方法与传统方法在不同测风仪数量下计算耗时的对比结果;

图5为一个实施例中结合机器学习与三维变分同化的二维风场反演装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种结合机器学习与三维变分同化的二维风场反演方法,该方法包括以下步骤:

步骤100:通过雷达和若干个测风仪对待测风场区域进行探测,获取待测风场探测数据。

待测风场探测数据包括:雷达探测的径向风速探测值以及测风仪探测的横向风速探测值和纵向风速探测值。

步骤102:将待测风场区域划分为均匀的分析网格,并建立xoy坐标系。

xoy坐标系是在待测风场区域中心设置一台雷达,以雷达位置为中心o,横向为x轴,纵向为y轴建立的。

如图2所示,ABCD方框为待测风场区域,将待测风场区域划分为均匀分析网格,如图2中虚线所示。在区域中心设置一台雷达,以雷达位置为中心o,横向为x轴,纵向为y轴,建立xoy坐标系。

步骤104:根据径向风速探测值,采用有监督学习方式将径向风速探测值插值到分析网格上,得到分析网格上的径向风速观测值。

步骤106:根据分析网格上的径向风速观测值,采用半监督学习方式将测风仪探测的横向风速探测值和纵向风速探测值插值到分析网格上,得到分析网格上的横向风速观测值和纵向风速观测值。

步骤108:根据分析网格上的径向风速观测值、横向风速观测值以及纵向风速观测值,采用三维变分同化法构建代价函数;通过优化求解代价函数得到分析网格上二维风场的反演结果。

采用三维变分同化法构建代价函数的表达式为:

其中,

其中,

对所述代价函数进行优化求解,得到分析网格上二维风场的反演结果。二维风场的反演结果包括:分析网格上的横向风速分析值和纵向风速分析值。

上述结合机器学习与三维变分同化的二维风场反演方法中,所述方法通过将雷达和测风仪的探测数据插值到分析网格点上,然后利用三维变分同化方法建立代价函数,通过迭代优化求解得到风场反演结果。迭代过程中无需插值,减少了计算量;针对雷达探测数据较密集、测风仪探测数据较稀疏的特点,利用机器学习中成熟的有监督学习方式和半监督学习方式来对雷达数据和测风仪数据进行插值,可以得到较高的准确率,减小插值引入的误差。

在其中一个实施例中,步骤100还包括:在待测风场区域中心设置一台雷达,通过雷达对待测风场区域进行平面显示器扫描,扫描方向为顺时针方向,得到径向风速探测值;在待测风场区域布置若干个测风仪,通过测风仪探测得到测风仪所在位置处的横向风速探测值和纵向风速探测值。

雷达对待测风场区域进行平面位置显示器(plan position indicator,简称:PPI)扫描,扫描方向为顺时针方向,图2中圆形区域为雷达探测数据的覆盖区域,雷达探测得到该区域内的径向风速探测值。在ABCD区域内,布置若干个测风仪,图2中黑色圆点即为布置测风仪的位置,测风仪探测得到其所在位置处的横向风速探测值和纵向风速探测值。

在其中一个实施例中,步骤104还包括:将雷达探测点的位置作为雷达有标记数据的特征;将径向风速探测值作为雷达有标记数据的值;将分析网格点的位置作为雷达未标记数据的特征;根据雷达有标记数据的特征、雷达有标记数据的值以及雷达未标记数据的特征构建雷达有标记数据集和雷达未标记数据集;雷达有标记数据集和雷达未标记数据集的构建公式如下:

其中,

采用最近邻算法学习雷达有标记数据集,并按照与距离成反比的权重加权得到雷达未标记数据集的值;雷达未标记数据集的值为分析网格上的径向风速观测值。

在其中一个实施例中,步骤106还包括:将测风仪的位置和测风仪探测的横向风速探测值和纵向风速探测值投影到雷达径向方向上的速度作为测风仪有标记数据的特征;将测风仪在其所处位置探测得到的横向风速探测值和纵向风速探测值作为测风仪有标记数据的值;将分析网格点的位置坐标和对应位置上的分析网格上的径向风速观测值作为测风仪未标记数据的特征;根据测风仪有标记数据的特征、测风仪有标记数据的值、测风仪未标记数据的特征,构建测风仪有标记数据集和测风仪未标记数据集;测风仪有标记数据集和测风仪未标记数据集的构建公式如下:

其中,

采用半监督学习中的协同回归法学习测风仪有标记数据集,并结合测风仪未标记数据集的特征,建立两个不同参数的最近邻算法协同训练,得到测风仪未标记数据集的值;测风仪未标记数据集的值为分析网格上的横向风速观测值和纵向风速观测值。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,提供了一种结合机器学习与三维变分同化的二维风场反演方法,具体步骤包括:

步骤一:利用雷达和若干个测风仪对感兴趣的风场区域进行探测,获取感兴趣的风场区域风速探测值,并将感兴趣的风场区域划分为均匀分析网格,建立xoy坐标系。

步骤二:利用有监督学习方式将径向风速探测值插值到分析网格上,得到径向风速观测值。

步骤三:根据径向风速观测值,利用半监督学习方式将测风仪探测的横向风速探测值和纵向风速探测值插值到分析网格上。

步骤四:利用三维变分法建立代价函数,优化求解得到分析网格上风场反演的结果。

根据步骤二,将雷达探测数据作为有标记数据,分析网格点作为未标记数据,根据上述公式(2)建立有标记数据集和未标记数据集。选用有监督学习方式KNN(最近邻算法)学习有标记数据集,然后按照与距离成反比的权重加权得到未标记数据集的值,将雷达探测数据插值到分析网格上,即得到径向风速观测值。

在此基础上,根据步骤三,将测风仪探测数据作为已标记数据,分析网格点作为未标记数据,根据上述公式(3)建立有标记数据集和未标记数据集,并利用半监督学习方式COREG(协同回归)将若干个测风仪的探测数据插值到分析网格上得到二维风速的观测值,即横向风速观测值和纵向风速观测值。

通过步骤二和步骤三,插值得到分析网格上径向风速观测值和横向风速观测值、纵向风速观测值。在步骤二和步骤三中,均采用交叉验证来确定KNN中的参数——最近邻个数和闵氏距离中常数p的最优值。

最后,在步骤四中,利用三维变分同化法建立代价函数,通过优化求解得到分析网格上二维风场的反演结果。求解上述方程(1)得到二维风场速度的分析值。

如图3所示,给出了在不同数量测风仪情况下,本发明提出的二维风场反演方法与传统(例如:基于Barnes插值的三维变分同化方法)反演方法的对比结果。其中横坐标表示待测风场区域内设置的测风仪个数,纵轴表示反演二维风场的均方根误差,圆圈-虚线表示利用本发明反演二维风场的均方根误差,三角-实线表示利用传统方法反演二维风场的均方根误差。通过图3的对比,发现通过结合机器学习和三维变分同化方法,本发明可以得到更准确的风场反演结果。

如图4所示,在相同的软件和硬件条件下:16G的RAM和2.59GHz的六核处理器,Matlab并行编程,对比了利用本发明与传统(例如:基于Barnes插值的三维变分同化方法)反演方法在不同数量测风仪情况下,完成三维变分同化法所需计算耗时的对比。其中横坐标表示待测风场区域内设置的测风仪个数,纵轴表示计算耗时,圆圈-虚线表示本发明完成三维变分同化所需计算耗时,三角-实线表示传统方法完成三维变分同化所需计算耗时。通过图4的对比,可以发现在不同测风仪个数情况下,本发明的计算耗时相比传统方法都有较大幅度的减小。

在一个实施例中,如图5所示,提供了一种结合机器学习与三维变分同化的二维风场反演装置,所述装置包括待测风场观测数据获取模块、网格划分和建立坐标系模块、雷达探测数据插值模块、测风仪探测数据插值模块以及二维风场的反演结果确定模块,其中:

待测风场观测数据获取模块,用于通过雷达和若干个测风仪对待测风场区域进行探测,获取待测风场探测数据;待测风场探测数据包括:雷达探测的径向风速探测值以及测风仪探测的横向风速探测值和纵向风速探测值。

网格划分和建立坐标系模块,用于将待测风场区域划分为均匀的分析网格,并建立xoy坐标系;xoy坐标系是在待测风场区域中心设置一台雷达,以雷达位置为中心o,横向为x轴,纵向为y轴建立的。

雷达探测数据插值模块,用于根据径向风速探测值,采用有监督学习方式将径向风速探测值插值到分析网格上,得到分析网格上的径向风速观测值。

测风仪探测数据插值模块,用于根据分析网格上的径向风速观测值,采用半监督学习方式将测风仪探测的横向风速探测值和纵向风速探测值插值到分析网格上,得到分析网格上的横向风速观测值和纵向风速观测值。

二维风场的反演结果确定模块,用于根据分析网格上的径向风速观测值、横向风速观测值以及纵向风速观测值,采用三维变分同化法构建代价函数;通过优化求解代价函数得到分析网格上二维风场的反演结果。

在其中一个实施例中,待测风场观测数据获取模块,还用于在待测风场区域中心设置一台雷达,通过雷达对待测风场区域进行平面显示器扫描,扫描方向为顺时针方向,得到径向风速探测值;在待测风场区域布置若干个测风仪,通过测风仪探测得到测风仪所在位置处的横向风速探测值和纵向风速探测值。

在其中一个实施例中,雷达探测数据插值模块,还用于将雷达探测点的位置作为雷达有标记数据的特征;将径向风速探测值作为雷达有标记数据的值;将分析网格点的位置作为雷达未标记数据的特征;根据雷达有标记数据的特征、雷达有标记数据的值以及雷达未标记数据的特征构建雷达有标记数据集和雷达未标记数据集;雷达有标记数据集和雷达未标记数据集的构建公式如下:

其中,

采用最近邻算法学习雷达有标记数据集,并按照与距离成反比的权重加权得到雷达未标记数据集的值;雷达未标记数据集的值为分析网格上的径向风速观测值。

在其中一个实施例中,测风仪探测数据插值模块,还用于将测风仪的位置和测风仪探测的横向风速探测值和纵向风速探测值投影到雷达径向方向上的速度作为测风仪有标记数据的特征;将测风仪在其所处位置探测得到的横向风速探测值和纵向风速探测值作为测风仪有标记数据的值;将分析网格点的位置坐标和对应位置上的分析网格上的径向风速观测值作为测风仪未标记数据的特征;根据测风仪有标记数据的特征、测风仪有标记数据的值、测风仪未标记数据的特征,构建测风仪有标记数据集和测风仪未标记数据集;测风仪有标记数据集和测风仪未标记数据集的构建公式如下:

其中,

采用半监督学习中的协同回归法学习测风仪有标记数据集,并结合测风仪未标记数据集的特征,建立两个不同参数的最近邻算法协同训练,得到测风仪未标记数据集的值;测风仪未标记数据集的值为分析网格上的横向风速观测值和纵向风速观测值。

关于结合机器学习与三维变分同化的二维风场反演装置的具体限定可以参见上文中对于结合机器学习与三维变分同化的二维风场反演方法的限定,在此不再赘述。上述结合机器学习与三维变分同化的二维风场反演装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 结合机器学习与三维变分同化的二维风场反演方法和装置
  • 结合机器学习与三维变分同化的二维风场反演方法和装置
技术分类

06120113213897