掌桥专利:专业的专利平台
掌桥专利
首页

一种检验G219沿线高寒区域气象站小时数据异常的方法

文献发布时间:2023-06-19 19:30:30


一种检验G219沿线高寒区域气象站小时数据异常的方法

技术领域

本发明涉及高寒区域气象站小时数据异常检验方法技术领域。具体地说是一种检验G219沿线高寒区域气象站小时数据异常的方法。

背景技术

高原山地在气象研究中具有特殊性,国内外学者在高原山地气象学方面开展多方探索和研究,积累了丰富成果。G219国道(新藏线叶城至狮泉河)位于青藏高原西部,平均海拔4570米,最高海拔5400多米,沿线有喀喇昆仑山、昆仑山、喜马拉雅山等高山,属于高海拔山区。一直以来,高海拔地区恶劣的气候环境,给无人值守的气象观测站仪器的维护和气象数据的收集带来挑战。气象仪器维护人员需要尽可能早地远程发现观测数据异常,然后去自动观测站点进行仪器维护,而通常这些站点建在海拔较高且周边无明显遮挡的地带,尤其在寒冷冬季交通不便,给高原地区仪器维护带来困难。

2019年之前,G219国道1100KM里程范围内,仅有一个无人值守的自动气象站,多站点、连续的气象观测数据资料的缺乏,非常不利于利用资料的长程持续性等特征发现数据异常。

至2020年12月,G219国道沿线的上述里程范围内,又增添十几个新建自动区域气象站,并实现温度、压强、湿度、风等气象要素逐小时数据实时传输,以及在新疆气象信息中心存储,如图1所示。这十几个自动气象站组成G219公路沿线时空相对连续的观测网,有助于实现由传统的单站质量控制(从单一站点记录气象数据的时间维度开展分析)向多站协同质量控制(从多个站点记录气象数据的空间维度开展分析)技术升级,并使得本发明提出新的数据异常检验方法成为可能。

本发明方法的提出,一方面考虑到,G219国道沿线区域处于高原山区的特殊性,传统的气象自动站数据质控方法,并不完全适用,需要针对该地区高海拔、山区等特点,制定新的质控指标和方法。另一方面,已有的传统气象资料质量控制方法,如界限值检查、极值检查、内部一致性检查、空间一致性检查等等,往往仅考虑气象资料时间序列中的局部特征——是否某时空点观测本身的数值过大或者与临近时空点观测值的差距较大,并没有充分考虑资料的长程持续性等标度特征。

而已有研究结果表明,气象台站观测得到的温度、压强、湿度、风等气象要素长时间序列普遍存在长程持续性特征。以风速为例,简单来说,长程持续性是指在一定的时间尺度上,大风速后面往往更倾向于继续大风,而小风速后面倾向于小风。为了研究利用长程持续性,人们提出去趋势波动分析

(简记为DFA)算法,利用所选取时间窗口s与波动函数F(s)之间的标度关系F(s)~s

发明内容

为此,本发明所要解决的技术问题,针对现有技术的不足,本发明提出一种利用资料的长程持续性特征,来检验G219沿线高寒区域气象站小时数据异常的方法。通过对不同气象资料开展去趋势波动分析,检验数据异常。

为解决上述技术问题,本发明提供如下技术方案:

一种检验G219沿线高寒区域气象站小时数据异常的方法,包括如下步骤:

步骤P1:G219沿线高寒区域气象站小时数据预处理;

步骤P2:利用去趋势波动分析方法对预处理好的数据进行标度分析;

步骤P3:对标度分析结果进行统计,获得正常数据合理标度指数的结果区间,作为检验数据问题的指标;

步骤P4:依据实际情况,针对每种气象要素,对异常数据进行标度分析;

步骤P5:通过异常数据的标度结果是否落在合理区间内,检验数据异常问题。

上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P1中,

步骤P101:收集G219沿线高寒区域14个气象站小时观测气象要素资料,气象要素资料包括温度T,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10;

步骤P102:在14个气象台站观测端,步骤P101中获得气象要素资料数据已经进行基本质量控制,包括僵值检查、内部一致性检查,保证在接下来的数据分析处理中有较高质量;

步骤P103:对步骤P102中获得气象要素资料数据,按照不同的气象要素,进行数据拼接,形成数据长时间序列;保证数据长度在10

(24h/day)*(365day/year)*(1.2year)=10512≈10

上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P2中,

步骤P201:步骤P1中分类拼接好的气象要素资料数据为原始序列,先统一表示为{x

其中:{x

步骤P202:窗口划分,将廓线序列{Y(j)}从头部正向分解到等时间长度s,且互相不重叠的N

步骤P203:在每个窗口v内,对廓线序列{Y(j)}利用k阶多项式进行拟合得到拟合的趋势序列

其中k=2;

步骤P204:对于去趋势序列{Y

步骤P205:将2N

步骤P206:原始序列{x

log

步骤P207:以log

上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P3中,

步骤P301:对小时温度T长时间序列的标度结果进行统计分析,获得所有14个站小时温度长时间序列标度指数的合理数值区间[α

步骤P302:对逐小时最高温度Tmax长时间序列的标度结果进行统计分析,获得所有14个站逐小时最高温度长时间序列标度指数的合理数值区间[α

步骤P303:对逐小时最低温度Tmin长时间序列的标度结果进行统计分析,获得所有14个站逐小时最低温度长时间序列标度指数的合理数值区间[α

步骤P304:对压强P长时间序列的标度结果进行统计分析,获得所有14个站小时压强长时间序列标度指数的合理数值区间[α

步骤P305:对小时相对湿度Rh长时间序列的标度结果进行统计分析,获得所有14个站小时相对湿度长时间序列标度指数的合理数值区间[α

步骤P306:对2分钟平均风速V2长时间序列的标度结果进行统计分析,获得所有14个站逐小时平均风速V2长时间序列标度指数的合理数值区间[α

步骤P307:对10分钟平均风速V10长时间序列的标度结果进行统计分析,获得所有14个站逐小时平均风速V10长时间序列标度指数的合理数值区间[α

步骤P308:以上步骤P301-P307中,标度指数的合理数值区间,通过统计所有14个站的各个气象要素得到,其区间下限为14个站统计得到的最小标度指数值减去14个站标度指数的标准差,其区间上限为14个站统计得到的最大标度指数值加上14个站标度指数的标准差。

上述一种检验G219沿线高寒区域气象站小时数据异常的方法,以温度T为例,其标度指数合理数值区间的上限α

α

α′

上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P4中:

步骤P401:选择某一站点,针对其观测的每一个气象要素,包括温度T,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10,构造有明显数据异常的气象要素长时间序列;针对Y9262站点,在正常序列最后分别添加5,10,30,60,90个僵值数据,形成新的时间序列:Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90;

步骤P402:针对小时分辨率的气象资料,选择参数5,10,30,60,90,分别对应时间尺度5h,10h,30h,60h,90h;

步骤P403:采用步骤P2做法,对步骤P401中构造的新的时间序列Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90进行去趋势波动分析,并在双对数坐标系中,画出波动函数F(s)与时间尺度(s)两者的关系;

步骤P404:将步骤P403中得到波动函数F(s)与时间尺度(s)两者的关系曲线,与正常数据进行去趋势波动分析后的曲线结果放在同一个坐标系中,通过比对与正常数据log

上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P5中:

步骤P501:选择同一大小的时间尺度窗口(log

步骤P502:计算该时间尺度窗口(log

步骤P503:检验步骤P502中得到的构造的异常数据序列α

步骤P504:以温度T时间序列为例,通过判定α

步骤P505:重复上述步骤P4-P504,完成其他气象要素,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10异常数据问题的检验与发现。

本发明的技术方案取得了如下有益的技术效果:

1、本发明方法的提出及实现,有助于快速发现G219沿线高寒区域气象站小时数据异常,及时通知基层观测人员开展仪器维护,有效提升观测气象数据质量。同时,实现该区域准确稳定的气象观测数据获取,有利于增强气象部门对G219国道沿线天气监测预报预警等业务能力,为沿线地区的经济、社会、国防建设等方面提供及时准确的气象数据支撑,提升该地区的气象服务技术水平。

本申请的创新之处在于:充分利用了气象资料的长程持续性这一普适特征,开展数据异常发现,提升数据质量。实现由传统单站质量控制向新型多站协同质量控制的方法升级,合理利用同一区域内的多个气象台站的历史观测资料,得到合理标度指数区间,对个别台站实时数据进行质量控制和异常数据排查。

(1)开展对G219沿线高寒区域气象站气象数据的质量控制,通过剔除明显离群的观测记录,可以有效增加对数据应用的信心,有助于理解高原区域的观测资料特点,揭示气象资料的内部规律。

(2)有助于快速发现G219沿线高寒区域气象站小时数据异常,及时通知基层观测人员开展仪器维护,提升观测气象数据质量。

(3)有利于增强气象部门对G219国道沿线天气监测预报预警等业务能力,提高登山者或旅行者的人身安全,理解世界第三极高原地区天气和气候特征。

(4)为沿线地区的经济、社会、国防建设等方面提供及时准确的气象数据支撑,有利提升该地区的气象服务技术水平。

附图说明

图1本发明所用G219沿线高寒区域14个气象站的位置分布图;

图2a G219沿线高寒区域14个气象站观测小时温度T气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图2b G219沿线高寒区域14个气象站观测逐小时最高温度Tmax气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图2c G219沿线高寒区域14个气象站观测逐小时最低温度Tmin气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图2d G219沿线高寒区域14个气象站观测压强P气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图2e G219沿线高寒区域14个气象站观测相对湿度Rh气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图2f G219沿线高寒区域14个气象站观测整小时时刻2分钟平均风速V2气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图2g G219沿线高寒区域14个气象站观测整小时时刻10分钟平均风速V10气象要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率;

图3以G219沿线高寒区域Y9259气象站为例,该站点观测多个气象要素时间序列的去趋势波动分析结果,并以白噪声序列(α=0.5)作为参照;

图4 G219沿线高寒区域两个气象站点(Y9259和Y9265)观测多个气象要素时间序列的去趋势波动分析对比结果;

图5a G219沿线高寒区域Y9262气象站观测小时温度T等气象要素时间序列及相应的异常序列(Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90)的去趋势波动分析结果;

图5b G219沿线高寒区域Y9262气象站观测压强P气象要素时间序列及相应的异常序列(Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90)的去趋势波动分析结果;

图5c G219沿线高寒区域Y9262气象站观测相对湿度Rh气象要素时间序列及相应的异常序列(Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90)的去趋势波动分析结果;

图5d G219沿线高寒区域Y9262气象站观测整小时时刻2分钟平均风速V2气象要素时间序列及相应的异常序列(Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90)的去趋势波动分析结果。

具体实施方式

至2020年12月,G219国道沿线的上述里程范围内,又增添十几个新建自动区域气象站,并实现温度、压强、湿度、风等气象要素逐小时数据实时传输,以及在新疆气象信息中心存储。这十几个自动气象站组成G219公路沿线时空相对连续的观测网,有助于实现由传统的单站质量控制(从单一站点记录气象数据的时间维度开展分析)向多站协同质量控制(从多个站点记录气象数据的空间维度开展分析)技术升级,并使得本发明提出新的数据异常检验方法成为可能。如图1所示的14个自动气象站。

本申请的检验G219沿线高寒区域气象站小时数据异常的方法,充分考虑资料的长程持续性等标度特征,利用多站气象资料开展协同质量控制,来检验G219沿线高寒区域气象站小时数据异常。通过对不同气象资料开展趋势波动分析,检验其标度指数是否落在预先统计得到的合理区间内,快速及时地发现G219沿线高寒区域气象站小时数据中的异常。具体方法如下所示。

步骤P1:G219沿线高寒区域气象站小时数据预处理;

步骤P101:收集G219沿线高寒区域14个气象站小时观测气象要素资料,气象要素资料包括温度T,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10;

步骤P102:在14个气象台站观测端,步骤P101中获得气象要素资料数据已经进行基本质量控制,包括僵值检查、内部一致性检查,保证在接下来的数据分析处理中有较高质量;

步骤P103:对步骤P102中获得气象要素资料数据,按照不同的气象要素,进行数据拼接,形成数据长时间序列;保证数据长度在10

(24h/day)*(365day/year)*(1.2year)=10512≈10

步骤P2:利用去趋势波动分析方法对预处理好的数据进行标度分析;

步骤P201:步骤P1中分类拼接好的气象要素资料数据为原始序列,先统一表示为{x

其中:{x

步骤P202:窗口划分,将廓线序列{Y(j)}从头部正向分解到等时间长度s,且互相不重叠的N

步骤P203:在每个窗口v内,对廓线序列{Y(j)}利用k阶多项式进行拟合得到拟合的趋势序列

其中k=2;

步骤P204:对于去趋势序列{Y

步骤P205:将2N

步骤P206:原始序列{x

log

步骤P207:以log

步骤P3:对标度分析结果进行统计,获得正常数据合理标度指数的结果区间,作为检验数据问题的指标;

步骤P301:对小时温度T长时间序列的标度结果进行统计分析,获得所有14个站小时温度长时间序列标度指数的合理数值区间[α

如图2a,G219沿线高寒区域14个气象站观测小时温度T要素的去趋势波动分析结果,其中数字为图中参照虚线的斜率。当时间尺度(log

α

α′

根据上述公式,可以获得标度指数取值的合理区间为[α

步骤P302:对逐小时最高温度Tmax长时间序列的标度结果进行统计分析,获得所有14个站逐小时最高温度长时间序列标度指数的合理数值区间[α

步骤P303:对逐小时最低温度Tmin长时间序列的标度结果进行统计分析,获得所有14个站逐小时最低温度长时间序列标度指数的合理数值区间[α

步骤P304:对压强P长时间序列的标度结果进行统计分析,获得所有14个站小时压强长时间序列标度指数的合理数值区间[α

步骤P305:对小时相对湿度Rh长时间序列的标度结果进行统计分析,获得所有14个站小时相对湿度长时间序列标度指数的合理数值区间[α

步骤P306:对2分钟平均风速V2长时间序列的标度结果进行统计分析,获得所有14个站逐小时平均风速V2长时间序列标度指数的合理数值区间[α

步骤P307:对10分钟平均风速V10长时间序列的标度结果进行统计分析,获得所有14个站逐小时平均风速V10长时间序列标度指数的合理数值区间[α

步骤P308:以上步骤P301-P307中,标度指数的合理数值区间,通过统计所有14个站的各个气象要素得到,其区间下限为14个站统计得到的最小标度指数值减去14个站标度指数的标准差,其区间上限为14个站统计得到的最大标度指数值加上14个站标度指数的标准差。

图2b-图2g其他气象要素,如逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10的标度指数取值的合理区间分别为:

值得一提的是,相同气象要素的时间序列,如逐小时温度T、逐小时最高温度Tmax,逐小时最低温度Tmin,具有相同的标度指数区间[0.8,1.2]。同理,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10的标度指数取值的合理区间相同,均为[0.66,0.86]。这与实际情况相符合,说明不同气象要素的变化规律,主要由不同的地球物理复杂系统过程控制,而某一气象要素的长程持续性,是该要素本身所独有的普适特征。

如图3给出,以G219沿线高寒区域Y9259气象站为例,该站点观测多个气象要素时间序列的去趋势波动分析结果,并以白噪声序列(α=0.5)作为参照。可以看出,如前面所言,同一站点的不同气象要素的长程持续性特征不同。以白噪声为参照,逐小时温度T、逐小时最高温度Tmax、逐小时最高温度Tmin、压强P、相对湿度Rh、整小时时刻2分钟平均风速V2和整小时时刻10分钟平均风速V10的标度指数存在明显差异。其中,当时间尺度(log

图4给出可以看出,在大多数情况下,相同气象要素在同一时间尺度(log

步骤P4:依据实际情况,针对每种气象要素,对异常数据进行标度分析;

步骤P401:选择某一站点,针对其观测的每一个气象要素,包括温度T,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10,构造有明显数据异常的气象要素长时间序列;针对Y9262站点,在正常序列最后分别添加5,10,30,60,90个僵值数据,形成新的时间序列:Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90;

步骤P402:针对小时分辨率的气象资料,选择参数5,10,30,60,90,分别对应时间尺度5h,10h,30h,60h,90h;

步骤P403:采用步骤P2做法,对步骤P401中构造的新的时间序列Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90进行去趋势波动分析,并在双对数坐标系中,画出波动函数F(s)与时间尺度(s)两者的关系;

步骤P404:将步骤P403中得到波动函数F(s)与时间尺度(s)两者的关系曲线,与正常数据进行去趋势波动分析后的曲线结果放在同一个坐标系中,通过比对与正常数据log

步骤P5:通过异常数据的标度结果是否落在合理区间内,检验数据异常问题。

步骤P501:选择同一大小的时间尺度窗口(log

步骤P502:计算该时间尺度窗口(log

步骤P503:检验步骤P502中得到的构造的异常数据序列α

步骤P504:以温度T时间序列为例,通过判定α

步骤P505:重复上述步骤P4-P504,完成其他气象要素,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10异常数据问题的检验与发现。

如图5a给出G219沿线高寒区域Y9262气象站观测小时温度T等气象要素时间序列及相应的异常序列(Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90)的去趋势波动分析结果。可以看出,随着温度时间序列中异常数据出现的越多(从5个逐渐增多到90个),图中曲线偏离正常数据结果的程度越大。这种定性的曲线偏离程度,可以用曲线的斜率-标度指数α来清晰地进行量化。序列(Y9262-fixed-5,Y9262-fixed-10,Y9262-fixed-30,Y9262-fixed-60,Y9262-fixed-90)的曲线斜率的标度指数α

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本专利申请权利要求的保护范围之中。

技术分类

06120115931298