一种基于贝叶斯回归的多来源降雨数据融合算法及装置
文献发布时间:2023-06-19 10:29:05
技术领域
本发明涉及智慧城市建设技术领域,尤其涉及一种基于贝叶斯回归的多来源降雨数据融合算法及装置。
背景技术
SWMM模型是由美国环保局推出的一种暴雨径流模型,能够完整地模拟城市降雨径流过程和污染物转移过程,目前广泛应用于暴雨径流模拟和城市排水系统管理。SWMM模型可以模拟分析现有管网的排水能力,确定管网排水能力不足的“瓶颈”段,同时依据模拟结果预先测出设计改造方案的实际效果,通过分析对比经济性指标,可获得合理经济的方案。但是SWMM模型的目前主要应用于对已有管网的模拟分析和已有管网改造方案对比。目前,雨水管网设计主要是人工雨水管网设计,它基于极限暴雨强度所计算的流量,凭经验采用反复查阅水力计算表的方法对管段的管径和坡度等进行人为的调整,以获得较经济合理的设计。该人工雨水管网设计方法计算量大,且计算结果精确度较低。这种人工雨水管网设计方法的水力计算过程基于静态的明渠流公式,假定下游可以自由出流,水力计算过程孤立,管网的设计过程完全忽略了下游管道的水力流动状况,难以体现管网的实际通洪效果,以至于产生局部瓶颈现象,导致内涝的发生。也就是说:现有雨水管网设计方法的静态化的计算过程难以满足城市建设和环境保护的需求。
随着科学技术的发展,各国各省市对暴雨径流模拟精度要求越来越高。提高降雨输入数据精度可以大大提高暴雨径流模拟数据。在城市区域,降雨数据通常包括雷达和降雨站,雷达降雨数据有高覆盖率的优点,但雷达所测降雨通常存在系统性偏差,本身误差及不确定性也较大;降雨站监测误差小,但是站点分布稀疏,难以提供高分辨率空间信息,所以得不出准确的实时降雨强度估算。
近年来,国内外兴起了通过众包监测降雨的研究与实践。众包降雨是普通市民利用物联网监测到的降雨数据,在提供有价值的实时降雨观测数据方面具有巨大潜力。众包方式鼓励市民利用低成本物联网传感器进行降雨监测,覆盖范围极大,密度极高,准确性高。因此得到的众包降雨数据密度高,范围广。但通常而言,众包降雨数据带有较大的不确定性,相对于传统监测方法(如降雨站)具有更大的误差。而在城市区域,如何有效结合众包数据与现有的雷达和降雨站数据,各取其所长,构建一套更加高分辨率和精确度的降雨数据,十分重要。综上,如何加强降雨数据的准确性是亟待解决的问题。
发明内容
有鉴于此,有必要提供一种基于贝叶斯回归的多来源降雨数据融合算法,用以解决如何加强降雨数据的准确性的问题。
本发明提供一种基于贝叶斯回归的多来源降雨数据融合算法,包括:
获取至少一个地点位置的观测数据,其中,所述观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
根据所述雷达回波强度数据,建立估算降雨强度的线性方程;
根据所述线性方程对应的随机误差系数,确定对应的变差函数;
根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量;
通过贝叶斯公式对所述第一向量进行估计,确定对应的似然函数,并通过所述似然函数的正态分布,将所述第一向量转换为第二向量;
通过拉普拉斯近似的方法,求解所述第二向量的最优值,并带入所述估算降雨强度的线性方程,确定降雨强度估计值。
进一步地,所述获取至少一个地点位置的观测数据包括:
针对预设时间段,根据空间位置,确定所述雷达回波强度数据、所述降雨站监测数据对应的所述雷达回波强度数据;
针对所述至少一个地点位置,构建对应的所述众包监测数据、所述降雨站监测数据以及所述雷达回波强度数据之间的映射关系。
进一步地,所述线性方程的回归系数包括第一回归系数和第二回归系数,所述估算降雨强度的线性方程通过如下公式表示:
其中,
进一步地,所述随机误差系数的第一期望值和第一标准偏差通过如下公式表示:
其中,
进一步地,所述变差函数的取值系数包括第一取值系数和第二取值系数,所述变差函数通过如下公式表示:
其中,
进一步地,所述根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量包括:
根据所述第一回归系数
进一步地,所述通过贝叶斯公式对所述第一向量进行估计通过如下公式表示:
其中,θ表示所述第一向量,
进一步地,所述通过所述似然函数的正态分布,将所述第一向量转换为第二向量包括:
假设所述似然函数服从正态分布,通过如下公式表示:
其中,
根据所述正态分布,确定第
其中,
根据所述第一常数ζ,以及所述第一向量中的所述第一回归系数
进一步地,所述通过拉普拉斯近似的方法,求解所述第二向量的最优值包括:
根据所述第二向量的局部最优值,将后验分布
确定最大化的后验分布在所述局部最优值处的二次泰勒展开式;
根据所述最大化的后验分布的海森矩阵,确定对应的拉普拉斯近似值函数;
根据所述拉普拉斯近似值函数的均值,确定所述第二向量的最优值。
本发明还提供一种多来源降雨数据实时融合装置,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上所述的基于贝叶斯回归的多来源降雨数据融合算法。
与现有技术相比,本发明的有益效果包括:首先,对雷达回波强度数据、降雨站监测数据以及众包监测数据进行有效的获取,保证丰富的数据来源;然后,基于雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误差系数,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定性;进而,结合线性方程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后续的方程求解;进而,通过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包监测数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯近似的方法,准确求解第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨强度估计值,保证每个地点位置降雨强度估计的快速性、实时性和高效性。综上,本发明简单、易读、准确、运行效率高,导出的实时降雨强度估算数据准确性高,为径流估算数据提供精确的数据来源。
附图说明
图1为本发明提供的基于贝叶斯回归的多来源降雨数据融合算法法的流程示意图;
图2为本发明提供的获取至少一个地点位置的观测数据的流程示意图;
图3为本发明提供的求解第二向量的最优值的流程示意图;
图4为本发明提供的基于贝叶斯回归的多来源降雨数据融合装置的结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
本发明实施例提供了一种基于贝叶斯回归的多来源降雨数据融合算法,结合图1来看,图1为本发明提供的基于贝叶斯回归的多来源降雨数据融合算法法的流程示意图,上述基于贝叶斯回归的多来源降雨数据融合算法包括步骤S1至步骤S6,其中:
在步骤S1中,获取至少一个地点位置的观测数据,其中,观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
在步骤S2中,根据雷达回波强度数据,建立估算降雨强度的线性方程;
在步骤S3中,根据线性方程对应的随机误差系数,确定对应的变差函数;
在步骤S4中,根据线性方程的回归系数、随机误差系数,以及变差函数的取值系数,确定对应的第一向量;
在步骤S5中,通过贝叶斯公式对第一向量进行估计,确定对应的似然函数,并通过似然函数的正态分布,结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量;
在步骤S6中,通过拉普拉斯近似的方法,求解第二向量的最优值,并带入估算降雨强度的线性方程,确定降雨强度估计值。
在本发明实施例中,首先,对雷达回波强度数据、降雨站监测数据以及众包监测数据进行有效的获取,保证丰富的数据来源;然后,基于雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误差系数,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定性;进而,结合线性方程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后续的方程求解;进而,通过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包监测数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯近似的方法,准确求解第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨强度估计值,保证每个地点位置降雨强度估计的快速性、实时性和高效性。
优选地,结合图2来看,图2为本发明提供的获取至少一个地点位置的观测数据的流程示意图,上述步骤S1包括步骤S11至步骤S12,其中:
在步骤S11中,针对预设时间段,根据空间位置,确定众包监测数据、降雨站监测数据对应的雷达回波强度数据;
在步骤S12中,针对至少一个地点位置,构建对应的雷达回波强度数据、降雨站监测数据以及雷达回波强度数据之间的映射关系。
作为具体实施例,本发明实施例通过某一个地点位置,获取其对应的众包监测数据、降雨站监测数据、雷达回波强度数据,构建相互的映射关系,实现数据的有效查找。
在本发明一个具体的实施例中,对于来自雷达站、降雨站和广大人民观测的降雨数据收集了该流域的M个地点位置的雷达回波强度数据、降雨站监测数据和众包监测数据。针对任一固定时间段,通过空间位置确定来自降雨站及众包监测数据所对应的雷达降雨估计值,建立一个包含M组数据的一一映射关系(点状降雨站及众包数据与雷达数据的映射),M为众包数据与降雨站数据的总和。假设
优选地,线性方程的回归系数包括第一回归系数和第二回归系数,在步骤S2中,估算降雨强度的线性方程通过如下公式表示:
其中,
作为具体实施例,本发明实施例结合雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计。
优选地,随机误差系数的第一期望值和第一标准偏差通过如下公式表示:
其中,
作为具体实施例,本发明实施例利用随机误差系数,结合第一期望值和第一标准偏差,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定性。
优先地,变差函数的取值系数包括第一取值系数和第二取值系数,变差函数通过如下公式表示:
其中,
作为具体实施例,本发明实施例在研究区域形成的变差函数,考虑不同地点位置的相互关系,确定对应的第一取值系数和第二取值系数。
优先地,在步骤S4中,具体包括:
根据第一回归系数
作为具体实施例,本发明实施例考虑多种随机变量,确定对应的第一向量,以便后续的方程求解。
优先地,上述通过贝叶斯公式对所述第一向量进行估计通过如下公式表示:
其中,θ表示所述第一向量,
作为具体实施例,本发明实施例采用随机贝叶斯方法,将五个未知数转换为随机变量,贝叶斯回归为系统提供了无偏估计,为降雨强度估算提高精确度,合理运用贝叶斯线性回归方法。
优选地,在步骤S5中具体包括:
假设似然函数服从正态分布,通过如下公式表示:
其中,
根据正态分布,确定第
其中,
根据第一常数ζ,以及第一向量中的第一回归系数
需要说明的是,通过式(9)可知,当观测数据来自降雨站监测数据时,似然函数取
作为具体实施例,本发明实施例充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包监测数据的相互补充和印证,提高了数据的准确性。
优选地,结合图3来看,图3为本发明提供的求解第二向量的最优值的流程示意图,上述步骤S5包括步骤S51至步骤S54,其中:
在步骤S51中,根据第二向量的局部最优值,将后验分布
在步骤S52中,确定最大化的后验分布在局部最优值处的二次泰勒展开式;
在步骤S53中,根据最大化的后验分布的海森矩阵,确定对应的拉普拉斯近似值函数;
在步骤S54中,根据拉普拉斯近似值函数的均值,确定第二向量的最优值
作为具体实施例,本发明实施例采用拉普拉斯近似的方法求解贝叶斯方程,在快速求解的基础上实现高精度低不确定性的降雨强度估计。
在本发明一个具体的实施例中,为了计算第二向量θ,令
其中,第二向量θ是一个6×6矩阵,表示
其中,
其中,等式(12)可近似视为均值为
优选地,上述来源降雨数据实时融合算法还包括:将降雨强度估计值导入暴雨径流模型,并与真实监测数据对比,确定对应的误差。其中,在本发明一个具体的实施例中,对比结果显示暴雨径流模型模拟径流数据与实时监测径流数据误差在30%以内,以此为市政管网建设提供精确的暴雨径流数据。在本发明一个具体的实施例中,美国圣地亚哥市的乔纳斯溪流域为例,它的流域面积为68km
实施例2
本发明实施例提供了一种多来源降雨数据实时融合装置,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上所述的一种基于贝叶斯回归的多来源降雨数据融合算法。
实施例3
本发明实施例提供了一种基于贝叶斯回归的多来源降雨数据融合装置,结合图4来看,图4为本发明提供的基于贝叶斯回归的多来源降雨数据融合装置的结构示意图,上述基于贝叶斯回归的多来源降雨数据融合装置400包括:
获取单元401,用于获取至少一个地点位置的观测数据,其中,观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
处理单元402,用于根据雷达回波强度数据,建立估算降雨强度的线性方程;还用于根据线性方程对应的随机误差系数,确定对应的变差函数;还用于根据线性方程的回归系数、随机误差系数,以及变差函数的取值系数,确定对应的第一向量;还用于通过贝叶斯公式对第一向量进行估计,确定对应的似然函数,并通过似然函数的正态分布,结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量;
估计单元403,用于通过拉普拉斯近似的方法,求解第二向量的最优值,并带入估算降雨强度的线性方程,确定降雨强度估计值。
本发明公开了一种基于贝叶斯回归的多来源降雨数据融合算法及装置,首先,对雷达回波强度数据、降雨站监测数据以及众包监测数据进行有效的获取,保证丰富的数据来源;然后,基于雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误差系数,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定性;进而,结合线性方程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后续的方程求解;进而,通过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包监测数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯近似的方法,准确求解第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨强度估计值,保证每个地点位置降雨强度估计的快速性、实时性和高效性。
本发明技术方案,区分了来自降雨站与众包的监测数据,为众包数据设计了更高的不确性,从而可以有效利用降雨站信息为整体输出数据降低不确定性;同时,利用贝叶斯回归为系统提供了无偏估计,为降雨强度估算提高精确度;且采用拉普拉斯近似的方法求解贝叶斯方程,在快速求解的基础上实现高精度低不确定性的降雨强度估计。因而本发明克服以往降雨强度估算的不确定性,合理运用贝叶斯线性回归方法,实现高精度、高分辨率的实时降雨强度估算,本发明提供的算法简单、易读、准确、运行效率高,导出的实时降雨强度估算数据准确性高,为径流估算数据提供精确的数据来源。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
- 一种基于贝叶斯回归的多来源降雨数据融合算法及装置
- 一种基于贝叶斯回归的多来源降雨数据融合算法及装置