掌桥专利:专业的专利平台
掌桥专利
首页

一种区域采样点的地理环境特征空间分布均匀度检测方法

文献发布时间:2024-04-18 19:58:53


一种区域采样点的地理环境特征空间分布均匀度检测方法

技术领域

本申请涉及空间制图技术领域,尤其是一种区域采样点的地理环境特征空间分布均匀度检测方法。

背景技术

野外的采样点是地理变量,比如土壤属性、气温等数据空间插值与推测的重要基础,而采样点是否均匀分布是样本点数据质量评价的关键指标,也是空间插值与推测结果准确性的重要保障。采样点分布的均匀度不仅包括地理空间分布的均匀度,同时也包括环境特征空间分布的均匀度。尤其是针对回归、机器学习等推测方法,采样点数据环境特征空间分布的均匀度甚至比地理空间分布的均匀度更为重要,它是利用环境变量提高推测精度的关键。

现有区域采样点均匀度的测算方法均只考虑地理空间而忽视了环境特征空间。采样点在环境特征空间的稀疏分布将严重影响样本点的数据质量,无法保证样本点数据的代表性和无偏性,降低了样本点数据分析与推测结果的准确性和可靠性。

发明内容

本申请的目的在于克服现有技术仅考虑地理空间而忽视环境特征空间,导致无法有效评估采样点数据在环境特征空间的代表性和无偏性,同时无法定位样点的冗余与缺失区域的问题,提供一种区域采样点的地理环境特征空间分布均匀度检测方法。

第一方面,提供了一种区域采样点的地理环境特征空间分布均匀度检测方法,包括:

S100、预设K个环境变量,将所述环境变量与采样区域进行叠加,并提取叠加后的栅格单元,以得到样本总体N中的样本单元,其中,所述样本单元的集合构成样本总体N;

S200、根据采样点的位置获取每个采样点的K维环境变量特征值,获取采样点样本N’;

S300、针对单个环境变量,将所述单个环境变量的样本总体N划分为R段,形成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率f

S400、计算采样点在每个环境特征子空间的差异值D

S500、针对单个环境变量,计算采样点在该环境变量的环境特征空间内的均匀度,其中,所述均匀度用采样点样本N’与总样本N的频率直方图之间的总差异TD表示;

S600、重复执行步骤S500,直至计算出采样点在K维环境变量特征空间的均匀度,则根据采样点在K维环境变量特征空间的均匀度计算采样点在总环境特征空间内的总均匀度。

进一步的,所述总差异TD的计算公式为:

其中,D

进一步的,根据采样点在K维环境变量特征空间的均匀度计算采样点在总环境特征空间内的总均匀度所采用的方法为均值法或最小因子限制法。

进一步的,所述均值法为将获取的所有环境变量的均匀度求均值作为采样点在地理环境特征空间分布的总均匀度,所述最小因子限制法为将获取的所有环境变量的均匀度取最小值作为采样点在地理环境特征空间分布的总均匀度。

进一步的,所述环境特征子空间为连续数值型环境特征子空间或类别型环境特征子空间。

在一种可选的实现方式中,所述连续数值型环境特征子空间的获取步骤包括:将所述连续数值型变量的值进行排序,按照等间距划分R段区间,以形成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率,并构建连续数值型变量的频率直方图。

在另一种可选的实现方式中,所述类别型变量特征子空间的获取步骤包括:将每个类别值作为一个环境特征子空间,通过类别型变量的类别值个数,将所述类别型变量划分成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率,并构建类别型变量的频率直方图。

可选的,计算采样点在每个环境特征子空间的差异值D

将环境特征子空间对应到相应的地理空间位置,每个像元赋值为环境特征子空间对应的差异值D

将K维环境变量的环境特征子空间的差异值分别映射到地理空间,以生成K个空间分布数据,其中,每个空间分布数据为对应的环境变量在各环境特征空间的差异值D

将K个差异值空间分布数据相加得到位置总差异值,通过所述总差异值来评价所在的环境特征空间样本集聚或稀疏程度。

第二方面,提供了一种计算机可读存储介质,所述计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于执行如第一方面中的任意一种实现方式中方法的步骤。

第三方面,提供了一种电子设备,所述电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面中的任意一种实现方式中的方法。

本申请具有如下有益效果:

1、本申请能够准确测算采样点在特征空间分布的均匀性,通过采样点的环境特征空间分布均匀度评价采样数据的可用性,以保证采样点数据在应用于统计学以及机器学习等推测制图时的准确性和可靠性;

2、本申请通过将K个差异值空间分布数据相加得到位置的总差异值,能够通过位置的总差异值来评价所述位置所在的环境特征空间样本集聚或稀疏程度,位置的总差异值为正,表示该位置所在的环境特征空间样本集聚,总差异值越大,越集聚,位置的总差异为负,表示该位置所在的环境特征空间样本稀疏,绝对值越大,越稀疏,从而能够提供环境特征空间的冗余和缺失情况,并映射到地理空间,使环境特征空间的集聚与稀疏情况能够直观的展现在地理空间,为采样点进一步的去冗精化或查漏补缺提供有效支撑。

附图说明

构成本申请的一部分的附图用于来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例1的区域采样点的地理环境特征空间分布均匀度检测方法的流程图;

图2是本申请实施例1的区域采样点的地理环境特征空间分布均匀度检测方法中环境变量1特征子空间内的均匀度映射到地理空间的计算示意图;

图3是本申请实施例1的区域采样点的地理环境特征空间分布均匀度检测方法中环境变量2特征子空间内的均匀度映射到地理空间的计算示意图;

图4是本申请实施例1的区域采样点的地理环境特征空间分布均匀度检测方法中采样点K维环境特征空间均匀度在地理空间的映射结果的计算示意图;

图5是本申请实施例3的电子设备的内部结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

实施例1

本申请实施例1所涉及的一种区域采样点的地理环境特征空间分布均匀度检测方法,包括:S100、预设K个环境变量,将所述环境变量与采样区域进行叠加,并提取叠加后的栅格单元,以得到样本总体N中的样本单元,其中,所述样本单元的集合构成样本总体N;S200、根据采样点的位置获取每个采样点的K维环境变量特征值,获取采样点样本N’;S300、针对单个环境变量,将所述单个环境变量的样本总体N划分为R段,形成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率f

具体的,图1示出了申请实施例1中的区域采样点的地理环境特征空间分布均匀度检测方法的流程图,包括:

S100、预设K个环境变量,以获取K维环境特征,其中,K为正整数,K维环境变量数据的结构为栅格结构,K维环境变量数据的分辨率相同,然后将所述环境变量与采样区域进行叠加,并提取叠加后的采用区域内的栅格单元,以得到样本总体N中的样本单元,其中,将样本单元的集合构成样本总体N,以获取到样本总体N;

S200、对于区域中的采样点,根据采样点的位置获取每个采样点的K维环境变量特征值,获取采样点样本N’;

S300、针对单个环境变量,将所述单个环境变量的样本总体N划分为R段,形成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率f

其中,环境特征子空间为连续数值型环境特征子空间或类别型环境特征子空间。

在一种可选的实现方式中,所述连续数值型环境特征子空间的获取步骤包括:将所述连续数值型变量的值进行排序,按照等间距划分R段区间,以形成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率,并构建连续数值型变量的频率直方图。

在另一种可选的实现方式中,所述类别型变量特征子空间的获取步骤包括:将每个类别值作为一个环境特征子空间,通过类别型变量的类别值个数,将所述类别型变量划分成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率,并构建类别型变量的频率直方图。

具体的,构建样本总体N的频率直方图时,根据所述样本总体N,得到K个环境特征子空间,环境特征子空间为连续数值型环境特征子空间或类别型环境特征子空间;所述连续数值型环境特征子空间的获取步骤包括:将所述连续数值型变量进行排序,按照等间距划分R段环境变量值区间,形成R个环境特征子空间,获取每个环境特征子空间内的样本单元频率f

构建采样点样本N’的频率直方图时,根据所述采样点样本N’,同样得到K个环境特征子空间,环境特征子空间为连续数值型环境特征子空间或类别型环境特征子空间;连续数值型环境特征子空间的获取步骤包括:采样点样本N’与总样本N的环境特征子空间一致,同样划分R段环境变量值区间,形成R个环境特征子空间,获取每个子空间内的频率f

S400、计算采样点在每个环境特征子空间的差异值D

需要说明的是,f

S500、针对单个环境变量,计算采样点在该环境变量的环境特征空间内的均匀度,其中,所述均匀度用采样点样本N’与总样本N的频率直方图之间的总差异TD表示;

具体的,所述总差异TD的计算公式为:

其中,D

S600、重复执行步骤S500,直至计算出采样点在K维环境变量特征空间的均匀度,则根据采样点在K维环境变量特征空间的均匀度计算采样点在总环境特征空间内的总均匀度。

需要说明的是,根据采样点在K维环境变量特征空间的均匀度计算采样点在总环境特征空间内的总均匀度所采用的方法为均值法或最小因子限制法。

其中,均值法为将获取的所有环境变量的均匀度求均值作为采样点在地理环境特征空间分布的总均匀度,所述最小因子限制法为将获取的所有环境变量的均匀度取最小值作为采样点在地理环境特征空间分布的总均匀度。

在该实施例中,能够通过总均匀度准确测算采样点在特征空间分布的均匀性,通过采样点的环境特征空间分布均匀度评价采样数据的可用性,以保证采样点数据在应用于统计学以及机器学习等推测制图时的准确性和可靠性。

如图1所示,计算采样点在每个环境特征子空间的差异值D

S700、将环境特征子空间对应到相应的地理空间位置,每个像元赋值为环境特征子空间对应的差异值D

针对单个环境变量,D

其中,f

S800、将K维环境变量的环境特征子空间的差异值分别映射到地理空间,以生成K个空间分布数据,其中,每个空间分布数据为对应的环境变量在各环境特征空间的差异值D

具体的,针对单个环境变量,针对采样点样本在单个环境特征子空间(r)的差异值D

按照上面的处理单个环境变量的方法,将K维环境变量的环境特征子空间的差异值分别映射到地理空间,生成K个均匀度空间分布数据,每个空间分布数据为对应的环境变量在各环境特征空间的差异值,需要说明的是,在该实例中K等于2,即表示2个环境变量,在该实例中K等于3,即表示3个环境变量,在该实例中K等于多少,即表示多少个环境变量。

S900、将K个差异值空间分布数据相加得到位置总差异值,通过所述总差异值来评价所在的环境特征空间样本集聚或稀疏程度。

如图2-4所示,以K=2为例,将K个差异值空间分布数据相加,即采样点在环境特征空间的差异值在地理空间上的显示,该位置总差异为正数,则表示该位置所在的环境特征空间样本集聚,值越大,越集聚,可为下一步采样点的去冗精化提供支撑;该位置总差异为负数,则表示该位置所在的环境特征空间样本稀疏,绝对值越大,越稀疏,可为下一步采样点的补样提供支撑。

实施例2

本申请实施例2所涉及的一种计算机可读存储介质,所述计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于执行如本申请实施例1中的任意一种实现方式中方法的步骤;

其中,计算机可读存储介质可以是只读存储器(read only memory,ROM),静态存储设备,动态存储设备或者随机存取存储器(random access memory,RAM);计算机可读存储介质可以存储程序代码,当计算机可读存储介质中存储的程序被处理器执行时,处理器用于执行如本申请实施例1中的任意一种实现方式中方法的步骤。

实施例3

如图5所示,本申请实施例3所涉及的一种电子设备,所述电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如本申请实施例1中的任意一种实现方式中的方法;

其中,处理器可以采用通用的中央处理器(central processing unit,CPU),微处理器,应用专用集成电路(application specific integrated circuit,ASIC),图形处理器(graphics processing unit,GPU)或者一个或多个集成电路,用于执行相关程序,以实现本申请实施例1中的任意一种实现方式中的方法。

处理器还可以是一种集成电路电子设备,具有信号的处理能力。在实现过程中,本申请实施例1中的任意一种实现方式中方法的各个步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。

上述处理器还可以是通用处理器、数字信号处理器、专用集成电路(ASIC)、现成可编程门阵列(field programmable gatearray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成本申请实施例的数据处理的装置中包括的单元所需执行的功能,或者执行本申请实施例1中的任意一种实现方式中方法。

以上,仅为本申请较佳的具体实施方式;但本申请的保护范围并不局限于此。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,根据本申请的技术方案及其改进构思加以等同替换或改变,都应涵盖在本申请的保护范围内。

相关技术
  • 一种基于特征空间拓扑分布的行人重识别方法
  • 破碎化区域采样点的地理空间分布均匀度检测方法
  • 连续不规则区域采样点的地理空间分布均匀度检测方法
技术分类

06120116512627