掌桥专利:专业的专利平台
掌桥专利
首页

面向大规模地理点数据的空间属性关联维诺图生成方法

文献发布时间:2023-06-19 12:02:28


面向大规模地理点数据的空间属性关联维诺图生成方法

技术领域

本发明属于信息技术领域,具体涉及一种面向大规模地理点数据的空间属性关联维诺图生成方法。

背景技术

随着地理位置获取技术的不断发展,地理数据能够被更加广泛地收集,并以点的形式进行结构化表示。这些数据是由坐标位置和属性信息组成的,描述了跨空间区域发生的位置特征和事件。在常见的场景中,地理点在地图中可视化,点显示地理位置,点的视觉元素(例如,颜色、大小和形状)被用来映射属性信息。大多数地理空间分析任务可以在这样的点样式地图上进行。然而,由于一些内在因素,如无法接受的成本、设备故障或无法到达的自然条件等,所记录的地理点无法覆盖整个目标空间,从而在与地理空间相关的决策中产生了不可避免的不确定性,特别是对于未覆盖的区域。为此,许多研究提出了将点转化为面的方法,主要分为空间插值和空间剖分两大类。(1)空间插值方法通过空间统计计算生成面积数据。例如,Tomislav等人建立了基于回归-kriging模型的空间预测框架,并证明了其预测的高效性。Greco和Cuomo提出了b样条和Bezier插值可以准确地得到杆结构。(2)空间剖分方法将地理空间划分为平面分区来进行地理空间分析。例如,Fink等人应用德劳内三角剖分方法来确定散点图的纵横比,方便用户识别点簇和趋势。Roberto等人提出了一种基于投影数据的维诺图探测工具,并使用三角剖分将其与标准表示方法进行对比。

维诺图是一种最常用的将点转换为面的方法,从地理点数据生成平面剖分的面片,然后在这些面片上应用颜色映射。其主要优点是多边形内的任意点都是最接近种子点的点,从而使生成的面片具有均匀的空间分布,反映空间关联特征。然而,随着地理点数据规模的不断增加,维诺图中生成的小面片会分布密集,大小不同,形状不规则。维诺图剖分面存在严重透支和视觉混淆问题,这在很大程度上阻碍了人们对地理点数据的视觉探索。经过与领域专家的深入讨论,他们提出了局部地区地理点之间高度相关,呈现统一的空间关联特征的想法。即选择一个点子集进行维诺图划分是可行的。即使没有那些未被发现或未采样的点,生成的面片也会在各个区域呈现类似的空间特征。此外,这一想法对于基于层次的地理空间分析也有两个潜在的好处:(1)加速了维诺图面片的生成;(2)减少透支和重叠面。然而,实现领域专家提供的想法仍存在三个技术问题:(1)如何选择一个既能保留原始地理点的空间分布又能同时表征其空间属性关联的代表性点子集。(2)如何增强维诺图面片的视觉感知,从而更好地刻画地理点的空间分布和属性关联。(3)如何评估地理空间分析中维诺图面片的有效性及其代表点生成的可视化。

发明内容

本发明的目的是提供一种面向大规模地理点数据的空间属性关联维诺图生成方法。

本发明所采取的技术方案是:

步骤(1)对原始的地理点数据进行聚类,用于指导下一步的自适应蓝噪声采样;

步骤(2)利用自适应蓝噪声采样模型结合聚类结果进行采样,将采集到的样本点作为种子点,进行德劳内三角剖分,进而生成维诺图;

步骤(3)对维诺图进行形状优化与颜色优化。

进一步,步骤(1)具体方法是:

(1-1)对原始的地理点数据进行德劳内三角剖分,形成一组顶点和一组边的连通图,以节点之间的欧氏距离作为权值;

(1-2)应用克鲁斯卡尔算法,通过最小化连通图中所有边的权值和提取最小生成树;

(1-3)根据各点属性值切割最小生成树:对每条边计算原树两侧所有点的属性值的标准差,并将两者中相对高的值定义为分割的代价:

各棵树的标准差

切割两侧成为第i和第j棵树的边的代价f(i,j)=max[STD(T

选择代价值最小的边进行切割,使得切割后的两棵新树的最大标准差最小;

(1-4)以每棵新树中所有点的属性值的标准差作为代价,选择值最高的树进行分割;

(1-5)重复(1-2)~(1-4),迭代切割,直到树的数量与目标类别的数量相同;最后,以节点所属的树作为分类标签完成聚类。

进一步,步骤(2)具体方法是:

(2-1)随机选取一个样本点,生成以它为中心的泊松盘,初始化泊松盘的半径为r

(2-2)然后计算核密度估计,得到局部分布密度k

(2-3)构建多目标蓝噪声采样模型;首先,根据采样率生成一定数量的初始化泊松盘;然后,利用获得的属性空间聚类信息计算泊松盘内类别标签的信息熵,指导泊松盘半径的调整;泊松盘的信息熵

(2-4)使用经典的德劳内三角剖分法来生成维诺图:构建点间的德劳内三角网,找到德劳内三角网各三角形外圆的圆心,再连接相邻三角形外圆的圆心形成多边形网,即维诺图。

进一步,步骤(3)中,所述的形状优化的具体方法是:首先,从系统视图中记录点集在画布上的投影坐标代替经纬度信息进行计算,规定像素距离单位为泊松盘最小半径阈值;然后,根据设定的最小半径阈值,结合采样率和属性空间聚类结果,平衡调整区域的整体泊松盘分布;最后,基于重采样点,得到了形状优化的维诺图。

所述的颜色优化采用Jenks自然断裂法来优化属性颜色的映射规则,进行离散和连续的颜色映射。

本发明的有益效果是:本发明方法结合空间距离和属性相似性,建立地理点的空间属性聚类模型;并结合其聚类结果,利用自适应蓝噪声采样模型,将采集到的样本点作为种子点,进行德劳内三角剖分,进而生成维诺图,既保留了原始数据的空间分布,又保留了原始数据的属性关联。此外,本发明方法通过最小半径阈值的设置与Jenks自然断裂分类方法的使用,从形状优化与颜色映射两方面来增强维诺图的视觉感知能力。本发明方法实现了一个用于大规模地理点数据的在线维诺图生成工具,使用户能够轻松地通过地理点数据生成有意义的面片,可视化地评估和比较维诺图。

附图说明

图1为本发明整体流程示意图;

图2为本发明中对原始的地理点数据进行聚类示意图;

图3为本发明中生成维诺图示意图;

图4为本发明中形状优化后示意图;

图5为本发明中颜色优化后示意图。

具体实施方式

以下结合附图和具体实施例,对本发明作详细地说明。

如图1,面向大规模地理点数据的空间属性关联维诺图生成方法,具体步骤是:

步骤(1)对原始的地理点数据进行聚类。本发明设计了一种空间属性关联模型,同时考虑空间距离和属性相似性,对地理点数据进行聚类,从而保证空间点之间距离较近,在同一类别内具有较强的属性关联。

如图2所示,步骤(1)具体步骤是:

(1-1)使用k-means聚类算法,对原始地理点数据进行预聚类,以优化计算效率。为每一类别分别进行三角剖分,图2中以k-means聚类后的某一类别中的十一个点举例,L

(1-2)应用克鲁斯卡尔算法,通过最小化连通图中所有边的权值和提取最小生成树

(1-3)根据各点属性值切割最小生成树:对每条边计算原树两侧所有点的属性值的标准差,并将两者中相对高的值定义为分割的代价:

各棵树的标准差

切割两侧成为第i和第j棵树的边的代价f(i,j)=max[STD(T

选择代价值最小的边进行切割min{max[STD(T

(1-4)以每棵新树中所有点的属性值的标准差作为代价,选择值最高的树进行分割,第i棵树代价表示为f(T

(1-5)重复(1-2)~(1-4),迭代切割,直到树的数量与目标类别的数量相同。最后,以节点所属的树作为分类标签完成聚类,以指导下一步的自适应蓝噪声采样。上述过程可以保证类别内的空间点具有较高的空间属性关联。

步骤(2)利用自适应蓝噪声采样模型结合聚类结果进行采样,将采集到的样本点作为种子点,进行德劳内三角剖分,进而生成维诺图。具体步骤是:

(2-1)随机选取一个样本点,生成以它为中心的泊松盘,初始化泊松盘的半径为r

(2-2)然后计算核密度估计(KDE,kernel density estimation),得到局部分布密度k

可以看出泊松盘的半径自适应地与点所在的空间密度成反比,即在密集区域采样点较多,在稀疏区域采样点较少。如图3(a)所示,在稀疏区域A圆盘的半径要大于密集区域B圆盘的半径。这样可以很好地保持原始空间点的空间相对密度。

(2-3)构建多目标蓝噪声采样模型。

要从大规模的地理点数据生成可信的维诺图,不仅需要对原始数据集进行简化以增强视觉感知,还需要保持其属性空间关联特征以近似表征原始数据。然而,自适应蓝噪声采样没有考虑属性空间关联。因此,本发明提出一种新颖的多目标蓝噪声采样模型,不仅减少原始数据大小,同时保持他们的空间分布也属性空间协会的一代泊松盘属性空间的引导下,集群空间属性关联模型的结果。

具体方法是:

首先,根据采样率生成一定数量的初始化泊松盘;

然后,利用获得的属性空间聚类信息计算盘内类别标签的信息熵,指导泊松盘半径的调整;泊松盘内的信息熵

最终泊松盘半径

可以看出,信息熵越大,最终半径值越小。如图3中(a)和(b)所示,由于A盘的所有点数据都属于同一类别,所以A盘的信息熵为零,并且A盘的半径没有调整;而B盘的半径减小,以获得一个更纯粹的泊松盘,因为其中有很多数据类别。盘中的数据类别越少,属性值就越相似。这样,泊松盘内的采样点将保持较高的空间属性关联,有利于生成优化的维诺图。

最后,利用对于原始数据具有代表性的采样点生成改进的维诺图。图3中(c)和(d)分别表示了原始数据下生成的维诺图与本发明方法下生成的维诺图。可以看出,样本点对于原始数据具有代表性。采样降低了数据规模的同时,采样得到的样本点能尽可能地保持了原始数据的空间与属性特征。

(2-4)使用经典的德劳内三角剖分法来生成维诺图:构建点间的德劳内三角网,找到德劳内三角网各三角形外圆的圆心,再连接相邻三角形外圆的圆心形成多边形网,即维诺图。

由于一个采样点生成的面片覆盖区域大部分在其泊松盘内,因此生成的维诺图不仅保持了原始数据的整体空间分布和属性特征,而且保持了维诺图面片内部的高空间属性关联。在生成的维诺图中,根据多边形内所有点的属性平均值映射每个多边形的颜色。

步骤(3)通过最小半径阈值的设置与Jenks自然断裂分类方法的使用,从形状优化与颜色优化两方面来增强维诺图的视觉感知能力;具体如下:

基于本发明提出的方法,生成的维诺图结果不仅保持了原始数据的空间分布,而且保留了原始数据的空间属性关联。但是,为了保持维诺图面片内部的高度空间相关性,在空间点密集、属性值变化的区域,不可避免地会产生一定程度的小而窄的面片,这将降低维诺图的视觉表达效果。因此,本发明设计了一种针对维诺图形状的优化方案。

形状优化的具体方法是:

首先,从系统视图中记录点集在画布上的投影坐标代替经纬度信息进行计算,规定最小屏幕像素距离为泊松盘最小半径的阈值,使基于其采样点生成的切面既能增强视觉感知,又能保留更多的细节信息;

然后,根据设定的最小半径阈值,结合采样率和属性空间聚类结果,平衡调整区域的整体泊松盘分布;

最后,基于重采样点,得到了形状改进的维诺图。

如图4中(a)和(b)所示,最小半径阈值设置将带来两个好处:一是避免在维诺图中产生过小的面片。二是保证生成的小面即使在泊松盘半径很小的情况下也不会在稠密区域被过度拉伸变形。因为分布在泊松盘周围的其他采样点之间必须有足够的间隔。从图4的(c)和(d)的对比中,可以看出优化后的维诺图具有更好的视觉感知效果。此外,将最小半径阈值作为用户可以设置的参数,以满足用户在不同空间尺度下对数据属性进行空间探索的需求。当用户需要了解更多的本地特征时,可以选择本地区域,并设置一个更小的最小半径阈值,生成更详细的维诺图。反之,可以设置较大的最小半径阈值,以更好地捕捉全局空间属性关联特征。

颜色优化采用Jenks自然断裂法来优化属性颜色的映射规则,进行离散和连续的颜色映射。

目前,许多软件内置的默认颜色映射方法是线性映射。虽然在很多数据中并不理想。对于属性分布不均匀的地理空间数据,有效的颜色映射方法应与数据特征相结合,使颜色映射能更好地反映数据的属性分布特征。为了更好地分析数据属性的区域特征和差异,本方法使用Jenks自然断裂法来优化属性颜色的映射规则,给出离散和连续的颜色映射方法。Jenks自然断裂法是一种标准方法,用于将数据集划分为一定数量的类别。该算法可以根据数据的特征对数据进行分类,从而使类内差异最小化,类间差异最大化。在Jenks自然断裂法中,属性值非线性地映射到离散映射中的几个间隔,每个间隔用统一的颜色编码。用户可以选择是将属性值映射到这些离散的间隔,还是基于这些分段的间隔构建一个连续的映射。

Jenks自然断裂法的引入,在不破坏映射前后属性的情况下,突出了区域间的差异,增强了维诺图的表达。相邻颜色之间的色差在离散映射中比较明显,而在连续映射中比较相似,得到优化后的结果如图5所示。本方法的颜色映射方案使相邻面的区别明显,以便更好地显示采样数据的特征。

该方法有效性评估如下:

通过定量比较来评估我们所提出的维诺图生成模型的有效性和适用性。采用3个地理点数据集(D1、D2、D3)进行评价。如表1所示,将本发明的维诺图生成方法(以“OUR”表示)与基于普通蓝噪声采样的维诺图生成方法(以“BNS”表示)、基于随机采样(以“RS”表示)的维诺图生成方法这两种具有普适性和权威性的方法进行了比较。

表1

在1%、5%和10%三种采样率下,使用以上四个指标:属性方差均值(AV-MVAR)、属性标准差均值(AV-MSTD)、面片边长变化系数(FSL-CV)以及相邻面面积离散平均值(FARE-MD)比较不同方法的结果。从表中可以看出,该方法在不同采样率下,AV-MVAR、AV-MSTD和FSL-CV的值都优于其他方法。这表明,本发明方法生成的维诺图结果不仅保持了蓝噪声采样算法的视觉感知优势,比随机采样方法生成的结果具有更规则、更光滑的面片,而且更好地保持了属性空间关联特征。

相关技术
  • 面向大规模地理点数据的空间属性关联维诺图生成方法
  • 面向地理空间数据库属性值约束检查的表达式解析方法
技术分类

06120113147741