掌桥专利:专业的专利平台
掌桥专利
首页

多特征约束的网状河流主流识别方法

文献发布时间:2023-06-19 09:41:38


多特征约束的网状河流主流识别方法

技术领域

本发明涉及地图综合相关技术领域,更具体的说是涉及多特征约束的网状河流主流识别方法。

背景技术

主流识别是河系综合过程中的一个重要操作,识别的准确性直接影响河系综合的质量。在空间范围较大的河系中,局部区域会出现因河道交织形成的网状河流,其内河段密集、结构复杂且属性近似,极大的提高了河系主流识别的难度。现有方法在识别主流时,首先通过设置主观经验阈值的方式初步确定主流流域,导致主流的识别结果依赖于所设阈值,此外,现有方法通过考虑语义及上游汇水信息确定最优河段,进而通过自河口向河源追踪的方式识别主流,然而这种方式仅实现了局部最优河段的确定,缺乏河网整体空间结构特征的考虑,导致某些情况下提取主流不够准确。因此如何准确的对网状河流进行宏观概括是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种多特征约束的网状河流主流识别方法,以解决现有方法在识别主流时,首先通过设置主观经验阈值的方式初步确定主流流域,导致主流的识别结果依赖于所设阈值,且仅能实现局部最优河段的确定,缺乏河网整体空间结构特征的考虑,导致某些情况下提取主流不够准确的问题。

为了实现上述目的,本发明提供如下技术方案:

多特征约束的网状河流主流识别方法,包括以下步骤:

识别冗余结点:以河系数据构建有向拓扑,探测存在多个流出河段的结点,定义为冗余结点;

探测有效拓扑边界:选择任一冗余结点,识别与所述任一冗余结点关联的流出河段所在的拓扑多边形;判断所述拓扑多边形是否为有效拓扑多边形;若为所述有效拓扑多边形,探测所述有效拓扑多边形的一阶邻近多边形,依据所述有效拓扑多边形与所述一阶邻近多边形的合并条件,形成最终有效拓扑多边形,探测有效拓扑边界;

建立冗余结点层次树:依据所述有效拓扑边界之间的包含关系及边界围成区域的面积,划分隶属层次,并以树结构进行表达;

合理去除冗余结点:多特征约束的最优连通路径探测算法,保留各个冗余结点位于最优连通路径上的流出河段;合理去除冗余结点,识别河流主流。

优选的,所述有效拓扑边界识别步骤为:

S21:为河系构建有向结点-弧段-多边形拓扑,选择河系内任一冗余结点,依据拓扑关系及河流流向,识别所述任一冗余结点关联的流出河段以及流出河段所在拓扑多边形;

S22:依据河流流向,判断所述任一冗余结点与步骤S2-1中识别的拓扑多边形上各个结点之间是否流通;若流通,将所述拓扑多边形放入有效拓扑边界候选集;若不流通,将所述拓扑多边形视为无效拓扑多边形;

S23:判定所述最终有效拓扑多边形;

S24:将所述有效拓扑边界候选集中所述最终有效拓扑多边形的边界作为所述任一冗余结点的所述有效拓扑边界。

优选的,S23中判定所述最终有效拓扑多边形的具体步骤为:

S231:探测S22中所述有效拓扑边界候选集中所述拓扑多边形的一阶邻近多边形,判断所述任一冗余结点至每个所述一阶邻近多边形上各个结点之间是否流通;

S232若流通,将所述一阶邻近多边形与所述拓扑多边形进行合并,同时更新所述有效拓扑边界候选集;

S233:重复步骤S231、S232,逐步向外扩展,直至不存在满足流通条件的邻近拓扑多边形;

S234:若不流通,将所述有效拓扑边界候选集中所述拓扑多边形作为最终有效拓扑多边形。

优选的,所述冗余结点识别方法为,若流入结点i的河流数量为入度,流出结点i的河流数量为出度,当出度大于1,所述结点i为冗余结点;反之,所述结点i为普通结点;确定冗余结点为构建结点-弧段-多边形拓扑奠定基础。

优选的,所述层次树由结点和连接结点的边组成,树有唯一的根结点;其余每个结点代表冗余结点所形成的有效拓扑边界,父结点包含子结点;具有同一父结点的各个兄弟结点互不包含。

优选的,建立层次树时层次划分标准为,冗余结点i和冗余结点j为不同的两个结点,若冗余结点i的有效拓扑边界包含冗余结点j的有效拓扑边界,所述冗余结点j为所述冗余结点i的子结点;冗余结点i,冗余结点j,冗余结点k为不同的冗余结点,若所述冗余结点i的有效拓扑边界包含所述冗余结点j的有效拓扑边界,所述冗余结点j的有效拓扑边界包含所述冗余结点k的有效拓扑边界,所述冗余结点i为所述冗余结点j的的父结点,所述冗余结点j是所述冗余结点k的的父结点;冗余结点i、冗余结点j和冗余结点k为不同的冗余结点,若所述冗余结点i的有效拓扑边界和所述冗余结点j的有效拓扑边界互不包含;所述冗余结点k的有效拓扑边界包含所述冗余结点i的有效拓扑边界;所述冗余结点k的有效拓扑边界包含所述冗余结点j的有效拓扑边界;所述冗余结点i与所述冗余结点j为兄弟结点。

优选的,最优连通路径探测算法的特征包括语义、几何、方向、拓扑、层次关系;其中,语义包括河流名称、河流编码;几何包括角度、长度;拓扑包括连通性、上游流域面积、关联支流数;方向及拓扑连通性特征用于识别冗余结点关联的路径;河流名称、河流编码、角度、长度、上游流域面积、关联支流数特征用于评价不同路径的重要性;层次关系特征用于确定网状河流内冗余结点消除顺序;采用多特征约束的最优连通路径探测算法,使识别的主流更为自然、光滑,更符合视觉延展性。

优选的,冗余结点关联的路径指连接起点和终点时不重复经过同一个点或同一条边的路线;起点为所述任一冗余结点,终点为所述任一冗余结点的有效拓扑边界内最下游结点。

优选的,评价路径重要性的各项指标的计算方法为:

1)河流名称:若某一路径内所有河段名称相同,取值为1;若不同,取值为0;

2)河流编码:若某一路径内所有河段编码相同,取值为1;若不同,取值为0;

3)角度:某一连通路径的角度指所述某一连通路径内所有河段的角度之和,路径内某一河段的角度指所述河段与上游河段夹角之和;

4)长度:某一路径的长度指所述某一路径包含的所有河段的几何长度之和;

5)上游流域面积:某一路径的上游流域面积指所述某一路径包含的所有河段的上游流域面积的最大值;

6)关联支流数:是指某一路径关联的悬挂支流个数。

优选的,冗余结点的去除依据层次树的“自底向上”的顺序,即从层次最低的冗余结点到层次最高的冗余结点;提高计算效率,且保证各结点均能获取最优连通路径。

经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种多特征约束的网状河流主流识别方法,以河系数据构建有向拓扑,确定冗余结点,识别各个结点的有效拓扑边界,据此建立层次树,然后综合考虑语义、几何、方向、拓扑、层次关系等多特征约束,计算结点间最优连通路径,实现主流识别;克服了现有技术中主流的识别结果依赖于所设阈值,致使识别结果准确度不够稳定的问题;识别结果的准确率和精确度都有较高提升;提取的主流形状更为自然平滑,且主流均分布在网状河流中心线附近,能够更好的对网状河流进行宏观概括。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1附图为冗余结点识别示意图;

图2(a)附图为冗余结点A的有效拓扑边界示意图,图2(b)附图为冗余结点B的有效拓扑边界示意图;

图3附图为冗余结点层次树结构示意图;

图4(a)附图为原始河流示意图,图4(b)附图为冗余结点消除结果示意图,

图4(c)附图为最终主流识别结果示意图;

图5(a)附图为1:10000实验数据来源区域图,图5(b)附图为1:140000样图;

图6附图为实验区网状河流统计信息折线图;

图7(a)附图为上游流域面积阈值设置为5%时Buttenfield方法提取的主流簇示意图;图7(b)附图为上游流域面积阈值设置为5%时Buttenfield方法提取的主流示意图;图7(c)附图为上游流域面积阈值设置为10%时Buttenfield方法提取的主流簇示意图;图7(d)附图为上游流域面积阈值设置为10%时Buttenfield方法提取的主流示意图;图7(e)附图为上游流域面积阈值设置为20%时Buttenfield方法提取的主流簇示意图;图7(f)附图为上游流域面积阈值设置为20%时Buttenfield方法提取的主流示意图;图7(g)附图为多特征约束的网状河流主流识别方法转化形成的树状河系示意图;图7(h)附图为多特征约束的网状河流主流识别方法提取的主流示意图;图7(i)附图为矢量化人工样图获取的河流面示意图;图7(j)附图为由河流面提取的主流示意图;

图8(a)附图为17号网状河流示意图;图8(b)附图为Buttenfield方法提取的17号网状河流主流示意图;图8(c)附图为多特征约束的网状河流主流识别方法提取的17号网状河流主流示意图;图8(d)附图为10号网状河流示意图;图8(e)附图为Buttenfield方法提取的10号网状河流主流示意图;图8(f)附图为多特征约束的网状河流主流识别方法提取的10号网状河流主流示意图;图8(g)附图为15号网状河流示意图;图8(h)附图为Buttenfield方法提取的15号网状河流主流示意图;图8(i)附图为多特征约束的网状河流主流识别方法提取的15号网状河流主流示意图;图8(j)附图为14号网状河流示意图;图8(k)附图为Buttenfield方法提取的14号网状河流主流示意图;图8(l)附图为多特征约束的网状河流主流识别方法提取的14号网状河流主流示意图;

图9附图为主流识别流程图;

图10附图为有效拓扑边界识别流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种多特征约束的网状河流主流识别方法,首先,构建河系数据拓扑结构,探测影响主流识别的关键结点,即冗余结点;其次,考虑河流流向,计算每个冗余结点的有效拓扑边界,确定其“影响域”,据此建立层次树;最后,顾及语义、几何、方向、拓扑、层次关系等多特征约束,计算结点间最优连通路径,将网状河流转换为树状河流,从而实现主流识别。

实施例

1.冗余结点识别

从水文学上讲,河水由多个河源流向河口,可理解为一个能量自上向下的传递过程,当上游的河流与下游的河流的关系为一对一或多对一时,能量逐渐累积,传输效率最高,而当二者之间的关系为一对多或多对多时,能量被分散,出现了冗余传递,降低了传输效率。分析网状河流空间结构可以发现,形成网状河流的根本原因在于在某些上游河流结点处出现了多条流出河段,且这些河段汇聚于下游河流结点。为此,本发明首先探测存在多个流出河段的结点,并将其定义为冗余结点。参考图论中“度”的概念,对冗余结点进行识别,即:

记流入结点i的河流数量为入度InDeg(i),流出结点i的河流数量为出度OutDeg(i),若OutDeg(i)>1,则将此结点识别为冗余结点;否则,此结点为普通结点。

如图1所示,结点A、B、C、D、E、F、G、H、I,9个结点被识别为冗余结点。

2.有效拓扑边界识别

由图1可以发现,每个冗余结点在河网中位置、关联的河段数量及流域范围均不同,即不同的冗余结点有不同的“影响域”。主流识别的关键在于识别每个冗余结点的“影响域”,并去除“影响域”内冗余连通路径。为此,本发明识别冗余结点的有效拓扑边界,将其作为该冗余结点的“影响域”。某一冗余结点的有效拓扑边界定义如下:始于该结点,终于可构成环路且与该结点连通的最远下游结点,起止点之间的河流汇聚而成的多边形边界即为有效拓扑边界,识别过程如下:

为河系构建有向结点-弧段-多边形拓扑,任选河系内某一冗余结点,依据拓扑关系及河流流向,识别其关联的流出河段以及流出河段所在拓扑多边形;

依据河流流向,判断冗余结点至各个流出河段关联的拓扑多边形上各个结点之间是否流通,若流通,则将拓扑多边形放入有效拓扑边界候选集;若不流通,将所述拓扑多边形视为无效拓扑多边形;

判定所述最终有效拓扑多边形,具体步骤为:

步骤31:探测有效拓扑边界候选集中拓扑多边形的一阶邻近多边形,判断某一冗余结点至每个一阶邻近多边形上各个结点之间是否流通;

步骤32:若流通,将一阶邻近多边形与拓扑多边形进行合并,同时更新有效拓扑边界候选集;

步骤33:重复步骤步骤31、步骤32,逐步向外扩展,直至不存在满足流通条件的邻近拓扑多边形;

步骤34:若不流通,将有效拓扑边界候选集中拓扑多边形作为最终有效拓扑多边形。

将候选集中最终确定的多边形边界作为该冗余结点的有效拓扑边界。

如图2(a)所示,对于冗余结点A,首先识别其流出河段AA

3.冗余结点层次树

为更好的描述网状河流内部冗余结点间的空间关系,本发明基于有效拓扑边界,建立层次树描述冗余结点的层次关系。依据有效拓扑边界之间的包含关系,划分隶属层次,并以树结构进行表达。层次划分规则如下:对于冗余结点A

·若B

·若B

·若B

and B

层次树由结点和连接结点的边组成,树有唯一的根结点(Rootnode)代表整幅河系数据;其余每个结点代表冗余结点所形成的有效拓扑边界,父结点(Parent node)包含子结点(Children node);具有同一父结点的各个兄弟结点(Siblingnode)互不包含。

如图1所示网状河流,其内冗余结点的有效拓扑边界层次树如图3所示,其中冗余结点H及其关联的流出河流并未形成有效拓扑多边形,故冗余结点H不存在有效拓扑边界。

4.多特征约束的最优连通路径探测算法

冗余结点的合理去除是进行主流追踪的关键,本发明提出一种顾及语义(河流名称、河流编码)、几何(角度、长度)、方向(流向)、拓扑(连通性、上游流域面积、关联支流数)、层次关系多特征约束的最优连通路径探测算法,通过保留最优连通路径、舍弃其他路径,实现冗余结点去除。其中,方向及拓扑连通性特征用于识别冗余结点关联的路径;河流名称、河流编码、角度、长度、上游流域面积、关联支流数特征用于评价不同路径的重要性;层次关系特征用于确定网状河流内冗余结点消除顺序。

具体说明如下:

对于某一冗余结点,其关联的路径是指以该冗余结点为起点,以其有效拓扑边界内最下游结点为终点,连接起点和终点且不重复经过同一个点或同一条边的路线。

评价路径重要性的各项指标的计算方法如下:

河流名称:若某一路径内所有河段名称相同,取值为1;若不同,取值为0。

河流编码:若某一路径内所有河段编码相同,取值为1;若不同,取值为0。

角度:路径内某一河段的角度指其与上下游河段夹角之和,某一连通路径的角度指其包含的所有河段的角度之和。角度是“视觉连续性”的重要体现,依据“180°准侧”,上下游呈直线状连接的河流更易于被接受为主流。本发明中某条河段的角度值指其与上游河段的夹角。

长度:某一路径的长度指其包含的所有河段的几何长度之和。

上游流域面积:某一路径的上游流域面积指其包含所有河段的上游流域面积的最大值。

关联支流数:是指某一路径关联的悬挂支流个数,由拓扑关联关系计算。关联支流数可在上述指标相差无几的情况下,为了保持河系整体结构特征,发挥一定作用,但该项指标的权重值应明显低于其他指标。

采用加权平均方法计算每一河段的重要性,由冗余结点开始,顺次追踪重要性最高的河段,完成拓扑边界内的最优连通路径提取。为避免各指标量纲对计算结果产生影响,利用极小值标准化方法对各指标量纲进行统一;利用加权方法经大量实验,获得重要性评价指标体系{河流名称、河流编码、角度、长度、上游流域面积、关联支流数}的权重向量为{0.3,0.3,0.15,0.1,0.1,0.05};

或通过神经网络算法进行训练获得权重。

计算由层次最低的冗余结点开始,依据层次树“自底向上”进行去除处理。由于层次较低的冗余结点位于河网下游,优先确定其最优连通路径后,其上游冗余结点(即层级较高结点),可直接利用该最优连通路径确定其关联的路径,从而提高计算效率,且保证各结点均能获取最优连通路径。冗余消除过程为:保留该结点位于最优连通路径上的流出河段,去除其他流出河段。例如图1所示网状河流,依据图3所示层次树,由冗余结点G开始进行消除,至冗余结点A结束,最终结果如图4(b)所示。从图4(b)可以发现,每个冗余结点均被转化为仅存在一个流出河段的普通结点,且该流出河段关联至下游结点的最优连通路径。至此,网状河流转化为树状河流,进而可依据树状河系主流提取方法提取河流主流,即从河口至河源进行主流追踪。

实验与分析

1.实验数据与实验环境

依托中国测绘科学研究院研制的WJ-III地图工作站,嵌入本发明提出的多特征约束的网状河流主流识别方法,并通过与Buttenfield et al.(2013)提取方法(下称Buttenfield方法)进行对比,对本发明方法的合理性和有效性进行验证。试验数据选自湖北省郧阳县1:10000地理国情普查水系数据,空间范围为57×43km

由图5(a)可以发现,网状河流主要分布于河源及入湖处,究其原因,河源处坡度大、地形破碎,河道易被凸起的地物阻隔,形成河段较为稀疏的网状河流;入湖处河床平坦,地表疏松,河道易被堤岸、湿地等地物切割,相互交织,形成河道段较为稠密的网状河流。

2.实验数据基本统计分析

统计实验区各个网状河流包含的河段数量及其空间覆盖范围,如表1及图6所示。

表1实验区网状河流统计信息

如表1及图6所示,对于实验区内的20组网状河流,其包含的河段数量最小值为2,最大值为34,河段数量5个以上的网状河流共有9组,占全部网状河流的45%。此外,20组网状河流的空间覆盖取值范围为[1687.21m

3.全局河系主流选取合理性分析

为验证本发明方法的有效性和合理性,分别使用Buttenfield方法与本发明提出的方法提取整条河系的全局主流,并利用人工确定的主流结果对两种方法提取主流的准确性进行评价。

Buttenfield方法通过设置上游流域面积阈值以识别主流簇,为此,参考原始文献,本发明分别将上游流域面积阈值设置为5%、10%、20%进行实验,实验结果如图7(a)——图7(f)所示。本发明提出的方法通过去除冗余结点将网状河流转化为树状河流,进而依据树状河系主流提取方法追踪主流,处理结果如图7(g)——图7(h)所示。因人工选取样图为栅格数据,本发明首先通过矢量化操作获取河流主流面,进而基于Delaunay三角网提取河流面中轴线作为主流,处理结果如图7(i)——图7(j)所示。

由图7(a)——图7(f)可以发现,当上游流域面积阈值不同时,Buttenfield方法所提主流呈现出明显差异,如矩形框A和B内主流所示。在矩形框A处,存在17号网状河流,当阈值设置为5%时,主流向左下角延展;当阈值设置为10%时,主流向左侧延展;而当阈值设置为20%时,此处主流未被识别。在矩形框B处,存在10号网状河流,当阈值设置为5%和10%时,主流提取结果在此处一致,呈东西方向延展,而当阈值设置为20%时,受左上角流域面积较大的支流影响,此处主流发生明显变化,由东西走向变为南北走向。由此看见,采取设置上游流域面积阈值的方式提取主流,具有较大的不确定性。

由图7(a)——图7(h)可以发现,Buttenfield方法所提主流与本发明方法所提主流同样具有明显差异,差异主要发生在矩形框A和C处。参考图7(a)——图7(j)可以发现,对于Buttenfield方法,当上游流域面积阈值设置为10%时,选取结果与人工识别主流最为相似,此外,相对Buttenfield方法提取最优主流,本发明方法识别的主流与人工识别主流更为相似。在矩形框A处,存在17号网状河流,Buttenfield方法选取了网状河流下侧河段,本发明方法选取了上侧河段,更符合视觉延展性;在矩形框C处,存在14号网状河流,Buttenfield方法提取主流存在明显曲折、抖动,本发明方法选取主流则更为自然、光滑。

为更好地评价两种方法提取主流的优劣,进一步用提取角度差值积分法进行定量化验证。角度差值积分法是一种形状相似性度量算法,其原理为:首先对两条待比较线状要素的长度进行等比例归一化处理,均转换为长度为1的线要素;然后进行平移操作使两条曲线首点重合,并设立一定步长,如0.01,对两条曲线进行等步长分割;最后计算每段分割折线与x轴之间的方位角以及相同位置处两条曲线的方位角之差,并将方位角差值沿线要素长度进行积分,积分值越小,则形状相似性越强,数学函数式如下:

式中,Similarity(A,B)为线要素A和B之间的形状相似性指数,

以人工识别的主流为标准值,依据式(1)分别计算Buttenfield方法提取主流(阈值为10%)与人工识别主流的形状相似性以及本发明方法提取主流与人工识别主流的形状相似性。经计算,本发明方法提取主流与人工识别主流角度差积分值为59.43°,Buttenfield方法提取主流(阈值为10%)与人工识别主流角度差积分值为254.25°,由此可以看出本发明方法提取主流与人工识别主流的形状更为相似。

4.局部网状河流主流选取合理性分析

为进一步验证本发明方法的有效性和合理性,在原始河系中剥离出实验区内的20组网状河流,分别依据Buttenfield方法(不设阈值)与本发明方法进行主流提取,并进行目视比较分析。

经统计,20组网状河流中,仅编号为4、10和14的三组网状河流中的河段名称、编码存在差异,占所有网状河流数量的15%,对于大部分(85%)网状河流,河网内各条河段的名称、编码均相同,属性信息无法作为区分河段重要性的有效指标。为此,本发明去除所有网状河流的名称、编码后,再进行主流提取。

在20组网状河流中,共有11组网状河流主流提取结果相同,其编号分别为1、2、3、4、5、8、12、13、16、19和20,这些河网中河段分布较为稀疏,空间结构简单,上游流域面积可以较好地概括各个河段的重要性;其余9组网状河流主流提取结果不同,这些河网中河段数量为2-3个的有5组,编号分别为6、7、9、11和18,这些河网中支流流域较大,导致影响了Buttenfield方法主流识别的准确性;剩余4组网状河流包含河段数量较多,分布较为密集,空间结构复杂,仅依赖上游流域面积一个指标无法准确概括各个河段的重要性,如图8(a)——图8(l)所示。

由图8(a)——图8(l)可以发现,对于存在差异的17、10、15和14号网状河流,其内包含的河段数量逐渐增多。由Buttenfield方法提取主流,或存在生硬拐角(图8(b)、图8(h)),或明显偏离网状河流主体形态(图8(e)),或存在明显抖动(图8(k)),而本发明方法提取的主流形状更为自然平滑,且主流均分布在网状河流中心线附近,能够更好的对网状河流进行宏观概括。具体而言,除17号网状河流外,其他3条网状河流中,两种方法间的差异均出现在结点S处,对于Buttenfield方法,其依据局部上游流域面积最大原则,选取了河段b,而本发明方法是一种全局最优的判断方法,在河流网络的起始结点S1至终止结点S2的连通路径间,河段a所在路径相对河段b所在路径具有更优,为此,本发明方法选取了河段a,获得的选取效果可以更好地反映制图人员的认知规律。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 多特征约束的网状河流主流识别方法
  • 多特征约束的网状河流主流识别方法
技术分类

06120112259856