掌桥专利:专业的专利平台
掌桥专利
首页

基于数据挖掘的农田连片整治自动优化方法

文献发布时间:2023-06-19 09:32:16


基于数据挖掘的农田连片整治自动优化方法

技术领域

本发明涉及农田整治优化技术领域,更具体的说是涉及基于数据挖掘的农田连片整治自动优化方法。

背景技术

国土、土地是国家的根本,土地的有效开发、土地的高效利用,是政府高度重视的问题。在农业领域,农田的质量,农田的开发、整治、保护、利用,是农业部门重要的任务,所以农业相关部门投入大量的人力、物力、财力用以划定评价农田耕地的等级,划定农田保护区,整治农田以提高土地的价值。开展土地整治的目的,就是要提高土地的利用率和产出率,改善生产和生态环境,从而提高农业生产力,为农业的现代化创造良好的生态环境。而土地的连片度是农田等级、优质农田的重要标准之一,连片整治是耕地整治的重要目标之一。

而近期常见的连片整治的研究只侧重于连片性的计算及分析评价,其中,有关连片性计算,如:周尚意等提出了空间相连性计算方法,用网格方法计算地块相连性;段刚提出基于矢量的缓冲区确定法计算连片性;晓英的PASG技术在农村环境连片综合治理中的研究与应用;李旭的基于连片性计算的基本农田保护区域划定方法研究。有关连片性评价,如:黄海舟的基于ArcGIS软件的广西耕地连片分析及应用;张强胜的基于最小费用距离模型的基本农田空间连片性评价与分析;陈显光的基于耕地质量的基本农田空间连片性评价。

目前连片整治的规划优化方面研究极少见到,当前能查到的只有‘CN201610298369.4一种农田连片整治的优化方法及其系统’,这是本项目组前期的授权发明专利,其研究内容只是单纯连片阈值的优化选择,且目前连片整治规划的方法主要依靠人为方法进行规划,现有技术存在以下问题:

1)人工规划:不适用于多个连通图并存海量图斑数据,人工规划主观,效率低,效果差。

2)最小生成树的图解法:难以应对多棵树并存海量图斑数据,效率低,效果差。

3)最小生成树的计算机算法:最小生成树的典型算法主要针对单棵树进行求解,它不适合直接用于多棵树并存海量图斑。图斑越多,该方法对设备配置要求越高,且即时响应越慢,不能灵活改变。

农地连片整治规划直接采用Kruskal等的连通图方法实际是行不通的,目前也未见农地连片整治规划相关成功的报道。

因此,如何提供一种基于数据挖掘的农田连片整治自动优化方法是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种基于数据挖掘的农田连片整治自动优化方法,能够准确快速计算出农田连片的优化结果,适用于众多生成树混杂的图斑数据集,适用性强。

为了实现上述目的,本发明采用如下技术方案:

基于数据挖掘的农田连片整治自动优化方法,包括:

S1连片信息数据库的构建:可采用基本的数据库软件(Excel\Access\SQL Serve)等构建连片信息数据库,包括图斑及距离数据库表、图斑及面积数据库表;将图斑号及两图斑距离录入距离数据库表,将图斑号及图斑面积录入图斑及面积数据库中。

S2图斑路径连片阈值的选取:从大到小依次设置多个图斑路径连片阈值,并按照从大到小的顺序,对每一个图斑路径连片阈值进行如下S3至S5的步骤,直至连片结果满足项目要求;

S3生成树优化图斑的挖掘:基于所述图斑及距离数据库表,依次挖掘有效连接路径、优势连接路径和优势图斑,得到优势图斑的距离数据库表;

S4基于规则库的自主分区与连片:基于所述优势图斑的距离数据库表的优化顺序,逐一提取连接边及图斑,按规则库的规则进行检查,包括构建新连片区、扩展连片区、合并连片区和环路剪枝;

S5连片结果的计算:基于所述图斑及面积数据库表,统计各连片区图斑的面积,剔除无效连片区,得到有效连片区面积;

S6图斑路径连片阈值的优化选择:若有效连片区面积S>90%*区域总面积,则选择下一所述图斑路径连片阈值,循环执行S3~S5,直至有效连片区面积S<90%*区域总面积,则上一个图斑路径连片阈值为最优阈值;

S7农田连片优化结果的计算:基于最优阈值得到农田连片优化结果。

进一步,所述图斑与距离数据库表包括第一图斑号、第二图斑号、两图斑距离、连片区图斑号、连片路径和剪枝后路径;

所述图斑及面积数据库表包括图斑号、图斑面积、连片区号、连片区图斑号和连片区面积。

进一步,挖掘有效连接路径具体为:在所述图斑及距离数据库表中,以所述图斑路径连片阈值为约束条件,删除大于所述图斑路径连片阈值的连接路径,得到有效连接路径;

挖掘优势连接路径具体为:以两图斑距离为第一关键字,将所述有效连接路径从小到大进行排序,挖掘生成树的优化连接路径;

挖掘优势图斑具体为:以图斑号为第二关键字,将排序后的优化连接路径进行二次排序,挖掘优化连接的图斑。

用挖掘出优势图斑的距离数据库表就可以为优势图斑优先连接的策略提供连片连接的操作顺序。

进一步,从优势图斑的距离数据库表中按优化顺序,逐一提取两个图斑级路径,按规则库的规则检查:

构建新连片区:若连接边两头的图斑号与已有的连片区的图斑号均不相同,则该连接边与图斑建立一个新连片区;

扩展连片区:若连接边两头的图斑号只有一个与已有的连片区的图斑号相同,则该连接边及图斑属于该连片区;

合并连片区:若连接边两头的图斑号与某两连片区各有一个图斑号相同,则该连接边连接两连片区;

环路剪枝:若连接边两头的图斑号与已有的某一连片区的两图斑号相同,则舍弃较大的连接边。

进一步,完成基于规则库的自主分区、连片操作之后还包括在所述优势图斑的距离数据库表的连片路径字段记录连片路径,并记录该路径所属连片区号。

进一步,所述S5连片结果的计算具体为:将所述连片区号录入所述图斑及面积数据库表,以所述连片区号作为关键字统计各连片区中图斑的面积,当连片区面积小于项目指标阈值为无效连片区,连片区面积大于等于项目指标阈值为有效连片区面积。

经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于数据挖掘的农田连片整治自动优化方法,应用计算机数据库挖掘技术,计算机在连通图万千个图斑及连接边中,自动挖掘优化生成树的优势的连接边,进一步挖掘优势连接图斑,采用优势图斑优先连接的策略进行自主分区连片;再挖掘图斑连片的数据特征,构建优化连片的规则库,以指引计算机进行图斑的并行自主分区、优化连片,无视觉协助下自动识别生成树的闭环回路并优化连通路径,形成最小生成树,自动得出连片整治规划的优化结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为基于数据挖掘的农田连片整治自动优化方法流程图。

图2为实施例连片区图斑。

图3为实施例连片区8按连片路径连接的生成树。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种基于数据挖掘的农田连片整治自动优化方法,如图1所示,从多连片区的图斑海量数据中,挖掘连接条件优势的图斑,以优势图斑优先连接的连片策略;挖掘构建最小生成树的优化连片规则库,根据优化规则库的指引,计算机自动完成图斑分片、优化连片过程。

在广州地区32672个图斑中截取94个图斑作为实施案例。本案例包括94个图斑,4465条连接路径,见图2。项目要求连片后90%的地块必须是连片的,最小连片地块设为5万亩,最大连接路径为500米,要求达到如上指标的最小连片阈值。

A.构建连片信息数据库

数据库包括:(表1)图斑及距离数据库表、(表2)图斑及面积数据库表。

项目提供数据包括:图斑号,两图斑距离(路径长),图斑面积。在两个数据库表中填入项目提供的相应图斑号、图斑面积及图斑间距离。表1中连接图斑的有4465条路径,表2中有94个图斑。

表1.部分图斑号及两图斑距离

表2.部分图斑号及其面积

B.图斑路径连片阈值的选择

阈值即连接图斑路径的最大长度,阈值越大连片程度越高,地块利用率越大,但连片成本越高。本项目可选择的阈值为75米,68米,61米,54米,46米,......。从大到小逐一选取一阈值,对于每一个阈值进行C到F步骤的操作(将得到一系列阈值对应的有效连片面积占总面积的比),直到有效面积占总区域的比小于等于的90%,则上一个阈值是项目要求的优化规划(即用尽量低的成本达到90%的连片地块面积大于5万亩)

C.优势图斑的挖掘

有效连接路径的挖掘----在图斑及距离数据库表中,用阈值的约束条件删除大于图斑路径连片阈值的路径,剩下的是有效的图斑连接路径。在本案例中原来是4465条记录,删除后距离数据库表挖掘出95条有效记录。

优势连接路径的挖掘----接着在距离数据库表中,以两图斑距离为关键字从小到大排序挖掘生成树的优化连接路径,最短的连接路径,是最优连接路径,它将被优先用以连接图斑。

优势图斑的挖掘---在上述步骤后距离数据库表中,以图斑号为第二关键字排序,就挖掘出连接条件优势的图斑,见表3,这样把图斑的可选路径汇聚,更便于自主生成各自的连片块。

经逐层数据挖掘之后,最具连接优势的路径和图斑在数据库表中排前,它将优先用以连片。见表3中,与图斑3连接的图斑有2、图斑1,图斑3有两条路径,图斑4也有两条路径,这样按图斑汇聚它的所有路径,有利于形成连片;图斑3与图斑2的路径较短就排前,较短的路径将优先被连接。

表3.优化图斑挖掘结果

D.基于规则库的自主分区与连片

图斑连片特征的挖掘:在上述进行逐层挖掘整合的距离数据库表3中,按优先顺序逐一提取连接边及图斑,按如下连片规则加入相应的连片区:

构建新连片区的特征挖掘:各连片区都找不到相同的图斑号;

扩展连片区的特征挖掘:若在已有连片区中连接边的两图斑只有一个图斑号相同;

环路剪枝的特征挖掘:有两个图斑号相同,则进行剪枝;

合并连片区的特征挖掘:两连片区各有一个图斑号相同;

环路剪枝的特征挖掘:连片区构建好之后,再次查询各连片区有无闭环路(即存在两个图斑号相同),则进行剪枝。

表3已按顺序提供了优势图斑及优势连接路径,计算机编程可以按顺序提取图斑和连接路径,实现优势图斑优先连接的策略,进行顺序逐个连接。

计算机按规则库从表3的数据库表中逐个提取图斑路径逐个连接,自动实现构建新连片区、扩展连片区、自动检测回路并剪枝、合并连片区。完成自主分区并行连接的连片整治优化规划。在逐个连接过程,须把连接的图斑及路径录入表3相应字段、给每个分好区的图斑填入区号(见表4)。

例如,按表4,用路径2-1(连接图斑1与2的路径)引入图斑1、2构建一个新区,把路径2-1录入连片路径字段,并把图斑1、2录入连片区图斑号字段;用路径3-2,因为3-2跟连片区1的现有图斑只有一个是相同的,所以路径3-2,可以加入刚刚新建的连片区,并把图斑3录入连片区图斑号字段,扩充了该连片区;用路径3-1,因为3-1跟刚建的连片区现有图斑有两个是相同的,所以路径3-1,不可以加入该连片区,路径3-1要剪枝。

连片区构建好之后,还可以检查有无闭环回路,进行剪枝。即原有区内图斑与某路径的有两个相同的图斑,就要剪断该路径。如:表4的第一条记录的连片路径字段中,4-3/1:检查路径4-3,当时连片区图斑只有‘2,1,3’,只有一个图斑号‘3’与路径4-3相同,所以路径4-3,可纳入该连片区,并把图斑号‘4’也录入该区;再检查路径4-1,则发现该区有两个图斑号‘4’‘1’都与路径4-1的两端图斑号相同,所以路径4-1被剪枝了。该连片区原有11条路径,剪枝后只剩8条路径。

表4.基于规则库的自主分区、连片结果

E.连片结果计算

把连片区图斑号录入面积数据库表,同一连片区图斑标记同一连片区号,如:图斑0、1、2......9,是同一连片区,在面积表中,它们的连片区号都填入1。在面积表中,所有图斑都填好连片区号后,以连片区号为关键字排序,统计各连片区中图斑的面积(见表5)。把连片区面积小于项目指标规定的5万亩的无效面积剔除,连片区面积大于等于5万亩的有效面积求和,再求有效面积的占比=有效连片面积之和/区域总面积。

每一个阈值将对应一个有效面积的占比,表3、表4、表5计算过程都是在阈值为45米的条件下进行运算的,运算结果,阈值为45米时,有效连片区总面积=2157083.611亩,区域总面积为2440712.786亩,所以有效连片区总面积占比为88%,见表6。

表5.连片计算结果

F.阈值的优化选择

若有效连片区总面积S>90%*区域总面积,则转第B步骤,选择下一个阈值,进行C到F的步骤,直至S≤90%*区域总面积,则该阈值为最优阈值。

从表6中可以看出阈值为75、68时,有效面积占比>90%,阈值为46、45时,有效面积占比<90%,所以在46—68间用较小的步长重复C到F步骤,可以得出,阈值=51时,有效面积占比=90.6%,阈值=51米时,为最理想的阈值,即尽量小的费用,达到尽量大的连片度。

表6.阈值对应的有效面积占比

(2)建连片区实施图:

选择连片区8为案例用以说明连片区方案实施图作图方法。阈值51时,按连片区8的路径:

62-61,64-62,65-64/63,66-64,68-64,69-62,70-63,72-70,73-70,74-72,75-68,79-74,81-79/78,86-78,由计算机获取距离数据表中路径字段的字符串,用字符串分割方法,提取图斑号,用计算机可作图的软件实现两点连线的功能,这样将图斑逐一进行连接可得图3的结果。

(3)优化结果与评价

a)本方案优化结果:按本优化连片规划方法,得出优化结果是阈值为51米时,有效连片区共有9块,他们面积都大于50000亩(可从表5得到):

连片区1,包括图斑:0,1,2,3,4,6,7,8,9;

连片区2,包括图斑:5,11,12,13,14,15;

连片区3,包括图斑:17,19,20,27,28,32,33,39,43;

连片区4,包括图斑:21,23,26,29,37,40,44,46,47,48,49,50;

连片区6,包括图斑:51,55;

连片区8,包括图斑:61,62,63,64,65,66,68,69,70,72,73,74,75,78,79,81,86;

连片区9,包括图斑:67,71,76,77,80,82,83,84;

连片区10,包括图斑:85,87,88,89,90,91,92,93,94;

连片区11,包括图斑:18,22,24,34,36,38,42,45,54;

无效连片区包括两个面积小于50000亩的连片区5和7,以及零星小图斑(从表5可得):

连片区5,包括图斑:25,30,31,35,面积:41460.39亩;

连片区7,包括图斑:57,60,面积:34548.81867亩;

零星小图斑:10、16、41、52、53、56、58、59,以及57、60;

b)人工规划优化结果(对照图2进行人工规划)

对无效连片区识别的比较。对照图2的地块图和表1提供的它们与周边路径距离。图斑:10、16、41、52、53、56、58、59,以及57、60肉眼可以识别出这些只能作为要剔除的零散小地块,无法连片;连片区25、30、31、35中图斑35与45肉眼目测,它们距离很近,但是实际距离是72米,所以该路径不能使用,它们只能算要剔除的零散小地块。因此说明无效连片区识别方面,本优化方法与人工优化结果相同。

对有效连片区识别的比较。人工规划目测的有效连片区是8块到9块,其中连片区3的图斑27与连片区11的图斑24,目测距离很近,未能目测确定两连片区是否可并一块。所以做进一步研究,查距离表它们直接路径实际上是53米,所以该路径不可用,两个片区不能连起来的。所以人工规划的无效地块也是9块,说明本优化方案与人工规划优化结果相同,它比人工优化有很大优势。

说明:按本优化方案,用计算机进行数据挖掘、自主分区连片优化,所得结果与图2采用人工的方法进行优化规划的结果相同。

c)本优化规划在适用性方面的评价。本方法本优化方案目标除了要求连片成本低之外也注重适用性。农地连片希望用较短的路径先连接周边地块,即除了注重连片总路径尽量短之外,希望周边的地块尽量连片,而不是为了单纯追求短路径,而把让周边地块通过较远的路径连接。所以,本方案采用优势地块优先连接的策略,实际是考虑农田连片适用性--把周边最短的路径先用上。所以从适用性出发,本方案也是农田连片的优化结果。

本发明具有以下优势:

1)采用连通图优化生成树的数据库+逐层数据挖掘方法,充分发挥数据库对海量数据的快速分类、检索、排序、数据挖掘的绝对优势。

2)利用计算机在自动处理海量数据上、自动并行构建优化多连片区方面,在路径选择、最小生成树的闭环剪枝步骤无需视觉的判断,直接依据数据特征判断剪枝的闭环,在适用性、快捷性方面大大优于现有的图论计算方法。

3)本发明不需要连片的唯一最短路径,方法简便、计算机运行环境要求低、即时响应快、可操作性强,优化结果能达到项目的各项指标要求。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 基于数据挖掘的农田连片整治自动优化方法
  • 一种农田连片整治的优化方法及其系统
技术分类

06120112207046