掌桥专利:专业的专利平台
掌桥专利
首页

一种基于遗传规划算法的耕地地块分类方法

文献发布时间:2023-06-19 12:10:19


一种基于遗传规划算法的耕地地块分类方法

技术领域

本发明涉及一种卫星遥感图像处理方法,特别是一种利用已有卫星遥感图像数据获得耕地地块分布信息的方法。

背景技术

耕地是人类社会赖以生存和发展的基础。获得准确及时的耕地空间分布和动态变化信息,是解决农作物生长监测、产量估算、粮食安全评估等农业土地系统热点问题的关键。地块是耕地利用的基本空间单元,能够反映农业投入、机械化程度以及经营模式等重要信息

遥感技术能够进行大面积快速观测,因不受地理条件限制,现已成为获取目标地物分布信息的一种重要手段。由于中国农业经营的主体是小农户,约95%的农户耕地面积小于2公顷

遗传规划或编程(Genetic Programming,GP)是一种进化/演化算法(EvolutionaryAlgorithms,EAs)。该算法是在达尔文进化论的理论基础上发展起来的,现已成功应用于各个领域解决回归、预测、分类、调度、图像分析及模式识别等问题

发明内容

本发明要解决的技术问题是提供一种基于遗传规划算法的耕地地块分类方法,以减少或避免前面所提到的问题。

本发明提供了一种基于遗传规划算法的耕地地块分类方法,其用于获取指定地理区域内的耕地分布信息,其包括如下步骤:

步骤A,在覆盖所述指定地理区域的卫星影像数据中,将像元聚合成地块,即是对卫星影像数据进行分割处理,获得地块数据。

步骤B,在步骤A获得的分割数据基础上,进行样本选取,按照7:3的比例分为训练数据和验证数据,并从选取的样本中提取特征数据,进行归一化处理获得特征集。

步骤C,将步骤B获得的特征集数据输入所提GP算法系统,获得适应度值/总体精度最高的个体作为最终对所有地块进行分类的特征,从而实现指定地理区域内的耕地的分类识别。

优选地,在步骤A中,卫星影像数据为GF-1和GF-2的影像数据,进行分割处理时,使用易康软件作为工具。

优选地,在步骤A中,对易康软件获得的分割结果,通过屏幕上的交互操作进一步进行修正。

优选地,在步骤B中,在耕地、林地、建筑用地、水体和道路五类地块数据中选择样本,总样本数量可以大致占总体分割地块数量的20%。

优选地,在步骤B中,对于已选取的样本数据,记录光谱特征、形状特征和纹理特征这三类特征,具体为,

光谱特征为10个,包括四个波段均值特征、四个波段标准差特征、一个亮度特征和一个归一化差值植被指数。

形状特征为11个,包括非对称性、边界指数、紧凑度、密度、椭圆拟合、主要方向、最大封闭椭圆半径、最小封闭椭圆半径、矩形拟合、圆度、形状指数。

纹理特征为8个,包括同质性、对比度、相异性、熵、角二阶矩、均值、标准偏差、相关性。

对上述特征进行归一化处理,从而获得具体数值范围为[-1,1]的特征集数据。归一化的具体公式如下:

式中,x

优选地,在步骤B中,纹理特征由灰度共生矩阵选择对识别植被更有效的近红外波段提取。

优选地,在步骤C中,将步骤B获得的训练数据的特征和随机常数[-1,1]作为GP算法的终端集,

优选地,在步骤C中,GP算法的函数集为{+,-,×,÷,sin,cos},其中除法重定义为保护性除法,即当除数为0时,返回结果0。

优选地,在步骤C中,GP算法的适应度函数设置为总体精度OA,即正确分类的样本数与总样本数的比值,公式表示为:

上式中,n

其他参数设置如下表所示。

优选地,在步骤C中,初始化随机产生1024个个体构成初始种群,对每个个体计算适应度。根据精英策略(Elitism),复制种群适应度最高的前1%个体到下一代,保留可能存在的最优解。然后通过大小为7的锦标赛选择方法(tournamentselection)挑选99%的个体构成父代,按照特定的概率通过交叉(crossover)和变异(mutation)操作生成新的子代个体,构造一个新的具有多样性的种群。重复此过程,直到满足终止条件。

最佳个体为最后一代种群中适应度最高的个体。将测试数据输入最佳个体得到新的特征值,以0为阈值进行划分。当特征值大于0时,该测试样本被标记为耕地,否则标记为非耕地。与测试样本的真实类别比较后,输出总体精度(正确分类的地块数与地块总数的比值)以及耕地和非耕地的制图精度(正确分为某类的地块数与该类真实地块数的比值)。制图精度(Prod.Acc,PA)的计算公式如下(i=1,2):

将GP算法运行30次,比较得到的最佳个体及其分类结果。在30次运行结果中,输出每一次运行结束后的最佳个体,并根据测试数据计算相应的总体精度及制图精度。30个最佳个体中选择总体精度最高的个体作为最终对实验区内所有地块进行分类的特征。

计算实验区内所有地块对应上述GP最佳个体的特征值,以0为阈值进行分类。若地块的特征值大于0,则被归为耕地,小于等于0则被归为非耕地。最终完成对指定地理区域内的耕地的分类识别。

本发明所提供的一种基于遗传规划算法的耕地地块分类方法,可提供较高精度的耕地地块空间分布数据,从而为区域尺度的耕地信息监测提供了便捷有效的技术手段。

附图说明

以下附图仅旨在于对本发明做示意性说明和解释,并不限定本发明的范围。其中,

图1为根据本发明的一个具体实施例的一种基于遗传规划算法的耕地地块分类方法所选择的地理区域的位置示意图;

图2为图1中实验区1的分割结果及样本分布示意图;

图3为图1中实验区2的分割结果及样本分布示意图;

图4为实验区1的不同分类方法的可视化结果示意图;

图5为实验区2的不同分类方法的可视化结果示意图;

图6为不同分类方法精度比较示意图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解,现参照附图说明本发明的具体实施方式。

本发明提供了一种基于遗传规划算法的耕地地块分类方法,其用于获取指定地理区域内的耕地分布信息,其包括如下步骤:

步骤A,在覆盖所述指定地理区域的卫星影像数据中,将像元聚合成地块,也即是对卫星影像数据进行分割处理,获得地块数据。

图1为根据本发明的一个具体实施例的一种基于遗传规划算法的耕地地块分类方法所选择的地理区域的位置示意图;图2为图1中实验区1的分割结果及样本分布示意图;图3为图1中实验区2的分割结果及样本分布示意图;参见图1-3所示,为了能够直观说明本发明的技术方案并展现本发明的技术效果,申请人在广西壮族自治区南宁市武鸣区,根据耕地及其他地物的复杂程度选择两个大小相近的实验区作为对象进行分析研究,一块实验区(实验区1)耕地分布集中,形状规则,且其他地物类别分布较为简单;另一块实验区(实验区2)耕地分散分布,形状各异,且包含更多的地物类别。卫星影像数据可以选择高分系列卫星的影像数据,高分系列卫星包括高分一号高分宽幅、高分二号亚米全色、高分三号1米雷达、高分四号同步凝视、高分五号高光谱观测、高分六号陆地应急监测、高分七号亚米立体测绘等7颗民用高分卫星,在本申请的具体实施例中,选择GF-1和GF-2的影像数据进行处理。在分析过程中,发明人选用了德国Definiens Imaging公司开发的易康(eCognition)智能化影像分析软件作为工具。使用易康中的多尺度分割方法对分割图像。这个方法需要设置三个参数:scale、shape和compactness。scale限制了相邻像素值之间的差异,所以它一般与对象的大小成正比。相对于与光谱信息直接相关的color,shape表示空间同质性,其值越大,分割结果形状在大小上差异越小。shape又分为compactness和smoothness,compactness表示对象同质性,其值越小,分割结果越破碎。

对于图1中的两个实验区域,在易康软件中尝试了多种参数组合后,最终按照下表参数进行设置,可以使得到的结果(也即是获得的各类别地块)能够大致按照道路、田垄等地物类别的边界分割。

得到易康的分割结果后,还可以进一步进行修正,也即是可以通过屏幕上的交互操作来修正分割结果。具体来说,修正的过程可以是先通过数据筛选,找到异常像元(例如由于卫星传感器异常,近红外波段像元值为65535的像元),并将其与邻近地块合并。

如前所述,在易康软件中进行分割时,是通过参数设置来实现的,对于同一地理区域来说,在不同时间获得的卫星影像数据,由于光照、云层覆盖等条件的影像,在易康软件中自动分割获得的结果,可能会存在部分过度分割的地块(不属于该地块所述的地物类别的部分划为该地块)和欠分割的地块(属于该地物类别的地块的部分划为其他地块),虽然通过设置参数调整可以使得过度分割的地块和欠分割的地块尽可能的少,但如果需要获得更精确的结果,可以由操作者在整体上对过度分割的地块进行重新分割,对欠分割的地块进行合并,从而得到最终的结果。也即是图2和图3所示的分割数据。

步骤B,在步骤A获得的分割数据基础上,进行样本选取,按照7:3的比例分为训练数据和验证数据,并对选取的样本提取特征数据,进行归一化处理获得特征集。

对于如图2和图3所示的步骤A所获得的分割结果数据(也即是所获得的地块数据),在耕地、林地、建筑用地、水体和道路五类地块数据中选择样本,总样本数量可以大致占总体分割地块数量的20%。选取样本时,可采用目视解译的方式,也可以根据实地调查得到的样本确定类别。对五类样本按照7:3的比例分为训练数据和验证数据,然后将除耕地以外的四个类别归为非耕地类别,具体数量可如下表所示。

为了精确量化耕地和非耕地两类对象的数据特征,对于已选取的样本数据,需要记录光谱特征、形状特征和纹理特征这三类特征,具体在本发明中,对应的具体特征如下表所示,

如上表所示,在本发明中,具体需要选择29个特征,其中,

光谱特征为10个,包括四个波段均值特征、四个波段标准差特征、一个亮度特征和一个归一化差值植被指数。

形状特征为11个,包括非对称性、边界指数、紧凑度、密度、椭圆拟合、主要方向、最大封闭椭圆半径、最小封闭椭圆半径、矩形拟合、圆度、形状指数。

纹理特征为8个,包括同质性、对比度、相异性、熵、角二阶矩、均值、标准偏差、相关性。

上述数据特征可以利用易康软件导出,导出后的特征再进行归一化处理,从而获得具体数值范围为[-1,1]的特征集数据。归一化的具体公式如下:

式中,x

在一个优选实施例中,纹理特征由灰度共生矩阵(Gray-Level Co-occurrenceMatrix,GLCM)选择对识别植被更有效的近红外波段提取。

步骤C,对步骤B获得的特征集数据进行计算,获得总体精度最高的个体作为最终对所有地块进行分类的特征,从而实现指定地理区域内的耕地的分类识别。

如背景技术所述,现有技术中未见有将遗传规划算法用于耕地识别的应用,当使用GP算法解决问题时,需要确定五个基本因素从而设计出特定的GP算法:

(1)终端集(TerminalSet)。该集合通常由变量和常量构成,用途是为GP构造有效特征时提供必需的判别信息。变量由具体问题来确定,一般为原始数据及提取的特征,常量是在某个与问题有关的区间内生成特定类型的随机数;

(2)函数集(FunctionSet)。该集合由不同类型的函数构成,常见的函数集包括基础算术运算符+、-、×、/,三角函数sin、cos等。

(3)适应度函数(FitnessFunction)。利用该函数计算每个个体的适应度,以此评估个体的优劣,并作为最佳个体搜索方向的指引。它在进化过程中起着非常重要的作用,且往往根据实际问题而发生变化。比如对于影像分类问题,其适应度函数可以定义为正确分类的实例数或百分比;

(4)运行参数。相关参数包括迭代次数、种群规模(个体数量)、选择策略、复制概率、交叉概率、变异概率以及GP树的最大深度等;

(5)终止条件。个体进化的终止条件决定算法何时停止迭代并输出种群内的最佳个体。常见的终止条件如种群中最佳个体的适应度满足特定要求(产生了问题的最佳解决方案)或进化代数达到预设最大迭代数或者搜索到最优的解等。

在本发明中,为了使用GP算法进行耕地地块分类,在步骤B获得了归一化后的特征集后,按7:3分为训练数据和测试数据,将其中的训练数据和随机常数[-1,1]作为GP算法的终端集,

函数集为{+,-,×,÷,sin,cos},其中除法重定义为保护性除法,即当除数为0时,返回结果0。

为了实现耕地和非耕地的二分类,个体将输入的训练数据转化为新的特征数据,然后应用一个阈值划分特征值。特征值若大于0,则该样本被标记为耕地,小于等于0则标记为非耕地。适应度函数设置为总体精度(OverallAccuracy,OA),即正确分类的样本数与总样本数的比值,公式表示为:

上式中,n

膨胀是影响GP算法的一个常见问题,即树不断生长而适应度值没有明显改善的现象,这通常会使进化停滞并导致最终得到的解决方案过于复杂。为了限制树的大小,当个体的树长度超过70,则设其适应度为0。

其他参数设置如下表所示。

初始化随机产生1024个个体构成初始种群,对每个个体计算适应度。根据Elitism参数,复制种群适应度最高的前1%个体到下一代,保留可能存在的最优解。然后通过大小为7的Tournament选择策略确定下一代种群99%的个体并按照选定的概率进行交叉和变异,增加解的多样性。重复此过程,直到满足终止条件。

最佳个体为最后一代种群中适应度最高的个体。将验证数据输入最佳个体得到新的特征值,以0为阈值进行划分。当特征值大于0时,该验证样本被标记为耕地,否则标记为非耕地。与验证样本的真实类别比较后,输出总体精度(正确分类的地块数与地块总数的比值)以及耕地和非耕地的制图精度(正确分为某类的地块数与该类真实地块数的比值)。制图精度(Prod.Acc,PA)的计算公式如下(i=1,2):

运行30次,比较得到的最佳个体及其分类结果。在GP的30次运行结果中,输出每一次运行结束后的最佳个体,并根据测试数据计算相应的总体精度及制图精度。30个最佳个体中选择总体精度最高的个体作为最终对实验区内所有地块进行分类的特征。

计算实验区内所有地块对应上述GP最佳个体的特征值,以0为阈值进行分类。若地块的特征值大于0,则被归为耕地,小于等于0则被归为非耕地。最终完成对指定地理区域内的耕地的分类识别。

为了进一步直观展现本发明所使用的方法的技术效果,对于对步骤B获得的归一化后的特征集数据,申请人分别输入K最邻近法(K-Nearest Neighbor,KNN)、决策树(DecisionTree,DT)、朴素贝叶斯(

图4为实验区1的不同分类方法的可视化结果示意图,图5为实验区2的不同分类方法的可视化结果示意图,图6为不同分类方法精度比较示意图,在图6中,左图(a)表示的是实验区1的分类精度,右图(b)表示的是实验区2的分类精度。参见图4-6所示,本发明所采用的GP对于两个实验区的总体精度都在98%左右,明显比其他5个常用分类器的精度高:在实验区1中GP比DT高了4%,比KNN高了大概20%;在实验区2中,GP比SVM和NB分别高了5%和12%。GP在制图精度即耕地和非耕地的分类中也表现出了比较明显的优势。

本发明所提供的一种基于遗传规划算法的耕地地块分类方法,可提供较高精度的耕地地块空间分布数据,从而为区域尺度的耕地信息监测提供了便捷有效的技术手段。

本领域技术人员应当理解,虽然本发明是按照多个实施例的方式进行描述的,但是并非每个实施例仅包含一个独立的技术方案。说明书中如此叙述仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体加以理解,并将各实施例中所涉及的技术方案看作是可以相互组合成不同实施例的方式来理解本发明的保护范围。

以上所述仅为本发明示意性的具体实施方式,并非用以限定本发明的范围。任何本领域的技术人员,在不脱离本发明的构思和原则的前提下所作的等同变化、修改与结合,均应属于本发明保护的范围。

本发明中所引用的参考文献包括:

[1]Foley J A,Ramankutty N,Brauman K A,et al.Solutions for acultivated planet[J].Nature,2011,478(7369):337-342.

[2]Yan L,Roy D P.Conterminous United States crop field sizequantification from multi-temporal Landsat data[J].Remote Sensing ofEnvironment,2016,172:67-86.

[3]Thapa G,Gaiha R.Smallholder farming in Asia and the Pacific:Challenges and opportunities[C].IFAD conference on new directions forsmallholder agriculture,2011.

[4]张学彪.中国小农户经营规模变迁与生产效率研究[D].中国农业科学院,2018.

[5]蒙继华,付伟,徐晋,et al.遥感在种植业保险估损中的应用[J].遥感技术与应用,2017,32(02):238-246.

[6]刘巍,吴志峰,骆剑承,et al.深度学习支持下的丘陵山区耕地高分辨率遥感信息分区分层提取方法[J].测绘学报,2021,50(01):105-116.

[7]Persello C,Tolpekin V A,Bergado J R,et al.Delineation ofagricultural fields in smallholder farms from satellite images using fullyconvolutional networks and combinatorial grouping[J].Remote Sensing ofEnvironment,2019,231.

[8]毕莹,薛冰,张孟杰.GP算法在图像分析上的应用综述[J].郑州大学学报(工学版),2018,39(06):3-13.

[9]Bi Y,Xue B,Zhang M.An Effective Feature Learning Approach UsingGenetic Programming With Image Descriptors for Image Classification[ResearchFrontier][J].IEEE Computational Intelligence Magazine,2020,15(2):65-77.

[10]Espejo P,Ventura S,Herrera F.ASurvey on the Application ofGenetic Programming to Classification[J].Systems,Man,and Cybernetics,Part C:Applications and Reviews,IEEE Transactions on,2010,40:121-144.

[11]Cabral A I R,Silva S,Silva P C,et al.Burned area estimationsderived from Landsat ETM+and OLI data:Comparing Genetic Programming withMaximum Likelihood and Classification and Regression Trees[J].ISPRS Journalof Photogrammetry and Remote Sensing,2018,142:94-105.

[12]Djerriri K,Malki M.Application of genetic programming and Landsatmulti-date imagery for urban growth monitoring[C].Image and Signal Processingfor Remote Sensing XIX,2013:889210.

[13]Koza J R.Genetic programming:on the programming of computers bymeans of natural selection[M].MIT Press,1992.

相关技术
  • 一种基于遗传规划算法的耕地地块分类方法
  • 一种基于遗传规划算法的图形图像分类方法
技术分类

06120113194527