掌桥专利:专业的专利平台
掌桥专利
首页

面向单视全极化SAR数据的集成迁移学习分类方法及系统

文献发布时间:2023-06-19 12:25:57


面向单视全极化SAR数据的集成迁移学习分类方法及系统

技术领域

本发明属于全极化雷达遥感图像处理技术领域,设计一种基于全极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,POLSAR)单视数据进行地物集成分类的迁移学习新方法及系统。

背景技术

遥感技术可以不与目标直接接触而进行远距离观测,是获取区域性地表信息的理想方式。遥感图像监督分类是利用有类别标签的像元样本建立识别模型,从而推断图像中其他像元所属类别的过程,其在土地利用管理、土地覆盖变化等方面有着巨大的应用潜力,能够为了解和规划土地用途、评估自然灾害影响、组织灾区救援与重建等工作提供重要支撑。在各类遥感传感器中,合成孔径雷达(Synthetic Aperture Radar,SAR)以其全天时、全天候的成像优势,成为了整个遥感观测体系中不可或缺的一部分。随着近年来雷达遥感卫星的频繁发射,海量雷达图像为雷达遥感图像处理技术的发展与应用提供了肥沃的土壤,同时也对雷达图像处理的自动化水平提出了严峻挑战。目前,雷达图像的产出速度与雷达图像的解译处理效率已存在严重的不匹配现象:在监督分类方面,有标签样本最直接的获取方式是在卫星过境观测期间,同步或近同步地开展实地调绘工作,但这种方式效率较低、耗资较大,且部分区域地形地势险峻,难以到达;另一种替代的方式是对雷达影像进行目视解译,但由于SAR的微波工作频段和特殊的侧视成像方式,其影像迥异于常规可见光图像,导致目视解译非常依赖于专家知识。考虑到存档图像中已有丰富的历史标签信息,若能将历史标签样本迁移至新的雷达数据进行类别信息共享,辅助完成当前分类任务,则可大大降低对当前待分类影像中的标签信息需求,提高雷达图像解译自动化程度。然而,现阶段的迁移学习技术主要是聚焦于常规的模式识别任务,未能结合遥感图像中的空间上下文信息和雷达散射矢量数据特性设计算法,直接用在SAR图像中易引起负迁移效应;此外,全极化合成孔径雷达(POLSAR)采用多通道形式获取地物目标后向散射信息,分类结果极易受斑点噪声影响。降低噪声影响的常用方式是采用多视处理,即利用空域集合平均求取散射矢量的二阶统计量作为分类器的输入特征,但这种处理人为地降低了空间分辨率,损失了大量空间细节。

发明内容

本发明的目的即在于直接使用POLSAR单视复散射矢量数据,并通过引入雷达图像空间上下文信息和散射矢量相似性系数建立集成迁移学习模型,利用大量历史数据中的有标签样本辅助极少量当前数据中的有标签样本完成地物分类。

本发明的技术方案提供一种面向单视全极化SAR数据的集成迁移学习分类方法,采用全图分割和局部开窗分割的方式,利用图像空间上下文信息浓缩源域有标签样本量和扩充目标域有标签样本量;然后结合散射矢量相似性系数和适应度函数设置源域有标签样本选取过程,根据目标域类别中心动态调整训练评判器模型所用的源域样本分布;随后引入对弱分类器可靠性的参考信息作为权重因子,采用加权形式利用迁移弱分类器进行类别软预测,给予预测结果一致的目标域无标签像元伪标签,以此扩充目标域有标签样本量并训练新的弱分类器;通过迭代运行,最终利用生成的迁移弱分类器集合完成目标域所有像元的集成分类。

而且,实现过程包括以下步骤:

步骤1,将整景历史存档图像作为源域,对整景历史存档图像进行分割处理,得到源域全部像元的图斑对象索引值;

步骤2,初始化源域有标签样本集合D

步骤3,将当前待分类的影像作为目标域,在当前待分类的影像中,以稀少的有标签样本为中心,分别开大小为N

步骤4,初始化目标域扩充样本集合C为空,然后在步骤3开的各窗口内,找到与窗口中心具有相同索引值的像元,分别取这些像元的复散射矢量作为样本值、中心像元的类别标签作为这些像元的标签,加入至集合C;

步骤5,原始目标域有标签样本集合D

步骤6,根据D

步骤7,计算D

步骤8,逐个利用融合子集作为独立的训练数据集,训练分类模型作为评判器,构成包含m个评判器的模型集合H;

步骤9,逐个利用H中每个评判器模型独立地对目标域无标签像元样本进行分类,即对每个被分类的像元样本均产生m个预测标签;

步骤10,利用目标域有标签样本集D

步骤11,将步骤10中完全基于目标域样本训练得到的弱分类器加入到迁移弱分类器集合F中,对其进行更新;

步骤12,利用F中每个弱分类器对目标域无标签像元样本进行类别预测,独立地输出预测样本从属于各类别的概率或与各类别中心的距离;

步骤13,遍历全部目标域无标签样本,比较利用H得到的m个预测标签与利用F得到的预测标签是否一致;取共计m+1个预测标签完全一致的样本构成目标域伪标签样本扩充集合C,C中每个样本的标签为其预测标签;

步骤14,判断是否集合F中的弱分类器数量不少于阈值T,或者,集合C中的样本数量不大于阈值N;

若是,则输出迁移弱分类器集合F,进入步骤15;否则,返回到步骤5,再次执行步骤5至步骤14;

步骤15,利用F中弱分类器独立完成剩余目标域无标签像元样本的分类,对各弱分类器预测类别进行多数投票作为最终的样本标签,从而完成了全部目标域像元的分类结果输出。

而且,步骤1采用POLSRM分割算法实现对整景历史存档图像进行分割处理。

而且,步骤6中,计算D

式中,Ω

而且,根据适应度大小从D

而且,步骤7中,适应度计算实现如下,

其中,I[·]是二值函数,方括号内条件为真时I[·]=1,条件为假时I[·]=0;x表示D

而且,步骤12中,进行类别预测实现如下,

对于任一样本x,将各弱分类器的预测概率或距离加权平均,找到概率平均值最大或距离平均值最小的类别作为F对该样本类别的预测标签;对于某类别c,样本x属于c的加权概率或与c中心的加权距离为d

其中,|F|是集合F中的弱分类器总数,

另一方面,本发明还提供一种面向单视全极化SAR数据的集成迁移学习分类系统,用于实现如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。

而且,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。

或者,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。

本发明的创新之处在于,以往的集成迁移学习方法直接利用有标签样本建立弱分类器集合,当目标域有标签样本数量过于稀少时,不充分且蕴含一定偏差因素的监督信息非常容易导致过拟合和负迁移问题。尤其是在POLSAR单视数据中,严重的相干斑噪声会加剧上述问题。本发明采用局部开窗分割的方式,利用图像空间上下文信息提取目标域样本,然后根据目标域类别中心动态调整训练评判器模型所用的源域样本分布,既增加了目标域有标签样本量又降低了选取到源域干扰样本的可能,减小了过拟合和负迁移风险,可大大提高迁移鲁棒性。本发明在集成学习框架下,面向全极化雷达单视数据特性进行了迁移学习形式扩展,在迭代训练新的弱分类器的同时持续更新融合子集和评判器模型集合,相当于不断用性能更高的评判器辅助预测样本标签,从而有助于降低相干斑噪声的不利影响,提高迁移分类精度。综上,本发明能够显著降低雷达图像分类任务对目标域标签信息的高度依赖,提高分类效率和自动化水平。再考虑到雷达传感器全天时、全天候的观测优势,本发明将可为土地覆盖利用与规划、国土资源调查、灾区灾情评估等任务提供充分保障,具有广阔的应用前景和经济价值。

附图说明

图1是本发明实施例的流程图。

具体实施方式

以下结合附图和实施例详细说明本发明技术方案。

大体上,POLSAR原始单视数据包含特定极化基(一般是水平-垂直极化基)下获取的4个通道数据,因此每一像元均对应着一个2×2大小的复数矩阵,称为S

在满足互易性前提时,可不失一般性地将该矩阵矢量化为3维复散射矢量Ω如下:

其中的矩阵元素s

为了提高POLSAR影像处理效率,仅基于稀少目标域监督样本完成地物分类,本发明实施例首先分别对源域和目标域图像采用全局和局部分割,减少噪声影响的同时增加目标域有标记样本数量。由于目标域监督信息不充分且可能有偏,通过引入源域监督信息帮助筛选目标域样本以提高目标域分类器泛化能力是十分必要的。本实施例在机器学习领域广泛采用的集成学习框架下,进行了面向地物分类的迁移学习形式扩展,同时适当融入POLSAR数据特性降低负迁移风险,最终完成整景目标域影像迁移分类。

本发明的技术方案为,分别采用全图分割和局部开窗分割的方式,利用图像空间上下文信息浓缩源域有标签样本量和扩充目标域有标签样本量;然后结合散射矢量相似性系数和本发明提出的适应度函数设计源域有标签样本选取过程,可根据目标域类别中心动态调整训练评判器模型所用的源域样本分布;随后引入对弱分类器可靠性的参考信息作为权重因子,采用加权形式利用迁移弱分类器进行类别软预测,给予预测结果一致的目标域无标签像元伪标签,以此扩充目标域有标签样本量并训练新的弱分类器。随上述样本选取、类别预测等步骤的迭代运行,最终可利用生成的迁移弱分类器集合完成目标域所有像元的集成分类。

本发明技术方案可采用计算机技术实现自动运行,如图1所示,本发明实施例提供的一种面向单视全极化SAR数据的集成迁移学习分类方法的流程包括以下步骤:

步骤1,源域图像整景分割处理。

对整景历史存档图像(以下称为源域)进行分割处理,得到源域全部像元的图斑对象索引值。

具体实施时,分割方法可自行选择图像分割的常用算法实现。

实施例优选采用POLSRM分割算法,为便于实施参考起见提供说明如下:

首先,逐像元计算与相邻像元间的归一化梯度g(x,x'),

其中,x为待处理像元,x'为其相邻像元,此处

按照梯度结果对所有像元与其相邻像元组成的像元对升序排序。根据排序顺序依次判断像元对(x,x')各自所属的图斑对象是否需要融合,判断方式如下:

融合R(x)和R(x')

else

不进行融合

式中,R(x)为像元x所在图斑对象,R(x')为相邻像元x'所在图斑对象,n

此公式代表在设定的恒虚警率C下,两个图斑对象源自同一地物目标的可能性。

为防止图斑对象过于细碎,可加入分割后处理,将小图斑强制融合到梯度最小的相邻图斑中。最后更新对象索引号,去除不连续的索引值。

步骤2,源域有标签样本集提取。

初始化源域有标签样本集合D

以上利用整景图像分割,引入空间上下文信息以提取源域代表性图斑样本,降低噪声影响的同时减少了后续源域样本运算量。

步骤3,目标域图像局部分割处理。

在具体实施中,可由本领域技术人员根据具体影像情况相应设置窗口尺寸值N

步骤4,目标域伪标签扩充集提取。

初始化目标域扩充样本集合C为空,然后在步骤3开的各窗口内,找到与窗口中心具有相同索引值的像元,分别取这些像元的复散射矢量作为样本值、中心像元的类别标签作为这些像元的标签,加入至集合C。

步骤5,目标域有标签样本集更新。

起初,由稀少的目标域标签样本构成了原始的目标域有标签样本集合D

步骤6,源域有标签样本与目标域类别中心相似度计算。

根据D

从而可以计算D

式中,Ω

步骤7,联合双域有标签样本集合的融合样本子集提取。

本步首先计算D

其中的I[·]是二值函数,方括号内条件为真时I[·]=1,条件为假时I[·]=0;x表示D

上述函数fit取值范围为[0,2logn

然后,根据适应度大小从D

(1)将适应度规范化至[0,1]区间且和为1,即

(2)将各样本及其Fit函数值随机重新排列,并将Fit值作为样本选择概率。不妨设排列后Fit值序列为Fit(x

(3)随机生成[0,1]区间内的数字Rand,利用随机数有放回地选取样本:

if Rand≤Fit(x

选取重排后的第1个样本x

选取重排后的第K个样本x

利用轮盘赌方法不断生成随机数选取样本,可形成与D

具体实施时可以预设重复次数m,通过重复上述过程m次,生成m个融合子集D

步骤8,评判器模型训练与集合构建。

逐个利用融合子集作为独立的训练数据集,训练分类模型作为评判器,构成包含m个评判器的模型集合H={h

具体实施时,分类器可根据具体影像数据和需求自行选用合适的监督分类算法。实施例优选采用POLSAR领域单视数据分类最为经典的复高斯分类器进行实现说明。此分类器基于贝叶斯理论和多元复高斯分布,可推导出如下距离度量:

其中Ω

步骤9,评判器模型独立分类预测。

逐个利用H中的每个评判器模型h

步骤10,弱分类器模型训练。

利用经扩充后的目标域有标签样本集D

步骤11,迁移弱分类器集合更新。

起初,迁移弱分类器集合F设置为空。每次执行本步时,均将当前次迭代执行上一步骤中完全基于目标域样本训练得到的弱分类器加入到迁移弱分类器集合F中,对其进行更新。

步骤12,弱分类器集合加权分类预测。

利用F中每个弱分类器对目标域无标签像元样本进行类别预测,独立地输出预测样本从属于各类别的概率或与各类别中心间的距离(本实施例中采用复高斯分类器进行说明,因此符合后一种情况)。对于任一样本x,将各弱分类器的预测概率或距离加权平均,找到概率平均值最大或距离平均值最小的类别作为F对该样本类别的预测标签。如对于某类别c,样本x属于它的平均预测概率或与其中心间的平均距离为d

其中,|F|是集合F中的弱分类器总数,

步骤13,目标域伪标签扩充集提取。

遍历全部目标域无标签样本,比较利用H得到的m个预测标签与利用F得到的预测标签是否一致。取共计m+1个预测标签完全一致的样本构成新的目标域伪标签样本扩充集合C,C中每个样本的标签为其预测标签。

步骤14,判断迁移弱分类器集合构建阶段是否结束。

判断是否集合F中的弱分类器数量不少于阈值T,或者,集合C中的样本数量不大于阈值N?若是,则表明迁移弱分类器集合构建完成,输出F并直接进入步骤15;否则,返回到步骤5,再次执行步骤5至步骤14。具体实施时,T可视具体需求设定,T越大精度越高,但时间开销越多,一般可设T不低于10;N一般可设为5%的目标域样本总数。

步骤15,迁移弱分类器投票分类预测。

利用F中弱分类器独立完成剩余目标域无标签像元样本的分类。此阶段先利用F中的弱分类器对无标签像元独立进行类别预测,然后按多数投票原则得到最终的样本标签,即对于某样本x,取其预测类别中出现次数最多的类别为预测结果。

综上,经过上述步骤1至步骤15,可得到全部目标域像元的预测类别,最终输出目标域数据的整体分类结果。

步骤3至步骤5中,采用开窗分割方式引入空间上下文信息扩充目标域有标签样本集;步骤7设计了基于相似性系数的特殊适应度函数并利用适应度选取源域样本构建子集,从而在建立评判器集合前预先筛选了源域样本,降低了源域无关样本对迁移分类过程的干扰;步骤12中,通过加权预测像元类别,增强迭代过程中选取新样本扩充目标域有标签样本集的可靠性。最终,通过多数投票法结合全体弱分类器分类结果,获取目标域影像中的地物类别信息。

具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。

在一些可能的实施例中,提供一种面向单视全极化SAR数据的集成迁移学习分类系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。

在一些可能的实施例中,提供一种面向单视全极化SAR数据的集成迁移学习分类系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,如采用其他图像分割算法或监督分类算法替代POLSRM分割和复高斯分类器,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

相关技术
  • 面向单视全极化SAR数据的集成迁移学习分类方法及系统
  • 一种面向高维数据的机器学习集成分类方法及软件系统
技术分类

06120113298300