掌桥专利:专业的专利平台
掌桥专利
首页

一种声呐图像识别方法、装置、电子设备和储存介质

文献发布时间:2023-06-19 13:45:04


一种声呐图像识别方法、装置、电子设备和储存介质

技术领域

本发明涉及声呐图像识别技术领域,尤其是涉及一种声呐图像识别方法、装置、电子设备和储存介质。

背景技术

近年来,随着经济社会的快速发展和国家基础建设的需要,对水下矿产和海底结构的探测识别的需求日益激增。利用声呐图像识别技术,可以对水下目标进行大面积的扫描识别,提高识别效率。但由于水下目标数据集少的特征,识别难度一直较大。目前常见的声呐技术通常包括前视声呐、侧扫声呐和多波束测深声呐等,前视声呐是一种主动声呐,将声波信号“聚焦”在预定的方向上,即形成所需扫描方向的波束。声呐发出的声信号经水下传播,遇到礁石、舰艇、鱼群等障碍物反射时,产生回声信号。声呐接收回波信号并将它们转变为电信号,接收机再将各个阵元的接收到的电信号转化为适合设备处理的形式,通过一系列的数据处理,最终形成声呐扫描图像。侧扫声呐主要用于探测物体和海底结构,通过安装在两侧的两个换能器发射声波脉冲并将其数字化,从而获得海底图像。SSS将回波能量强度沿着时间线进行显示从而获得海底的连续图像。侧扫声呐能够呈现高度精细化的图像,不仅能显示物体的存在,同时还能通过强反射和弱反射展示物体的材料类别多波束测深声呐可以发射出一条波束带,可以瞬间测量一条线的水深值,随着船体的移动,多波束声呐线动成面,便可以在不同范围内测量水深值,是目前测量水深领域主要的技术之一。

不同的声呐对不同目标的识别结果也不尽相同,选择合适的声呐设备也至关重要。因此,如何提高声呐图像的识别效率,如何在小数据集样本中提高声呐图像的识别能力,如何融合多种声呐探测技术的识别结果变得尤为重要。

当前,水下目标识别通常是利用水下机器人搭载侧扫声呐对海底目标进行扫描,技术人员将扫描数据进行人工的识别。这种方法的识别检测效率相对较低,不利于大面积的应用。而声呐图像目标检测的技术通常是以图像分割、色度特征提取等人工设计特征提取的方式,结合分类器识别的结果对目标进行识别。这种需要大量的训练数据并且特征单一,未被广泛应用于实际。

发明内容

鉴于此,本发明提出一种声呐图像识别方法,通过迁移学习方式将三种声呐识别结果通过机器自学习模式识别并融合到仪器,减少声呐图像数量依赖,提高声呐图像识别结果。

其技术方案为:一种声呐图像识别方法,包括以下步骤:分别对前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集进行预处理;

对应前视声呐图像数据集、多波束测深声呐图像数据集和侧扫声呐图像数据集分别构建迁移学习模型并进行训练,获取对应的三组分类结果;

对三组分类结果分别求取识别率,并放入D-S证据决策理论算法中融合三组声呐图像识别的结果,得到声呐图像识别结果。

一种声呐图像识别装置,包括采集模块,用于采集前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集;

预处理模块,用于对前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集进行预处理;

训练模块,用于对应前视声呐图像数据集、多波束测深声呐图像数据集和侧扫声呐图像数据集分别构建迁移学习模型并进行训练并获取对应的三组分类结果;

融合模块,三组分类结果求取识别率,并放入D-S证据决策理论算法中融合三组声呐图像识别的结果,最终得到声呐图像识别结果。

一种电子设备,包括:处理器、存储器;

所述存储器,用于存储计算机程序;

所述处理器,用于通过调用所述计算机程序,执行如上述中任一种所述的声呐图像识别方法。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序用于被处理器执行时实现如上述任一种所述的声呐图像识别方法。

本发明的效果相比于现有技术,其优点在于:使用迁移学习需要的数据量较少,同时图像识别的数据集特征具有通用性,可以用较少的数据达到相近的深度学习识别效果;使用自适应的迁移模型方法,可以在原有少数据量的情况下得到识别结果,然后再通过识别过程获取的数据和标签改进模型参数提升识别效果;使用信息融合的方法,可以使某一类的低识别率的数据源在其他高识别率数据源条件下进行融合,提高整体的决策判断结果,减少某一低识别率特征对整体识别结果的影响;结合这两种方法,最终在小数据量的声呐图象数据集中实现目标准确率的提升。同时,这是一种同源异构数据的识别方法,针对同一目标的不同声呐图像特征,综合判定的一种识别策略,综合了迁移学习和信息融合的声呐图像识别方法,更好的在图像声呐领域应用,可以有效提升在识别的准确率,降低训练时间,同时提升系统的稳定性,避免单一声呐图像特征对识别过程造成影响。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图进行简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的系统流程框架构图;

图2为迁移学习流程图;

图3为特征融合流程图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。

下面结合附图对本发明中的具体实施方式的内容进行详细描述:

结合图1-3,本专利的实施方式。

一种声呐图像识别方法,包括以下步骤:分别对前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集进行预处理;对应前视声呐图像数据集、多波束测深声呐图像数据集和侧扫声呐图像数据集分别构建迁移学习模型并进行训练,获取对应的三组分类结果;对三组分类结果求取识别率,并放入D-S(Dempster-Shafer)证据决策理论算法中融合三组声呐图像识别的结果,最终得到声呐图像识别结果。

在传统图像识别领域,CNN(Convo l ut i ona l Neura l Network)卷积神经网络的识别准确率已经达到了人工识别的水平,同时衍生出的VGG16、ResNet模型对大量图像数据集的处理都达到了较高的水平。但是在声呐成像领域,由于声呐图像并非自然拍照图像而是通过声呐扫描回波的电信号构成的图像,与现实中图像关联性不大;且声呐图像领域不同于传统的图像识别领域,它的数据获取较为复杂,具有采集成本高、数据量少的特点,不利于应用这种传统的图像识别方法,因此无法用卷积神经网络直接对声呐图像进行识别。同时,声呐图像目标的特征提取方式和获取数据源也不尽相同。因此对于水下不同目标的识别,即便是引入迁移学习,也无法对某一种声呐图像达到理想的识别能力。本发明的迁移学习步骤中初始训练集迁移自其他模型数据,在测试过程中还可以根据测试数据的变化,同步进行更新学习,提升模型的适应度,提升单个模型的识别准确率。本申请采用迁移学习与D-S证据决策理论算法相结合,融合前视声呐图像、多波束测深声呐图像和侧扫声呐图像的识别集合,提高声呐图像的识别准确度。

在上述实施例的基础上,本发明进一步提出一种实施方式,即所述迁移学习模型构建步骤包括:选取CNN网络结构,利用I mageNet数据集进行训练,得到CNN目标网络;选取VGG16网络结构,利用I mageNet数据集进行训练,得到VGG16目标网络;选取FCN网络结构,利用I mageNet数据集进行训练,得到FCN(全卷积神经网络)目标网络;将前视声呐图像特征代入CNN网络结构得到CNN迁移学习模型,将侧扫声呐图像特征代入VGG16网络结构得到VGG16迁移学习模型,将多波束测深声呐图像特征代入FCN网络结构得到FCN迁移学习模型。

本实施方式中,由于前视声呐图像、多波束测深声呐图像和侧扫声呐图像各自之间的图像扫描特征都存在较大区别,仅采用一种迁移学习模型对声呐图像识别准确率非常低。本发明的声呐图像融合的难点在于特征识别模型的选择和决策策略的选取,特征识别模型要满足不同声呐图像的特征要求,同时还要适应网络参数的选取和数据的需要,本发明在满足上述要求的基础上结合迁移学习算法,提升模型识别效果。本发明在决策算法中选择用证据决策理论算法,将同源异构数据判断结果做决策分析,从决策层提升整体的判断效果,提高识别结果的预测精确度。结合这两种方法,避免单一声呐图像在特殊环境下识别率低的影响,最终在少数据量的数据集和多角度声呐图像数据中实现目标准确率的提升。

在上述实施例的基础上,本发明进一步的,采用迁移学习模型进行训练的步骤包括:分别根据前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集的图像数量调整对应的CNN迁移学习模型、VGG16迁移学习模型、FCN迁移学习模型;将前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集对应代入CNN迁移学习模型、VGG16迁移学习模型、FCN迁移学习模型,获得对应的三组分类结果。在本实施例中,根据不同声呐图像各自的特点及每个声呐图像集数量不同及识别需求,以CNN网络结构对前视声呐图像进行迁移训练、以VGG16目标网络对侧扫声呐图像进行训练和以FCN网络结构对多波束测深声呐图像进行训练是效率与准确度相对最佳的迁移学习方式。本发明的多波束测深声呐图像数据集相对采集较少,适合VGG16迁移学习模型;FCN迁移学习模型可以对声呐图像进行像素级的分类,适合侧扫声呐图像的识别过程。本发明的不同的数据集适合不同的网络训练模型,得到的识别准确率为各自网络下的最优解,再将最优解放入融合模块,提升目标整体判断的识别准确率。本发明结合上述三个模型的基础上进一步在决策算法中选择用证据决策理论算法,将通源异构的数据判断结果做决策分析,提升整体的判断效果,提高识别结果的预测精确度。

进一步的,在实施本发明的过程中,在迁移学习过程中对前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集进行预处理过程还包括,分别选取每组图像数据集的80%做训练集、20%做测试集。

将前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集对应代入CNN迁移学习模型、VGG16迁移学习模型、FCN迁移学习模型,获得对应的三组分类结果过程还包括,使用验证集评价不同网络的分类性能,如果过拟合或识别效果不明显,就退回步骤7重新训练。直到三组模型的分类结果均满足要求。

本发明采用D-S证据决策理论算法融合三组声呐图像识别结果。基于不确定推理的D-S(Dempster-Shafer)证据决策理论常用在目标跟踪、模式识别、医学图像等领域。在DS证据理论中,由互不相容的基本命题(假定)组成的完备集合称为识别框架,表示对某一问题的所有可能答案,但其中只有一个答案是正确的。以下举例说明

假设有四类目标需要识别,抽象系统的识别框架为:θ={A,B,C,D},根据先验概率,实际中无需把θ的所有组合情况完全考虑进去,仅考虑四种不同类型目标的概率模型分类情况。

基本概率分配函数为:m{A},m{B},m{C},m{D}。根据D-S理论,当前识别框架下mass函数可表述为:

根据上述公式,为了求得合成规则m

第一步,计算冲突因子K:

第二步,根据证据规则计算不同类别图像声呐的识别结果组合的BPA:

A类目标的识别结果组合的mass函数值:

在本发明中,将DS理论用于三种图像的融合,根据三组分类结果求取识别率,并放入D-S证据决策理论算法中融合三组声呐图像识别的结果,最终得到声呐图像识别结果。

本发明进一步提出一种声呐图像识别装置,包括采集模块,用于采集前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集;预处理模块,用于对前视声呐图像数据集、多波束测深声呐图像数据集、侧扫声呐图像数据集进行包括以切分、去噪或其他方式的预处理;训练模块,用于对应前视声呐图像数据集、多波束测深声呐图像数据集和侧扫声呐图像数据集分别构建相应迁移学习模型进行训练,再将经迁移学习模型得到的初始识别结果当做训练集重新输入模型进行训练,调整网络参数,增加训练的数据量,提升迁移学习模型的自适应能力,获取对应的三组分类结果;融合模块,三组分类结果求取识别率,并放入D-S证据决策理论算法中融合三组声呐图像识别的结果,得到声呐图像识别结果。

在上述装置的基础上,进一步本发明的所述装置还包括预学习模块,用于选取CNN网络结构,利用ImageNet数据集进行训练,构建CNN目标网络;选取VGG16网络结构,利用ImageNet数据集进行训练,构建VGG16目标网络;选取FCN网络结构,利用I mageNet数据集进行训练,构建FCN目标网络。

在上述实施例基础上,本发明还包括验证模块,用于验证集评价不同网络的分类性能。

进一步的,本发明提出一种电子设备,包括:处理器、存储器;

所述存储器,用于存储计算机程序;

所述处理器,用于通过调用所述计算机程序,执行上述实施例中中任一项实施例所述的声呐图像识别方法。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序用于被处理器执行时实现如上述实施例中任一项实施例所述的声呐图像识别方法。

相比于传统单一特征下的声呐图像识别效果,本发明增加多种特征联合的方法可以有效提高识别准确率,同时利用迁移学习可以减少数据量的使用,利用D-S证据决策理论算法可以使多种声呐图像特征的准确率融合,利用决策算法,提高识别的准确率。结合这两种方法,避免单一声呐图像在特殊环境下识别率低的影响,最终在少数据量的声呐图像数据集中实现目标准确率的提升。

本发明是一种同源异构数据的识别方法,针对同一目标的不同声呐图像特征,综合判定的一种识别策略。利用迁移学习和传统深度学习方法的结合,提取多源声呐图像数据模型,更好的在图像声呐领域应用,提升系统整体识别准确率,避免单一声呐图像特征在特定环境下识别准确率低对识别过程造成负面影响

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述一个或多个实施例是为了更好地解释本发明的原理和实际应用,从而使本技术领域的技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

技术分类

06120113791831