导航：首页> 机床；其他类目中不包括的金属加工>一种基于深度森林的小样本水中目标识别方法

一种基于深度森林的小样本水中目标识别方法

文献发布时间：2023-06-19 12:13:22

技术领域

本发明涉及信息信号处理领域，尤其涉及水声信号处理、非神经网络深度学习等理论，具体是一种水中目标识别方法。

背景技术

坚决维护国家海洋权益、建设海洋强国已经作为一项重要战略目标被纳入国家战略体系中。作为水声信号处理领域的重要研究方向之一，水中目标识别是研制现代化水下装备以及打赢来自海上的信息化局部战争的关键技术，对我国的海洋国防事业具有重要的意义。

目前，水中目标识别多采用传统的机器学习方法，例如支持向量机、随机森林、k近邻等。这些传统方法难以提取目标的深层特征，对于水中目标的分类识别能力有限。近年来，基于神经网络的深度学习模型发展迅速，其能够通过层层处理进行表征学习，自动学习到输入数据的深层特征，在计算机视觉、语音等领域已经取得了令人瞩目的成绩。然而，基于神经网络的深度学习模型需要大规模的训练数据来保证其学习效果，在样本量较少的水中目标识别领域表现往往不够理想。因此，亟需一种适合小样本情况的具有表征学习能力的水中目标识别方法。

发明内容

为了克服现有技术的不足，本发明提供一种基于深度森林的小样本水中目标识别方法。针对小样本情况下传统的机器学习方法以及基于神经网络的深度学习方法对水中目标的识别效果不够理想的问题，本发明采用水中目标辐射噪声信号的梅尔频率倒谱系数MFCC特征作为深度森林模型的输入数据，深度森林模型采用森林的级联结构实现对输入数据的逐层处理从而进行表征学习并根据级联森林最后一层的输出进行预测。同时，深度森林模型中级联森林的层数可以根据数据自适应地调整，模型复杂度与数据相匹配，适合小样本场景。与现有的水中目标识别方法相比，本发明所提供的方法能够有效地提高小样本情况下水中目标的识别精度。

针对小样本情况下传统的机器学习方法以及基于神经网络的深度学习方法对水中目标的识别效果不够理想的问题，本发明公开了一种基于深度森林的水中目标识别方法。该方法采用水中目标辐射噪声信号的梅尔频率倒谱系数MFCC特征作为深度森林模型的输入数据。

本发明解决其技术问题所采用的技术方案包括以下步骤：

步骤1，将水听器布放于海洋中，分别采录不同类别的水中目标的辐射噪声信号，并以时间t为单位对采录的信号进行切分，得到不同类别的水中目标的辐射噪声信号样本集；

步骤2，提取切分后的每个辐射噪声信号样本的梅尔频率倒谱系数MFCC特征，得到每个辐射噪声信号样本对应的特征向量；

步骤3，按照目标类别对特征向量分别打标签，得到数据集；

步骤4，将数据集随机打乱，按比例划分，构成训练集和测试集；

步骤5，构建仅包括级联森林的深度森林模型，具体步骤如下：

步骤5.1，构建m个完全随机树森林和m个随机森林作为级联森林的第一层；每个完全随机树森林包含n棵完全随机树；每个随机森林包含n棵决策树；m和n是任意正整数；

步骤5.2，构建级联森林的第二层，结构与步骤5.1级联森林的第一层相同；将步骤5.1的级联森林第一层的输出拼接在原始的输入MFCC特征向量上，作为级联森林第二层的输入；依此类推，共构建L层；L为正整数，是自定义的级联森林层数的最大值；

步骤6，在步骤4的训练集上训练步骤5得到的深度森林模型；级联森林每增加一层后，在训练集上进行模型的性能验证，当验证性能的识别准确率提升不超过阈值m时停止训练，此时得到最优的级联森林层数，从而得到对应的最优深度森林模型；

步骤7，在步骤4的测试集上测试最优深度森林模型，得到测试集的水中目标识别准确率。

所述时间t取5秒。

所述标签选择非负整数。

所述划分比例为6：4或7：3或8：2。

所述阈值m为0.001％。

本发明的有益效果在于在小样本情况下，针对传统方法对水中目标的识别效果不佳的问题，本发明提供了一种基于深度森林的水中目标识别方法。该方法采用了水中目标辐射噪声信号的梅尔频率倒谱系数MFCC特征作为输入特征向量，同时采用级联森林模型对输入特征向量进行层层处理从而实现表征学习。其中，级联森林的层数是根据输入数据自动确定的，因此模型复杂度与数据相匹配，模型适用于小样本情况。与支持向量机、决策树、随机森林、k近邻以及前向神经网络方法相比，本发明所提供的基于深度森林的方法能够有效地提高小样本情况下水中目标的识别准确率。

附图说明

图1是本发明的总体方法流程图。

图2是本发明结合具体实施例本发明的整体架构图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

针对小样本情况下传统的机器学习方法以及基于神经网络的深度学习方法对水中目标的识别效果不够理想的问题，本发明公开了一种基于深度森林的水中目标识别方法。该方法采用水中目标辐射噪声信号的梅尔频率倒谱系数MFCC特征作为深度森林模型的输入数据，主要包括以下步骤：

步骤1，将水听器布放于海洋中，分别采录不同类别的水中目标的辐射噪声信号，并以5秒为单位对采录的信号进行切分，得到不同类别的水中目标的辐射噪声信号样本集；

步骤2，提取切分后的每个辐射噪声信号样本的梅尔频率倒谱系数MFCC特征，得到每个辐射噪声信号样本对应的特征向量；

步骤3，按照目标类别对步骤2得到的特征向量分别打标签，标签选择0、1、2等非负整数，得到数据集；

步骤4，将步骤3得到的数据集随机打乱，按比例划分，构成训练集和测试集，划分比例选择6：4或7：3或8：2；

步骤5，构建仅包括级联森林的深度森林模型，具体步骤如下：

步骤5.2，构建级联森林的第二层，结构与步骤5.1所述级联森林的第一层相同；将步骤5.1所述级联森林第一层的输出拼接在原始的输入MFCC特征向量上作为级联森林第二层的输入；依此类推，共构建L层；L为正整数，是自定义的级联森林层数的最大值；

步骤6，在步骤4所述训练集上训练步骤5所述深度森林模型；级联森林每增加一层后在训练集上进行模型的性能验证，当验证性能的提升不超过0.001％时停止训练，得到最优的级联森林层数，从而得到最优的深度森林模型；

步骤7，在步骤4所述测试集上测试步骤6训练好的最优深度森林模型，得到测试集的水中目标识别准确率。

下面结合附图和具体实施例对本发明进行进一步说明，本发明包括但不仅限于下述实施例。

实施例

结合附图1和附图2，本发明基于深度森林的小样本水中目标识别方法，包括以下步骤：

步骤1，将水听器布放于海洋中，分别采录6类水中目标的辐射噪声信号并以5s为单位对采录的信号进行切分，得到6类水中目标的辐射噪声信号样本集；

步骤2，提取切分后的每个辐射噪声信号样本的梅尔频率倒谱系数MFCC特征，得到每个辐射噪声信号样本对应的特征向量，特征向量的维度选20；分帧时，帧长选2048，帧移选512；加窗选择汉宁窗；FFT点数选2048；Mel滤波器组中滤波器个数选128；信号的采样率选16000；

步骤3，按照目标类别对步骤2得到的特征向量分别打标签，标签选择0、1、2、3、4、5，得到数据集；

步骤4，将步骤3得到的数据集随机打乱后，按7：3划分，构成训练集和测试集；

步骤5，构建仅包括级联森林的深度森林模型，具体步骤如下：

步骤5.1，构建2个完全随机树森林和2个随机森林作为级联森林的第一层；每个完全随机树森林包含100棵完全随机树；每个随机森林包含100棵决策树；

步骤5.2，构建级联森林的第二层，结构与步骤5.1所述级联森林的第一层相同；将步骤5.1所述级联森林第一层的输出拼接在原始的输入MFCC特征向量上作为级联森林第二层的输入；依此类推，共构建20层；

步骤7，在步骤4所述测试集上测试步骤6训练好的最优深度森林模型，得到测试集的水中目标识别准确率。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：申晓红;董亚芬;王海燕;闫永胜;
专利申请人：西北工业大学;