掌桥专利:专业的专利平台
掌桥专利
首页

水声目标识别方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 19:58:21


水声目标识别方法、装置、电子设备及存储介质

技术领域

本发明涉及目标识别技术领域,尤其涉及一种水声目标识别方法、装置、电子设备及存储介质。

背景技术

水声目标识别是利用声纳设备采集的声信号来对水面和水下目标进行识别的技术。然而,由于海洋环境噪声不断增加以及水下目标降噪技术的改进,目标信号在低信噪比条件下往往会被噪声所掩盖。常规技术主要是依靠声纳员的谱图辨识、听音辨识和人工判断。因此,在识别水声目标时,声纳员会面临更大的困难,可能无法有效地提取目标信号的谱图特征,从而使得对目标进行分类和判断变得困难。

发明内容

本发明提供一种水声目标识别方法、装置、电子设备及存储介质,用以解决水声目标识别的问题。

第一方面,本发明提供一种水声目标识别方法,所述方法包括:

获取待识别目标数据,并利用预设的线谱检测模型对所述待识别目标数据进行特征提取以得到线谱特征;

将所述待识别目标数据输入至训练好的神经网络模型以得到特征相似度得分,并将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度;

将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果。

在本申请一实施例中,所述方法还包括:

在训练过程利用第一训练数据构建所述物理可分性特征库;

在训练过程利用第二训练数据对所述神经网络模型进行预训练。

在本申请一实施例中,所述在训练过程利用第一训练数据构建所述物理可分性特征库包括:

获取所述第一训练数据,其包括第一谱图和第二谱图;

利用所述线谱检测模型从所述第一谱图提取到第一线谱特征和从所述第二谱图提取到第二线谱特征;

根据所述第二线谱特征确定螺旋桨桨叶数,并根据所述第一线谱特征和所述螺旋桨桨叶数计算机桨传动转速比;

基于所述第一线谱特征、所述螺旋桨桨叶数以及所述机桨传动转速比构建所述物理可分性特征库。

在本申请一实施例中,获取所述第一训练数据的第一谱图包括:

对采集到的水声目标音频信号进行分帧,并对每帧信号进行傅里叶变换,以得到每帧信号在各个频率上的频谱,并对每帧信号的频谱进行功率谱计算,以得到每帧信号在各个频率上的功率值;

将连续多帧的功率谱按照预设的积分时间进行序贯相干累积,以得到所述第一谱图。

在本申请一实施例中,获取所述第一训练数据的第二谱图包括:

对采集到的水声目标音频信号进行带通滤波操作,并对经过带通滤波后的信号进行绝对值检波处理和低通滤波操作;

对经过低通滤波操作后的每帧信号进行傅里叶变换,以得到每帧信号的频谱,并对每帧信号的频谱进行功率谱计算,以得到每帧信号在各个频率上的功率值;

将连续多帧的功率谱按照预设的积分时间进行序贯相干累积,以得到所述第二谱图。

在本申请一实施例中,所述利用所述线谱检测模型从所述第一谱图提取到第一线谱特征和从所述第二谱图提取到第二线谱特征包括:

将所述第一谱图和所述第二谱图输入至所述线谱检测模型;

分别对所述第一谱图和所述第二谱图进行基于背景均衡的线谱增强操作、线谱提取操作、线谱跟踪操作以及线谱筛选操作后,以得到对应的包括线谱出现时间、线谱频率以及线谱幅值的第一线谱检测结果和第二线谱检测结果;

基于所述第一线谱检测结果,选取线谱幅值最高的预设根线谱作为所述第一线谱特征,以及基于所述第二线谱检测结果,选取其中一组符合预设要求的线谱作为所述第二线谱特征。

在本申请一实施例中,所述根据所述第二线谱特征确定螺旋桨桨叶数包括:

对所述第二线谱特征求其最小公约数以作为轴频;

在线谱出现的时间区间内,对所述第二谱图进行时间维度的叠加,以得到频率维的频谱结构;

基于所述频谱结构并结合所述轴频,按照预设规则确定所述螺旋桨桨叶数。

在本申请一实施例中,所述在训练过程利用第二训练数据对所述神经网络模型进行预训练包括:

获取所述第二训练数据,其包括第三谱图及其标签数据,所述第三谱图按照预设的积分时间进行序贯相干累积以得到所述第一谱图;

利用所述第二训练数据对所述神经网络模型进行预训练,以确定所述神经网络模型参数并得到所述训练好的神经网络模型。

在本申请一实施例中,所述神经网络模型使用基于ResNet26的深度学习模型框架,其包括前置卷积层、堆叠的卷积块以及全连接层;

其中,所述前置卷积层为所述神经网络模型的第一部分,其使用7x7大小的卷积滤波器和最大池化层;所述堆叠的卷积块为所述神经网络的第二部分,其包含4种不同大小的特征,通过将不同大小的卷积块堆叠在一起,以形成了深度不同的网络结构;所述全连接层为所述神经网络的第三部分,其用于将经过卷积和池化操作之后得到的特征映射到相应的类别空间。

在本申请一实施例中,所述将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度包括:

判断所述线谱特征是否包括第一谱图的第一线谱特征和第二谱图的第二线谱特征;

若所述线谱特征包括第一线谱特征和第二线谱特征,则根据所述第二线谱特征确定螺旋桨桨叶数,并根据所述第一线谱特征和所述螺旋桨桨叶数计算机桨传动转速比;

按照每条第一线谱特征占总权重的第一百分比、所述螺旋桨桨叶数占总权重的第二百分比以及所述机桨传动转速比占总权重的第三百分比,分别与所述物理可分性特征库进行特征匹配计算并根据预设的权重值进行加权处理以得到所述特征匹配置信度。

在本申请一实施例中,所述将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度包括:

若所述线谱特征只包括第一线谱特征,假设所述待识别目标数据包含的i条第一线谱特征与所述物理可分性特征库的第j条第一线谱特征在预设的误差范围内有n根线谱是相同的,则所述特征匹配置信度Wij=n/m,其中m为第j条第一线谱特征的总线谱数。

在本申请一实施例中,所述将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果包括:

若所述特征匹配置信度大于或等于预设阈值,则按照所述特征相似度得分占第一预设百分比和所述特征匹配置信度占第二预设百分比进行融合判决以得到所述目标识别结果;

若所述特征匹配置信度小于所述预设阈值,则按照所述特征相似度得分占第三预设百分比和所述特征匹配置信度占第四预设百分比进行融合判决以得到所述目标识别结果;

其中,所述第一预设百分比和所述第二预设百分比之和为1,所述第三预设百分比和所述第四预设百分比之和为1。

第二方面,本申请还提供一种水声目标识别装置,所述装置包括:

特征提取模块,用于获取待识别目标数据,并利用预设的线谱检测模型对所述待识别目标数据进行特征提取以得到线谱特征;

计算模块,用于将所述待识别目标数据输入至训练好的神经网络模型以得到特征相似度得分,并将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度;

目标识别模块,用于将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果。

第三方面,本申请还提供一种电子设备,包括存储器、处理器及存储在所述存储器并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的水声目标识别方法的步骤。

第四方面,本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的水声目标识别方法的步骤。

本发明提供的一种水声目标识别方法、装置、电子设备及存储介质,该方法通过线谱检测模型对待识别目标数据进行特征提取,获得线谱特征。然后,将所述待识别目标数据输入训练好的神经网络模型,得到特征相似度得分,用于评估所述待识别目标数据与已知目标的相似程度。同时,将所述线谱特征与训练过程中构建的物理可分性特征库进行比对,计算出特征匹配置信度,该特征匹配置信度反映了所述待识别目标数据与目标特征的匹配程度。最后,通过融合判决,综合考虑特征相似度得分和特征匹配置信度,以得出目标识别结果。

因此,本申请通过使用线谱检测模型提取线谱特征,可以降低海洋环境噪声对目标信号的影响,增强目标信号的可辨识度。其次,通过使用神经网络模型进行特征相似度得分计算,提高了目标识别的准确性和鲁棒性。此外,结合物理可分性特征库的特征匹配置信度评估,可以进一步提高目标识别的可靠性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的水声目标识别方法的流程图;

图2是本发明实施例提供的训练过程和预测过程的示意图;

图3是本发明实施例提供的线谱检测模型的示意图;

图4是本发明提供的水声目标识别装置的结构示意图;

图5是本发明实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。

以下对本发明涉及的技术术语进行描述:

水声目标识别可以应用于海洋学、海洋工程、水下探测与侦查等领域。在水下环境中,由于水声传播的特性,声波可以远距离传播,并且在水中与目标交互后发生反射、散射和折射等现象,这使得通过水声信号能够获取目标的相关信息。水声目标识别技术利用声纳设备获取水声信号,并结合信号处理、特征提取和模式识别方法,对目标的声学特征进行分析和解释,以实现对不同类型、形态和行为的水下目标进行辨识和分类。

为了解决现有技术中水声目标识别的问题,本发明提供了一种水声目标识别方法、装置、电子设备及存储介质,首先,线谱检测模型对待识别目标数据进行特征提取,获得线谱特征。然后,将所述待识别目标数据输入训练好的神经网络模型,得到特征相似度得分,用于评估所述待识别目标数据与已知目标的相似程度。同时,将所述线谱特征与训练过程中构建的物理可分性特征库进行比对,计算出特征匹配置信度,该特征匹配置信度反映了所述待识别目标数据与目标特征的匹配程度。最后,通过融合判决,综合考虑特征相似度得分和特征匹配置信度,以得出目标识别结果。本申请通过特征提取、特征比对以及融合判决等步骤,能够克服噪声干扰和低信噪比的问题,提高目标识别的准确性和可靠性。

下面结合图1-图5描述本发明的水声目标识别方法、装置、电子设备及存储介质。

请参考图1,图1是本发明提供的水声目标识别方法的流程图。一种水声目标识别方法,所述方法包括:

步骤101,获取待识别目标数据,并利用预设的线谱检测模型对所述待识别目标数据进行特征提取以得到线谱特征。

示例性地,所述待识别目标数据可以是LOFAR(Low frequency analysis andrecording)谱图、DEMON(Detection of Envelope Modulation On Noise)谱图、长积分LOFAR谱图以及长积分DEMON谱图的任一或其组合。

LOFAR图谱用于研究信号在较长时间内频谱特性的变化。可以采用滑动窗口的方式对一段时间内的水声信号进行频谱分析,得到不同时间段的频谱数据。LOFAR图谱通过展示信号能量分布随频率变化的曲线,能够描述信号在不同频率上的强度分布。

DEMON谱图基于舰船宽带噪声高频段存在的调制现象通过对接收的宽带信号进行解调以获得低频的包络谱,从而获得了诸如目标轴频、叶频等低频段较强的物理特征。

另外,长积分LORAR谱图是指将LOFAR图谱进行长时间累积处理得到的频谱图。通过对较长时间内的水声信号进行频谱分析并将多个频谱图叠加,可提高信噪比,进一步显示出信号的频率分布特性。

长积分DEMON谱图则是在DEMON谱图的基础上做进一步处理。长积分DEMON谱图通过对声纳信号的DEMON谱图分析结果在时间维进行多行序贯叠加,从而提高信号的信噪比。

线谱检测模型(Line Spectral Detection Model)是一种用于处理舰船辐射噪声信号的模型。它主要用于从舰船辐射噪声频谱中检测其线谱特征,提取线谱频率成分。

步骤102,将所述待识别目标数据输入至训练好的神经网络模型以得到特征相似度得分,并将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度。

特征相似度得分是衡量待比较特征与已知特征之间在某种相似性度量下的相似程度的评估指标。特征相似度得分的计算方法可根据任务的需求和所使用的特征表示方法而不同。在目标识别任务中,较高的特征相似度得分表示待识别目标与已知目标之间的相似性较高,可能属于同一类别或具有相似的属性。而较低的特征相似度得分则表示待识别目标与已知目标之间的差异性较大,可能属于不同类别或具有不同属性。

特征匹配置信度用于确定待匹配特征与已知特征之间的匹配程度或相似程度的可靠性。特征匹配置信度的计算方法可以根据具体任务和所使用的特征匹配算法而不同。在目标识别任务中,较高的特征匹配置信度表明待识别目标与已知目标之间的相似性较高,可能属于同一类别或具有相似的特征。而较低的特征匹配置信度则表明待识别目标与已知目标之间的差异性较大,可能是不同类别或具有不同属性的目标。

步骤103,将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果。

融合判决是指将不同的评估指标或得分以某种方式综合起来做出判断或决策。特征相似度得分和特征匹配置信度是两个评估指标,通过进行融合判决可以综合考虑它们的结果,从而得出更准确的目标识别结果。可以通过对特征相似度得分和特征匹配置信度进行加权计算或综合计算得到一个综合评估得分。而融合判决则是在该综合评估得分的基础上根据特定的规则或判断准则,做出最终的目标识别结果决策。

以下对上述步骤101~103进行具体描述。

请参考图2,图2是本发明实施例提供的训练过程和预测过程的示意图。一种水声目标识别方法,还包括:

步骤201,在训练过程利用第一训练数据构建物理可分性特征库。

步骤202,在训练过程利用第二训练数据对神经网络模型进行预训练。

在本申请的一些实施例中,上述步骤201中,在训练过程利用第一训练数据构建所述物理可分性特征库包括:

步骤2011,获取第一训练数据,其包括第一谱图和第二谱图。

示例性地,第一谱图可以是长积分LORAR谱图,第二谱图可以是长积分DEMON谱图。

示例性地,第一谱图可以由采集到的水声目标音频信号生成的,具体实现方式如下:

步骤20111,对采集到的水声目标音频信号进行分帧,并对每帧信号进行傅里叶变换,以得到每帧信号在各个频率上的频谱,并对每帧信号的频谱进行功率谱计算,以得到每帧信号在各个频率上的功率值。

例如,对水声目标音频采集信号按照窗长Win(对应一定的采样时间,可以为1s)、步长为50%的重叠(即窗长的一半)分为N帧,对每一帧信号做点数为NFFT(可以取1倍的采样点数)的傅里叶变换,计算每帧舰船辐射噪声信号的功率谱。

步骤20112,将连续多帧的功率谱按照预设的积分时间进行序贯相干累积,以得到第一谱图。

例如,对N帧的功率谱按照N1(对应积分时间,可以取10s)帧进行序贯相干累积,得到累积后的长积分LOFAR谱图。

示例性地,第二谱图可以由采集到的水声目标音频信号生成的,具体实现方式如下:

步骤20113,对采集到的水声目标音频信号进行带通滤波操作,并对经过带通滤波后的信号进行绝对值检波处理和低通滤波操作。

例如,对水声目标音频采集信号进行带通滤波,带通滤波的频带根据信号进行调节,然后进行绝对值检波,检波后进行100Hz以下的低通滤波。

步骤20114,对经过低通滤波操作后的每帧信号进行傅里叶变换,以得到每帧信号的频谱,并对每帧信号的频谱进行功率谱计算,以得到每帧信号在各个频率上的功率值。

例如,对滤波后的信号同样按照窗长Win(对应一定的采样时间,可以为1s)、步长为50%的重叠(即窗长的一半)分为N帧,对每一帧信号做点数为NFFT(可以通常取1倍的采样点数)的傅里叶变换,计算每帧信号的功率谱。

步骤20115,将连续多帧的功率谱按照预设的积分时间进行序贯相干累积,以得到第二谱图。

例如,对N帧的功率谱按照N1(对应积分时间,可以取10s)帧进行序贯相干累积,得到累积后的长积分DEMON谱图。

需要说明的是,上述步骤20111~步骤20112和步骤20113~步骤20115没有先后关系。

步骤2012,利用线谱检测模型从第一谱图提取到第一线谱特征和从所述第二谱图提取到第二线谱特征。其包括:

步骤20121,将第一谱图和第二谱图输入至线谱检测模型。

步骤20122,分别对第一谱图和第二谱图进行基于背景均衡的线谱增强操作、线谱提取操作、线谱跟踪操作以及线谱筛选操作后,以得到对应的包括线谱出现时间、线谱频率以及线谱幅值的第一线谱检测结果和第二线谱检测结果。

步骤20123,基于第一线谱检测结果,选取线谱幅值最高的预设根线谱作为所述第一线谱特征,以及基于所述第二线谱检测结果,选取其中一组符合预设要求的线谱作为所述第二线谱特征。

在本申请的一些实施例中,请参考图3,图3是本发明实施例提供的线谱检测模型的示意图。该线谱检测模型包括线谱增强模块、线谱提取模块、线谱跟踪模块以及线谱筛选模块。例如,其输入可以是长积分LOFAR谱图或长积分DEMON谱图。

需要说明的是,线谱检测模型可以接受多种形式的输入,例如包括谱图和时域信号等。具体使用哪种输入形式取决于任务需求、数据可用性和模型设计。

以下对线谱检测模型的各个模块进行具体描述。

(1)线谱增强模块

由于海洋环境噪声在时间上的非平稳性和空间上的非均匀性,导致噪声在时间和频率上的分布差异,影响了对弱信号的辨识和检测。利用背景均衡技术能有效过滤信号的随机起伏,改善长积分LOFAR谱图的显示质量,突出线谱信号,弱化背景噪声。

示例性地,可以采用双通分离窗的背景均衡方法,利用滑动窗估计背景噪声均值。

首先对一个局部区域计算均值,这个局部区域可以理解为是一个窗,它以点k为中心,可以用下面的式子来表示:

这个窗共有点数为:

对于L不等于0的情况,这个窗实际上就是以点k为中心的存在一个长度为2L-1的缺口的窗。在所分析的数据段首尾两端(1≤k≤M或者N-M+1≤k≤N)的点,无法计算估计值,因此其估计值就要分别使用第M+1点和第N-M点的估计值代替。对于其他的不属于这两个边缘区域的点,本地均值的估计值为:

式中,n(Rk)表示构成窗的点数。

另外,为了防止调制谱中出现幅度突变的信号而带来均值估计偏差,设定了以下准则:将每个x(k)都和(k)相比较,如果输入的值超过了

最后就得到了“背景噪声”的均值估计:

取M=L=对原始的长积分LOFAR谱图的每一行计算背景噪声,原始的长积分LOFAR谱图减去计算的背景噪声即可得到线谱增强后的长积分LOFAR谱图。

(2)线谱提取模块

对线谱增强后的长积分LOFAR谱图的每一行进行谱峰提取、谱峰合并、卡门限处理,得到单行的线谱位置。

首先对单行线谱进行归一化处理:

对每一点设置标志Flag(i),对y

式中,

谱峰所在点在局部地区为最大点,不可能出现在中间点上,因此剔除连续上升或连续下降中间点,只留下转折点。记为:

y

y

可得:

剔除极小值点,可得:

将剔除的点所在位置的值置为零,得到y

设置频率范围门限gate,将频率范围gate内的线谱看作同一根线谱,其频率局部最大值点为:

对剩下的局部最大值点进行卡门限处理,即可提取线谱特征。

(3)线谱跟踪模块

经线谱识别处理后保留下来的点,除了对应窄带信号形成的线谱点处,也有一部分对应着满足了线谱识别逻辑的噪声点,加上事先不知道窄带信号的数量和起止时间,经线谱识别后保留的谱值非零点,既可能是噪声点,又可能是窄带信号对应的线谱点;而窄带信号对应的线谱点可能对应窄带信号开始、终止,以及中间时刻。因此,为了能够判断经线谱识别处理后的谱值非零点是否对应窄带信号形成的线谱点,可进一步利用窄带信号在时间上的连续性,由窄带信号形成的谱线上必然会有更多的点被识别为线谱,这意味着可根据非零谱值点前后多个时刻识别出的线谱识别情况来判断该点是否是窄带信号对应的点。

①按频率从低到高找出M时刻的谱值非零点。

②从第M时刻的谱值非零点开始,向前后两侧搜索,统计两侧M个时刻的谱值非零点出现次数。频率搜索范围限定在相邻时刻最大频率偏移量的范围内,不妨设为2N+1;搜索中心是根据最近搜索结果外推的线谱最可能出现的频率点,其位置由下式来确定:

F

其中,F

由于窄带信号在一段时间上是一直存在的,其对应的线谱必然在时间上具有一定的连续性,并且同一窄带信号所对应的线谱在相邻时刻的峰值点之间的频率变化范围由信号的频率变化和多普勒频移决定,一般不会很大。对应窄带信号的线谱点,其线谱跟踪路径上出现的谱值非零点数应多于噪声点对应的跟踪路径上出现的谱值非零点数。因此可以根据上一步的线谱跟踪结果进一步剔除噪声点。

由于在M时刻识别出的非零峰值点,即可能是噪声点,又可能是窄带信号对应的线谱点。而窄带信号对应的线谱点可能对应窄带信号开始、终止,以及中间时刻。只要是与M时刻的非零点相邻的M行数据中搜索到的线谱数大于设置门限gate1,就认为该线谱点是窄带信号所对应的线谱点,否则,则认为是噪声点予以剔除。经过噪声点剔除处理后,随机噪声点基本上剔除干净。由于信号起伏、噪声干扰等原因,部分线谱点可能在线谱识别时被剔除,或原本就淹没在噪声中。若直接利用剔除后的结果进行目标识别,丢失的线谱必然影响系统的性能。

为了提高系统的性能,需要在进行目标检测和识别之前,产生中间丢失的线谱。具体方法是对M时刻判为线谱的点搜索下一时刻信号出现情况,若在搜索范围内信号丢失,根据前后识别线谱的情况,若丢失的是中间点,并且丢失时刻小于最大允许丢失的时刻数MM,则在线谱最可能出现的点,自动产生一个表示线谱信号的非零点,供下一时刻判断,中间丢失的信号点的位置,同样由上式来确定。

从处理过程可以看出,算法在实现过程中只要保存2M+1个时刻的谱值信息,并实时更新数据,则会自动输出前面第M时刻的处理结果,最后处理结果共延迟了M个时刻。

(4)线谱筛选模块

最终检测出的线谱点,按照时间维和频率维进一步卡门限,保证线谱持续时间并避免频率突变,最后筛选出虚警率较低的线谱频率、线谱幅值及线谱出现时间,以作为对应的第一线谱检测结果和第二线谱检测结果。

例如,对长积分LOFAR谱图进行线谱检测,取线谱幅值最高的5根线谱作为该条水声目标音频采集信号的线谱特征,若线谱间隔小于2Hz视为同一条线谱。

步骤2013,根据第二线谱特征确定螺旋桨桨叶数,并根据第一线谱特征和螺旋桨桨叶数计算机桨传动转速比。

例如,对长积分DEMON谱图通过线性检测模型进行如上述步骤2012的线谱检测,以获取到长积分DEMON谱的线谱频率、线谱幅值及线谱出现时间。

示例性地,所述根据所述第二线谱特征确定螺旋桨桨叶数包括:

步骤20131,对第二线谱特征求其最小公约数以作为轴频。

例如,取一组基本成倍频关系的线谱作为第二线谱特征,并求该第二线谱特征最小公约数作为轴频。

步骤20132,在线谱出现的时间区间内,对第二谱图进行时间维度的叠加,以得到频率维的频谱结构。

例如,对线谱出现时间区间内的长积分DEMON谱图进行时间维的叠加,得到频率维的频谱结构,结合轴频,按照以下表1示出的规则确定桨叶数,其中P(l)代表轴频第l次谐波线谱的幅值:

表1螺旋桨桨叶数判别规则

示例性地,所述根据所述第一线谱特征和所述螺旋桨桨叶数计算机桨传动转速比具体如下:

例如,舰船的发动机多为柴油机驱动,对于柴油机驱动的舰船,在长积分LOFAR谱图的低频部分可以看到一组间隔大致相同的谱线,这组谱线的个数为柴油机的汽缸数,这组谱线的间隔为柴油机的点火频率。柴油机大多为4冲程,所以曲柄转动频率为柴油机点火频率的2倍。曲柄转动频率除以螺旋桨轴频即可得到机桨传动转速比。

步骤2014,基于第一线谱特征、螺旋桨桨叶数以及机桨传动转速比构建物理可分性特征库。

可以理解的是,也可以基于第一线谱特征、第二线谱特征、螺旋桨桨叶数以及机桨传动转速比构建所述物理可分性特征库。

在本申请的一些实施例中,上述步骤202中,在训练过程利用第二训练数据对神经网络模型进行预训练包括:

步骤2021,获取第二训练数据,其包括第三谱图及其标签数据,对第三谱图进行按照预设的积分时间进行序贯相干累积以得到第一谱图。

例如,第三谱图可以是LOFAR谱图,第一谱图可以是长积分LOFAR谱图。

步骤2022,利用第二训练数据对神经网络模型进行预训练,以确定神经网络模型参数并得到训练好的神经网络模型。

示例性地,所述神经网络模型可以使用基于ResNet26的深度学习模型框架,其包括前置卷积层、堆叠的卷积块以及全连接层。

其中,所述前置卷积层为神经网络模型的第一部分,其使用7x7大小的卷积滤波器和最大池化层。

其中,所述堆叠的卷积块为神经网络的第二部分,其包含4种不同大小的特征,通过将不同大小的卷积块堆叠在一起,以形成了深度不同的网络结构。

其中,所述全连接层为神经网络的第三部分,其用于将经过卷积和池化等操作之后得到的特征映射到相应的类别空间。

在水声目标数据较为充足的情况下,可以利用深度学习模型框架进行预训练,建立一个初始的网络模型。然后,使用预训练模型的权重来初始化构建的网络模型。接下来,可以使用Resnet26网络模型进行模型训练,并通过使用dropout和mask-training等技术来避免过拟合问题,并达到较好的训练效果。Dropout是一种常用的正则化技术,通过在训练过程中随机丢弃一些神经元来减少过拟合。Mask-training是一种用于语音识别等任务的训练技术,通过在输入数据中随机屏蔽掩盖一定比例的特征来增加模型的鲁棒性。

通过使用Resnet26网络模型和一些避免过拟合的技术,旨在实现较好的训练效果。

在本申请的一些实施例中,上述步骤102中,将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度包括:

步骤1021,判断线谱特征是否包括第一谱图的第一线谱特征和第二谱图的第二线谱特征。

通过判断是否包括第一谱图的第一线谱特征和第二谱图的第二线谱特征,便于根据不同情况采取不同的特征匹配策略。

步骤1022,若线谱特征包括第一线谱特征和第二线谱特征,则根据第二线谱特征确定螺旋桨桨叶数,并根据第一线谱特征和螺旋桨桨叶数计算机桨传动转速比。

步骤1023,按照每条第一线谱特征占总权重的第一百分比、螺旋桨桨叶数占总权重的第二百分比以及机桨传动转速比占总权重的第三百分比,分别与物理可分性特征库进行特征匹配计算并根据预设的权重值进行加权处理以得到特征匹配置信度。

例如,线谱特征包括长积分LOFAR谱图的第一线谱特征和长积分DEMON谱图的第二线谱特征,那么按照以下权重进行特征匹配:

每个第一线谱特征权重占12%;

螺旋桨桨叶数权重占20%;

机桨传动转速比权重占20%。

然后,再根据预设的权重值进行加权处理以得到特征匹配置信度。

例如,第一线谱特征的匹配结果为A,螺旋桨桨叶数的匹配结果为B,机桨传动转速比的匹配结果C,则赋予A、B、C不同的权重以进行加权处理以得到特征匹配置信度。

步骤1024,若线谱特征只包括第一线谱特征,假设待识别目标数据包含的i条第一线谱特征与物理可分性特征库的第j条第一线谱特征在预设的误差范围内有n根线谱是相同的,则特征匹配置信度W

在本申请的一些实施例中,上述步骤103中,将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果包括:

步骤1031,若特征匹配置信度大于或等于预设阈值,则按照特征相似度得分占第一预设百分比和特征匹配置信度占第二预设百分比进行融合判决以得到目标识别结果,其中第一预设百分比和第二预设百分比之和为1。

例如,如果特征匹配置信度大于或等于50%,则按照特征匹配置信度占80%的权重,特征相似度得分占20%的权重来计算识别得分值,以得到目标识别结果。

步骤1032,若特征匹配置信度小于预设阈值,则按照特征相似度得分占第三预设百分比和特征匹配置信度占第四预设百分比进行融合判决以得到目标识别结果,其中第三预设百分比和第四预设百分比之和为1。

例如,如果特征匹配置信度小于50%,则按照特征匹配置信度占20%的权重,特征相似度得分占80%的权重来计算识别得分值,以得到目标识别结果。

因此,在识别过程中综合考虑特征匹配置信度和特征相似度得分,根据不同的权重比例计算识别得分值,并最终通过得分值确定待识别目标数据的类别。权重比例的选择可以根据特征匹配置信度的大小来确定的。

综上所述,本申请提供了一种基于物理可分性特征匹配和神经网络相结合的水声目标智能识别技术方案。该技术方案首先提出了将机桨传动转速比作为水声目标的特征,并给出了机桨传动转速比的计算方法。其次,通过基于物理可分性特征比对获取特征匹配的置信度,并结合特征相似度得分进行识别判决。最终的识别结果既具有物理特征的可解释性,又综合了谱图的全局信息。并且,解决了水声目标的智能识别问题。通过使用物理可分性特征和神经网络相结合的方法,可以提高对水声目标的识别准确度和鲁棒性。同时,利用机桨传动转速比作为特征之一,能够更好地描述水声目标的属性,并对其进行识别与分类。

由此可知,本申请通过综合利用物理可分性特征和谱图全局信息,可以更准确地识别水声目标,提高识别的准确度;由于使用了多种不同类型的特征以及综合判决方法,该技术对于不同的水声环境和目标情况具有较强的适应性和鲁棒性;通过采用物理可分性特征和机桨传动转速比等可解释性特征,可以提供对识别结果的物理解释,使得结果更易理解和应用;并且结合了物理可分性特征和神经网络模型,为水声目标智能识别领域提供了新的研究方向和思路。

下面对本发明提供的水声目标识别装置进行描述,下文描述的水声目标识别装置与上文描述的水声目标识别方法可相互对应参照。

请参考图4,图4是本发明提供的水声目标识别装置的结构示意图。一种水声目标识别装置400,包括特征提取模块401、计算模块402以及目标识别模块403。

示例性地,特征提取模块401用于:

获取待识别目标数据,并利用预设的线谱检测模型对所述待识别目标数据进行特征提取以得到线谱特征。

示例性地,计算模块402用于:

将所述待识别目标数据输入至训练好的神经网络模型以得到特征相似度得分,并将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度。

示例性地,目标识别模块403用于:

将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果。

示例性地,所述装置还包括训练模块,所述训练模块用于:

在训练过程利用第一训练数据构建所述物理可分性特征库;

在训练过程利用第二训练数据对所述神经网络模型进行预训练。

示例性地,所述训练模块还用于:

获取所述第一训练数据,其包括第一谱图和第二谱图;

利用所述线谱检测模型从所述第一谱图提取到第一线谱特征和从所述第二谱图提取到第二线谱特征;

根据所述第二线谱特征确定螺旋桨桨叶数,并根据所述第一线谱特征和所述螺旋桨桨叶数计算机桨传动转速比;

基于所述第一线谱特征、所述螺旋桨桨叶数以及所述机桨传动转速比构建所述物理可分性特征库。

示例性地,所述训练模块还用于:

对采集到的水声目标音频信号进行分帧,并对每帧信号进行傅里叶变换,以得到每帧信号在各个频率上的频谱,并对每帧信号的频谱进行功率谱计算,以得到每帧信号在各个频率上的功率值;

将连续多帧的功率谱按照预设的积分时间进行序贯相干累积,以得到所述第一谱图。

示例性地,所述训练模块还用于:

对采集到的水声目标音频信号进行带通滤波操作,并对经过带通滤波后的信号进行绝对值检波处理和低通滤波操作;

对经过低通滤波操作后的每帧信号进行傅里叶变换,以得到每帧信号的频谱,并对每帧信号的频谱进行功率谱计算,以得到每帧信号在各个频率上的功率值;

将连续多帧的功率谱按照预设的积分时间进行序贯相干累积,以得到所述第二谱图。

示例性地,所述训练模块还用于:

将所述第一谱图和所述第二谱图输入至所述线谱检测模型;

分别对所述第一谱图和所述第二谱图进行基于背景均衡的线谱增强操作、线谱提取操作、线谱跟踪操作以及线谱筛选操作后,以得到对应的包括线谱出现时间、线谱频率以及线谱幅值的第一线谱检测结果和第二线谱检测结果;

基于所述第一线谱检测结果,选取线谱幅值最高的预设根线谱作为所述第一线谱特征,以及基于所述第二线谱检测结果,选取其中一组符合预设要求的线谱作为所述第二线谱特征。

示例性地,所述训练模块还用于:

对所述第二线谱特征求其最小公约数以作为轴频;

在线谱出现的时间区间内,对所述第二谱图进行时间维度的叠加,以得到频率维的频谱结构;

基于所述频谱结构并结合所述轴频,按照预设规则确定所述螺旋桨桨叶数。

示例性地,所述训练模块还用于:

获取所述第二训练数据,其包括第三谱图及其标签数据,所述第三谱图按照预设的积分时间进行序贯相干累积以得到所述第一谱图;

利用所述第二训练数据对所述神经网络模型进行预训练,以确定所述神经网络模型参数并得到所述训练好的神经网络模型。

示例性地,所述神经网络模型使用基于ResNet26的深度学习模型框架,其包括前置卷积层、堆叠的卷积块以及全连接层;

其中,所述前置卷积层为所述神经网络模型的第一部分,其使用7x7大小的卷积滤波器和最大池化层;所述堆叠的卷积块为所述神经网络的第二部分,其包含4种不同大小的特征,通过将不同大小的卷积块堆叠在一起,以形成了深度不同的网络结构;所述全连接层为所述神经网络的第三部分,其用于将经过卷积和池化操作之后得到的特征映射到相应的类别空间。

示例性地,计算模块402还用于:

判断所述线谱特征是否包括第一谱图的第一线谱特征和第二谱图的第二线谱特征;

若所述线谱特征包括第一线谱特征和第二线谱特征,则根据所述第二线谱特征确定螺旋桨桨叶数,并根据所述第一线谱特征和所述螺旋桨桨叶数计算机桨传动转速比;

按照每条第一线谱特征占总权重的第一百分比、所述螺旋桨桨叶数占总权重的第二百分比以及所述机桨传动转速比占总权重的第三百分比,分别与所述物理可分性特征库进行特征匹配计算并根据预设的权重值进行加权处理以得到所述特征匹配置信度。

示例性地,计算模块402还用于:

若所述线谱特征只包括第一线谱特征,假设所述待识别目标数据包含的i条第一线谱特征与所述物理可分性特征库的第j条第一线谱特征在预设的误差范围内有n根线谱是相同的,则所述特征匹配置信度W

示例性地,目标识别模块403还用于:

若所述特征匹配置信度大于或等于预设阈值,则按照所述特征相似度得分占第一预设百分比和所述特征匹配置信度占第二预设百分比进行融合判决以得到所述目标识别结果;

若所述特征匹配置信度小于所述预设阈值,则按照所述特征相似度得分占第三预设百分比和所述特征匹配置信度占第四预设百分比进行融合判决以得到所述目标识别结果;

其中,所述第一预设百分比和所述第二预设百分比之和为1,所述第三预设百分比和所述第四预设百分比之和为1。

在此需要说明的是,本发明实施例提供的上述水声目标识别装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

图5是本发明实施例提供的电子设备的结构示意图,如图5所示,该电子设备可以包括:处理器(Processor)510、通信接口(Communications Interface)520、存储器(Memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行所述水声目标识别方法,所述方法包括:

获取待识别目标数据,并利用预设的线谱检测模型对所述待识别目标数据进行特征提取以得到线谱特征;

将所述待识别目标数据输入至训练好的神经网络模型以得到特征相似度得分,并将所述线谱特征与在训练过程构建的物理可分性特征库进行特征比对以得到特征匹配置信度;

将所述特征相似度得分和所述特征匹配置信度进行融合判决,以得到目标识别结果。

此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的水声目标识别方法。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的水声目标识别方法。

本发明实施例提供的一种电子设备、一种计算机程序产品、一种处理器可读存储介质,其上存储的计算机程序使处理器能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 一种漆面识别方法、装置、存储介质及电子设备
  • 欺诈行为识别方法、装置、电子设备及可读存储介质
  • 命名实体识别方法、装置、电子设备、机器可读存储介质
  • 一种虚假主叫识别方法、装置、电子设备及存储介质
  • 文本情感识别方法及装置、电子设备、存储介质
  • 水声目标探测训练方法、识别方法、装置、设备及介质
  • 目标识别方法、装置、电子设备及存储介质
技术分类

06120116480138