掌桥专利:专业的专利平台
掌桥专利
首页

基于声传感器阵列空域矩阵滤波的混叠鸟鸣声分离方法

文献发布时间:2024-04-18 20:02:18


基于声传感器阵列空域矩阵滤波的混叠鸟鸣声分离方法

技术领域

本发明涉及一种基于声学传感器阵列空域矩阵滤波技术的混叠鸟鸣声信号的分离方法,具体涉及一种利用空间声学传感器阵列采集野外同时发声的混叠鸟鸣声信号,利用发声鸟类目标声源的空间方位信息,采用声传感器阵列的空域矩阵滤波技术,实现混叠鸟鸣声信号分离的方法。

背景技术

利用鸣声对鸟类进行识别的过程中,由于受鸟类的集群生活习性影响,导致多个鸟类群落之间的同时鸣叫现象很普遍,野外采集鸟鸣声数据通常包含多只、多物种鸟类鸣声的混叠鸣声信号,这给野外环境下的鸟鸣声识别带来困难,是影响野外环境下鸟鸣声物种识别的重要因素。

在人类语音识别领域,语音增强和分离是稳健语音识别的重要预处理步骤。语音分离问题的主要研究方法有听觉场景分析技术和盲源分离技术,听觉场景分析技术从人的听觉生理及心理特性出发,模仿人类听觉系统的非线性处理方法,许多研究者试图通过这一理论来实现人耳的“鸡尾酒会效应”,但算法复杂,很难用于实际应用。盲源分离技术基于独立成分分析(Independent Component Analysis,ICA)理论,假定各声源信号之间相互独立,并且满足瞬时混合模型,盲源分离算法在应用时需要事先估计目标声源个数,目标数量估计的准确性严重影响算法的分离性能,并且存在分离不确定性等问题。近年来,基于声传感器阵列和自适应波束形成技术的多通道语音分离技术逐渐成为语音分离的主流趋势,多通道语音分离系统除了可以获得阵元信号之间的更多声学特性信息,还可以利用目标声源的空间方位信息,使语音分离性能显著提升。

空域矩阵滤波技术是一种新兴的阵列信号处理技术,其数学基础是利用一个系数矩阵与阵列快拍数据相乘,输出仍保留阵元域数据的特性,这种矩阵运算称为矩阵滤波。具有空域滤波特性的矩阵滤波称为空域矩阵滤波。空域矩阵滤波的实现方法是,通过对空间方位划分通带和阻带,得到一个空域系数矩阵,对阵列数据滤波,该滤波器可以使通带内的信号无失真通过,同时阻带内信号被抑制,从而实现抑制阻带干扰的目的。由于空域矩阵滤波输出得到阵元域信号,可以很容易的实现混叠语音信号的分离。

发明内容

本发明的目的在于针对野外环境下多只、多种、同时发声的混叠鸟鸣声信号分离问题,本发明利用声传感器阵列和空域矩阵滤波技术,利用不同发声目标声源的空间方位信息差异,通过空间干扰抑制的方法,实现混叠鸟鸣声信号分离。

为达到上述目的,本发明通过下述技术方案实现。

本发明提出了一种基于声传感器阵列空域矩阵滤波的混叠鸟鸣声分离方法,该方法包括以下步骤:

S1.选取一种鸟鸣声作为目标信号;

S2.根据目标信号的波长计算声传感器阵元间距;

S3.根据计算的阵元间距,布放声传感器阵列,通过每个阵元分别接收多个声源的混叠鸟鸣声信号;

S4.利用阵列波束形成技术,根据声传感器阵列接收的混叠鸟鸣声信号估计发出目标信号的声源方位;

S5.对于每个发出目标信号的声源方位,分别设计空域矩阵滤波器,并使目标信号位于滤波器的通带区域,其他干扰信号位于滤波器的阻带区域;

S6.通过空域矩阵滤波器对声传感器阵列接收的混叠鸟鸣声信号数据进行滤波,获得各个声源方位的纯净目标信号;

S7.选取另一种鸟鸣声作为目标信号;

S8.重复步骤S2-S7,直到获得混叠鸟鸣声中所有的纯净鸟鸣声信号,实现混叠鸟鸣声信号的分离。

作为上述技术方案的改进之一,所述步骤S2中声传感器阵元间距d的计算式为:

其中,λ为目标信号的波长。

作为上述技术方案的改进之一,所述步骤S3中,声传感器阵列为M个声传感器阵元组成的等间距直线声基阵。

作为上述技术方案的改进之一,所述步骤S3中,每个声传感器阵元采集的混叠鸟鸣声信号均满足下式:

其中,t为时刻,x

作为上述技术方案的改进之一,所述步骤S4具体包括:

S4-1.利用阵列波束形成技术,根据声传感器阵列的阵型生成波束形成器;

S4-2.利用波束形成器对接收的混叠鸟鸣声信号中各个鸟鸣声信号在各个角度进行扫描测量,并输出每个鸟鸣声信号在每个角度的平均功率;

S4-3.判断每个鸟鸣声信号平均功率的极大值及极大值对应的角度,极大值对应的角度即为鸟鸣声信号对应的目标声源的方位。

作为上述技术方案的改进之一,所述步骤4-2中,输出的每个鸟鸣声信号在每个角度的平均功率,均满足下式:

P

其中,θ表示波束形成器的扫描角度;P

w

上标T表示转置,R

R

其中,E{·}表示期望运算。

作为上述技术方案的改进之一,所述步骤S5具体包括:

S5-1.根据得到的每个声源方位,获得声传感器阵列在各个声源方位的阵列流形矩阵;

S5-2.基于获得的声传感器阵列在各个声源方位的阵列流形矩阵,在每个声源方位设计空域矩阵滤波器,并使目标信号位于滤波器的通带区域,其他干扰信号位于滤波器的阻带区域,获得通带区域和阻带区域对应的阵列流形矩阵。

作为上述技术方案的改进之一,所述步骤S5-1中,声传感器阵列在各个声源方位的流形矩阵A均满足下式:

A=[a(θ

式中,a(θ

作为上述技术方案的改进之一,所述步骤5-2中设计的空域矩阵滤波器W均满足下式:

W=V

其中,V

其中,P和S分别为通带区域和阻带区域离散化的点数,a(θ

作为上述技术方案的改进之一,所述空域矩阵滤波器输出y(t)均满足下式:

y(t)=WAs(t)+Wn(t)

其中,s(t)为阵元接收的各个声源传来的的鸟鸣声信号,n(t)为阵元接收的环境噪声;空域矩阵滤波器使通带区域内的目标信号通过,阻带区域内的干扰信号被抑制,即满足下式:

其中,a(θ

常规的自适应波束形成技术实现语音分离,通常得到待分离语音信号的波束域数据,需要经过复杂的数学运算转换为时域语音信号,本发明的优点是利用目标声源的空间方位信息,通过空域矩阵滤波方法在时域直接分离混叠鸟鸣声信号。带来的有益效果在于通过对混叠鸟鸣声信号的分离处理,为后端鸟鸣声信号的检测和识别提供纯净的鸟鸣声信号,提升后续信号处理的性能,同时降低了算法的复杂度。

附图说明

图1为等间距直线阵列模型示意图;

图2为基于空域矩阵滤波的混叠鸟鸣声分离流程图;

图3为经空域矩阵滤波分离前后的目标1的混叠鸟鸣声信号的时域波形图,其中,图3(a)为目标1原信号时域波形图,图3(b)为针对目标1设计的阵列接收混叠信号时域波形图,图3(c)为分离得到的目标1信号时域波形图;

图4为经空域矩阵滤波分离前后的目标1的混叠鸟鸣声信号的频谱图,其中,图4(a)为目标1原信号频谱图,图4(b)为针对目标1设计的阵列阵元接收混叠信号频谱图,图4(c)为分离得到的目标1信号频谱图;

图5为经空域矩阵滤波分离前后的目标2的混叠鸟鸣声信号的时域波形图,其中,图5(a)为目标2原信号时域波形图,图5(b)为针对目标2设计的阵列阵元接收混叠信号时域波形图,图5(c)为分离得到的目标2信号时域波形图;

图6为经空域矩阵滤波分离前后的目标2的混叠鸟鸣声信号的频谱图,其中,图6(a)为目标2原信号频谱图,图6(b)为针对目标2设计的阵列阵元接收混叠信号频谱图,图6(c)为分离得到的目标2信号频谱图;

图7为经空域矩阵滤波分离前后的目标3的混叠鸟鸣声信号的时域波形,其中,图7(a)为目标3原信号时域波形图,图7(b)为针对目标3设计的阵列阵元接收混叠信号时域波形图,图7(c)为分离得到的目标3信号时域波形图;

图8为经空域矩阵滤波分离前后的目标3的混叠鸟鸣声信号的频谱图,其中,图8(a)为目标3原信号频谱图,图8(b)为针对目标3设计的阵列阵元接收混叠信号频谱图,图8(c)为分离得到的目标3信号频谱图。

具体实施方式

对于野外采集混叠鸟鸣声信号,当同时发声的多个鸟类目标位于空间不同的方位,将多个发声鸟声源分别建模为目标和干扰声源,利用空域矩阵滤波技术对声传感器阵列采集的混叠鸟鸣声信号进行空域矩阵滤波处理,就可以实现将空间不同方位的混叠鸟鸣声信号在阵元域进行分离。

本发明利用声传感器阵列空域矩阵滤波技术,利用空间多个同时发声的鸟类目标声源的空间方位信息,实现混叠鸟鸣声信号的分离。

本发明通过在野外布放声传感器阵列,采集混叠鸟鸣声信号。首先通过阵列波束形成技术,估计空间多个发声目标声源的目标方位;接着,在每个目标方位,分别设计一个满足空域滤波特性的空域矩阵滤波器,使感兴趣的目标位于通带,其他干扰目标位于阻带;空域矩阵滤波器具有使通带内的信号无失真的通过、阻带内的信号被抑制,并且输出的仍为阵元域信号的特性,将基阵快拍数据经过空域矩阵滤波器滤波,滤波器输出即为通带方位的纯净鸟鸣声信号。同理,在每个目标入射方位,分别设计空域矩阵滤波器,经多次滤波,就可以依次分离出多个方位的鸟鸣声信号,实现混叠鸟鸣声信号的分离。

以下结合实施例进一步说明本发明所提供的技术方案。

本发明实施例具体的技术方案如下:

1)利用波束形成技术测量空间多目标声源的目标方位

在空间布放一个由M个阵元组成的等间距直线声基阵,阵元间距为

在野外开阔空间,不考虑声反射等多径传输的影响,在此模型下,接收阵第m个阵元接收到的信号为各目标声源信号的线性叠加,表达式为:

式中,x

利用阵列波束形成(beamforming,BF)技术,估计空间K个声源的目标方位。对于等间距直线阵列模型,波束形成器测向表达式为:

P

式中,P

R

R

将(2)式中的θ由-180°~180°进行扫描,找到P

2)空域矩阵滤波器设计

空域矩阵滤波器设计的基本原理是,将全空间方位划分为通带区域和阻带区域,按优化思想设计一个滤波器作用于阵列方向向量,使通带区域内信号无失真通过,阻带区域内信号被抑制。

根据步骤1)得到的目标方位估计值,得到接收阵阵列流形矩阵为:

A=[a(θ

式中,a(θ

设计空域矩阵滤波器W对阵列接收数据进行滤波,滤波器的输出为:

y(t)=WAs(t)+Wn(t) (7)

为使通带内信号通过,阻带内信号被抑制,该滤波器应满足:

式中,Θ

P和S分别为通带区域和阻带区域离散化的点数。

采用优化设计思想,按最小二乘法求解系数矩阵W,表达式为:

3)混叠鸟鸣声信号分离

利用步骤1)得到的目标方位,在当前目标入射方位设计一个空域矩阵滤波器,使当前方位θ

考虑监测区域空间内同时存在3个目标声源,目标方位分别为θ

(1)以目标1为目标声源设计空域矩阵滤波器,通带中心角度取θ

(2)以目标2为目标声源设计空域矩阵滤波器,通带中心角度取θ

(3)以目标3为目标声源设计空域矩阵滤波器,通带中心角度取θ

通过图3~图8的处理结果可以看到,利用本发明的技术方案,可以实现空间3个不同入射方位目标声源混叠信号的分离。当空间存在任意N个目标声源,只要目标声源之间存在方位差异,即可通过N次空域矩阵滤波,实现任意N个目标声源混叠信号的分离。

从上述对本发明的具体描述可以看出,本发明的一种基于声传感器阵列空域矩阵滤波技术的混叠鸟鸣声信号的分离方法,利用鸣声对鸟类进行物种识别的过程中,由于受鸟类的集群生活习性影响,导致多个鸟类群落之间的同时鸣叫现象很普遍,野外采集鸟鸣声数据通常包含多只、多物种鸟类鸣声的混叠鸣声信号,这给野外环境下的鸟鸣声识别带来困难,是影响野外鸟鸣声识别的重要因素。空域矩阵滤波技术是一种新兴的阵列信号处理技术,利用空间同时发声的多个鸟类目标声源的空间方位信息的差异,实现混叠鸟鸣声信号的分离,并且空域矩阵滤波的输出可以直接得到阵元域数据,很容易的实现混叠语音信号的分离。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

技术分类

06120116579032