掌桥专利:专业的专利平台
掌桥专利
首页

基于语音分析的森林枪声定位方法

文献发布时间:2024-04-18 20:00:50


基于语音分析的森林枪声定位方法

技术领域

本申请涉及语音处理技术领域,具体涉及基于语音分析的森林枪声定位方法。

背景技术

由于森林中的风吹过树叶、草丛等植物时会产生噪声,并且在枪声响起的同时,通常会引发森林中动物的鸣叫,这些问题均造成利用麦克风阵列采集的声音信号数据中包含较多噪声、动物鸣叫声等干扰数据,在使用声源定位算法对枪声信号进行定位时,例如MUSIC(Multiple Signal Classification,多重信号分类)算法,容易将动物的鸣叫误认为是枪声信号的声源进行定位,导致枪声的定位结果出现较大的误差。而且由于森林中存在大量的树木和植被,而枪声信号属于高频信号,在传播的过程中容易被空气、树木和植被等吸收,并且动物的声音也会和枪声信号形成混合信号,导致麦克风阵列采集到的枪声信号损失了过多的可用信息,影响枪声定位结果的精度。

发明内容

本申请提供基于语音分析的森林枪声定位方法,以解决通过语音分析对森林中枪声定位准确性低的问题,所采用的技术方案具体如下:

本申请一个实施例提供了基于语音分析的森林枪声定位方法,该方法包括以下步骤:

获取森林中的声音信号数据,将森林中每个声音信号采集点的麦克风阵列中每个阵元麦克风的声音信号数据转换为语谱图;

根据每个阵元麦克风对应的语谱图中每个数据点的局部能量特征构建声音高能量聚集度;根据每个阵元麦克风对应的语谱图中每个数据点对应的声音高能量聚集度构建语谱图中每列数据点的高能量频带和低能量频带;根据每个阵元麦克风对应的语谱图中每列数据点的高能量频带和低能量频带计算高能量频带集中覆盖率;基于每个阵元麦克风对应的语谱图中每列数据点对应的高能量频带集中覆盖率计算枪声马赫波疑似度;

根据每个阵元麦克风对应的语谱图中所有列的枪声马赫波疑似度获取森林中每个声音信号采集点对应的马赫波数据矩阵,基于马赫波数据矩阵获取森林中枪声所在的方向角度的定位结果。

优选的,所述根据每个阵元麦克风对应的语谱图中每个数据点的局部能量特征构建声音高能量聚集度的方法为:

将每个阵元麦克风对应的语谱图中所有的数据点的能量值作为输入,采用密度峰值聚类算法获取所述语谱图中每个数据点的局部声音能量密度;

以每个阵元麦克风对应的语谱图中每个数据点为中心构建预设大小的局部窗口,根据所述语谱图中每个数据点的局部窗口内不同数据点之间的局部声音能量密度和能量值差异计算能量分布相似聚集度;

根据每个阵元麦克风对应的语谱图中每个数据点的局部窗口对应的能量分布相似聚集度计算每个数据点的声音高能量聚集度。

优选的,所述根据所述语谱图中每个数据点的局部窗口内不同数据点之间的局部声音能量密度和能量值差异计算能量分布相似聚集度的具体方法为:

对于每个阵元麦克风对应的语谱图中每个数据点的局部窗口,将所述局部窗口内每个数据点的局部能量密度与能量值的乘积作为第一聚集系数,将所述局部窗口内任意两个数据点对应的第一聚集系数之差的绝对值作为第二聚集系数;

将所述局部窗口内任意两个数据点之间的欧氏距离作为第三聚集系数,将所述局部窗口内任意两个数据点对应的第二聚集系数与第三聚集系数的乘积与预设参数之和的倒数作为所述局部窗口内任意两个数据点之间的能量分布相似聚集度。

优选的,所述根据每个阵元麦克风对应的语谱图中每个数据点的局部窗口对应的能量分布相似聚集度计算每个数据点的声音高能量聚集度的具体方法为:

对于每个阵元麦克风对应的语谱图中每个数据点的局部窗口,将所述局部窗口内的任意两个数据点之间的能量分布相似聚集度在局部窗口上累加结果的均值作为第一高能量系数;将所述局部窗口内所有数据点能量值的均值作为第二高能量系数,将所述局部窗口的第一高能量系数与第二高能量系数的乘积作为所述语谱图中每个数据点的声音高能量聚集度。

优选的,所述根据每个阵元麦克风对应的语谱图中每个数据点的声音高能量聚集度构建语谱图中每列数据点的高能量频带和低能量频带的方法为:

采用阈值分割算法获取每个阵元麦克风对应的语谱图中所有数据点的声音高能量聚集度的分割阈值,将所述语谱图中声音高能量聚集度大于等于分割阈值的数据点作为声音高能量聚集点,将所述语谱图中声音高能量聚集度小于分割阈值的数据点作为声音低能量聚集点;

对于每个阵元麦克风对应的语谱图中的每列数据点,将每列数据点中声音高能量聚集点的能量值置为1,将每列数据点中声音低能量聚集点的能量值置为0,将每列数据点能量值更新后的数据组成的序列作为频带分析序列,采用连通域分析算法获取频带分析序列的连通域,将频带分析序列中元素均为1的连通域作为高能量频带,将频带分析序列中元素均为0的连通域作为低能量频带。

优选的,所述根据每个阵元麦克风对应的语谱图中每列数据点的高能量频带和低能量频带计算高能量频带集中覆盖率的方法为:

对于每个阵元麦克风对应的语谱图中每列数据点,将每列数据点中任意一个高能量频带中所有数据点的能量值的标准差的映射结果作为第一集中系数,将第一集中系数在每列数据点的所有高能量频带上的累加结果作为第二集中系数;将每列数据点中任意一个低能量频带中所有数据点的能量值的标准差的映射结果作为第三集中系数,将第三集中系数在每列数据点中所有低能量频带上的累加结果作为第四集中系数,将第二集中系数与第四集中系数的乘积作为每列数据点的语谱频带能量集中度;

将每列数据点中任意一个高能量频带中所有数据点的能量值的均值作为第一差异系数,将每列数据点中任意一个低能量频带中所有数据点的能量值的均值作为第二差异系数,将第一差异系数与第二差异系数之差的绝对值的映射结果作为第三差异系数,将第三差异系数在每列数据点上的累加结果作为每列数据点的频带能量差异系数;

根据每个阵元麦克风对应的语谱图中每列数据点的语谱频带能量集中度、频带能量差异系数和每列数据点的频带分布特征计算高能量分布集中度;根据每个阵元麦克风对应的语谱图中每列数据点的高能量分布集中度和高能量频带的频带宽度获取高能量频带集中覆盖率。

优选的,所述根据每个阵元麦克风对应的语谱图中每列数据点的语谱频带能量集中度、频带能量差异系数和每列数据点的频带分布特征计算高能量分布集中度的具体方法为:

对于每个阵元麦克风对应的语谱图中每列数据点,分别将每列数据点中每个高能量频带、低能量频带中所有数据点之间频率差值的最大值作为每个高能量频带、低能量频带的频带宽度;

将每列数据点的语谱频带能量集中度与频带能量差异系数的比值作为分子,将每列数据点中相邻两个高能量频带之间所有低能量频带的频带宽度的和作为第一分布系数,将第一分布系数在每列数据点上累加结果的均值与预设参数的和作为分母,将分子与分母的比值作为每列数据点的高能量分布集中度。

优选的,所述根据每个阵元麦克风对应的语谱图中每列数据点的高能量分布集中度和高能量频带的频带宽度获取高能量频带集中覆盖率的方法为:

对于每个阵元麦克风对应的语谱图中每列数据点,计算每列数据点中所有高能量频带的频带宽度的均值,将所述均值与每列数据点的高能量分布集中度的乘积作为每列数据点的高能量频带集中覆盖率。

优选的,所述基于每个阵元麦克风对应的语谱图中每列数据点对应的高能量频带集中覆盖率计算枪声马赫波疑似度的方法为:

对于每个阵元麦克风对应的语谱图中每列数据点,将每列数据点中所有高能量频带的频带宽度的和作为频带覆盖率,获取以每列数据点为中心列所取短时区间内所有列的频带覆盖率,将所述短时区间内每一列的序号为横坐标,将每一列的频带覆盖率为纵坐标,将横坐标和纵坐标确定的数据点的拟合直线的斜率作为每列数据点的短时高能覆盖率;

将以每列数据点为中心列所取短时区间内每一列的短时频带覆盖率变化指数与中心列的短时频带覆盖率变化指数之差的平方作为第一疑似系数,将第一疑似系数在以每列数据点为中心列所取短时区间上累加结果的均值与每列数据点的短时频带覆盖率变化指数的映射结果的乘积作为第二疑似系数,将第二疑似系数与预设参数的和作为分母,将每列数据点对应的高能量频带集中覆盖率作为分子,将分子与分母的比值作为每列数据点的枪声马赫波疑似度。

优选的,所述根据每个阵元麦克风对应的语谱图中所有列的枪声马赫波疑似度获取森林中每个声音信号采集点对应的马赫波数据矩阵,基于马赫波数据矩阵获取森林中枪声所在的方向角的方法为:

将每个阵元麦克风对应的语谱图中所有列的枪声马赫波疑似度作为输入,利用最大类类间方差算法获取所述语谱图中所有列的分割结果,将所有列的分割结果作为基音同步叠加算法的输入,获取所述语谱图的拼接数据序列,将每个所述拼接数据序列作为集合中的一个元素,将所有所述拼接数据序列组成的集合作为马赫波数据序列集合,将马赫波数据序列集中所有元素按照时间升序顺序进行排序组成的序列作为每个阵元麦克风的马赫波数据序列;

将每个阵元麦克风的马赫波数据序列作为矩阵中一行元素,将麦克风阵列中所有阵元麦克风的马赫波数据序列组成的矩阵作为每个声音信号采集点的麦克风阵列的枪声马赫波数据矩阵,将所述枪声马赫波数据矩阵的K等划分的结果作为MUSIC算法的输入,获取每个声音信号采集点的麦克风阵列的马赫波方向角度序列,将所述马赫波方向角度序列作为LSTM神经网络模型的输入,获取每个声音信号采集点的森林中枪声所在的方向角度的定位结果。

本申请的有益效果是:通过分析声音信号数据中的声音能量的局部分布特征和聚集特征构建声音高能量聚集度,通过声音高能量聚集度反应声音信号数据中局部信号特征的能量差异,提高分析声音信号中枪声信号的马赫波能量的特征的准确性,进一步的,根据声音高能量聚集度构建声音信号数据对应的语谱图中的高能量频带和低能量频带,通过高能量频带和低能量频带的分布特征差异构建高能量频带集中覆盖率,通过高能量频带集中覆盖率反应声音信号数据中的马赫波的声音信号特征,提高声音信号中对马赫波的识别的准确性,根据高频能量频带集中覆盖率构建枪声马赫波疑似度,基于枪声马赫波疑似度利用MUSIC算法和LSTM神经网络模型获取森林中枪声所在的方向角度,其有益效果在于可以准确识别森林中采集的声音信号数据中的马赫波,提高通过森林中采集的声音信号的分析对枪声定位的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一个实施例所提供的基于语音分析的森林枪声定位方法的流程示意图;

图2为本申请一个实施例所提供的获取森林中枪声定位结果的实施过程的示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参阅图1,其示出了本申请一个实施例提供的基于语音分析的森林枪声定位方法的流程图,该方法包括以下步骤:

步骤S001,获取森林中的声音信号数据。

将森林所在的区域划分成

以森林的中心为原点设置一个平面坐标系,获取每个麦克风阵列的几何阵列信息向量,几何阵列信息向量中的各个元素分别表示麦克风阵列中各个阵元麦克风在平面坐标系中的投影坐标以及方向角。

至此,获取了森林中每个声音采集点的声音信号数据。

步骤S002,将每个声音信号采集点的麦克风阵列的每个阵元麦克风的声音信号数据转换为语谱图,根据语谱图中每个数据点的局部能量特征构建局部声音能量密度,根据局部声音能量密度构建声音高能量聚集度。

将枪声产生的声音信号记为枪声信号,枪声信号主要由膛口波和马赫波组成,一般持续时间为几百毫秒到几秒,膛口波是指子弹出膛后喷出枪口的气流形成的,一般持续时间为

进一步的,对于每个声音信号采集点采集的声音信号数据,将每个声音信号采集点中麦克风阵列中每个阵元采集的声音信号数据进行分析,具体的,例如森林中第

进一步的,将

进一步的,枪声信号通常具有较大的能量,但麦克风阵列中每个阵元在声音信号数据采集的过程中会受到噪声的干扰,使

具体的,输入为

式中,

进一步的,根据语谱图中每个数据点对应的能量分布相似聚集度计算每个数据点的声音高能量聚集度,具体的计算公式如下:

式中,

若语谱图中

至此,获取了语谱图中每个数据点对应的声音高能量聚集度。

步骤S003,根据语谱图中每个数据点对应的声音高能量聚集度获取语谱图中每帧声音信号的高能频带集中覆盖率,根据高能频带集中覆盖率获取枪声马赫波疑似度。

在森林中,枪声出现的同时会引起部分动物发出鸣叫,这会造成

具体的,输入为

进一步的,对于语谱图中的每帧声音信号,即语谱图中的每列数据点,将每列数据点中声音高能量聚集点的能量值置为1,将每列数据点中声音低能量聚集点的能量值置为0,将每列数据点能量值更新后的数据组成的序列作为频带分析序列;输入为频带分析序列,采用连通域分析算法获取频带分析序列的连通域,将频带分析序列中元素均为1的连通域作为高能量频带,将频带分析序列中元素均为0的连通域作为低能量频带,分别将每个高能量频带和每个低能量频带中所有数据点对应的频率的最大值和最小值的差值作为高能量频带和低能量频带的频带宽度。

进一步的,以

式中,

若语谱图中第

进一步的,根据语谱图中每列数据点对应的语谱频带能量集中度、频带能量差异系数和每列数据点的频带分布特征计算高能量分布集中度,具体的计算公式如下:

式中,

若语谱图第

进一步的,根据语谱图中每列数据点对应的高能量分布集中度和高能量频带的特征获取高能量频带集中覆盖率,具体的计算公式如下:

式中,

若语谱图中第

进一步的,高频声音信号在传播过程中遇到树木、植被等障碍物时会更容易发生反射和衍射现象,也更容易被空气和这些障碍物吸收,使高频声音信号的能量具有较大的衰减程度,而枪声信号中的马赫波整体属于高频信号,并且马赫波的能量通常集中分布在一个频带中,马赫波每一帧的声音信号在语谱图中的高能量频带集中覆盖率会随时间有明显的下降趋势,并且在语谱图中的高能量频带集中覆盖率之间的下降程度较为接近。

进一步的,以

进一步的,根据高能量频带集中覆盖率和短时频带覆盖率变化指数计算语谱图中每列数据点的枪声马赫波疑似度,具体的计算公式如下:

式中,

若语谱图中第

至此,获取了语谱图中每列数据点的枪声马赫波疑似度。

步骤S004,根据枪声马赫波疑似度获取枪声马赫波数据序列,基于枪声马赫波数据序列利用多重信号分类算法获取森林中枪声的方向角度,根据枪声的方向角度完成森林枪声定位。

进一步的,语谱图中每列数据点对应

进一步的,将第

进一步的,子弹在以超音速飞行的过程中,子弹在其飞行弹道上的每一点均会产生马赫波,即子弹在每个时刻都会产生马赫波,由于马赫波的持续时间较短、传播速度较快,因此子弹在一个较短的时间内产生的所有马赫波与同一个麦克风阵列在平面坐标系中所形成的方向角是近似的。因此,将

进一步的,通过MUSIC算法共得到了

进一步的,由于子弹是远离枪击点,因此将子弹飞行弹道估计方向角

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 一种带有复合式连杆的碟簧自复位阻尼器装置
  • 一种组合式齿板、碟簧、软钢自复位耗能阻尼器
技术分类

06120116545233