掌桥专利:专业的专利平台
掌桥专利
首页

准确定位声源的方法、装置、设备与存储介质

文献发布时间:2024-04-18 20:01:30


准确定位声源的方法、装置、设备与存储介质

技术领域

本发明涉及声源定位技术领域,尤其是一种准确定位声源的方法、装置、设备与存储介质。

背景技术

在现有的声源定位技术中,使用麦克风阵列进行声源定位是一种较为常见的技术,麦克风阵列包含有若干麦克风,可以对外部环境进行声音信号的采集,由于声音信号与麦克风阵列中各个麦克风的距离不一致,声音信号达到麦克风阵列中各个麦克风的时间也就不一致,根据麦克风阵列中各个麦克风采集到相同的一个声音信号的时间差,可以得到声源与麦克风阵列中各个麦克风的距离差,再基于声音传播速度与麦克风阵列中各个麦克风之间的距离差的计算,即可以计算出声源的大致位置信息。

上述的步骤是大多数使用麦克风阵列进行声源定位的大致思路,在这一方法中,仅通过麦克风阵列获取时间差进行声源定位对麦克风的性能要求和信号处理的需求较高,且得到的定位数据缺少其他数据的印证,一旦某个麦克风出现问题就会导致定位错误,可靠性相对较低。

发明内容

本发明的目的在于提供一种准确定位声源的方法、装置、设备与存储介质,旨在解决现有技术中通过麦克风阵列采集信号的时间差进行声源定位精准度和可靠性不足的问题。

本发明是这样实现的,本发明提供一种精准定位声源的方法,包括:

确定麦克风阵列中各个麦克风的相对坐标信息,并根据所述麦克风阵列中各个麦克风的相对坐标信息构建空间定位坐标系;

驱动所述麦克风阵列中各个麦克风按预定方案进行旋转,并在旋转过程中持续对待定位声源进行声音信号的采集,以得到所述麦克风阵列中各个麦克风的声音信号图谱;

分别对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向,将所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向在所述空间定位坐标系上进行模拟和重叠,以得到所述待定位声源的基础定位区域;其中,所述正向声音特征是麦克风正对所述待定位声源时采集的声音信号;

对所述麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差分析,根据所述麦克风阵列中各个麦克风的相对坐标信息和对所述相同声音信号的获取时间差,获取所述待定位声源的附加定位区域;

将所述待定位声源的基础定位区域与附加定位区域代入至所述空间定位坐标系,以得到所述待定位声源在所述空间定位坐标系中的精准定位信息。

优选地,当所述麦克风阵列中各个麦克风阵列按预定方案进行旋转时,所述麦克风阵列中各个麦克风在相同时间点的朝向是相同的。

优选地,对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向的步骤包括:

对所述声音信号图谱的声音信号进行信号质量的识别,根据识别的结果为声音信号赋予正向特征权重;

将所有对应相同麦克风朝向的声音信号的正向特征权重进行均值计算,将具有最高的均值计算结果的声音信号确定为正向声音特征。

优选地,对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向的步骤还包括:

对所述声音信号图谱中进行声音特征的提取,并将所述声音信号图谱中相同的声音特征规划为对称组;

在所述声音信号图谱中确定各个所述对称组的对称轴,对各个所述对称组的对称轴进行均值计算,以得到图谱对称轴,并将处于所述图谱对称轴的声音信号作为所述正向声音特征。

优选地,对所述麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差分析,根据所述麦克风阵列中各个麦克风的相对坐标信息和对所述相同声音信号的获取时间差,获取所述待定位声源的附加定位区域的步骤包括:

在所述麦克风阵列中各个麦克风的声音信号图谱中确定一个相同声音信号,并获取所述麦克风阵列中各个麦克风获取所述相同声音信号的采集时间,根据所述麦克风阵列中各个麦克风获取所述相同声音信号的采集时间计算所述相同声音信号的获取时间差;

根据所述麦克风阵列中各个麦克风之间的获取时间差和声音信号的传播速度计算获得所述待定位声源与所述麦克风阵列中各个麦克风的距离差;

根据所述麦克风阵列中各个麦克风的相对坐标信息获取所述麦克风阵列中各个麦克风之间的距离差;

根据所述待定位声源与所述麦克风阵列中各个麦克风的距离差和所述麦克风阵列中各个麦克风之间的距离差进行计算,以得到所述待定位声源的附加定位区域。

第二方面,本发明提供一种精准定位声源的装置,包括:

坐标构建模块,用于确定麦克风阵列中各个麦克风的相对坐标信息,并根据所述麦克风阵列中各个麦克风的相对坐标信息构建空间定位坐标系;

信号采集模块,用于驱动所述麦克风阵列中各个麦克风按预定方案进行旋转,并在旋转过程中持续对待定位声源进行声音信号的采集,以得到所述麦克风阵列中各个麦克风的声音信号图谱;

第一定位模块,用于分别对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向,将所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向在所述空间定位坐标系上进行模拟和重叠,以得到所述待定位声源的基础定位区域;其中,所述正向声音特征是麦克风正对所述待定位声源时采集的声音信号;

第二定位模块,用于对所述麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差分析,根据所述麦克风阵列中各个麦克风的相对坐标信息和对所述相同声音信号的获取时间差,获取所述待定位声源的附加定位区域;

精准定位模块,用于将所述待定位声源的基础定位区域与附加定位区域代入至所述空间定位坐标系,以得到所述待定位声源在所述空间定位坐标系中的精准定位信息。

第三方面,本发明提供一种精准定位声源的设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中任一项所述方法的步骤。

第四方面,本发明提供一种精准定位声源的存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如第一方面中任一项所述的方法。

本发明提供了一种准确定位声源的方法,具有以下有益效果:

本发明通过驱动麦克风阵列中各个麦克风进行旋转,来获取各个麦克风的声音信号图谱,通过对声音信号图谱的正向声音特征的提取,来判断各个麦克风阵列正对朝向待定位声源时的朝向,从而获取待定位声源的基础定位区域,并通过对声音信号图谱进行时间差分析,来获取待定位声源的附加定位区域,将基础定位区域与附加定位区域在空间定位坐标系上叠加以得到精准定位信息,通过双重定位的方式提升了定位的精准度与可靠性,解决了现有技术中通过麦克风阵列采集信号的时间差进行声源定位精准度和可靠性不足的问题。

附图说明

图1是本发明实施例提供的一种精准定位声源的方法的步骤示意图;

图2是本发明实施例提供的麦克风阵列与待定位声源的位置关系示意图;

图3是本发明实施例提供的一种精准定位声源的装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。

以下结合具体实施例对本发明的实现进行详细的描述。

参照图1、图2所示,为本发明提供较佳实施例。

第一方面,本发明提供一种精准定位声源的方法,包括:

S1:确定麦克风阵列中各个麦克风的相对坐标信息,并根据所述麦克风阵列中各个麦克风的相对坐标信息构建空间定位坐标系;

S2:驱动所述麦克风阵列中各个麦克风按预定方案进行旋转,并在旋转过程中持续对待定位声源进行声音信号的采集,以得到所述麦克风阵列中各个麦克风的声音信号图谱;

S3:分别对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向,将所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向在所述空间定位坐标系上进行模拟和重叠,以得到所述待定位声源的基础定位区域;其中,所述正向声音特征是麦克风正对所述待定位声源时采集的声音信号;

S4:对所述麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差分析,根据所述麦克风阵列中各个麦克风的相对坐标信息和对所述相同声音信号的获取时间差,获取所述待定位声源与所述麦克风阵列的附加定位区域;

S5:将所述待定位声源的基础定位区域与附加定位区域代入至所述空间定位坐标系,以得到所述待定位声源在所述空间定位坐标系中的精准定位信息。

在本发明提供的方法的步骤S1中,通过确定麦克风阵列中各个麦克风的相对坐标信息,来构建空间定位坐标系,需要说明的是,空间定位坐标系用于对麦克风阵列中各个麦克风进行定位,以便在后续声源定位的过程中对待定位声源进行定位。

具体地,构建空间定位坐标系的步骤可以为:根据各个麦克风的相对坐标信息确定麦克风阵列的中心点,并将该中心点作为空间定位坐标系的坐标中心,基于这个坐标中心进行X轴与Y轴的构建,从而得到空间定位坐标系。

更具体地,在一些场景中,为了提升声源定位的精度,可以在空间定位坐标系中引入Z轴。

在本发明提供的方法的步骤S2中,驱动麦克风阵列中各个麦克风按预定方案进行旋转,并在旋转过程中持续对待定位声源进行声音信号的采集,以得到麦克风阵列中各个麦克风的声音信号图谱。

具体地,麦克风的声音信号图谱是麦克风在旋转过程中持续采集到的声音信号的合集,需要说明的是,当麦克风的朝向与声源处在不同的角度关系时,麦克风采集到的声音信号也是产生相应的变化:当麦克风正对着声源时,采集到的声音信号最佳,当麦克风侧对着声源时,采集到的声音信号较差,当麦克风背对着声源时,采集到的声音信号最差。

根据上述的现象可以看出,令麦克风阵列中的各个麦克风进行旋转和声音采集得到的声音信号图谱中的声音信号的质量会呈变化起伏的状态,其中,状态最好的声音信号代表着此时麦克风正对着待定位声源,在状态最好的信号左右侧是较差的声音信号,此时麦克风的左侧或右侧朝向待定位声源,也就是说,声音信号图谱中的声音信号呈现轴对称的状态,而其中的对称轴就是麦克风正对或背对待定位声源时采集到的声音信号。

因此在本发明提供的方法的步骤S3中,分别对各个声音信号图谱提取正向声音特征,也就是麦克风正对着待定位声源时采集到的质量最佳的声音信号,之后根据麦克风阵列中各个麦克风的正向声音特征对应的麦克风的朝向在空间定位坐标系上进行模拟和重叠,以得到待定位声源的基础定位区域。

具体地,模拟方式是先基于空间定位坐标系确定各个麦克风的朝向,再基于各个麦克风的朝向在空间定位坐标系上进行延伸线的描述,最后各个麦克风的延伸线交接的地方就是待定位声源的基础定位区域。

在本发明提供的方法的步骤S3中,根据麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差的分析,根据麦克风阵列中各个麦克风的相对坐标信息和对相同声音信号的获取时间差,获取待定位声源与麦克风阵列的附加定位区域。

可以理解的是,由于麦克风阵列中各个麦克风与待定位声源之间的距离不同,因此待定位声源发出的声音信号在达到各个麦克风的时间也不一定,将待定位声源发出的一个声音信号作为标记,在各个麦克风的声音信号图谱中寻找这一标记,以得到各个麦克风采集到该声音信号的时间,根据麦克风阵列中各个麦克风的相对坐标信息和对相同声音信号的获取时间差,即可以构建计算模型,来获得待定位声源的附加定位区域。

参阅图2,图2是一种麦克风阵列与待定位声源的位置关系的示意图。

具体地,当待定位声源发出声音信号时,声音信号经过待定位声源与麦克风之间的距离传播至麦克风中,由于麦克风之间的距离已经固定,那么当待定位声源一个位置发出声音信号后,其声音信号传播至各个麦克风所需要经过的传播距离也是固定的,也就是说,麦克风之间的距离、待定位声源与各个麦克风之间的距离,可以构成三角形的三条边,那么通过构建计算模型将麦克风的距离差(一条边的数值)和声音信号的获取时间差(通过获取时间差和声音信号的传播速度计算获得两条边的差值)代入,即可以得到待定位声源的附加定位区域。

除了上述的计算方式外,还可以使用其他能够实现功能的数学计算方法来进行附加定位区域的计算,在此不再赘述。

需要说明的是,图2中的麦克风阵列仅为参考,也可以设置其他数目的麦克风来作为麦克风阵列。

综合上述内容,可以看出基础定位区域和附加定位区域是两种通过麦克风阵列对待定位声源进行定位的方法,将两种定位方式进行结合,可以有效地提升定位的精准度。

需要注意的是,在上述的描述中,无论是令麦克风旋转获得的基础定位区域,和通过相同声音信号的获取时间差获得的附加定位区域,均可以在麦克风的一轮旋转内完成,但在实际的运作中,仅通过一次基础定位区域和一次附加定位区域的判断来对待定位声源定位会显得不够精准可靠,因此需要重复进行基础定位区域和附加定位区域的判定,并通过多个基础定位区域与多个附加定位区域的平均值计算,来最终确定待定位声源的位置,以确保精准度与可靠性。

本发明提供了一种准确定位声源的方法,具有以下有益效果:

本发明通过驱动麦克风阵列中各个麦克风进行旋转,来获取各个麦克风的声音信号图谱,通过对声音信号图谱的正向声音特征的提取,来判断各个麦克风阵列正对朝向待定位声源时的朝向,从而获取待定位声源的基础定位区域,并通过对声音信号图谱进行时间差分析,来获取待定位声源的附加定位区域,将基础定位区域与附加定位区域在空间定位坐标系上叠加以得到精准定位信息,通过双重定位的方式提升了定位的精准度与可靠性,解决了现有技术中通过麦克风阵列采集信号的时间差进行声源定位精准度和可靠性不足的问题。

优选地,当所述麦克风阵列中各个麦克风阵列按预定方案进行旋转时,所述麦克风阵列中各个麦克风在相同时间点的朝向是相同的。

具体地,麦克风阵列的各个麦克风的初始朝向是相同的,在旋转时各个麦克风在单位时间内的旋转方向和角度也是相同的,这样设置的目的在于保持麦克风阵列中各个麦克风之间的相对位置关系保持不变,以避免麦克风的旋转造成麦克风阵列中各个麦克风之间的距离差产生细微变化,从而给附加定位区域的计算带来影响。

优选地,对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向的步骤包括:

S31:对所述声音信号图谱的声音信号进行信号质量的识别,根据识别的结果为声音信号赋予正向特征权重;

S32:将所有对应相同麦克风朝向的声音信号的正向特征权重进行均值计算,将具有最高的均值计算结果的声音信号确定为正向声音特征。

优选地,对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向的步骤还包括:

S33:对所述声音信号图谱中进行声音特征的提取,并将所述声音信号图谱中相同的声音特征规划为对称组;

S34:在所述声音信号图谱中确定各个所述对称组的对称轴,对各个所述对称组的对称轴进行均值计算,以得到图谱对称轴,并将处于所述图谱对称轴的声音信号作为所述正向声音特征。

具体地,上述内容是两种正向声音特征的提取方式,第一种是根据声音信号的质量来确定正向声音特征,第二种是根据声音信号图谱中声音信号呈轴对称的特性来确定正向声音特征。

更具体地,由于麦克风是在不断旋转着的,因此麦克风与待定位声源之间的朝向关系也是随之不断变化的,当麦克风正对朝向待定位声源时,麦克风采集声音信号的效果最好,当麦克风侧对朝向待定位声源时,麦克风采集声音信号的效果较差,由于麦克风是旋转的,因此麦克风采集声音信号的效果会不断变化,且在声音信号图谱中最好效果的声音信号两侧均为较差效果的声音信号。

更具体地,由于声音信号图谱中呈现出的特性,可以直接对声音信号进行声音信号的质量进行识别,也可以对图谱中的对称轴进行识别。

需要说明的是,无论是哪一种方法,都需要多次进行并通过均值计算来最终确定正向声音特征:在第一种方法中,对声音信号图谱的声音信号进行信号质量的识别,根据识别的结果为声音信号赋予正向特征权重;将所有对应相同麦克风朝向的声音信号的正向特征权重进行均值计算,将具有最高的均值计算结果的声音信号确定为正向声音特征;在第二种方法中,对声音信号图谱中进行声音特征的提取,并将声音信号图谱中相同的声音特征规划为对称组;在声音信号图谱中确定各个对称组的对称轴,对各个对称组的对称轴进行均值计算,以得到图谱对称轴,并将处于图谱对称轴的声音信号作为正向声音特征。

优选地,对所述麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差分析,根据所述麦克风阵列中各个麦克风的相对坐标信息和对所述相同声音信号的获取时间差,获取所述待定位声源的附加定位区域的步骤包括:

S41:在所述麦克风阵列中各个麦克风的声音信号图谱中确定一个相同声音信号,并获取所述麦克风阵列中各个麦克风获取所述相同声音信号的采集时间,根据所述麦克风阵列中各个麦克风获取所述相同声音信号的采集时间计算所述相同声音信号的获取时间差;

S42:根据所述麦克风阵列中各个麦克风之间的获取时间差和声音信号的传播速度计算获得所述待定位声源与所述麦克风阵列中各个麦克风的距离差;

S43:根据所述麦克风阵列中各个麦克风的相对坐标信息获取所述麦克风阵列中各个麦克风之间的距离差;

S44:根据所述待定位声源与所述麦克风阵列中各个麦克风的距离差和所述麦克风阵列中各个麦克风之间的距离差进行计算,以得到所述待定位声源的附加定位区域。

具体地,在麦克风阵列中各个麦克风的声音信号图谱中确定一个相同声音信号,并获取这个相同声音信号在各个声源信号图谱中的采集时间,从而通过计算得到各个麦克风的获取时间差,由于声音信号的传播速度固定,那么各个麦克风采集到声音信号的获取时间差可以反馈出待定位声源与麦克风阵列中各个麦克风的距离差。

更具体地,由于各个麦克风之间的距离差也是固定的,那么根据待定位声源与麦克风阵列中各个麦克风的距离差和麦克风阵列中各个麦克风之间的距离差进行计算,以得到待定位声源的附加定位区域。

参阅图2,图2是一种麦克风阵列与待定位声源的位置关系的示意图,以下是一种附加定位区域的计算方法:

具体地,将麦克风阵列中的两个麦克风分别标记为A、B,将A、B之间的距离差标记为C,A、B之间的获取时间差标记为D。

更具体地,由于A、B之间的获取时间为D,且声音信号的传播速度固定为E,因此A、B与待定位声源之间的距离差为D*E,也就是说,A与待定位声源的距离为X,B与待定位声源的距离为X+D*E。

根据三角形的边长关系可以得知,三角形任意两边和大于第三边,因此可以得出:(C - D*E) / 2 < X < C + D*E。

将各个麦克风两两一组重复上述的步骤,得到各个麦克风在不同组合下的距离X,并在空间定位坐标系上根据距离将X进行圆形绘制,当所有绘制的圆形完成后,将重叠部分作为待定位声源的预设定位区域。

参阅图3,第二方面,本发明提供一种精准定位声源的装置,包括:

坐标构建模块,用于确定麦克风阵列中各个麦克风的相对坐标信息,并根据所述麦克风阵列中各个麦克风的相对坐标信息构建空间定位坐标系;

信号采集模块,用于驱动所述麦克风阵列中各个麦克风按预定方案进行旋转,并在旋转过程中持续对待定位声源进行声音信号的采集,以得到所述麦克风阵列中各个麦克风的声音信号图谱;

第一定位模块,用于分别对各个所述声音信号图谱进行正向声音特征的提取,以获取所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向,将所述麦克风阵列中各个麦克风采集所述正向声音特征时的麦克风朝向在所述空间定位坐标系上进行模拟和重叠,以得到所述待定位声源的基础定位区域;其中,所述正向声音特征是麦克风正对所述待定位声源时采集的声音信号;

第二定位模块,用于对所述麦克风阵列中各个麦克风的声音信号图谱的相同声音信号进行获取时间差分析,根据所述麦克风阵列中各个麦克风的相对坐标信息和对所述相同声音信号的获取时间差,获取所述待定位声源的附加定位区域;

精准定位模块,用于将所述待定位声源的基础定位区域与附加定位区域代入至所述空间定位坐标系,以得到所述待定位声源在所述空间定位坐标系中的精准定位信息。

第三方面,本发明提供一种精准定位声源的设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中任一项所述方法的步骤。

第四方面,本发明提供一种精准定位声源的存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如第一方面中任一项所述的方法。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

相关技术
  • 插入板材的装载装置,接收坯料的工作站,板材元件的加工机以及运送插入板材的方法
  • 一种用于生产缸头的安全型加工装置及加工方法
  • 一种钣金板材生产加工用万能存储装置及其使用方法
  • 一种保健酒生产加工的蒸馏装置及方法
  • 一种电火花伺服加工中插入高频微抖动的方法
  • 加工插入管外皮层的挤出装置及加工方法、内窥镜插入管
  • 加工插入管外皮层的挤出装置及加工方法、内窥镜插入管
技术分类

06120116562548