掌桥专利:专业的专利平台
掌桥专利
首页

一种波束信息波达方向的确定方法、装置、及存储介质

文献发布时间:2023-06-19 10:24:22


一种波束信息波达方向的确定方法、装置、及存储介质

技术领域

本申请涉及语音信息技术领域,尤其是涉及一种波束信息波达方向的确定方法、装置及存储介质。

背景技术

麦克风是广泛应用的声音采集装置,而麦克风阵列是将多个麦克风按一定形状排列组合而成的声音采集系统,麦克风阵列可以采集附带空间信息的多通道语音,进而进行语音增强,而语音增强中的波束形成只能对导向矢量所在的方向进行处理,其他方向的效果会有一定衰减甚至无法采集到语音。如果演讲者在不停的移动的情况下,目前市面上的麦克风阵列无法根据演讲者讲话位置的改变,无法准确的查询说话人的位置,这大大的降低了确定声源位置的精确度,进而导致想要实现增强演讲者所在方位语音的效果变差。

发明内容

有鉴于此,本申请的目的在于提供一种波束信息波达方向的确定方法方法、装置及存储介质,本申请通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

第一方面,本申请实施例提供了波束信息波达方向的确定方法,所述确定方法包括:

根据多个麦克风构成的阵列和待跟踪对象的目标语音信息,确定所述待跟踪对象的目标波束信息;

根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在各个预设方向上的方向响应功率;其中,每个所述预设方向的设定与所述多个麦克风构成的阵列结构相关;

将多个所述方向响应功率中最大的方向响应功率对应的预设方向,确定为所述待跟踪对象的波达方向,并基于所述波达方向对待跟踪对象进行跟踪。

在一种可能的实施方式中,针对每个预设方向,通过以下方式确定所述目标波束信息在所述预设方向上的方向响应功率:

根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息;

根据所述预设方向上的相对于单个麦克风的输出信息,确定所述各个预设方向的方向响应功率。

在一种可能的实施方式中,根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息,包括:

根据目标波束信息和多个麦克风构成的阵列结构,确定所述目标波束信息下的所述多个麦克风构成的阵列结构的导向矢量;

根据所述导向矢量和波速形成算法在每个所述预设方向的系数,确定每个所述预设方向对应的权重系数;

根据所述预设方向对应的权重系数,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息。

在一种可能的实施方式中,所述将多个所述方向响应功率中最大的方向响应功率对应的预设方向,确定为所述待跟踪对象在所述目标波束信息下的波达方向,包括:

将多个所述方向响应功率中最大的方向响应功率对应的预设方向分别与历史波束信息对应的历史方向和在预设范围的波束信息下对应的目标方向进行对比,分别确定出现频率最高的方向为第一方向和第二方向;

根据所述第一方向和所述第二方向的方向信息,确定所述待跟踪对象在所述目标波束信息下的波达方向。

在一种可能的实施方式中,在所述根据所述第一方向和所述第二方向的方向信息,确定所述待跟踪对象在所述目标波束信息下的波达方向之前,所述确定方法还包括:

将所述第二方向的频率与预设频率阈值进行对比,判断所述第二方向的频率与预设频率阈值的大小;

在确定所述第二方向的频率大于预设频率阈值后,确定所述第一方向和所述第二方向的方向信息。

在一种可能的实施方式中,根据所述第一方向和所述第二方向的方向信息,确定所述待跟踪对象在所述目标波束信息下的波达方向,包括:

若所述第一方向和所述第二方向的方向信息相等,则确定所述第一方向为所述待跟踪对象在所述目标波束信息下的波达方向;

若所述第一方向和所述第二方向的方向信息不相等,则确定所述第二方向为所述待跟踪对象在所述目标波束信息下的波达方向,且所述波达方向由所述第一方向转向所述第二方向。

在一种可能的实施方式中,通过以下方式实现基于所述波达方向对待跟踪对象进行跟踪:

根据所述波达方向,确定所述待跟踪对象在所述目标语音信息下对应的方位角;

根据所述方位角调整所述多个麦克风构成的阵列结构,实现对所述待跟踪对象进行跟踪。

第二方面,本申请实施例还提供了一种波束信息波达方向的确定装置,所述确定装置包括:

第一确定模块,用于根据多个麦克风构成的阵列和待跟踪对象的目标语音信息,确定所述待跟踪对象的目标波束信息;

中心处理模块,用于根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在各个预设方向上的方向响应功率;其中,所述每个所述预设方向的设定与所述多个麦克风构成的阵列结构相关;

第二确定模块,用于将多个所述方向响应功率中最大的方向响应功率对应的预设方向,确定为所述待跟踪对象在所述目标波束信息下的波达方向,并基于所述波达方向对待跟踪对象进行跟踪。

第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的确定方法的步骤。

第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的确定方法的步骤。

本申请实施例提供的波束信息波达方向的确定方法,与现有技术中的波达方向确定方法相比,本申请通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种波束信息波达方向的确定方法的流程图;

图2示出了本申请实施例所提供的另一种波束信息波达方向的确定方法的流程图;

图3示出了本申请实施例所提供的一种波束信息波达方向的确定装置的结构示意图;

图4示出了本申请实施例所提供的一种电子设备的结构示意图。

主要元件符号说明:

图中:300-确定装置;310-第一确定模块;320-中心处理模块;330-第二确定模块;400-电子设备;410-处理器;420-存储器;430-总线。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“波束信息波达方向的确定”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。

本申请实施例下所述波束信息波达方向的确定方法、装置、电子设备及存储介质可以应用于任何文字识别的场景,本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的无线通信方法及装置的方案均在本申请保护范围内。

值得注意的是,经研究发现,在本申请提出之前,麦克风阵列可以采集附带空间信息的多通道语音,进而进行语音增强,而语音增强中的波束形成只能对导向矢量所在的方向进行处理,其他方向的效果会有一定衰减甚至无法采集到语音。如果演讲者在不停的移动的情况下,目前市面上的麦克风阵列无法根据演讲者讲话位置的改变,无法准确的查询说话人的位置,这大大的降低了确定声源位置的精确度,进而导致想要实现增强演讲者所在方位语音的效果变差。

针对上述问题,本申请实施例提供了一种波束信息波达方向的确定方法、装置及存储介质,通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。

请参阅图1,图1为本申请实施例所提供的一种波束信息波达方向的确定方法的流程图。如图1中所示,本申请实施例提供的波束信息波达方向的确定方法,所述确定方法包括:

S101、根据多个麦克风构成的阵列结构和待跟踪对象的目标语音信息,确定所述待跟踪对象的目标波束信息。

该步骤中,通过由多个麦克风构成的阵列结构和采集的待跟踪对象说话时的目标语音信息来确定所述待跟踪对象的目标波束信息,其中,本实施例涉及的多个麦克风构成的阵列结构具体是由7个麦克风构成的同心圆结构的阵列结构,每个所述麦克风的半径为4.3cm,每个所述麦克风的采样率为16kHz。

这里,所述目标波束信息的形成技术具体为通过采集到的目标语音信息,将所述目标语音信息中的一系列语音电信号通过所述由多个麦克风构成的阵列结构,来识别、记录并分析所述目标语音信息的声源位置。

其中,所述同心圆结构的阵列结构为圆心处有麦克风,并不是普通的圆形阵列,用于减小白噪声增益和方向因子的不均匀性。

S102、根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在各个预设方向上的方向响应功率;其中,每个所述预设方向的设定与所述多个麦克风构成的阵列结构相关。

该步骤中,所述波速形成算法是基于超指向波束形成器形成的算法,所述预设方向的数量为根据所述多个麦克风构成的阵列结构确定的,本实施例中,由于所述多个麦克风构成的阵列结构具为由7个麦克风构成的同心圆结构的阵列结构,根据多个麦克风构成的阵列中同心圆结构的中心对称原则,设定所述预设方向的数量为12个,所述预设方向的数量可根据集体需要和使用场景进行自定义的设定,且两个所述预设方向之间的角度为π/6,且每两个所述麦克风之间的角度为π/3。

其中,根据超指向波束形成器中的所述波束形成算法,对所述目标波束信息在各个预设方向上的方向响应功率进行计算。

进一步的,针对每个预设方向,通过以下方式确定所述目标波束信息在所述预设方向上的方向响应功率:

根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息。

其中,所述行程所述波速形成算法的超指向波束形成器的理论设定条件为噪声场为均匀散射场噪声场,即认为噪声来自所有方向的概率密度相等,其中,推导出噪音相关矩阵具体为:

其中,

进一步的,根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息,包括:

根据目标波束信息和多个麦克风构成的阵列结构,确定所述目标波束信息下的所述多个麦克风构成的阵列结构的导向矢量。

其中,多个麦克风构成的阵列结构中的所述导向矢量描述的是不同预设方向的目标波束信息在不同的麦克风信号之间的相位差信息。其定义为:

其中,θ

根据所述导向矢量和波速形成算法在每个所述预设方向的系数,确定每个所述预设方向对应的权重系数。

其中,所述波速形成算法为基于所述超指向滤波器行程的算法,且超指向滤波器设计原则为在保证预设方向信号不失真的前提下最小化输出的噪音能量,这里,最优化问题可通过下面的表达式表示为:

其中,W

这里,为了均匀散射场噪音自相关矩阵在低频散射场与高频散射场的误差,需要增加一个小的单位矩阵,提升散射场的准确性以及鲁棒性,其中,通过进行对角加载来实现均匀散射场噪音,所述对角加载后的超指向波束形成器形成的每个所述预设方向的系数为:

其中:

在本实施例的具体实现中,由于低频段角频率较小,为保证足够的指向性,在1000Hz以下频带,采用较小的加载因子ε=0.007;在4000Hz以上,为避免旁瓣太多采用较大的加载因子,避免语音损伤ε=0.35;在1000Hz到4000Hz之间,加载因子设置为ε=0.055。

根据所述预设方向对应的权重系数,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息。

对于给定的滤波器,单个麦克风的输出信息可通过下式计算:

其中,X(ω)为目标语音信息下的多通道的频点,Y(ω,θ

根据所述预设方向上的相对于单个麦克风的输出信息,确定所述各个预设方向的方向响应功率。

其中,通过所述预设方向上的相对于单个麦克风的输出信息,确定所述各个预设方向的方向响应功率的具体表达式为:

这里,SRP为所述12个预设方向的方向响应功率,θ

S103、将多个所述方向响应功率中最大的方向响应功率对应的预设方向,确定为所述待跟踪对象的波达方向,并基于所述波达方向对待跟踪对象进行跟踪。

该步骤中,所述方向响应功率最大的方向所对应的预设方向为所述待跟踪对象的波达方向,具体表达式为argmax(SRP(θ

这里,通过所述波达方向对待跟踪对象进行跟踪,以实现自动跟踪说话人的方向,提高了确定声源位置的精确度。

进一步的,通过以下方式实现基于所述波达方向对待跟踪对象进行跟踪:

根据所述波达方向,确定所述待跟踪对象在所述目标语音信息下对应的方位角。

根据所述方位角调整所述多个麦克风构成的阵列结构,实现对所述待跟踪对象进行跟踪。

其中,根据所述波达方向,确定所述待跟踪对象在所述目标语音信息下对应的预设方向以及所述预设方向的方位角,并根据所述方位角调整本实施例中出同心圆处麦克风外的其他麦克风的角度,实现对所述待跟踪对象进行跟踪,进而自动跟踪说话人的方向,提高了确定声源位置的精确度。

本申请实施例提供的波束信息波达方向的确定方法,与现有技术中的波达方向确定方法相比,本申请通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

请参阅图2,图2为本申请另一实施例提供的一种波束信息波达方向的确定方法的流程图。如图2中所示,本申请实施例提供的波束信息波达方向的确定方法,所述确定方法包括以下步骤:

S201、根据多个麦克风构成的阵列和待跟踪对象的目标语音信息,确定所述待跟踪对象的目标波束信息。

S202、根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在各个预设方向上的方向响应功率;其中,每个所述预设方向的设定与所述多个麦克风构成的阵列结构相关。

S203、将多个所述方向响应功率中最大的方向响应功率对应的预设方向分别与历史波束信息对应的历史方向和在预设范围的波束信息下对应的目标方向进行对比,分别确定出现频率最高的方向为第一方向和第二方向。

该步骤中,将所述历史波束信息对应的历史方向与在预设范围的波束信息下对应的目标方向分别进行存储,并通过将所述多个所述方向响应功率中最大的方向响应功率对应的预设方向分别历史方向与目标方向进行对比,分别确定出现频率最高的方向为第一方向和第二方向。

其中,所述在预设范围的波束信息中所述的预设范围为根据用户自定义设置的范围,下面在本实施例中具体设定为10帧-50帧的预设范围的波束信息。且每帧所述预设范围的波束信息的帧长为10ms。

这里,所述预设范围的波束信息的信息长度为固定的,每当有新的预设范围的波束信息存入时,就删掉距当前时刻最久的预设范围的波束信息的旧值,进而所述预设范围的波束信息只存储10帧-50帧的波束信息。

S204、根据所述第一方向和所述第二方向的方向信息,确定所述待跟踪对象在所述目标波束信息下的波达方向。

该步骤中,将所述第二方向的频率与预设频率阈值进行对比,判断所述第二方向的频率与预设频率阈值的大小。

这里,若所述第二方向的频率小于预设频率阈值,说明目标语音信息对应的演讲者可能是说话停止或中间停顿,则认为所述目标语音信息只有噪声的无语音信息帧,实现了判断所述目标波束信息是否为静音的功能。

在确定所述第二方向的频率大于预设频率阈值后,确定所述第一方向和所述第二方向的方向信息。

其中,若所述第一方向和所述第二方向的方向信息相等,则确定所述第一方向为所述待跟踪对象在所述目标波束信息下的波达方向。

其中,若所述第一方向和所述第二方向的方向信息相等,则说明当前时刻说话人方向与历史时刻一致,那么所述目标波束信息下的波达方向不变,为第一方向。

若所述第一方向和所述第二方向的方向信息不相等,说明当前时刻说话人位置发生了变化,则确定所述第二方向为所述待跟踪对象在所述目标波束信息下的波达方向,且所述波达方向由所述第一方向转向所述第二方向,同时删除历史波束信息对应的历史方向,将确定为波达方向的第二方向所对应的方向信息进行存储,作为后续波达方向的参考,提高了确定声源位置的精确度。增强了演讲者所在方位的语音效果。

这里,所述历史波束信息对应的历史方向的作用是保持波达方向的稳定性,排除其他噪声的干扰,而当所述待跟踪对象(即演讲者)的位置发生改变时,通过所述预设范围的波束信息下对应的目标方向来判断所述波达方向是否需要发生转向的变化,保证了所述波达方向的灵活性,并且可根据使用环境的不同,灵活的调正参数。

其中,S201至S202的描述可以参照S102至S102的描述,并且能达到相同的技术效果,对此不做赘述。

本申请实施例提供的波束信息波达方向的确定方法,与现有技术中的波达方向确定方法相比,本申请通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

请参阅图3,图3为本申请实施例所提供的一种波束信息波达方向的确定装置的结构示意图。如图3中所示,所述确定装置300包括:

第一确定模块310,用于根据多个麦克风构成的阵列和待跟踪对象的目标语音信息,确定所述待跟踪对象的目标波束信息。

中心处理模块320,用于根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在各个预设方向上的方向响应功率;其中,所述每个所述预设方向的设定与所述多个麦克风构成的阵列结构相关。

进一步的,针对每个预设方向,通过以下方式确定中心处理模块中所述目标波束信息在所述预设方向上的方向响应功率:

根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息。

可选的,根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息,包括:

根据目标波束信息和多个麦克风构成的阵列结构,确定所述目标波束信息下的所述多个麦克风构成的阵列结构的导向矢量。

根据所述导向矢量和波速形成算法在每个所述预设方向的系数,确定每个所述预设方向对应的权重系数。

根据所述预设方向对应的权重系数,确定所述目标波束信息在所述预设方向上的相对于单个麦克风的输出信息。

根据所述预设方向上的相对于单个麦克风的输出信息,确定所述各个预设方向的方向响应功率。

第二确定模块330,用于将多个所述方向响应功率中最大的方向响应功率对应的预设方向,确定为所述待跟踪对象在所述目标波束信息下的波达方向,并基于所述波达方向对待跟踪对象进行跟踪。

这里,通过以下方式实现第二确定模块中基于所述波达方向对待跟踪对象进行跟踪:

根据所述波达方向,确定所述待跟踪对象在所述目标语音信息下对应的方位角。

根据所述方位角调整所述多个麦克风构成的阵列结构,实现对所述待跟踪对象进行跟踪。

进一步的,所述第二确定模块,具体用于:

将多个所述方向响应功率中最大的方向响应功率对应的预设方向分别与历史波束信息对应的历史方向和在预设范围的波束信息下对应的目标方向进行对比,分别确定出现频率最高的方向为第一方向和第二方向。

将所述第二方向的频率与预设频率阈值进行对比,判断所述第二方向的频率与预设频率阈值的大小。

在确定所述第二方向的频率大于预设频率阈值后,确定所述第一方向和所述第二方向的方向信息。

根据所述第一方向和所述第二方向的方向信息,确定所述待跟踪对象在所述目标波束信息下的波达方向。

可选的,若所述第一方向和所述第二方向的方向信息相等,则确定所述第一方向为所述待跟踪对象在所述目标波束信息下的波达方向。

若所述第一方向和所述第二方向的方向信息不相等,则确定所述第二方向为所述待跟踪对象在所述目标波束信息下的波达方向,且所述波达方向由所述第一方向转向所述第二方向。

本申请实施例提供的波束信息波达方向的确定装置,与现有技术中的波达方向确定装置相比,本申请通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

请参阅图4,图4为本申请实施例所提供的一种电子设备的结构示意图。如图4中所示,所述电子设备400包括处理器410、存储器420和总线430。

所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图1以及图2所示方法实施例中的确定方法的步骤。

具体地,所述机器可读指令被所述处理器410可以执行如下处理:

根据多个麦克风构成的阵列和待跟踪对象的目标语音信息,确定所述待跟踪对象的目标波束信息;

根据所述目标波束信息、多个麦克风构成的阵列结构以及波速形成算法,确定所述目标波束信息在各个预设方向上的方向响应功率;其中,每个所述预设方向的设定与所述多个麦克风构成的阵列结构相关;

将多个所述方向响应功率中最大的方向响应功率对应的预设方向,确定为所述待跟踪对象的波达方向,并基于所述波达方向对待跟踪对象进行跟踪。

本申请实施例中,通过多个麦克风构成的阵列结构、波速形成算法以及根据目标语音信息确定的目标波束信息来确定方向响应功率,并根据最大的方向响应功率对应的预设方向来确定波达方向,根据波达方向可以自动跟踪说话人的方向,提高了确定声源位置的精确度,使得演讲者在改变说话方向的情况下,仍可以保持麦克风声音的输出效果。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种波束信息波达方向的确定方法、装置、及存储介质
  • 一种波束信息波达方向的确定方法、装置、及存储介质
技术分类

06120112534821