导航：首页> 测量；测试>定向发声方法及装置、设备

定向发声方法及装置、设备

文献发布时间：2023-06-19 19:30:30

技术领域

本申请实施例涉及电子技术，涉及但不限于一种定向发声方法及装置、设备。

背景技术

目前，网络会议和通话在日常生活中越来越普遍，在公共空间或者办公场所为了尽量减少对他人的影响，通话时总是需要带着耳机，时间长了对耳朵造成不可逆的损伤。开放空间内的定向声技术就解决了这一用户痛点，让用户可以在共享空间内免除佩戴耳机，减少耳朵的负担，同时也保证了私密性，也减少了对他人的影响。

发明内容

有鉴于此，本申请实施例提供一种定向发声方法及装置、设备。

本申请实施例的技术方案是这样实现的：

第一方面，本申请实施例提供一种定向发声方法，所述方法包括：

获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

第二方面，本申请实施例提供一种定向发声装置，所述装置包括：

获取单元，用于获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

配置单元，用于基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

第三方面，本申请实施例提供一种定向发声设备，所述设备包括：

扬声器阵列；

处理器，用于获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

本申请实施例提供一种定向发声方法及装置、设备，通过获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同，如此，能够实现一种低成本且更适用于个人用户使用场景的定向声技术。

附图说明

图1为本申请实施例定向发声方法的实现流程示意图一；

图2为本申请实施例定向发声方法的实现流程示意图二；

图3为本申请实施例定向发声方法的实现流程示意图三；

图4为本申请实施例定向发声设备的组成结构示意图；

图5A为本申请实施例扬声器阵列的定向声效果的示意图；

图5B为本申请实施例智能定向声效果的实施方案的示意图一；

图5C为本申请实施例智能定向声效果的实施方案的示意图二；

图5D为本申请实施例智能定向声效果的实施方案的实现流程示意图；

图6为本申请实施例定向发声装置的组成结构示意图；

图7为本申请实施例定向发声设备的一种硬件实体示意图。

具体实施方式

下面结合附图和实施例对本申请的技术方案进一步详细阐述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明，其本身没有特定的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

需要指出，本申请实施例所涉及的术语“第一第二第三”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一第二第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

目前，市面上的定向声扬声器技术基本包括如下几种：

第一、声聚焦扬声器；它是通过聚音罩实现的，在聚音罩中间的扬声器播放声音，通过聚音罩的反射实现在聚音罩下面声音聚集的定向声效果。该方案是完全基于物理结构实现的定向声技术。该方案的声聚焦扬声器的优点是结构较简单，缺点是对相邻区域声音的隔离功能有一定局限性，尤其对低频的聚声效果有所逊色。并且，聚音罩体积庞大，占用空间较多，直径大小不同，需要根据场地的大小及罩下方的人数来定制尺寸。同时，聚音罩的使用范围有较大限制，仅可以在聚音罩下方使用。

第二、基于超声的定向声方案；该方案是把可听声调制在不可听的超声上，超声在空气中的自解调特性可以解调出可听声，利用超声的强指向性实现定向声的效果。基于超声的定向声方案需要超声换能器，然后调制在超声上的可听声在空气中自解调，在瑞利距离的范围之外，可听声解调出来，实现定向声的效果。由于超声需要在空气中解调出可听声，因此有一个最小的解调距离，称为瑞利距离。该距离大约为0.5米左右。因此，基于超声定向声的方案需要在0.5米之外的范围内使用，对于近场定向声的使用场景有一些限制。而且超声定向声的方案其硬件和软件都需要重新设计，系统的兼容性较差。同时超声定向声方案的成本较高，且尺寸较大，不适合个人使用。

基于此，本申请实施例提供一种定向发声方法，该方法所实现的功能可以通过定向发声设备中的处理器调用程序代码来实现，当然程序代码可以保存在所述定向发声设备的存储介质中。图1为本申请实施例定向发声方法的实现流程示意图一，如图1所示，所述方法包括：

步骤S101、获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

本申请实施例中，需要获得目标对象(例如某一用户)在所述定向发声设备所处的环境中的位置信息。即，所述目标对象相对于所述定向发声设备的位置信息。例如，可以基于传感器(如距离传感器、红外传感器等)的方式获得目标对象的位置信息，还可以基于摄像头、雷达，或者声源定位的方式等确定目标对象的位置信息。其中，所述传感器、摄像头等装置位于所述定向发声设备上。

在一些实施例中，还可以是通过定向发声设备与目标对象佩戴的穿戴设备之间的信号强度、通信参数等来确定目标对象的位置信息。当然，还可以通过一第三方设备来确定所述目标对象相对于所述定向发声设备的位置信息。

需要说明的是，本申请实施例对获得目标对象的位置信息的具体实现方式并不做限制。当然，还可以是对所述目标对象进行实时追踪，获取所述目标对象的实时位置。

这里，所述定向发声设备具有为所述目标对象提供定向声音的功能，本申请实施例中的定向发声设备可以为任一具有扬声器阵列的电子设备。

步骤S102、基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

这里，所述定向发声设备的发声组件可以包括DSP(Digital Signal Processing，数字信号处理芯片)控制器，也可以包括扬声器阵列和DSP控制器。其中，所述DSP控制器主要用于数据存储、数据处理、滤波和采样等，相当于一个简易的CPU(Central ProcessingUnit，中央处理器)。所述扬声器阵列由多个扬声器组成。

进而，可以基于所述目标对象的位置信息在所述DSP控制器中配置对应的发声参数，通过扬声器阵列基于所述发声参数将目标声音定向传输至所述目标对象。当然，也可以理解为基于所述目标对象的位置信息配置所述定向发声设备的DSP控制器和扬声器阵列的发声参数。

本申请实施例中，所述发声组件的发声参数包括但不限于以下一种：发声方向、幅值、频率、周期、相位、响度和波长等。当然，所述发声参数还可以包括定向发声的传递函数或者实现定向发声的滤波器系数。

如此，通过上述步骤S101至步骤S102中的方法，能够实现一种低成本且更适用于个人用户使用场景的定向声技术。

在一些实施例中，所述方法还包括以下至少之一：

步骤S11、监测目标对象的运动信息，基于所述运动信息调整所述定向发声设备的发声组件的发声参数；

这里，所述目标对象的运动信息主要包括目标对象的运动速度，以及目标对象的运动趋势等。例如，如果目标对象此时不是静止状态而是运动状态，则可以基于目标对象的运动趋势预测目标对象即将到达的新的目标区域，以便及时改变定向发声设备的发声组件的发声参数，从而达到提前调整的目的。同时，还可以基于目标对象在运动过程中的运动速度，预测目标对象到达所述新的目标区域的时间，以便准确确定触发参数调整的时间，从而达到精准调整的目的。

当然，所述运动信息还可以包括其他的内容，本申请实施例对此并不做限制。

步骤S12、获得所述定向发声设备所处位置的环境信息，基于所述环境信息调整所述定向发声设备的发声组件的发声参数；

这里，所述环境信息可以包括环境噪声，还可以包括环境变化信息等。

举例来说，如果所述定向发声设备所处位置的环境信息比较嘈杂，则可以调整所述发声组件的发声参数，使得定向发声设备输出的目标声音的响度变小。如果所述定向发声设备所处位置的环境信息比较安静，则可以调整所述发声组件的发声参数，使得定向发声设备输出的目标声音的响度变大。

步骤S13、获得目标声音的属性信息，基于所述属性信息调整所述定向发声设备的发声组件的发声参数。

这里，所述目标声音的属性信息可以包括单声道、双声道、音频帧率、风格类型等。例如，如果目标声音的风格类型偏激情彭拜，则可以调整所述发声组件的发声参数，使得定向发声设备输出的目标声音的响度变小。

在一些实施例中，所述定向发声设备包括扬声器阵列，则确定目标对象的位置所处的区域，并将所述区域确定为目标声学亮区；确定在所述区域作为目标声学亮区的情况下，所述扬声器阵列中每一扬声器对应的滤波器系数，并将每一扬声器对应的滤波器系数，确定为目标滤波器系数。进而，可以基于所述每一扬声器对应的目标滤波器系数对待播放的声音进行处理，得到每一扬声器对应的处理后的声音，并控制每一扬声器同时播放对应的处理后的声音。

基于前述的实施例，本申请实施例再提供一种定向发声方法，该方法应用于定向发声设备，图2为本申请实施例定向发声方法的实现流程示意图二，如图2所示，所述方法包括：

步骤S201、获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

步骤S202、基于所述位置信息确定所述目标对象当前所处的目标声学区域，基于声学区域与发声参数之间的映射关系确定所述目标声学区域对应的目标发声参数，控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标声学区域；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

本申请实施例中，可以对定向发声设备所处的环境所包含的区域进行划分，划分为多个声学区域，且每一声学区域都存在一对应的发声参数使得该声学区域为声学亮区其他区域为声学暗区。然后基于目标对象的位置信息判断所述目标对象当前处于所述多个声学区域中的哪一个声学区域，并将该声学区域确定为目标声学区域。进而，可以基于声学区域与发声参数之间的映射关系确定该目标声学区域对应的目标发声参数，然后控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标声学区域。

例如，把定向发声设备前方180度区域分成10个小区域，每个区域的角度大约为18度。每一个区域都存在预设的滤波器系数，实现该区域是声学亮区而其他区域都是声学暗区。当定向发声设备获取到目标对象的位置信息之后可以自动切换定向声区域，如此时的目标对象处于区域4，则发声组件以区域4对应的滤波器系数工作，此时区域4是声学亮区，其他区域是声学暗区。当目标对象移动到区域1时，DSP控制器自动切换区域1定向声所对应的滤波器系数，此时区域1是声学亮区，其他区域是声学暗区，从而实现定向发声的效果。

如此，通过上述步骤S201至步骤S202中的方法，能够根据目标对象的位置直接切换该位置所在区域的发声参数从而实现定向发声。

基于前述的实施例，本申请实施例再提供一种定向发声方法，该方法应用于定向发声设备，所述方法包括：

步骤S211、获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

步骤S212、基于所述位置信息确定所述目标对象当前所处的目标声学区域，将所述定向发声设备的发声区域划分为多个声学区域，确定每一声学区域作为声学亮区和声学暗区时对应的滤波器系数，得到所述声学区域与发声参数之间的映射关系；

这里，可以对定向发声设备所处的环境所包含的区域进行划分，划分为多个声学区域，且每一声学区域都存在一对应的滤波器系数使得该声学区域为声学亮区其他区域为声学暗区。然后基于目标对象的位置信息判断所述目标对象当前处于所述多个声学区域中的哪一个声学区域，并将该声学区域确定为目标声学区域。进而，可以基于声学区域与滤波器系数之间的映射关系确定该目标声学区域对应的目标滤波器系数，并基于该目标滤波器系数得到目标发声参数，然后控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标声学区域。

步骤S213、将所述目标对象当前所处的目标声学区域作为声学亮区，基于所述映射关系将该声学亮区所对应的目标滤波器系数作为所述目标发声参数，控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标声学区域；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

这里，可以将目标对象当前所处的目标声学区域作为声学亮区、且除所述目标声学区域以外的其他声学区域作为声学暗区时，对应的滤波器系数作为发声参数。进而，可以控制定向发声设备的DSP控制器和扬声器阵列以所述发声参数工作，从而将目标声音定向输送至所述目标声学区域，实现定向声效果。例如，定向发声设备中的扬声器阵列由4个扬声器组成，且所述定向发声设备所在的环境包括5个区域，分别为区域1、区域2至区域5。如果此时目标对象处于区域3，则确定区域3为声学亮区其他区域为声学暗区时该4个扬声器分别对应的滤波器系数。DSP控制器利用该4个扬声器分别对应的滤波器系数对待播放的声音进行处理，得到4个待播放的目标声音，以使该4个扬声器分别播放对应的待播放的目标声音。这4个待播放的目标声音在各个区域相互叠加，使得区域3为声学亮区而其他区域为声学暗区。其中，在声学暗区中该4个待播放的目标声音相互抵消(即幅值相同相位相反)。

如此，通过上述步骤S211至步骤S213中的方法，能够提供一种基于声学算法实现的定向声技术，相比于现有的超声定向声技术的成本更低，低频的效果更好，也更适用于个人用户的使用场景。

基于前述的实施例，本申请实施例再提供一种定向发声方法，该方法应用于定向发声设备，图3为本申请实施例定向发声方法的实现流程示意图三，如图3所示，所述方法包括：

步骤S301、获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

步骤S302、基于所述位置信息确定所述目标对象当前所在的目标位置与初始声学亮区的第一位置关系，基于所述第一位置关系和所述初始声学亮区所对应的初始发声参数确定所述目标位置对应的目标发声参数，控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标位置；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

本申请实施例中，可以在定向发声设备所处的环境所包含的区域中选择某一部分区域作为初始声学亮区，并确定该初始声学亮区对应的初始发声参数。如果目标对象当前所在的目标位置位于所述初始声学亮区，则控制定向发声设备的发声组件以该初始发声参数工作即可。如果目标对象当前所在的目标位置没有位于所述初始声学亮区中，则确定目标位置与该初始声学亮区之间的第一位置关系(如定向发声设备和目标位置构成的直线与初始声学亮区的中心线之间的夹角)，进而可以根据该第一位置关系和初始发声参数确定目标发声参数(如目标发声参数等于初始发声参数乘以上述夹角)。然后，控制定向发声设备的发声组件以该目标发声参数工作即可。

当然，所述第一位置关系除了角度以外，还可以包括距离或者其他类型的参数，本申请实施例对此并不做限制。

如此，通过上述步骤S301至步骤S302中的方法，能够根据目标对象与初始声学亮区之间的位置关系，以及初始发声参数确定目标发声参数从而实现定向发声。

基于前述的实施例，本申请实施例再提供一种定向发声方法，该方法应用于定向发声设备，所述方法包括：

步骤S311、获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

步骤S312、基于所述位置信息确定所述目标对象当前所在的目标位置与初始声学亮区的第一位置关系，确定初始声学亮区的位置及其对应的初始滤波器系数；

这里，所述初始声学亮区对应的初始滤波器系数可以实现所述初始声学亮区的初始发声参数。即，如果目标对象位于所述初始声学亮区，则定向发声设备的发声组件以所述初始发声参数工作(如利用初始滤波器系数对待播放的声音进行处理)，就可以将目标声音定向传送至所述目标对象。例如，可以定义定向发声设备的中心轴线±10°的范围为初始声学亮区，进而可以在DSP控制器中预设该角度范围内的滤波器系数，作为初始滤波器系数。

步骤S313、基于所述第一位置关系确定角度变换矩阵，利用所述角度变换矩阵对所述初始滤波器系数进行处理，得到目标滤波器系数，将所述目标滤波器系数作为所述目标位置所对应的目标发声参数，控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标位置；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

这里，可以基于目标对象与初始声学亮区之间的第一位置关系确定一个角度变换矩阵，然后将初始滤波器系数乘以该角度变化矩阵得到目标滤波器系数。进而，可以利用该目标滤波器系数对待播放的声音进行处理，得到目标声音，从而实现定向声效果。例如，定义初始声学亮区并在DSP控制器中预设该区域的角度范围内的滤波器系数，称为初始滤波器系数。当获取到目标对象的位置信息之后，得到目标对象位置的角度，假如该角度为120度，则在DSP控制器中的初始滤波器系数乘以一个120度的角度变换矩阵以实现声学亮区的旋转，从而实现了追踪对象位置的定向声效果。

如此，通过上述步骤S311至步骤S313中的方法，能够提供一种基于声学算法实现的定向声技术，相比于现有的超声定向声技术的成本更低，低频的效果更好，也更适用于个人用户的使用场景。

在一些实施例中，所述定向发声设备的发声组件包括至少一扬声器阵列，所述方法还包括：

步骤S31a、利用所述扬声器阵列的扬声器部件依次发射白噪声，测试所述白噪声从所述扬声器阵列到声学亮区目标点位置的第一传递函数、以及从所述扬声器阵列到声学暗区目标点位置的第二传递函数；

这里，如果所述扬声器阵列包括多个扬声器，则可以利用所述多个扬声器依次发射白噪声，测试白噪声从对应的扬声器到声学亮区目标点位置的第一传递函数、以及从对应的扬声器到声学暗区目标点位置的第二传递函数。

步骤S32a、基于所述第一传递函数和所述第二传递函数，以最大化声学亮区和声学暗区的声能量对比度为目标进行最优权向量求解，得到每一声学区域对应的滤波器系数。

本申请实施例中，为了实现上述步骤S211至步骤S213中的方法，需要预先确定出各区域作为声学亮区时的滤波器系数。为了实现上述步骤S311至步骤S313中的方法，需要预先确定出初始声学亮区的滤波器系数。因此，可以通过上述步骤S31a至步骤S32a中的方法确定滤波器系数。这里，通过求解声学亮区和声学暗区的声能量对比度达到最大值时的扬声器权向量，得到每一声学区域作为声学亮区其他区域作为声学暗区时对应的滤波器系数。对于上述步骤S211至步骤S213中的方法，需要在实验室中测试如下内容：区域1是声学亮区，其他区域是声学暗区；区域2是声学亮区，其他区域是声学暗区；类似的，划分了几个区域就需要测试几组传递函数。对于上述步骤S311至步骤S313中的方法，仅需要在实验室中测试初始区域为声学亮区其他区域为声学暗区的传递函数。这里，滤波器系数指的是一个变量，即乘以这个滤波器系数之后整体的传递函数也会发生改变。

如此，通过上述方法能够基于扬声器阵列根据用户对象的位置匹配相应的传递函数，从而实现智能动态调节定向声角度、智能动态调节声学亮区的范围，实现追踪用户位置的定向声效果。进而在用户对象所处区域实现类似于“虚拟耳机”的效果。

在一些实施例中，所述步骤S32、基于所述第一传递函数和所述第二传递函数，以最大化声学亮区和声学暗区的声能量对比度为目标进行最优权向量求解，得到每一声学区域对应的滤波器系数，包括：

步骤S321、确定所述扬声器阵列中不同扬声器对应的第一传递函数之间的第一互相关矩阵，以及不同扬声器对应的第二传递函数之间的第二互相关矩阵；

步骤S322、基于所述第一互相关矩阵和所述第二互相关矩阵，以最大化声学亮区和声学暗区的声能量对比度为目标进行最优权向量求解，得到每一声学区域对应的滤波器系数。

例如，可以通过公式

在一些实施例中，所述方法还包括以下至少之一：

步骤S31b、基于所述位置信息确定所述目标对象与所述定向发声设备的声学区域目标点位置的第二位置关系，基于所述第二位置关系调整所述发声参数；

一般地，在上述测试得到传递函数的过程中，测试距离是距离扬声器阵列0.5米，即在距离扬声器阵列0.5米的位置设置目标点(如专业的人工头设备或双耳录音设备)，该目标点位置即定向发声设备的声学区域目标点位置(参考位置)，区域为声学亮区时的发声参数也是基于该位置得到。如果此时目标对象距离扬声器阵列0.7米，则需要考虑目标对象的实际位置与该参考位置之间的差异(即第二位置关系)，从而根据差异调整区域为声学亮区时的发声参数，以得到更加精确的定向发声效果。

步骤S32b、获得目标对象对声音的敏感程度信息，基于所述敏感程度信息调整所述发声参数；

这里，还可以获得目标对象的用户画像信息，如用户习惯、偏好等，进而推测出目标对象对声音的敏感程度信息，从而基于敏感程度信息调整发声参数。例如，如果目标对象对声音比较敏感，则可以基于敏感程度调整发声参数，使得发声参数的响度降低。

步骤S33b、获得所述定向发声设备与其他音频输出设备的第三位置关系，基于所述第三位置关系调整所述发声参数。

这里，可以考虑其他音频输出设备的干扰，进而基于其他音频输出设备与定向发声设备之间的位置关系调整发声参数。

基于前述的实施例，本申请实施例提供一种定向发声设备，图4为本申请实施例定向发声设备的组成结构示意图，如图4所示，所述定向发声设备400包括：

扬声器阵列401；

处理器402，用于获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

在一些实施例中，所述定向发声设备除了包括扬声器阵列和处理器，还可以包括：麦克风、蓝牙、USB接口、功能按键等。其中，所述麦克风可以用于捕捉用户位置，蓝牙、USB接口可以用于音频输入方式，功能按键可以包括开机、关机、调音量等。

本申请实施例中的定向发声设备包括多个扬声器，因为需要该多个扬声器之间增益的配合，这也是实验测试时需要计算的。每一扬声器权向量的比重是不同的。例如，一个扬声器关注在200到500HZ(赫兹)，另一个扬声器关注在1000到2000HZ，这种分频率段设计是一种补偿的方式。另一种补偿方式是相位补偿，一个扬声器只发在声学亮区，另一个只发声学暗区(即发两个信号互相抵消，幅值相同相位相反的两个声音)。并且，在目标对象位于某一声学亮区时，每一扬声器分别对应不同的滤波器系数。

基于前述的实施例，本申请实施例再提供一种定向发声方法及定向发声设备。该定向发声设备使用普通全指向扬声器单元组成的扬声器阵列，通过空间音频的控制算法实现空间中声学亮区和声学暗区，通过亮暗区的对比度体现出定向声的效果。

该定向发声设备中的定向声扬声器阵列使用普通的全指向性扬声器单元。例如，可以设定4个扬声器单元组成扬声器阵列结构。除扬声器阵列外，所述定向发声设备还包括：麦克风、DSP控制器、数模转换模块(如4通道数模转换模块)、模数转换模块(如1通道模数转换模块)、功能按键、电源按键、电池、蓝牙输入和USB-C(一种接口外形标准)接口输入等。例如，该DSP控制器计算输出的信号通过4通道的数模转换模块输出给4个扬声器，这4个扬声器可以进行音频重放，其算法均采用维纳滤波。进而，可以通过预设的声学算法实现扬声器的定向声。

图5A为本申请实施例扬声器阵列的定向声效果的示意图，如图5A所示，通过预设的声学算法实现扬声器阵列51中每一扬声器发出的音频存在特定的差异，从而不同扬声器发出的音频的叠加实现用户52所在的区域的定向声效果。

其中，该方案在实现定向声效的同时可以智能追踪用户所在位置，本申请实施例提出两种动态追踪用户位置的智能定向声效果的方案，从而实现用户所在位置虚拟耳机的效果。

(1)第一种智能定向声效果的实施方案；

图5B为本申请实施例智能定向声效果的实施方案的示意图一，如图5B所示，该扬声器阵列把扬声器前方90°(度)区域分成5个小区域，每个区域的角度大约18°。每一个区域都有预设的传递函数，实现该区域是声学亮区而其他区域都是声学暗区。因此，在扬声器阵列的DSP中预设了5组不同的滤波器系数，每一组系数对应着每一个区域的定向声效果。当扬声器阵列获取用户的位置信息之后可以自动切换定向声区域，如此时的用户处于区域4，当用户移动到区域1时，DSP会自动切换区域1定向声所对应的滤波器系数。

用户的位置信息获取不限方式，可以通过红外检测、语音距离识别等。把扬声器正前方的180°范围内分成若干区域，从左到右0°至45°和135°至180°范围内是声学暗区，如果用户处于这些区域是无法实现定向声的。当用户处于45°至135°的范围内可以实现定向声的效果，在这个90°的范围内又细分为5个区域，每个区域的范围都是18°。当用户的位置信息输入后，且在45°至135°范围内，假如用户在45°至63°，则此时滤波器组切换到实验室中预设的区域1的系数。相同的，如果检测到用户的位置发生变化，则DSP会自动切换相应位置的滤波器系数，进而实现该方向的定向声效果。

需要说明的是，本申请实施例中所划分的区域，以及所定义的角度只是为了方便说明，在实际应用的过程中，可以根据需要划分区域以及定义声学亮区的角度等，技任意角度范围的修改均在本申请的保护范围内。

(2)第二种智能定向声效果的实施方案；

图5C为本申请实施例智能定向声效果的实施方案的示意图二，如图5C所示，定义α角为扬声器阵列夹角，在扬声器阵列正前方的180°范围内。定义α＝90°的中心轴线±10°的范围为初始位置的声学亮区(即初始位置的声学亮区的角度为20°)。此时，在这个范围内是声学亮区，在DSP中预设了这个角度范围内的滤波器系数，称为初始位置的滤波器系数。当获取到用户的位置信息之后，得到用户位置的α

这里，定义扬声器阵列夹角的作用是为了确定初始声学亮区，图5C中的45°指的是每一声学亮区的范围是45度。

同样的，本申请实施例中角度的定义是为了方便说明，对于任意角度的变换均在本申请的保护范围内。

(3)确定发声参数；

对于第一种智能定向声效果的实施方案，需要测试如下内容：区域1是声学亮区，其他4个区域是声学暗区；区域2是声学亮区，其他4个区域是声学暗区；类似的，需要测试共5组传递函数。对于第一种智能定向声效果的实施方案，需要在上述定义的声学亮区测试其传递函数，距离扬声器阵列0.5m(米)，角度如图5B所示。

对于第二种智能定向声效果的实施方案，仅需要测试位于初始位置为声学亮区，而其他位置为声学暗区的传递函数。对于第二种智能定向声效果的实施方案，需要在上述定义的声学亮区测试其传递函数，距离扬声器阵列0.5m，角度如图5C所示。

对于上述需要测试的传递函数，其测试过程是一致的，如下：

①、L个扬声器单元依次发射白噪声，通过麦克风测试从L个扬声器单元到声学亮区目标点位置的传递函数，令该传递函数为G

②、L个扬声器单元依次发射白噪声，通过麦克风测试从L个扬声器单元到声学暗区目标点位置的传递函数，令该传递函数为G

③、利用声能量对比度控制算法对L个扬声器的权向量进行求解，定义10log

式中，R

④、基于下述公式(2)求解最优权向量即可得到需要的声能比：

图5D为本申请实施例智能定向声效果的实施方案的实现流程示意图，如图5D所示，两种智能定向声效果的实施方案均需要使用到位置追踪定向声扬声器阵列；其中，

第一种智能定向声效果的实施方案(即方案1)涉及到的定向发声方法包括：

步骤S501、测试区域1至区域5的传递函数；

步骤S502、获取用户的位置信息；

步骤S503、基于所述位置信息和所述传递函数，匹配相应区域的滤波器系数；

步骤S504、基于所述滤波器系数对音频进行处理，实现用户动态位置的定向声。

第二种智能定向声效果的实施方案(即方案2)涉及到的定向发声方法包括：

步骤S511、测试初始位置定向声传递函数；

步骤S512、获取用户位置信息，即α

步骤S513、基于所述传递函数和所述α

步骤S514、基于所述滤波器系数对音频进行处理，实现用户动态位置的定向声。

采用本方案之后的优势是：

1)、该方案是基于声学算法实现的，相比于超声定向声技术的成本更低，低频的效果更好，也更适用于个人用户的使用场景。

2)、对于该扬声器阵列系统，可以实现根据用户的位置匹配相应的传递函数，从而实现智能动态调节定向声角度。智能动态调节声学亮区的范围，本申请实施例提出的两个方案均可以有效的实现该效果。实现追踪用户位置的定向声效果，在用户所处区域实现类似于“虚拟耳机”的效果。

基于前述的实施例，本申请实施例提供一种定向发声装置，该装置包括所包括的各单元、以及各单元所包括的各模块、以及各模块所包括的各部件，可以通过定向发声设备中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为CPU(Central Processing Unit，中央处理器)、MPU(Microprocessor Unit，微处理器)、DSP(Digital Signal Processing，数字信号处理器)或FPGA(Field Programmable GateArray，现场可编程门阵列)等。

图6为本申请实施例定向发声装置的组成结构示意图，如图6所示，所述装置600包括：

获取单元601，用于获得目标对象的位置信息，所述目标对象是接收定向发声设备输出的目标声音的对象；

配置单元602，用于基于所述位置信息配置所述定向发声设备的发声组件的发声参数，以基于所述发声参数将目标声音定向输送至所述目标对象；

其中，在所述目标对象相对所述定向发声设备处于不同的位置的情况下，对应的发声参数不同。

在一些实施例中，所述配置单元602，包括以下至少之一：

第一配置模块，用于基于所述位置信息确定所述目标对象当前所处的目标声学区域，基于声学区域与发声参数之间的映射关系确定所述目标声学区域对应的目标发声参数，控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标声学区域；

第二配置模块，用于基于所述位置信息确定所述目标对象当前所在的目标位置与初始声学亮区的第一位置关系，基于所述第一位置关系和所述初始声学亮区所对应的初始发声参数确定所述目标位置对应的目标发声参数，控制所述定向发声设备的发声组件以所述目标发声参数工作，以将目标声音定向输送至所述目标位置。

在一些实施例中，所述第一配置模块，包括：

第一配置子模块，用于将所述定向发声设备的发声区域划分为多个声学区域，确定每一声学区域作为声学亮区和声学暗区时对应的滤波器系数，得到所述声学区域与发声参数之间的映射关系；

所述第一配置子模块，还用于将所述目标对象当前所处的目标声学区域作为声学亮区，基于所述映射关系将该声学亮区所对应的目标滤波器系数作为所述目标发声参数。

在一些实施例中，所述第二配置模块，包括：

第二配置子模块，用于确定初始声学亮区的位置及其对应的初始滤波器系数；

所述第二配置子模块，还用于基于所述第一位置关系确定角度变换矩阵，利用所述角度变换矩阵对所述初始滤波器系数进行处理，得到目标滤波器系数，将所述目标滤波器系数作为所述目标位置所对应的目标发声参数。

在一些实施例中，所述定向发声设备的发声组件包括至少一扬声器阵列，所述装置还包括：

测试单元，用于利用所述扬声器阵列的扬声器部件依次发射白噪声，测试所述白噪声从所述扬声器阵列到声学亮区目标点位置的第一传递函数、以及从所述扬声器阵列到声学暗区目标点位置的第二传递函数；

求解单元，用于基于所述第一传递函数和所述第二传递函数，以最大化声学亮区和声学暗区的声能量对比度为目标进行最优权向量求解，得到每一声学区域对应的滤波器系数。

在一些实施例中，所述求解单元，包括：

求解子单元，用于确定所述扬声器阵列中不同扬声器对应的第一传递函数之间的第一互相关矩阵，以及不同扬声器对应的第二传递函数之间的第二互相关矩阵；

所述求解子单元，还用于基于所述第一互相关矩阵和所述第二互相关矩阵，以最大化声学亮区和声学暗区的声能量对比度为目标进行最优权向量求解，得到每一声学区域对应的滤波器系数。

在一些实施例中，所述装置还包括以下至少之一：

第一调整单元，用于监测目标对象的运动信息，基于所述运动信息调整所述定向发声设备的发声组件的发声参数；

所述第一调整单元，还用于获得所述定向发声设备所处位置的环境信息，基于所述环境信息调整所述定向发声设备的发声组件的发声参数；

所述第一调整单元，还用于获得目标声音的属性信息，基于所述属性信息调整所述定向发声设备的发声组件的发声参数。

在一些实施例中，所述装置还包括以下至少之一：

第二调整单元，用于基于所述位置信息确定所述目标对象与所述定向发声设备的声学区域目标点位置的第二位置关系，基于所述第二位置关系调整所述发声参数；

所述第二调整单元，还用于获得目标对象对声音的敏感程度信息，基于所述敏感程度信息调整所述发声参数；

所述第二调整单元，还用于获得所述定向发声设备与其他音频输出设备的第三位置关系，基于所述第三位置关系调整所述发声参数。

以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

需要说明的是，本申请实施例中，如果以软件功能模块的形式实现上述的定向发声方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台电子设备(可以是个人计算机、服务器等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、ROM(Read Only Memory，只读存储器)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件和软件结合。

对应地，本申请实施例提供一种定向发声设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述实施例中提供的定向发声方法中的步骤。

对应地，本申请实施例提供一种可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述定向发声方法中的步骤。

这里需要指出的是：以上存储介质和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

需要说明的是，图7为本申请实施例定向发声设备的一种硬件实体示意图，如图7所示，该定向发声设备700的硬件实体包括：处理器701、通信接口702和存储器703，其中

处理器701通常控制定向发声设备700的总体操作。

通信接口702可以使定向发声设备700通过网络与其他电子设备或服务器或平台通信。

存储器703配置为存储由处理器701可执行的指令和应用，还可以缓存待处理器701以及定向发声设备700中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过FLASH(闪存)或RAM(Random Access Memory，随机访问存储器)实现。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理模块中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张岳;王冉;刘扬;
专利申请人：联想(北京)有限公司;