掌桥专利:专业的专利平台
掌桥专利
首页

用于飞机上的内部通信的方向性阵列对讲机

文献发布时间:2023-06-19 19:28:50


用于飞机上的内部通信的方向性阵列对讲机

技术领域

本公开总体上涉及用于飞机的音频对讲系统。更具体地说,对讲系统使用分布式、声学上可操控的波束扬声器和麦克风阵列来跟踪用户语音的位置,并使用关键字语音识别和对话处理器来路由飞机内不同区域之间的通信。

背景技术

本部分提供与本公开相关的背景信息,其不一定是现有技术。

在飞行之前和飞行期间,机舱内的乘务员和机组人员以及飞行驾驶台(flightdeck)上的飞行员需要可靠的彼此通信的手段。虽然乘客可能包括在一般通告中,但在许多情况下,飞行员和机组人员需要在不打扰乘客的情况下进行通信。在某些情况下,飞行员可能需要与上班的机组人员进行通信,而不会唤醒正在睡觉的下班的机组成员。

通常,机组人员-飞行员通信由专用对讲系统承载,该专用对讲系统将飞行员的耳机与分布在整个机舱的专用位置(通常邻近飞行驾驶台,靠近机组人员座位和在后盥洗室区域中)的机组人员耳机或听筒(例如,插入到插孔中)连接。

这种耳机和听筒并不总是便利的,并且在某些情况下使用起来相当麻烦。例如,在涉及烟、火灾或烟雾的紧急情况下,飞行机组人员在执行灭火或清除烟和烟雾的职责时必须穿戴个人防护装备(PPE,personal protection equipment)。该PPE被设计为保护作出响应的机组人员的面部和身体。PPE面罩以及火灾、烟或烟雾的存在可能会导致难以找到和使用耳机,尤其是在后盥洗室内的狭窄区域中。

发明内容

所公开的对讲系统提供了一种解决常规分布式耳机系统的缺点的免提飞行员-机组人员对讲系统。所公开的系统不依赖于有线的耳机或听筒,而是使用多个方向性麦克风阵列和方向性扬声器阵列系统,其部署在机舱和飞行驾驶台内的合适位置或区域。麦克风阵列和扬声器阵列形成对讲系统的一部分,该对讲系统控制或操控(steer)每个相应麦克风阵列和扬声器阵列的波束图案指向方向。麦克风阵列波束图案的指向方向(收听方向)是通过在包括一个麦克风阵列的单独麦克风换能器之间引入时间延迟或相移差异来产生的。类似地,扬声器阵列波束图案的指向方向是通过在包括一个扬声器阵列的单独扬声器换能器之间引入时间延迟或相移差异来产生的。

通过使用关键字或短语来调用系统,系统确定关键字话语起源的飞行员或机组成员的位置,然后调整附近麦克风阵列的指向方向或焦点,以聚焦对那个人进一步话语的拾取。

然后,系统调整人所在区域内的扬声器阵列的指向方向,以将声学通知和通信从对讲系统聚焦或投射到该区域内的人,使得消息可以被那个人听得更清楚。

可以一次管理多个不同的双向或n向通信,这归功于消息路由系统,该消息路由系统维护正在进行的每个双向、n向和广播通信的数据记录。数据记录存储每个对话起源和端点(endpoint)的位置,使得所有通知和通信消息都被路由到最近或性能最佳的麦克风阵列和扬声器阵列,以用于通信的每一方。

当通信正在进行时,消息路由系统将由当前使用的麦克风阵列接收到的信号与从其他附近的麦克风阵列接收到的时间相关信号进行比较,并且如果说话的人正在移出当前使用的麦克风阵列的范围,则将自动地将通信切换到性能更好的麦克风阵列。以这种方式,如果机组成员在进行对话时在机舱周围移动,则通过分析麦克风阵列数据来重新评估该机组成员的位置,并且可以选择性能更好的麦克风阵列以供后续使用。

在任何时候,如果一个人无法从当前使用的扬声器阵列清楚地听到,则那个人可以简单地说出校准消息,诸如“GINA,校准”,并且该话语将用于确定那个人的当前位置并重新聚焦扬声器阵列波束。在所示实施例中,遍及各处使用了术语GINA(表示湾流内部通知阵列,Gulfstream Internal Notification Array)。将理解的是,可以使用不同的词语或短语。

因此,根据本公开的一个方面,提供了一种用于飞机的对讲机(intercom),该飞机具有限定多个空间不同的区域的飞行驾驶台和机舱。对讲机采用多个麦克风阵列,其设置在多个区域中的每一个中;以及多个扬声器阵列,其设置在多个区域中的每一个中。多个可操控扬声器阵列各自产生单独可控的可操控声束。

对讲机包括语音识别器,其耦合到多个麦克风阵列中的每一个,并且可操作以生成与从由多个麦克风阵列拾取的声学信号导出的话语相对应的识别文本。方向控制处理器耦合到多个麦克风阵列中的每一个和多个扬声器阵列中的每一个。方向控制处理器被编程为分析来自多个可操控麦克风阵列中的至少一个的信号的到达时间以识别话语的位置,并使用所识别的位置来控制多个可操控扬声器阵列中的至少一个的波束方向。

对讲机还包括对话管理器处理器,其耦合到语音识别器以及多个麦克风阵列和多个扬声器阵列中的每一个。对话管理器处理器被编程为响应预定义关键字集合,以使用设置在第一选定区域和第二选定区域中的每一个中的麦克风阵列和扬声器阵列,选择性地将语音通信从第一选定区域路由到第二选定区域。

附图说明

本文描述的附图仅用于所选实施例的说明性目的,而不是所有可能的实现方式。附图的特定选择并不旨在限制本公开的范围。

图1是对讲系统的框图;

图2a和图2b图示性地示出了序列,通过该序列检测飞行员话语并使用飞行员话语在该飞行员的方向上操控扬声器阵列;

图3是示出麦克风阵列和扬声器阵列系统可以如何与信号处理相结合以基于检测到的话语来操控波束成形扬声器阵列或波束成形麦克风阵列指向方向的框图;

图4是示出可以如何测量相同说出信号的不同到达时间的波形图;

图5是示出被说出声音的波前的几何原点可以如何从不同视角到达麦克风换能器对的图;

图6是示出扬声器阵列内的一对扬声器换能器的定相(插入的时间延迟)可以如何通过相长和相消干涉来影响波束指向方向的图;

图7是用于理解编程处理器可以如何实现音频定向系统的流程图;以及

图8是用于理解用于到达方向分析的GCC-PHAT最大似然估计技术的框图。

具体实施方式

介绍和基本功能

对讲系统使用机载的麦克风和扬声器阵列来实现飞机上不同区或区域之间的内部通信。使用比如“GINA”之类的元命令关键字,飞行机组人员或乘客可以请求与飞机的其他区域进行通信。例如,机舱内的人说“GINA,飞行驾驶台”将促使连接到飞行驾驶台。在实现系统时,可以使用任何元命令关键字。因此,将理解的是,关键字“GINA”仅为示例。

出于隐私目的,必须在建立双向通信之前接受连接请求。例如,接收者将听到比如“来自机舱的GINA通信请求正在等待批准”之类的广播消息。诸如“GINA,接受”之类的响应将建立与机舱的通信。

出于隐私目的,双向通信可以在任何时间使用来自通信中涉及的任一区域的关键字“GINA,停止”来关闭。出于隐私目的,所有GINA通信都留在飞机上,并且不被记录。

虽然所公开的对讲系统的常规使用通常将用于支持飞行员和机组人员之间的通信或机组成员之间的通信,但该系统也可以用于使乘客能够与飞行机组人员交谈,而无需走到飞行驾驶台或机组人员休息区。

当对飞行驾驶台外的问题进行故障排除时,所公开的对讲系统特别有用。飞行机组人员可以在与飞行驾驶台维持通信的同时对有问题的站点进行故障排除。在紧急情况的过程中,诸如涉及烟、火灾或烟雾的紧急情况,飞行机组人员可以与飞行驾驶台进行通信,而无需寻找和佩戴耳机。

所公开的对讲系统可以使用一个或多个处理器来实现,诸如微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)设备及其组合。这些处理器被编程为执行下面解释和描述的功能。

对讲系统组件概述

如图1所示,所公开的对讲系统被设计为部署在飞机10内,并且采用分布在整个飞机的预定区或区域中的多个麦克风阵列30和扬声器阵列32。如图所示,这些区域表示飞机内的唯一可寻址区域。在所示示例中,飞行驾驶台位于区域0内,并且乘客和机组人员机舱区域位于区域1……区域n内。所公开的对讲系统使用所示处理系统在整个飞机的可寻址区域之间处理和路由语音消息和对话。

如将进一步解释的,定位麦克风阵列以从乘客、飞行员和其他机组人员拾取话语(例如,人类语音)。信号处理电路分析这些接收到的话语以确定话语起源的位置。然后,波束操控系统使用该信息来以电子方式操控附近扬声器阵列的波束。相同的信息还用于操控波束成形麦克风阵列,以提高该人在嘈杂环境中的语音清晰度。因此,系统能够直接向每个乘员的位置提供音频内容。

具体地,所公开的对讲系统使用分配至三个不同控制层(即语音识别层300、麦克风和扬声器阵列瞄准层302以及消息和对话路由层304)的处理器来处理语音消息和对话。这些层通过系统处理器的操作系统306协作地互连,操作系统306包括流控制消息传递系统,通过流控制消息传递系统将一层中的条件通信到其他层。如现在将描述的,这些控制层是处理器实现的。

语音识别层300采用语音识别处理器310,诸如经过训练的神经网络或基于隐马尔可夫模型的处理器,其收听由整个飞机中的麦克风阵列拾取的所有声学信号,处理这些信号以检测是否任何一个信号与以注意关键字开头的预定义元命令关键字相关。在本公开中,“GINA”被用作注意关键字。任何合适的关键字(日常言语中不常用)就足够了。

当以足够高的识别似然性检测到元命令关键字话语时,控制消息由语音识别器处理器310经由操作系统306流控制消息传递系统发送到阵列瞄准层302和对话路由层304,导致这两个层都被唤醒并开始主动处理。

麦克风和扬声器阵列瞄准层302采用方向控制处理器312,其执行与以下相关的任务集合:确定说话的人的位置,并且分别操控麦克风和扬声器阵列30和32,以优化与那个人的通信。由处理器312执行的功能之一是进行使用哪个麦克风阵列和扬声器阵列的初始评估。具体地,方向控制处理器312基于具有最强麦克风信号而将麦克风阵列之一识别为主麦克风阵列。其他麦克风阵列的信号水平也由处理器312监测并与来自主麦克风阵列的信号水平进行比较。这种比较用于检测说话的人在对话期间是否已经移动到不同的区或区域。

在使用主麦克风阵列的情况下,方向控制处理器312对由主麦克风阵列接收到的声学信号执行到达时间分析,并使用该信息来确定说话人的话语起源的位置。这包括确定元命令起源的位置以及随后的话语。在一个实施例中,这些到达时间分析由到达时间定位处理器56执行,在下面更全面地讨论。

方向控制处理器312使用所确定的说话人的位置信息,以朝向说话人的位置定向、操控或聚焦主扬声器阵列32的声束。在一个实施例中,使用延迟处理器60执行波束操控,该延迟处理器60将具体计算的时间延迟或相移注入到提供给包括主扬声器阵列32的每个单独扬声器的每个电信号中。延迟处理器60的功能在下面更全面地讨论。

对话管理器

所公开的对讲系统在消息和对话路由层304中包括对话管理器处理器314,其被编程为基于什么关键字元命令被先前说出并由语音识别器处理器310识别到的状态,在不同区或区域之间路由消息。

例如,如果位于飞行驾驶台上的麦克风阵列从飞行员拾取话语“GINA厨房”,则语音识别器310会将话语识别为属于预定义的元命令集,并且会将话语的识别文本(或与识别文本相对应的合适参数)通过流控制消息传递系统306传递到消息路由和对话层304。对话管理器处理器314然后会解析文本命令或参数,并通过打开飞行驾驶台和厨房之间的对讲通道(即分别在飞行驾驶台和厨房的扬声器阵列和麦克风阵列之间)而对文本命令或参数起作用。对话管理器处理器314然后会向厨房扬声器阵列发出合成的或数字预录的语音消息,宣布“来自飞行驾驶台的GINA通信正在等待批准”。对话管理器处理器314然后在预定的响应时间内监测打开的通道,在此期间机组成员会要么通过说出“GINA,接受”来响应,要么响应时间会过去。一旦响应时间过去,则对话管理器处理器314向飞行驾驶台发出合成语音消息,“没有来自厨房的响应”。

对话管理器处理器主要用于打开和关闭飞机内的第一区或区域与飞机内的第二区或区域之间的通信通道。可以打开通道以用于两个区域之间的人与人通信;或者可以打开通道以用于跨两个以上区域的多播或广播。

一旦通道打开并且在两方或更多方之间使用,则对话管理器处理器314退回到非干扰模式,其中允许通信继续进行而不与对话管理器交互。对话管理器处理器将仅在某些监督元命令(诸如“GINA,停止”)被说出的情况下在进行中的对话中进行调停,这导致处理器314关闭通信通道。

在对话期间,机组成员可能在区或区域内四处移动,使得主扬声器阵列不再最佳地指向机组成员的方向。对话管理器处理器314被编程为响应于元命令“GINA,校准”来处理这种情况。当这种重新校准请求被语音识别器310识别到并传递给对话管理器处理器314时,处理器314通过流控制消息传递系统306向麦克风和扬声器阵列瞄准层302发出命令。到达时间定位处理器56使用与“GINA,校准”话语相关联的声学数据来重新校准说话者的位置。然后,延迟处理器60使用新确定的说话者位置来将扬声器阵列波束操控到新位置。

上面概述的重新校准过程突出了所公开的对讲系统的一个重要方面——声学数据、识别到的元数据命令和流控制消息传递指令与给定事件相关,即使这些不同的数据不是在同一时刻发生或改变状态。这种行为之所以成为可能,是因为由麦克风阵列换能器拾取的声学数据存储在带时间戳的缓冲区中,允许到达时间定位处理器及时回顾以分析与“GINA,校准”话语相对应的声学数据片段,即使来自对话管理器处理器的进行此操作的指令是在话语发生后发出的。时间戳被配置为具有在此类时间计算中使用的所需分辨率和准确性。

路由命令集

作为示例,下表提供了由对话管理器处理器314实现的语音识别路由命令的示例性列表。这些命令通过说出元命令关键字GINA来触发。将认识到的是,提供该命令表是为了说明所公开的对讲系统的实用性,而不是意图作为详尽的列表。还将认识到的是,元命令关键字GINA仅为示例性的,因为可以使用任何通常不被说出的关键字或短语。

/>

除了响应于语音命令之外,对话管理器处理器314可以提供由其他手段触发的路由和控制功能。因此,处理器314可以被配置为以编程方式响应于飞机上感测到的条件、飞行驾驶台设备设置或飞行计划内的飞行阶段。例如,如果检测到湍流条件,则对话管理器处理器可以使咨询消息广播到所有区或区域。向机组人员睡眠区的某些类型的消息可以在占用传感器指示这些区正被占用时被抑制或阻止。当飞机处于预定的飞行阶段时,诸如在着陆期间,或者如果飞行员使用口头命令或来自飞行驾驶台内的致动器操纵来故意对阻止进行超控,则机组人员睡眠区消息阻止可以被自动解除阻止。例如,当睡觉的机组人员需要被警告紧急情况时,可以执行这种超控。

对话管理器可以耦合到飞机上的计算机系统,该计算机系统存储当前飞行计划的记录并确定相对于当前飞行计划的飞机飞行状态,使得所应用的禁止路由到睡眠区域的规则考虑到飞机飞行状态。

切换到另一个区域

如果正在与从一个区或区域移动到另一个区或区域的机组成员进行对话,则方向控制处理器312将感测到这一点,因为随着新的区或区域的信号强度将逐渐增加,主麦克风阵列的信号强度将逐渐降低。当来自两个区域的信号强度变得大致相等时,对话管理器处理器314经由流控制消息传递系统306得到通知,使其向移动的机组成员发出语音提示,请求重新校准。作为响应,机组成员会简单地说出“GINA校准”,然后说话者的新位置通过到达时间三角测量而被获取。

实际上,可能不需要提示机组成员进行重新校准,因为机组成员可能会检测到来自原始区或区域的扬声器阵列波束不再提供稳健信号。因此,重新校准序列会是自主的,并且会在没有提示的情况下运行。

对话记录日志

为了处理区域转移,对话管理器处理器314维护每个对话从其开始直到因明确的“GINA停止”消息或因自动超时而终止的时间的记录。每个这样的记录包括起源区域、目的地区域和对话开始时的时间戳的指示。例如,以下记录将指示在UTC时间戳2021-08-23 20:02:51从飞行驾驶台(区域0)向厨房(区域1)发起呼叫。

0,1,2021-08-23 20:02:51

当呼叫终止时,它的数据记录可以被适当地标记,如下所示,或者简单地擦除。

0,1,2021-08-23 20:02:51X——其中X表示明确的STOP命令

或者

0,1,2021-08-23 20:02:51t/o——其中t/o表示呼叫因自动超时而终止

(如果有用,也可能有与X或t/o相关联的时间戳,从而提供通信持续时间)。

如果发生切换,由此机组成员从厨房移动到前方乘客区(区域3),则呼叫记录通过终止初始记录并立即写入更新的记录来更新,如下所示:

0,1,2021-08-23 20:02:51X

0,3,2021-08-23 20:04:14

通过比较切换示例中的时间戳,注意到呼叫切换到区域3发生在区域0和区域1之间最初建立呼叫之后1分23秒。

这种切换的效果是关闭到区域1中的扬声器阵列的通道,同时打开到区域3中的扬声器阵列的通道。类似地,在切换之后,区域3中的麦克风阵列将用于拾取来自流动机组成员的话语。

将理解的是,数据记录示例仅旨在示出对话线程的记录可以如何由对话管理器处理器314记载和存储。这些记录在两方之间正在进行对话期间是有用的,因为它们标识通信双方的端点,并因此规定如何对通信进行路由。这些记录也可以保存在日志文件中,以便稍后在与某些区域的通信可能出现故障时进行检查。出于隐私原因,这些记录不包含任何特定对话内容的指示,甚至不包含个体所说的内容。这些记录仅反映在特定时间帧期间两个区域之间的通信通道是打开的。

麦克风和扬声器阵列的放置和操作

参考图2a和图2b,飞行驾驶台12通过隔板16与乘客区隔开。在所示示例中,提供三个飞行员座椅34,用于飞行员、副飞行员和辅助飞行员。安装在仪表板上合适位置的是麦克风阵列30(所示的是两个这样的阵列,一个用于飞行员,一个用于副飞行员)。在一般情况下,将部署一个或多个阵列来处理来自两个飞行员的通信,目标是提供良好的方向性,以允许飞行员和副飞行员同时对话到分离的接收器。实现这一目标所需的麦克风阵列数量将取决于飞行驾驶台的声学效果。还适当地安装扬声器阵列32(所示的是两个这样的阵列,一个用于飞行员,一个用于副飞行员)。在图4中图示性地示出了用于实现音频定向系统36的电子组件。在38处还图示性地示出了航空电子通信系统,其提供飞行员与空中交通管制和其他服务之间的无线电通信,包括与机组人员的对讲通信,并且还提供声音警告和警报消息。该航空电子通信系统通过定位在飞行员前方的扬声器阵列32提供音频内容。

图2a和图2b示出了音频定向系统如何工作。如图2a中所示,飞行员40a说出作为话语42传播的口头消息,它被麦克风阵列30a接收。电子音频定向系统36对接收到的话语进行处理以确定话语从其起源的方向,并且然后使用该起源方向将扬声器阵列32(位于最接近飞行员40a)的声学输出以电子方式操控在飞行员40a的方向上。如图2b中所示,在现在已经被操控以将其声能指向飞行员的情况下,扬声器阵列32将来自航空电子通信系统38的后续音频内容作为声能束44传输到该飞行员。音频定向系统36可以被配置为执行采样和保持功能,由此在从他或她的话语获悉人的位置的情况下,系统将维持在所获悉的位置上训练的扬声器阵列32,除非后续话语规定应当调整波束方向。

波束操控

参考图3,更详细地示出了音频定向系统36。在操控扬声器模式下,系统被设计成在通过确定乘员说出的话语42的起源方向来感测乘员的方向或位置之后,将音频内容从扬声器阵列32定向至飞机的乘员,或将麦克风阵列波束成形朝向乘员,诸如飞行员或乘客40。在聚焦麦克风模式下,系统还被设计成在感测乘员的方向或位置之后,将波束成形麦克风阵列30(包括多个麦克风换能器46)聚焦在乘员的方向上。如果需要,可以一起使用操控扬声器和聚焦麦克风的应用。

如先前所讨论的,话语42由麦克风阵列30拾取,该麦克风阵列30包括以已知位置和间距的预定分组布置的多个单独可寻址(独立监测)的麦克风换能器46。扬声器阵列32还包括已知位置和间距的多个单独可寻址的扬声器换能器50。

单独的麦克风换能器46各自耦合到多通道的前置放大器52,前置放大器52将每个麦克风换能器46的相应输出放大到合适的电平,以驱动多通道的模数(A到D)转换器54。由于音频定向系统依赖于到达时间检测,所以前置放大器52和模数转换器电路54应当被配置为在所有通道上引入相等的相位延迟(或时间延迟)(如果有的话)。这将确保相对到达时间的测量是准确确定的,以确保计算出的时间差是准确的。这可以部分地通过仔细选择组件以匹配麦克风换能器的阻抗并最小化通道之间的电容或电感差异、以及通过确保所有通道的电信号路径长度相同来实现。还可以使用不需要模数转换器的具有数字输出的麦克风换能器来实现该系统。

多通道的模数转换器54将每个麦克风换能器输出的数字表示提供给信号处理器56,信号处理器56使用到达方向算法来确定话语来源的位置或定位。信号处理器56被编程为对由麦克风阵列30的换能器接收到的声音进行关联和比较,以确定相同话语到达每个换能器的时间。根据这些所确定的时间,计算时间差dt。

使用到达时间的话语定位

如图4中图示性示出的,在话语42b到达换能器46b之前,话语42a到达第一换能器46a。信号处理器对由每个换能器接收到的声音执行关联,以便识别话语42a和42b表示相同的话语事件,只是在不同时间被接收。通过对相应接收到的话语信号的到达时间进行相减,由处理器计算时间差dt。然后根据该计算出的时间差dt计算话语来源的位置或定位。

图5示出了计算出的在换能器42a和42b处的到达时间的差dt可以如何不仅用来确定话语来自的大致方向,还通过三角测量法确定话语42的来源的精确位置或定位。在图5中,话语在42处起源,并以由图5中的扩展弧线描绘的球面波前在声学上传播。如图所示,在波前穿过换能器46b并被其接收之前,波前在48处穿过换能器46a并被其接收。换能器46a和46b之间的间距L是固定的。因此,从话语来源42到换能器46a的视线距离x比视线距离y短一个数量,该数量等于在计算出的延迟时间dt期间波前传播到46b的附加距离。换句话说,在知道所计算或测量的时间延迟dt和飞机机舱内的声速c的情况下,从话语来源42到相应换能器46a和46b的距离可以相关,如下:

y=x+dt×c

在已经计算出距离x和y并且知道固定间距L以及麦克风换能器46a和46b的已知位置的情况下,可以确定话语来源42的方向和位置。如果需要,可以使用角度度量来表示话语来源的位置。在图5中,这种角度度量以相对于与换能器46a和46b所在平面正交的直线所测量的θ

聚焦麦克风模式

返回图3,处理器56使用所计算的话语来源计算将到达方向指令提供给麦克风阵列波束成形延迟调整处理器57。这将时间延迟或相位变化插入到来自模数转换器54的输入信号中的所选信号中,以使麦克风阵列作为操控波束成形阵列进行操作,其定向或聚焦麦克风阵列拾取图案以增强在话语来源的方向上的声音拾取。麦克风阵列波束成形延迟调整处理器57的输出作为音频输入源在24和38处馈送。以该方式,由麦克风阵列30拾取的音频信号将偏好在波束已被主动聚焦的方向上的声音拾取。如上所述,聚焦麦克风模式可以与操控扬声器模式同时使用。

操控扬声器模式

返回图3,处理器56使用所计算的话语来源计算将指令提供给波束操控电路或信号处理操作60。执行声束的实际操控,而不需要扬声器换能器50或麦克风阵列30的物理重取向。相反,通过在馈送到每个单独换能器的音频信号中引入定时或定相差异来以电子方式操控波束。这些相移或时移的音频信号通过合适的驱动器电路72和功率放大器74提供给扬声器阵列32的单独的扬声器换能器50。注意,相移或时移的音频信号并行地传送到扬声器阵列的扬声器换能器。应当注意,驱动器电路72和功率放大器74在所有通道上引入相等的相位延迟(或时间延迟)(如果有的话)。这将确保会发生适当的相长和相消干涉,以便正确地操控波束。这可以部分地通过仔细选择组件以匹配扬声器换能器的阻抗并最小化通道之间的电容或电感差异、以及通过确保所有通道的电信号路径长度相同来实现。

波束操控电路或过程60在为每个通道插入计算出的时间延迟以实现波束操控之后,本质上是从航空电子通信系统38(用于飞行员)或从机上娱乐系统24(用于乘客)传送音频内容。如果尚未在数字域中,则来自航空电子通信系统38和机上娱乐系统24的音频输入可以通过音频处理电路62中的模数转换进行转换。

调制超声波束实施例

如果需要,可以使用超声扬声器系统来实现更有方向性(更窄)的波束44,该系统可以实现为音频处理电路62的一部分,如图3中的虚线框64所示。在该实施例中,来自航空电子通信系统38和/或机上娱乐系统24的音频输入在通过波束操控调整60处理之后被提供给调制器电路68,调制器电路68将音频节目内容调制到由超声振荡器66提供的超声载波上。采用一个这样的调制器电路来馈送驱动器72电路中的每一个,使得每个换能器以适当的时间延迟(相位调整)传输超声信号。以该方式,扬声器阵列产生具有人耳听不见的频率的超声载波的超声波束。系统音频调制在该超声载波上,并因此与载波一起在波束的方向上传播。当波束在到达听众耳朵的路线中经过空气分子时,调制波通过与空气分子的相互作用而变为自然解调。由于这种自然解调,听众能够听到解调后的音频信号,听起来就像来自常规扬声器。

用于控制扬声器波束方向的电路

信号处理器56使用麦克风换能器信号之间的到达时间延迟,在其话语被接收到的人的方向上以电子方式操控波束44。这是通过插入受控延迟来实现的。

为了更好地理解波束操控是如何实现的,请参考图6,其示出了以线性阵列布置的两个扬声器换能器50。当两个扬声器相干地馈送有相同的音频信号时,从每个扬声器发出的声波是同相的,并且声音将好像从扬声器的平面(即,从垂直于水平轴(如图6中所示)的方向)直接产生。

然而,当扬声器之一由延迟了时间增量dt的信号馈送时,两个扬声器的相应波前之间的相长和相消干涉将在成角度的方向上产生最响亮的集合声音,与水平轴不再垂直而是成角度θ,如图6中所示。通过知道音频频率的波长,可以用三角法计算角度方向。根据以下等式,频率(f)和波长λ与声速c相关:

f=c/λ

为了在图6中所示的方向(角度θ)上操控波束,来自左侧扬声器(图6中)的信号被延迟了时间dt,该时间dt被计算为导致以下事实,即,来自左侧扬声器(图6中)的信号必须穿过附加距离d,以便其波前与来自右侧扬声器(图6中)的波前同相。可以使用以下三角关系为给定角度θ计算该延迟dt:

dt=s sin(θ)/c

其中s是扬声器间距,并且c是环境温度下的声速。

编程处理器实现方式

图7示出了处理器被编程以执行的步骤的一个示例性实施例,在100处开始。尽管将处理器描绘为连续的一系列步骤,但是如果需要,这些操作可以并行执行。

处理器使用存储器102,其被配置为存储校准数据104,校准数据104用于向处理器给出麦克风换能器和扬声器换能器的位置的知识。可替代地,如果需要,换能器位置可以硬编码在固件或软件中。存储器102还提供数据存储106,用于存储最后使用的(先前的)话语来源位置。处理器使用这种存储的位置来计算扬声器指向方向,如果说话者移动,则根据需要更新所存储的值——有效地实现采样和保持功能。存储器102还用于定义多个预定义音频通道108,包括用于每个麦克风换能器的一组通道和用于每个扬声器换能器的一组通道。这些是数字音频通道,将来自麦克风和来自航空电子通信系统38或机上娱乐系统24的数字音频存储在适当大小的缓冲存储器位置,处理器可以在这些位置上操作以操纵数据。

处理器在110处从麦克风接收输入并在112处应用预滤波器。如下面所讨论的,预滤波器可以用于抑制或拒绝由麦克风接收的不具有人类语音质量的声音。在114处,处理器对预滤波的(人类语音话语)数据应用到达时间算法或函数,以找到话语来源位置。在一个实施例中,使用GCC-PHAT函数。

处理器在116处测试话语来源位置是否与先前存储在数据存储106中的值实质不同。如果是,则处理器前进到步骤118,在数据存储106中写入新的话语来源位置。如果不是,则处理器恢复到开始100。

根据存储在数据存储106中的话语来源位置值,处理器在步骤120处计算新的扬声器阵列指向方向。参见图5。然后处理器在122处使用该新的指向方向来计算将使扬声器波束指向新的指向方向的时间延迟参数。参见图6。处理器在步骤124处使用这些计算出的时间延迟参数在适用时在每个扬声器的音频通道中插入时间延迟。这是通过对音频通道中缓冲的数字音频数据进行操作来完成的,以重新定位某些数据以进行延迟播放(相对于其他音频通道)。经过时间延迟处理的音频数据作为音频内容通过每个扬声器的多个信号通道来提供。

广义互相关相位变换(GCC-PHAT)

参考图3,在一个实施例中,处理器56被编程为通过最大化广义互相关相位变换(GCC-PHAT)函数58来执行到达时间检测,以确定话语来源(位置和/或方向)。这通过以下操作将从两个空间分离的麦克风换能器接收的信号进行比较:将这些信号应用到具有可调时间分量的互相关器,其建立一个信号相对于另一个信号的时间延迟。然后通过以编程方式或以算法方式调整时间分量,针对各种不同的延迟组合对两个信号进行相乘和积分,直到发现最大峰值。达到该最大峰值的时间分量延迟对应于两个信号之间的到达时间延迟的最大似然估计。

图8示出了基本的最大似然估计原理。将两个麦克风信号x

不同的滤波器函数或变换可以用于滤波器200。在所描述的实施例中,已经使用相位变换(PHAT)。可以替换其他滤波器替代物。如果需要,可以使用Matlab gccphat(sig,refsig)函数实现GCC-PHAT函数。

预滤波

假设背景噪声是相对不相关的,信号处理器56使用的GCC-PHAT函数在存在背景噪声的情况下相当稳健。然而,为了增强话语检测并避免错误触发,信号处理器56还可以包括一个或多个音频预滤波器,以在到达时间估计(GCC-PHAT)之前处理麦克风换能器数据。这种预滤波可以包括频带滤波,其中在正常人类语音频率范围之外的麦克风换能器信号被抑制。为了进一步提高可扩展性,可以使用不同的成对麦克风阵列来推导出更可靠的到达方向估计。

这种预滤波还可以包括梅尔频率处理,其比线性间隔的频带更接近人类听觉系统的响应。此外,预滤波还可以包括时间窗口处理,由此来自麦克风换能器的输入数据流被采样到与人类语音的自然持续时间相对应的时间窗口中,从而允许处理器抑制对信号的到达时间估计处理,该信号可能包括与人类语音相同的频率,但不存在于与人类语音相当的时间帧上。

在更高级的系统中,预滤波还可以包括语音识别处理,由此处理器测试接收到的信号是否从语音识别器算法生成足够高的似然分数,以断定该信号是人类语音。在这种情况下,识别器不需要将话语解码成文本,而只是确定接收到的声音很可能是人类语音。也可以使用这些和其他类似滤波器的组合。

尽管在前述详细描述中已经提出了至少一个示例性实施例,但是应当理解,存在大量的变型。还应当理解,示例性实施例或多个示例性实施例仅是示例,并且不旨在以任何方式限制本发明的范围、适用性或配置。相反,前述详细描述将为本领域技术人员提供用于实现如本文考虑的示例性实施例的便利路线图。应当理解,在不脱离如所附权利要求中阐述的本发明的范围的情况下,可以在示例性实施例中描述的元件的功能和布置中进行各种改变。

技术分类

06120115928213