掌桥专利:专业的专利平台
掌桥专利
首页

音频信号采集设备和音频信号采集方法

文献发布时间:2023-06-19 11:44:10


音频信号采集设备和音频信号采集方法

技术领域

本公开涉及计算机技术领域,尤其是一种音频信号采集设备和音频信号采集方法、存储介质以及电子设备。

背景技术

随着语音交互技术的发展,很多设备里面加入了语音识别的功能,基础功能有语音降噪,声源定位,以及在此衍生出来的很多上层应用。比如汽车领域,副驾说打开空调,就只打开副驾区域的空调;比如后排左方的乘客说播放音乐,就只播放后排左方的扬声器等等。为了使这些功能得到较好的实际体验,需要在设备内采集大量的音频数据进行唤醒和识别模型的训练。在车辆上,采集音频信号的位置可以包括:每个座位、车机屏幕,顶灯,方向盘等。目前采用的音频信号采集方法通常是,在每台车内,放置一个工控机,一台显示器,一块多麦克风的录音板,一台车载逆变器,一套电源插排。

发明内容

本公开的实施例提供了一种音频信号采集设备和音频信号采集方法、存储介质以及电子设备。

本公开的实施例提供了一种音频信号采集设备,该设备包括:至少一个音频接收模块,音频信号转换模块和录音数据存储模块,其中,至少一个音频接收模块与音频信号转换模块通信连接,音频信号转换模块与录音数据存储模块通信连接;至少一个音频接收模块用于采集音频信号,并将音频信号发送至音频信号转换模块;音频信号转换模块用于将音频信号转换为预设格式的录音数据,并将录音数据发送至录音数据存储模块;录音数据存储模块用于将录音数据存储。

根据本公开实施例的另一个方面,提供了一种音频信号采集方法,该方法包括:响应于触发录音指令,控制至少一个音频接收模块采集音频信号;对音频信号进行格式转换,得到录音数据;将至少一个音频接收模块中的每个音频接收模块对应的位置信息和录音数据关联存储,其中,位置信息用于表征音频接收模块在目标设备上的安装位置。

根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述音频信号采集方法。

根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述音频信号采集方法。

基于本公开上述实施例提供的音频信号采集设备、音频信号采集方法,通过至少一个音频接收模块采集音频信号,并将音频信号发送至音频信号转换模块,音频信号转换模块将音频信号转换为预设格式的录音数据,并将录音数据发送至录音数据存储模块,录音数据存储模块将录音数据存储,从而实现了利用至少一个音频接收模块从至少一个位置采集录音数据,提高了采集录音数据的效率,由于具有多个采集录音数据的位置,因此使录音数据的来源更加丰富,无需通过工控机进行软硬件配置,降低了采集录音数据的成本。

下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

附图说明

通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1是本公开一示例性实施例提供的音频信号采集设备的示例性结构图。

图2是本公开另一示例性实施例提供的音频信号采集设备的示例性结构图。

图3是本公开一示例性实施例提供的音频信号采集方法的流程示意图。

图4是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。

应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。

还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。

还应理解,对于本公开实施例中提及的任一部件、录音数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。

另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。

还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

目前的音频信号采集方法成本比较高,硬件设备多,占用设备内的测试空间大。工控机不能同时支持多个声卡,只能在一个位置,进行单点数据采集。硬件设备功耗高,通过逆变器从设备内取电,会有电路谐波,影响语音数据的采集质量;若使用独立的带蓄电池的车载逆变器,续航时间短,外出进行数据采集需要中途充电。上述的这些问题,造成了数据采集的成本高,效率低。

图1示出了可以应用本公开的实施例的音频信号采集设备的示例性结构图。

如图1所示,音频信号采集设备可以包括至少一个音频接收模块101(包括M1-Mn),音频信号转换模块102和录音数据存储模块103。其中,至少一个音频接收模块101与音频信号转换模块102通信连接,音频信号转换模块102与录音数据存储模块103通信连接。

至少一个音频接收模块101用于采集音频信号,并将音频信号发送至音频信号转换模块102。其中,至少一个音频接收模块101可以采集各种声音,例如人的语音。至少一个音频接收模块101可以是麦克风阵列。例如,麦克风阵列可以通过A2B总线连接,即每个麦克风均连接到A2B总线上。通过A2B总线连接的麦克风阵列,每两个麦克风之间的间距最大为10米,整个链路的长度可以达到40米。

各个音频接收模块可以分别被设置到不同的位置,从而可以从不同位置采集音频信号。作为示例,当音频信号采集设备设置在车辆上时,可以将各个音频接收模块设置在车辆上不同的位置,不同的位置例如可以设置在方向盘上、副驾驶座椅前方、后排座椅前方、中控台上等位置。

音频信号转换模块102用于将音频信号转换为预设格式的录音数据,并将录音数据发送至录音数据存储模块103。通常,音频信号转换模块102可以为板卡形式的硬件,其上可以设置有用于将音频接收模块101采集的音频信号进行格式转换的设备。作为示例,如图2所示,音频信号转换模块102可以包括音频协议转换芯片AD2428,音频接收模块101可以按照A2B总线协议将采集的音频信号传输至AD2428,AD2428会做一个协议转换,将音频信号设置为16khz,16bit,TDMx格式的录音数据,再通过音频总线I2S传输至录音数据存储模块103。

录音数据存储模块103用于将录音数据存储。其中,录音数据存储模块103可以用于接收并存储录音数据的各种硬件设备,例如单片机、单板计算机、FPGA(FieldProgrammable Gate Array,现场可编程门阵列)、DSP(Digital Signal Processor数字信号处理器)、树莓派等。通常,如图2所示,录音数据存储模块103还可以外接显示器、鼠标、键盘等设备,以便于用户对上述音频信号采集设备进行软件配置,配置好后,可以将显示器、鼠标、键盘等设备移除。需要说明的是,录音数据存储模块103处可以用于存储录音数据外,还可以执行其他功能,例如设置音频接收模块101的采集时间、设置录音数据的存储容量等,录音数据存储模块103的名称不应构成对其功能的限定。

录音数据存储模块103可以将录音数据存储到各种形式的存储器上。例如,如图2所示,录音数据存储模块103可以包括SD卡,SD卡通过SDIO协议与录音数据存储模块103连接,录音数据存储模块103可以将接收的录音数据存储到SD卡上,当需要使用录音数据时,只需取下SD卡读取即可。

再例如,录音数据存储模块103可以包括网络通信单元,接收的录音数据可以经过网络通信单元,以有线或无线传输的方式传输到其他设备中存储。

在一些可选的实现方式中,录音数据存储模块103进一步用于将至少一个音频接收模块101中的每个音频接收模块101对应的位置信息和录音数据关联存储。其中,位置信息用于表征音频接收模块101的安装位置。位置信息可以包括但不限于以下至少一种形式的信息:数字、文字、符号等。作为示例,当音频信号采集设备设置在车辆上时,位置信息A表征音频接收模块101设置在方向盘上,位置信息B表征音频接收模块101设置在副驾驶座椅前方。本实现方式可以使存储的录音数据与音频接收模块101的安装位置对应,使录音数据存储时更有针对性,从而有助于在读取录音数据时,使用户得知录音数据采集于哪个位置,提高在使用录音数据进行模型训练或其他应用方式时的针对性。

在一些可选的实现方式中,至少一个音频接收模块101采用菊花链拓扑形式连接。以菊花链形式连接的音频接收模块101,可以减少了冗余线缆,使电缆线束的重量大幅减轻,从而整体设计成本和复杂度也得以降低,同时便于安装维护。

在一些可选的实现方式中,至少一个音频接收模块101通过总线供电并与音频信号转换模块102通信。例如,上述总线可以为A2B总线、MOST(Media Oriented SystemTransport,面向媒体的系统传输)总线等。如图2所示,至少一个音频接收模块101可以通过A2B音频总线(包括A线和B线)供电并与音频信号转换模块102通信。与传统音频连接方式相比,A2B音频总线的线缆数量有所减少,且线缆可以是成本更低、重量更轻的非屏蔽双绞线。A2B音频总线还可以提供小功率的幻象电源,可以实现无需在各个节点的音频接收模块101上使用本地电源,从而进一步降低成本。通过总线供电及通讯,可以灵活地调整音频接收模块101的数量,提高了音频采集的灵活性。

在一些可选的实现方式中,如图2所示,音频信号采集设备还包括供电接口,供电接口与电源输出接口连接。其中,上述电源输出接口可以是设置上述音频信号采集设备的主设备的电源输出接口。例如,主设备可以是车辆,电源输出接口可以是车辆上的USB接口、点烟器接口等。通过将音频信号采集设备的供电接口直接与电源输出接口连接,可以实现无需额外的电源供电,提高了音频信号采集的便利性,降低了硬件成本。

本公开的上述实施例提供的音频采集设备,通过设置至少一个音频接收模块101采集音频信号,并将音频信号发送至音频信号转换模块102,音频信号转换模块102将音频信号转换为预设格式的录音数据,并将录音数据发送至录音数据存储模块103,录音数据存储模块103将录音数据存储,从而实现了利用至少一个音频接收模块101从至少一个位置采集录音数据,提高了采集录音数据的效率,由于具有多个采集录音数据的位置,因此使录音数据的来源更加丰富,无需通过工控机进行软硬件配置,降低了采集录音数据的成本。

图3是本公开一示例性实施例提供的音频信号采集方法的流程示意图。本实施例可应用在如图1所示的音频信号采集设备上,如图3所示,该方法包括如下步骤:

步骤301,响应于触发录音指令,控制至少一个音频接收模块采集音频信号。

在本实施例中,音频信号采集设备可以响应于触发录音指令,控制至少一个音频接收模块(如图1所示的至少一个音频接收模块101)采集音频信号。其中,录音指令可以由用户手动触发(例如用户通过按键、点击虚拟按钮等操作触发),也可以由音频信号采集设备自动触发(例如定时触发、设备启动时自动触发等)。

步骤302,对音频信号进行格式转换,得到录音数据。

在本实施例中,音频信号采集设备可以对音频信号进行格式转换,得到录音数据。具体地,至少一个音频接收模块101可以将采集的音频信号发送到如图1所示的音频信号转换模块102,由音频信号转换模块102对音频信号进行格式转换,得到预设格式的录音数据。作为示例,预设格式可以是TDMx格式。

步骤303,将至少一个音频接收模块中的每个音频接收模块对应的位置信息和录音数据关联存储。

在本实施例中,音频信号采集设备可以将至少一个音频接收模块中的每个音频接收模块对应的位置信息和录音数据关联存储。其中,位置信息用于表征音频接收模块在目标设备上的安装位置。位置信息可以包括但不限于以下至少一种形式的信息:数字、文字、符号等。其中,目标设备可以是设置有上述音频信号采集设备的设备。作为示例,目标设备可以是车辆、家电等各种设备。具体地,音频信号转换模块102可以将录音数据发送到如图1所示的录音数据存储模块103,录音数据存储模块103可以包括存储器(例如SD卡),录音数据存储模块103可以将录音数据和对应的位置信息存储到存储器中。

在一些可选的实现方式中,步骤303可以如下执行:

响应于接收到目标设备当前的工况信息,将至少一个音频接收模块中的每个音频接收模块对应的位置信息、录音数据和工况信息关联存储。工况信息可以是用于表征目标设备当前的工作状态的信息。例如,当目标设备为车辆时,工况信息可以包括但不限于以下至少一种:车辆速度、车辆所在的地点、空调温度等等。本实现方式通过将工况信息与录音数据和位置信息关联存储,可以采集到更丰富的信息,从而可以有助于提高使用录音数据进行模型训练等应用场景的准确性。

在一些可选的实现方式中,音频信号采集设备还可以通过目标设备的电源输出接口为至少一个音频接收模块供电。作为示例,当目标设备为车辆时,电源输出接口可以是车辆上的USB接口、点烟器接口等。通过目标设备的电源输出接口为至少一个音频接收模块供电,可以实现无需额外的电源为至少一个音频接收模块供电,提高了音频信号采集的便利性,降低了硬件成本。

本公开的上述实施例提供的方法,通过由至少一个音频接收模块采集音频信号,再对音频信号进行格式转换,得到录音数据,最后将至少一个音频接收模块中的每个音频接收模块对应的位置信息和录音数据关联存储,从而实现了利用至少一个音频接收模块从至少一个位置采集录音数据,提高了采集录音数据的效率,由于具有多个采集录音数据的位置,因此使录音数据的来源更加丰富,通过将录音数据与位置信息关联存储,可以使录音数据存储时更有针对性,从而有助于在读取录音数据时,使用户得知录音数据采集于哪个位置,提高在使用录音数据进行模型训练或其他应用方式时的针对性。

下面,参考图4来描述根据本公开实施例的电子设备。该电子设备可以包括如图1所示的音频信号采集设备。

图4图示了根据本公开实施例的电子设备的框图。

如图4所示,电子设备400包括一个或多个处理器401和存储器402。

处理器401可以是中央处理单元(CPU)或者具有录音数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备400中的其他组件以执行期望的功能。

存储器402可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器401可以运行程序指令,以实现上文的本公开的各个实施例的音频信号采集方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中,电子设备400还可以包括:输入装置403和输出装置404,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如,该输入装置403可以是鼠标、键盘、麦克风等设备,用于输入音频信号或程序指令。在该电子设备是单机设备时,该输入装置403可以是通信网络连接器,用于从远程接收所输入的音频信号或程序指令。

该输出装置404可以向外部输出各种信息,包括接收到的录音数据。该输出设备404可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图4中仅示出了该电子设备400中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备400还可以包括任何其他适当的组件。

除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的音频信号采集方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的音频信号采集方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

相关技术
  • 音频信号采集设备和音频信号采集方法
  • 用以基于下混信号表示型态针对上混信号表示型态的供应来提供一个或多个经调整参数的装置、音频信号译码器、音频信号转码器、音频信号编码器、音频位串流、使用对象相关参数信息的方法与计算机程序
技术分类

06120113032918