掌桥专利:专业的专利平台
掌桥专利
首页

一种语音回声消除方法、装置、终端设备及存储介质

文献发布时间:2023-06-19 11:45:49


一种语音回声消除方法、装置、终端设备及存储介质

技术领域

本发明涉及音频处理技术领域,尤其涉及一种语音回声消除方法、装置、终端设备及存储介质。

背景技术

语音视频通信是4G时代、5G时代最大量的应用。目前无论是近场语音还是远场语音,都是通过录制麦克风加算法实现。为了消除语音回声,现有技术中,需要单独的录制环境噪声的麦克风,比如手机,在顶端有一个环境音麦克风麦克风专门录制环境噪声,而设置环境音麦克风,增加了成本。

因此,现有技术还有待改进和提高。

发明内容

本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音回声消除方法、装置、终端设备及存储介质,旨在解决现有技术中需要设置环境音麦克风来消除语音回声,增加了成本的问题。

为了解决上述技术问题,本发明所采用的技术方案如下:

第一方面,本发明提供一种语音回声消除方法,其中,所述方法包括:

获取预设频率内的语音信号,并得到所述语音信号的正弦波形;

根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移;

获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。

在一种实现方式中,所述获取预设频率内的语音信号,并得到所述语音信号的正弦波形,包括:

获取所述麦克风所采集到的语音信号,所述语音信号为预设频率内的语音信号;

对所述语音信号进行傅里叶变换,将所述语音信号分解成若干个正弦波形。

在一种实现方式中,所述获取所述麦克风所采集到的语音信号,包括:

使用设置好的带通滤波器,对所述麦克风所采集到的语音信号进行滤波处理,得到仅保留人声频率部分的语音信号。

在一种实现方式中,所述预设频率为100Hz~10kHz。

在一种实现方式中,所述根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移,包括:

获取所述扬声器与所述麦克风之间的传输距离;

根据所述传输距离,对所述正弦波形进行预设角度的相位偏移,得到相位偏移后的正弦波形。

在一种实现方式中,所述预设角度为10°-20°。

在一种实现方式中,所述获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除,包括:

对相位偏移后的正弦波形进行反相操作,得到所述相位偏移后的正弦波形所对应的反向波形;

将所述反向波形与所述相位偏移后的正弦波形进行叠加,去除杂波,以对所述语音信号中的回声消除。

第二方面,本实施例还提供一种语音回声消除装置,其中,所述装置包括:

正弦波形获取模块,用于获取预设频率内的语音信号,并得到所述语音信号的正弦波形;

相位偏移模块,用于根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移;

回声消除模块,用于获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。

第三方面,本发明实施例还提供一种终端设备,其中,所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的音视频同步程序,所述处理器执行所述音视频同步程序时,实现上述方案中任一项所述的语音回声消除方法的步骤。

第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有音视频同步程序,所述音视频同步程序被处理器执行时,实现上述方案中任一项所述的语音回声消除方法的步骤。

有益效果:与现有技术相比,本发明提供了一种语音回声消除方法,首先,获取预设频率内的语音信号,并得到所述语音信号的正弦波形。然后根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移。最后获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。本发明无需增加环境麦克风,即可消除语音信号的回声,节省了成本,提高语音录制的音频质量。

附图说明

图1为本发明实施例提供的语音回声消除方法的具体实施方式的流程图。

图2为本发明实施例提供的语音回声消除方法的相位偏移对比图。

图3为本发明实施例提供的语音回声消除方法中反向波形图。

图4为本发明实施例提供的语音回声消除方法中波形叠加效果图。

图5是本发明实施例提供的音视频同步装置的原理框图。

图6是本发明实施例提供的终端设备的内部结构原理框图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

语音视频通信是4G时代、5G时代最大量的应用。目前无论是近场语音还是远场语音,都是通过录制麦克风加算法实现。为了消除语音回声,现有技术中,需要单独的录制环境噪声的麦克风,比如手机,在顶端有一个环境音麦克风麦克风专门录制环境噪声,而设置环境音麦克风,增加了成本。

为了解决现有技术的问题,本实施例提供一种语音回声消除方法,具体实施时,本实施例获取预设频率内的语音信号,并得到所述语音信号的正弦波形。然后根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移。最后获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。本发明无需增加环境麦克风,即可消除语音信号的回声,节省了成本,提高语音录制的音频质量。

本实施例中的语音回声消除方法可应用于终端设备中,所述终端设备可为具有语音采集和语音播放功能的终端设备,比如手机。在本实施例中,终端设备中内置有麦克风和扬声器,并且所述麦克风和扬声器之间具有一定的传输距离。具体地,如图1中所示,所述语音回声消除方法具体可包括如下步骤:

步骤S100、获取预设频率内的语音信号,并得到所述语音信号的正弦波形。

在一种实现方式中,所述步骤S100具体包括:

步骤S101、获取所述麦克风所采集到的语音信号,所述语音信号为预设频率内的语音信号;

步骤S102、对所述语音信号进行傅里叶变化,将所述语音信号分解成若干个正弦波形。

在本实施例中,本实施例在进行语音回声消除时,本实施例是针对预设频率内的语音信号进行回声消除,比如,预设频率为100Hz~10kHz,则就是针对100Hz~10kHz的语音信号进行回声消除。在一种实现方式中,本实施例中在消除语音信号时,通过麦克风采集语音信号。并且本实施例使用设置好的带通滤波器,对所述麦克风所采集到的语音信号进行滤波处理,得到仅保留人声频率部分的语音信号。当采集到语音信号后,本实施例电对该语音信号进行傅里叶变换,因为根据傅里叶变换,任何复杂的波形都可以分解成若干个正弦波,因此本实施例即可将语音信号的复杂波形分解成简单地正弦波形。

步骤S200、根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移。

在一种实现方式中,所述步骤S200具体包括如下步骤:

步骤S201、获取所述扬声器与所述麦克风之间的传输距离;

步骤S202、根据所述传输距离,对所述正弦波形进行预设角度的相位偏移,得到相位偏移后的正弦波形。

在本实施例中,当得到正弦波形后,本实施例获取扬声器与麦克风之间的距离,因此麦克风与扬声器之间的距离原因,语音信号传输至麦克风后发生相位偏移,为此,本实施例计算声音信号在扬声器和麦克风之间的距离,然后根据距离,对所述正弦波形进行预设角度的相位偏移,得到相位偏移后的正弦波形。在一种实现方式中,本实施例预设角度为10°-20°。如图2中所示,图是以1kHz的语音信号为例,在图2中1号波形为1kHz扬声器波形。因为传输距离原因,2号波形为传输到麦克风后产生了15°的相位偏移的波形,即2号波形即为本实施例中相位偏移后的正弦波形。

步骤S300、获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。

在一种实现方式中,所述步骤S300具体包括如下步骤:

步骤S301、对相位偏移后的正弦波形进行反相操作,得到所述相位偏移后的正弦波形所对应的反向波形;

步骤S302、将所述反向波形与所述相位偏移后的正弦波形进行叠加,去除杂波,以对所述语音信号中的回声消除。

在本实施例中,当得到相位偏移后的正弦波形后,本实施例对相位偏移后的正弦波形进行反相操作,得到所述相位偏移后的正弦波形所对应的反向波形,如图3中所示。因为这个预设角度的反向,正好是扬声器到麦克风产生的相位,因此本实施例将所述反向波形与所述相位偏移后的正弦波形进行叠加,具体如图4中所示,叠加后的波形中就会去除杂波,以对所述语音信号中的回声消除。

综上,本实施例获取预设频率内的语音信号,并得到所述语音信号的正弦波形。然后根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移。最后获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。本发明无需增加环境麦克风,即可消除语音信号的回声,节省了成本,提高语音录制的音频质量。

如图5中所示,本实施例还提供一种语音回声消除装置,该装置包括:正弦波形获取模块10、相位偏移模块20以及回声消除模块30。在本实施例中,所述正弦波形获取模块10,用于获取预设频率内的语音信号,并得到所述语音信号的正弦波形。所述相位偏移模块20,用于根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移。所述回声消除模块30,用于获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。

在一种实现方式中,所述正弦波形获取模块10包括:

语音信号获取单元,用于获取所述麦克风所采集到的语音信号,所述语音信号为预设频率内的语音信号;

正弦波形获取单元,用于对所述语音信号进行傅里叶变化,将所述语音信号分解成若干个正弦波形。

在本实施例中,本实施例在进行语音回声消除时,本实施例是针对预设频率内的语音信号进行回声消除,比如,预设频率为100Hz~10kHz,则就是针对100Hz~10kHz的语音信号进行回声消除。在一种实现方式中,本实施例中在消除语音信号时,通过麦克风采集语音信号。并且本实施例使用设置好的带通滤波器,对所述麦克风所采集到的语音信号进行滤波处理,得到仅保留人声频率部分的语音信号。当采集到语音信号后,本实施例电对该语音信号进行傅里叶变换,因为根据傅里叶变换,任何复杂的波形都可以分解成若干个正弦波,因此本实施例即可将语音信号的复杂波形分解成简单地正弦波形。

在一种实现方式中,所述回声消除模块20包括:

传输距离获取单元,用于获取所述扬声器与所述麦克风之间的传输距离;

相位偏移单元,用于根据所述传输距离,对所述正弦波形进行预设角度的相位偏移,得到相位偏移后的正弦波形。

在本实施例中,当得到正弦波形后,本实施例获取扬声器与麦克风之间的距离,因此麦克风与扬声器之间的距离原因,语音信号传输至麦克风后发生相位偏移,为此,本实施例计算声音信号在扬声器和麦克风之间的距离,然后根据距离,对所述正弦波形进行预设角度的相位偏移,得到相位偏移后的正弦波形。在一种实现方式中,本实施例预设角度为10°-20°。如图2中所示,图是以1kHz的语音信号为例,在图2中1号波形为1kHz扬声器波形。因为传输距离原因,2号波形为传输到麦克风后产生了15°的相位偏移的波形,即2号波形即为本实施例中相位偏移后的正弦波形。

在一种实现方式中,所述回声消除模块30具体包括:

反向操作单元,用于对相位偏移后的正弦波形进行反相操作,得到所述相位偏移后的正弦波形所对应的反向波形;

回声消除单元,用于将所述反向波形与所述相位偏移后的正弦波形进行叠加,去除杂波,以对所述语音信号中的回声消除。

在本实施例中,当得到相位偏移后的正弦波形后,本实施例对相位偏移后的正弦波形进行反相操作,得到所述相位偏移后的正弦波形所对应的反向波形,如图3中所示,因为这个预设角度的反向,正好是扬声器到麦克风产生的相位,因此本实施例将所述反向波形与所述相位偏移后的正弦波形进行叠加,具体如图4中所示,叠加后的波形中就会去除杂波,以对所述语音信号中的回声消除。

基于上述实施例,本发明还提供了一种终端设备,其原理框图可以如图6所示。该终端设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、温度传感器。其中,该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音回声消除方法。该终端设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该终端设备的温度传感器是预先在终端设备内部设置,用于检测内部设备的运行温度。

本领域技术人员可以理解,图6中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端设备的限定,具体的终端设备以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种终端设备,终端设备包括存储器、处理器及存储在存储器中并可在处理器上运行的音视频同步程序,处理器执行音视频同步程序时,实现如下操作指令:

获取预设频率内的语音信号,并得到所述语音信号的正弦波形;

根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移;

获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

综上,本发明公开了一种语音回声消除方法、装置、存储介质及终端设备,所述方法包括:获取预设频率内的语音信号,并得到所述语音信号的正弦波形;根据扬声器与麦克风之间的距离,对所述正弦波形进行相位偏移;获取相位偏移后的正弦波形的反向波形,并将所述反向波形与所述相位偏移后的正弦波形进行叠加,以对所述语音信号中的回声消除。本发明无需增加环境麦克风,即可消除语音信号的回声,节省了成本,提高语音录制的音频质量。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 一种语音回声消除方法、装置、终端设备及存储介质
  • 语音信号的回声消除方法、装置、存储介质以及电子装置
技术分类

06120113045345