掌桥专利:专业的专利平台
掌桥专利
首页

一种回声消除方法、装置、系统、电子设备及存储介质

文献发布时间:2023-06-19 18:46:07


一种回声消除方法、装置、系统、电子设备及存储介质

技术领域

本申请涉及语音处理技术领域,特别是涉及一种回声消除方法、装置、系统、电子设备及存储介质。

背景技术

对于具有扬声器和麦克风的电子设备,当电子设备的扬声器工作时,扬声器播放的声音信号会被麦克风采集到,形成回声,即回声为扬声器播放后被麦克风采集到的声音信号。回声会对麦克风需要传输的近端语音信号造成掩蔽效果,导致向远端设备传输的声音信号质量较差。

发明内容

本申请实施例的目的在于提供一种回声消除方法、装置、电子设备及存储介质,以提高向远端设备传输的声音信号质量。具体技术方案如下:

在本申请实施的第一方面,首先提供了一种回声消除方法,应用于电子设备,所述方法包括:

采集目标近端声音信号;

根据预先存储的播放参数与回声时延的对应关系,获取与所述电子设备的当前播放参数对应的目标回声时延;

根据所述目标回声时延,消除所述目标近端声音信号中回声信号。

在一些实施例中,所述方法还包括:

检测所述电子设备是否播放远端声音信号;

若是,则执行所述根据预先存储的播放参数与回声时延的对应关系,获取与所述电子设备的当前播放参数对应的目标回声时延的步骤;

若否,则将所述近端声音信号作为回声信号消除后的声音信号。

在一些实施例中,所述方法还包括:

向服务器发送回声时延请求,所述回声时延请求包括所述电子设备的类型,以使所述服务器获取所述电子设备的类型对应的播放参数与回声时延的对应关系,并将所获取的对应关系携带在回声时延响应中,反馈给所述电子设备;

接收并存储所述回声时延响应中携带的播放参数与回声时延的对应关系。

在一些实施例中,所述接收并存储所述回声时延响应中携带的播放参数与回声时延的对应关系步骤,包括:

接收所述回声时延响应中携带的播放参数与回声时延的对应关系;

获取相同播放参数对应的至少一个回声时延,作为候选回声时延;

对所述相同播放参数所对应的候选回声时延进行均值回归处理,得到所述相同播放参数所对应的回声时延;或者,

去除所述相同播放参数所对应的候选回声时延中的噪声数据,对去除噪声数据后的候选回声时延进行均值回归处理,得到所述相同播放参数所对应的回声时延。

在一些实施例中,所述方法还包括:

播放预设激励信号;

采集测试近端声音信号,所述测试近端声音信号中包括所述预设激励信号的回声信号;

将所述预设激励信号和所述测试近端声音信号进行归一化最小均方匹配,得到时延收敛时的候选回声时延;

根据所述候选回声时延,确定所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延;

存储所确定的播放参数和回声时延的对应关系。

在一些实施例中,所述播放参数对应多个候选回声时延;

所述根据所述候选回声时延,确定所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延的步骤,包括:

对所述多个候选回声时延进行均值回归处理,得到所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延;或者,

去除所述多个候选回声时延中的噪声数据,对去除噪声数据后的多个候选回声时延进行均值回归处理,得到所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延。

在一些实施例中,所述电子设备处于固定位置。

在一些实施例中,所述方法还包括:

向服务器发送所存储的所确定的播放参数和回声时延的对应关系。

在一些实施例中,所述播放参数包括采集播放模式、声音算法流程、所述电子设备的声学器件结构、所述电子设备所在环境状态及所述电子设备的通话状态中的一种或多种。

在本申请实施的第二方面,提供了一种回声消除装置,应用于电子设备,所述装置包括:

第一采集模块,用于采集目标近端声音信号;

获取模块,用于根据预先存储的播放参数与回声时延的对应关系,获取与所述电子设备的当前播放参数对应的目标回声时延;

第一消除模块,用于根据所述目标回声时延,消除所述目标近端声音信号中回声信号。

在一些实施例中,所述装置还包括:检测模块和第二消除模块,所述获取模块包括第一获取子模块;

所述检测模块,用于检测所述电子设备是否播放远端声音信号;

所述第一获取子模块,用于在所述检测模块的检测结果为是的情况下,根据预先存储的播放参数与回声时延的对应关系,获取与所述电子设备的当前播放参数对应的目标回声时延;

所述第二消除模块,用于在所述检测模块的检测结果为否的情况下,将所述近端声音信号作为回声信号消除后的声音信号。

在一些实施例中,所述装置还包括:

第一发送模块,用于向服务器发送回声时延请求,所述回声时延请求包括所述电子设备的类型,以使所述服务器获取所述电子设备的类型对应的播放参数与回声时延的对应关系,并将所获取的对应关系携带在回声时延响应中,反馈给所述电子设备;

接收模块,用于接收并存储所述回声时延响应中携带的播放参数与回声时延的对应关系。

在一些实施例中,所述接收模块包括:

接收子模块,用于接收所述回声时延响应中携带的播放参数与回声时延的对应关系;

获取子模块,用于获取相同播放参数对应的至少一个回声时延,作为候选回声时延;

处理子模块,用于对所述相同播放参数所对应的候选回声时延进行均值回归处理,得到所述相同播放参数所对应的回声时延;或者,去除所述相同播放参数所对应的候选回声时延中的噪声数据,对去除噪声数据后的候选回声时延进行均值回归处理,得到所述相同播放参数所对应的回声时延。

在一些实施例中,所述装置还包括:

播放模块,用于播放预设激励信号;

第二采集模块,用于采集测试近端声音信号,所述测试近端声音信号中包括所述预设激励信号的回声信号;

匹配模块,用于将所述预设激励信号和所述测试近端声音信号进行归一化最小均方匹配,得到时延收敛时的候选回声时延;

确定模块,用于根据所述候选回声时延,确定所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延;

存储模块,用于存储所确定的播放参数和回声时延的对应关系。

在一些实施例中,所述播放参数对应多个候选回声时延;

所述确定模块,具体用于:

对所述多个候选回声时延进行均值回归处理,得到所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延;或者,

去除所述多个候选回声时延中的噪声数据,对去除噪声数据后的多个候选回声时延进行均值回归处理,得到所述电子设备播放所述预设激励信号时的播放参数所对应的回声时延。

在一些实施例中,所述电子设备处于固定位置。

在一些实施例中,所述装置还包括:

第二发送模块,用于向服务器发送所存储的所确定的播放参数和回声时延的对应关系。

在一些实施例中,所述播放参数包括采集播放模式、声音算法流程、所述电子设备的声学器件结构、所述电子设备所在环境状态及所述电子设备的通话状态中的一种或多种。

在本申请实施的第三方面,提供了一种回声消除系统,包括电子设备和服务器;

所述电子设备,用于向服务器发送回声时延请求;

所述服务器,用于将预先存储的播放参数与回声时延的对应关系携带在回声时延响应中,并反馈给所述电子设备;

所述电子设备,还用于接收并存储所述回声时延响应中携带的播放参数与回声时延的对应关系;采集目标近端声音信号;根据预先存储的播放参数与回声时延的对应关系,获取与所述电子设备的当前播放参数对应的目标回声时延;根据所述目标回声时延,消除所述目标近端声音信号中回声信号。

在本申请实施的第四方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一所述的回声消除方法。

在本申请实施的第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的回声消除方法。

在本申请实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的回声消除方法。

本申请实施例提供的技术方案中,电子设备中预先存储了播放参数与回声时延的对应关系,也就是,预先存储了与播放参数相适应的回声时延。在采集目标近端声音信号后,电子设备根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数相适应的目标回声时延,进而将与电子设备的当前播放参数相适应的目标回声时延作为时延对齐的初始值,消除目标近端声音信号中的回声信号,可以大大减少时延收敛的时间,加快了回声消除处理的进程,大大提升了回声消除的效果,特别是提升了刚开始播放或者切换播放的电子设备后的前几秒的回声消除的效果,减少了回声残留,甚至啸叫的情况,提高了向远端设备传输的声音信号质量。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为回声信号消除应用实例的一种示意图;

图2为本申请实施例提供的回声消除方法的第一种流程示意图;

图3为本申请实施例提供的回声消除方法的第二种流程示意图;

图4a为本申请实施例提供的接收来电事件方的提示界面的一种示意图;

图4b为本申请实施例提供的多媒体播放界面的一种示意图;

图5为本申请实施例提供的播放参数与回声时延的对应关系获取方法的第一种流程示意图;

图6为图5中步骤S52的第一种细化示意图;

图7为图5中步骤S52的第二种细化示意图;

图8为本申请实施例提供的播放参数与回声时延的对应关系获取方法的第二种流程示意图;

图9a为基于相关技术中的回声消除方法进行回声消除的消除效果的一种示意图;

图9b为基于本申请实施例提供的回声消除方法进行回声消除的消除效果的一种示意图;

图10为基于本申请实施例提供的回声消除方法以及相关技术中的回声消除方法分别进行回声消除的消除效果的一种示意图;

图11为本申请实施例提供的回声消除装置的第一种结构示意图;

图12为本申请实施例提供的回声消除装置的第二种结构示意图;

图13为本申请实施例提供的回声消除系统的一种结构示意图;

图14为本申请实施例提供的电子设备的一种结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

为便于理解,下面对本申请实施例中出现的词语进行说明。

远端声音信号:由本端设备通过扬声器播放的声音信号。远端声音信号可以为远端设备向本端设备传输的声音信号,也可以由本端设备通过扬声器播放的本端设备中存储的声音信号,对此不进行限定。

近端声音信号:本端设备通过麦克风采集的声音信号。近端声音信号可以包括有效声音信号、回声信号和噪声等。

对于具有扬声器和麦克风的电子设备,当电子设备的扬声器工作时,扬声器播放的远端声音信号经过反射或者折射后会被麦克风采集到,形成回声,即回声为扬声器播放后被麦克风采集到的声音信号。回声会对麦克风需要传输的近端语音信号造成掩蔽效果,导致麦克风向远端设备传输的声音信号质量较差。

例如,在语音通信中,回声会对通话造成影响,当回声较大时将严重影响通话质量。目前,电子设备利用AEC(Acoustic Echo Canceller,回声消除)算法消除回声,具体的回声信号消除过程可参见图1所示的回声信号消除应用实例。图1中,麦克风采集的近端声音信号D(n)包括经回声路径传递至麦克风的回声信号y(n)、有效声音信号v(n)和噪声s(n)。电子设备对D(n)进行DFT(Discrete Fourier Transform,离散傅里叶变换),得到频域上的近端声音信号d(n);电子设备获取下行的频域上的远端声音信号X(n),X(n)转换为时域上的远端声音信号为X(t);电子设备将X(t)缓存至Buffer(缓冲器)中,进行初始(当前)时延参数的延时对齐,输出对齐后的远端声音信号为X'(t),对X'(t)进行DFT,得到频域上的远端声音信号X'(n);电子设备对X'(n)和d(n)进行NLMS(Normalized Least MeanSquare,归一化最小均方)匹配,获得X'(n)和d(n)相对于时延对齐的时延残差e(n);根据e(n)转换为对应的偏差时延,并对前置环节的时延参数X'(t)进行校准,形成反馈通路,使得电子设备中回声消除模块在时延上收敛,提升回声消除效果。电子设备在获得X'(n)后,可以进行回声路径估计,得到回声估计信号y'(n),电子设备进行线性滤波处理,消除d(n)中的y'(n),输出线性滤波后的误差信号e'(n),之后,电子设备对e'(n)进行NLP(Non LinearProcessing,非线性处理)滤波、CNG(Comfort Noise Generator,舒适噪声生成)处理、和IDFT(Inverse Discrete Fourier Transform,离散傅里叶逆变换)等,获得上行的近端声音信号Y(n),并向远端输出近端声音信号Y(n)。

电子设备通过上述方式可以消除近端声音信号中的回声信号,提高向远端设备传输的声音信号质量。但是在刚开始播放或者切换播放的电子设备后的前几秒,由于时延收敛较慢,会出现回声残留,甚至啸叫的情况。

为了提高向远端设备传输的声音信号质量,降低刚开始播放或者切换播放的电子设备后的前几秒的回声残留,本申请实施例提供了一种回声消除方法。该方法应用于具有扬声器与麦克风的电子设备,该电子设备可以为手机、平板电脑、PC(Personal Computer,个人电脑)、可穿戴电子设备、电子手表等。为便于理解,下面以电子设备为执行主体进行解释说明,并不起限定作用。本申请实施例提供的技术方案可以应用于通话、会议和直播连麦等场景中。

上述回声消除方法中,电子设备中预先存储了播放参数与回声时延的对应关系,也就是,预先存储了与播放参数相适应的回声时延。在采集目标近端声音信号后,电子设备根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数相适应的目标回声时延,进而将与电子设备的当前播放参数相适应的目标回声时延作为时延对齐的初始值,消除目标近端声音信号中的回声信号,可以大大减少时延收敛的时间,加快了回声消除处理的进程,大大提升了回声消除的效果,特别是提升了刚开始播放或者切换播放的电子设备后的前几秒的回声消除的效果,减少了回声残留,甚至啸叫的情况,提高了向远端设备传输的声音信号质量。

下面通过具体实施例,对本申请实施例提供的回声消除方法进行详细说明。

参见图2,图2为本申请实施例提供的回声消除方法的第一种流程示意图,该方法应用于电子设备,包括如下步骤:

步骤S21,采集目标近端声音信号;

步骤S22,根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数对应的目标回声时延;

步骤S23,根据目标回声时延,消除目标近端声音信号中回声信号。

本申请实施例提供的技术方案中,电子设备中预先存储了播放参数与回声时延的对应关系,也就是,预先存储了与播放参数相适应的回声时延。在采集目标近端声音信号后,电子设备根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数相适应的目标回声时延,进而将与电子设备的当前播放参数相适应的目标回声时延作为时延对齐的初始值,消除目标近端声音信号中的回声信号,可以大大减少时延收敛的时间,加快了回声消除处理的进程,大大提升了回声消除的效果,特别是提升了刚开始播放或者切换播放的电子设备后的前几秒的回声消除的效果,减少了回声残留,甚至啸叫的情况,提高了向远端设备传输的声音信号质量。

在上述步骤S21中,目标近端声音信号可以为电子设备通过麦克风采集的任一近端声音信号,目标近端声音信号可以包括需要传输的有效声音信号、远端声音信号经过反射与折射产生的回声信号以及噪声信号等。回声信号和噪声信号对有效声音信号产生影响,使得麦克风向远端声音设备传输的声音信号质量较差。

在上述步骤S22中,播放参数可以包括采集播放模式、声音算法流程、电子设备的声学器件结构、电子设备所在环境状态以及电子设备的通话状态中的一种或多种。

其中,采集播放模式包括设备内部的播放模式,高低时延模式等;声音算法流程包括3A处理的不同算法结构;电子设备的通话状态包括声音外放等与声音不外放状态等;电子设备所在环境状态包括空旷环境、密闭环境、人员密集环境等。3A处理算法包括:AEC(Acoustic Echo Canceller,回声消除)算法、ANS(Ambient Noise Suppression,噪声抑制)算法和AGC(Automatic Gain Control,自动音量增益)算法。

上述电子设备的声学器件结构在电子设备出厂时就已经固定,采集播放模式、声音算法流程则是和操作系统ADM(Architecture Development Method,架构开发方法)流程、应用代码配置固定,而电子设备所在环境状态以及当前通话状态的通话状态在电子设备的使用过程中是实时变化的,对应的时延参数初始值需要根据以上因素动态调整其时延对齐初始值,即调整对应的回声时延。

获得上述播放参数与回声时延的对应关系的方式可以为基于大数据投递回声时延,去除波动大的数值并进行均值回归。这里,获得上述播放参数与回声时延的对应关系的操作可以由电子设备自身实现,为了提高播放参数与回声时延的对应关系的准确性获得上述播放参数与回声时延的对应关系的操作,也可以由云端的服务器实现,具体的实现方式后续会进行详细说明,此处不进行展开介绍。

在上述步骤S23中,根据步骤S22中获取的目标回声时延,对远端声音信号进行时延对齐处理,使得经过处理后的远端声音信号在时间上更接近于回声信号。仍以图1所示的回声信号消除应用实例进行说明,目标回声时延相当于NLMS时延对齐后输出的时延残差e(n);电子设备将X(t)缓存至Buffer后,基于目标回声时延,对Buffer中缓存的X(t)进行时延对齐,输出对齐后的远端声音信号X'(t)。

本申请实施例中,回声时延的初始值即为与电子设备的当前播放参数相适应的目标回声时延,这加快了回声消除算法的收敛,加快了回声消除处理的进程,特别是,提升了电子设备刚开始播放和切换播放的电子设备时的前几秒的回声消除效果。

在一些实施例中,基于图2所示的方法实施例,本申请实施例还提供了一种回声消除方法,如图3所示,图3为本申请实施例提供的回声消除方法的第二种流程示意图,该方法可以包括如下步骤:

步骤S31,采集目标近端声音信号;

步骤S32,检测电子设备是否播放远端声音信号,若是,则执行步骤S33,若否,则执行步骤S35;

步骤S33,根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数对应的目标回声时延;

步骤S34,根据目标回声时延,消除目标近端声音信号中回声信号;

步骤S35,将近端声音信号作为回声信号消除后的声音信号。

应用本申请实施例提供的技术方案,电子设备在检测到播放远端声音信号的情况下,才获取目标回声时延,进而消除近端声音信号中回声信号;而在未播放远端声音信号的情况下,电子设备不会进行回声信号消除操作,节约了电子设备对计算资源。

步骤S31、步骤S33、步骤S34分别与步骤S21、步骤S22、步骤S23相同,此处不再进行说明,详细参见前文相关描述。

在上述步骤S32中,电子设备可以根据应用场景,确定检测方式,并依据所确定的检测方式,检测电子设备是否播放远端声音信号。

例如,在语音通话的应用场景中,检测方式为检测接收来电事件方是否点击接听按键。如图4a所示的接收来电事件方的提示界面,在接收来电事件方侧,当接收来电事件方检测到用户点击接听按键时,确定播放远端声音信号;在发送来电事件方侧,当确定接收来电事件方的用户点击接听按键时,确定播放远端声音信号。

在多媒体播放的应用场景中,检测方式为检测用户是否点击播放按键。如图4b所示的多媒体播放界面,电子设备在检测用户点击4b所示的界面中的播放按键时,确定播放远端声音信号。

当检测到电子设备播放远端声音信号时,说明采集到的近端声音信号中会包括远端声音信号的回声信号,电子设备执行步骤S33,以消除近端声音信号中所包括的回声信号。当检测到电子设备未播放远端声音信号时,说明采集到的近端声音信号中不会包括远端声音信号的回声信号,为节约电子设备的计算资源,电子设备执行步骤S35,不需要再执行消除回声的操作,将近端声音信号直接作为有效声音信号传输至远端声音设备。

本申请实施例中,上述的播放参数与回声时延的对应关系的获取可以从云端的服务器获取,如图5所示,图5为本申请实施例提供的播放参数与回声时延的对应关系获取方法的第一种流程示意图,该方法可以包括如下步骤:

步骤S51,向服务器发送回声时延请求,回声时延请求包括电子设备的类型,以使服务器获取电子设备的类型对应的播放参数与回声时延的对应关系,并将所获取的对应关系携带在回声时延响应中,反馈给电子设备;

步骤S52,接收并存储回声时延响应中携带的播放参数与回声时延的对应关系。

应用本申请实施例提供的技术方案,电子设备直接从服务器获取与本电子设备的类型相符的各种播放参数与回声时延的对应关系,无需电子设备本身计算确定各种播放参数与回声时延的对应关系,减轻了电子设备的负担,提高了其他应用的处理效率。

在上述步骤S51中,电子设备的类型由指定信息确定,其中,指定信息可以包括但不限于生产厂家、产品批次、型号、版本等信息。

服务器中预先存有与各种设备类型对应的播放参数与回声时延的对应关系,如下表1所示。

表1

上述表1中,一行表示一个设备类型对应的播放参数与回声时延的对应关系。

服务器中所存储的这些对应关系可以是电子设备发送给服务器的,也就是,电子设备基于大数据投递回声时延,去除波动大的数值并进行均值回归,获得播放参数与回声时延的对应关系,并将所获取的对应关系发送给服务器,服务器接收并存储相应的设备类型对应的播放参数与回声时延的对应关系。

服务器中所存储的这些对应关系也可以是服务器自身所确定的,也就是,电子设备将不同播放参数下的回声时延发送给服务器,服务器基于大数据投递回声时延,去除波动大的数值并进行均值回归,获得并存储相应的设备类型对应的播放参数与回声时延的对应关系。

其中,服务器和电子设备基于大数据投递回声时延,去除波动大的数值并进行均值回归,获得并存储相应的设备类型对应的播放参数与回声时延的对应关系的操作相似,后续会详细说明,此处不再展开介绍。

电子设备向服务器发送回声时延请求;服务器接收到回声时延请求后,从回声时延请求中提取电子设备的类型,进而从预先存储的播放参数与回声时延的对应关系中,获取该电子设备的类型对应的播放参数与回声时延的对应关系,将所获取的播放参数与回声时延的对应关系携带在回声时延响应中,并将回声时延响应反馈给电子设备。

本申请实施例中,电子设备可以周期性地向服务器发送回声时延请求,也可以在接收到用户输入的回声时延更新请求后,向服务器发送回声时延请求,对此不进行限定。

在上述步骤S52中,电子设备接收到服务器反馈的回声时延响应,从回声时延响应中提取到播放参数与回声时延的对应关系,进而存储所提取的播放参数与回声时延的对应关系。后续,当执行回声消除时,电子设备可以根据最新存储的所接收的播放参数与回声时延的对应关系,执行上述步骤S22,获取与电子设备的当前播放参数对应的目标回声时延,进而消除回声。

本申请实施例中,当服务器中所存储的这些对应关系是服务器自身所确定的时,服务器中每个设备类型、每种播放参数对应一个回声时延,如上述表1所示。这种情况下,电子设备在接收到服务器反馈的播放参数与回声时延的对应关系后,可以直接存储所接收的播放参数与回声时延的对应关系。

当服务器中所存储的这些对应关系是电子设备发送给服务器的时,服务器中每个设备类型、每种播放参数对应至少一个回声时延,如下表2所示,

表2

这种情况下,电子设备在接收到服务器反馈的播放参数与回声时延的对应关系后,电子设备需要进一步对播放参数与回声时延的对应关系进行处理,以获得每种播放参数与回声时延的对应关系。

一个示例中,如图6所示,上述步骤S52可以包括步骤S61-步骤S63。

步骤S61,接收回声时延响应中携带的播放参数与回声时延的对应关系;

步骤S62,获取相同播放参数对应的至少一个回声时延,作为候选回声时延;

步骤S63,对相同播放参数所对应的候选回声时延进行均值回归处理,得到相同播放参数所对应的回声时延。

应用本申请实施例提供的技术方案,服务器中存储了来自相同设备类型的多个电子设备的播放参数与回声时延的对应关系。本电子设备从服务器,获取来自相同设备类型的多个电子设备的播放参数与回声时延的对应关系,并对这些播放参数与回声时延的对应关系进行均值回归处理,确定了不同播放参数所对应的回声时延。这里,大大提高了每个电子设备确定不同播放参数所对应的回声时延的数据量,进而提高了不同播放参数所对应的回声时延的准确度,提高了回声消除的精度。

在上述步骤S61中,回声时延响应中可以包括来自相同设备类型的多个电子设备的播放参数与回声时延的对应关系,这些对应关系可以为与当前电子设备具有相同设备类型的设备实时获取并发送给服务器的,也可以为与当前电子设备具有相同设备类型的设备基于大数据投递回声时延,去除波动大的数值并进行均值回归所获取的,对此不进行限定。

在上述步骤S62中,电子设备所获取的播放参数与回声时延的对应关系中,一种播放参数对应一个或多个回声时延的对应关系,如上述表1和表2所示。这种情况下,电子设备获取相同播放参数对应的至少一个回声时延,作为候选回声时延。如表2所示,电子设备可以获取参数1对应的时延1-3分别作为参数1对应的候选回声时延。

在上述步骤S63中,电子设备对相同播放参数对应的候选回声时延进行均值回归处理,所获得的时延值,即为该相同播放参数所对应的回声时延。

例如,如表2所示,电子设备获取参数1对应的时延1-3分别作为参数1对应的候选回声时延,对时延1-3进行均值回归处理,得到时延值为(时延1+时延2+时延3)/3,(时延1+时延2+时延3)/3即为参数1对应的回声时延。

本申请实施例中,服务器所存储的播放参数与回声时延的对应关系中会存在噪声数据,即一个播放参数所对应的回声时延中,波动较大的回声时延。这使得电子设备所获取的播放参数与回声时延的对应关系中也会存在噪声数据。

为了提高所确定的播放参数与回声时延的对应关系的准确性,如图7所示,上述步骤S52可以包括步骤S71-步骤S73。

步骤S71,接收回声时延响应中携带的播放参数与回声时延的对应关系;

步骤S72,获取相同播放参数对应的至少一个回声时延,作为候选回声时延;

步骤S73,去除相同播放参数所对应的候选回声时延中的噪声数据,对去除噪声数据后的候选回声时延进行均值回归处理,得到相同播放参数所对应的回声时延。

应用本申请实施例提供的技术方案,电子设备先去除回声时延中的噪声数据,基于对去除噪声数据后的回声时延,来确定播放参数与回声时延的对应关系,降低了噪声数据对回声时延的影响,进一步提高了不同播放参数所对应的回声时延的准确度,进一步提高了回声消除的精度。

步骤S71、步骤S72分别与步骤S61、步骤S62相同,此处不再进行说明,详细参见前文相关描述。

在上述步骤S73中,由于噪声数据可能存在较大的误差,电子设备去除大波动的噪声数据,得到稳定的回声时延,对剩余的稳定的回声时延进行均值回归处理,可以得到准确的回声时延。

例如,如表2所示,电子设备获取参数1对应的时延1-3分别作为参数1对应的候选回声时延,其中,时延3为噪声数据,因此,电子设备去除时延3,对时延1-2进行均值回归处理,得到时延值为(时延1+时延2)/2,(时延1+时延2)/2即为参数1对应的回声时延。

本申请实施例中,电子设备中的播放参数和回声时延的对应关系可以为电子设备自身确定的,如电子设备自身基于大数据投递回声时延,去除波动大的数值并进行均值回归,获得播放参数与回声时延的对应关系,如图8所示,图8为本申请实施例提供的播放参数与回声时延的对应关系获取方法的第二种流程示意图,该方法可以包括如下步骤:

步骤S81,播放预设激励信号;

步骤S82,采集测试近端声音信号,测试近端声音信号中包括预设激励信号的回声信号;

步骤S83,将预设激励信号和测试近端声音信号进行归一化最小均方匹配,得到时延收敛时的候选回声时延;

步骤S84,根据候选回声时延,确定电子设备播放预设激励信号时的播放参数所对应的回声时延;

步骤S85,存储所确定的播放参数和回声时延的对应关系。

应用本申请实施例提供的技术方案,电子设备利用自身的数据进行测试,确定播放参数和回声时延的对应关系,无需在网络中传输自身的数据,提高了电子设备数据的安全性和隐私性。

在上述步骤S81中,预设激励信号为固定频率的信号,例如周期性的基频4kHz(千赫兹)正弦波短时激励信号、或者设备谐振频率f0的单频脉冲语音信号,播放设备谐振频率的语音信号可以使得回声信号更加明显,利于采集到预设激励信号的回声信号。

本申请实施例中,为了保证所存储的播放参数和回声时延的对应关系的准确性,电子设备处于固定位置,这样可使得电子设备的播放参数不变,进而准确的确定该播放参数下的回声时延,准确存储播放参数和回声时延的对应关系。

在上述步骤S82中,在播放预设激励信号之后,电子设备可以实时采集近端声音信号,作为测试近端声音信号,测试近端声音信号中可以包括预设激励信号的回声信号、需要传输的有效声音信号等。

本申请实施例中,电子设备也可以在播放预设激励信号预设时长之后,再采集近端声音信号,作为测试近端声音信号。其中,预设时长可以根据经验值设定,预设时长为电子设备回声时延收敛所需的时长。

在上述步骤S83中,对预设激励信号和测试近端声音信号进行NLMS匹配,获得预设激励信号与测试近端声音信号之间的时延残差,将所获得的时延残差转换为回声时延,该转换得到的回声时延即为候选回声时延。

相同播放参数下,电子设备可以不断地执行步骤S82和S83,获得多个候选回声时延。

在上述步骤S84中,为便于描述和理解,以下将电子设备播放预设激励信号时的播放参数简称为测试播放参数。

当仅获取到一个候选回声时延时,电子设备可以直接将该候选回声时延确定为测试播放参数所对应的回声时延。

当仅获取到多个候选回声时延时,电子设备可以采用如下任意一种方式确定测试播放参数所对应的回声时延:

方式一,对多个候选回声时延进行均值回归处理,得到测试播放参数所对应的回声时延。与步骤S63相似,可参见步骤S63部分的相关描述。

方式二,去除多个候选回声时延中的噪声数据,对去除噪声数据后的多个候选回声时延进行均值回归处理,得到测试播放参数所对应的回声时延。与步骤S73相似,可参见步骤S73部分的相关描述。

本申请实施例中,电子设备还可以采用其他方式,确定测试播放参数所对应的回声时延,如,从多个候选回声时延中随机选择一个候选回声时延,作为测试播放参数所对应的回声时延,对此不进行限定。

在确定测试播放参数所对应的回声时延之后,电子设备执行步骤S85,存储测试播放参数和回声时延的对应关系。

后续,当执行回声消除时,电子设备可以根据存储的测试播放参数与回声时延的对应关系,执行上述步骤S22,获取与电子设备的当前播放参数对应的目标回声时延,进而消除回声。

在一些实施例中,电子设备在执行步骤S85之后,向服务器发送所存储的所确定的播放参数和回声时延的对应关系。此时,服务器可以综合存储不同电子设备发送的播放参数和回声时延的对应关系,并执行如图5-7所示的方法步骤,以提高电子设备用于回声消除的初始回声时延的准确度,提高回声消除效果。

发明人基于本申请实施例提供的回声消除方法以及相关技术中的回声消除方法,分别进行回声消除,并对消除效果进行比较,发现:

(1)在开始播放远端语音信号,电子设备处于单讲状态时,电子设备基于相关技术中的回声消除方法进行回声消除,其消除效果如图9a所示;电子设备基于本申请实施例提供的回声消除方法进行回声消除,其消除效果如图9b所示。

图9a和图9b中,上方为回声消除后的近端声音信号的时域图,下方为回声消除后的近端声音信号的频域图。从图9a和图9b可以看出,采用本申请实施例提供的回声消除方法进行回声消除时,有效削弱甚至消除刚刚开始播放远端语音信号时的远端声音信号的回声信号,减少刚刚开始播放远端语音信号时的本电子设备漏回声。

(2)在开始播放远端语音信号,电子设备处于双讲状态时,电子设备基于本申请实施例提供的回声消除方法以及相关技术中的回声消除方法,分别进行回声消除,其消除效果如图10所示。

图10中,第一行为采用相关技术中的回声消除方法进行回声消除后的近端声音信号的时域图,第二行为采用本申请实施例提供的回声消除方法进行回声消除后的近端声音信号的时域图;第三行为采用相关技术中的回声消除方法进行回声消除后的近端声音信号的频域图,第四行为采用本申请实施例提供的回声消除方法进行回声消除后的近端声音信号的频域图。从图10可以看出,在刚刚开始播放远端语音信号时,采用相关技术中的回声消除方法进行回声消除,对近端声音信号中的有效声音信号的误消除问题严重,而采用本申请实施例提供的回声消除方法进行回声消除,由于使用了预先存储的播放参数对应的回声时延,有效解决了双讲场景回声延时不收敛的问题,减轻了对近端声音信号中的有效声音信号的误消除问题。

基于相同的发明构思,与上述回声消除方法实施例对应,本申请实施例还提供了一种回声消除装置,参见图11,图11为本申请实施例提供的回声消除装置的一种结构示意图,该装置包括:

第一采集模块111,用于采集目标近端声音信号。

获取模块112,用于根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数对应的目标回声时延;

第一消除模块113,用于根据目标回声时延,消除目标近端声音信号中回声信号。

本申请实施例提供的技术方案中,电子设备中预先存储了播放参数与回声时延的对应关系,也就是,预先存储了与播放参数相适应的回声时延。在采集目标近端声音信号后,电子设备根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数相适应的目标回声时延,进而将与电子设备的当前播放参数相适应的目标回声时延作为时延对齐的初始值,消除目标近端声音信号中的回声信号,可以大大减少时延收敛的时间,加快了回声消除处理的进程,大大提升了回声消除的效果,特别是提升了刚开始播放或者切换播放的电子设备后的前几秒的回声消除的效果,减少了回声残留,甚至啸叫的情况,提高了向远端设备传输的声音信号质量。

在一些实施例中,如图12所示,上述回声消除装置还可以包括:检测模块114和第二消除模块115,获取模块112可以包括第一获取子模块1121;

检测模块114,用于检测电子设备是否播放远端声音信号;

第一获取子模块1121,用于在检测模块的检测结果为是的情况下,根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数对应的目标回声时延;

第二消除模块115,用于在检测模块的检测结果为否的情况下,将近端声音信号作为回声信号消除后的声音信号。

在一些实施例中,上述回声消除装置还可以包括:

第一发送模块,用于向服务器发送回声时延请求,回声时延请求包括电子设备的类型,以使服务器获取电子设备的类型对应的播放参数与回声时延的对应关系,并将所获取的对应关系携带在回声时延响应中,反馈给电子设备;

接收模块,用于接收并存储回声时延响应中携带的播放参数与回声时延的对应关系。

在一些实施例中,上述接收模块可以包括:

接收子模块,用于接收回声时延响应中携带的播放参数与回声时延的对应关系;

获取子模块,用于获取相同播放参数对应的至少一回声时延,作为候选回声时延;

处理子模块,用于对相同播放参数所对应的候选回声时延进行均值回归处理,得到相同播放参数所对应的回声时延;或者,

去除相同播放参数所对应的候选回声时延中的噪声数据,对去除噪声数据后的候选回声时延进行均值回归处理,得到相同播放参数所对应的回声时延。

在一些实施例中,上述回声消除装置还可以包括:

播放模块,用于播放预设激励信号;

第二采集模块,用于采集测试近端声音信号,测试近端声音信号中包括预设激励信号的回声信号;

匹配模块,用于将预设激励信号和测试近端声音信号进行归一化最小均方匹配,得到时延收敛时的候选回声时延;

确定模块,用于根据候选回声时延,确定电子设备播放预设激励信号时的播放参数所对应的回声时延;

存储模块,用于存储所确定的播放参数和回声时延的对应关系。

在一些实施例中,上述播放参数对应多个候选回声时延;

这种情况下,上述确定模块,具体可以用于:

对多个候选回声时延进行均值回归处理,得到电子设备播放预设激励信号时的播放参数所对应的回声时延;或者,

去除多个候选回声时延中的噪声数据,对去除噪声数据后的多个候选回声时延进行均值回归处理,得到电子设备播放预设激励信号时的播放参数所对应的回声时延。

在一些实施例中,电子设备处于固定位置。

在一些实施例中,上述回声消除装置还可以包括:

第二发送模块,用于向服务器发送所存储的所确定的播放参数和回声时延的对应关系。

在一些实施例中,播放参数包括采集播放模式、声音算法流程、电子设备的声学器件结构、电子设备所在环境状态及电子设备的通话状态中的一种或多种。

本申请实施例还提供了一种回声消除系统,如图13所示,包括电子设备131和服务器132;

电子设备131,用于向服务器132发送回声时延请求;

服务器132,用于将预先存储的播放参数与回声时延的对应关系携带在回声时延响应中,并反馈给电子设备131;

电子设备131,还用于接收并存储回声时延响应中携带的播放参数与回声时延的对应关系;采集目标近端声音信号;根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数对应的目标回声时延;根据目标回声时延,消除目标近端声音信号中回声信号。

本申请实施例还提供了一种电子设备,如图14所示,包括处理器141、通信接口142、存储器143和通信总线144,其中,处理器141,通信接口142,存储器143通过通信总线144完成相互间的通信,

存储器143,用于存放计算机程序;

处理器141,用于执行存储器143上所存放的程序时,实现如下步骤:

采集目标近端声音信号;

根据预先存储的播放参数与回声时延的对应关系,获取与电子设备的当前播放参数对应的目标回声时延;

根据目标回声时延,消除目标近端声音信号中回声信号。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述实施例中任一的回声消除方法。

在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一的回声消除方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、系统实施例、电子设备实施例、存储介质实施例和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

技术分类

06120115687012