掌桥专利:专业的专利平台
掌桥专利
首页

一种基于蓝牙耳机的语音翻译系统及其方法

文献发布时间:2024-04-18 19:58:26


一种基于蓝牙耳机的语音翻译系统及其方法

技术领域

本发明涉及语音翻译领域,具体地,涉及一种基于蓝牙耳机的语音翻译系统及其方法。

背景技术

随着经济全球化,各国在商业、生活上的交流变得日益频繁,各国之间经常开展国际学术演讲,由于各国的语言不一,一般都需要借助翻译设备来进行沟通。为保证翻译内容的隐秘性和便利性,翻译设备往往配合一对蓝牙翻译蓝牙耳机一起使用,交流的双方各自佩戴一只蓝牙耳机,每只耳机均能够采集语音信号并将采集的语音信号发送至翻译机或者云端翻译引擎进行翻译,最后将翻译后的语音信号发送至另一只耳机进行播放。虽然在大部分情况下这种方式都能够很好的实现不同语种的双方进行有效交流,但是这种翻译蓝牙耳机具有一定的局限性,我们通常交流的双方都是面对面的,相互之间的距离比较小,比如:一对蓝牙耳机分别为耳机A和耳机B,进行交流的两个人为甲和乙,其中,甲佩戴耳机A,乙佩戴耳机B,当甲在讲话的过程中,由于二人距离近的原因,耳机A和耳机B都能够采集到甲的音频信号,由于翻译机或者云端翻译引擎无法识别音频信号是来源于甲还是乙,这样翻译机或者云端翻译引擎就会对来源于耳机A和耳机B的任何音频信号进行识别和翻译,即翻译机或者云端翻译引擎既会对来自耳机A采集到的甲的音频信号进行识别和翻译,又会对来自耳机B采集到的甲的音频信号进行识别和翻译;同样地,当只有乙在说话的过程中也会出现这样的情况,这样很容易造成翻译机或者翻译引擎识别和翻译混乱,导致识别和翻译不准确,影响正常的沟通和交流,同时也增加了大量的不必要的翻译工作,造成翻译流量资源浪费。

发明内容

本发明的目的在于为了克服现有技术的缺陷和不足,提供了一种基于蓝牙耳机的语音翻译系统,该系统中能够识别出两只蓝牙耳机采集的音频信号是来源交流双方的哪一方,并只将来源于佩戴该耳机的人的音频信号发送至翻译机或者云端翻译引擎进行语音识别和翻译,这样解决了语音识别和翻译的混乱问题,使得沟通和交流更加有效;同时也大大减少了不必要的语音识别和翻译。

为实现上述目的,本发明提供一种基于蓝牙耳机的语音翻译系统,所述系统包括:

第一翻译蓝牙耳机和第二翻译蓝牙耳机,所述第一翻译蓝牙耳机和第二翻译蓝牙耳机分别佩戴于相互交流的用户身上;

音频信号处理中心,所述音频信号处理中心包括傅里叶变换模块、信号互相关处理模块、判决模块以及增益模块,将所述第一翻译蓝牙耳机和第二翻译蓝牙耳机分别采集到的第一音频信号和第二音频信号发送至所述傅里叶变化模块进行时频信号处理,然后通过所述信号互相关处理模块对所述第一音频信号和第二音频信号进行信号互相关处理;并根据所述第一音频信号和第二音频信号的信号互相关值的大小由所述判决模块判断第一音频信号和第二音频信号是否来源于同一声源;当所述第一音频信号和第二音频信号是来源于同一声源时,再根据所述第一音频信号和第二音频信号之间的时延关系判断声源位置;所述增益模块根据所获得的声源位置信息设置第一音频信号的增益因子G1和第二音频信号的增益因子G2;

翻译模块,所述第一音频信号和所述第二音频信号经过所述增益模块处理后,由所述翻译模块进行识别和翻译,并将翻译后的音频信号对应地发送至所述第一翻译蓝牙耳机或者第二翻译蓝牙耳机上。

根据本发明的一个实施例,所述第一音频信号和第二音频信号的信号互相关值的取值范围为(0.7,1)时,所述第一音频信号和第二音频信号为同一声源信号。

根据本发明的一个实施例,当所述第一音频信号和第二音频信号均来自佩戴所述第一翻译蓝牙耳机的用户时,第一增益因子G1=1,第二增益因子G2=0;当所述第一音频信号和第二音频信号均来自佩戴所述第二翻译蓝牙耳机的用户时,第一增益因子G1=0,第二增益因子G2=1。

根据本发明的一个实施例,所述音频信号处理中心还包括信号幅值检测模块,用于检测所述第一音频信号和第二音频信号的信号幅值大小;当所述第一音频信号和第二音频信号是来源于同一声源时,若第一音频信号的信号幅值大于第二音频信号的信号幅值时,所述第一音频信号和第二音频信号均来自佩戴所述第一翻译蓝牙耳机的用户;反之,所述第一音频信号和第二音频信号均来自佩戴所述第二翻译蓝牙耳机的用户。

本发明的另外一个目的还在于提供一种基于蓝牙耳机的语音翻译方法,所述方法包括以下步骤:首先将所述第一翻译蓝牙耳机和第二翻译蓝牙耳机分别采集到的第一音频信号和第二音频信号进行傅里叶变化,进行时频信号处理;然后对时频信号处理后的所述第一音频信号和第二音频信号进行信号互相关处理,获得所述第一音频信号和第二音频信号的信号互相关值,并根据信号互相关值的大小判断第一音频信号和第二音频信号是否来源于同一声源;当所述第一音频信号和第二音频信号是来源于同一声源时,再通过第一音频信号和第二音频信号之间的时延关系判断声源位置;并且根据声源位置信息设置第一音频信号的增益因子G1和第二音频信号的增益因子G2;最后将所述第一音频信号和所述第二音频信号进行增益后输送至翻译机或者云端翻译引擎上进行识别和翻译,并将翻译后的音频信号对应地发送至所述第一翻译蓝牙耳机或者第二翻译蓝牙耳机上。

根据本发明的一个实施例,所述判断第一音频信号和第二音频信号是否来源于同一声源包括:

所述第一音频信号与第二音频信号的互相关函数为以下公式,

x

x

x

其中,t表示时间,s(·)声源模型,n

并且假设噪声信号与语音信号不相关,噪声信号之间也不相关,则第一音频信号与第二音频信号的互相关函数变为,

由公式(4)可以计算出

根据本发明的一个实施例,所述第一音频信号和第二音频信号之间的时延关系判断声源位置:

公式(4)经过转换变为,

根据相关函数的特性知道,R

与现有技术相比,本发明具有如下有益效果:本发明提供了一种基于蓝牙耳机的语音翻译系统以及语音翻译方法,该系统能够识别出第一音频信号和第二音频信号是否来源于同一声源,以及判断来源于同一声源的第一音频信号和第二音频信具体来源于哪个声源,从而为上述第一音频信号和第二音频信号设定相应的增益因子,即当第一音频信号和第二音频信号均来自佩戴第一翻译蓝牙耳机的用户时,第一增益因子G1=1,第二增益因子G2=0;当第一音频信号和第二音频信号均来自佩戴第二翻译蓝牙耳机的用户时,第一增益因子G1=0,第二增益因子G2=1,通过增益后的第一音频信号和第二音频信号发送至翻译机或者云端翻译引擎进行翻译,这样解决了识别和翻译的混乱问题,使得沟通和交流更加有效;同时也大大减少了不必要的语音识别和翻译。

附图说明

图1为本发明实施例应用场景模型示意图;

图2为本发明基于蓝牙耳机的语音翻译系统原理框图;

图3为本发明基于蓝牙耳机的语音翻译方法流程图。

具体实施方式

下面结合具体实施方式对本发明的技术方案作进一步详细地说明。

如图1所示,为本发明应用场景模型示例图,通常我们一对蓝牙耳机有左右两个,而将该左右蓝牙耳机分别佩戴在相互交流的两个人身上。比如一对翻译蓝牙耳机包括第一翻译蓝牙耳机(为左边蓝牙耳机)和第二翻译蓝牙耳机(为右边蓝牙耳机),两个耳机佩戴后,其中第一翻译蓝牙耳机位于A处,第二翻译蓝牙耳机位于B处,进行交流的两个人为甲和乙,其中,甲佩戴第一翻译蓝牙耳机,乙佩戴第二翻译蓝牙耳机。下面以该种场景模型对本发明内容进行详细描述。如图2所示,为本发明基于蓝牙耳机的语音翻译系统原理框图,该系统包括:第一翻译蓝牙耳机和第二翻译蓝牙耳机,第一翻译蓝牙耳机和第二翻译蓝牙耳机分别佩戴于相互交流的用户身上;本发明实施例中,第一翻译蓝牙耳机和第二翻译蓝牙耳机可以是一对蓝牙耳机的左右两个,也可以是不成对的两个无线蓝牙耳机。

本发明语音翻译系统还包括音频信号处理中心,当也包括实现翻译系统功能的存储模块、处理器、电源模块等等,音频信号处理中心作为信号处理的核心,主要包括傅里叶变换模块、信号互相关处理模块、判决模块以及增益模块,第一翻译蓝牙耳机采集到的信号为第一音频信号,第二翻译蓝牙耳机采集到的信号为第二音频信号,第一音频信号和第二音频信号发送至傅里叶变化模块进行时频信号处理,然后通过信号互相关处理模块对第一音频信号和第二音频信号进行信号互相关处理;并由此获得信号互相关值,根据该信号互相关值的大小,由判决模块判断第一音频信号和第二音频信号是否来源于同一声源;当判断第一音频信号和第二音频信号是来源于同一声源时,再根据第一音频信号和第二音频信号之间的时延关系判断声源位置;当判断第一音频信号和第二音频信号不是来源于同一声源时,音频信号处理中心不对该两个音频信号进行处理,只保持原来信号的采集功能。增益模块根据所获得的声源位置信息设置第一音频信号的增益因子G1和第二音频信号的增益因子G2;

本发明实施例中,语音翻译系统还包括翻译模块,第一音频信号和第二音频信号经过增益模块处理后,由翻译模块进行识别和翻译,并将翻译后的音频信号对应地发送至第一翻译蓝牙耳机或者第二翻译蓝牙耳机上,即将第一翻译蓝牙耳机采集到的第一音频信号经过识别翻译后发送至第二翻译蓝牙耳机进行播放;将第二翻译蓝牙耳机采集到的第二音频信号经过识别翻译后发送至第一翻译蓝牙耳机进行播放。实现了准确的语音翻译,避免了翻译错误和混乱。

根据本发明的一个实施例中,根据第一音频信号和第二音频信号的信号互相关值的大小来判断第一音频信号和第二音频信号是否为同一声源信号,当第一音频信号和第二音频信号的信号互相关值的取值为(0.7,1)时,可以判断第一音频信号和第二音频信号为同一声源信号,否则第一音频信号和第二音频信号为非同一声源信号。

根据本发明的一个实施例,如果第一音频信号和第二音频信号为同一声源信号时,需要进行信号的下一步处理,比如当第一音频信号和第二音频信号均来自佩戴所述第一翻译蓝牙耳机的用户时,设定第一增益因子G1=1,第二增益因子G2=0;当第一音频信号和第二音频信号均来自佩戴第二翻译蓝牙耳机的用户时,第一增益因子G1=0,第二增益因子G2=1。这样设定增益因子的目的是为了获取所需的目标语音信号,便于准确识别和翻译。

根据本发明的一个实施例,音频信号处理中心还包括信号幅值检测模块,用于检测第一音频信号和第二音频信号的信号幅值大小;当第一音频信号和第二音频信号是来源于同一声源时,若第一音频信号的信号幅值大于第二音频信号的信号幅值时,第一音频信号和第二音频信号均来自佩戴第一翻译蓝牙耳机的用户;反之,第一音频信号和第二音频信号均来自佩戴第二翻译蓝牙耳机的用户。

本发明的另外一个目的还在于提供一种基于蓝牙耳机的语音翻译方法,该方法包括以下步骤:首先将所第一翻译蓝牙耳机和第二翻译蓝牙耳机分别采集到的第一音频信号和第二音频信号进行傅里叶变化,进行时频信号处理;然后对时频信号处理后的第一音频信号和第二音频信号进行信号互相关处理,获得第一音频信号和第二音频信号的信号互相关值,并根据信号互相关值的大小判断第一音频信号和第二音频信号是否来源于同一声源;当第一音频信号和第二音频信号是来源于同一声源时,再通过第一音频信号和第二音频信号之间的时延关系判断声源位置;并且根据声源位置信息设置第一音频信号的增益因子G1和第二音频信号的增益因子G2;最后将第一音频信号和第二音频信号进行增益后输送至翻译机或者云端翻译引擎上进行识别和翻译,并将翻译后的音频信号对应地发送至第一翻译蓝牙耳机或者第二翻译蓝牙耳机上。

根据本发明的一个实施例,判断第一音频信号和第二音频信号是否来源于同一声源包括:

第一音频信号与第二音频信号的互相关函数为以下公式,

x

x

x

其中,t表示时间,s(·)声源模型,n

并且假设噪声信号与语音信号不相关,噪声信号之间也不相关,则第一音频信号与第二音频信号的互相关函数变为,

由公式(4)可以计算出

根据本发明的一个实施例,当第一音频信号和第二音频信号均来自同一声源时,那么可以通过第一音频信号和第二音频信号之间的时延关系判断声源位置:

公式(4)经过转换变为,

根据相关函数的特性知道,R

综上所述,本发明提供了一种基于蓝牙耳机的语音翻译系统以及语音翻译方法,该系统能够识别出第一音频信号和第二音频信号是否来源于同一声源信号,以及判断来源于同一声源信号的第一音频信号和第二音频信具体来源于哪个声源,从而为上述第一音频信号和第二音频信号设定相应的增益因子,即当第一音频信号和第二音频信号均来自佩戴第一翻译蓝牙耳机的用户时,第一增益因子G1=1,第二增益因子G2=0;当第一音频信号和第二音频信号均来自佩戴第二翻译蓝牙耳机的用户时,第一增益因子G1=0,第二增益因子G2=1,通过增益后的第一音频信号和第二音频信号发送至翻译机或者云端翻译引擎进行翻译,这样解决了识别和翻译的混乱问题,使得沟通和交流更加有效;同时也大大减少了不必要的语音识别和翻译。

上面对本发明的较佳实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

相关技术
  • 一种基于耳机的实时语音翻译方法及装置
  • 一种支持TWS蓝牙耳机的翻译系统
  • 一种基于音频畸变补偿技术的蓝牙耳机系统
  • 耳机装置、语音处理系统和语音处理方法
  • 一种蓝牙耳机的语音实时翻译方法及系统
  • 一种翻译耳机语音输出方法、系统及翻译耳机和存储介质
技术分类

06120116494014