掌桥专利:专业的专利平台
掌桥专利
首页

一种语音通话的双向实时翻译系统及方法

文献发布时间:2023-06-19 11:44:10


一种语音通话的双向实时翻译系统及方法

技术领域

本发明涉及通信技术领域,特别是涉及一种语音通话的双向实时翻译系统及方法。

背景技术

随着生活水平的日益提高,人们的出行范围逐渐从国内走向全球,但是语言始终是出游的最大障碍,于是出现语音翻译系统。

其中,专利申请号为CN202010537579.0,申请名称为实时云端语音翻译处理方法及系统,提供了一种实时云端语音翻译处理方法及系统,应用于用户端、云端服务器和翻译服务器的交互中,通过云端服务器选择最佳的翻译服务器对用户端采集的翻译请求进行翻译,将翻译结果的音频文件存储在云端,将翻译结果的文本和云端音频文件的访问地址推送给用户端;专利申请号为CN201510237760.9,申请名称为一种移动通信网络中实时翻译的方法、装置及网元设备,提供了一种移动通信网络中实时翻译的方法、装置及网元设备,其中该方法包括:网元设备接收第一用户设备向第二用户设备发送的第一通话内容;网元设备根据第一用户设备所对应的用户所使用的第一语言和第二用户设备所对应的用户所使用的第二语言,将接收到的第一通话内容实时翻译成与第二语言对应的第二通话内容;以及网元设备将翻译后的第二通话内容发送给第二用户设备。上述专利虽然实现了语音翻译,第一个技术方案不是用于通话过程中的实时翻译,而且需要终端和云端服务器的密切配合,需要特定的终端APP实现;第二种技术方案首先限定了移动通信,并且根据用户设备的配置决定翻译的语言,实现方式不够灵活。

因此,基于上述问题,亟需一种语音翻译系统以实现不局限于终端技术,且能够完全依靠通信网络对信令和话路的控制功能实现,进而提高实现方式的灵活性。

发明内容

本发明的目的是提供一种语音通话的双向实时翻译系统及方法,能够完全依靠通信网络对信令和话路的控制功能实现,进而提高实现方式的灵活性。

为实现上述目的,本发明提供了如下方案:

一种语音通话的双向实时翻译系统,包括:业务受理IT系统、语音翻译应用服务器、IMS核心网以及呼叫终端;

所述业务受理IT系统与所述IMS核心网连接;所述业务受理IT系统用于受理用户的语音翻译业务,并当受理业务后将业务触发条件iFC下发至所述IMS核心网的xCSCF设备上;所述IMS核心网的xCSCF设备用于接收受理业务的用户通过所述呼叫终端拨打电话时生成的业务触发条件iFC,进而根据所述业务触发条件iFC触发语音翻译业务,并转发所述业务触发条件iFC至所述语音翻译应用服务器;所述业务触发条件iFC包括呼叫信令;

所述语音翻译应用服务器部署在所述IMS核心网上;所述语音翻译应用服务器用于根据转发的业务触发条件iFC,建立与所述呼叫终端的两路语音话路,并当接收到翻译指令后,执行主叫侧的语音翻译以及被叫侧的语音翻译,并将两侧的语音翻译进行交互;所述呼叫终端包括主叫终端和被叫终端。

可选的,所述语音翻译应用服务器包括:信令与媒体连接模块、第一语音翻译处理模块以及第二语音翻译处理模块;

所述信令与媒体连接模块分别与所述第一语音翻译处理模块以及所述第二语音翻译处理模块以及所述IMS核心网的xCSCF设备连接;所述信令与媒体连接模块用于接收所述转发的业务触发条件iFC,根据所述转发的业务触发条件iFC,建立与所述呼叫终端的两路语音话路,并启动所述第一语音翻译处理模块以及所述第二语音翻译处理模块,进而对所述两路语音话路进行对接;

所述第一语音翻译处理模块以及所述第二语音翻译处理模块均与所述IMS核心网的xCSCF设备连接,且所述第一语音翻译处理模块以及第二语音翻译处理模块相互通信。

可选的,所述语音翻译应用服务器还包括:语音翻译程序模块;

所述语音翻译程序模块与所述IMS核心网的xCSCF设备以及所述信令与媒体连接模块连接;所述语音翻译程序模块用于当所述翻译指令为按键音时,对所述按键音进行识别解析出对应的数字,进而根据识别出数字序列确定翻译指令。

可选的,所述语音翻译应用服务器还包括:缓存模块;

所述缓存模块分别与所述信令与媒体连接模块、所述第一语音翻译处理模块以及所述第二语音翻译处理模块连接;所述缓存模块用于缓存翻译资源。

一种语音通话的双向实时翻译方法,用于实现所述的一种语音通话的双向实时翻译系统,包括:

通过IMS核心网的xCSCF设备接收业务触发条件iFC;所述业务触发条件iFC为受理业务的用户通过呼叫终端拨打电话时生成的指令;所述业务触发条件iFC用于触发语音翻译业务;

利用所述IMS核心网的xCSCF设备转发所述业务触发条件iFC至语音翻译应用服务器;

根据所述转发的业务触发条件iFC,建立与呼叫终端的两路语音话路;

获取翻译指令;

根据所述翻译指令执行主叫侧的语音翻译以及被叫侧的语音翻译,并将两侧的语音翻译进行交互。

可选的于,所述通过IMS核心网的xCSCF设备接收业务触发条件iFC,之前还包括:

将将业务触发条件iFC下发至IMS核心网的xCSCF设备上。

可选的,所述根据所述转发的业务触发条件iFC,建立与呼叫终端的两路语音话路,之后还包括:

根据所述转发的业务触发条件iFC启动所述第一语音翻译处理模块以及所述第二语音翻译处理模块,进而对所述两路语音话路进行对接。

可选的,所述获取翻译指令,具体包括:

当所述翻译指令为按键音时,对所述按键音进行识别解析出对应的数字,进而根据识别出数字序列确定翻译指令。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明所提供的一种语音通话的双向实时翻译系统及方法,通过在IMS核心网络中部署的语音翻译应用服务器,所述语音翻译应用服务器用于根据转发的业务触发条件iFC,建立与所述呼叫终端的两路语音话路,并当接收到翻译指令后,执行主叫侧的语音翻译以及被叫侧的语音翻译,并将两侧的语音翻译进行交互。利用IMS网络的信令和语音话路控制技术实现终端的语音翻译。并且,本发明的呼叫终端并不限于特定的终端,即能够实现覆盖的实时通话翻译翻译服务,进而提高了实现方式的灵活性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所提供的一种语音通话的双向实时翻译系统结构示意图;

图2为本发明所提供的一种语音通话的双向实时翻译方法流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种语音通话的双向实时翻译系统及方法,能够完全依靠通信网络对信令和话路的控制功能实现,进而提高实现方式的灵活性。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明所提供的一种语音通话的双向实时翻译系统结构示意图,如图1所示,本发明所提供的一种语音通话的双向实时翻译系统,包括:业务受理IT系统1、语音翻译应用服务器2、IMS核心网3以及呼叫终端4。此处的呼叫终端4不需要特别制定,普通的手机终端即可。

所述业务受理IT系统1与所述IMS核心网3连接;所述业务受理IT系统1用于受理用户的语音翻译业务,并当受理业务后将业务触发条件iFC下发至所述IMS核心网3的xCSCF设备上;所述IMS核心网3的xCSCF设备用于接收受理业务的用户通过所述呼叫终端4拨打电话时生成的业务触发条件iFC,进而根据所述业务触发条件iFC触发语音翻译业务,并转发所述业务触发条件iFC至所述语音翻译应用服务器2;所述业务触发条件iFC包括呼叫信令。

即业务触发条件iFC为IMS网络中语音翻译业务的触发条件,是一小段配置文件。

所述语音翻译应用服务器2部署在所述IMS核心网3上;所述语音翻译应用服务器2用于根据转发的业务触发条件iFC,建立与所述呼叫终端4的两路语音话路,并当接收到翻译指令后,执行主叫侧的语音翻译以及被叫侧的语音翻译,并将两侧的语音翻译进行交互;所述呼叫终端4包括主叫终端和被叫终端。

所述语音翻译应用服务器2为本发明的核心装置,并部署在IMS核心网3,通过IMS核心网3与主被叫手机进行信令协议、原始语音媒体、语音翻译指令以及翻译后的语音媒体进行交互。

所述语音翻译应用服务器2包括:信令与媒体连接模块21、第一语音翻译处理模块22以及第二语音翻译处理模块23。

所述信令与媒体连接模块21分别与所述第一语音翻译处理模块22以及所述第二语音翻译处理模块23以及所述IMS核心网3的xCSCF设备连接;所述信令与媒体连接模块21用于接收所述转发的业务触发条件iFC,根据所述转发的业务触发条件iFC,建立与所述呼叫终端4的两路语音话路,并启动所述第一语音翻译处理模块22以及所述第二语音翻译处理模块23,进而对所述两路语音话路进行对接。

所述第一语音翻译处理模块22以及所述第二语音翻译处理模块23均与所述IMS核心网3的xCSCF设备连接,且所述第一语音翻译处理模块22以及第二语音翻译处理模块23相互通信。

翻译指令包括两种可选的形态,一是特定的数字拨号盘按键序列(通过每个数字键都有的DTMF音进行识别的数字串,如“#0086”),二是特定的语音指令,如用户说“开始翻译中文”。

所述语音翻译应用服务器2还包括:语音翻译程序模块。

所述语音翻译程序模块与所述IMS核心网3的xCSCF设备以及所述信令与媒体连接模块21连接;所述语音翻译程序模块用于当所述翻译指令为按键音时,对所述按键音进行识别解析出对应的数字,进而根据识别出数字序列确定翻译指令。

即当呼叫终端4通过激活手机拨号盘以及固话利用按键盘激活时,根据每个数字键都有DTMF音,语音翻译程序模块根据每个数字键对应的DTMF音识别解析出对应的数字,进而识别出数字序列代表的翻译指令。如“#0086”,把对方话音翻译成中文后发给自己,或“#001”翻译成英文发给自己。

需要关闭翻译时,同样发送数字拨号键或语音的关闭指令,如:“#0000”或“停止翻译”等。

为了进行各种语言的翻译,所述语音翻译应用服务器2还包括:缓存模块;

所述缓存模块分别与所述信令与媒体连接模块21、所述第一语音翻译处理模块22以及所述第二语音翻译处理模块23连接;所述缓存模块用于缓存翻译资源。

图2为本发明所提供的一种语音通话的双向实时翻译方法流程示意图,如图2所示,本发明所提供的一种语音通话的双向实时翻译方法,用于所述的一种语音通话的双向实时翻译系统,包括:

S201,通过IMS核心网3的xCSCF设备接收业务触发条件iFC;所述业务触发条件iFC为受理业务的用户通过呼叫终端4拨打电话时生成的指令;所述业务触发条件iFC用于触发语音翻译业务。

S201之前还包括:

将将业务触发条件iFC下发至IMS核心网3的xCSCF设备上。

S202,利用所述IMS核心网3的xCSCF设备转发所述业务触发条件iFC至语音翻译应用服务器2。

S203,根据所述转发的业务触发条件iFC,建立与呼叫终端4的两路语音话路。

S203之后还包括:

根据所述转发的业务触发条件iFC启动所述第一语音翻译处理模块22以及所述第二语音翻译处理模块23,进而对所述两路语音话路进行对接。

S204,获取翻译指令。

S204具体包括:

当所述翻译指令为按键音时,对所述按键音进行识别解析出对应的数字,进而根据识别出数字序列确定翻译指令。

S205,根据所述翻译指令执行主叫侧的语音翻译以及被叫侧的语音翻译,并将两侧的语音翻译进行交互。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种语音通话的双向实时翻译系统及方法
  • 一种针对聋人自然手语的双向实时翻译系统及方法
技术分类

06120113031603