掌桥专利:专业的专利平台
掌桥专利
首页

音频处理方法、音频处理装置及计算机存储介质

文献发布时间:2023-06-19 18:32:25


音频处理方法、音频处理装置及计算机存储介质

技术领域

本公开涉及终端控制技术,尤其涉及一种音频处理方法、音频处理装置及计算机存储介质。

背景技术

随着手机的蓬勃发展,越来越多的应用可以在运行的过程中,基于网际协议与同样运行该应用的其他终端进行通信。例如:在游戏应用中,在与他人进行团体作战时,通过基于网际协议的语音传输(Voice over Internet Protocol,Voip),与其他终端的用户进行沟通。

但在实际应用中,部分情况下,用户基于网际协议与同样运行该应用的其他终端进行通信时,双方并不认识,因此,为保护个人信息,需要对通话声音进行变音处理。

发明内容

为克服相关技术中存在的问题,本公开提供一种音频处理方法、音频处理装置及计算机存储介质。

根据本公开实施例的第一方面,提供一种音频处理方法,应用于第一终端,所述音频处理方法包括:响应于在所述第一终端接收到用户输入的音频数据,且确定开启了语音变音功能,确定变音参数。基于所述变音参数,对所述音频数据进行变音处理。

在一实施例中,所述确定变音参数,包括:响应于开启语音变音功能的时间早于创建语音通路的时间,确定创建所述语音通路时设置的变音参数。或者响应于所述开启语音变音功能的时间晚于创建所述语音通路的时间,遍历变音参数库中各语音通路对应的变音参数,得到匹配所述语音通路的变音参数。

在另一实施例中,所述语音通路采用如下方式创建:启用用于设置语音变音功能的功能选项,在所述功能选项对应的语音变音功能设置页面中添加所述语音通路对应的应用,并设置变音参数。

在又一实施例中,所述变音参数包括语音变音功能开启参数、应用标识以及变音模式。基于所述变音参数,对所述音频数据进行变音处理,包括:响应于当前未开启语音变音功能,但所述语音变音功能开启参数表征开启了语音变音功能,并设置有变音模式,且当前运行应用的应用标识与所述变音参数的应用标识相同,则开启对接收到的音频数据进行变音处理的功能,并在所述变音模式下对所述音频数据进行变音处理。或者响应于当前开启语音变音功能,但所述变音参数对应的变音模式与当前运行应用使用的变音模式不一致,则切换至所述变音参数对应的变音模式下,对接收到的音频数据进行变音处理的功能。

在又一实施例中,所述音频处理方法还包括:响应于当前开启语音变音功能,但所述语音变音功能开启参数表征未开启语音变音功能或者当前运行应用的应用标识与所述变音参数的应用标识不相同,则关闭对接收到的音频数据进行变音处理的功能。

在又一实施例中,所述功能选项包括游戏加速功能。

根据本公开实施例的第二方面,提供一种音频处理装置,应用于第一终端,所述音频处理装置包括:确定单元,用于响应于在所述第一终端接收到用户输入的音频数据,且确定开启了语音变音功能,确定变音参数。处理单元,用于基于所述变音参数,对所述音频数据进行变音处理。

在一实施例中,所述确定单元采用下述方式确定变音参数:响应于开启语音变音功能的时间早于创建语音通路的时间,确定创建所述语音通路时设置的变音参数。或者响应于所述开启语音变音功能的时间晚于创建所述语音通路的时间,遍历变音参数库中各语音通路对应的变音参数,得到匹配所述语音通路的变音参数。

在另一实施例中,所述语音通路采用如下方式创建:启用用于设置语音变音功能的功能选项,在所述功能选项对应的语音变音功能设置页面中添加所述语音通路对应的应用,并设置变音参数。

在又一实施例中,所述变音参数包括语音变音功能开启参数、应用标识以及变音模式。所述处理单元采用下述方式基于所述变音参数,对所述音频数据进行变音处理:响应于当前未开启语音变音功能,但所述语音变音功能开启参数表征开启了语音变音功能,并设置有变音模式,且当前运行应用的应用标识与所述变音参数的应用标识相同,则开启对接收到的音频数据进行变音处理的功能,并在所述变音模式下对所述音频数据进行变音处理。或者响应于当前开启语音变音功能,但所述变音参数对应的变音模式与当前运行应用使用的变音模式不一致,则切换至所述变音参数对应的变音模式下,对接收到的音频数据进行变音处理的功能。

在又一实施例中,所述处理单元还用于:响应于当前开启语音变音功能,但所述语音变音功能开启参数表征未开启语音变音功能或者当前运行应用的应用标识与所述变音参数的应用标识不相同,则关闭对接收到的音频数据进行变音处理的功能。

在又一实施例中,所述功能选项包括游戏加速功能。

本公开的实施例提供的技术方案可以包括以下有益效果:通过本公开提供的音频处理方法,能够基于确定的变音参数对用户输入的音频数据进行变音处理,且无需下载第三方应用,进而达到保护个人隐私目的的同时,有利于增添使用体验。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种音频处理方法的流程图。

图2是根据一示例性实施例示出的一种页面效果示意图。

图3是根据一示例性实施例示出的一种确定变音参数的方法的流程图。

图4是根据一示例性实施例示出的一种变音处理判断的方法流程图。

图5是根据一示例性实施例示出的一种音频管理器示意图。

图6是根据一示例性实施例示出的一种音频处理装置框图。

图7是根据一示例性实施例示出的另一种音频处理装置框图。

图8是根据一示例性实施例示出的又一种音频处理装置框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

相关技术中,终端不具有语音变音功能,因此,为保护个人隐私,用户在终端运行应用的过程中与他人进行通信时,需要通过第三方插件,通过添加新的虚拟驱动,达到改变用户通话声音的目的。但相关第三方插件在进行安装或者下载时,需要付费,影响用户的安装体验。且由于第三方插件是用户自行下载的,因此与终端系统的适配性也存在一定隐患,影响变音的稳定性。

鉴于此,本公开提供一种音频处理方法,在接收到用户输入的音频数据后,基于已确定的变音参数将接收到的音频数据进行变音处理,使用户无需下载第三方插件,便可以实现变音,从而达到保护个人隐私目的的同时,有利于增添使用体验,且有助于变音稳定。

在一示例中,应用可以包括游戏应用。在另一示例中,应用还可以包括社交应用。

在一实施例中,本公开所提供的音频处理方法,能够应用于任意一种终端。在一示例中,终端的种类可以包括移动终端,例如:手机、平板、智能电视、带屏智能音箱、带屏智能手表、ipod等。在另一示例中,终端的结构可以包括:双面屏终端、折叠屏终端、全面屏终端等。

图1是根据一示例性实施例示出的一种音频处理方法的流程图。如图1所示,音频处理方法用于终端中,包括以下步骤S11至步骤S12。

在步骤S11中,响应于在第一终端接收到用户输入的音频数据,且确定开启了语音变音功能,确定变音参数。

在本公开实施例中,在第一终端接收到用户输入的音频数据时,表征用户此时需要进行语音通话。在确定该应用开启了语音变音功能时,则表征用户在进行语音通话,需要将用户输入的音频数据进行变音处理。因此,在接收到用户输入的音频数据,且确定该应用开启了语音变音功能的情况下,可以确定用户需要对输入的音频数据进行变音处理,进而确定对该音频数据进行变音处理的变音参数。在一示例中,若确定未开启语音变音功能,则可以默认用户不需要对输入的音频进行变音处理。在一例中,变音参数可以是变音模式对应的参数。例如:变音模式可以包括:萝莉音模式、御姐音模式、大叔音模式、机器人音模式或者卡通音模式。不同变音模式对应的变音参数不同。

在一实施场景中,可以是在第一终端运行应用的过程中接收到用户输入的音频数据。在运行该应用的过程中,能够基于用户的选择,通过互联网,基于网际协议,与同样运行该应用的第二终端进行通信的应用。即,该应用是可以进行网际协议互联语音通信的应用。例如,应用可以包括:游戏应用或者社交应用。

在步骤S12中,基于变音参数,对音频数据进行变音处理。

在本公开实施例,第一终端基于确定的变音参数,将用户输入的变音数据进行变音处理。对音频数据进行变音处理,可以理解为是,根据指定变音模式的变音参数,将当前输入的音频数据对应的声音进行变音处理,变换成另一种声音的过程。在一实施场景中,对音频数据进行变音处理可以包括,对用户的原声进行变音处理。例如:将原声变成大叔音的过程。在另一实施场景中,对音频数据进行变音处理还可以包括,在已对用户的原声进行变音处理的情况下,根据用户的选择,将已进行变音处理后的音频数据再次进行变音处理。例如:将原声变成大叔音的基础上,将大叔音切换成萝莉音。

通过上述实施例,在接收到的用户输入的音频数据,且该应用开启语音变音功能的情况下,第一终端能够根据确定的变音参数自行将输入的音频数据进行变音处理,并且在对音频数据进行变音处理时,无需下载第三方插件,便可以进行变音处理,更有利于稳定使用该语音变音功能,使用户无需担忧语音变音功能与终端系统不兼容,进而影响变音处理的效果的问题,从而更有助于提升用户的使用体验。

在一实施场景中,可以将变音处理后的音频数据发送至第二终端。第二终端运行有与应用进行网际协议互联语音通信的应用。例如:以某手游应用为例,在多人进行团队作战时,不同用户使用的终端不同。为保证不同的用户在各自终端运行该手游应用时,相互之间能够彼此进行沟通交流,则可以基于该手游应用所支持的Voip相互进行通信。

在一实施例中,为使应用在第一终端运行的过程中,在用户需要基于Voip进行通信的情况下,将用户输入的音频数据可以进行变音处理,可以预先建立语音变音功能与应用之间的关系,以便根据语音变音功能与应用之间的关系,确定应用是否具有语音变音功能。在确定应用具有语音变音功能的情况下,可以基于开启语音变音功能的时间与创建语音通路的时间之间的先后顺序,确定需要进行变音处理的变音参数。其中,开启语音变音功能的时间,可以理解为是启动应用可以执行语音变音功能的时间。创建语音通路的时间可以理解为是,用户启动应用语音通话功能,与运行应用的第二终端的用户基于Voip进行通信的时间。以游戏应用为例,创建语音通路的时间可以理解为是,用户启动游戏应用执行开黑功能的时间。其中,开黑是一种游戏用语,是指用户在玩游戏时,通过语音或者面对面的方式,与运行相同应用的第二终端的用户进行交流。

在一示例中,若应用开启语音变音功能的时间早于创建语音通路的时间,则表征用户是在基于Voip进行通信之前,建立了语音变音功能与应用之间的关系,进而可以确定具有语音变音功能。因此,在确定开启语音变音功能的时间早于创建语音通路的时间时,则可以在创建语音通路之前,预先设置的变音参数,进而当语音通路创建完成时,便可以基于预先设置的变音参数进行变音处理,从而当用户基于Voip进行通信,便可以直接将输入的音频数据根据设置的参数进行变音处理,从通信起始起,便对用户输入的音频数据进行变音保护。

在一实施场景中,以游戏应用为例,预先确定游戏应用具有语音变音功能。可以在用户进行开黑之前,先确定需要进行变声处理的变音参数,进而当用户启动开黑功能后,语音通路创建完成时,将接收到的用户输入的音频数据根据预先设置的变音参数进行变音处理。例如,预先设置的变音参数为萝莉音模式的变音参数,进而当语音通路创建完成后,将接收到的用户输入的音频数据根据萝莉音模式的变音参数进行变音处理。

在另一示例中,若开启语音变音功能的时间晚于创建语音通路的时间,则表征用户是在基于Voip进行通信之后,建立了语音变音功能与应用之间的关系。可以理解为,是在用户基于Voip进行通信时,建立了语音变音功能与应用之间的关系,进而使应用具有语音变音功能。因此,在确定开启语音变音功能的时间晚于创建语音通路的时间时,则应用基于用户的选择,遍历变音参数库中各语音通路对应的变音参数,得到匹配语音通路的变音参数,即,得到用户指定的变音模式对应的变音参数,进而使用户在基于Voip进行通信时,可以随时调用需要进行变音处理的变音参数,从而提升应用体验,增加乐趣。其中,变音参数库可以理解为是多种变音参数的集合。

在一实施场景中,以游戏应用为例,在用户开黑的过程中,建立语音变音功能与应用之间的关系,进而选择需要进行变音的变音模式。在用户选择指定的变音模式后,应用遍历变音参数库中各语音通路对应的变音参数,调用与用户指定进行变音的变音模式相匹配的变音参数,进而将匹配得到的变音参数作为语音通路需要进行变音处理的变音参数。

在另一实施场景中,确定变音参数时,可以是基于第一终端的音频管理器(AudioManager)进行确定。在AudioManager中,包括音频策略的执行者(AudioFlinger)。其中,AudioFlinger用于控制输入输出流设备的管理及音频流数据的处理传输,并且,在AudioFlinger中,包括能够创建语音通路的线程(RecordThread)。若应用开启语音变音功能的时间早于创建RecordThread的时间,则创建语音通路时设置的变音参数(AudioFlinger::setParameters),并将该变音参数(RecordThread)进行保存。进而在创建语音通路时,将确定的变音参数发送至语音通路。若应用开启语音变音功能的时间晚于创建语音通路的时间,则直接在AudioFlinger::setParameters中遍历变音参数库中各语音通路对应的变音参数,根据用户指定的变音模式对应的变音参数,匹配语音通路进行变音处理的变音参数,并将匹配得到的变音参数发送至语音通路。

在另一实施例中,语音通路是基于能够设置语音变音功能的功能选项下进行设置的。将用于设置语音变音功能的功能选项进行启动,并在该功能选项对应的语音变音功能设置页面中将应用进行添加,使应用与语音变音功能建立对应关系,进而使应用具有语音变音功能。进而在应用具有变音功能的情况下,设置进行变音处理的变音参数。在一示例中,功能选项可以是位于终端系统设置下的某一功能选项集。在另一示例中,功能选项可以是终端系统自带软件下的功能手机软件(Application,APP)。

在一实施场景中,功能选项可以包括游戏加速功能,在游戏加速功能下,具有能够将应用进行的添加的语音变音功能设置页面,进而通过添加应用,使应用具有对输入的音频数据进行变音处理的语音变音功能。

在另一实施场景中,游戏加速功能可以是游戏加速APP所能够执行的功能,在该游戏加速APP下,具有能够将应用进行的添加的语音变音功能设置页面,进而通过添加应用,使应用具有对输入的音频数据进行变音处理的语音变音功能。

在又一实施场景中,以游戏应用为例。若通过游戏加速建立应用与语音变音功能之间的对应关系时,可以在第一终端的系统设置中,搜索游戏加速,进而点击右上方按钮(按钮位置可自定义)添加对应的应用。在设置变音参数时,打开游戏应用界面,并滑动左上角(位置可自定义)将游戏加速打开,在游戏加速中选择游戏变声器中提供的任意一种变音模式,进而将选中的变音模式对应的变音参数作为应用进行变音处理的变音参数。其中,在游戏界面打开的情况下,通过游戏加速确定变音模式的界面可以如图2所示。图2是根据一示例性实施例示出的一种页面效果示意图。游戏变声器可以理解为是语音变音功能设置页面,能够提供多种变音模式,并且,不同变音模式对应变音参数不同。其中,游戏变声器中的变音模式可以包括:原声模式、萝莉音模式、御姐音模式、大叔音模式、机器人音模式或者卡通音模式,在本公开中不进行限定。在一示例中,为便于用户选择,用户还可以通过游戏变声器,试听变声后的变声效果。

在一实施例中,在语音通路中,基于变音参数,对音频数据进行变音处理时,可以基于当前语音变音功能开启状态、以及当前运行应用的应用标识进行确定。其中,变音参数可以包括语音变音功能开启参数、应用标识以及变音模式。

若当前未开启语音变音功能,但语音变音功能开启参数表征开启了语音变音功能,并设置有变音模式,且当前运行应用的应用标识与变音参数的应用标识相同,则表征用户暂时不需要基于Voip与运行应用的第二终端的用户进行通信,但当前应用具有语音变音功能,且设置有将从语音通路中接收到的音频数据进行变音处理的变音参数。进而开启当前对接收到的音频数据进行变音处理的功能,并对接收到的音频数据进行变音处理。其中,当前运行应用的应用标识与变音参数的应用标识相同,表征应用与语音变音功能之间具有对应关系,该应用能够进行变音处理。

若当前开启语音变音功能,但变音参数对应的变音模式与当前运行应用使用的变音模式不一致,则表征用户需要变更变音参数,进而原有的变音参数切换至变音参数对应的变音模式下,对接收到的音频数据进行变音处理的功能。例如:预先设置的变音参数对应的变音模式为萝莉音模式,当前运行应用开启网际协议互联语音通信功能时,采用的变音模式为大叔音模式,则将萝莉音模式切换为大叔音模式。

在另一实施例中,图3是根据一示例性实施例示出的一种确定变音参数的方法的流程图。如图3所示,确定变音参数的方法包括以下步骤。

在步骤S21中,响应于在第一终端接收到用户输入的音频数据,且确定开启了语音变音功能,确定变音参数。

在步骤S221中,响应于当前未开启语音变音功能,但语音变音功能开启参数表征开启了语音变音功能,并设置有变音模式,且当前运行应用的应用标识与变音参数的应用标识相同,则开启对接收到的音频数据进行变音处理的功能,并在变音模式下对音频数据进行变音处理。

在步骤S222中,响应于当前开启语音变音功能,但变音参数对应的变音模式与当前运行应用使用的变音模式不一致,则切换至变音参数对应的变音模式下,对接收到的音频数据进行变音处理的功能。

在步骤S223中,响应于当前开启语音变音功能,但语音变音功能开启参数表征未开启语音变音功能或者当前运行应用的应用标识与变音参数的应用标识不相同,则关闭对接收到的音频数据进行变音处理的功能。

在本公开实施例中,响应于当前运行应用开启语音变音功能,但语音变音功能开启参数表征未开启语音变音功能或者当前运行应用的应用标识与变音参数的应用标识不相同,则表征用户在基于Voip进行通信时,不需要进行变音处理,或则该应用不具有语音变音功能。因此,当前运行应用开启网际协议互联语音通信功能时,关闭对接收到的音频数据进行变音处理的功能。

在一实施场景中,确定是否对音频数据进行变音处理的过程可以如4所示。图4是根据一示例性实施例示出的一种变音处理判断的方法流程图。

若当前运行应用未开启网际协议互联语音通信功能,但语音变音功能开启参数表征开启了语音变音功能(ModeOpen=true&&Mode>0&&isAPPVoip=true),并且当前运行应用的应用标识(User Identification,uid)与变音参数的应用标识相同,则开启当前运行应用的网际协议互联语音通信功能。

若当前运行应用开启网际协议互联语音通信功能,但变音参数对应的变音模式与当前运行应用使用的变音模式不一致,则当前运行应用使用的变音模式切换至变音参数对应的变音模式。

若当前运行应用开启网际协议互联语音通信功能,但语音变音功能开启参数表征未开启语音变音功能或者当前运行应用的应用标识与变音参数的应用标识不相同(ModeOpen=false Or isAPPVoip=false),则将当前运行应用的网际协议互联语音通信功能进行关闭。

在另一实施场景中,以应用为游戏应用为例。第一终端在对音频数据进行音频处理时,可以是基于底层确定变音参数,进而对音频数据进行变音处理。如图5所示,图5是根据一示例性实施例示出的一种音频管理器示意图。其中,实线箭头表示数据通路,虚线箭头表示控制通路。在音频管理器中,包括:Android应用程序包(Android applicationpackage,APK)、AudioFlinger、ADSP。其中,APK是Android操作系统使用的一种应用程序包文件格式,用于分发和安装移动应用及中间件。APK包括:AudioTrack:负责回放数据的输出,以及AudioRecord:负责录音数据的采集。AudioFlinger包括:Playbackthread回放线程以及RecordThread记录线程。在RecordThread中,包括ThreadLoop能够循环处理数据的线程以及游戏变音算法库。ADSP是一种数字信号处理芯片,包括:TX发送,以及RX接收。

当用户在使用游戏应用的过程中,需要执行变音的相关操作时,游戏应用可以通过AudioManager给底层设置变音参数。由底层在AudioFlinger中解析变音参数并将变音参数设置给游戏变音算法库。将麦克风(mic)录制的音频数据通过ADSP传给AudioFlinger,AudioFlinger的RecordThread::ThreadLoop(在语音通路线程中,能够循环处理音频数据的线程)中把脉冲编码调制(Pulse Code Modulation,PCM)数据(未经压缩的音频采样数据裸流)循环拷贝给各个应用(track),并在拷贝后判断当前track是否需要进行变音处理。如果需变音处理,则把变音参数传给游戏变音算法库中做变音处理,并将处理后的音频数据传给游戏应用发送至第二终端。

具体的,为便于应用能够使用语音变音功能的功能。在底层中创建宏开关,若开关功能被开启,则表征应用具有语音变音功能。若开关功能被关闭,则表征应用不具有语音变音功能。

在AudioFlinger中确定变音参数时,若应用开启语音变音功能的时间晚于创建语音通路的时间,则直接在AudioFlinger::setParameters遍历变音参数库中各语音通路对应的变音参数,得到匹配语音通路的变音参数。若应用开启语音变音功能的时间早于创建语音通路的时间,则在AudioFlinger::setParameters中将预先设置的变音参数进行保存,进而当创建语音通路时,将设置的变音参数发送至游戏变音算法库中做变音处理。

当游戏变音算法库接收到的设置的变音参数时,通过调用检查游戏参数1(checkForGameParameter_l)解析针对游戏变音的各个变音参数。若发现变音参数发生变化,则调用创建游戏变音模式(setGameMode)做处理,在setGameMode中循环处理当前创建的所有audiotracks(负责回放数据的输出)。

若当前应用未开启网际协议互联语音通信功能,但在RecordThread中收到ModeOpen=true,Mode>0且当前track的uid等于收到的uid,则将当前应用的变音处理功能打开。若当前应用开启网际协议互联语音通信功能,但在RecordThread中收到了ModeOpen=false或者当前track的uid不等于收到的uid,则将当前应用的变音处理功能关闭。若当前应用开启网际协议互联语音通信功能,但在RecordThread中收到的变音mode不等于当前track的变音mode,则给当前track切换变音mode。

当确定应用是否启动应用变音模式,以及在确定应用启动变音模式并设置完对应的变音参数之后,在AudioFlinger::RecordThread::threadLoop()中在把PCM传给各个应用,并在各应用需要进行变音处理时进行相应的变音处理。

通过上述任意一种音频处理方法,使语音变音功能能够基于第一终端的终端系统进行开发,进而使用户能够得到免费且稳定的变音功能,进而用户在使用相关应用时,可以在基于Voip进行通信的情况下,采用不同的变音模式进行通信,并且在关闭语音变音功能的情况下,可以保护用户原声,进而达到保护个人隐私的同时,增加应用体验乐趣。

基于相同的构思,本公开实施例还提供一种应用于第一终端的音频处理装置。

可以理解的是,本公开实施例提供的音频处理装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤,本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本公开实施例的技术方案的范围。

图6是根据一示例性实施例示出的一种音频处理装置框图。参照图6,该音频处理装置100包括确定单元101和处理单元102。

确定单元101,用于响应于在第一终端接收到用户输入的音频数据,且确定开启了语音变音功能,确定变音参数。

处理单元102,用于基于变音参数,对音频数据进行变音处理。

在一实施例中,确定单元101采用下述方式确定变音参数:响应于开启语音变音功能的时间早于创建语音通路的时间,确定创建语音通路时设置的变音参数。或者响应于应用开启语音变音功能的时间晚于创建语音通路的时间,遍历变音参数库中各语音通路对应的变音参数,得到匹配语音通路的变音参数。

在另一实施例中,语音通路采用如下方式创建:启用用于设置语音变音功能的功能选项,在功能选项对应的语音变音功能设置页面中添加语音通路对应的应用,并设置变音参数。

在又一实施例中,变音参数包括语音变音功能开启参数、应用标识以及变音模式。处理单元102采用下述方式基于变音参数,对音频数据进行变音处理:响应于当前未开启语音变音功能,但语音变音功能开启参数表征开启了语音变音功能,并设置有变音模式,且当前运行应用的应用标识与变音参数的应用标识相同,则开启对接收到的音频数据进行变音处理的功能,并在变音模式下对音频数据进行变音处理。或者响应于当前开启语音变音功能,但变音参数对应的变音模式与当前运行应用使用的变音模式不一致,则切换至变音参数对应的变音模式下,对接收到的音频数据进行变音处理的功能。

在又一实施例中,处理单元102还用于:响应于当前开启语音变音功能,但语音变音功能开启参数表征未开启语音变音功能或者当前运行应用的应用标识与变音参数的应用标识不相同,则关闭对接收到的音频数据进行变音处理的功能。

在又一实施例中,功能选项包括游戏加速功能。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图7是根据一示例性实施例示出的另一种音频处理装置框图。例如,音频处理装置200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图7,音频处理装置200可以包括以下一个或多个组件:处理组件202,存储器204,电力组件206,多媒体组件208,音频组件210,输入/输出(I/O)接口212,传感器组件214,以及通信组件216。

处理组件202通常控制音频处理装置200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件202可以包括一个或多个处理器220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件202可以包括一个或多个模块,便于处理组件202和其他组件之间的交互。例如,处理组件202可以包括多媒体模块,以方便多媒体组件208和处理组件202之间的交互。

存储器204被配置为存储各种类型的数据以支持在音频处理装置200的操作。这些数据的示例包括用于在音频处理装置200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电力组件206为音频处理装置200的各种组件提供电力。电力组件206可以包括电源管理系统,一个或多个电源,及其他与为音频处理装置200生成、管理和分配电力相关联的组件。

多媒体组件208包括在所述音频处理装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件208包括一个前置摄像头和/或后置摄像头。当音频处理装置200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件210被配置为输出和/或输入音频信号。例如,音频组件210包括一个麦克风(MIC),当音频处理装置200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中,音频组件210还包括一个扬声器,用于输出音频信号。

I/O接口212为处理组件202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件214包括一个或多个传感器,用于为音频处理装置200提供各个方面的状态评估。例如,传感器组件214可以检测到音频处理装置200的打开/关闭状态,组件的相对定位,例如所述组件为音频处理装置200的显示器和小键盘,传感器组件214还可以检测音频处理装置200或音频处理装置200一个组件的位置改变,用户与音频处理装置200接触的存在或不存在,音频处理装置200方位或加速/减速和音频处理装置200的温度变化。传感器组件214可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件214还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件216被配置为便于音频处理装置200和其他设备之间有线或无线方式的通信。音频处理装置200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件216还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,音频处理装置200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述任意一种音频处理方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器204,上述指令可由音频处理装置200的处理器220执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图8是根据一示例性实施例示出的又一种音频处理装置框图。例如,音频处理音频处理装置300可以被提供为一服务器。参照图8,音频处理装置300包括处理组件322,其进一步包括一个或多个处理器,以及由存储器332所代表的存储器资源,用于存储可由处理组件322的执行的指令,例如应用程序。存储器332中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件322被配置为执行指令,以执行上述任意一种音频处理方法。

音频处理装置300还可以包括一个电源组件326被配置为执行音频处理装置300的电源管理,一个有线或无线网络接口350被配置为将音频处理装置300连接到网络,和一个输入输出(I/O)接口358。音频处理装置300可以操作基于存储在存储器332的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。

进一步可以理解的是,本公开中“多个”是指两个或两个以上,其它量词与之类似。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

进一步可以理解的是,术语“第一”、“第二”等用于描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开,并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。

进一步可以理解的是,除非有特殊说明,“连接”包括两者之间不存在其他构件的直接连接,也包括两者之间存在其他元件的间接连接。

进一步可以理解的是,本公开实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利范围指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利范围来限制。

相关技术
  • 同场景音频处理方法、装置、计算机可读存储介质及系统
  • 音频处理方法、装置、穿戴式设备及存储介质
  • 基于终端的音频处理方法、装置、终端和可读存储介质
  • 音频处理方法、装置及存储介质
  • 音频处理方法、装置及存储介质
  • 终端支架及其控制方法、音频处理方法、音频处理系统、电子设备以及计算机可读存储介质
  • 音频处理方法和装置、音频模型训练方法和装置、电子设备及计算机可读存储介质
技术分类

06120115603091