掌桥专利:专业的专利平台
掌桥专利
首页

一种处理声像方位的方法和终端

文献发布时间:2023-06-19 19:28:50


一种处理声像方位的方法和终端

技术领域

本申请涉及音频处理领域,尤其涉及一种处理声像方位的方法和终端。

背景技术

目前,随着科学技术的发展,耳机的功能越来越多且逐渐完善。例如,通过左右耳机分别播放左声道对应的音频(左声道音频)以及右声道对应的音频(右声道对应的音频),可以使得佩戴者感觉声音更具有立体感,进而提高播放音频的质量。

耳机的使用场景越来越多,大部分用户喜欢利用耳机进行听歌等服务。如何进一步提高耳机所播放音频的质量,提升用户体验感是值得讨论的。

发明内容

本申请提供了一种处理声像方位的方法和终端,可以使得佩戴者的听感方位与相对方位匹配。

第一方面,本申请提供了一种处理声像方位的方法,应用于包括终端和耳机的系统,该方法包括:

该终端向该耳机发送第一调试音频,该第一调试音频的声像方位对应该第一相对方位;该声像方位用于描述调试音频的模拟声源相对于该用户的方位;该相对方位用于描述用户头部相对于参考声源的方位;该终端获取输入的第一听感方位;该听感方位用于描述该耳机播放该第一调试音频后,该用户主观认为的参考声源相对于该用户头部的方位;该终端将该第一相对方位对应的渲染方位设置为第一听感方位;该终端接收该耳机发送的第二相对方位;该第二相对方位为第一时间该用户头部相对于参考声源的方位;该第二相对方位取值为该第一听感方位;该终端基于该第一相对方位对待播放音频进行滤波处理,得到已处理音频;该已处理音频的声像方位对应该第一相对方位;该终端向该耳机发送该已处理音频使得该耳机处于播放该已处理音频的状态。

该实施例中涉及的第一调试音频可以为下述内容中涉及的调试音频1;涉及的第一听感方位可以下述内容中涉及的听感方位1;涉及的第二相对方位可以为下述内容中涉及的相对方位A。

这里一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

结合第一方面,在一些可能的实现方式中,该终端获取输入的第一听感方位,具体包括:该终端显示第一界面,该第一界面中包括第一控件;该第一界面用于设置听感方位;该听感方位用于描述该耳机播放该第一调试音频后,该用户主观认为的参考声源相对于该用户头部的方位;响应于针对该第一控件的操作,该终端获取输入的第一听感方位。

该实施例中涉及的第一界面可以为下述内容中涉及的用户界面A2,第一控件可以为下述内容中涉及的“确认”控件152a;涉及的用户可以为下述内容中涉及的佩戴者。

这里终端可以提供用户输入听感方位的功能。使得输入的听感方位可以表达用户的主观感知。

结合第一方面,在一些可能的实现方式中,该方法还包括:该终端显示第二界面,该第二界面中包括标志符与第二控件;该标志符用于指示该终端与该耳机连接;该第二界面用于设置待调试的相对方位;响应于针对该第二控件的操作,该终端获取输入的第一相对方位;该终端基于该第一相对方位确定该第一调试音频。

该实施例中涉及的第二界面可以为下述内容中涉及的用户界面A1;涉及的第二控件可以为下述内容中涉及的“确认”控件121b;涉及的标志符可以为下述内容中涉及的连接标志符。

这里终端可以提供用户输入相对方位的功能,给用户提供更多选择。使得用户可以输入用户想调试的相对方位。

结合第一方面,在一些可能的实现方式中,该终端显示第一界面,具体包括:该终端接收已播放音频;该已播放音频为该耳机采集播放后的该第一调试音频所得到的音频;确定该已播放音频对应的方位与该第一相对方位的方位误差小于等于第一阈值,或者,该第一调试音频的播放次数大于等于第二阈值的情况下,该终端显示该第一界面。

该实施例中涉及的第一阈值可以为下述内容中涉及的预设误差1,第二阈值可以为下述内容中涉及的预设阈值1。

这里终端可以检测耳机的佩戴情况,方位误差小于等于第一阈值说明用户是正常佩戴耳机的。在播放次数大于第二阈值的情况下,可以认为该耳机的佩戴状态被调整过,或者,可以不用调整该耳机的佩戴情况。在耳机正常佩戴时,才可以显示第一界面使得用户可以输入听感方位。这样,可以控制用户产生方位感偏差的变量,保证用户的方位感偏差是一种主观认知,而不是受耳机不正常佩戴导致的。

结合第一方面,在一些可能的实现方式中,该终端向该耳机发送第一调试音频之前,该方法还包括:确定该已播放音频对应的方位与该第一相对方位的方位误差大于该第一阈值,且,该第一调试音频的播放次数小于该第二阈值的情况下,该终端显示该第三界面,该第三界面中包括第三控件;该第三界面用于提示该用户正常佩戴该耳机;响应于针对该第三控件的操作,该终端确定该耳机变更为正常佩戴的状态。

该实施例中涉及的第三界面可以为下述内容中涉及的用户界面15a,第三控件可以为“完成”控件151b。

方位误差大于第一阈值,且,播放次数小于第二阈值的情况下,可以认为用户没有正常佩戴耳机,该耳机的佩戴状态需要调整。调整耳机的佩戴状态为正常佩戴时,才可以显示第一界面使得用户可以输入听感方位。这样,可以控制用户产生方位感偏差的变量,保证用户的方位感偏差是一种主观认知,而不是受耳机不正常佩戴导致的。

结合第一方面,在一些实施例中,该方法还包括:该终端分别基于Q个预设方位对应的传递函数对该预设音频进行滤波处理,得到Q个预设方位对应的调试音频;该终端对该Q个调试音频进行特征提取,得到每一个调试音频对应的双耳互相关特征;该终端将该Q个调试音频对应的双耳互相关特征分别与预设方位对应,得到Q个预设方位及其对应的双耳互相关特征;该终端对该已播放音频进行特征提取,得到该已播放音频对应的双耳互相关特征;该终端确定目标双耳互相关特征,该目标双耳互相关特征为Q个目标双耳互相关特征中与已播放音频对应的双耳互相关特征最相似的;该终端将该目标双耳互相关特征对应的预设方位作为已播放音频对应的方位。

结合第一方面,在一些可能的实现方式中,该终端将该第一相对方位对应的渲染方位设置为第一听感方位,具体包括:该终端获取该耳机的耳机标识;该终端基于该耳机标识确定其对应的方位对应关系;该终端将该第一相对方位及其对应的渲染方位记录到该方位对应关系中,该第一相对方位对应的渲染方位为该第一听感方位。

该实施例中,一个耳机标识可以唯一用于表示一个耳机。这里一个耳机对应一个方位对应关系,可以消除不同耳机间的差距,也可能一个耳机就可以代表不同的用户,保证不同用户都可以有个性化定制的方位对应关系。

结合第一方面,在一些可能的实现方式中,该终端基于该第一相对方位对待播放音频进行滤波处理之前,该方法还包括:该终端获取该耳机标识对应的方位对应关系;该终端基于该方位对应关系,确定该第一相对方位对应的渲染方位为该第二相对方位。

结合第一方面,在一些可能的实现方式中,该终端基于该第一相对方位确定该第一调试音频,具体包括:该终端基于该第一相对方位对应的传递函数对该预设音频进行滤波处理,得到该第一调试音频。

结合第一方面,在一些实施例中,该相对方位中包括该用户的头部相对该参考声源的水平角以及俯仰角。

第二方面,本申请实施例提供了一种处理声像方位的方法,应用于包括终端和耳机的系统,该方法包括:该终端向该耳机发送第一调试音频,该第一调试音频的声像方位对应该第一相对方位;该声像方位用于描述模拟声源相对于该用户的方位,该模拟声源包括产生播放后的第一调试音频的声源;该相对方位用于描述用户头部相对于参考声源的方位;该耳机播放该第一调试音频;该终端获取输入的第一听感方位;该听感方位用于描述该耳机播放该第一调试音频后,该用户主观认为的参考声源相对于该用户头部的方位;该终端将该第一相对方位对应的渲染方位设置为第一听感方位;第一时间,该耳机检测到该用户头部相对于该参考声源的方位变更为第二相对方位;该耳机向该终端发送该第二相对方位;该终端接收该第二相对方位;该第二相对方位为第一时间该用户头部相对于参考声源的方位;该第二相对方位取值为该第一听感方位;该终端基于该第一相对方位对待播放音频进行滤波处理,得到已处理音频;该已处理音频的声像方位对应该第一相对方位;该终端向该耳机发送该已处理音频;耳机播放该已处理音频。

该实施例中涉及的第一调试音频可以为下述内容中涉及的调试音频1;涉及的第一听感方位可以下述内容中涉及的听感方位1;涉及的第二相对方位可以为下述内容中涉及的相对方位A。

这里一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

第三方面,本申请实施例提供了一种终端,该终端包括:一个或多个处理器和存储器;该存储器与该一个或多个处理器耦合,该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令,该一个或多个处理器调用该计算机指令以使得该终端执行:

向该耳机发送第一调试音频,该第一调试音频的声像方位对应该第一相对方位;该声像方位用于描述调试音频的模拟声源相对于该用户的方位;该相对方位用于描述用户头部相对于参考声源的方位;获取输入的第一听感方位;该听感方位用于描述该耳机播放该第一调试音频后,该用户主观认为的参考声源相对于该用户头部的方位;该终端将该第一相对方位对应的渲染方位设置为第一听感方位;接收该耳机发送的第二相对方位;该第二相对方位为第一时间该用户头部相对于参考声源的方位;该第二相对方位取值为该第一听感方位;基于该第一相对方位对待播放音频进行滤波处理,得到已处理音频;该已处理音频的声像方位对应该第一相对方位;向该耳机发送该已处理音频使得该耳机处于播放该已处理音频的状态。

该实施例中涉及的第一调试音频可以为下述内容中涉及的调试音频1;涉及的第一听感方位可以下述内容中涉及的听感方位1;涉及的第二相对方位可以为下述内容中涉及的相对方位A。

这里一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

第四方面,本申请提供了一种系统,该系统中包括终端和耳机,其中:

该终端用于向该耳机发送第一调试音频,该第一调试音频的声像方位对应该第一相对方位;该声像方位用于描述模拟声源相对于该用户的方位,该模拟声源包括产生播放后的第一调试音频的声源;该相对方位用于描述用户头部相对于参考声源的方位;该耳机播放该第一调试音频;该终端获取输入的第一听感方位;该听感方位用于描述该耳机播放该第一调试音频后,该用户主观认为的参考声源相对于该用户头部的方位;该终端还用于将该第一相对方位对应的渲染方位设置为第一听感方位;第一时间,该耳机检测到该用户头部相对于该参考声源的方位变更为第二相对方位;该耳机用于向该终端发送该第二相对方位;该终端还用于接收该第二相对方位;该第二相对方位为第一时间该用户头部相对于参考声源的方位;该第二相对方位取值为该第一听感方位;该终端还用于基于该第一相对方位对待播放音频进行滤波处理,得到已处理音频;该已处理音频的声像方位对应该第一相对方位;该终端向该耳机发送该已处理音频;耳机还用于播放该已处理音频。

该实施例中涉及的第一调试音频可以为下述内容中涉及的调试音频1;涉及的第一听感方位可以下述内容中涉及的听感方位1;涉及的第二相对方位可以为下述内容中涉及的相对方位A。

这里一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

第五方面,本申请提供了一种终端,该终端包括:一个或多个处理器和存储器;该存储器与该一个或多个处理器耦合,该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令,该一个或多个处理器调用该计算机指令以使得该终端执行如第一方面或第一方面的任意一种实施方式所描述的处理声像方位方法。

上述实施例中,一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

第六方面,本申请实施例提供了一种芯片系统,该芯片系统应用于终端,该芯片系统包括一个或多个处理器,该处理器用于调用计算机指令以使得该终端执行如第一方面或第一方面的任意一种实施方式所描述的处理声像方位方法。

上述实施例中,一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

第七方面,本申请实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在终端上运行时,使得该终端执行如第一方面或第一方面的任意一种实施方式所描述的方法。

上述实施例中,一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

第八方面,本申请实施例提供了一种计算机可读存储介质,包括指令,当该指令在终端上运行时,使得该终端执行如第一方面或第一方面的任意一种实施方式所描述的处理声像方位的方法。

上述实施例中,一个相对方位对应的渲染方位可以理解为:基于该相对方位对音频进行滤波处理之后,得到的已处理音频在用户听起来对应的方位(听感方位)即为该相对方位对应的渲染方位。在佩戴者或者佩戴者头部与参考声源的相对方位改变时,基于该相对方位对应的渲染方位对音频进行滤波处理,使得该处理后的音频(相当于已处理音频)对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,佩戴者在听到该处理后的音频时,可以感觉声音是从参考声源传播而来的,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差,佩戴者始终感觉声源没有发生变化过。

附图说明

图1中示出了佩戴者与参考声源的相对方位一个示例性描述;

图2示出了佩戴者对声源进行定位的示例性内容;

图3示出了本申请实施例中处理声像方位时涉及的一个示例性流程图;

图4A、图4B以及图5示出了设置相对方位时涉及的示例性用户界面;

图6示出了确定调试音频1与已播放音频1对应的方位误差的示例性流程图;

图7示出了终端设置听感方位时涉及的示例性用户界面;

图8示出了本申请实施例中处理声像方位时涉及的另一个示例性流程图;

图9是本申请实施例提供的系统的结构示意图;

图10是本申请实施例提供的耳机的结构示意图;

图11是本申请实施例提供的终端的结构示意图。

具体实施方式

本申请以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个所列出项目的任何或所有可能组合。

以下,术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。

在一种方案中,耳机中设置了运动跟踪算法,在检测到佩戴者(佩戴耳机的用户)头部转动时,可以确定头部转动后相对于固定位置的参考声源的方位(相对方位)。在播放音频时,基于该相对方位对音频进行渲染(滤波)处理,使得音频对应的方位(声像方位)与该相对方位相同或者接近。即,头部转动之后,在一些可能的情况下,也可以使得播放的音频听起来是从该参考声源传播而来的。这样,可以给佩戴者营造一种头部虽然在转动,但是声源始终固定在一个位置的感觉,进而提高播放音频的质量,且,符合用户听音习惯。因为日常生活中,参考声源(例如音响、电视等)相对于用户的方位是可以随着用户头部转动改变的,则用户头部转动时所听到的声音(参考声源发出的)的方位也会改变。这里,相对方位可以理解为参考声源(位置固定)相对于佩戴者的方位。音频对应的声像方位包括模拟声源相对于佩戴者的方位,该模拟声源包括产生播放后的音频的声源。在声像方位与相对方位一致时,模拟声源与参考声源位置相同。

但是,由于佩戴者的耳道结构或者方向感知不同,则声像方位相同的音频经过耳机播放时,不同用户的听感方位可能不同。该听感方位可以理解为听到该音频的佩戴者感知到的声源相对于佩戴者的方位。这样,当佩戴者的方向感知或者耳道结构出现偏差时,头部与声源的相对方位改变时,即使将音频渲染为与相对方位A(改变后的相对方位)对应,但是播放后用户感知到的方位不会是相对方位A,即听感方位与相对方位不匹配,使得佩戴者觉得“声源位置变了”,不符合日常听音习惯。

本申请实施例提供了一种处理声像方位的方法,在佩戴者或者佩戴者头部与参考声源的相对方位改变时,在方位对应关系中记录了改变后的相对方位对应的渲染方位时,基于该渲染方位对音频进行滤波处理,使得该处理后的音频对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差。

其中一种确定相对方位对应的渲染方位的实现方式包括:基于一个相对方位(相对方位1)对预设音频进行滤波处理,得到处理后的音频。且,使得该处理后的音频(调试音频1)的声像方位对应该相对方位1。然后,终端通过耳机播放该调试音频1,且,接收用户通过终端输入的听感方位。将该输入的听感方位作为该相对方位1对应的渲染方位。该输入的听感方位可以理解为该调试音频1被播放后,听到该调试音频1的佩戴者感知到的声源相对于佩戴者的方位,该感知到的声源可以理解为产生调试音频1的对象。

基于上述实现方式即可得到一个相对方位及其对应的渲染方位。分别基于不同的相对方位实行前述实现方式,确定不同相对方位对应的渲染方位,得到方位对应关系。该方位对应关系中,包括相对方位A1及其对应的渲染方位A1,该渲染方位A1的取值为听感方位A1,该听感方位A1为基于相对方位A对音频进行滤波处理之后,播放该处理后的音频时,佩戴者的听感方位。在该佩戴者与参考声源的相对方位改变时为时,在相对方位A2与听感方位A1取值相同时,终端可以基于该方位对应关系确定该相对方位A1对应的渲染方位(渲染方位A1)与该相对方位A2相同,则可以基于相对方位A1对音频进行滤波处理之后。播放该处理后的音频时,佩戴者的听感方位为该相对方位A2。

下面对前述内容中涉及的相关术语进行示例性描述。

图1中示出了佩戴者与参考声源的相对方位一个示例性描述。

下面结合图1对相对方位以及声像方位进行示例性描述。

在一些可能的情况下,相对方位描述了佩戴者或者佩戴者头部相对于参考声源的位置,其中可以包括以参考声源作为原点建立空间坐标系时,佩戴者头部相对于参考声源的俯仰角以及水平角。该俯仰角以及水平角在佩戴者头部转动时即可发生改变,则相对方位发生改变。

如图1中(1)所示,这里以参考声源作为原点建立空间坐标系,即参考声源的俯仰角以及水平角均为0。水平方向建立X轴,竖直方向建立Y轴,垂直于平面XOY的方向建立Z轴。

佩戴者头部的俯仰角表示为该点绕X的旋转角度,俯仰角的范围为-180°-180°。佩戴者头部的水平角表示该点绕Y的旋转角度,水平角的范围为-180°-180°。例如,佩戴者头部旋转至K点时,K点对应的俯仰角为Φ,K点对应的水平角为θ。可以用(Φ,θ)表示K点相对于参考声源的方位。

声像方位描述了所播放音频的模拟声源相对于佩戴者的方位,也可以理解声像方位模拟了佩戴者头部相对于参考声源的相对方位。在声像方位等于相对方位的情况下,则模拟声源与参考声源位置相同。在声像方位与相对方位不相同的情况下,则模拟声源与参考声源位置不相同。声像方位与相对方位相差越大,则模拟声源与参考声源位置相差越大。

如图1中(2)所示,这里以水平角改变,俯仰角不改变为例进行说明。佩戴者头部初始时处于与参考声源的水平角为0°的方位。后续,佩戴者头部转动,处于与参考声源的水平角为90°(或者-90°)的方位。则播放后的音频的声像方位也为90°(或者-90°)的水平角时,则佩戴者虽然头部转动了,但是由于声像方位与相对方位匹配,可以理解为参考声源位置没有改变。

在一些可能的情况下,终端可以基于相对方位对应的传递函数对待播放音频进行滤波处理,使得处理后的音频播放时,听起来可以为从参考声源处产生后进行传播的。也可以称为:使得处理后的音频的声像方位对应该相对方位。该处理后的音频的声像方位与该相对方位越接近,则处理后的音频播放时,听起来越可以理解为从参考声源处产生后进行传播的。

在一些可能的情况下,一个相对方位对应的传递函数可以利用头相关传递函数(head-related transfer function,HRTF)表示。一个相对方位对应的头相关传递函数可以表示为音频从声源处传播到双耳的声压,该声压可以理解为声音压力的大小,声压越大,能量越大。为了营造立体声效果,这里的音频通常包括左声道音频以及右声道音频。左声道音频对应的头相关传递函数与右声道音频对应的头相关传递函数不同。其中,左声道音频对应的头相关传递函数可以表示为参考声源在左耳处的声压与参考声源在头部中心位置处的声压之比。右声道音频对应的头相关传递函数可以表示为参考声源在右耳处的声压与参考声源在头部中心位置处的声压之比。下面公式(1)表示了一个相对方位对应的头相关传递函数。

/>

公式(1)中,其中,H

图2示出了佩戴者对声源进行定位的示例性内容。

下面结合图2对听感方位进行示例性描述。

佩戴者的听感方位可以理解为音频被播放后,听到该音频的佩戴者感知到(主观认为)的参考声源相对于佩戴者的方位。该感知到的声源可以理解为产生音频的对象。例如,该音频可以为前述涉及的调试音频1。总结起来可以理解为佩戴者具有听音识方位的能力,但是不同佩戴者对方位的识别能力不同,客观上同一个方位的音频在主观上可以被认定为不同方位的音频。

如图2所述,由于佩戴者的双耳位于头部两侧,且具有一定的距离,当双耳与该声源的距离不相同且声源产生声音(音频)时,该声音传播到佩戴者的双耳时,双耳接收到的声音就会产生差别,佩戴者感受到该差别后可以使得佩戴者判断声源的方位。该差别包括但不限于:声音到达双耳的时间不同,即左右耳听到的声音具有时间差(interaural timedifference,ITD);声音到达双耳的声级不同,即左右耳听到的声音具有声级差(interaural level difference,ILD);声音到达双耳的声压谱不同。且不同方位的声音双耳声压不同,也使得佩戴者可以判断声源的方位。

还可以理解为不同方位的音频具有不同的特征,不同特征使得佩戴者可以识别音频的方位。音频的特征包括但不限于左右声道音频的时间差、左右声道音频的声级差、左右声道音频的声压谱变化等参数中的一个或者多个。

图3示出了本申请实施例中处理声像方位时涉及的一个示例性流程图。

实施本申请中处理声像方位的过程可以参考下述对步骤S101-步骤S112的描述。

S101.终端与耳机建立连接。

在一些可能的情况下,终端与耳机可以通过蓝牙(bluetooth,BT)网络建立连接。终端与耳机建立连接之后,可以与耳机相互发送信息。例如,终端可以通过蓝牙向耳机发送音频。

在一些可能的情况下,终端与耳机建立连接之后,终端中可以显示连接标志符以提示佩戴者连接完成。

在建立连接之后,终端可以开启方位设置功能,该功能为佩戴者提供将相对方位与听感方位对应的功能。基于该功能,终端可以获取至少一个相对方位对应的渲染方位。将不同相对方位及其对应的渲染方位记录在方位对应关系中。

在一些可能的情况下,该相对方位可以是终端随机指定的。

在另一些可能的情况下,该相对方位还可以是佩戴者通过终端设置的。

下面以该相对方位为佩戴者通过终端设置的这一情况为例,对得到相对方位对应的渲染方位所涉及的过程进行描述。针对该过程的描述可以参考下述对步骤S102-步骤S108的描述。

S102.终端显示用户界面A1,该用户界面A1用于设置待调试的相对方位,检测到确定相对方位1的操作。

该步骤S102是可选的。

检测到终端与耳机连接之后,终端可以显示用户界面A1。

该用户界面A1为设置相对方位时涉及的用户界面。佩戴者可以通过用户界面A1输入相对方位1。后续,基于该输入的相对方位1,终端可以播放声像方位与该相对方位1对应的音频。佩戴者听到该音频之后,可以通过终端输入佩戴者主观认为的听感方位,即佩戴者认为的产生该音频的对象(声源)相对于佩戴者的方位。该后续过程涉及的内容可以参考下述对步骤S103-步骤S108的描述。然后,终端可以将该输入的听感方位作为该相对方位对应的渲染方位。

图4A、图4B以及图5示出了设置相对方位时涉及的示例性用户界面。

该用户界面A1的一种示例性情况可以包括图4A中涉及的用户界面11、图4B中涉及的用户界面12以及图5中涉及的用户界面13。

如图4A所示,用户界面11为终端确定与耳机建立连接之后,显示的一个示例性界面。该用户界面11中可以包括连接标志符111。该用户界面11中还可以包括提示框112,该提示框112可以用于提示佩戴者开启方位设置或者取消方位设置。该提示框112中可以包括提示信息以询问佩戴者是否开启方位设备。该提示信息可以为文字内容:“‘XXX1’已连接,是否开启方位设置”。该用户界面11中还可以包括“取消”控件112a以及“确认”控件112b。其中,“确认”控件112b可以用于接收开启方位设置的操作(例如点击操作),触发终端显示方位设置的其他界面以使得佩戴者通过终端输入相对方位。“取消”控件112a可以用于接收取消方位设置的操作(例如点击操作),触发终端关闭该提示框112。

响应于针对该“确认”控件112b的操作,终端可以显示进行方位设置时涉及的用户界面。例如,可以显示下述图4B涉及的用户界面12。

如图4B所示,用户界面12可以为佩戴者提供输入相对方位的功能。这里以相对方位包括俯仰角以及水平角为例进行说明。该用户界面12中可以包括编辑框121,该编辑框121可以用于佩戴者编辑相对方位。该编辑框121中可以包括“取消”控件121a以及“确认”控件121b。其中,“取消”控件121a可以用于接收取消编辑相对方位的操作(例如点击操作),触发终端关闭该编辑框121。“确认”控件121a可以用于接收确定编辑相对方位的操作(例如点击操作),触发终端获取所编辑的相对方位。

在一些可能的情况下,该编辑框121可以用于选择相对方位中包括的水平角以及俯仰角。该编辑框121中还可以包括水平角设置项121c,以及俯仰角设置项121d。水平角设置项121c可以提供至少一个可选择的水平角,俯仰角设置项121d以及至少一个可选择的俯仰角。选择水平角以及俯仰角的过程即为选择相对方位的过程。

应该理解的是,可选择的水平角以及可选择的俯仰角来自预设方位。该预设方位为终端中纪录的传递函数已知的相对方位,即该相对方位对应的传递函数已经设置在终端中。

在一些可能的情况下,默认将选择的水平角设置为0°,以及默认选择的俯仰角设置为0°。响应于针对俯仰角设置项的操作(例如滑动操作),终端可以改变选择的俯仰角。例如以俯仰角从0°变更为30°为例进行说明。此时,终端可以显示下述图5中示出的用户界面13。

如图5所示的用户界面13中,选择的水平角为0°,选择的俯仰角为30°。检测到针对“确认”控件121b的操作,响应于该操作,终端可以获取该输入相对方位1。

在一些可能的情况下,该针对“确认”控件121b的操作,可以看作一种确定相对方位1的操作。

S103.终端向耳机发送调试音频1,该调试音频1的声像方位对应相对方位1。

在相对方位1确定之后,终端可以向耳机发送该相对方位1对应的调试音频(调试音频1)。该调试音频1的声像方位对应相对方位1。

其中,终端得到调试音频1的方法包括但不限于以下方式。

方式1:终端可以基于该相对方位1对应的传递函数对预设音频进行滤波处理,得到调试音频1(相对方位1对应的调试音频)。该滤波处理可以包括:增强预设音频中相对方位1所在方向上音频的能量,抑制预设音频中其他方向上音频的能量,使得处理后的音频(调试音频1)听起来是从相对方位1传播来的,即,使得该调试音频1对应的声像方位为相对方位1。

方式2:终端可以预先存储不同相对方位对应的调试音频。在确定相对方位1之后,获取该相对方位1对应的调试音频(调试音频1)。

S104.耳机播放该调试音频1。

如图5所示,在相对方位1确定之后,耳机可以播放基于该相对方位1确定的调试音频1。

在播放该调试音频1之后,耳机还可以采集(录制)该播放后的调试音频1,得到已播放音频1。然后,执行下述步骤S105。将该已播放音频1发送至终端。

S105.耳机向终端发送已播放音频1,该已播放音频1是耳机采集播放后的调试音频1所得到的音频。

S106.终端基于相对方位1确定调试音频1与已播放音频1对应的方位误差是否大于预设误差1,且,调试音频1的播放次数是否小于预设阈值1。

其中,预设误差1可以为1°-5°,例如5°等。该预设阈值为大于等于2的整数,例如可以为2或者3等。通常可以为2。

在一些可能的情况下,调试音频1的播放次数小于预设阈值时,终端可以基于相对方位1结合该已播放音频1确定该调试音频1与已播放音频1对应的方位误差是否大于预设误差1。该调试音频1对应的方位即为相对方位1,已播放音频1对应的方位即为该已播放音频1对应的声像方位。这里认为在已播放音频1对应的声像方位与相对方位1误差小于预设误差1时,表示耳机佩戴情况良好,即耳机与佩戴者耳朵接触良好(耳机处于正常佩戴的状态)。这里认为在已播放音频1对应的声像方位与相对方位1误差大于预设误差1时,表示耳机佩戴情况差(耳机处于非正常佩戴的状态),即耳机与佩戴者耳朵接触不良。在确定耳机处于正常佩戴的状态(佩态状态)时,终端可以执行下述步骤S108以使得佩戴者可以通过终端选择该相对方位1对应的听感方位。在耳机处于非正常佩戴的状态时,终端可以执行下述步骤S107以使得耳机变更为正常佩戴的状态。

该调试音频1与已播放音频1对应的方位误差小于等于预设误差1,或者,调试音频1的播放次数大于或者等于预设阈值时,表示耳机的佩态状态被调整过或者可以不调整该耳机的佩戴状态。终端可以直接执行下述步骤S108以使得佩戴者可以通过终端选择该相对方位1对应的听感方位。

图6示出了确定调试音频1与已播放音频1对应的方位误差的示例性流程图。

其中,终端基于相对方位1确定调试音频1与已播放音频1对应的方位误差是否大于预设误差1的过程可以参考下述描述。关于该过程的详细内容,可以参考下述对步骤S10到步骤S16的描述。

S10.终端分别基于Q个预设方位对应的传递函数对预设音频进行滤波处理,得到Q个预设方位对应的调试音频(共计Q个调试音频)。

预设方位为终端中纪录的传递函数已知的相对方位。

Q个预设方位对应的传递函数是在预先设置在终端中的。其中,确定Q个预设方位的一种设置方式包括:在预设方位中包括水平角以及俯仰角的情况下,可以每隔5°取一个角度作为可选择的水平角,每隔5°取一个角度作为可选择的俯仰角。将可选择的水平角以及可选择的俯仰角进行组合作为Q个预设方位。其中,5°是举例说明,实际应用中可以为其他角度,例如10°、20°等。本申请实施例对此不作限定。

该Q个预设方位中可以包括预设方位A,基于预设方位A对应的传递函数对预设音频进行滤波处理,得到该预设方位A对应的调试音频的过程包括:基于该预设方位A对应的传递函数与该预设音频相乘,进而得到该预设方位A对应的调试音频。这样,可以增强预设音频中预设方位A所在方向上音频的能量,抑制预设音频中其他方向上音频的能量,使得处理后的音频(预设方位A对应的调试音频)听起来是从预设方位A传播来的,即,使得预设方位A对应的调试音频的声像方位为预设方位A。其中,预设方位A为Q个预设方位中的任意一个预设方位。

应该理解的是,前述涉及的相对方位1也可以为Q个预设方位中的任意一个预设方位。

其中,此处预设方位对应的传递函数也可以为前述涉及的头相关传递函数。该Q个预设方位对应的传递函数是预先设置好,然后置于终端中的。一个预设方位对应的传递函数可以用于描述将音频按照该预设方位传播时到达佩戴者头部的情况。

在一些可能的情况下,可以基于常用的HRTF数据库来确定Q个预设方位与音频之间的映射关系(即传递函数)。这样,可以使得Q个预设方位对应的传递函数更具有普适性。其中,常用的HRTF数据库包括但不限于CIPIC、MIT、TU-Berlin、SCUT等中的一个或者多个。

基于前述公式(1)可知,在确定预设方位对应的传递函数时,包括的一个参数s为不同类型的佩戴者具有个性化的参量,例如头部的尺寸等。这里为了使得Q个预设方位对应的传递函数更具有普适性,确定Q个预设方位对应的传递函数时,可以使用标准人工头确定公式(1)与佩戴者头部相关的参数。其中,标准人工头包括但不限于GRAS KEMAR人工头。

应该理解的是,Q个预设方位的一种设置方式包括:在预设方位中包括水平角以及俯仰角的情况下,可以每隔5°取一个角度作为可选择的水平角,每隔5°取一个角度作为可选择的俯仰角。其中5°为一种示例性说明,实际应用中还可以为其他的角度,例如10°等,本申请实施例对此不做限定。可以通过三维转动设备,控制人工头按照特征速度和角度转动,得到Q个预设方位,并确定每一个预设方位对应的传递函数。

S11.终端对该Q个调试音频进行特征提取,得到每一个调试音频对应的双耳互相关特征。

任一调试音频中可以包括左声道音频以及右声道音频。该双耳互相关特征(interaural correlation coefficient,IACC)可以看作调试音频对应的特征,包括但不限于左右声道音频的时间差、左右声道音频的声级差、左右声道音频的声压谱变化等参数中的一个或者多个。

其中,左右声道音频的时间差可以理解为左声道音频分别到达人耳的时间差。左右声道音频的声级差可以理解为左声道音频分别到达人耳的声级差。左右声道音频的声压谱变化可以理解为左声道音频分别到达人耳的声压谱差别。

例如,终端可以对预设方位A对应的调试音频(调试音频A)进行特征提取,得到调试音频A对应的双耳互相关特征,记为双耳互相关特征A。该双耳互相关特征A可以用于指示该预设方位A上音频对应的特征。

S12.终端将Q个调试音频对应的双耳互相关特征分别与每一个调试音频对应的预设方位相对应,得到预设方位与双耳互相关特征的对应关系(方位-特征对应关系),该方位-特征对应关系中包括Q个双耳互相关特征以及每一个双耳互相关特征对应的预设方位。

例如,终端可以将预设方位A对应的双耳互相关特征以及该预设方位A对应,并记录到方位-特征对应关系中。

S13.终端对已播放音频1进行特征提取,得到该已播放音频1对应的双耳互相关特征(双耳互相关特征1)。

该已播放音频1中可以包括耳机采集的播放后的左声道音频以及播放后的右声道音频。双耳互相关特征1中可以包括已播放音频1对应的特征,包括但不限于左右声道音频的时间差、左右声道音频的声级差、左右声道音频的声压谱变化等参数中的一个或者多个。

S14.终端确定Q个双耳互相关特征中的目标双耳互相关特征,该目标双耳互相关特征与该双耳互相关特征1相似性最大。

终端分别确定Q个双耳互相关特征与该双耳互相关特征1的相似性,将Q个双耳互相关特征中与该双耳互相关特征1的相似性最大的一个双耳互相关特征作为目标双耳互相关特征。

其中,双耳互相关特征A与该双耳互相关特征1之间的相似性可以表示为双耳互相关特征A与该双耳互相关特征1之间的距离,距离越小则相似性越大。该距离可以利用两个特征间全部参数(时间差、声级差以及声压谱变化等)的距离之和进行表示。一个参数的距离可以表示为两个特征中该参数的差值。

S15.终端将该目标双耳互相关特征对应的预设方位作为已播放音频1对应的方位。

终端可以通过方位-特征对应关系确定该目标双耳互相关特征对应的预设方位。将该目标双耳互相关特征对应的预设方位作为已播放音频1对应的方位(声像方位)。

S16.终端将相对方位1与已播放音频1对应的方位间的误差作为调试音频1与已播放音频1对应的方位误差。

应该理解的是,在终端执行前述步骤S103-步骤S106中任一步骤之后,终端还可以显示图7中(1)所示的用户界面14,以提示耳机正在播放所选相对方位对应的音频,佩戴者可以确定该相对方位对应的听感音频。例如,该用户界面14中可以包括提示框141。该提示框141可以包括提示信息:“正在播放所选相对方位对应的音频,确定听感方位后可点击‘暂停’进入后续流程”。该用户界面14中还可以包括“取消”控件141a以及“暂停”控件141b。其中,该“取消”控件141a可以用于关闭该提示框141,并停止音频设置。该“暂停”控件141b可以使得通知耳机暂时停止播放音频。同时进行后续流程。后续流程可以为步骤S107或者步骤S108中涉及的内容。下面结合图7中(2)涉及的用户界面15a对步骤S107进行描述,以及结合图7中(3)涉及的用户界面15b对步骤S108进行描述。

S107.终端确定耳机变更为正常佩戴的状态。

在调试音频1与已播放音频1对应的方位误差大于预设误差1,且,调试音频1的播放次数小于预设阈值1的情况下,终端可以提示佩戴者重新佩戴耳机以使得耳机变更为正常佩戴的状态。

该情况下,如图7中(1)所示,响应于针对“暂停”控件141b的操作,终端还可以显示图7中(2)所示的用户界面15a。该用户界面15a中可以包括提示框151。该提示框151中可以包括提示信息提示佩戴者重新佩戴耳机。例如,该提示信息涉及的内容可以为:“请正常佩戴耳机,若正常佩戴耳机请点击“完成”进入后续流程,点击“取消”结束方位设置”。

响应于针对“完成”控件151b的操作,终端可以确定耳机已变更为正常佩戴的状态。后续,终端可以再次执行前述涉及的步骤S103-步骤S107使得耳机重新播放调试音频1,使得佩戴者可以重新感受该调试音频1对应的方位,进而得到该相对方位1对应的渲染方位。

在一些可能的情况下,前述涉及的步骤S105-步骤S107是可选的,终端在执行了步骤S103之后,可以直接执行步骤S108。

S108.终端显示用户界面A2,该用户界面A2用于设置该相对方位对应的渲染方位,检测到输入听感方位1的操作,将方位对应关系中,该相对方位1对应的渲染方位设置为听感方位1。

在调试音频1与已播放音频1对应的方位误差小于等于预设误差1,或者,调试音频1的播放次数大于等于预设阈值1的情况下,一种可能的实现方式中,终端可以提示佩戴者输入听感方位,将该输入的听感方位设置为该相对方位1对应的渲染方位。并将该相对方位1对应的渲染方位记录到方位对应关系中。

该情况下,如图7中(1)所示,响应于针对“暂停”控件141b的操作,终端还可以显示图7中(3)所示的用户界面15b。该用户界面15b可以用于佩戴者输入听感方位。

这里应该理解的是,该用户界面15b可以看作一种用户界面A2。

如图7中(3)所示,该用户界面15b中编辑框152。该编辑框152可以用于佩戴者输入听感方位。例如,可以选择听感方位中水平角为0°,俯仰角为40°。关于该编辑框152的描述还可以参考前述对编辑框121的描述,此处不再赘述。

响应于针对“确认”控件152a的操作,终端可以将输入的听感方位设置为相对方位1对应的渲染方位设置。这里相对方位1为(0°,30°),其对应的渲染方位为(0°,40°)。

在一些可能的情况下,在编辑听感方位时,佩戴者可选择的水平角以及可选择的俯仰角来自预设方位。

这里应该理解的是,该方位对应关系中,除了记录相对方位1对应的渲染方位以外。还可以记录其他相对方位及其对应的渲染方位。例如,步骤S108执行完成之后,终端可以再次执行步骤S102-步骤S107,确定其他方位及其对应的渲染方位。对于该过程的描述可以参考前述内容,此处不再赘述。

在一些可能的情况下,一个终端对应一个方位对应关系,连接不同耳机时,该方位对应关系仍然适用。

在一些可能的情况下,一个方位对应关系还可以与一个耳机标识对应。该耳机标识用于唯一标识一个耳机,不同耳机对应的方位对应关系可以独立进行设置:终端连接不同耳机时,可以获取该耳机标识所对应的方位对应关系,将相对方位与其对应的渲染方位存储在该耳机对应的方位对应关系中。

在一些可能的情况下,除了通过用户界面A2获取输入的相对方位以外。还可以有其他的方式,例如通过语音输入,本申请实施例对此不作限定。

S109.耳机向终端发送方位信息,该方位信息中包括在时间A的相对方位(相对方位A),该相对方位A取值等于听感方位1。

时间A,在佩戴者头部转动使得头部相对于参考声源的方位发生改变的情况下,耳机可以获取此时方位信息,该方位信息中在时间A的相对方位(相对方位A),该相对方位A描述了佩戴者头部在时间A相对于参考声源的方位。

这里以相对方位取值等于前述涉及的听感方位1为例,实际情况中,该相对方位还可以为其他方位,本申请实施例对此不做限定。

S110.基于方位对应关系,确定该相对方位1对应的渲染方位为该相对方位A,基于相对方位1对应的传递函数对待播放音频进行滤波处理,得到处理后的音频,该处理后的音频的声像方位对应相对方位1。

在终端对应一个方位对应关系的情况下,终端可以基于该方位对应关系,确定该相对方位1对应的渲染方位为该相对方位A,基于相对方位1对应的传递函数对待播放音频进行滤波处理,得到处理后的音频,该处理后的音频的声像方位对应相对方位1。

在一些可能的情况下,该处理后的音频也可以被称为已处理音频。

在一个方位对应关系与一个耳机标识对应的情况下,终端获取耳机对应的耳机标识,基于该耳机标识所对应的方位对应关系,确定该相对方位1对应的渲染方位为该相对方位A,基于相对方位1对应的传递函数对待播放音频进行滤波处理,得到处理后的音频,该处理后的音频的声像方位对应相对方位1。

在一些可能的情况下,该相对方位1对应的渲染方位为该相对方位A可以包括:该相对方位1对应的渲染方位等于该相对方位A。或者,该相对方位1对应的渲染方位最接近该相对方位A,且,该相对方位1对应的渲染方位与该小于预设误差2。

其中,在渲染方位中包括俯仰角和水平角时,该相对方位1对应的渲染方位与该相对方位A的误差小于预设误差2包括:渲染方位中的水平角与相对方位A中的水平角小于预设误差2,以及,渲染方位中的俯仰角与相对方位A中的俯仰角小于预设误差2。

该相对方位1对应的渲染方位最接近该相对方位A包括:方位对应关系中记录的全部渲染方位中,与该相对方位A的误差最小的渲染方位为该相对方位1对应的渲染方位。在渲染方位中包括俯仰角和水平角时,渲染方位与相对方位A的误差等于:渲染方位中的水平角与相对方位A中的水平角之差的绝对值加上渲染方位中的俯仰角与相对方位A中的俯仰角之差的绝对值。

其中,关于对音频进行滤波处理的相关内容可以参考前述内容,此处不再赘述。

S111.终端向耳机发送该处理后的音频。

S112.耳机播放该处理后的音频。

该处理后的音频对应的声像方位对应相对方位1。由于相对方位1在佩戴者的主观认知中对应听感方位1,而听感方位1即为相对方位A,则可以使得佩戴者认为当前播放的音频对应的方位(听感方位)与头部转动后的相对方位匹配。

这里应该理解的是,前述步骤S109-步骤S112中是以相对方位A取值等于听感方位1为例进行说明的。在实际情况中,该相对方位A还可以为其他的取值。在该相对方位为其他取值的情况下,终端在方位对应关系中未确定该相对方位A对应的渲染方位时,终端可以基于该相对方位A对应的传递函数对待播放音频进行滤波处理,得到处理后的音频,该处理后的音频的声像方位对应相对方位A。

图8示出了本申请实施例中处理声像方位时涉及的另一个示例性流程图。

实施本申请中处理声像方位的过程还可以参考下述对步骤S201-步骤S205的描述。

S201.终端分别向耳机发送各预设方位对应的调试音频。

在终端与耳机建立连接之后。终端可以开启方位调试,按照预设周期向耳机发送各预设方位对应的调试音频。

该预设周期包括30秒发送一个预设方位对应的调试音频。其中,30秒是举例说明,实际情况中,还可以为其他的时间,例如20秒等。不应该构成对本申请实施例的限定。在发送一个预设方位(预设方位B1)之后,发送另外一个预设方位之前。终端可以获取佩戴者输入的该预设方位B1对应的听感方位。该过程可以参考前述对步骤S108以及图7中(3)所示内容的描述。

其中,方位调试包括:播放预设方位对应的调试音频,为佩戴者提供输入听感方位,将该听感方位作为该预设方位对应的渲染方位的功能。

在一些可能的情况下,终端可以为佩戴者提供退出方位调试的功能。

S202a.耳机播放调试音频。

耳机接收到终端发送的调试音频之后,即可播放该调试音频。

应该理解的是,此处,耳机可以按照预设周期接收到各调试音频,然后播放各调试音频。

S202b.耳机录制播放后的调试音频,得到已播放音频。

耳机在得到已播放音频之后,将该已播放音频发送至终端。终端在接收到已播放音频之后,可以执行下述步骤S202c确定方位误差,在方位误差较大(例如大于预设误差1)时,可以提示用户重新佩戴耳机。然后在下一个周期,可以重新给耳机发送该前一次发送的调试音频。在方位误差较小(例如小于预设误差1)时,可以在下一个周期,给耳机发送该下一个预设方位对应的调试音频。

这里可以设置同一个预设方位对应的调试音频可以被发送至耳机的次数小于等于T次。该T为大于等于1的整数,例如T可以等于1。

S202c.IACC特征分析确定方位误差。

该过程即是基于预设方位确定该预设方位对应的调试音频与该调试音频对应的已播放音频之间的方位误差。对该过程的描述可以参考前述对步骤S106的描述,此处不再赘述。

S203.佩戴者反馈听感方位。

佩戴者可以通过终端输入当前调试的预设方位对应的听感方位。

S204.得到方位对应关系。

终端可以将该当前调试的预设方位对应的渲染方位设置为听感方位,记录在方位对应关系中。

关于步骤S203以及步骤S204的描述可以参考前述对步骤S108的描述,此处不再赘述。

S205.基于方位对应关系实现定制化音频播放。

后续,佩戴者的头部相对于参考声源的相对方位改变时,在方位对应关系中记录了改变后的相对方位对应的渲染方位时,基于该渲染方位对音频进行滤波处理,使得该处理后的音频对应的声像方位可以为该渲染方位。然后,通过耳机播放该处理后的音频,即可使得佩戴者的听感方位为该改变后的相对方位。这样,可以使得佩戴者的听感方位与相对方位匹配,消除不同用户的方位感偏差。

下面介绍本申请实施例提供的示例性系统。

图9是本申请实施例提供的系统的结构示意图。

如图9所示,该系统包括:终端、多个耳机,例如耳机301以及耳机302等,还可以包括其他耳机。

本申请实施例中的终端可以是搭载Android、华为鸿蒙系统(HuaweiHarmonyOS)、iOS、Microsoft或者其它操作系统的终端设备,例如智慧屏、手机、平板电脑、笔记本电脑、个人计算机、可穿戴设备如运动手环、运动手表、膝上型计算机(laptop)、具有触敏表面或触控面板的台式计算机等。例如,在图9所示的例子中,终端为手机。

耳机可以用于实现播放音频数据,该音频数据是终端传输给该耳机的。该耳机可以为无线耳机或者有线耳机等。例如,该耳机301以及耳机302都可以为无线耳机。该音频数据可以是语音以及音乐,也可以是其他类型的声音,本申请实施例对此不限定。

蓝牙用于为本申请实施例涉及的终端以及耳机提供各项服务,例如连接服务、通信服务以及传输服务等。

终端与各耳机可以通过蓝牙建立连接,然后进行通信以及数据传输。

例如,终端可以对各耳机进行查找,当查找到耳机301时,终端可以向耳机301发送建立连接的请求,耳机301接收到该请求后,可以与终端建立连接。然后,终端可以通过蓝牙向该耳机301发送音频数据,该耳机301接收到该音频数据后,可以播放该音频数据。例如该音频数据可以为前述涉及的调试音频等。

耳机还可以向终端发送佩戴者头部与参考音频的相对方位。

下面介绍本申请实施例提供的示例性耳机。

图10是本申请实施例提供的耳机的结构示意图。

应该理解的是,耳机可以具有比图中所示的更多的或者更少的部件,可以组合两个或多个的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

本申请实施例中,耳机可以包括处理器20、扬声器21、蓝牙通信处理模块22以及方位跟踪模块23等。

处理器20可以用于解析蓝牙通信处理模块22接收到的信号。该信号包括:终端发送的建立连接的请求等。

处理器20还可以用于生成蓝牙通信处理模块22向外发送的信号,该信号包括:将音频(例如已播放音频1)传输到终端的请求、佩戴者头部与参考音频的相对方位等。在一些实施中,处理器20中还可以设置存储器,用于存储指令。在一些实施例中,该指令可以包括:发送信号的指令等。

扬声器21,也称“喇叭”,用于输出音频数据。耳机可以通过扬声器21收听音乐,或收听通话等。

蓝牙通信处理模块22可以用于提供和终端建立连接,进行数据传输等服务。

方位跟踪模块23可以用于确定佩戴者头部与参考音频的相对方位。

下面介绍本申请实施例提供的示例性终端。

图11是本申请实施例提供的终端的结构示意图。

下面以终端为例对实施例进行具体说明。应该理解的是,终端可以具有比图中所示的更多的或者更少的部件,可以组合两个或多个的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

终端可以包括:处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。

可以理解的是,本申请实施例示意的结构并不构成对终端的具体限定。在本申请另一些实施例中,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。

其中,控制器可以是终端的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。

处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。

在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口等。

可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端的结构限定。在本申请另一些实施例中,终端也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。

充电管理模块140用于从充电器接收充电输入。

电源管理模块141用于连接电池142,充电管理模块140与处理器110。

终端的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。终端中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。

移动通信模块150可以提供应用在终端上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoise amplifier,LNA)等。

调制解调处理器可以包括调制器和解调器。

无线通信模块160可以提供应用在终端上的包括无线局域网(wireless localarea networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。

在一些实施例中,终端的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS)等等。

终端通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD)。显示面板还可以采用有机发光二极管(organiclight-emitting diode,OLED)等制造。在一些实施例中,终端可以包括1个或N个显示屏194,N为大于1的正整数。

终端可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。

摄像头193用于捕获静态图像或视频。

数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。

NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。

内部存储器121可以包括一个或多个随机存取存储器(random access memory,RAM)和一个或多个非易失性存储器(non-volatile memory,NVM)。

终端可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。

扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端可以通过扬声器170A收听音乐,或收听免提通话。

受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。

麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。

耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端平台(open mobile terminal platform,OMTP)标准接口,蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。

压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。

陀螺仪传感器180B可以用于确定终端的运动姿态。

气压传感器180C用于测量气压。

磁传感器180D包括霍尔传感器。

加速度传感器180E可检测终端在各个方向上(一般为三轴)加速度的大小。

距离传感器180F,用于测量距离。

接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。

环境光传感器180L用于感知环境光亮度。

指纹传感器180H用于采集指纹。终端可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。

温度传感器180J用于检测温度。

触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端的表面,与显示屏194所处的位置不同。

按键190包括开机键,音量键等。按键190可以是机械按键。

马达191可以产生振动提示。

指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。

SIM卡接口195用于连接SIM卡。

本申请实施例中,该处理器110可以调用内部存储器121中存储的计算机指令,以使得终端执行本申请实施例中的处理声像方位的方法。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

用户界面常用的表现形式是图形用户界面(graphic user interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。

上述实施例中所用,根据上下文,术语“当…时”可以被解释为意思是“如果…”或“在…后”或“响应于确定…”或“响应于检测到…”。类似地,根据上下文,短语“在确定…时”或“如果检测到(所陈述的条件或事件)”可以被解释为意思是“如果确定…”或“响应于确定…”或“在检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘)等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

相关技术
  • 一种多终端调度方法、信令冲突的处理方法、基站及终端
  • 一种移动终端多闹钟处理方法、移动终端及存储介质
  • 一种终端自干扰处理方法和用户终端
  • 一种井下数据采集终端、处理系统及处理方法
  • 一种图像处理方法、图像处理装置及终端设备
  • 声像方位感处理方法和装置
  • 声像方位感处理方法和装置
技术分类

06120115925118