掌桥专利:专业的专利平台
掌桥专利
首页

发声控制方法、头戴显示设备和计算机存储介质

文献发布时间:2023-06-19 18:37:28


发声控制方法、头戴显示设备和计算机存储介质

技术领域

本申请涉及声音处理技术领域,尤其涉及一种发声控制方法、头戴显示设备和计算机存储介质。

背景技术

目前市场上的VR(VirtualReality,虚拟现实技术)设备或者AR(AugmentedReality,增强现实)设备等头戴显示设备逐渐增多,头戴显示设备由于其沉浸式的感受,使得其在游戏及沉浸式电影的应用十分广泛,但受限于头戴显示设备轻量化的趋势,头戴显示设备在发声单元上的选择并不多,因而头戴显示设备在低频的表现并不好。例如由于头戴显示设备轻量化和自身发声模式的限制,头戴显示设备只能通过自身的喇叭单元进行发声,进而无法实现发声单元多样化和造成在低频的发声效果不佳。

因此,在上述方案的应用过程中,存在只能通过自身的喇叭单元进行发声的缺陷,进而造成了头戴显示设备在低频的发声效果不佳。

发明内容

本申请的主要目的在于提供一种发声控制方法、头戴显示设备和计算机存储介质,旨在解决头戴显示设备在低频的发声效果不佳的技术问题。

为实现上述目的,本申请提供一种发声控制方法,所述发声控制方法应用于头戴显示设备,所述发声控制方法的步骤包括:

接收至少一个音响的音响扫频信号,并根据各所述音响扫频信号确定低音发声音响;

基于预存的目标频响确定所述音响扫频信号对应的修正曲线,并将各所述音响扫频信号对应的修正曲线汇总得到修正曲线集;

根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息,根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制。

可选地,所述根据各所述音响扫频信号确定低音发声音响的步骤包括:

依次确定所述音响扫频信号对应的低音性能曲线,并检测所述低音性能曲线是否与预存的最优低音性能曲线匹配,其中,通过对所述音响扫频信号进行傅里叶变换得到性能曲线,所述低音性能曲线为所述性能曲线中频率值小于预设频率值的曲线;

若匹配,则确定与所述最优低音性能曲线匹配的音响扫频信号对应的音响作为低音发声音响。

可选地,所述基于预存的目标频响确定所述音响扫频信号对应的修正曲线的步骤包括:

确定所述音响扫频信号对应的中高音性能曲线,并确定所述中高音性能曲线对应的音响频响,其中,所述中高音性能曲线为所述性能曲线中频率值大于等于预设频率值的曲线;

确定所述音响频响与预存的目标频响之间的差值作为修正虚线;

接收所述修正虚线对应的音响发声信号,根据所述音响发声信号和所述修正虚线进行发声控制得到修正曲线。

可选地,所述根据所述音响发声信号和所述修正虚线进行发声控制得到修正曲线的步骤包括:

确定所述音响发声信号中的中高音性能曲线,并基于所述修正虚线对所述中高音性能曲线进行频响校准得到发声频响;

检测所述发声频响与所述目标频响的差值是否小于预设值;

若小于预设值,则确定所述修正虚线为修正曲线。

可选地,所述根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息的步骤之前包括:

确定所述音响扫频信号对应高频声压信息,确定所述高频声压信息中最大声压方向为音响角度位置;

获取第一延迟值,其中所述第一延迟值是初始位置的播放指令的时间与接收指令的时间之间的时间延时值;

获取第二延迟值,其中所述第二延迟值是终点位置的播放指令的时间与接收指令的时间之间的时间延时值;

将所述第一延迟值与所述第二延迟值之间差值作为指令收发延时值;

所述根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息的步骤包括:

确定采集的指令收发延时值对应的音响距离,并将所述音响角度位置对应的所述音响距离作为所述音响扫频信号对应音响位置信息。

可选地,所述根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制的步骤包括:

确定待播放音频对应的发声需求,并检测所述发声需求是否为中高音发声需求;

若所述发声需求是中高音发声需求,则接收所述音响发送的中高音频响,并确定所述中高音频响在所述修正曲线集中的目标修正曲线,基于所述音响位置信息和所述目标修正曲线对所述中高音频响进行频响校准,以进行中高音发声;

若所述发声需求不是中高音发声需求,则控制所述低音发声音响进行音响低音发声。

可选地,所述接收多个音响的音响扫频信号的步骤之前包括:

与多个音响的蓝牙建立蓝牙连接;

基于所述蓝牙连接依次对所述音响发送音响扫频信号需求指令;

所述接收多个音响的音响扫频信号的步骤包括:

接收多个音响基于所述音响扫频信号需求指令生成的音响扫频信号。

可选地,所述接收多个音响的音响扫频信号的步骤之后,所述方法还包括:

根据各所述音响扫频信号确定个性音发声音响;

基于预存的个性目标频响确定所述个性音发声音响对应的个性修正曲线;

根据采集的个性指令收发延时值确定所述个性音发声音响对应个性音响位置信息,根据所述个性音响位置信息和所述个性修正曲线进行发声控制。

本申请还提供一种头戴显示设备,所述头戴显示设备为实体设备,所述头戴显示设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述发声控制方法的程序,所述发声控制方法的程序被处理器执行时可实现如上述的发声控制方法的步骤。

本申请还提供一种计算机存储介质所述计算机存储介质上存储有实现发声控制方法的程序,所述实现发声控制方法的程序被处理器执行以实现如上述发声控制方法的步骤。

本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的发声控制方法的步骤。

本申请的技术方案是通过接收多个音响的音响扫频信号,并根据各所述音响扫频信号确定低音发声音响;基于预存的目标频响确定所述音响扫频信号对应的修正曲线,并将各所述音响扫频信号对应的修正曲线汇总得到修正曲线集;根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息,根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制,以使该头戴显示设备根据所述音响位置信息和所述修正曲线集进行中高音发声和根据低音发声音响进行低音发声,从而达到提高头戴显示设备在低频的发声效果的目的。

现有通过蓝牙和音箱建立起立体声系统,对于头戴显示设备例如VR类产品和音箱建立立体声系统,一方面,相对于传统立体声音箱,音箱的声学性能不会随着人体的移动而变化,而VR类产品由于IMU(Inertialmeasurementunit,惯性测量单元)及摄像头的存在,可以很好的捕捉人体的移动及所处的方位,因此实时的校准会让人获得更加真实的声音环境。另一方面,由于音箱的发声单元更为多样化,有高音单元、中音单元及低音单元。

另外,由于用户一方面通过音响扫频信号确定低音发声音响,根据低音发声音响进行控制头戴显示设备实现低音发声,另一方面基于预存的目标频响确定所述音响扫频信号对应的修正曲线,进而确定音响的修正曲线集,还会确定音响扫频信号对应音响位置信息,最终根据音响位置信息和修正曲线集进行控制头戴显示设备实现中高音发声,也就是说,头戴显示设备可以通过低音发声音响实现低音发声,还可以通过头戴显示设备中的修正曲线集对音响中高发声进行修正实现中高音发声,并基于音响中高音发声以及修正曲线实现个性化发声,从而克服了头戴显示设备轻量化和自身发声模式的限制,头戴显示设备只能通过自身的喇叭单元进行发声,进而无法实现头戴显示设备发声单元多样化和造成头戴显示设备在低频的发声效果不佳的问题,使得本申请能最大程度的消除目前头戴显示设备的低音发声缺陷,进而通过音响与头戴显示设备内部喇叭单元共同发声,进而可以实现发声的个性化选择,以及通过低音音响发声提高头戴显示设备在低频的发声效果。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请发声控制方法第一实施例的流程示意图;

图2为本申请发声控制方法第二实施例的流程示意图;

图3为本申请一实施例中头戴显示设备与音响构建的场景示意图;

图4为本申请一实施例中头戴显示设备进行音响发声校准流程示意图;

图5为本申请一实施例中头戴显示设备进行个性音响发声校准流程示意图;

图6为本申请实施例中头戴显示设备涉及的硬件运行环境的设备结构示意图。

本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。

在本实施例中,本申请的头戴显示设备可以是例如混合现实(MixedReality)—MR设备(例如MR眼镜或者MR头盔)、增强现实(AugmentedReality)—AR设备(例如AR眼镜或者AR头盔)、虚拟现实-(VirtualReality)—VR设备(例如VR眼镜或者VR头盔)、扩展现实(ExtendedReality)—XR设备或其某种组合。

目前,头戴显示设备由于受限于自身轻量化的发展趋势,头戴显示设备例如VR产品在喇叭上的选择并不多。因为受限自身安装空间的影响,故在喇叭的尺寸上的选择性不高,就会由于喇叭尺寸的原因造成VR产品在低频的表现并不好。例如用户在使用VR产品进行游戏时,就会造成VR产品在低音发声时的发声效果不佳,进而影响用户游戏体验。

实施例一

基于此,请参照图1,发声控制方法第一实施例的流程示意图,本实施例提供一种发声控制方法,所述发声控制方法应用于头戴显示设备,所述发声控制方法的步骤包括:

步骤S100,接收多个音响的音响扫频信号,并根据各所述音响扫频信号确定低音发声音响;

在本实施例中,通过建立VR设备与多个音响进行蓝牙连接的系统,进而对该系统的VR设备进行校准后实现发声控制。在校准过程中,通过接收多个音响的音响扫频信号,多个音响指代的是该系统的音响,该系统中含有多少个音响就会接收到多少个音响的音响扫频信号,音响扫频信号是指音响发送的从低频至高频,或者由高频至低频连续变化的信号。因为基于VR设备自身喇叭尺寸较小的影响,就会根据音响扫频信号确定低音发声音响,低音发声音响是指在本实施例VR设备中专用负责低音发声的音响。进而在VR设备需要进行低音发声是通过蓝牙控制低音发声音响进行发声,进而避免现有VR设备在低音频段发声效果较差的现象。

步骤S200,基于预存的目标频响确定所述音响扫频信号对应的修正曲线,并将各所述音响扫频信号对应的修正曲线汇总得到修正曲线集;

在本实施例中,确定低音发声音响之后,就会对中高音进行发声校准。通过预存的目标频响依次确定音响扫频信号对应的修正曲线,并将全部音响扫频信号对应的修正曲线汇总得到修正曲线集后,就会将得到的修正曲线集写入VR设备的均衡器,以便于之后处理音响中高音时进行调用。目标频响是指VR设备内部喇叭发声得到的频响,修正曲线对音响的中高音的频响进行修正的声音曲线,修正曲线集是指所有音响扫频信号对应的音响的中高音的修正曲线,因为中高音由音响和VR设备内部的喇叭单元进行共同发声,故需要对音响的中高音进行修正曲线修正在与VR设备内部的喇叭单元进行共同发声。另一方面,中高音出现相位差甚至强于强度差,所以高音的方向性强,故需要对中高音进行位置及角度确定,以调整音响的中高音,提高VR设备的真实模拟性能。

步骤S300,根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息,根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制。

在本实施例中,因为上述的中高音出现相位差甚至强于强度差,所以中高音的方向性强的原因,故需要根据采集的指令收发延时值确定音响扫频信号对应音响位置信息,也就是说通过指令收发延时值确定音响扫频信号对应音响的位置信息。指令收发延时值是指开始位置和无限接近终点位置时两者指令收发延时的差值,进而可以根据声音的特性计算出音响距离开始位置的距离,以及还会通过高频声音确定音响与开始位置的角度,也就是音响在开始位置的方位信息。最终,就会根据音响位置信息和修正曲线集实现VR设备的中高音发声控制,实现了音响与VR设备的联合发声,提高了VR设备发声单元的多样化;通过低音发声音响实现VR设备的低音发声控制,进而比避免了现有技术VR设备低音发声效果不佳的问题。

本申请的技术方案是通过接收多个音响的音响扫频信号,并根据各所述音响扫频信号确定低音发声音响;基于预存的目标频响确定所述音响扫频信号对应的修正曲线,并将各所述音响扫频信号对应的修正曲线汇总得到修正曲线集;根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息,根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制,以使该头戴显示设备根据所述音响位置信息和所述修正曲线集进行中高音发声和根据低音发声音响进行低音发声,从而达到提高头戴显示设备在低频的发声效果的目的。

现有通过蓝牙和音箱建立起立体声系统,对于头戴显示设备例如VR类产品和音箱建立立体声系统,一方面,相对于传统立体声音箱,音箱的声学性能不会随着人体的移动而变化,而VR类产品由于IMU(Inertialmeasurementunit,惯性测量单元)及摄像头的存在,可以很好的捕捉人体的移动及所处的方位,因此实时的校准会让人获得更加真实的声音环境。另一方面,由于音箱的发声单元更为多样化,有高音单元、中音单元及低音单元。

另外,由于用户一方面通过音响扫频信号确定低音发声音响,根据低音发声音响进行控制头戴显示设备实现低音发声,另一方面基于预存的目标频响确定所述音响扫频信号对应的修正曲线,进而确定音响的修正曲线集,还会确定音响扫频信号对应音响位置信息,最终根据音响位置信息和修正曲线集进行控制头戴显示设备实现中高音发声,也就是说,头戴显示设备可以通过低音发声音响实现低音发声,还可以通过头戴显示设备中的修正曲线集对音响中高发声进行修正实现中高音发声,并基于音响中高音发声以及修正曲线实现个性化发声,从而克服了头戴显示设备轻量化和自身发声模式的限制,头戴显示设备只能通过自身的喇叭单元进行发声,进而无法实现头戴显示设备发声单元多样化和造成头戴显示设备在低频的发声效果不佳的问题,使得本申请能最大程度的消除目前头戴显示设备的低音发声缺陷,进而通过音响与头戴显示设备内部喇叭单元共同发声,进而可以实现发声的个性化选择,以及通过低音音响发声提高头戴显示设备在低频的发声效果。

在一种可实施的方式中,所述根据各所述音响扫频信号确定低音发声音响的步骤包括:

步骤A10,依次确定所述音响扫频信号对应的低音性能曲线,并检测所述低音性能曲线是否与预存的最优低音性能曲线匹配,其中,通过对所述音响扫频信号进行傅里叶变换得到性能曲线,所述低音性能曲线为所述性能曲线中频率值小于预设频率值的曲线;

步骤A20,若匹配,则确定与所述最优低音性能曲线匹配的音响扫频信号对应的音响作为低音发声音响。

在本实施例中,因为VR设备低音发声的效果不佳的问题,故通过蓝牙与音响连接,进而实现控制音响进行低音发声以避免VR设备低音发声的效果不佳的问题。

通过接收到音响扫频信号之后,通过依次对音响扫频信号进行傅里叶变换得到其中的低音性能曲线(通过得到性能曲线,将性能曲线中频率值小于预设频率值的曲线作为低音性能曲线),检测低音性能曲线是否与预存的最优低音性能曲线匹配,当两者匹配时,就会确定与最优低音性能曲线匹配的音响扫频信号对应的音响作为低音发声音响。也就是说,在多个音响扫频信号确定与最优低音性能曲线匹配的音响扫频信号对应的音响,并将该音响作为低音发声音响,进而在后续控制中控制该音响进行低音发声。低音性能曲线是指音响在低音发声时的发声曲线,最优低音性能曲线是指低音效果符合要求的的低音曲线,匹配是指低音性能曲线符合最优低音性能曲线的曲线要求。例如,最优低音性能曲线是曲线A,而低音性能曲线是曲线B,若曲线B的低音效果可以比曲线A效果强,则确定低音性能曲线与最优低音性能曲线匹配,低音效果可以是看曲线的圆滑度、稳定性等。

所述检测所述低音性能曲线是否与预存的最优低音性能曲线匹配的步骤之后包括:

步骤A30,确定预存的设备低音性能曲线,并检测所述低音性能曲线是否与设备低音性能曲线匹配;

步骤A40,若匹配,则确定与所述设备低音性能曲线匹配的音响扫频信号对应的音响作为低音发声音响。

当不存在与所述最优低音性能曲线匹配的音响扫频信号时,就会确定预存的设备低音性能曲线,通过检测低音性能曲线是否与设备低音性能曲线匹配。当两者不匹配时,则结束确定低音发声音响,继续使用VR设备进行低音发声;当两者匹配时,就会确定与设备低音性能曲线匹配的音响扫频信号对应的音响作为低音发声音响。设备低音性能曲线是指VR设备自身的低音性能曲线,通过确定与设备低音性能曲线匹配的低音发声音响进行低音发声,进而可以有效通过VR设备的低音发声效果。

进一步地,在一种可能的实施方式中,所述基于预存的目标频响确定所述音响扫频信号对应的修正曲线的步骤包括:

步骤B10,确定所述音响扫频信号中的中高音性能曲线,并确定所述中高音性能曲线对应的音响频响,其中,所述中高音性能曲线为所述性能曲线中频率值大于等于预设频率值的曲线;

步骤B20,确定所述音响频响与预存的目标频响之间的差值作为修正虚线;

步骤B30,接收所述修正虚线对应的音响发声信号,根据所述音响发声信号和所述修正虚线进行发声控制得到修正曲线。

在本实施例中,当对VR设备的低音发声进行校准之后,就会对VR设备中高音进行校准。因为中高音的发声要求(所述中高音性能曲线为所述性能曲线中频率值大于等于预设频率值(可以是300hz)的曲线),也即是VR设备的中高音发声由VR设备的喇叭单元和音响的中高音共同发声,故为防止两者发声的不统一性,进而需要对音响的中高音进行修正,进而与VR设备的喇叭单元共同实现中高音发声。通过对音响扫频信号进行傅里叶变换得到其中的中高音性能曲线,并确定中高音性能曲线对应的音响频响,就会将音响频响与预存的目标频响之间的差值作为修正虚线,也就是确定中高音性能曲线的频响与VR设备内部喇叭单元发声中高音的目标频响之间的差值。其中,中高音性能曲线是指音响扫频信号中中高音对应的声音曲线,音响频响是指中高音性能曲线对应的中高音的频响,目标频响是指VR设备内部喇叭单元发声中高音的频响,修正虚线是指为进行校准的修正曲线,只有当修正虚线校准合格之后才会确定修正虚线为修正曲线。确定修正虚线之后就会对修正虚线进行校准进而得到修正曲线。

所述确定所述音响频响与预存的目标频响之间的差值作为修正虚线的步骤之后包括:

步骤B21,确定所述修正虚线对应的目标音响,并基于所述修正虚线生成发声需求指令;

步骤B22,将所述发声需求指令发送至所述目标音响。

在本实施例中,对修正虚线进行校准的方式是通过确定修正虚线对应的目标音响,也就会确定得到修正虚线的音响扫频信号,进而可以确定修正虚线对应的目标音响。因为需要校准修正虚线的缘故,故在得到修正虚线之后,就会生成发声需求指令,进而通过发声需求指令控制目标音响进行发声,并接收基于修正虚线的发声需求指令而促使目标音响进行发声并发送的音响发声信号。其中,目标音响是指修正虚线对应的音响,发声需求指令是指通过蓝牙控制该目标音响进行发声的指令,音响发声信号是指音响基于发声需求指令进行发声进而传输至VR设备的声音信号。进一步的,该步骤还可以是基于所述修正虚线生成中高音发声需求指令,进而实现目标音响发出中高音信号,中高音发声需求指令是指控制音响发出中高音的指令。因为实际修正曲线校准的只有中高音,故可以直接向音响发出中高音的需求,在接收到音响发声信号或者中高音信号之后,就会根据音响发声信号或者中高音信号和修正虚线进行发声控制得到修正曲线,也就是进一步验证之前得到的修正虚线是否合格,通过实际发声的方式进行验证,进而可以保证修正曲线的准确性。

在另一种可能的实施方式中,所述根据所述音响发声信号和所述修正虚线进行发声控制得到修正曲线的步骤包括:

步骤C10,确定所述音响发声信号中的中高音性能曲线,并基于所述修正虚线对所述中高音性能曲线进行频响校准得到发声频响;

步骤C20,检测所述发声频响与所述目标频响的差值是否小于预设值;

步骤C30,若小于预设值,则确定所述修正虚线为修正曲线。

在本实施例中,在对修正虚线进行校准时,通过确定音响发声信号或者中高音信号中的中高音性能曲线,中高音性能曲线的确定方式与上述提及的中高音性能曲线确定方式相同,都是需要通过傅里叶变化得到。之后就会根据修正虚线对得到的中高音性能曲线进行频响校准得到发声频响,发声频响是指音响发声信号或者中高音信号经过修正虚线进行校准之后的中高音发声频响,并将发声频响与目标频响的差值与预设值进行判断,当差值小于预设值时,就会确定修正虚线是符合要求的,进而将修正虚线确定为修正曲线,发声频响与目标频响的差值是指两者在整个频率响应的差值,频响是指频率响应,预设值是指用户定义的最佳频响差值。反之当差值不小于预设值时,就会基于发声频响与预存的目标频响之间的差值作为修正虚线,进而执行接收所述修正虚线对应的音响发声信号的步骤。通过对修正虚线的校准进而可以保证确定的修正曲线的准确性,进而实现在VR设备中高音1控制的准确性。

进一步的,参照图4,图4为头戴显示设备进行音响发声校准流程示意图,通过确定音响数量,通过比较音响的音响扫频信号进而确定那个音响在低音的发声较好,则确定为低音音响,VR产品内部的喇叭模组进行发声,校准MIC(microphone,麦克风)进行收声,进而可以确定VR产品的目标频响。就会依次对每一个音响进行校准。以音响1为例,通过将音响1的音响扫频信号中的中高音的频响减去目标频响,就会获得该音响1的修正虚线,并存入均衡器EQ中。进而控制音响1再次发声,音响1在加载均衡器EQ中的修正虚线对再次发声进行频响分析,检测得到的发声频响与目标频响在全频段的差值是否在3dB以内,若在3dB以内则对音响1修正曲线校准完成。反之则再次确定音响1的再次发声的频响与目标频响的差,进而获得该音响1的修正虚线,直至发声频响与目标频响在全频段的差值在3dB以内,则对音响1修正曲线校准完成,并对其他音响进行修正曲线的校准,进而可以确定所有音响在中高音的修正曲线,进而在使用VR设备时可以对音响的中高音进行修正发声,实现中高音发声的准确性与真实性。

在一种可实施的方式中,所述根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息的步骤之前包括:

步骤D10,确定所述音响扫频信号对应高频声压信息,确定所述高频声压信息中最大声压方向为音响角度位置;

步骤D20,获取第一延迟值,其中所述第一延迟值是初始位置的播放指令的时间与接收指令的时间之间的时间延时值;

步骤D30,获取第二延迟值,其中所述第二延迟值是终点位置的播放指令的时间与接收指令的时间之间的时间延时值;

步骤D40,将所述第一延迟值与所述第二延迟值之间差值作为指令收发延时值。

在本实施例中,因为中高音接收时左右耳的声波,容易出现相位差甚至强于强度差,所以高音的方向性强。故需要对终点位置进行校准,进而可以保证中高音的方向性,提高用户使用VR设备时的中高音体验。通过确定音响扫频信号对应高频声压信息,高频声压信息是指在音响高频发声时不同方位的声压,当音响进行高频发声时,就会确定高频声压信息中最大声压方向为音响角度位置,音响角度位置是指音响的处于佩戴者的方向。并会基于音响角度位置确定佩戴者位置与音响之间的距离,通过确定初始位置的第一播放指令与第一接收指令的第一延迟值,同时确定终点位置的第二播放指令与第二接收指令的第二延迟值,最终将第一延迟值与所述第二延迟值之间差值作为指令收发延时值。初始位置是指佩戴者佩戴VR设备的位置,一般固定在一个位置开始使用VR设备,终点位置是指佩戴者佩戴终点位置无限接近音响,第一播放指令与第一接收指令是指佩戴者在初始位置发送的控制音响播放的指令与接收到音响播放声音的指令,第二播放指令与第二接收指令是指佩戴者在终点位置发送的控制音响播放的指令与接收到音响播放声音的指令,第一延迟值是指第一播放指令与第一接收指令之间的时间延时值,第二延迟值是指第二播放指令与第二接收指令之间的时间延时值,进而确定两个延迟值之间的差值作为指令收发延时值,通过终点位置和初始位置的延时值的确定,进而可以保证避免内部指令发送的延时时间影响距离确定,进而提高了距离确定的准确性。

所述根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息的步骤包括:

步骤D50,确定采集的指令收发延时值对应的音响距离,并将所述音响角度位置对应的所述音响距离作为所述音响扫频信号对应音响位置信息。

在本实施例中,通过确定的指令收发延时值对应的音响距离,其确定步骤是根据指令收发延时值与声音的传播速度就可以准确确定音响距离,音响距离是指初始位置到终点位置的距离。通过两个位置之间的指令收发延时值确定音响距离,进而可以避免实际指令收发以及内部指令处理以及内部延时造成的影响确定距离不准确的现象。最终就可以确定音响角度位置对应的所述音响距离作为所述音响扫频信号对应音响位置信息,也就是确定了音响在整个区域的角度及距离初始位置,进而可以实现音响发声与距离进行联系,提高了VR设备发声的真实性。还有一方面就是,当VR设备装载有摄像头时,就会直接通过摄像头确定音响位置信息,进而实现将音响位置信息与佩戴者移动结合,提高了VR设备发声的真实性。

在一种可能的实施方式中,所述根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制的步骤包括:

步骤E10,确定待播放音频对应的发声需求,并检测所述发声需求是否为中高音发声需求;

步骤E20,若所述发声需求是中高音发声需求,则接收所述音响发送的中高音频响,并确定所述中高音频响在所述修正曲线集中的目标修正曲线,基于所述音响位置信息和所述目标修正曲线对所述中高音频响进行频响校准,以进行中高音发声;

步骤E30,若所述发声需求不是中高音发声需求,则控制所述低音发声音响进行音响低音发声。

在本实施例中,当进行发声控制时,就会基于待播放音频确定发声需求,也就是说通过音响位置信息确定佩戴者在该位置需要音响发出多大分贝的声音,以及携带的发声需求,待播放音频是指需要播放的音频。发声需求是指控制音响需要何种声音,包括低音和中高音,而对于中高音才会有分贝要求。并在基于所述音响位置信息确定发声需求之前的步骤包括:

步骤E01,采集角度信息,基于所述角度信息对音响位置信息进行修正;

步骤E02,根据所述修正之后的音响位置信息更新所述音响位置信息。

在本实施例中,因用户每次佩戴时的位置可以进行固定,但实际角度会存在偏差,因而可以通过IMU确定角度信息,进而根据角度信息对音响位置信息进行修正,角度信息是指佩戴VR设备与校准时存在的角度。也就是说校准时的音响位置信息可能是正前方,此时默认角度信息为0度。当佩戴时采集角度信息为偏右30度时,就会修正音响位置信息为正前方偏左30度,进而可以将修正之后的音响位置信息对音响位置信息进行更新,进而保证每次使用时的音响位置信息的准确性,进而提高了后续中高音发声控制的准确性。这里还存在一个极端情况,用户可以在以音响为圆心的圆上开始佩戴,进而根据采集角度信息与提前校准得到高频声压信息中最大声压方向为音响角度位置进行更新音响位置信息。

通过检测发声需求是否为中高音发声需求,中高音发声需求就是指是否需要进行中高音发声的需要。当不需要进行中高音发声时,就会直接通过蓝牙控制低音发声音响进行音响低音发声,因低音的方位性不强,故低音发声音响的摆放位置不需要确定该音响的音响位置信息,但低音发声音响进行中高音发声时,则需要确定音响位置信息;反之需要进行中高音发声时,就会控制音响进行中高音发声时,并接收至少一个音响发送的中高音频响,这里以一个音响2为例,中高音频响是指中高音发声对应的频响。确定中高音频响在修正曲线集中的目标修正曲线,也就是确定该音响2在修正曲线集中的目标修正曲线,目标修正曲线是指音响2在之前校准中得到的修正曲线,就会基于目标修正曲线对中高音频响进行频响校准,以进行中高音发声。也就是说音响发出的中高音经过对应的修正曲线进行频响校准(对中高音频响进行修正)之后与VR设备内部的喇叭单元实现中高音发声,中高音发声是指音响中高音发声结合内部喇叭单元的中高音发声。一方面通过音响中高音发声结合内部喇叭单元进行中高音发声,实现了发声单元的多元化,另一方面可以直接通过低音发声音响进行音响低音发声进行提高了VR设备低音的发声效果。在基于所述目标修正曲线对所述中高音频响进行频响校准,以进行中高音发声的步骤之后,包括:

步骤E21,实时采集移动信息,基于所述移动信息和所述音响位置信息确定中高音控制指令;

步骤E22,基于所述中高音控制指令控制至少一个所述音响生成指定中高音频响;

步骤E23,基于所述目标修正曲线对所述指定中高音频响进行频响校准,以进行中高音发声。

在本实施例中,在实际VR设备的使用中,通过实时采集移动信息,并基于移动信息和音响位置信息确定中高音控制指令,移动信息是指佩戴者移动的距离,角度等信息,中高音控制指令是指控制中高音进行发声的指令。也就是说根据用户移动的距离以及角度,进而确定中高音应该的发声标准。例如,音响中高音发声在前方D米,用户向前直线移动了C米(C

在一种可能的实施方式中,所述接收多个音响的音响扫频信号的步骤之前包括:

步骤F10,与多个音响的蓝牙进行蓝牙连接;

步骤F20,基于所述蓝牙连接依次对所述音响发送音响扫频信号需求指令。

在本实施例中,在基于头戴显示设备与音响通过蓝牙连接建立的系统,通过开启头戴显示设备的蓝牙与音响的蓝牙进行蓝牙连接,进而可以实现整个系统的控制。通过与头戴显示设备蓝牙连接依次向音响发送音响扫频信号需求指令,音响扫频信号需求指令是指头戴显示设备需要音响生成并传输音响扫频信号的指令。接收到的音响就会生成音响扫频信号并传输至头戴显示设备,头戴显示设备基于接收的音响扫频信号进行校准,一方面通过音响扫频信号确定低音发声音响,进而实现低音发声,另一方面通过音响扫频信号对中高音的修正曲线以及音响位置信息进行确定,进而实现中高低音发声。

所述接收至少一个音响的音响扫频信号的步骤包括:

步骤F30,接收至少一个音响基于所述音响扫频信号需求指令生成的音响扫频信号。

在本实施例中,通过音响扫频信号需求指令发送至音响,音响进而反馈回来音响扫频信号,通过头戴显示设备接收至少一个音响基于音响扫频信号需求指令生成的音响扫频信号。至少一个音响指代的是与头戴显示设备蓝牙连接的音响,也即是音响与头戴显示设备组成的系统里面的音响,通过依次发送音响扫频信号需求指令至系统中的每一个音响,进而可以接收每一个音响发送的音响扫频信号。实现基于音响扫频信号对头戴显示设备低音和中高音发声的校准,进而提高头戴显示设备低音发声的效果。

实施例二

基于本申请第一实施例,在本申请另一实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,请参照图2,发声控制方法第二实施例的流程示意图,所述获取输入的全部音响扫频信号的步骤之后,所述方法还包括:

步骤S310,根据各所述音响扫频信号确定个性音发声音响;

在本实施例中,因为中高音发声结合了音响发声,故可以通过音响发声实现个性化的发声需求。通过音响扫频信号确定个性音发声音响,其实现流程与根据各所述音响扫频信号确定低音发声音响的流程一致。所述根据各所述音响扫频信号确定个性音发声音响对步骤包括:

步骤G10,依次确定所述音响扫频信号中的中高音性能曲线,并检测所述中高音性能曲线是否与预存的最优个性音性能曲线匹配,其中,通过对所述音响扫频信号进行傅里叶变换得到所述中高音性能曲线;

步骤G20,若匹配,则确定与所述最优个性音性能曲线匹配的音响扫频信号对应的音响作为个性音发声音响,主要检测中高音性能曲线经傅里叶变换之后的强度差和相位差是否符合最优个性音性能曲线中的强度差和相位差要求。只是个性音发声音响检测的是中高音性能曲线是否与预存的最优个性音性能曲线匹配,最优个性音性能曲线是指中高音效果符合要求的的中高音曲线,具体可以到实际中高音的某一个频率点,进而确定该频率点的个性音发声音响。也会存在步骤A30与步骤A40的流程,进而确定在某一频率的发声与设备在该频率的发声效果好就可以确定为个性音发声音响。个性音发声音响是指发出个性化中高音的音响,可以根据用户需求进行个性化中高音的发声,进而提高了VR设备的功能性以及提升用户体验与选择。

步骤S320,基于预存的个性目标频响确定所述个性音发声音响对应的个性修正曲线;

步骤S330,根据采集的个性指令收发延时值确定所述个性音发声音响对应个性音响位置信息,根据所述个性音响位置信息和所述个性修正曲线进行发声控制。

在本实施例中,确定个性音发声音响之后,就会基于预存的个性目标频响确定个性音发声音响对应的个性修正曲线。其实现步骤与第一实施例的步骤S200相同,只是存在个性目标频响为减数得到个性修正曲线而步骤S200则是目标频响为减数得到修正曲线。个性目标频响是指VR设备内部喇叭发声进行自定义的频响,例如目标频响为20dB,用户个性化就可以定义个性目标频响为10dB或者5dB。再通过采集的个性指令收发延时值确定性音发声音响对应个性音响位置信息,并根据个性音响位置信息和个性修正曲线进行发声控制,个性音响位置信息是指进行个性发声音响的位置,因为个性发声是属于中高音发声,故需要确定位置进行实现发声控制的真实性,个性指令收发延时值是指个性音发声音响收发指令的延时值。进而通过个性目标频响改变个性修正曲线来实现中高音的个性化发声,提高了VR设备发声多养化。

进一步,参照图5,图5为头戴显示设备进行个性音响发声校准流程示意图,当佩戴者选择个性化音频时,就会经过DSP(digitalsingnalprocessor,微处理器)处理分析频响的频率特性,并根据频率特性选择合适的音响设备,再次对选择的音响设备进行再校验。通过多个音响设备依次播放测试音频,校准MIC收到后根据傅里叶变换技术强度差和相位差,进而确定强度差和相位差是否符合要求。符合要求时,则确定选择合适的音响设备为个性发声音响,反之重新根据测试音频确定合适的音响设备,直到强度差和相位差是否符合要求,此步骤可以是获取输入的全部音响扫频信号的步骤之后进行个性化音响的校准以及控制。通过个性发声音响的确定可以对VR设备实现个性化发声,扩展了VR设备的发声的选择性。

在另一种可能的实施方式中,所述根据所述个性音响位置信息和所述个性修正曲线进行发声控制的步骤包括:

步骤K10,若接收到个性需求指令,则确定所述个性需求指令对应的目标个性音发声音响;

步骤K20,基于所述目标个性音发声音响进行个性发声。

在本实施例中,当用户在使用过程中,通过输入个性需求指令,VR设备就会根据个性需求指令对应的目标个性音发声音响,控制目标个性音发声音响进行发声并通过目标个性音发声音响对应的目标个性修正曲线进行修正,个性需求指令是指用户输入的选择个性化发声的指令,目标个性音发声音响是指用户个性化发声对应的音响。例如,个性需求指令是沉重高音,就会确定之前校准时确定的沉重高音对应的音响3,通过该音箱3进行发声。通过个性化发声控制实现VR设备的个性化发声,扩展了VR设备的功能性。

为了助于理解本申请的技术构思,列举一具体实施例:

本具体实施例涉及的头戴显示设备为VR设备,该VR设备通过计算机模拟生成三维空间中的虚拟世界。在Java或Quicktime、ActiveX、Flash等播放插件的支持下,实验者还可以对图像进行放大、缩小、旋转等操作,使用户体验到一般画面和三维造型无与伦比的真实感、立体感、沉浸感,本实施例将VR设备通过蓝牙和音箱建立起立体声系统,从而支持发声单元更为多样化,有高音单元、中音单元及低音单元。它的使用场景图如图3所示,头戴显示设备与音响构建的场景示意图。VR设备通过蓝牙与系统(系统内包括VR设备和多个音响)内的音响建立蓝牙连接,进而可以通过VR设备的蓝牙控制音响实现音响发声(低音由特定低音发声音响发声,中高音由VR设备的喇叭单元和音响的中高音共同发声),进而可以克服VR设备进行发声时在低音的效果不佳的信息,还可以通过音响发声扩展用户选择个性化发声的要求。在进行校准时通过蓝牙控制系统内的所有音响发出音响扫频信号,进而根据音响扫频信号确定低音发声音响和各个音响的修正曲线。并在修正时通过对所有音响进行位置确定,例如图中对音响1对于VR设备的距离X,佩戴者通过距离检测进而可以确定校准MIC根据佩戴者的行走是否需要进行进行发声变化。例如,佩戴者佩戴VR设备不断接近音响1,校准MIC的中高音就会变化至更加大(分贝值更高),反之远离音响1,校准MIC的中高音就会变化至更加小(分贝值更低),而且还存在角度问题,是否中高音发声在后方还是前方。

通过VR设备中的IMU确定佩戴者佩戴VR设备时的位置变化以及角度变化。而低音就不会存在为位置和角度变化的问题。基于声源定位的原理可知:声源发出的声音到达人的双耳时,存在着声压级、时间差、相位差等,这些经过人脑的处理,使人感受到声源的方位,这就是声像定位。人耳的声源定位能力还与频率有关,300Hz以下(低音)频率定位能力差,这是因为低音的绕射能力强。其波长与人的两耳之间的距离相比大的多,人耳获得的相位差及强度差很小,定位作用也就小,因此家中的家庭影院一般只需要一个超重低音箱,且摆放位置比较随意,不需要有角度以及位置要求。而300Hz以上(中高音)声音定位的能力逐渐增强。随着频率升高,波长变短,当声音到达人耳时,人的双耳距离与其波长相比已经不可忽视,这时,左右耳接受的声波,就容易出现相位差甚至强于强度差,所以高音的方向性强。故对于音响的中高音发声就需要确定位置及角度关系,以便于根据位置及角度关系确定佩戴者移动时或者移动后中高音的发声分贝值需要如何变化,以提高VR设备的真实性,还可以通过特定低音发声音响发声进而通过VR设备低音发声的效果。

需要说明的是,该具体实施例阐述的诸多细节仅助于理解本申请的技术构思,并不构成对本申请的限定,基于本申请的该技术构思进行更多形式的简单变换,均应在本申请的保护范围内。

实施例三

本发明实施例提供一种头戴显示设备,头戴显示设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例一中的发声控制方法。

下面参考图6,图6为头戴显示设备涉及的硬件运行环境的设备结构示意图,其示出了适于用来实现本公开实施例的头戴显示设备的结构示意图。本公开实施例中的头戴显示设备可以包括但不限于混合现实(MixedReality)—MR设备(例如MR眼镜或者MR头盔)、增强现实(AugmentedReality)—AR设备(例如AR眼镜或者AR头盔)、虚拟现实-(VirtualReality)—VR设备(例如VR眼镜或者VR头盔)、扩展现实(ExtendedReality)—XR设备或其某种组合等等头戴显示设备。图6示出的头戴显示设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示,头戴显示设备可以包括处理装置1001(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM1002)中的程序或者从存储装置加载到随机访问存储器(RAM1004)中的程序而执行各种适当的动作和处理。在RAM1004中,还存储有头戴显示设备操作所需的各种程序和数据。处理装置1001、ROM1002以及RAM1004通过总线1005彼此相连。输入/输出(I/O)接口也连接至总线1005。

通常,以下系统可以连接至I/O接口1006:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置1007;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1008;包括例如磁带、硬盘等的存储装置1003;以及通信装置1009。通信装置1009可以允许头戴显示设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的头戴显示设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置1003被安装,或者从ROM1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。

本发明提供的头戴显示设备,采用上述实施例一或实施例二中的发声控制方法,能通过低音音响发声提高VR设备在低频的发声效果,以及通过音响与VR设备内部喇叭单元共同发声,进而可以实现发声的个性化选择。与现有技术相比,本发明实施例提供的头戴显示设备的有益效果与上述实施例一提供的发声控制方法的有益效果相同,且该头戴显示设备中的其他技术特征与上一实施例方法公开的特征相同,在此不做赘述。

应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

实施例四

本发明实施例提供一种计算机存储介质,所述计算机存储介质为计算机存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例一中的发声控制方法。

本发明实施例提供的计算机存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

上述计算机存储介质可以是头戴显示设备中所包含的;也可以是单独存在,而未装配入头戴显示设备中。

上述计算机存储介质承载有一个或者多个程序,当上述一个或者多个程序被头戴显示设备执行时,使得头戴显示设备:接收至少一个音响的音响扫频信号,并根据各所述音响扫频信号确定低音发声音响;基于预存的目标频响确定所述音响扫频信号对应的修正曲线,并将各所述音响扫频信号对应的修正曲线汇总得到修正曲线集;根据采集的指令收发延时值确定所述音响扫频信号对应的音响位置信息,根据所述音响位置信息、所述修正曲线集和所述低音发声音响进行发声控制。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。

本发明提供的计算机存储介质,存储有用于执行上述发声控制方法的计算机可读程序指令,能通过低音音响发声提高VR设备在低频的发声效果,以及通过音响与VR设备内部喇叭单元共同发声,进而可以实现发声的个性化选择。与现有技术相比,本发明实施例提供的计算机存储介质的有益效果与上述实施例一或实施例二提供的发声控制方法的有益效果相同,在此不做赘述。

实施例五

本发明实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的发声控制方法的步骤。

本申请提供的计算机程序产品能通过低音音响发声提高VR设备在低频的发声效果,以及通过音响与VR设备内部喇叭单元共同发声,进而可以实现发声的个性化选择。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例一或实施例二提供的发声控制方法的有益效果相同,在此不做赘述。

以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

技术分类

06120115637309