导航：首页> 气体或液体的贮存或分配>位置推荐方法及装置、计算机可读存储介质和电子设备

位置推荐方法及装置、计算机可读存储介质和电子设备

文献发布时间：2023-06-19 09:35:27

技术领域

本公开涉及增强现实技术领域，具体而言，涉及一种位置推荐方法、位置推荐装置、计算机可读存储介质和电子设备。

背景技术

随着生活水平的提升，用户开始不断追求听觉给自身带来的愉悦感。例如，在室内环境中，用户可以配置多个发声源(如音响)，以达到听觉享受。

然而，在室内存在多个发声源的情况下，室内各个位置的听觉感受并不相同，尤其在家装时，如何确定较佳的听觉位置，直接关系着家装的布局及成本。

发明内容

本公开提供一种位置推荐方法、位置推荐装置、计算机可读存储介质和电子设备，进而至少在一定程度上解决如何确定听觉位置的问题。

根据本公开的第一方面，提供了一种位置推荐方法，应用于移动终端，包括：对移动终端进行定位，以确定移动终端在地图坐标系下的位姿，获取地图；确定地图中多个发声源在地图坐标系下的位姿，获取各发声源对应的虚拟声波，根据各发声源在地图坐标系下的位姿，确定各发声源对应虚拟声波在地图坐标系下的位姿；根据各发声源对应虚拟声波在地图坐标系下的位姿，确定场景中各位置的音频接收评价指标值；根据场景中各位置的音频接收评价指标值，从场景中确定出音频接收位置并推荐。

根据本公开的第二方面，提供了一种位置推荐装置，应用于移动终端，包括：定位模块，用于对移动终端进行定位，以确定移动终端在地图坐标系下的位姿，获取地图；位姿确定模块，用于确定地图中多个发声源在地图坐标系下的位姿，获取各发声源对应的虚拟声波，根据各发声源在地图坐标系下的位姿，确定各发声源对应虚拟声波在地图坐标系下的位姿；指标值确定模块，用于根据各发声源对应虚拟声波在地图坐标系下的位姿，确定场景中各位置的音频接收评价指标值；位置推荐模块，用于根据场景中各位置的音频接收评价指标值，从场景中确定出音频接收位置并推荐。

根据本公开的第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述的位置推荐方法。

根据本公开的第四方面，提供了一种电子设备，包括处理器；存储器，用于存储一个或多个程序，当一个或多个程序被处理器执行时，使得所述处理器实现上述的位置推荐方法。

在本公开的一些实施例所提供的技术方案中，首先，对移动终端进行定位，确定移动终端在地图坐标系下的位姿，获取地图；接下来，确定地图中多个发声源在地图坐标系下的位姿，获取各发声源对应的虚拟声波，并确定出各虚拟声波的位姿；然后，根据各虚拟声波的位姿，确定场景中各位置的音频接收评价指标值，据此从场景中确定出音频接收位置并推荐。本公开方案可以结合增强现实的技术，通过各发声源对应的虚拟声波来确定场景中较佳的音频接收位置，可以在发声源未发声甚至在未实际配置发声源的情况下，实现听觉位置的推荐，无需用户凭借自身的感知来确定较佳听觉位置，位置确定的准确性和实现的便利性都得到了大幅提升。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了本公开实施方式的位置推荐方案的示例性系统架构的示意图；

图2示出了适于用来实现本公开实施例的电子设备的结构示意图；

图3示意性示出了根据本公开的示例性实施方式的位置推荐方法的流程图；

图4示意性示出了根据本公开的示例性实施方式的地图构建过程的流程图；

图5示出了小孔成像原理的示意图；

图6示意性示出了根据本公开的示例性实施方式的移动终端的定位过程的流程图；

图7示出了应用本公开方案在室内场景中确定出音频接收位置的示意图；

图8示意性示出了根据本公开的示例性实施方式的位置推荐装置的方框图；

图9示意性示出了根据本公开的另一示例性实施方式的位置推荐装置的方框图；

图10示意性示出了根据本公开的再一示例性实施方式的位置推荐装置的方框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的步骤。例如，有的步骤还可以分解，而有的步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。另外，下面所有的术语“第一”、“第二”仅是为了区分的目的，不应作为本公开内容的限制。

图1示出了本公开实施方式的位置推荐方案的示例性系统架构的示意图。

如图1所示，室内场景可以包括移动终端1011和发声源1021、1022、1023。移动终端1011的显示界面上可以呈现出室内场景中较佳的音频接收位置，该位置基于对发声源1021、1022、1023所播放音频对应的虚拟声波进行分析而确定出。

移动终端1011可以是手机、平板电脑、AR(Augmented Reality，增强现实)眼镜、AR头盔等能够实现AR处理及AR显示功能的设备。

发声源1021、1022、1023可以是音响、收音机、手机、平板电脑、个人计算机等能够播放音频的设备。本公开对场景中发声源的数量和类型均不做限制。

需要注意的是，场景中多个发声源的一个或多个可以是虚拟配置出的发声源，即现实场景中不存在这些发声源，可以基于增强现实技术通过虚实结合的方式在场景中配置虚拟发声源。

在实现位置推荐的过程中，移动终端1011可以进行自身定位，以确定移动终端1011在地图坐标系下的位姿，获取地图。移动终端1011可以确定地图中发声源1021、1022、1023在地图坐标系下的位姿，获取发声源1021、1022、1023对应的虚拟声波，根据发声源1021、1022、1023在地图坐标系下的位姿，确定出发声源1021、1022、1023对应虚拟声波在地图坐标系下的位姿。

接下来，移动终端1011可以根据发声源1021、1022、1023对应虚拟声波在地图坐标系下的位姿，确定各虚拟声波彼此之间的交叠情况，由此，可以确定出场景各位置的音频接收评价指标值。

然后，移动终端1011可以根据场景中各位置的音频接收评价指标值，从场景中确定音频接收位置，并执行推荐操作。

在家装场景下，结合增强现实技术，用户在手机上仅通过一些简单的配置操作，即可实现室内较佳听觉位置的确定过程，为家具的摆放以及音响的配置提供指导。

下面描述的位置推荐方法的各个步骤应用于移动终端，也就是说，由移动终端执行位置推荐方法的各个步骤。在这种情况下，位置推荐装置可以配置于移动终端中。

图2示出了适于用来实现本公开示例性实施方式的电子设备的示意图。本公开示例性实施方式中移动终端可以被配置为图2的形式。需要说明的是，图2示出的电子设备仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

本公开的电子设备至少包括处理器和存储器，存储器用于存储一个或多个程序，当一个或多个程序被处理器执行时，使得处理器可以实现本公开示例性实施方式的位置推荐方法。

具体的，如图2所示，电子设备200可以包括：处理器210、内部存储器221、外部存储器接口222、通用串行总线(Universal Serial Bus，USB)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(Subscriber IdentificationModule，SIM)卡接口295等。其中传感器模块280可以包括深度传感器、压力传感器、陀螺仪传感器、气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器及骨传导传感器等。

可以理解的是，本公开实施例示意的结构并不构成对电子设备200的具体限定。在本申请另一些实施例中，电子设备200可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。

处理器210可以包括一个或多个处理单元，例如：处理器210可以包括应用处理器(Application Processor，AP)、调制解调处理器、图形处理器(Graphics ProcessingUnit，GPU)、图像信号处理器(Image Signal Processor，ISP)、控制器、视频编解码器、数字信号处理器(Digital Signal Processor，DSP)、基带处理器和/或神经网络处理器(Neural-etwork Processing Unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。另外，处理器210中还可以设置存储器，用于存储指令和数据。

电子设备200可以通过ISP、摄像模组291、视频编解码器、GPU、显示屏290及应用处理器等实现拍摄功能。在一些实施例中，电子设备200可以包括1个或N个摄像模组291，N为大于1的正整数，若电子设备200包括N个摄像头，N个摄像头中有一个是主摄像头。

内部存储器221可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。内部存储器221可以包括存储程序区和存储数据区。外部存储器接口222可以用于连接外部存储卡，例如Micro SD卡，实现扩展电子设备200的存储能力。

就本公开所述的位置推荐方案而言，移动终端可以利用摄像模组291拍摄当前帧，并基于传感器模块280中的深度传感器，确定出与当前帧对应的深度信息。处理器210可以利用当前帧及其对应的深度信息，并结合预先构建的地图信息，确定移动终端在地图坐标系下的位姿。处理器210可以通过图像识别或基于用户的配置，确定地图中多个发声源在地图坐标系下的位姿，获取各发声源对应的虚拟声波以及在地图坐标系下的位姿。在这种情况下，处理器210可以计算场景中各位置的音频接收评价指标值，据此从场景中确定出音频接收位置。另外，处理器210可以将虚拟推荐对象显示在音频接收位置，用户可以通过显示屏290看到虚拟推荐对象，实现位置推荐过程。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

图3示意性示出了本公开的示例性实施方式的应用于移动终端的位置推荐方法的流程图。参考图3，所述位置推荐方法可以包括以下步骤：

S32.对移动终端进行定位，以确定移动终端在地图坐标系下的位姿，获取地图。

就移动终端进行定位的过程而言，本公开可以预先构建场景的地图，并根据构建出的地图来对移动终端进行定位。

下面将参考图4对本公开示例性实施方式的地图构建过程进行说明。在下面的示例中，将用于构建地图的设备称为建图设备。应当注意的是，建图设备通常可以是除本公开所述的移动终端之外的另一设备。然而，在移动终端自身建图并进行重定位的实施例场景中，移动终端也可以是建图设备。

在步骤S402中，建图设备获取场景图像以及场景图像对应的深度信息。

建图设备配备有单目摄像头，可以通过单目摄像头对环境进行采集，以得到场景图像，场景图像通常为RGB图像。具体的，建图设备可以利用单目摄像头，以固定帧率进行RGB图像采集，得到场景图像。

建图设备配备有深度传感器，可以通过深度传感器，以固定帧率对环境进行深度信息的采集，得到深度图像。其中，深度传感器可以为TOF(Time Of Flight，飞行时间)、结构光等。另外，建图设备还可以通过单目测距、多目测距等方式确定深度信息，本公开对此不做限制。

在得到RGB的场景图像以及深度图像后，可以基于时间戳将RGB的场景图像与深度图像进行对齐，随后，即得到场景图像以及场景图像对应的深度信息。

在步骤S404中，建图设备对场景图像进行特征提取，得到特征信息。

本公开示例性实施方式的特征提取算法可以包括但不限于FAST特征点检测算法、DOG特征点检测算法、Harris特征点检测算法、SIFT特征点检测算法、SURF特征点检测算法等。对应的特征描述子可以包括但不限于BRIEF特征点描述子、BRISK特征点描述子、FREAK特征点描述子等。本公开对此不做限制。

通过上述特征提取算法与特征描述子进行组合，可以确定一组特征提取模式，并采用此特征提取模式对场景图像进行特征提取，得到特征信息。

另外，可以将不同特征提取算法与特征描述子进行组合，以确定出多组特征提取模式。例如，一组特征提取模式可以为FAST特征点检测算法和BRIEF特征点描述子，另一组特征提取模式可以为DOG特征点检测算法和FREAK特征点描述子。基于上面的描述，本领域技术人员可以理解的是，针对一张图像，不同的特征提取模式提取出的特征点的类型存在差异，例如，一组特征提取模式适合对强纹理场景进行特征提取，而另一种特征提取模式适合对弱纹理场景进行特征提取。

在这种情况下，可以基于多组特征提取模式，从场景图像提取多种类型的特征信息。

在步骤S406中，建图设备利用特征信息进行视觉跟踪和运动估计，得到中间结果。

本领域技术人员容易理解的是，通过视觉跟踪和运动估计，可以反映出采集的场景图像所表征的二维特征数据，将这种基于RGB的二维特征数据作为中间结果。

在步骤S408中，建图设备利用深度信息以及移动终端的相机内参得到局部点云数据。可以理解的是，此处所述的局部点云数据是局部稠密点云数据。

可以依据小孔成像原理来得到局部点云数据，图5示出了小孔成像原理的示意图。

具体的，可以通过公式1将图像坐标点(u,v)转换到世界坐标点(x

其中，(u

由此，可以通过这种变换关系，利用深度信息以及移动终端的相机内参得到局部点云数据。

在步骤S410中，建图设备利用中间结果以及局部点云数据，生成全局点云数据。可以理解的是，此处所述的全局点云数据是全局稠密点云数据。

具体的，可以将表征RGB二维特征数据的中间结果与局部点云数据合并，以生成全局点云数据。

在步骤S412中，建图设备基于全局点云数据，构建出地图。

具体的，可以将全局点云数据序列化存储于本地，以得到地图。另外，可以将构建出的地图上传至云端，以便利用云端对随后需要定位的设备进行定位。应当理解的是，构建出的地图为包含深度信息的三维地图。然而，在公开的另一些实施例中，构建出的地图还可以不包含深度信息。

在构建出场景三维地图的情况下，可以结合该地图来对移动终端进行定位。

首先，移动终端可以获取当前帧以及当前帧对应的深度信息，得到当前帧的特征点信息。其中，当前帧是移动终端通过其摄像模组拍摄的当前图像，由于同时利用深度传感器获取到了深度信息，因此，得到的当前帧的特征点信息是三维信息。另外，此处特征点的提取与建图设备进行特征点提取的方法类似，不再赘述。

接下来，移动终端利用当前帧的特征点信息以及用于构建地图的关键帧集合中关键帧的特征点信息，计算移动终端的坐标系与建图设备的坐标系的位姿转换关系。

然后，移动终端获取移动终端在移动终端坐标系下的位姿，并利用该位姿转换关系，可以将移动终端在移动终端坐标系下的位姿转换至在地图坐标系下的位姿。

具体的，可以结合ICP(Iterative Closest Point迭代最近点)算法实现定位过程。ICP算法是基于最小二乘法的最优配准算法，该算法重复进行选择对应点时，计算最优刚体变换，直至满足正确配准的收敛精度要求。ICP算法的基本原理是：分别在待匹配的目标点云P和源点云Q中，按照一定的约束条件(该约束条件可以自定义)，找到最邻近的点(p

其中，n为邻近点对的数量，p

下面将参考图6对本公开示例性实施方式的移动终端的定位过程进行说明。

在步骤S602中，移动终端获取当前帧以及当前帧对应的深度信息，得到当前帧的点集。在下述处理中，所用到的点集p

在步骤S604中，移动终端确定建图所用一关键帧的点集q

在步骤S606中，计算旋转矩阵R和平移矩阵T，使得误差函数最小。

在步骤S608中，利用旋转矩阵R和平移矩阵T对当前帧的点集p

在步骤S610中，计算中间点集p'

在步骤S612中，判断平均距离d是否小于距离阈值d

在步骤S614中，输出当前的旋转矩阵R和平移矩阵T。

由此，移动终端可以利用当前输出的最优的旋转矩阵R和平移矩阵T，将移动终端在移动终端坐标系下的位姿转换至在地图坐标系下的位姿。

另外，在确定出移动终端在地图坐标系下的位姿的情况下，可以获取到地图。

S34.确定地图中多个发声源在地图坐标系下的位姿，获取各发声源对应的虚拟声波，根据各发声源在地图坐标系下的位姿，确定各发声源对应虚拟声波在地图坐标系下的位姿。

根据本公开的一些实施例，发声源都是实际布置在场景中的真实发声源。

在一个实施例中，发声源在构建地图的过程中已经配置出，由此，可以从地图中直接获取发声源在地图坐标系下的位姿。

在另一个实施例中，发声源在构建地图的过程中未经配置，而是在构建地图之后配置出的。在这种情况下，移动终端可以利用摄像模组采集的RGB图像和深度传感器采集的深度图像，确定出发声源在移动终端坐标系下的位姿，并根据地图坐标系与移动终端坐标系之间的位姿转换关系，确定出发声源在地图坐标系下的位姿。

在又一个实施例中，一些发声源在构建地图的过程中已经配置出，另一些发声源在构建地图之后配置出。针对在构建地图的过程中配置出的发声源，可以从地图中直接获取在地图坐标系下的位姿；针对在构建地图之后配置出的发声源，移动终端可以利用摄像模组和深度传感器确定出发声源在移动终端坐标系下的位姿，并根据地图坐标系与移动终端坐标系之间的位姿转换关系，确定出发声源在地图坐标系下的位姿。

根据本公开的另一些实施例，场景中多个发声源中至少一个发声源为虚拟发声源。针对真实发声源，可以通过上面实施例中的方式确定出在地图坐标系下的位姿。

针对虚拟发声源，可以响应虚拟发声源配置操作，来进行配置，并确定虚拟发声源在地图坐标系下的位姿。其中，响应虚拟发声源配置操作的界面可以是增强现实软件中预先配置的界面。

在一个实施例中，首先，可以响应第一配置操作，从虚拟发声源集合中确定出虚拟发声源。例如，虚拟发声源集合中可以预先配置多个发声源，这些发声源对应于市场上可以购买到的发声源，如不同厂家、不同型号的音响。

接下来，可以响应第二配置操作，将确定(或称为选择)出的虚拟发声源配置在场景中，通过在增强现实软件中的配置，并鉴于已得到移动终端与建图设备的位姿位姿转换关系，即可得到虚拟发声源在地图坐标系下的位姿。

例如，在增强现实软件的界面中对虚拟发声源的操作可以包括：a、在用户选定满足需求的虚拟发声源后，触摸移动终端所呈现的场景中的对应位置，即可添加虚拟发声源。b、长按已经添加的虚拟发声源，点击右上角即可在场景中删除该虚拟发声源。c、长按已经添加的虚拟发声源，拖拽接口移动该虚拟发声源，以改变其在场景中的位置。d、长按已经添加的虚拟发声源，滑动旋转条即可旋转该虚拟发声源，以改变该虚拟发声源的姿态。

无论发声源是真实存在在场景中的设备，还是虚拟配置出的，移动终端均可以确定各发声源对应的虚拟声波。应当理解的是，在本公开的示例性实施方式中，发声源与虚拟声波存在映射关系，在确定出发声源的情况下，其对应的虚拟声波即可确定出。可以理解的是，虚拟声波可以是能够反映出发声源音频输出特性的声波，本公开对此不做限制。

针对虚拟声波，一方面，虚拟声波可以是预先配置的彩色声波；另一方面，虚拟声波的传播速度可以例如设定为3.4m/s；再一方面，可以通过例如游戏引擎实现声波的碰撞效果，如，在虚拟声波与场景中墙面、地面、天花板、桌子、家具等障碍物发生碰撞时，生成并显示碰撞效果(例如，反射效果)；又一方面，声波的振幅和频率可以调节。此外，在发声源同时发声的场景中，虚拟声波在发声源停止发声后衰减达到60dB，即达到混响时间，对应的虚拟声波消失。

应当理解的是，在配置虚拟声波的过程中，可以配置场景中例如墙面、地面、天花板、桌子、家具等障碍物的材质、碰撞体积等信息，以更加真实地模拟出场景，有助于随后位置推荐的准确性。

在一些实施例中，不同发声源的虚拟声波可以相同，或者不同发声源所针对的虚拟声波的频率和/或振幅可以不同。

另外，发声源与对应虚拟声波的位姿关系也可以预先配置出。例如，虚拟声波是以发声源为中心向周围扩散的声波。或者，虚拟声波沿发声源的喇叭方向传播。

在本公开的示例性实施方式中，在确定出发声源在地图坐标系下位姿的情况下，可以确定出对应虚拟声波在地图坐标系下的位姿。

此外，移动终端可以根据移动终端在地图坐标系下的位置以及各发声源对应虚拟声波在地图坐标系下的位姿，在显示界面上显示发声源对应的虚拟声波。

应当注意的是，显示虚拟声波的同时，发声源实际可以播放音频，或者不播放音频。

S36.根据各发声源对应虚拟声波在地图坐标系下的位姿，确定场景中各位置的音频接收评价指标值。

在本公开的示例性实施方式中，音频接收评价指标是用来评价音频接收质量的指标，本公开对其类型不做限制。例如，音频接收评价指标可以包括但不限于混响时间、谐振模态、声染状态、声场均匀度等。应当注意的是，步骤S36确定出的音频接收评价指标值的类型可以是一种或多种。

在确定出各发声源对应虚拟声波在地图坐标系下的位姿的情况下，移动终端可以确定各发声源对应虚拟声波在场景中的交叠情况，结合交叠情况可以确定出场景中各位置的音频接收评价指标值。

S38.根据场景中各位置的音频接收评价指标值，从场景中确定出音频接收位置并推荐。

在步骤S36仅确定出一种音频接收评价指标值的实施例中，可以将该音频接收评价指标值与一阈值进行比较，确定场景中满足推荐条件的位置作为音频接收位置，并进行推荐。其中，推荐条件与上述阈值的比较结果相关，本公开对此不做限制。另外，可以理解的是，音频接收评价指标不同，对应的阈值也不同。

在步骤S36仅确定出一种音频接收评价指标值的另一实施例中，可以将该音频接收评价指标值转换为音频接收评价得分，确定场景中音频接收评价得分高于分数阈值的位置，并进行推荐。其中，本公开对分数阈值不做限制。

在步骤S36确定出多种音频接收评价指标值的实施例中，首先，可以根据场景中各位置的音频接收评价指标值，计算场景中各位置的音频接收评价得分。具体的，可以预先为不同类型的音频接收评价指标配置权重，并利用加权的方式计算出音频接收评价得分，本公开对此过程不做限制。

接下来，移动终端可以将场景中音频接收评价得分高于分数阈值的位置，确定为音频接收位置，并推荐这些音频接收位置。其中，本公开对分数阈值不做限制。

针对推荐音频接收位置的过程，移动终端可以基于移动终端的显示功能，在移动终端的显示界面上的音频接收位置呈现虚拟推荐对象。其中，虚拟推荐对象可以任意能够区分于其他位置的对象，例如，带有颜色的方框、圆圈等等，还可以是例如草地的虚拟效果，本公开对此不做限制。

应当注意的是，虚拟推荐对象可以是表征地面平面的二维虚拟对象，在音频接收位置为三维信息时，虚拟推荐对象还可以是三维虚拟对象。

在场景中，确定出的音频接收位置可以对应一个区域。另外，确定出的音频接收位置还可以对应多个区域，区域与区域之间没有交集。

图7示出了应用本公开方案在室内场景中确定出音频接收位置的示意图。

参考图7，在家装场景中，发声源可以包括中置音箱、左主箱、右主箱、左环绕、右环绕。其中，这些发声源中的至少一个可以是虚拟发声源，由用户通过增强现实的软件配置出。用户手持手机执行上述位置推荐过程，以确定出音频接收位置700，表征家装场景中较佳的听觉位置。

应当注意，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

综上所述，基于本公开的位置推荐方案，可以结合增强现实的技术，通过各发声源对应的虚拟声波来确定场景中较佳的音频接收位置，可以在发声源未发声甚至在未实际配置发声源的情况下，实现听觉位置的推荐，无需用户凭借自身的感知来确定较佳听觉位置，位置确定的准确性和实现的便利性都得到了大幅提升。

进一步的，本示例实施方式中还提供了一种应用于移动终端的位置推荐装置。

图8示意性示出了本公开的示例性实施方式的位置推荐装置的方框图。参考图8，根据本公开的示例性实施方式的位置推荐装置8可以包括定位模块81、位姿确定模块83、指标值确定模块85和位置推荐模块87。

具体的，定位模块81可以用于对移动终端进行定位，以确定移动终端在地图坐标系下的位姿，获取地图；位姿确定模块83可以用于确定地图中多个发声源在地图坐标系下的位姿，获取各发声源对应的虚拟声波，根据各发声源在地图坐标系下的位姿，确定各发声源对应虚拟声波在地图坐标系下的位姿；指标值确定模块85可以用于根据各发声源对应虚拟声波在地图坐标系下的位姿，确定场景中各位置的音频接收评价指标值；位置推荐模块87可以用于根据场景中各位置的音频接收评价指标值，从场景中确定出音频接收位置并推荐。

根据本公开的示例性实施例，多个发声源中至少一个发声源为虚拟发声源。在这种情况下，位姿确定模块83还可以被配置为执行：响应虚拟发声源配置操作，确定地图中虚拟发声源在地图坐标系下的位姿。

根据本公开的示例性实施例，位姿确定模块83还可以被配置为执行：响应第一配置操作，从虚拟发声源集合中确定出虚拟发声源；响应第二配置操作，将虚拟发声源配置在场景中，得到虚拟发声源在地图坐标系下的位姿。

根据本公开的示例性实施例，位置推荐模块87可以被配置为执行：根据场景中各位置的音频接收评价指标值，计算场景中各位置的音频接收评价得分；将场景中音频接收评价得分高于分数阈值的位置，确定为音频接收位置，并推荐音频接收位置。

根据本公开的示例性实施例，位置推荐模块87推荐音频接收位置的过程可以被配置为执行：基于移动终端的显示，在音频接收位置呈现虚拟推荐对象。

根据本公开的示例性实施例，参考图9，相比于位置推荐装置8，位置推荐装置9还可以包括虚拟声波显示模块91。

具体的，虚拟声波显示模块91可以被配置为执行：根据移动终端在地图坐标系下的位姿以及各发声源对应虚拟声波在地图坐标系下的位姿，在移动终端的显示界面上显示各发声源对应的虚拟声波。

根据本公开的示例性实施例，定位模块81可以被配置为执行：获取当前帧以及当前帧对应的深度信息，得到当前帧的特征点信息；利用当前帧的特征点信息以及用于构建地图的关键帧集合中关键帧的特征点信息，计算移动终端的坐标系与地图坐标系的位姿转换关系；获取移动终端在移动终端坐标系下的位姿；利用位姿转换关系，将移动终端在移动终端坐标系下的位姿转换至在地图坐标系下的位姿。

根据本公开的示例性实施例，地图由移动终端构建出。在这种情况下，参考图10，相比于位置推荐装置8，位置推荐装置10还可以包括地图构建模块101。

具体的，地图构建模块101可以被配置为执行：预先获取场景图像以及与场景图像对应的深度信息；利用场景图像以及与场景图像对应的深度信息，构建地图。

根据本公开的示例性实施例，地图构建模块101构建地图的过程可以被配置为执行：对场景图像进行特征提取，得到特征信息；利用特征信息进行视觉跟踪和运动估计，得到中间结果；利用场景图像对应的深度信息以及移动终端的相机内参，得到局部点云数据；利用中间结果和局部点云数据，生成全局点云数据；基于全局点云数据，构建出地图。

由于本公开实施方式的位置推荐装置的各个功能模块与上述方法实施方式中相同，因此在此不再赘述。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

此外，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

本领域技术人员在考虑说明书及实践这里公开的内容后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：金珂;李姬俊男;
专利申请人：OPPO广东移动通信有限公司;