掌桥专利:专业的专利平台
掌桥专利
首页

用于呈现合成现实用户界面的方法和设备

文献发布时间:2023-06-19 09:29:07


用于呈现合成现实用户界面的方法和设备

技术领域

本公开整体涉及合成现实用户界面,并且具体地,涉及用于呈现包括文件组的组表示的合成现实用户界面的系统、方法和设备。

背景技术

物理布景是指无需电子系统帮助个体就能够感知和/或个体能够交互的世界。物理布景(例如,物理森林)包括物理元素(例如,物理树、物理结构和物理动物)。个体可直接与物理布景相互作用和/或感知物理布景,诸如通过触摸、视觉、嗅觉、听觉和味觉。

相比之下,合成现实(SR)布景是指经由电子系统个体能够感知并且/或者个体能够与其交互的完全或部分由计算机创建的布景。在SR中,监测个体移动的子集,并且响应于此,以符合一个或多个物理定律的方式使SR布景中的一个或多个虚拟对象的一个或多个属性变化。例如,SR系统可检测到个体向前走几步,并且响应于此,以类似于此类情景和声音在物理环境中会如何变化的方式来调节呈现给个体的图形和音频。也可响应于移动的表示(例如,音频指令)而进行对SR布景中一个或多个虚拟对象的一个或多个属性的修改。

个体可使用他的任何感觉(包括触觉、嗅觉、视觉、味觉和声音)与SR对象进行交互和/或感知SR对象。例如,个体可与创建多维(例如,三维)或空间听觉布景和/或实现听觉透明性的听觉对象进行交互和/或感知听觉对象。多维或空间听觉布景为个体提供了在多维空间中对离散听觉源的感知。在具有或不具有计算机创建的音频的情况下,听觉透明性选择性地结合来自物理布景的声音。在一些SR布景中,个体可仅与听觉对象进行交互和/或仅感知听觉对象。

SR的一个示例是虚拟现实(VR)。VR布景是指被设计为仅包括针对至少一种感觉的计算机创建的感官输入的模拟布景。VR布景包括个体可与之交互和/或对其进行感知的多个虚拟对象。个体可通过在计算机创建的布景内模拟个体动作的子集和/或通过对个体或其在计算机创建的布景内的存在的模拟,来与VR布景中的虚拟对象进行交互和/或感知VR布景中的虚拟对象。

SR的另一个示例是混合现实(MR)。MR布景是指被设计为将计算机创建的感官输入(例如,虚拟对象)与来自物理布景的感官输入或其表示集成的模拟布景。在现实谱系上,混合现实布景介于一端的VR布景和另一端的完全物理布景之间并且不包括这些布景。

在一些MR布景中,计算机创建的感官输入可以适应于来自物理布景的感官输入的变化。另外,用于呈现MR布景的一些电子系统可以监测相对于物理布景的取向和/或位置,以使虚拟对象能够与真实对象(即来自物理布景的物理元素或其表示)交互。例如,系统可监测运动,使得虚拟植物相对于物理建筑物看起来是静止的。

混合现实的一个示例是增强现实(AR)。AR布景是指至少一个虚拟对象叠加在物理布景或其表示之上的模拟布景。例如,电子系统可具有不透明显示器和至少一个成像传感器,成像传感器用于捕获物理布景的图像或视频,这些图像或视频是物理布景的表示。系统将图像或视频与虚拟对象组合,并在不透明显示器上显示该组合。个体使用系统经由物理布景的图像或视频间接地查看物理布景,并且观察叠加在物理布景之上的虚拟对象。当系统使用一个或多个图像传感器捕获物理布景的图像,并且使用那些图像在不透明显示器上呈现AR布景时,所显示的图像被称为视频透传。另选地,用于显示AR布景的电子系统可具有透明或半透明显示器,个体可通过该显示器直接查看物理布景。该系统可在透明或半透明显示器上显示虚拟对象,使得个体使用该系统观察叠加在物理布景之上的虚拟对象。又如,系统可包括将虚拟对象投影到物理布景中的投影系统。虚拟对象可例如在物理表面上或作为全息图被投影,使得个体使用该系统观察叠加在物理布景之上的虚拟对象。

增强现实布景也可指其中物理布景的表示被计算机创建的感官信息改变的模拟布景。例如,物理布景的表示的一部分可被以图形方式改变(例如,放大),使得所改变的部分仍可代表一个或多个初始捕获的图像但不是忠实再现的版本。又如,在提供视频透传时,系统可改变传感器图像中的至少一者以施加不同于一个或多个图像传感器捕获的视点的特定视点。再如,物理布景的表示可通过以图形方式将其部分进行模糊处理或消除其部分而被改变。

混合现实的另一个示例是增强虚拟(AV)。AV布景是指计算机创建布景或虚拟布景并入来自物理布景的至少一个感官输入的模拟布景。来自物理布景的一个或多个感官输入可为物理布景的至少一个特征的表示。例如,虚拟对象可呈现由一个或多个成像传感器捕获的物理元素的颜色。又如,虚拟对象可呈现出与物理布景中的实际天气条件相一致的特征,如经由天气相关的成像传感器和/或在线天气数据所识别的。在另一个示例中,增强现实森林可具有虚拟树木和结构,但动物可具有从对物理动物拍摄的图像精确再现的特征。

许多电子系统使得个体能够与各种SR布景进行交互和/或感知各种SR布景。一个示例包括头戴式系统。头戴式系统可具有不透明显示器和一个或多个扬声器。另选地,头戴式系统可以被设计为接收外部显示器(例如,智能电话)。头戴式系统可具有分别用于拍摄物理布景的图像/视频和/或捕获物理布景的音频的一个或多个成像传感器和/或麦克风。头戴式系统也可具有透明或半透明显示器。透明或半透明显示器可结合基板,表示图像的光通过该基板被引导到个体的眼睛。显示器可结合LED、OLED、数字光投影仪、激光扫描光源、硅上液晶,或这些技术的任意组合。透射光的基板可以是光波导、光组合器、光反射器、全息基板或这些基板的任意组合。在一个实施方案中,透明或半透明显示器可在不透明状态与透明或半透明状态之间选择性地转换。又如,电子系统可以是基于投影的系统。基于投影的系统可使用视网膜投影将图像投影到个体的视网膜上。另选地,投影系统还可将虚拟对象投影到物理布景中(例如,投影到物理表面上或作为全息图)。SR系统的其他示例包括平视显示器、能够显示图形的汽车挡风玻璃、能够显示图形的窗口、能够显示图形的镜片、耳机或耳塞、扬声器布置、输入机构(例如,具有或不具有触觉反馈的控制器)、平板电脑、智能电话,以及台式计算机或膝上型计算机。

在大量数据项(诸如音频文件、视频文件、文档文件或网页)之间进行导航以定位特定数据项可能比较麻烦。例如,在大型音乐库中定位要播放的歌曲可能是一项繁琐的任务。此外,在歌曲之间转变或以其他方式同时播放多首歌曲可产生声音不一致。

附图说明

因此,本公开可被本领域的普通技术人员理解,更详细的描述可参考一些例示性实施方式的方面,其中一些实施方式在附图中示出。

图1A是根据一些实施方式的示例性操作架构的框图。

图1B是根据一些实施方式的示例性操作架构的框图。

图2是根据一些实施方式的示例性控制器的框图。

图3是根据一些实施方式的示例性头戴式设备(HMD)的框图。

图4是根据一些实施方式的SR体积环境的第三人称视图。

图5A至图5P示出了根据一些实施方式的包括文档文件组的SR组表示的SR体积环境的第一人称视图。

图6A至图6H示出了根据一些实施方式的包括音频文件组的SR组表示的SR体积环境的第一人称视图。

图7A至图7C示出了根据一些实施方式的其中通过将SR组表示朝向用户牵拉来选择SR组表示的SR体积环境。

图8A至图8E示出了根据一些实施方式的其中通过将SR组表示拉开来选择SR组表示的SR体积环境。

图9A至图9B示出了根据一些实施方式的其中通过注视SR组表示来选择SR组表示的SR体积环境。

图10A至图10B示出了根据一些实施方式的SR体积环境,其中通过朝向SR组表示移动来选择SR组表示。

图11A至图11B示出了根据一些实施方式的其中同时播放两个音频文件的SR体积环境。

图12A至图12C示出了根据一些实施方式的其中第一音频文件交错淡变至第二音频文件的SR体积环境。

图13示出了根据一些实施方式的在SR用户界面中移动对象的方法的流程图表示。

图14是根据一些实施方式的重组SR用户界面中的数据项的方法的流程图表示。

图15是根据一些实施方式的在SR用户界面中选择数据项组的方法的流程图表示。

图16示出了根据一些实施方式的播放两个音频文件的方法的流程图表示。

图17是根据一些实施方式的在两个音频文件之间交错淡变的方法的流程图表示。

根据通常的做法,附图中示出的各种特征部可能未按比例绘制。因此,为了清楚起见,可以任意地扩展或减小各种特征部的尺寸。另外,一些附图可能未描绘给定的系统、方法或设备的所有部件。最后,在整个说明书和附图中,类似的附图标号可用于表示类似的特征部。

发明内容

本文所公开的各种实施方式包括用于在SR用户界面中移动对象的设备、系统和方法。在各种实施方式中,方法由包括一个或多个处理器、非暂态存储器和显示器的设备执行。该方法包括识别多个数据项,该多个数据项中的每个数据项具有第一元数据字段。该方法包括在显示器上显示SR体积环境,该SR体积环境包括分别与多个第一组数据项对应的多个第一SR组表示,该多个第一组数据项中的每个第一组数据项分别包括该多个数据项中具有该第一元数据字段的多个第一元数据字段值中相应第一元数据字段值的数据项。该方法包括检测指向多个第一SR组表示中的特定第一SR组表示的第一用户输入。该方法包括,响应于检测到第一用户输入,将多个第一SR组表示中的特定第一SR组表示在SR体积环境中相对于多个第一SR组表示中的至少另一个第一SR组表示移动。

本文所公开的各种实施方式包括用于在SR用户界面中将数据项重新分组的设备、系统和方法。在各种实施方式中,方法由包括一个或多个处理器、非暂态存储器和显示器的设备执行。该方法包括识别多个数据项,该多个数据项中的每个数据项具有第一元数据字段和第二元数据字段。该方法包括在显示器上显示SR体积环境,该SR体积环境包括分别与多个第一组数据项对应的多个第一SR组表示,该多个第一组数据项中的每个第一组数据项分别包括该多个数据项中具有该第一元数据字段的多个第一元数据字段值中相应第一元数据字段值的数据项。该方法包括检测指示第二元数据字段的第一用户输入。该方法包括,响应于检测到第一用户输入,将多个第一SR组表示替换为分别与多个第二组数据项对应的多个第二SR组表示,该多个第二组数据项中的每个第二组数据项分别包括该多个数据项中具有该第二元数据字段的多个第二元数据字段值中相应第二元数据字段值的数据项。

本文所公开的各种实施方式包括用于在SR用户界面中选择数据项组的设备、系统和方法。在各种实施方式中,方法由包括一个或多个处理器、非暂态存储器和显示器的设备执行。该方法包括识别多个数据项,该多个数据项中的每个数据项具有第一元数据字段和第二元数据字段。该方法包括在显示器上显示SR体积环境,该SR体积环境包括分别与多个第一组数据项对应的多个第一SR组表示,该多个第一组数据项中的每个第一组数据项分别包括该多个数据项中具有第一元数据字段的数据项,该第一元数据字段包括多个第一元数据字段值中的相应第一元数据字段值。该方法包括检测指向与第一组数据项中的特定第一组数据项对应的多个第一SR组表示中的特定第一SR组表示的第一用户输入,该第一组数据项中的特定第一组数据项包括多个数据项中具有第一元数据字段的数据项,该第一元数据字段包括该多个第一元数据字段值中的特定第一元数据字段值。该方法包括,响应于检测到第一用户输入,将多个第一SR组表示中的特定第一SR组表示替换为分别与多个第二组数据项对应的多个第二SR组表示,该多个第二组数据项中的每个第二组数据项分别包括该多个数据项中具有第一元数据字段和第二元数据字段的数据项,该第一元数据字段包括多个第一元数据字段值中的特定第一元数据字段值,并且该第二元数据字段包括多个第二元数据字段值中相应的第二元数据字段值。

本文公开的各种实施方式包括用于播放两个音频文件的设备、系统和方法。在各种实施方式中,方法由包括一个或多个处理器、非暂态存储器、定向扬声器系统和显示器的设备执行。该方法包括在显示器上显示SR体积空间中的相应位置处的多个SR对象,该多个SR对象中的每个SR对象与多个音频文件中的至少一个音频文件的元数据字段的相应元数据字段值相关联。该方法包括确定SR体积空间中的用户位置与多个SR对象中的第一SR对象在SR体积空间中的第一位置之间的第一距离,其中第一SR对象与第一元数据字段值相关联。该方法包括确定SR体积空间中的用户位置与多个SR对象中的第二SR对象在SR体积空间中的第二位置之间的第二距离,其中第二SR对象与第二元数据字段值相关联。该方法包括选择该多个音频文件中的、具有包括第一元数据字段值的元数据字段的第一音频文件。该方法包括基于第一音频文件选择该多个音频文件中的、具有包括第二元数据字段值的元数据字段的第二音频文件。方法包括经由定向扬声器系统基于第一距离以第一音量在从第一位置开始的方向上播放第一音频文件,并且同时经由定向扬声器系统基于第二距离以第二音量在从第二位置开始的方向上播放第二音频文件。

根据一些实施方式,一种设备包括一个或多个处理器、非暂态存储器以及一个或多个程序;一个或多个程序被存储于非暂态存储器中并且被配置为由一个或多个处理器执行。一个或多个程序包括用于执行或促使执行本文描述的任何方法的指令。根据一些实施方式,一种非暂态计算机可读存储介质中存储有指令,这些指令在由设备的一个或多个处理器执行时使该设备执行或使执行本文所述方法中的任一种。根据一些实施方式,一种设备包括:一个或多个处理器、非暂态存储器以及用于执行或使执行本文所述方法中的任一种的装置。

具体实施方式

描述了许多细节以便提供对附图中所示的示例实施方式的透彻理解。然而,附图仅示出了本公开的一些示例方面,因此不应被视为限制。本领域的普通技术人员将理解,其他有效方面和/或变体不包括本文所述的所有具体细节。此外,没有详尽地描述众所周知的系统、方法、部件、设备和电路,以免模糊本文所述的示例性实施方式的更多相关方面。

如上所述,在大量数据项(诸如音频文件、视频文件、文档文件或网页)之间进行导航以定位特定数据项可能比较麻烦。本文描述了可用于打开多个数据项中的数据项的SR用户界面。在各种实施方式中,SR用户界面的呈现包括SR体积环境的显示,该SR体积环境包括在SR体积环境中用户周围的各个位置处的SR组表示。每个SR组表示对应于相应的一组数据项,其中该组中的每个数据项共享属性值。因此,大量文件在SR用户界面中表示为较少数量的SR组表示。

在各种实施方式中,SR组表示可在SR体积环境内由用户重新布置和组织。在各种实施方式中,数据项可被重新排序和/或重新分组,使得与第一属性的相应值相关联的相应SR组表示被替换为与第二属性的相应值相关联的相应SR组表示。在各种实施方式中,可选择与第一属性的特定值相关联的SR组表示,从而其可被替换为(1)具有第一属性的特定值的数据项的表示或(2)具有第一属性的特定值但第二属性的相应不同值的数据项组的相应SR组表示。

图1A是根据一些实施方式的示例性操作架构100A的框图。尽管示出了相关特征,但本领域的普通技术人员将从本公开中认识到,为简洁起见并且为了不模糊本文所公开的示例性实施方式的更多相关方面,未示出各种其他特征。为此,作为非限制性示例,操作架构100A包括电子设备120A。

在一些实施方式中,电子设备120A被配置为向用户呈现CGR内容。在一些实施方式中,电子设备120A包括软件、固件和/或硬件的合适组合。根据一些实施方式,在用户物理地存在于实体环境103内时,电子设备120A经由显示器122向用户呈现SR内容,该实体环境包括位于电子设备120A的视场111内的桌子107。因此,在一些实施方式中,用户将电子设备120A握在他/她的手中。在一些实施方式中,在提供增强现实(AR)内容时,电子设备120A被配置为显示AR对象(例如,AR立方体109)并实现在显示器122上对(例如,包括桌子107的表示117的)实体环境103的视频透传。

图1B是根据一些实施方式的示例性操作架构100B的框图。尽管示出了相关特征,但本领域的普通技术人员将从本公开中认识到,为简洁起见并且为了不模糊本文所公开的示例性实施方式的更多相关方面,未示出各种其他特征。为此,作为非限制性示例,操作环境100B包括控制器110和头戴式设备(HMD)120B。

在一些实施方式中,控制器110被配置为管理和协调针对用户的SR呈现。在一些实施方式中,控制器110包括软件、固件和/或硬件的合适组合。下文参考图2更详细地描述控制器110。在一些实施方式中,控制器110是相对于场景105处于本地或远程位置的计算设备。例如,控制器110是位于场景105内的本地服务器。又如,控制器110是位于场景105之外的远程服务器(例如,云服务器、中央服务器等)。在一些实施方式中,控制器110经由一个或多个有线或无线通信信道144(例如,蓝牙、IEEE802.11x、IEEE 802.16x、IEEE 802.3x等)与HMD 120B通信耦接。又如,控制器110被包括在HMD 120B的外壳内。

在一些实施方式中,HMD 120B被配置为向用户呈现SR内容。在一些实施方式中,HMD 120B包括软件、固件和/或硬件的合适组合。下文参考图3更详细地描述了HMD 120B。在一些实施方式中,控制器110的功能由HMD 120B提供和/或与HMD 120B结合。

根据一些实施方式,当用户虚拟地和/或物理地存在于场景105内时,HMD 120B向用户呈现SR内容。

在一些实施方式中,用户将HMD 120B戴在他/她头上。因此,HMD120B包括被提供用于显示SR内容的一个或多个SR显示器。例如,在各种实施方式中,HMD 120B包围用户的视场。在一些实施方式中,诸如在图1A中,使用被配置为呈现SR内容的手持设备(诸如智能电话或平板电脑)代替HMD 120B,并且用户不再佩戴HMD 120B而是手持该设备,使显示器朝向用户的视场,并且使相机朝向场景105。在一些实施方式中,手持设备可被放置在可被佩戴在使用者的头部的外壳内。在一些实施方式中,用被配置为呈现SR内容的SR舱、外壳或室替代HMD 120B,其中用户不再佩戴或手持HMD 120B。

图2是根据一些实施方式的控制器110的示例的框图。尽管示出了一些具体特征,但本领域的技术人员将从本公开中认识到,为简洁起见并且为了不模糊本文所公开的实施方式的更多相关方面,未示出各种其他特征。为此,作为非限制性示例,在一些实施方式中,控制器110包括一个或多个处理单元202(例如,微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、中央处理单元(CPU)、处理核心等)、一个或多个输入/输出(I/O)设备206、一个或多个通信接口208(例如,通用串行总线(USB)、FIREWIRE、THUNDERBOLT、IEEE 802.3x、IEEE 802.11x、IEEE 802.16x、全球移动通信系统(GSM)、码分多址(CDMA)、时分多址(TDMA)、全球定位系统(GPS)、红外(IR)、蓝牙、ZIGBEE和/或相似类型接口)、一个或多个编程(例如,I/O)接口210、存储器220以及用于互连这些部件和各种其他部件的一条或多条通信总线204。

在一些实施方式中,所述一条或多条通信总线204包括互连系统部件和控制系统部件之间的通信的电路。在一些实施方式中,一个或多个I/O设备206包括键盘、鼠标、触控板、操纵杆、一个或多个麦克风、一个或多个扬声器、一个或多个图像传感器、一个或多个显示器等中的至少一种。

存储器220包括高速随机存取存储器,诸如动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、双倍数据速率随机存取存储器(DDR RAM)或者其他随机存取固态存储器设备。在一些实施方式中,存储器220包括非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存存储器设备或其他非易失性固态存储设备。存储器220任选地包括远离一个或多个处理单元202定位的一个或多个存储设备。存储器220包括非暂态计算机可读存储介质。在一些实施方式中,存储器220或者存储器220的非暂态计算机可读存储介质存储下述程序、模块和数据结构或者它们的子集,其中包括任选的操作系统230和SR体验模块240。

操作系统230包括用于处理各种基础系统服务和用于执行硬件相关任务的过程。在一些实施方式中,SR体验模块240被配置为管理和协调一个或多个用户的单重或多重SR体验(例如,一个或多个用户的单重SR体验,或一个或多个用户的相应群组的多重SR体验)。为此,在各种实施方式中,SR体验模块240包括数据获取单元242、跟踪单元244、协调单元246和数据传输单元248。

在一些实施方式中,数据获取单元242被配置为至少从HMD 120B获取数据(例如,呈现数据、交互数据、传感器数据、位置数据等)。为此,在各种实施方式中,数据获取单元242包括指令和/或用于指令的逻辑部件以及启发法和用于启发法的元数据。

在一些实施方式中,跟踪单元244被配置为映射场景105并且至少跟踪HMD 120B相对于场景105的位置/定位。为此,在各种实施方式中,跟踪单元244包括指令和/或用于指令的逻辑部件以及启发法和用于启发法的元数据。

在一些实施方式中,协调单元246被配置为管理和协调由HMD 120B向用户呈现的SR体验。为此,在各种实施方式中,协调单元246包括指令和/或用于指令的逻辑部件以及启发法和用于启发法的元数据。

在一些实施方式中,数据传输单元248被配置为至少向HMD 120B传输数据(例如,呈现数据、位置数据等)。为此,在各种实施方式中,数据传输单元248包括指令和/或用于指令的逻辑部件以及启发法和用于启发法的元数据。

尽管数据获取单元242、跟踪单元244、协调单元246和数据传输单元248被示为驻留在单个设备(例如,控制器110)上,但应当理解,在其他实施方式中,数据获取单元242、跟踪单元244、协调单元246和数据传输单元248的任何组合可位于单独计算设备中。

此外,图2更多地用作可以存在于特定实施方案中的各种特征的功能描述,与本文所述的实施方式的结构示意图不同。如本领域的普通技术人员将认识到的,单独显示的项目可以组合,并且一些项目可以分开。例如,图2中单独示出的一些功能模块可以在单个模块中实现,并且单个功能块的各种功能可在各种实施方式中通过一个或多个功能块来实现。模块的实际数量和特定功能的划分以及如何在其中分配特征将根据实施方式而变化,并且在一些实施方式中,部分地取决于为特定实施方案选择的硬件、软件和/或固件的特定组合。

图3是根据一些实施方式的HMD 120B的示例的框图。尽管示出了一些具体特征,但本领域的技术人员将从本公开中认识到,为简洁起见并且为了不模糊本文所公开的实施方式的更多相关方面,未示出各种其他特征。出于该目的,作为非限制性示例,在一些实施方式中,HMD 120B包括一个或多个处理单元302(例如,微处理器、ASIC、FPGA、GPU、CPU、处理核心等)、一个或多个输入/输出(I/O)设备及传感器306、一个或多个通信接口308(例如,USB、FIREWIRE、THUNDERBOLT、IEEE802.3x、IEEE 802.11x、IEEE 802.16x、GSM、CDMA、TDMA、GPS、IR、BLUETOOTH、ZIGBEE和/或类似类型的接口)、一个或多个编程(例如,I/O)接口310、一个或多个SR显示器312、一个或多个任选的面向内部和/或面向外部的图像传感器314、存储器320以及用于互连这些部件和各种其他部件的一条或多条通信总线304。

在一些实施方式中,一条或多条通信总线304包括互连和控制系统部件之间的通信的电路。在一些实施方式中,一个或多个I/O设备和传感器306包括惯性测量单元(IMU)、加速度计、陀螺仪、温度计、一个或多个生理传感器(例如,血压监测仪、心率监测仪、血氧传感器、血糖传感器等)、一个或多个麦克风、一个或多个扬声器(例如,耳机或扩音器)、触觉引擎、一个或多个深度传感器(例如,结构光、飞行时间等)等中的至少一者。

在一些实施方式中,一个或多个SR显示器312被配置为向用户提供SR体验。在一些实施方式中,一个或多个SR显示器312对应于全息、数字光处理(DLP)、液晶显示器(LCD)、硅上液晶(LCoS)、有机发光场效应晶体管(OLET)、有机发光二极管(OLED)、表面传导电子发射显示器(SED)、场发射显示器(FED)、量子点发光二极管(QD-LED)、微机电系统(MEMS)和/或类似的显示器类型。在一些实施方式中,一个或多个SR显示器312对应于衍射、反射、偏振、全息等波导显示器。例如,HMD 120B包括单个SR显示器。在另一示例中,HMD 120B包括针对用户的每只眼睛的SR显示器。在一些实施方式中,一个或多个SR显示器312能够呈现AR和VR内容。

在一些实施方式中,一个或多个图像传感器314被配置为获取对应于用户面部的至少一部分(包括用户的眼睛)的图像数据(因而可称为眼睛跟踪相机)。在一些实施方式中,一个或多个图像传感器314被配置成面向前方,以便获取与当不存在HMD 120B时用户会看到的场景对应的图像数据(因而可以被称为场景相机)。一个或多个图像传感器314可包括一个或多个RGB相机(例如,具有互补金属氧化物半导体(CMOS)图像传感器或电荷耦合器件(CCD)图像传感器)、一个或多个红外(IR)相机和/或一个或多个基于事件的相机等。

存储器320包括高速随机存取存储器,诸如DRAM、SRAM、DDR RAM或其他随机存取固态存储器设备。在一些实施方式中,存储器320包括非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存存储器设备或其他非易失性固态存储设备。存储器320任选地包括远离一个或多个处理单元302定位的一个或多个存储设备。存储器320包括非暂态计算机可读存储介质。在一些实施方式中,存储器320或存储器320的非暂态计算机可读存储介质存储下述程序、模块和数据结构或者它们的子集,其中包括可选的操作系统330和SR呈现模块340。

操作系统330包括用于处理各种基础系统服务和用于执行硬件相关任务的过程。在一些实施方式中,SR呈现模块340被配置为经由一个或多个SR显示器312向用户呈现SR内容。为此,在各种实施方式中,SR呈现模块340包括数据获取单元342、SR用户界面单元344、声音处理单元346和数据传输单元348。

在一些实施方式中,数据获取单元342被配置为从控制器110(例如,经由通信接口308)、I/O设备和传感器306或者一个或多个图像传感器314中的一者或多者获取数据(例如,呈现数据、交互数据、传感器数据、位置数据等)。为此,在各种实施方式中,数据获取单元342包括指令和/或用于指令的逻辑部件以及启发法和用于启发法的元数据。

在一些实施方式中,SR用户界面单元344被配置为经由一个或多个SR显示器312呈现包括SR用户界面的SR内容。为此,在各种实施方式中,SR呈现单元344包括指令和/或用于指令的逻辑以及启发法和用于启发法的元数据。

在一些实施方式中,声音处理单元346被配置为分析和/或修改声音数据。出于该目的,在各种实施方式中,平面检测单元346包括指令和/或用于指令的逻辑以及启发法和用于启发法的元数据。

在一些实施方式中,数据传输单元348被配置为至少向控制器110传输数据(例如,呈现数据、位置数据等)。为此,在各种实施方式中,数据传输单元348包括指令和/或用于指令的逻辑部件以及启发法和用于启发法的元数据。

尽管数据获取单元342、SR用户界面单元344、声音处理单元346和数据传输单元348被示为驻留在单个设备(例如,HMD 120B)上,但应当理解,在其他实施方式中,数据获取单元342、SR用户界面单元344、声音处理单元346和数据传输单元348的任何组合可位于单独的计算设备中。

此外,图3更多地用作可能存在于特定实施方案中的各种特征的功能描述,与本文所述的实施方式的结构示意图不同。如本领域的普通技术人员将认识到的,单独显示的项目可以组合,并且一些项目可以分开。例如,图3中单独示出的一些功能模块可以在单个模块中实现,并且单个功能块的各种功能可在各种实施方式中通过一个或多个功能块来实现。模块的实际数量和特定功能的划分以及如何在其中分配特征将根据实施方式而变化,并且在一些实施方式中,部分地取决于为特定实施方案选择的硬件、软件和/或固件的特定组合。

图4示出了基于其中存在用户420的真实环境的SR体积环境400。在图4中,用户420正在佩戴HMD并调查SR体积环境400(如以下附图中的第一人称视图所示)。SR体积环境400包括多个对象,包括多个真实对象(例如,桌子412和与真实环境的真实桌子和灯对应的灯414)和多个虚拟对象(例如,多个SR组表示440A-440G)。在各种实施方式中,在第一SR体积环境400中的位置处(例如,在由三维(3D)SR坐标系中的三个坐标限定的位置处)显示每个对象。因此,当用户420在SR体积环境400中移动(例如,改变位置和/或取向)时,对象在HMD的显示器上被移动,但保持其在SR环境400中的位置。在各种实施方式中,虚拟对象(例如,SR组表示440A-440D)中的一个或多个虚拟对象位于SR体积环境400中用户420的视场内的位置处,而虚拟对象(例如,SR组表示440E-440G)位于SR体积环境400中不在用户420的视场内的位置处,至少直到用户420改变SR体积环境400内的位置和/或取向。

在各种实施方式中,SR组表示分别对应于数据项组。在各种实施方式中,每个数据项具有第一元数据字段(包括相应的第一元数据字段值)。在各种实施方式中,每个数据项具有第二元数据字段(包括相应的第二元数据字段值)。例如,在各种实施方式中,数据项是音频文件,并且第一元数据字段是艺术家元数据字段(包括诸如“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”等值),并且第二元数据字段是专辑元数据字段(包括诸如“专辑名称1”、“专辑名称2”和“专辑名称3”等值)。在各种实施方式中,数据项是文档文件,并且第一元数据字段是文档类型字段(包括诸如“文本”、“电子表格”和“幻灯片演示”等值),并且第二元数据字段是作者元数据字段(包括诸如“Alice”、“Bob”和“Carl”等值)。在各种实施方式中,数据项是电影文件,并且第一元数据字段是流派元数据字段,并且第二元数据字段是发行年份元数据字段。在各种实施方式中,数据项是在线商店的网页,并且第一元数据字段是品牌元数据字段,并且第二元数据字段是价格元数据字段。在各种实施方式中,数据项可具有附加的和/或其他元数据字段。

在各种实施方式中,SR组表示分别对应于包括具有第一元数据字段的数据项的数据项组,该第一元数据字段包括多个第一元数据字段值中的相应第一元数据字段值。例如,在各种实施方式中,SR组表示包括与具有包括“文本”的文档类型元数据字段的一组数据项对应的第一SR组表示,以及与具有包括“电子表格”的文档类型元数据字段的一组数据项对应的第二SR组表示。在各种实施方式中,SR组表示包括与具有包括“艺术家姓名1”的艺术家元数据字段的一组数据项对应的第一SR组表示,以及与具有包括“艺术家姓名2”的艺术家元数据字段的一组数据项对应的第二SR组表示。

图5A示出了根据一些实施方式的用户角度的SR体积环境500。SR体积环境500包括多个对象。SR体积环境500中的多个对象包括多个真实对象,诸如与真实环境的真实桌子和灯对应的桌子512和灯514。真实对象还包括与用户的左手和右手对应的左手590L和右手590R。SR体积环境500中的多个对象包括多个虚拟对象,诸如多个第一SR组表示541A-541D。

第一SR组表示541A-541D对应于具有文档类型元数据字段和作者元数据字段的文档文件组。相应的第一SR组表示541A-541D对应于相应的文档类型元数据字段值。在各种实施方式中,第一SR组表示541A-541D与具有相应文档类型元数据字段值的标记一起显示,诸如用于打开该文档类型的文档文件的应用程序的图标。

第一SR组表示541A-541D包括与一组文档文件对应的电子表格组表示541A,该组文档文件具有包括值“电子表格”的文档类型元数据字段。第一SR组表示541A-541D包括与一组文档文件对应的呈现组表示541B,该组文档文件具有包括值“幻灯片呈现”的文档类型元数据字段。第一SR组表示541A-541D包括与具有文档类型元数据字段的一组文档文件对应的其他组表示541C,该文档类型元数据字段包括值“其他”或至少缺少与第一SR组表示中的其他第一SR组表示对应的值。第一SR组表示541A-541D包括与具有包括值“文本”的文档类型元数据字段的一组文档文件对应的文本组表示541D。

图5B示出了其中用户输入指向文本组表示541D的图5A的SR体积环境500。在图5B中,用户输入包括用户用其右手抓住文本组表示541D并将其朝向桌子512的顶部移动。

图5C示出了响应于检测到指向文本组表示541D的用户输入的图5B的SR体积环境500。在图5C中,文本组表示541D已经从其初始位置(如图5B所示)移动到桌子512的顶部上的位置(如图5C所示)。因此,文本组表示541D相对于第一SR组表示541A-541C中的至少另一个第一SR组表示在SR体积环境500中移动。

图5D示出了用户在SR体积环境500内移动的图5C的SR体积环境500。在图5D中,用户从SR体积环境500中面向桌子的第一位置朝向面向SR体积环境500的左后角的SR体积环境500的右后角移动。

图5E示出了响应于检测到用户在SR体积环境500内移动的图5D的SR体积环境500。虽然多个对象例如在由用户佩戴的HMD的显示器上被显示在用户视场中的不同位置处,但是多个对象被显示在SR体积环境500内的相同位置处。因此,在各种实施方式中,在图5D中,在显示器上的第一多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D,并且响应于检测到SR体积环境中的用户位置和/或取向的变化,在显示器上的第二多个位置处在SR体积环境中的相同的多个位置处显示第一SR组表示541A-541D。

在各种实施方式中,第一SR组表示541A-541D在SR体积环境500中的位置随时间推移是持久的。例如,在各种实施方式中,位置存储在非暂态存储器中。因此,即使当用户停止使用呈现SR用户界面的应用程序和/或设备并且稍后返回到呈现SR用户界面的应用程序和/或设备时,第一SR组表示541A-541D也显示在SR体积环境500中的相同位置处。以这种方式,SR体积环境500类似于计算机桌面,从而允许用户在后续任何时候在其认为适合使用时重新布置和组织第一SR组表示541A-541D(例如,使用如相对于图5B所述的用户输入)。

图5F示出了其中用户输入指向文本组表示541D的图5E的体积环境500。在图5F中,用户输入包括用户用其右手的单个手指触摸文本组表示541D。因此,图5F中的用户输入(触摸文本组表示541D)不同于图5B中的用户输入(抓取文本组表示541D)。虽然图5F中指向文本组表示541D的用户输入包括触摸文本组表示541D(如同弹出气泡一样),但是下文进一步描述了选择SR组表示的其他类型的用户输入。

图5G示出了响应于检测到指向文本组表示541D的用户输入的图5F的体积环境500。在图5G中,文本组表示541D被替换为多个第二SR组表示542A-542D。与第一SR组表示541A-541D类似,第二SR组表示542A-542D对应于具有文档类型元数据字段和作者元数据字段的文档文件组。第二SR组表示542A-542D对应于文档文件组,其包括文档类型元数据字段值“文本”和被包括在作者元数据字段中的不同值。

相应的第二SR组表示542A-542D对应于相应作者元数据字段值(和文档类型元数据字段值中的所选的一个文档类型元数据字段值)。在各种实施方式中,第二SR组表示542A-542D与具有相应作者元数据字段值的标记一起显示,诸如文档文件的作者的头像。在各种实施方式中,第二SR组表示542A-542D还与具有文档类型元数据字段值中的所选的一个文档类型元数据字段值的标记一起显示。

因此,第二SR组表示542A-542D包括与一组文档文件对应的Alice-文本组表示542A,该组文档文件具有包括值“文本”的文档类型元数据字段和具有作者元数据字段值“Alice”的作者元数据字段。第二SR组表示542A-542D包括与一组文档文件对应的Bob-文本组表示542B,该组文档文件具有包括值“文本”的文档类型元数据字段和具有作者元数据字段值“Bob”的作者元数据字段。第二SR组表示542A-542D包括与一组文档文件对应的Carl-文本组表示542C,该组文档文件具有包括值“文本”的文档类型元数据字段和具有作者元数据字段值“Carl”的作者元数据字段。第二SR组表示542A-542D包括与一组文档文件对应的Dave-文本组表示542D,该组文档文件具有包括值“文本”的文档类型元数据字段和具有作者元数据字段值“Dave”的作者元数据字段。

尽管在图5G中显示了其他第一SR组表示541A-541C,但在各种实施方式中,响应于指向特定的第一SR组表示的用户输入,其他SR组表示停止被显示或以不同的方式被显示(例如,更小、更远、变灰、更透明等),以将用户的注意力集中在替换特定第一SR组表示的第二SR组表示上。

图5G示出了指向Dave-文本组表示542D的用户输入。在图5G中,用户输入包括用户用其右手的单个手指触摸Dave-文本组表示542D。

图5H示出了响应于检测到指向Dave-文本组表示542D的用户输入的图5G的SR体积环境500。在图5H中,Dave-文本组表示542D被替换为多个SR项表示543A-543D。SR项表示543A-543D对应于具有文档类型元数据字段和作者元数据字段的文档文件。具体地,每个SR项表示543A-543D对应于具有文档类型元数据字段和作者元数据字段的文档文件,该文档类型元数据字段包括文档类型元数据字段值“文本”,该作者元数据字段包括作者元数据字段值“Dave”。SR项表示543A-543D包括与名为“one.txt”的文档文件对应的第一SR项表示543A、与名为“two.txt”的文档文件对应的第二SR项表示543B、与名为“three.txt”的文档文件对应的第三SR项表示543C,以及与名为“four.txt”的文档文件对应的第四SR项表示543D。

尽管在图5H中未显示其他第二SR组表示542A-542C,但在各种实施方式中,响应于指向特定第二SR组表示的用户输入而显示其他第二SR组表示(在相同位置或在不同位置以为SR项表示腾出空间)。

图5H示出了指向第三SR项表示543C的用户输入。在图5H中,用户输入包括用户用其右手的单个手指触摸第三SR项表示543C。

图5I示出了响应于检测到指向第三SR项表示543C的用户输入的图5H的SR体积环境500。图5I的SR体积环境500包括另一个虚拟对象、包括名为“three.txt”的文档文件的内容545的文本显示窗口544以及关闭示能表示546,该关闭示能表示546在经由用户输入被选择时关闭文本显示窗口544。

图5J示出了其中用户输入指示作者元数据字段的图5E的SR体积环境500。在图5J中,用户输入包括由用户发出的言语命令591。在各种实施方式中,言语命令591显示在SR体积环境中。在各种实施方式中,不显示言语命令591。

图5K示出了响应于检测到指示作者元数据字段的用户输入的图5J的SR体积环境500。在图5J中,第一SR组表示541A-541D被替换为多个第三SR组表示551A-551D。与第一SR组表示541A-541D类似,第三SR组表示551A-551D对应于具有文档类型元数据字段和作者元数据字段的文档文件组。然而,其中第一SR组表示541A-541D中的不同的第一SR组表示对应于不同的文档类型元数据字段值,第三SR组表示551A-551D中的不同的第三SR组表示对应于不同作者元数据字段值。因此,相应的第三SR组表示551A-551D对应于相应的作者元数据字段值。在各种实施方式中,第三SR组表示551A-551D与具有相应作者元数据字段值的标记一起显示,诸如文档文件的作者的头像。

因此,第三SR组表示551A-551D包括与具有包括值“Alice”的作者元数据字段的一组文档文件对应的Alice组表示551A。第三SR组表示551A-551D包括与具有包括值“Bob”的作者元数据字段的一组文档文件对应的Bob组表示551B。第三SR组表示551A-551D包括与具有包括值“Carl”的作者元数据字段的一组文档文件对应的Carl组表示551C。第三SR组表示551A-551D包括与具有包括值“Dave”的作者元数据字段的一组文档文件对应的Dave组表示551D。

在各种实施方式中,将第一SR组表示541A-541D替换为第三SR组表示551A-551D包括显示动画,其中第一SR组表示541A-541D显示为分解成移动到新位置并聚合成第三SR组表示551A-551D的SR项表示。图5L1-5L6示出了在图5J和图5K之间的动画期间的SR体积环境500。

图5M示出了包括指向Carl组表示551C的用户输入的图5K的SR体积环境500。在图5M中,用户输入包括用户用其右手的单个手指触摸Carl组表示551C。

图5N示出了响应于检测到指向Carl组表示551C的用户输入的图5M的体积环境500。在图5N中,Carl组表示551C被替换为多个第四SR组表示552A-552C。与第三SR组表示551A-551C类似,第四SR组表示552A-552C对应于具有文档类型元数据字段和作者元数据字段的文档文件组。然而,第四SR组表示552A-552C对应于包括作者元数据字段值“Carl”(以及文档类型元数据字段中的不同值)的文档文件组。

相应的第四SR组表示552A-552C对应于相应的文档类型元数据字段值(和作者元数据字段值中的所选的一个作者元数据字段值)。在各种实施方式中,第四SR组表示552A-552C与具有相应文档类型元数据字段值的标记一起显示,诸如用于打开该文档类型的文档文件的应用程序的图标。在各种实施方式中,第四SR组表示552A-552C还与具有作者元数据字段值中的所选的一个作者元数据字段值的标记一起显示。

因此,第四SR组表示552A-552C包括与一组文档文件对应的文本-Carl组表示552A,该组文档文件具有包括值“文本”的文档类型元数据字段和具有作者元数据字段值“Carl”的作者元数据字段。第四SR组表示552A-552C包括与一组文档文件对应的呈现-Carl组表示552B,该组文档文件具有包括值“幻灯片呈现”的文档类型元数据字段和具有作者元数据字段值“Carl”的作者元数据字段。第四SR组表示552A-552C包括与一组文档文件对应的电子表格-Carl组表示552C,该组文档文件具有包括值“电子表格”的文档类型元数据字段和具有作者元数据字段值“Carl”的作者元数据字段。在图5N的示例中,不存在具有包括值“其他”的文档类型元数据字段和具有值“Carl”的作者元数据字段的文档文件。因此,在图5N的示例中,第四SR组表示552A-552C不包括与一组文档文件对应的其他-Carl组表示,该组文档文件具有包括值“其他”的文档类型元数据字段和具有作者元数据字段值“Carl”的作者元数据字段。

尽管在图5N中显示了其他第三SR组表示551A-551C,但在各种实施方式中,响应于指向特定的第三SR组表示的用户输入,其他三SR组表示停止被显示或以不同的方式被显示(例如,更小、更远、变灰、更透明等),以将用户的注意力集中在替换特定第三SR组表示的第四SR组表示上。

图5N示出了指向呈现-Carl组表示552B的用户输入。在图5N中,用户输入包括用户用其右手的单个手指触摸呈现-Carl组表示552B。

图5O示出了响应于检测到指向呈现-Carl组表示552B的用户输入的图5N的SR体积环境500。在图5O中,呈现-Carl组表示552B被替换为多个SR项表示553A-553B。SR项表示553A-553B对应于具有文档类型元数据字段和作者元数据字段的文档文件。具体地,每个SR项表示553A-553B对应于具有文档类型元数据字段和作者元数据字段的文档文件,该文档类型元数据字段包括文档类型元数据字段值“幻灯片呈现”,该作者元数据字段包括作者元数据字段值“Carl”。SR项表示553A-553B包括与名为“one.ppt”的文档文件对应的第一SR项表示553A和与名为“two.ppt”的文档文件对应的第二SR项表示553B。

尽管在图5O中未显示其他第四SR组表示552A-552C,但在各种实施方式中,响应于指向特定第四SR组表示的用户输入而显示其他第四SR组表示(在相同位置或在不同位置以为SR项表示腾出空间)。

图5O示出了指向第二SR项表示553B的用户输入。在图5O中,用户输入包括用户用其右手的单个手指触摸第二SR项表示553B。

图5P示出了响应于检测到指向第二SR项表示553B的用户输入的图5O的SR体积环境500。图5P的SR体积环境500包括另一个虚拟对象、包括名为“two.ppt”的文档文件的内容555的一部分的幻灯片呈现显示窗口554、用于在名为“two.ppt”的文档文件的内容中进行导航的导航示能表示557A-557B、以及关闭示能表示556,该关闭示能表示在经由用户输入被选择时关闭幻灯片呈现显示窗口554。

图6A示出了根据一些实施方式的用户角度的SR体积环境600。SR体积环境600包括多个对象。SR体积环境600中的多个对象包括多个真实对象,诸如与真实环境的真实桌子和灯对应的桌子612和灯614。真实对象还包括与用户的左手和右手对应的左手690L和右手690R。SR体积环境600中的多个对象包括多个虚拟对象,诸如多个第一SR组表示641A-641D。

第一SR组表示641A-641D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。相应的第一SR组表示641A-641D对应于相应的艺术家元数据字段值。在各种实施方式中,第一SR组表示641A-641D与具有相应艺术家元数据字段值的标记一起显示,诸如音频文件的艺术家的照片和/或指示艺术家元数据字段值的文本。

第一SR组表示641A-641D包括与一组音频文件对应的艺术家姓名1组表示641A,该组音频文件具有包括值“艺术家姓名1”的艺术家元数据字段。第一SR组表示641A-641D包括与一组音频文件对应的艺术家姓名2组表示641B,该组音频文件具有包括值“艺术家姓名2”的艺术家元数据字段。第一SR组表示641A-641D包括与一组音频文件对应的艺术家姓名3组表示641C,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段。第一SR组表示641A-641D包括与一组音频文件对应的艺术家姓名4组表示641D,该组音频文件具有包括值“艺术家姓名4”的艺术家元数据字段。

图6B示出了图6A的SR体积环境600,其中第一SR组表示641A-641D使用具有相应艺术家元数据字段值的标记来被显示为旋转球,该标记为与艺术家元数据字段值相关联的相应专辑元数据字段值的多个标记的形式(例如,专辑封面)。因此,在各个不同的时间,用户的视场包括显示各种不同专辑封面的第一SR组表示641A-641D。

图6C示出了图6A的SR体积环境600,其中第一SR组表示641A-641D与具有相应艺术家元数据字段值的标记一起显示,该标记为相应专辑元数据字段值的多个标记的形式(例如,专辑封面),该相应专辑元数据字段值的多个标记与围绕中心旋转的艺术家元数据字段值相关联(在各种实施方式中,艺术家元数据字段值包括相应艺术家元数据字段值的附加标记,诸如艺术家照片和/或指示艺术家元数据字段值的文本)。因此,第一SR组表示641A-641D显示为“太阳系”,其中行星是专辑封面并且太阳(如果存在)是艺术家照片。

图6D示出了图6A的SR体积环境600,其中第一SR组表示641A-641D与具有相应艺术家元数据字段值的标记一起显示,该标记为相应专辑元数据字段值的多个标记的形式(例如,专辑封面),该相应专辑元数据字段值的多个标记与云线中的艺术家元数据字段值相关联(在各种实施方式中,艺术家元数据字段值包括相应艺术家元数据字段值的附加标记,诸如艺术家照片和/或指示艺术家元数据字段值的文本)。

图6D示出了指向艺术家姓名3组表示641C的用户输入。在图6D中,用户输入包括用户用其右手的单个手指触摸艺术家姓名3组表示641C。虽然指向艺术家姓名3组表示641C的用户输入包括触摸艺术家姓名3组表示641C,但是下文进一步描述了选择SR组表示的其他类型的用户输入。

图6E示出了响应于检测到指向艺术家姓名3组表示641C的用户输入的图6D的体积环境600。在图6E中,艺术家姓名3组表示641C被替换为多个第二SR组表示642A-642D。与第一SR组表示641A-641D类似,第二SR组表示642A-642D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。第二SR组表示642A-642D对应于音频文件组,其包括艺术家元数据字段值“艺术家姓名3”(和专辑元数据字段中的不同值)。

相应的第二SR组表示642A-642D对应于相应专辑元数据字段值(和艺术家元数据字段值中的所选的一个艺术家元数据字段值)。在各种实施方式中,第二SR组表示642A-642D与相应专辑元数据字段值的标记一起显示,诸如专辑封面。

因此,第二SR组表示642A-642D包括与一组音频文件对应的专辑名称1组表示642A,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段和具有专辑元数据字段值“专辑名称1”的专辑元数据字段。第二SR组表示642A-642D包括与一组音频文件对应的专辑名称2组表示642B,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段和具有专辑元数据字段值“专辑名称2”的专辑元数据字段。第二SR组表示642A-642D包括与一组音频文件对应的专辑名称3组表示642C,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段和具有专辑元数据字段值“专辑名称3”的专辑元数据字段。第二SR组表示642A-642D包括与一组音频文件对应的专辑名称4组表示642D,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段和具有专辑元数据字段值“专辑名称4”的专辑元数据字段。

尽管在图6E中显示了其他第一SR组表示641A-641C,但在各种实施方式中,响应于指向特定的第一SR组表示的用户输入,其他SR组表示以相同的方式或不同的方式被显示(例如,更小、更远、变灰、更透明等),以将用户的注意力集中在替换特定第一SR组表示的第二SR组表示上。

在各种实施方式中,将第一SR组表示641A-641D替换为第二SR组表示642A-642D包括显示动画,其中第一SR组表示641A-641D(其包括相关联专辑元数据字段值的标记,诸如专辑封面)显示为分解成第二SR组表示642A-642D。图6F1至图6F4示出了在图6E和图6F之间的动画期间的SR体积环境600。

图6G示出了其中用户输入指向专辑名称4组表示642D的图6F的SR体积环境600。在图6G中,用户输入包括用户用其右手的单个手指触摸专辑名称4组表示642D。

图6H示出了响应于检测到指向专辑名称4组表示642D的用户输入的图6G的体积环境600。在图6H中,专辑名称4组表示642D被替换为多个SR项表示643A-643D。SR项表示643A-643D对应于具有艺术家元数据字段和专辑元数据字段的音频文件(例如,歌曲)。具体地,每个SR项表示643A-643D对应于具有艺术家元数据字段和专辑元数据字段的音频文件,该艺术家元数据字段包括艺术家元数据字段值“艺术家姓名3”,该专辑元数据字段包括专辑元数据字段值“专辑名称4”。SR项表示643A-643D包括与名为“歌曲名称1”的音频文件对应的第一SR项表示643A、与名为“歌曲名称2”的音频文件对应的第二SR项表示643B、与名为“歌曲名称3”的音频文件对应的第三SR项表示643C,以及与名为“歌曲名称4”的音频文件对应的第四SR项表示643D。

尽管在图6H中未显示其他第二SR组表示,但在各种实施方式中,响应于指向特定第二SR组表示的用户输入而显示其他SR组表示(在相同位置或在不同位置以为SR项表示腾出空间)。

图6H示出了指向第四SR项表示643D的用户输入。在图6H中,用户输入包括用户用其右手的单个手指触摸第四SR项表示643D。响应于检测到指向第四SR项表示的用户输入而播放音频文件(例如,在用户佩戴的HMD的扬声器上)。

尽管上文描述了用于选择SR组表示的某些用户输入(例如,触摸图5F中的球或触摸图6D中的云线),但下文描述了用于选择SR组表示的其他用户输入。

图7A示出了其中用户输入指向艺术家姓名4组表示641D的图6A的SR体积环境600。在图7A中,用户输入包括用户用其右手抓住艺术家姓名4组表示641D并将其朝向用户移动。

图7B示出了在指向艺术家姓名4组表示641D的用户输入的第一部分之后的图7A的SR体积环境600。在图7B中,将艺术家姓名4组表示641D从其在SR体积环境600中的初始位置移动到靠近用户位置的位置。因此,与图7A相比,艺术家姓名4组表示641D在用户的视场中看起来是放大的。此外,使第一SR组表示641A-641C中的其他表示淡变。

图7C示出了在指向艺术家姓名4组表示641D的用户输入的第二部分之后的图7B的SR体积环境600。在图7C中,响应于艺术家姓名4组表示641D的位置位于距用户位置的阈值距离内,艺术家姓名4组表示641D被替换为多个第二SR组表示647A-647D。与第一SR组表示641A-641D类似,第二SR组表示647A-647D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。第二SR组表示647A-647D对应于音频文件组,其包括艺术家元数据字段值“艺术家姓名4”(和专辑元数据字段中的不同值)。

图8A示出了其中用户输入指向艺术家姓名4组表示641D的图6A的SR体积环境600。在图8A中,用户输入包括用户用其左手和其右手拉开(或展开)艺术家姓名4组表示641D。在各种实施方式中,拉开手势可被执行为使用用户单手的展开手势(其中用户的食指和拇指在艺术家姓名4组表示641D的位置处展开)。

图8B示出了在指向艺术家姓名4组表示641D的用户输入的第一部分之后的图8A的SR体积环境600。在图8B中,艺术家姓名4组表示641D在SR体积环境600中的其初始位置处放大。此外,第一SR组表示641A-64C中的其他表示淡入淡出。

图8C示出了在指向艺术家姓名4组表示641D的用户输入的第二部分之后的图8B的SR体积环境600。在图8C中,响应于用户的左手和用户的右手相距大于阈值距离,艺术家姓名4组表示641D被替换为多个第二SR组表示647A-647D。与第一SR组表示641A-641D类似,第二SR组表示647A-647D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。第二SR组表示647A-647D对应于音频文件组,其包括艺术家元数据字段值“艺术家姓名4”(和专辑元数据字段中的不同值)。

图8C示出了指向多个第二SR组表示647A-647D的用户输入。在图8C中,用户输入包括用户用其左手和其右手捏合(或收拢)多个第二SR组表示647A-647D。

图8D示出了在指向多个第二SR组表示647A-647D的用户输入的第一部分之后的图8C的SR体积环境600。在图8D中,多个第二SR组表示647A-647D朝向彼此移动。

图8E示出了在指向多个第二SR组表示647A-647D的用户输入的第二部分之后的图8D的SR体积环境600。在图8E中,响应于用户的左手和用户的右手相距小于阈值距离,多个第二SR组表示647A-647D被替换为艺术家姓名4组表示641D(并且其他第一SR组表示641A-641C被重新显示)。

图9A示出了其中用户输入指向艺术家姓名4组表示641D的图6A的SR体积环境600。在图9A中,用户输入包括用户查看艺术家姓名4组表示641D并执行触发手势(例如,挤眼、眨眼、按下按钮、弹响指等)。用户的注视点在图9A中由注视点指示符695示出,根据实施方式,注视点指示符695可被显示或可不被显示。

图9B示出了响应于检测到指向艺术家姓名4组表示641D的用户输入的图9A的体积环境600。在图9B中,艺术家姓名4组表示641D被替换为多个第二SR组表示647A-647D。与第一SR组表示641A-641D类似,第二SR组表示647A-647D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。第二SR组表示647A-647D对应于音频文件组,其包括艺术家元数据字段值“艺术家姓名4”(和专辑元数据字段中的不同值)。

图10A示出了其中用户输入指向艺术家姓名4组表示641D的图6A的SR体积环境600。在图10A中,用户输入包括用户在SR体积环境600内朝向艺术家姓名4组表示641D移动。

图10B示出了在指向艺术家姓名4组表示641D的用户输入之后的图10A的体积环境600。在图10B中,响应于用户与艺术家姓名4组表示641D的距离小于阈值距离,艺术家姓名4组表示641D被替换为多个第二SR组表示647A-647D。与第一SR组表示641A-641D类似,第二SR组表示647A-647D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。第二SR组表示647A-647D对应于音频文件组,其包括艺术家元数据字段值“艺术家姓名4”(和专辑元数据字段中的不同值)。

图11A示出了根据一些实施方式的用户角度的SR体积环境700。图11A的SR体积环境700基本上类似于图6A的SR体积环境600,但缺少艺术家姓名4组表示641D。因此,SR体积环境700包括多个对象。SR体积环境700中的多个对象包括多个真实对象,诸如与真实环境的真实桌子和灯对应的桌子712和灯714。真实对象还包括与用户的左手和右手对应的左手790L和右手790R。SR体积环境700中的多个对象包括多个虚拟对象,诸如多个第一SR组表示741A-741C。

第一SR组表示741A-741C对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。相应的第一SR组表示741A-741C对应于相应的艺术家元数据字段值。在各种实施方式中,第一SR组表示741A-741C与具有相应艺术家元数据字段值的标记一起显示,诸如音频文件的艺术家的照片和/或指示艺术家元数据字段值的文本。

在各种实施方式中,第一SR组表示741A-741C从其在SR体积环境700中的相应位置发出声音。认识到第一SR组表示741A-741C是虚拟对象,短语“发出声音”和类似的短语在本文中被用作“似乎发出声音”的缩略词。例如,当HMD内的扬声器生成真实声音时,虚拟对象发出声音以模拟当虚拟对象是其在真实环境中的位置处的真实对象的情况下会从该虚拟对象发出的声音。在各种实施方式中,当对象从SR体积环境700中的位置发出声音时,声音的音量基于用户与SR体积环境中的对象的位置之间的距离。在各种实施方式中,当对象从SR体积环境700中的位置发出声音时,声音在不同的时间到达用户的两只耳朵以指示发出声音的(相对于用户的)角度。

因此,当SR组表示不在用户的当前视场内时(诸如图4的SR组表示440E-440G),用户知道SR体积环境中SR组表示的存在。

在各种实施方式中,当SR组表示表示音频文件组时,由SR组表示发出的声音是音频文件中的一个音频文件的音频数据的至少一部分。例如,当SR组表示表示艺术家的歌曲的一组音频文件时,由SR组表示发出的声音是艺术家的歌曲之一。

当SR体积环境中存在多个SR组表示时,由不同SR组表示发出的不同声音有可能产生不一致的刺耳音。因此,在各种实施方式中,选择(并且任选地,处理)由不同SR组表示发出的声音以减少不一致。

在图11A中,第一SR组表示741A-741C包括与一组音频文件对应的艺术家姓名1组表示741A,该组音频文件具有包括值“艺术家姓名1”的艺术家元数据字段,该“艺术家姓名1”发出与具有包括值“艺术家姓名1”的艺术家元数据字段的第一音频文件对应的声音。第一SR组表示741A-741C包括与一组音频文件对应的艺术家姓名2组表示741B,该组音频文件具有包括值“艺术家姓名2”的艺术家元数据字段,该“艺术家姓名2”发出与具有包括值“艺术家姓名2”的艺术家元数据字段的第一音频文件对应的声音。第一SR组表示741A-741C包括与一组音频文件对应的艺术家姓名3组表示741C,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段,该“艺术家姓名3”发出与具有包括值“艺术家姓名3”的艺术家元数据字段的第一音频文件对应的声音。

在各种实施方式中,随机选择第一音频文件。在各种实施方式中,基于第一音频文件来选择第二音频文件。在各种实施方式中,选择第二音频文件以减少第一音频文件与第二音频文件之间的不一致。在各种实施方式中,第二音频文件基于第一音频文件和第二音频文件的音频数据,诸如音频数据的音调、旋律或节拍。在各种实施方式中,第二音频文件基于第一音频文件和第二音频文件的元数据,诸如歌曲名称或流派。

在各种实施方式中,基于第一音频文件和第二音频文件的音调来选择第二音频文件。例如,在各种实施方式中,如果第二音频文件具有与第一音频文件相同的音调、具有与第一音频文件的音调接近的音调(并且因此可易于被处理为具有与第一音频文件相同的音调)或者具有与第一音频文件一致的音调(例如,相差五分之一),则更可能(从具有包括值“艺术家姓名2”的艺术家元数据字段的音频文件组中)选择第二音频文件。

在各种实施方式中,基于第一音频文件和第二音频文件的旋律来选择第二音频文件。例如,在各种实施方式中,如果第二音频文件具有与第一音频文件相同的旋律、具有与第一音频文件的旋律接近的旋律(并且因此可易于被处理为具有与第一音频文件相同的旋律)或者具有第一音频文件的倍数旋律(例如,一半或两倍),则更可能(从具有包括值“艺术家姓名2”的艺术家元数据字段的音频文件组中)选择第二音频文件。

在各种实施方式中,基于第一音频文件和第二音频文件的节拍来选择第二音频文件。例如,在各种实施方式中,如果第二音频文件具有与第一音频文件相同的节拍、具有与第一音频文件的节拍接近的节拍(并且因此可易于被处理为具有与第一音频文件相同的节拍)或者具有第一音频文件的倍数节拍(例如,一半或两倍),则更可能(从具有包括值“艺术家姓名2”的艺术家元数据字段的音频文件组中)选择第二音频文件。

在各种实施方式中,基于第一音频文件和第二音频文件的乐器来选择第二音频文件。例如,在各种实施方式中,如果第二音频文件使用与第一音频文件相同的乐器中的一个或多个仪器(例如,吉他、小提琴、长笛、电贝司、竖琴等),则更可能(从具有包括值“艺术家姓名2”的艺术家元数据字段的音频文件组中)选择第二音频文件。

在各种实施方式中,基于第一音频文件和第二音频文件共有的样本来选择第二音频文件。例如,在各种实施方式中,第二音频文件被选择为包括第一音频文件的样本或第一音频文件的艺术家的样本的第二音频文件。

在各种实施方式中,基于第一音频文件和第二音频文件的名称来选择第二音频文件。例如,在各种实施方式中,第二音频文件被选择为具有与第一音频文件相同名称的音频文件。因此,第二音频文件可为第一音频文件的翻唱版本。在各种实施方式中,基于第二文件的第一歌曲的艺术家和伴唱艺术家来选择第二音频文件。因此,第二音频文件可为二重唱或艺术家姓名2和艺术家姓名1之间的协作。

在各种实施方式中,至少部分地随机选择第二音频文件。因此,第一音频文件和第二音频文件并不总是相同的两首歌曲。

如上所述,在各种实施方式中,(从具有包括值“艺术家姓名1”的艺术家元数据字段的音频文件组中)随机选择第一音频文件。在各种实施方式中,同时选择第一音频文件和第二音频文件以找到具有匹配特性的两个音频文件。因此,在各种实施方式中,基于第二音频文件来选择第一音频文件。

在各种实施方式中,处理或修改第二音频文件以减少第一音频文件与第二音频文件之间的不一致。例如,在各种实施方式中,改变第二音频文件的音调和/或节拍以更好地匹配第一音频文件的音调和/或节拍。因此,在各种实施方式中,与第二音频文件对应的声音由艺术家姓名2SR表示741B基于第一音频文件而发出。

在各种实施方式中,基于第一音频文件和第二音频文件来选择第三音频文件。在各种实施方式中,SR组表示仅在SR体积环境700中的用户与SR组表示之间的距离小于阈值量时发出声音。

图11A示出了用户在SR体积环境700内移动。图11B示出了在用户已经在SR体积环境700内移动之后的SR体积环境700。第一SR组表示741A-741C显示在SR体积环境700中的相同位置处(但可能在显示器上的不同位置处)。此外,用户与各个第一SR组表示741A-741C之间的距离已经改变。因此,由第一SR组表示741A-741C发出的声音的音量(和方向)也被改变。

图12A示出了根据一些实施方式的用户角度的SR体积环境800。图12A的SR体积环境800基本上类似于图6A的SR体积环境600。SR体积环境800包括多个对象。SR体积环境800中的多个对象包括多个真实对象,诸如与真实环境的真实桌子和灯对应的桌子812和灯814。真实对象还包括与用户的左手和右手对应的左手890L和右手890R。SR体积环境800中的多个对象包括多个虚拟对象,诸如多个第一SR组表示841A-841D。

第一SR组表示841A-841D对应于具有艺术家元数据字段和专辑元数据字段的音频文件组。相应的第一SR组表示841A-841D对应于相应的艺术家元数据字段值。在各种实施方式中,第一SR组表示841A-841D与具有相应艺术家元数据字段值的标记一起显示,诸如音频文件的艺术家的照片和/或指示艺术家元数据字段值的文本。

第一SR组表示841A-841D包括与一组音频文件对应的艺术家姓名1组表示841A,该组音频文件具有包括值“艺术家姓名1”的艺术家元数据字段。第一SR组表示841A-841D包括与一组音频文件对应的艺术家姓名2组表示841B,该组音频文件具有包括值“艺术家姓名2”的艺术家元数据字段。第一SR组表示841A-841D包括与一组音频文件对应的艺术家姓名3组表示841C,该组音频文件具有包括值“艺术家姓名3”的艺术家元数据字段。第一SR组表示841A-841D包括与一组音频文件对应的艺术家姓名4组表示841D,该组音频文件具有包括值“艺术家姓名4”的艺术家元数据字段。

用户的注视点在图12A中由注视点指示符895示出,根据实施方式,注视点指示符895可被显示或可不被显示。因此,在图12A中,用户正在查看艺术家姓名4组表示841D。在各种实施方式中,当用户正在查看第一SR组表示时,对应于该组音频文件中的一个音频文件的声音被呈现给用户。在各种实施方式中,当SR组表示表示音频文件组时,由SR组表示发出的声音是音频文件中的一个音频文件的音频数据的至少一部分。例如,当SR组表示表示艺术家的歌曲的一组音频文件时,由SR组表示发出的声音是艺术家的歌曲之一。因此,在图12A中,艺术家姓名4组表示841D发出与艺术家姓名4的歌曲对应的声音。

图12B示出了当用户的注视点(由注视点指示符895指示)从艺术家姓名4组表示841D移动到艺术家姓名3组表示841C时的图12A的SR体积环境。在各种实施方式中,所呈现的声音从第一音频文件(例如,艺术家姓名4的歌曲)淡变至第二音频文件(例如,艺术家姓名3的歌曲)。在各种实施方式中,第二音频文件基于第一音频文件(例如,如上文相对于图11A所述)。

图12C示出了当用户的注视点到达艺术家姓名3组表示841C时图12B的SR体积环境。此时,所呈现的声音已从第一音频文件完全交叉淡变至第二音频文件。

图13示出了根据一些实施方式的在SR用户界面中移动对象的方法1300的流程图表示。在各种实施方式中,方法1300由具有一个或多个处理器、非暂态存储器和一个或多个SR显示器的设备(例如,图3中的HMD120B)执行。在一些实施方式中,方法1300由处理逻辑部件,包括硬件、固件、软件或其组合来执行。在一些实施方式中,方法1300由执行存储在非暂态计算机可读介质(例如,存储器)中的指令(例如,代码)的处理器执行。

方法1300在框1310中开始于设备识别多个数据项,所述多个数据项中的每个数据项具有第一元数据字段(包括相应的第一元数据字段值)。在各种实施方式中,多个数据项中的每个数据项还具有第二元数据字段(包括相应的第二元数据字段值)。例如,在各种实施方式中,数据项是音频文件,并且第一元数据字段是艺术家元数据字段(包括诸如“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”等值),并且第二元数据字段是专辑元数据字段(包括诸如“专辑名称1”、“专辑名称2”和“专辑名称3”等值)。在各种实施方式中,数据项是文档文件,并且第一元数据字段是文档类型字段(包括诸如“文本”、“电子表格”和“幻灯片演示”等值),并且第二元数据字段是作者元数据字段(包括诸如“Alice”、“Bob”和“Carl”等值)。在各种实施方式中,数据项是电影文件,并且第一元数据字段是流派元数据字段,并且第二元数据字段是发行年份元数据字段。在各种实施方式中,数据项是在线商店的网页,并且第一元数据字段是品牌元数据字段,并且第二元数据字段是价格元数据字段。在各种实施方式中,数据项可具有附加的和/或其他元数据字段。

在各种实施方式中,识别多个数据项包括针对多个数据项中的每个数据项用第一元数据字段值填充第一元数据字段。在各种实施方式中,基于例如通过聚类算法对数据项的检查来执行填充。

在各种实施方式中,多个数据项与在第一元数据字段中包括第一元数据字段值和在第二元数据字段中包括第二元数据字段值的元数据一起存储。

方法1300在框1320中继续,其中设备显示包括与多个第一组数据项对应的多个第一SR组表示的SR体积环境,所述多个第一组数据项中的每个第一组数据项分别包括所述多个数据项中的、具有所述第一元数据字段的多个第一元数据字段值中的相应第一元数据字段值的数据项。

例如,在图5A中,设备显示SR体积环境500,该SR体积环境括分别对应于多个第一组数据项(例如,文档文件)的多个第一SR组表示541A-541D。多个第一组数据项中的每个第一组数据项分别包括多个数据项中具有第一元数据字段(例如,文档类型元数据字段)的多个第一元数据字段值中的相应第一元数据字段值(例如,“文本”、“电子表格”和“幻灯片呈现”)的数据项。

又如,在图6A中,设备显示SR体积环境600,该SR体积环境括分别对应于多个第一组数据项(例如,音频文件)的多个第一SR组表示641A-641D。多个第一组数据项中的每个第一组数据项分别包括多个数据项中具有第一元数据字段(例如,艺术家元数据字段)的多个第一元数据字段值中的相应第一元数据字段值(例如,“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”)的数据项。

在各种实施方式中,显示SR体积环境包括在显示器上的第一多个位置处在显示器上的SR体积环境中的多个位置处显示多个第一SR组表示。在各种实施方式中,显示SR体积环境包括检测SR体积环境中的用户位置和/或取向的变化。例如,在图5D中,在显示器上的第一多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D,并且用户改变SR体积环境500中的位置和/或取向。在各种实施方式中,显示SR体积环境包括,响应于检测到SR体积环境中的用户位置和/或取向的变化,在显示器上的第二多个位置处在显示器上的SR体积环境中的所述多个位置处显示多个第一SR组表示。例如,在图5E中,响应于检测到用户位置和/或取向的变化,在显示器上的第二多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D。

在各种实施方式中,SR体积环境中的多个位置与用户配置文件相关联地保存。因此,这些位置随时间推移是持久的。

在各种实施方式中,多个第一SR组表示中的每个第一SR组表示与多个第一元数据字段值中的相应第一元数据字段值的标记一起显示。例如,在图5A中,第一SR组表示541A-541D与用于打开所述文档类型的文档文件的应用程序的图标一起显示。又如,在图6A中,第一SR组表示641A-641D与艺术家照片和指示艺术家元数据字段值的文本一起显示。在图6B中,多个第一元数据字段值中的相应第一元数据字段值的标记是与第一元数据字段值相关联的相应第二元数据字段值(例如,专辑封面)的多个标记的形式。因此,在各种实施方式中,第一SR组表示中的第一个第一SR组表示显示为不同于第一SR组表示中的第二个第一SR组表示。

方法1300在框1330中继续,其中设备检测指向多个第一SR组表示中的特定第一SR组表示的第一用户输入。在各种实施方式中,检测第一用户输入包括检测用户的至少一部分在SR体积环境中的位置。例如,在图5B中,用户抓住文本组表示541D并将其移动以使其置于桌子512上。在各种实施方式中,第一用户输入包括光标的使用或言语命令的发出。

方法1300在框1340中继续,其中设备响应于检测到第一用户输入,将多个第一SR组表示中的特定第一SR组表示在SR体积环境中相对于多个第一SR组表示中的至少另一个第一SR组表示移动。例如,在图5C中,响应于检测到第一用户输入,文本组表示541D在SR体积环境500中相对于另一个第一SR组表示541A-541C移动。

在各种实施方式中,方法1300还包括检测指向与第一组数据项中的特定第一组数据项对应的多个第一SR组表示中的特定第一SR组表示的第二用户输入,所述第一组数据项中的特定第一组数据项包括多个数据项中的、具有包括所述多个第一元数据字段值中的特定第一元数据字段值的第一元数据字段的数据项。例如,图5F示出了指向文本组表示541D的用户输入。

在各种实施方式中,方法1300还包括,响应于检测到第二用户输入,将多个第一SR组表示中的特定第一SR组表示替换为分别与多个第二组数据项对应的多个第二SR组表示,所述多个第二组数据项中的每个第二组数据项分别包括所述多个数据项中具有第一元数据字段和第二元数据字段的数据项,所述第一元数据字段包括多个第一元数据字段值中的特定第一元数据字段值,并且所述第二元数据字段包括多个第二元数据字段值中相应的第二元数据字段值。例如,在图5G中,响应于检测到图5F的用户输入,文本组表示541D被替换为多个第二SR组表示542A-542D,所述多个第二SR组表示分别包括多个数据项中具有第一元数据字段(例如,文档类型元数据字段)和第二元数据字段(例如作者元数据字段)的数据项,所述第一元数据字段包括多个第一元数据字段值中的特定第一元数据字段值(例如“文本”),所述第二元数据字段包括多个第二元数据字段值中的相应第二元数据字段值(例如,“Alice”、“Bob”、“Carl”和“Dave”)。

在各种实施方式中,方法1300还包括检测指示第二元数据字段的第二用户输入。例如,在图5J中,用户发出指示作者元数据字段的言语命令。

在各种实施方式中,方法1300还包括,响应于检测到第二用户输入,将多个第一SR组表示替换为分别与多个第二组数据项对应的多个第二SR组表示,所述多个第二组数据项中的每个第二组数据项分别包括所述多个数据项中的、具有所述第二元数据字段的多个第二元数据字段值中的相应第二元数据字段值的数据项。例如,在图5K中,响应于言语命令,多个第一SR组表示541A-541B被替换为多个第二SR组表示(例如第三SR组表示551A-551D),所述多个第二SR组表示分别对应于多个第二组数据项,其中多个第二组数据项中的每个第二组数据项分别包括多个数据项中具有第二元数据字段(例如作者元数据字段)的多个第二元数据字段值中相应第二元数据字段值(例如“Alice”、“Bob”、“Carl”和“Dave”)的数据项。

图14是根据一些实施方式的重组SR用户界面中的数据项的方法1400的流程图表示。在各种实施方式中,方法1400由具有一个或多个处理器、非暂态存储器和一个或多个SR显示器的设备(例如,图3中的HMD120B)执行。在一些实施方式中,方法1400由处理逻辑部件,包括硬件、固件、软件或其组合来执行。在一些实施方式中,方法1400由执行存储在非暂态计算机可读介质(例如,存储器)中的指令(例如,代码)的处理器执行。

方法1400在框1410中开始,其中设备识别多个数据项,所述多个数据项中的每个数据项具有第一元数据字段(包括相应的第一元数据字段值)。在各种实施方式中,多个数据项中的每个数据项还具有第二元数据字段(包括相应的第二元数据字段值)。例如,在各种实施方式中,数据项是音频文件,并且第一元数据字段是艺术家元数据字段(包括诸如“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”等值),并且第二元数据字段是专辑元数据字段(包括诸如“专辑名称1”、“专辑名称2”和“专辑名称3”等值)。在各种实施方式中,数据项是文档文件,并且第一元数据字段是文档类型字段(包括诸如“文本”、“电子表格”和“幻灯片演示”等值),并且第二元数据字段是作者元数据字段(包括诸如“Alice”、“Bob”和“Carl”等值)。在各种实施方式中,数据项是电影文件,并且第一元数据字段是流派元数据字段,并且第二元数据字段是发行年份元数据字段。在各种实施方式中,数据项是在线商店的网页,并且第一元数据字段是品牌元数据字段,并且第二元数据字段是价格元数据字段。在各种实施方式中,数据项可具有附加的和/或其他元数据字段。

在各种实施方式中,识别多个数据项包括针对多个数据项中的每个数据项用第一元数据字段值填充第一元数据字段。在各种实施方式中,基于例如通过聚类算法对数据项的检查来执行填充。

在各种实施方式中,多个数据项与在第一元数据字段中包括第一元数据字段值和在第二元数据字段中包括第二元数据字段值的元数据一起存储。

在各种实施方式中,方法1400包括基于针对多个数据项的类型的默认元数据字段来选择多个元数据字段中的第一个元数据字段作为第一元数据字段。例如,在各种实施方式中,当所述多个数据项被识别为文档文件时,默认元数据字段为文档类型元数据字段。又如,在各种实施方式中,当多个数据项被识别为音频文件时,默认元数据字段是艺术家元数据字段(或流派元数据字段)。又如,在各种实施方式中,当多个数据项被识别为在线商店的网页时,默认元数据字段是品牌元数据字段。

在各种实施方式中,方法1400包括基于多个第一组数据项中的数据项的数量来选择多个元数据字段中的第一个元数据字段作为第一元数据字段。例如,元数据字段被选择作为第一元数据字段,以在多组数据项中均匀地划分数据项。在各种实施方式中,基于上下文信息诸如日历邀请或最近打开的文档来选择第一元数据。

方法1400在框1420中继续,其中设备显示包括与多个第一组数据项对应的多个第一SR组表示的SR体积环境,所述多个第一组数据项中的每个第一组数据项分别包括所述多个数据项中的、具有所述第一元数据字段的多个第一元数据字段值中的相应第一元数据字段值的数据项。

例如,在图5A中,设备显示SR体积环境500,该SR体积环境括分别对应于多个第一组数据项(例如,文档文件)的多个第一SR组表示541A-541D。多个第一组数据项中的每个第一组数据项分别包括多个数据项中具有第一元数据字段(例如,文档类型元数据字段)的多个第一元数据字段值中的相应第一元数据字段值(例如,“文本”、“电子表格”和“幻灯片呈现”)的数据项。

又如,在图6A中,设备显示SR体积环境600,该SR体积环境括分别对应于多个第一组数据项(例如,音频文件)的多个第一SR组表示641A-641D。多个第一组数据项中的每个第一组数据项分别包括多个数据项中具有第一元数据字段(例如,艺术家元数据字段)的多个第一元数据字段值中的相应第一元数据字段值(例如,“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”)的数据项。

在各种实施方式中,显示SR体积环境包括在显示器上的第一多个位置处在显示器上的SR体积环境中的多个位置处显示多个第一SR组表示。在各种实施方式中,显示SR体积环境包括检测SR体积环境中的用户位置和/或取向的变化。例如,在图5D中,在显示器上的第一多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D,并且用户改变SR体积环境500中的位置和/或取向。在各种实施方式中,显示SR体积环境包括,响应于检测到SR体积环境中的用户位置和/或取向的变化,在显示器上的第二多个位置处在显示器上的SR体积环境中的所述多个位置处显示多个第一SR组表示。例如,在图5E中,响应于检测到用户位置和/或取向的变化,在显示器上的第二多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D。

在各种实施方式中,多个第一SR组表示中的每个第一SR组表示与多个第一元数据字段值中的相应第一元数据字段值的标记一起显示。例如,在图5A中,第一SR组表示541A-541D与用于打开所述文档类型的文档文件的应用程序的图标一起显示。又如,在图6A中,第一SR组表示641A-641D与艺术家照片和指示艺术家元数据字段值的文本一起显示。在图6B中,多个第一元数据字段值中的相应第一元数据字段值的标记是与第一元数据字段值相关联的相应第二元数据字段值(例如,专辑封面)的多个标记的形式。因此,在各种实施方式中,第一SR组表示中的第一个第一SR组表示显示为不同于第一SR组表示中的第二个第一SR组表示。

方法1400在框1430中继续,其中设备检测指示第二元数据字段的第一用户输入。在各种实施方式中,检测第一用户输入包括检测用户的言语输入。例如,在图5J中,用户发出指示作者元数据字段的言语命令。在各种实施方式中,检测第一用户输入包括检测对所显示的重新排序示能表示的选择。

方法1400在框1440中继续,其中设备响应于检测到第二用户输入,将多个第一SR组表示替换为分别与多个第二组数据项对应的多个第二SR组表示,所述多个第二组数据项中的每个第二组数据项分别包括所述多个数据项中的、具有所述第二元数据字段的多个第二元数据字段值中的相应第二元数据字段值的数据项。例如,在图5K中,响应于言语命令,多个第一SR组表示541A-541B被替换为多个第二SR组表示(例如第三SR组表示551A-551D),所述多个第二SR组表示分别对应于多个第二组数据项,其中多个第二组数据项中的每个第二组数据项分别包括多个数据项中具有第二元数据字段(例如作者元数据字段)的多个第二元数据字段值中相应第二元数据字段值(例如“Alice”、“Bob”、“Carl”和“Dave”)的数据项。

在各种实施方式中,将所述多个第一SR组表示替换为所述多个第二SR组表示包括显示动画,其中所述多个第一SR表示被替换为多个SR项表示,所述多个SR项表示在SR体积环境中被重新布置并且被替换为所述多个第二SR组表示。例如,图5L1至图5L6示出了其中多个第一SR组表示541A-541D被替换为多个SR项表示的动画,所述多个SR项表示在SR体积环境500中被重新布置并且被替换为多个第二SR组表示(例如,第三SR组表示551A-551C)。

在各种实施方式中,方法1400包括检测指向与第二组数据项中的特定第二组数据项对应的多个第二SR组表示中的特定第二SR组表示的第二用户输入,所述第二组数据项中的所述特定第二组数据项包括多个数据项中具有第二元数据字段的数据项,所述第二元数据字段包括所述多个第二元数据字段值中的特定第二元数据字段值。例如,图5M示出了指向Carl组表示551D的用户输入。

在各种实施方式中,方法1400还包括,响应于检测到第二用户输入,将多个第二SR组表示中的特定第二SR组表示替换为分别与多个第三组数据项对应的多个第三SR组表示,所述多个第三组数据项中的每个第三组数据项分别包括所述多个数据项中具有第二元数据字段和第一元数据字段的数据项,所述第二元数据字段包括多个第二元数据字段值中的特定第二元数据字段值,所述第一元数据字段包括多个第一元数据字段值中相应的第一元数据字段值。

例如,在图5N中,响应于检测到图5M的用户输入,Carl组表示551C被替换为多个第三SR组表示(例如第四SR组表示552A-552D),该多个第三SR组表示分别对应于多个第三组数据项,所述多个第三组数据项中的每个第三组数据项分别包括多个数据项中具有第二元数据字段(例如作者元数据字段)和第一元数据字段(例如文档类型元数据字段)的数据项,所述第二元数据字段包括多个第二元数据字段值中的特定第二元数据字段值(例如“Carl”),所述第一元数据字段包括多个第一元数据字段值中相应的第一元数据字段值(例如“文本”、“电子表格”和“幻灯片呈现”)。

在各种实施方式中,方法1400还包括检测指向与第三组数据项中的特定第三组数据项对应的多个第三SR组表示中的特定第三SR组表示的第三用户输入。例如,在图5N中,用户选择呈现-Carl组表示552B。

在各种实施方式中,方法1400还包括,响应于检测到第三用户输入,将所述多个第三SR组表示中的特定第三SR组表示替换为多个SR项表示,所述多个SR项表示分别对应于多个数据项中具有第一元数据字段的多个第一元数据字段值中的特定第一元数据字段值和第二元数据字段的多个第二元数据字段值中的特定第二元数据字段值的数据项。例如,在图5O中,响应于图5N的用户输入,呈现-Carl组表示552B被替换为多个SR项表示553A-553B,该多个SR项表示分别对应于多个数据项中具有第一元数据字段(例如,文档类型元数据字段)的第一元数据字段值中的特定第一元数据字段值(例如“幻灯片呈现”)和第二元数据字段(例如作者元数据字段)的多个第二元数据字段值中的特定第二元数据字段值(例如“Carl”)的数据项。

在各种实施方式中,方法1400还包括,检测指向与数据项中的特定数据项对应的多个SR项表示中的特定SR项表示的第四用户输入。例如,在图5O中,用户选择与名为“two.ppt”的文档文件对应的第二SR项表示553B。

在各种实施方式中,方法1400还包括,响应于检测到第四用户输入,打开数据项中的特定数据项。例如,在图5P中,SR体积环境500包括幻灯片呈现显示窗口554,该幻灯片呈现显示窗口包括名为“two.ppt”的文档文件的内容555的一部分、用于在名为“two.ppt”的文档文件的内容中进行导航的导航示能表示557A-557B,以及关闭示能表示556,该关闭示能表示在经由用户输入被选择时关闭幻灯片呈现显示窗口554。

图15是根据一些实施方式的在SR用户界面中选择数据项组的方法1500的流程图表示。在各种实施方式中,方法1500由具有一个或多个处理器、非暂态存储器和一个或多个SR显示器的设备(例如,图3中的HMD120B)执行。在一些实施方式中,方法1500由处理逻辑部件,包括硬件、固件、软件或其组合来执行。在一些实施方式中,方法1500由执行存储在非暂态计算机可读介质(例如,存储器)中的指令(例如,代码)的处理器执行。

方法1500在框1510中开始,其中设备识别多个数据项,所述多个数据项中的每个数据项具有第一元数据字段(包括相应的第一元数据字段值)。在各种实施方式中,多个数据项中的每个数据项还具有第二元数据字段(包括相应的第二元数据字段值)。例如,在各种实施方式中,数据项是音频文件,并且第一元数据字段是艺术家元数据字段(包括诸如“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”等值),并且第二元数据字段是专辑元数据字段(包括诸如“专辑名称1”、“专辑名称2”和“专辑名称3”等值)。在各种实施方式中,数据项是文档文件,并且第一元数据字段是文档类型字段(包括诸如“文本”、“电子表格”和“幻灯片演示”等值),并且第二元数据字段是作者元数据字段(包括诸如“Alice”、“Bob”和“Carl”等值)。在各种实施方式中,数据项是电影文件,并且第一元数据字段是流派元数据字段,并且第二元数据字段是发行年份元数据字段。在各种实施方式中,数据项是在线商店的网页,并且第一元数据字段是品牌元数据字段,并且第二元数据字段是价格元数据字段。在各种实施方式中,数据项可具有附加的和/或其他元数据字段。

在各种实施方式中,识别多个数据项包括针对多个数据项中的每个数据项用第一元数据字段值填充第一元数据字段。在各种实施方式中,基于例如通过聚类算法对数据项的检查来执行填充。

在各种实施方式中,多个数据项与在第一元数据字段中包括第一元数据字段值和在第二元数据字段中包括第二元数据字段值的元数据一起存储。

在各种实施方式中,方法1500包括基于针对多个数据项的类型的默认元数据字段来选择多个元数据字段中的第一个元数据字段作为第一元数据字段。例如,在各种实施方式中,当所述多个数据项被识别为文档文件时,默认元数据字段为文档类型元数据字段。又如,在各种实施方式中,当多个数据项被识别为音频文件时,默认元数据字段是艺术家元数据字段(或流派元数据字段)。又如,在各种实施方式中,当多个数据项被识别为在线商店的网页时,默认元数据字段是品牌元数据字段。

在各种实施方式中,方法1500包括基于多个第一组数据项中的数据项的数量来选择多个元数据字段中的第一个元数据字段作为第一元数据字段。例如,元数据字段被选择作为第一元数据字段,以在多组数据项中均匀地划分数据项。在各种实施方式中,基于上下文信息诸如日历邀请或最近打开的文档来选择第一元数据。

方法1500在框1520中继续,其中设备显示包括与多个第一组数据项对应的多个第一SR组表示的SR体积环境,所述多个第一组数据项中的每个第一组数据项分别包括所述多个数据项中的、具有所述第一元数据字段的多个第一元数据字段值中的相应第一元数据字段值的数据项。

例如,在图5A中,设备显示SR体积环境500,该SR体积环境括分别对应于多个第一组数据项(例如,文档文件)的多个第一SR组表示541A-541D。多个第一组数据项中的每个第一组数据项分别包括多个数据项中具有第一元数据字段(例如,文档类型元数据字段)的多个第一元数据字段值中的相应第一元数据字段值(例如,“文本”、“电子表格”和“幻灯片呈现”)的数据项。

又如,在图6A中,设备显示SR体积环境600,该SR体积环境括分别对应于多个第一组数据项(例如,音频文件)的多个第一SR组表示641A-641D。多个第一组数据项中的每个第一组数据项分别包括多个数据项中具有第一元数据字段(例如,艺术家元数据字段)的多个第一元数据字段值中的相应第一元数据字段值(例如,“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”)的数据项。

在各种实施方式中,显示SR体积环境包括在显示器上的第一多个位置处在显示器上的SR体积环境中的多个位置处显示多个第一SR组表示。在各种实施方式中,显示SR体积环境包括检测SR体积环境中的用户位置和/或取向的变化。例如,在图5D中,在显示器上的第一多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D,并且用户改变SR体积环境500中的位置和/或取向。在各种实施方式中,显示SR体积环境包括,响应于检测到SR体积环境中的用户位置和/或取向的变化,在显示器上的第二多个位置处在显示器上的SR体积环境中的所述多个位置处显示多个第一SR组表示。例如,在图5E中,响应于检测到用户位置和/或取向的变化,在显示器上的第二多个位置处在SR体积环境500中的多个位置处显示第一SR组表示541A-541D。

在各种实施方式中,多个第一SR组表示中的每个第一SR组表示与多个第一元数据字段值中的相应第一元数据字段值的标记一起显示。例如,在图5A中,第一SR组表示541A-541D与用于打开所述文档类型的文档文件的应用程序的图标一起显示。又如,在图6A中,第一SR组表示641A-641D与艺术家照片和指示艺术家元数据字段值的文本一起显示。

在各种实施方式中,多个第一元数据字段值中的相应第一元数据字段值的标记包括多个第二元数据字段值中相应第二元数据字段值的多个标记。例如,在图6B至图6D中,多个第一元数据字段值中的相应第一元数据字段值的标记是与第一元数据字段值相关联的相应第二元数据字段值(例如,专辑封面)的多个标记的形式。因此,在各种实施方式中,第一SR组表示中的第一个第一SR组表示显示为不同于第一SR组表示中的第二个第一SR组表示。

方法1500在框1530中继续,其中设备检测指向与第一组数据项中的特定第一组数据项对应的多个第一SR组表示中的特定第一SR组表示的第一用户输入,所述第一组数据项中的特定第一组数据项包括多个数据项中的、具有包括所述多个第一元数据字段值中的特定第一元数据字段值的第一元数据字段的数据项。例如,图5F示出了指向文本组表示541D的用户输入。又如,图6D示出了指向艺术家姓名3组表示641C的用户输入。

在各种实施方式中,检测第一用户输入包括检测用户的至少一部分在SR体积环境中的位置。例如,在图6D中,设备检测用户的手在选择艺术家姓名3组表示641C时的位置。又如,在图7A中,设备检测用户的手在将艺术家姓名4组表示641D拉得更近时的位置。又如,在图8A中,设备检测用户的手在拉开艺术家姓名4组表示641D时的位置。又如,在图10A至图10B中,设备检测用户在从第一位置移动到第二位置时的位置。

在各种实施方式中,检测第一用户输入包括检测SR体积环境中的用户的注视点。例如,在图9A中,当触发选择触发器时,设备检测用户的注视点。

在各种实施方式中,检测第一用户输入包括检测用户的言语输入或光标的位置。

方法1500在框1540中继续,其中设备响应于检测到第一用户输入,将多个第一SR组表示中的特定第一SR组表示替换为分别与多个第二组数据项对应的多个第二SR组表示,所述多个第二组数据项中的每个第二组数据项分别包括所述多个数据项中具有第一元数据字段和第二元数据字段的数据项,所述第一元数据字段包括多个第一元数据字段值中的特定第一元数据字段值,并且所述第二元数据字段包括多个第二元数据字段值中相应的第二元数据字段值。

例如,在图5G中,响应于检测到图5F的用户输入,文本组表示541D被替换为多个第二SR组表示542A-542D,每个第二SR组表示分别包括多个数据项中具有第一元数据字段(例如,文档类型元数据字段)和第二元数据字段(例如作者元数据字段)的数据项,所述第一元数据字段包括多个第一元数据字段值中的特定第一元数据字段值(例如“文本”),所述第二元数据字段包括多个第二元数据字段值中的相应第二元数据字段值(例如,“Alice”、“Bob”、“Carl”和“Dave”)。

又如,在图6E中,响应于检测到图6D的用户输入,艺术家姓名3组表示641C被替换为多个第二SR组表示642A-642D,每个第二SR组表示分别包括多个数据项中具有第一元数据字段(例如,艺术家元数据字段)和第二元数据字段(例如专辑元数据字段)的数据项,所述第一元数据字段包括多个第一元数据字段值中的特定第一元数据字段值(例如“艺术家姓名3”),所述第二元数据字段包括多个第二元数据字段值中的相应第二元数据字段值(例如,“专辑名称1”、“专辑名称2”、“专辑名称3”和“专辑名称4”)。

在各种实施方式中,将多个第一SR组表示中的特定第一SR组表示替换为多个第二SR组表示包括显示动画,其中多个第二元数据字段值中的相应第二元数据字段值的多个标记被扩展并移动到相应位置,从而成为多个第二SR组表示。例如,图6F1至图6F4示出了其中多个第二元数据字段值(例如,“专辑名称1”、“专辑名称2”、“专辑名称3”和“专辑名称4”)中的多个标记中的相应标记被扩展并移动到相应位置从而成为多个第二SR组表示642A-642D的动画。

在各种实施方式中,将多个第一SR组表示中的特定第一SR组表示替换为多个第二SR组表示包括停止显示多个第一SR组表示中的其他第一SR组表示。例如,在图6E中,当艺术家姓名3组表示641C被替换为多个第二SR组表示642A-642D时,停止显示第一SR组表示641A、641B和641D中的其他第一SR组表示。在各种实施方式中,多个SR组表示中的其他SR组表示以淡变、收缩或变灰状态显示。

在各种实施方式中,方法1500还包括检测指向与第二组数据项中的特定第二组数据项对应的多个第二SR组表示中的特定第二SR组表示的第二用户输入,该第二组数据项中的特定第二组数据项包括多个数据项中具有第二元数据字段的多个第二元数据字段值中的特定第二元数据字段值的数据项。例如,在图5G中,用户选择Dave-文本组表示542D。又如,在图6G中,用户选择专辑名称4组表示642D。

在各种实施方式中,方法1500还包括,响应于检测到第二用户输入,将所述多个第二SR组表示中的特定第二SR组表示替换为多个SR项表示,所述多个SR项表示分别对应于多个数据项中具有第一元数据字段的多个第一元数据字段值中的特定第一元数据字段值和第二元数据字段的多个第二元数据字段值中的特定第二元数据字段值的数据项。

例如,在图5H中,响应于图5G的用户输入,第二SR组表示中的特定第二SR组表示(例如,Dave-文本组表示542D)被替换为多个SR项表示543A-543D,该多个SR项表示分别对应于多个数据项中具有第一元数据字段(例如,文档类型元数据字段)的第一元数据字段值中的特定第一元数据字段值(例如“文本”)和第二元数据字段(例如作者元数据字段)的多个第二元数据字段值中的特定第二元数据字段值(例如“Dave”)的数据项。

又如,在图6H中,响应于图6G的用户输入,第二SR组表示中的特定第二SR组表示(例如,专辑名称4组表示642D)被替换为多个SR项表示643A-643D,该多个SR项表示分别对应于多个数据项中具有第一元数据字段(例如,艺术家元数据字段)的第一元数据字段值中的特定第一元数据字段值(例如“艺术家姓名3”)和第二元数据字段(例如专辑元数据字段)的多个第二元数据字段值中的特定第二元数据字段值(例如“专辑名称4”)的数据项。

在各种实施方式中,方法1500还包括,检测指向与数据项中的特定数据项对应的多个SR项表示中的特定SR项表示的第三用户输入。例如,在图5H中,用户选择与名为“three.txt”的文档文件对应的第三SR项表示543C。又如,在图6H中,用户选择与名为“歌曲名称4”的音频文件对应的第四SR项表示643D。

在各种实施方式中,方法1500还包括,响应于检测到第三用户输入,打开数据项中的特定数据项。例如,在图5I中,响应于检测到图5H中的用户输入,SR体积环境500包括文本显示窗口544,该文本显示窗口包括名为“three.txt”的文档文件的内容545和关闭示能表示546,该关闭示能表示在经由用户输入被选择时关闭文本显示窗口544。又如,响应于检测到图6H中的用户输入,设备经由扬声器播放名为“歌曲名称4”的音频文件。

在各种实施方式中,方法1500还包括在显示第二SR组表示时检测关闭第二SR组表示的第三用户输入。例如,在图8C中,用户输入包括用户用其左手和其右手捏合(或收拢)多个第二SR组表示647A-647D。

在各种实施方式中,方法1500还包括,响应于检测到第三用户输入,将多个第二SR组表示替换为多个第一SR组表示。例如,在图8E中,多个第二SR组表示647A-647D被替换为第一SR组表示641A-641D。

图16示出了根据一些实施方式的播放两个音频文件的方法1600的流程图表示。在各种实施方式中,方法1600由具有一个或多个处理器、非暂态存储器和一个或多个SR显示器的设备(例如,图3中的HMD 120B)执行。在一些实施方式中,方法1600由处理逻辑部件,包括硬件、固件、软件或其组合来执行。在一些实施方式中,方法1600由执行存储在非暂态计算机可读介质(例如,存储器)中的指令(例如,代码)的处理器执行。

方法1600在框1610中开始,其中设备在显示器上显示SR体积空间中的相应位置处的多个SR对象,所述多个SR对象中的每个SR对象与多个音频文件中的至少一个音频文件的元数据字段的相应元数据字段值相关联。例如,在图11A中,在SR体积空间700中的相应位置处显示多个SR对象(例如,第一SR组表示741A-741C)。多个对象中的每个对象与多个音频文件中的至少一个音频文件的元数据字段(例如,艺术家元数据字段)的相应元数据字段值(例如,“艺术家姓名1”、“艺术家姓名2”和“艺术家姓名3”)相关联。

方法1600在框1620中继续,其中设备确定SR体积空间中的用户位置与多个SR对象中的第一SR对象在SR体积空间中的第一位置之间的第一距离,其中第一SR对象与第一元数据值相关联。在各种实施方式中,用户位置对应于SR环境中用户身体的位置、SR环境中用户手的位置或SR环境中用户注视点的位置。例如,在图11A中,体积空间包括与第一元数据值(例如,“艺术家姓名1”)相关联的第一SR对象(例如,艺术家姓名1组表示741A)。

方法1600在框1630中继续,其中设备确定SR体积空间中的用户位置与多个SR对象中的第二SR对象在SR体积空间中的第二位置之间的第二距离,其中第二SR对象与第二元数据值相关联。例如,在图11A中,体积空间包括与第二元数据值(例如,“艺术家姓名2”)相关联的第二SR对象(例如,艺术家姓名2组表示741B)。

方法1600在框1640中继续,其中设备选择所述多个音频文件中的、具有包括第一元数据字段值的元数据字段的第一音频文件。例如,在图11A中,设备选择在艺术家元数据字段中包括“艺术家姓名1”的音频文件。在各种实施方式中,随机选择第一音频文件。在各种实施方式中,基于第二音频文件来选择第一音频文件。

方法1600在框1650中继续,其中设备基于第一音频文件选择所述多个音频文件中的、具有包括第二元数据字段值的元数据字段的第二音频文件。在各种实施方式中,选择第二音频文件以减少第一音频文件与第二音频文件之间的不一致。在各种实施方式中,第二音频文件基于第一音频文件和第二音频文件的音频数据。因此,在各种实施方式中,选择第二音频文件基于第一音频文件和第二音频文件的音调、第一音频文件和第二音频文件的旋律或第一音频文件和第二音频文件的节拍中的一者或多者。在各种实施方式中,第二音频文件基于第一音频文件和第二音频文件的元数据,诸如歌曲名称或流派。

在各种实施方式中,选择第二音频文件基于第一音频文件和第二音频文件的乐器。在各种实施方式中,选择第二音频文件基于第一音频文件和第二音频文件共有的样本。在各种实施方式中,选择第二音频文件进一步基于随机选择。

方法1600在框1660中继续,其中设备包括经由定向扬声器系统基于第一距离以第一音量在从第一位置开始的方向上播放第一音频文件,并且同时经由定向扬声器系统基于第二距离以第二音量在从第二位置开始的方向上播放第二音频文件。

在各种实施方式中,处理或修改第二音频文件以减少第一音频文件与第二音频文件之间的不一致。例如,在各种实施方式中,改变第二音频文件的音调和/或节拍以更好地匹配第一音频文件的音调和/或节拍。因此,在各种实施方式中,播放第二音频文件基于第一音频文件。

在各种实施方式中,方法1600还包括确定SR体积空间中的用户位置与多个SR对象中的第三SR对象在SR体积空间中的第三位置之间的距离,其中第一SR对象与第三元数据字段值相关联;基于所述第一音频文件和所述第二音频文件来选择所述多个音频文件中的、具有包括所述第三元数据字段值的元数据字段的第三音频文件;以及与经由定向扬声器系统基于第三距离以第三音量在从第三位置开始的方向上播放第一音频文件和第二音频文件同时播放第三音频文件。在各种实施方式中,响应于确定第三距离低于阈值来选择并播放第三音频文件。因此,在各种实施方式中,远离用户位置的SR对象不发出声音(甚至是微弱的声音)。

在各种实施方式中,方法1600还包括检测SR体积空间中的用户位置到新的用户位置的变化,确定新的用户位置与第一SR对象的第一位置之间的更新的第一距离,确定所述新的用户位置与所述第二SR对象的所述第二位置之间的更新的第二距离,并且基于所述更新的第一距离和所述更新的第二距离改变所述第一音量和所述第二音量。例如,在图11B中,用户移动到新位置,从而改变用户与第一SR体积表示之间的距离。

图17是根据一些实施方式的在两个音频文件之间交错淡变的方法1700的流程图表示。在各种实施方式中,方法1700由具有一个或多个处理器、非暂态存储器和一个或多个SR显示器的设备(例如,图3中的HMD120B)执行。在一些实施方式中,方法1700由处理逻辑部件,包括硬件、固件、软件或其组合来执行。在一些实施方式中,方法1700由执行存储在非暂态计算机可读介质(例如,存储器)中的指令(例如,代码)的处理器执行。

方法1700在框1710中继续,其中设备经由扬声器播放多个音频文件中的、具有包括第一元数据字段值的元数据字段的第一音频文件。例如,在图12A中,响应于用户查看艺术家姓名4组表示841D,设备播放来自多个音频文件中的、具有包括值“艺术家姓名4”的艺术家元数据字段的第一音频文件。

方法1700在框1720中继续,其中设备在播放第一音频文件时接收对第二元数据字段值的指示。例如,在图12B中,用户开始看向指示第二元数据字段值“艺术家姓名3”的艺术家姓名3组表示841C。

方法1700在框1730中继续,其中设备基于第一音频文件选择多个音频文件中的、具有包括第二元数据字段值的元数据字段的第二音频文件。在各种实施方式中,选择第二音频文件以减少第一音频文件与第二音频文件之间的不一致。在各种实施方式中,第二音频文件基于第一音频文件和第二音频文件的音频数据。因此,在各种实施方式中,选择第二音频文件基于第一音频文件和第二音频文件的音调、第一音频文件和第二音频文件的旋律或第一音频文件和第二音频文件的节拍中的一者或多者。在各种实施方式中,第二音频文件基于第一音频文件和第二音频文件的元数据,诸如歌曲名称或流派。

在各种实施方式中,选择第二音频文件基于第一音频文件和第二音频文件的乐器。在各种实施方式中,选择第二音频文件基于第一音频文件和第二音频文件共有的样本。在各种实施方式中,选择第二音频文件进一步基于随机选择。

方法1700在框1740中继续,其中响应于接收到对第二元数据字段值的指示,设备从第一音频文件交叉淡变到第二音频文件。例如,在图12A至图12C中,设备从艺术家姓名4歌曲交叉淡变到艺术家姓名3歌曲(基于艺术家姓名4歌曲来选择)。在各种实施方式中,交叉淡变包括同时播放第一音频文件和第二音频文件,同时减小第一音频文件的音量并增大第二音频文件的音量。

虽然上文描述了在所附权利要求书范围内的实施方式的各个方面,但是应当显而易见的是,上述实施方式的各种特征可通过各种各样的形式体现,并且上述任何特定结构和/或功能仅是例示性的。基于本公开,本领域的技术人员应当理解,本文所述的方面可以独立于任何其他方面来实现,并且这些方面中的两个或更多个可以采用各种方式组合。例如,可以使用本文阐述的任何数量的方面来实现装置和/或可以实践方法。另外,除了本文阐述的一个或多个方面之外或者不同于本文阐述的一个或多个方面,可以使用其他结构和/或功能来实现这样的装置和/或可以实践这样的方法。

还将理解的是,虽然术语“第一”、“第二”等可能在本文中用于描述各种元素,但是这些元素不应当被这些术语限定。这些术语只是用于将一个元件与另一元件区分开。例如,第一节点可以被称为第二节点,并且类似地,第二节点可以被称为第一节点,其改变描述的含义,只要所有出现的“第一节点”被一致地重命名并且所有出现的“第二节点”被一致地重命名。第一节点和第二节点都是节点,但它们不是同一个节点。

本文中所使用的术语仅仅是为了描述特定实施方式并非旨在对权利要求进行限制。如在本实施方式的描述和所附权利要求中所使用的那样,单数形式的“一个”和“该”旨在也涵盖复数形式,除非上下文清楚地另有指示。还将理解的是,本文中所使用的术语“和/或”是指并且涵盖相关联的所列出的项目中的一个或多个项目的任何和全部可能的组合。还将理解的是,术语“包括”在本说明书中使用时是指定存在所陈述的特征、整数、步骤、操作、元件和/或部件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、部件,和/或其分组。

如本文所使用的,术语“如果”可以被解释为表示“当所述先决条件为真时”或“在所述先决条件为真时”或“响应于确定”或“根据确定”或“响应于检测到”所述先决条件为真,具体取决于上下文。类似地,短语“如果确定[所述先决条件为真]”或“如果[所述先决条件为真]”或“当[所述先决条件为真]时”被解释为表示“在确定所述先决条件为真时”或“响应于确定”或“根据确定”所述先决条件为真或“当检测到所述先决条件为真时”或“响应于检测到”所述先决条件为真,具体取决于上下文。

相关技术
  • 用于呈现合成现实用户界面的方法和设备
  • 用于呈现音频和合成现实体验的方法和设备
技术分类

06120112181412