导航：首页> 基本电气元件>扩增实况内容

扩增实况内容

文献发布时间：2024-04-18 20:01:30

技术领域

本发明涉及扩增实况内容，更具体地涉及双相机设备、方法和设备。

背景技术

诸如智能设备、移动设备(例如，蜂窝电话、平板设备、智能电话)、消费者电子设备等的设备能够被实施用于在广泛范围的环境中使用并且用于各种不同的应用。许多不同类型的移动电话和设备包括双相机以利用前置相机和后置相机捕获数字图像。通常，双相机中的仅一个相机在任何特定时间活动并且能用于捕获数字图像。通常，前置相机的镜头被集成在移动设备的显示屏幕中或周围，并且在用户使设备保持就位以查看显示屏幕时面向他或她。用户通常使用前置相机来拍摄他们自己的照片(例如，数字图像)，诸如常常称为“自拍”的自我肖像数字图像。这些双相机设备通常提供诸如显示在用户界面上的可选控件，用户能够选择可选控件以在使用前置相机或后置相机之间切换。通常，后置相机的镜头被集成在设备的后盖或外壳中，并且背对着用户朝向如从用户的视点看到的周围环境。用户通常使用后置相机来捕获他们可以在周围环境中在他们前面看到的任何东西的数字图像和/或视频。

发明内容

根据本发明的一个方面，提供了一种双相机设备，包括：后置相机，所述后置相机具有用于捕获相机场景的场景数字内容的第一成像器；前置相机，所述前置相机具有用于从与所述后置相机相反的视点捕获用户数字内容的第二成像器，所述第一成像器和所述第二成像器一起操作以大致同时地捕获所述场景数字内容和所述用户数字内容；以及成像管理器，所述成像管理器至少部分地实施在计算机硬件中以：识别所述用户数字内容中描绘的对象以用于提取为提取的对象；至少部分地基于所述双相机设备的地理位置来识别至少一个增强特征；并且通过将所述提取的对象与所述场景数字内容合并并且与所述至少一个增强特征合并来生成扩增实况内容。

根据本发明的另一个方面，提供了一种方法，包括：利用双相机设备的后置相机捕获相机场景的场景数字内容；利用前置相机从与所述后置相机相反的视点捕获用户数字内容，所述后置相机和所述前置相机一起操作以大致同时地捕获所述场景数字内容和所述用户数字内容；识别所述用户数字内容中描绘的对象以用于提取为提取的对象；至少部分地基于所述双相机设备的地理位置来识别至少一个增强特征；以及通过将所述提取的对象与所述场景数字内容合并并且与所述至少一个增强特征合并来生成扩增实况内容。

根据本发明的又一个方面，提供了一种设备，包括：位置模块，所述位置模块至少部分地实施在计算机硬件中以确定所述设备的地理位置；以及成像管理器，所述成像管理器至少部分地实施在所述计算机硬件中以：识别用户数字内容中描绘的对象以用于提取为提取的对象；至少部分地基于所述设备的地理位置来识别至少一个增强特征；并且通过将所述提取的对象与所述场景数字内容合并并且与所述至少一个增强特征合并来生成扩增实况内容。

附图说明

参考以下各图描述用于扩增实况内容的技术的实施方式。相同的标号可以自始至终用于引用各图中示出的相同的特征和组件：

图1图示根据如本文所描述的一个或多个实施方式的用于扩增实况内容的技术的示例。

图2图示能够用于实施如本文所描述的用于扩增实况内容的技术的示例设备。

图3图示根据如本文所描述的一个或多个实施方式的扩增实况内容的特征的示例。

图4图示根据本文描述的技术的一个或多个实施方式的扩增实况内容的示例方法。

图5图示根据本文描述的技术的一个或多个实施方式的扩增实况内容的示例方法。

图6图示能够用于实施如本文所描述的用于扩增实况内容的技术的示例设备的各种组件。

具体实施方式

扩增实况内容的实施方式被描述，并且提供由双相机设备实施的技术来将从利用前置相机捕获的用户数字内容中提取的对象与利用后置相机捕获为数字照片或数字视频内容的场景数字内容合并，并且还合并一个或多个增强特征以形成扩增实况内容。然后能够将扩增实况内容(例如，作为数字照片、视频剪辑、实时视频、实况视频流等)显示、记录和/或传送到另一设备。例如，能够将扩增实况内容显示在双相机设备的显示屏幕上，扩增实况内容然后可由设备的用户查看。与场景数字内容和增强特征合并的提取的对象的扩增内容还可以被记录，诸如到设备的维持记录以用于后续访问的存储器。附加地，可以将扩增实况内容传送到另一设备。在实施方式中，双相机设备是能够与其他支持通信的设备建立通信的移动电话或智能电话，并且移动电话诸如以数字视频内容的形式传送扩增实况内容，以用于在将扩增实况内容作为视频聊天或以数字内容的另一通信格式接收的其他设备处查看。

在描述的技术中，能够将场景数字内容捕获为如可利用后置相机查看的相机场景的数字照片或数字视频内容，诸如如可利用后置相机查看的环境的数字照片或数字视频。用户数字内容是利用前置相机从与后置相机相反的视点捕获的，并且用户数字内容包括一个或多个对象的描绘，以包括设备的用户的自我图像或自我视频。尤其，双相机设备的后置相机和前置相机一起操作以大致同时地捕获场景数字内容和用户数字内容，并且设备的用户不必在相机之间切换或者翻转设备以捕获周围环境的图像或视频。这规定双相机设备的用户既能够与具有另一设备的人视频聊天，又向另一个人示出用户从保持双相机设备的用户的视点看到的环境。具有另一设备的人然后能够既以视频聊天格式看到双相机设备的用户，又看到从用户的视角的周围环境。

在如本文所描述的扩增实况内容的各方面中，双相机设备包括被实施以从利用前置相机捕获的用户数字内容中描绘的一个或多个对象中提取对象的成像管理器。成像管理器能够被实施以利用任何类型的选择准则来确定要从用户数字内容中提取哪个对象，诸如基于用于选择用户的自我图像的面部检测，或者基于对象特性，诸如在数字图像中的对象之中看上去最大的对象、或最接近数字图像的中心的对象、或任何其他类型的选择准则。替换地或另外，双相机设备的用户可以例如在显示在设备的显示屏幕上的用户界面中提供选择输入，并且成像管理器能够接收识别选择的对象以用于提取的用户选择输入。成像管理器然后能够从数字图像(诸如利用前置相机捕获为用户的自我图像或自我视频的用户数字内容)中提取选择的对象，并且从用户数字内容中提取的对象是用户的描绘。

在如本文所描述的扩增实况内容的实施方式中，双相机设备的成像管理器能够利用位置模块来确定双相机设备的地理位置。例如，利用成像管理器实施的位置模块能够确定双相机设备所位于的环境，诸如城市，并且进一步确定双相机设备的地理位置的城市信息或其他环境信息。成像管理器能够利用该城市信息来确定存储场景内容和/或一个或多个增强特征以与扩增实况内容合并。存储场景内容能够是任何类型的数字内容，诸如库存数字内容、静止数字图像或描绘在双相机设备的地理位置附近的地标的数字视频。还能够将存储场景内容实施为任何类型的静止背景或移动背景，诸如纯色。一个或多个增强特征也可以是任何类型的数字内容，并且能够以任何数量的方式描绘城市或环境信息，诸如描绘当前在城市或环境中发生的天气状况，或者描绘城市的日期、时间和/或名称。替换地，或者除了成像管理器自动地确定存储场景内容和增强特征之外，成像管理器可以接收用于选择库存或附加场景数字内容和增强特征的用户输入。

由双相机设备实施的成像管理器然后能够通过将提取的对象与场景数字内容合并并且与一个或多个选择的增强特征合并来生成组合图像。在实施方式中，成像管理器能够自动地对提取的对象进行尺寸调整和定位以使提取的对象看上去与场景数字内容中描绘的其他对象成比例，并且以便不覆盖场景数字内容中的其他对象。替换地或另外，成像管理器能够接收用于将用户的描绘作为与场景数字内容和一个或多个增强特征合并的提取的对象移动或进行尺寸调整的用户输入。如以上指出的，然后能够将扩增实况内容(例如，作为数字照片、视频剪辑、实时视频、实况视频流等)显示在双相机设备的显示屏幕上，记录到存储器，和/或传送到另一设备以用于诸如在视频聊天应用中查看。

虽然能够在任何数量的不同设备、系统、环境和/或配置中实施扩增实况内容的特征和概念，但是在以下示例设备、系统和方法的上下文中描述如从合并数字内容生成的扩增实况内容的实施方式。

如本文所描述的，图1图示使用双相机设备102的用于扩增实况内容的技术的示例100，双相机设备102实施成像管理器104以生成扩增实况内容。在该示例100中，双相机设备102可以是任何类型的移动设备、计算设备、平板设备、移动电话、翻盖电话和/或被实施有双相机的任何其他类型的设备。通常，双相机设备102可以是被实施有各种组件的任何类型的电子设备和/或计算设备，各种组件诸如处理器系统和存储器以及如参考图5中示出的示例设备进一步描述的任何数量和组合的不同组件。

在该示例100中，双相机设备102具有后置相机106和前置相机108。通常，后置相机106包括集成在设备的后盖或外壳中的镜头，并且背对着设备的用户朝向周围环境。后置相机106还具有称为成像器的成像传感器，成像传感器接收引导通过相机镜头的光，光然后被捕获为场景数字内容110，诸如数字照片、数字视频或实况视频流内容。例如，由后置相机106捕获的场景数字内容110可以是如可利用后置相机查看的环境的数字照片。后置相机106具有相机的视场(FOV)，在本文中称为相机场景112。如本文所使用的，术语“数字内容”和“场景数字内容”包括任何类型的数字图像、数字照片、视频剪辑的数字视频帧、数字视频、实况视频流和/或任何其他类型的数字内容。

类似地，双相机设备102的前置相机108包括集成在设备的显示屏幕中或周围的镜头，并且前置相机108在设备的用户使设备保持就位以查看显示屏幕时面向他或她。前置相机108还具有接收引导通过相机镜头的光的成像器，光然后从与后置相机相反的视点被捕获为用户数字内容114。用户通常使用前置相机108来拍摄他们自己的照片或视频(例如，数字图像)，诸如常常称为“自拍”的自我肖像数字图像或自我肖像数字视频。例如，可以利用前置相机108从面向双相机设备的用户的视点将用户数字内容114捕获为自我图像。通常，用户数字内容114可以包括一个或多个对象的描绘，以包括设备的用户的图像或视频和/或可在前置相机108的视场内查看的对象。

在如本文所描述的扩增实况内容的实施方式中，后置相机106和前置相机108的成像器一起操作以大致同时地捕获场景数字内容110和用户数字内容114。双相机设备102包括成像管理器104，成像管理器104可以被实施为包括充当与双相机设备102集成的计算设备和/或电子设备的独立处理组件、存储器组件和/或逻辑组件的模块。替换地或另外，成像管理器104能够被实施为软件应用或软件模块，诸如作为可利用双相机设备102的处理器执行的计算机可执行软件指令与操作系统集成。作为软件应用或者模块，成像管理器104能够被存储在设备的存储器中，或者存储在与成像管理器一起实施的任何其他合适的存储器设备或电子数据存储设备中。作为软件应用或模块，还可以将成像管理器104实施为人工智能算法。替换地或另外，可以在固件中和/或至少部分地在计算机硬件中实施成像管理器104。例如，成像管理器104的至少一部分可以可由计算机处理器执行，并且/或者成像管理器的至少一部分可以被实施在逻辑电路中。

在如本文所描述的扩增实况内容的实施方式中，场景数字内容110可以由成像管理器104诸如从存储场景内容识别和/或获得，存储场景内容可以作为由后置相机106捕获的场景数字内容的替代或补充。在实施方式中，成像管理器104可以包括位置模块以确定双相机设备102的地理位置，诸如在城市或其他环境中。地理位置可以由成像管理器104或者由与成像管理器一起实施的位置模块使用任何数量的位置确定技术来确定。例如，成像管理器104可以利用GPS技术来确定环境，诸如双相机设备102所位于的城市。成像管理器104然后能够识别关于双相机设备102所位于的城市或环境的信息。成像管理器104然后能够使用环境或城市信息来确定和/或获得与环境或城市相关联的存储场景内容，环境或城市信息可以描绘在城市中或在城市附近的地标。

能够以任何形式的数字内容(诸如静止图像、数字视频或GIF)描绘存储场景内容。如该示例100中所示，成像管理器104能够确定双相机设备102位于芝加哥市并且将云门雕塑描绘为与城市或环境相关联的存储场景内容。替换地或另外，能够将存储场景内容实施为任何类型的静止背景或移动背景，诸如纯色。在实施方式中，成像管理器104能够自动地确定存储场景内容，或者成像管理器能够接收用户输入作为对要与提取的对象118、一个或多个增强特征116和/或场景数字内容110合并以生成扩增实况内容的存储场景内容的选择。

成像管理器104能够基于双相机设备102的地理位置来自动地识别和/或获得一个或多个增强特征116。如上所述，成像管理器104或与成像管理器一起实施的位置模块能够确定双相机设备102的地理位置并且确定关于双相机设备所位于的环境或城市的信息。成像管理器104能够以任何数量的方式将该环境或城市信息描绘为增强特征116，诸如描绘城市的天气状况，或者描绘城市的日期、时间和/或名称。在该示例100中，成像管理器104确定双相机设备102位于芝加哥市并且确定当前天气状况是下雪。成像管理器104然后能够确定和/或获得使用智能过滤器来描绘落雪的增强特征116。能够使用任何类型的数字内容来描绘增强特征116。替换地或者除了成像管理器104自动地确定一个或多个增强特征116之外，双相机设备102能够接收用于选择一个或多个增强特征的用户输入。

附加地，成像管理器104能够从可以被描绘在用户数字内容114中以用于提取为提取的对象118的对象中的任何中识别和选择对象。在该示例100中，从用户数字内容114中提取的对象118是双相机设备102的用户的描绘，用户已经利用前置相机108从面向设备的用户的视点将用户数字内容捕获为自我图像。可以被实施为人工智能算法的成像管理器104能够利用任何类型的选择准则来确定要在用户数字内容114中选择哪个对象，诸如在用户数字内容中的对象之中看上去最大的对象、最接近用户数字内容的中心的对象、具有相机的视场的最大百分比的对象、出现在用户数字内容的聚焦区域中的对象，并且/或者使用任何其他类型的选择准则，诸如面部识别技术。替换地或另外，双相机设备102的用户可以例如在显示在设备的显示屏幕上的用户界面中提供选择输入，并且成像管理器104能够基于接收到识别提取的对象118的用户选择输入来选择用于从用户数字内容中提取的对象。

成像管理器104然后能够生成扩增实况内容120，诸如通过将提取的对象118与场景数字内容110合并并且与一个或多个增强特征116合并。在该示例100中，扩增实况内容120通过成像管理器104将用户的描绘与描绘城市地标的场景数字内容110并且与描绘落雪的智能过滤器的增强特征116合并来生成。如上所述，可以将场景数字内容110描绘为由后置相机106捕获和/或由成像管理器104识别为存储场景内容的任何类型的数字内容。还可以将提取的对象118描绘为由前置相机108捕获的任何类型的数字内容。如关于图3更详细地描述的，提取的对象可以由成像管理器104或通过用户输入自动地定位和/或进行尺寸调整。

尽管被称为实况内容，但是扩增实况内容120可以是和与场景数字内容110并且与一个或多个增强特征116合并的提取的对象118一起实时地生成的数字图像、视频剪辑或数字视频，其然后可以作为视频聊天或者以另一通信格式被传送到另一设备。在如本文所描述的扩增实况内容的各方面中，可以将扩增实况内容120显示、记录和/或传送到另一设备。例如，能够将扩增实况内容120(例如，作为数字照片、视频剪辑、实时视频、实况视频流等)显示在双相机设备102的显示屏幕上，扩增实况内容然后可作为与场景数字内容110合并并且与一个或多个增强特征116合并的提取的对象118由设备的用户查看。扩增实况内容120还可以被记录，诸如到设备的维持记录以用于后续访问的存储器，或者被传送以用于基于云的存储。在实施方式中，双相机设备102是能够与其他支持通信的设备建立通信的移动电话或智能电话，并且移动电话传送扩增实况内容120以用于在将扩增实况内容作为视频聊天或以数字内容的另一通信格式接收的其他设备处查看。

图2图示能够用于如本文所描述的实施扩增实况内容的技术的移动设备202的示例200，移动设备202诸如参考图1示出和描述的双相机设备102。在该示例200中，移动设备202可以是任何类型的计算设备、平板设备、移动电话、翻盖电话和/或任何其他类型的移动设备。通常，移动设备202可以是被实施有各种组件的任何类型的电子设备和/或计算设备，各种组件诸如包括集成或独立视频图形处理器的处理器系统204和存储器206以及如参考图5中示出的示例设备进一步描述的任何数量和组合的不同组件。例如，移动设备202能够包括用于给设备供电的电源，诸如可再充电电池和/或可以被实施在电子设备和/或计算设备中的任何其他类型的有源或无源电源。

在实施方式中，移动设备202可以是实施为双相机设备的移动电话(通常也称为“智能电话”)。移动设备202包括后置相机208和前置相机210。尽管在本文中将设备通常描述为具有两个相机的双相机设备，但是设备中的任何一个或多个设备可以包括多于两个相机。例如，后置相机208的实施方式可以包括两个或三个单独的相机本身，诸如以大致同时地在不同焦距下和/或在不同光圈下捕获数字内容。

在该示例200中，移动设备202的后置相机208包括成像器212以捕获场景数字内容110，诸如数字照片或数字视频内容。例如，由后置相机208捕获的场景数字内容110可以是如可利用后置相机查看的环境(在本文中也称为相机场景)的数字照片。如参考图1示出和描述的，利用双相机设备102的后置相机106捕获的场景数字内容110是可以由移动设备202的后置相机208捕获的场景数字内容110的示例。

类似地，移动设备202的前置相机210包括成像器214以从与后置相机相反的视点捕获用户数字内容114。通常，用户数字内容114可以包括一个或多个对象的描绘，以包括设备的用户的图像和/或可在前置相机的视场内查看的对象。如参考图1示出和描述的，利用双相机设备102的前置相机108从保持设备并面向相机的用户的视点捕获为自我图像和/或自我视频的用户数字内容114是可以由移动设备202的前置相机210捕获的用户数字内容114的示例。如以上并且在描述的扩增实况内容的实施方式中指出的，后置相机208的成像器212和前置相机210的成像器214一起操作以大致同时地捕获场景数字内容110和用户数字内容114。

在该示例200中，移动设备202包括如本文所描述的并且通常如参考图1示出和描述的实施扩增实况内容的特征的成像管理器104。可以将成像管理器104实施为包括充当与移动设备202集成的计算设备和/或电子设备的独立处理组件、存储器组件和/或逻辑组件的模块。替换地或另外，成像管理器104能够被实施为软件应用或软件模块，诸如与操作系统集成并且作为可利用移动设备202的处理器(例如，用处理器系统204)执行的计算机可执行软件指令。作为软件应用或模块，成像管理器104能够被存储在计算机可读存储存储器(例如，设备的存储器206)中，或者在与成像管理器一起实施的任何其他合适的存储器设备或电子数据存储设备中。作为软件应用或模块，成像管理器104还可以被实施为人工智能算法。替换地或另外，成像管理器104可以被实施在固件中和/或至少部分地被实施在计算机硬件中。例如，成像管理器104的至少一部分可以可由计算机处理器执行，并且/或者成像管理器的至少一部分可以被实施在逻辑电路中。

附加地，成像管理器104可以包括、实施位置模块216或者与位置模块216接口连接，位置模块216被包括以确定移动设备202的地理位置218，成像管理器104能够从移动设备202的地理位置218确定与地理位置相关的存储场景内容220，并且确定用于生成扩增实况内容120的增强特征116。在实施方式中，位置模块216可以被实施为成像管理器104的软件组件或模块(如图所示)，或者替换地，被实施为与设备的成像管理器104和/或操作系统接口连接的独立设备应用222。通常，移动设备202包括设备应用222，诸如可在设备上执行的任何类型的用户应用和/或设备应用。例如，设备应用222能够包括视频聊天应用，移动设备202的用户可以发起视频聊天应用以经由视频聊天与和移动设备通信的另一设备的用户进行通信。

在实施方式中，移动设备202能够经由网络(例如，LTE、WLAN等)或经由直接对等连接(例如，Wi-Fi Direct、蓝牙

在如本文所描述的扩增实况内容的实施方式中，场景数字内容110可以由成像管理器104识别为存储场景内容220(例如，作为由后置相机208捕获的场景数字内容110的替代或补充)。存储场景内容220可以是库存数字图像或任何其他类型的数字内容，库存数字图像或任何其他类型的数字内容可以被存储在设备上，诸如在存储器206中，或者被存储在基于云的站点上并且由移动设备从基于云的存储设备获得。

位置模块216能够确定移动设备202的地理位置218，移动设备202的地理位置218可以使用任何数量的位置确定技术来确定，诸如利用GPS技术来确定移动设备202所位于的环境或城市。成像管理器104然后能够识别关于移动设备202所位于的环境或城市的信息。附加地，存储场景内容220能够由成像管理器104使用环境和/或城市信息来确定和/或获得，诸如以描绘在城市中或在城市附近的地标。替换地或另外，存储场景内容220可以包括静止背景或移动背景，诸如纯色。能够以任何形式的数字内容(诸如静止图像、数字视频或GIF)描绘存储场景内容。如参考图1示出和描述的描绘云门雕塑的场景内容是由成像管理器104确定的存储场景内容220的示例。

成像管理器104还能够基于移动设备202的地理位置218来自动地识别和/或获得增强特征116中的一个或多个增强特征。如上所述，位置模块216能够确定移动设备202的地理位置并且确定关于移动设备所位于的环境或城市的信息。成像管理器104能够以任何数量的方式将该环境或城市信息描绘为增强特征，诸如描绘当前在城市中发生的天气状况，或者描绘城市的日期、时间和/或名称。如图1所示，可以将增强特征116描绘为落雪以反映双相机设备102所位于的城市的实际天气状况。这是成像管理器104如何能够自动地确定增强特征的示例。替换地或者除了成像管理器104自动地确定增强特征之外，移动设备202能够接收用户输入作为对增强特征中的一个或多个增强特征的选择。

在扩增实况内容的实施方式中，成像管理器104能够从可以被描绘在用户数字内容114中以用于从用户数字内容中提取的对象中的任何中选择对象。例如，选择的对象可以由成像管理器104选择为移动设备202的用户的描绘。可以被实施为人工智能算法的成像管理器104可以利用任何类型的选择准则来确定要从用户数字内容114中选择哪个对象，诸如在数字图像中的对象之中看上去最大的对象、最接近数字图像的中心的对象、具有相机的视场的最大百分比的对象、出现在捕获的数字图像的聚焦区域中的对象，并且/或者通过使用任何其他类型的选择准则，诸如面部识别技术。替换地，移动设备202的用户可以例如在显示在设备的显示屏幕226上的用户界面中提供选择输入，并且成像管理器104能够基于接收到识别要提取的对象的用户选择输入来选择用于从用户数字内容中提取的对象。

成像管理器104被实施以从用户数字内容114中提取对象作为提取的对象118。如图1所示，从用户数字内容114中提取的对象118是已经捕获自我图像或自我视频的双相机设备102的用户的描绘。成像管理器104然后能够生成扩增实况内容120，诸如通过将提取的对象118与场景数字内容110和增强特征116中的至少一个增强特征合并。场景数字内容110可以由后置相机208捕获，或者从诸如库存数字图像或内容的存储场景内容220确定和获得。在参考图1示出和描述的示例100中，扩增实况内容120通过成像管理器104将来自用户数字内容的用户的描绘(例如，提取的对象118)与环境的数字照片或视频(例如，场景数字内容110)并且与描绘落雪的增强特征116合并来生成。在实施方式中，提取的对象118能够被自动地定位和/或尺寸调整为与场景数字内容中描绘的其他对象成比例，诸如关于图3进一步描述的。

尽管被称为实况内容，但是扩增实况内容120可以是与提取的对象118以及增强特征116中的一个或多个增强特征一起实时地生成的数字图像、视频剪辑或数字视频。然后能够将扩增实况内容120作为视频聊天或以另一通信格式传送到另一设备。附加地，扩增实况内容120可以作为实时视频聊天或作为以另一通信格式的记录的数字内容被传送到另一设备。

在实施方式中，还可以显示和/或记录扩增实况内容120。例如，能够渲染扩增实况内容(例如，作为数字照片、视频剪辑、实时视频、实况视频流等)以用于查看为在移动设备202的显示屏幕226上显示的内容228，扩增实况内容然后可由设备的用户查看为与场景数字内容110并且与由成像管理器104识别、确定和/或获得的增强特征116合并的提取的对象118。在另一示例中，从与环境的数字照片或数字视频(例如，场景数字内容110)合并的用户数字内容114中的用户的描绘生成的扩增实况内容120被示出为在双相机设备102的显示屏幕上显示的内容。扩增实况内容120还可以被记录，诸如到移动设备202的维持记录的内容230(例如，记录的数字内容)以用于后续访问和/或以用于传送以用于基于云的存储的存储器206。

图3图示如本文所描述的用于扩增实况内容的技术的特征的示例300。如以上指出的，由成像管理器104从与场景数字内容110合并并且与增强特征116合并的用户数字内容114生成为用户的描绘(例如，提取的对象118)的扩增实况内容120被示出为在双相机设备102的显示屏幕上显示的内容。在实施方式中，成像管理器104能够自动地对与场景数字内容110和增强特征116合并的提取的对象118进行尺寸调整和定位。替换地或另外，用户可以经由设备的显示屏幕上的用户界面与扩增实况内容120的显示交互以对与场景数字内容110和增强特征116合并的提取的对象118进行尺寸调整和定位。例如，如在302处示出的，成像管理器104能够通过将提取的对象118与场景数字内容110和增强特征116合并来生成扩增实况内容120。在302处，尚未相对于场景数字内容110对提取的对象118进行尺寸调整或定位。

此外，如在304处示出的，提取的对象118的尺寸被缩小306，使得提取的对象118相对于场景数字内容110中的对象(诸如场景数字内容中示出的云门雕塑)是大致成比例的尺寸。尤其，能够根据成像管理器104放大或缩小提取的对象118的尺寸。类似地，成像管理器104能够接收用于增大或减小提取的对象的尺寸的用户输入(例如，展开或捏合手势)。如在308处进一步示出的，提取的对象118由成像管理器定位以便不遮挡场景数字内容110中描绘的被描绘对象(例如，环境中的云门雕塑)。提取的对象118向右移动310，使得被描绘对象不被提取的对象118遮挡。尤其，提取的对象118能够相对于由成像管理器104确定的场景数字内容110中描绘的对象向右、向左、向上和/或向下移动。类似地，成像管理器104能够接收用于定位提取的对象118从而将提取的对象向左、向右、向上和/或向下移动的用户输入。

示例方法400和500是参考根据扩增实况内容的实施方式的相应的图4和图5来描述的。通常，本文描述的任何服务、组件、模块、方法和/或操作能够使用软件、固件、硬件(例如，固定逻辑电路)、手动处理或其任何组合来实施。可以在存储在计算机处理系统本地和/或远程的计算机可读存储存储器上的可执行指令的一般上下文中描述示例方法的一些操作，并且实施方式能够包括软件应用、程序、功能等。替换地或另外，本文描述的功能中的任何功能能够至少部分地由一个或多个硬件逻辑组件执行，一个或多个硬件逻辑组件诸如但不限于现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SoC)、复杂可编程逻辑器件(CPLD)等。

图4图示扩增实况内容的示例方法400，并且通常参考双相机设备和由设备实施的成像管理器来描述。描述方法的次序不旨在被解释为限制，并且能够以任何次序执行任何数量或组合的描述的方法操作以执行方法或替代方法。

在402处，利用双相机设备的后置相机捕获相机场景的场景数字内容。例如，双相机设备102的后置相机106捕获相机场景112的场景数字内容110。场景数字内容110能够是作为如可利用后置相机查看的数字图像、数字视频等的环境的任何类型的描绘。

在404处，利用前置相机从与后置相机相反的视点捕获用户数字内容。例如，双相机设备102的前置相机108捕获包括一个或多个对象的描绘的用户数字内容114。可以利用前置相机108从面向双相机设备的用户的视点将用户数字内容114捕获为自我图像或自我视频。例如，前置相机108在设备的用户使设备保持就位以查看显示屏幕时面向他或她，并且用户能够捕获自我图像或自我视频(例如，自我肖像数字图像或自我肖像数字视频)。尤其，双相机设备102的后置相机106和前置相机108一起操作以大致同时地捕获场景数字内容110和用户数字内容114。

在406处，识别用户数字内容中描绘的对象以用于提取为提取的对象。例如，由双相机设备102实施的成像管理器104选择用户数字内容114中描绘的对象以用于提取为提取的对象118。成像管理器104可以利用任何类型的选择准则来确定要在数字图像中选择哪个对象以用于提取，诸如在数字图像中的对象之中看上去最大的对象、最接近数字图像的中心的对象、具有相机的视场的最大百分比的对象、出现在捕获的数字图像的聚焦区域中的对象，并且/或者利用任何其他类型的选择准则，诸如面部识别技术。替换地或另外，双相机设备102的用户可以例如在显示在设备的显示屏幕上的用户界面中提供选择输入，并且成像管理器104基于接收到用户选择输入从用户数字内容114中提取对象。

在408处，基于双相机设备的地理位置来识别至少一个增强特征。例如，成像管理器104用确定双相机设备102的地理位置218的位置模块216来实施，并且成像管理器104确定关于双相机设备所位于的环境或城市的信息。成像管理器104能够以任何数量的方式将环境或城市信息描绘为增强特征116，诸如描绘城市的天气状况，或者描绘城市的日期、时间和/或名称。能够使用任何类型的数字内容来描绘增强特征116。替换地或者除了成像管理器104自动地确定一个或多个增强特征116之外，双相机设备102能够接收用于选择增强特征中的一个或多个增强特征的用户输入。

在410处，通过将提取的对象与场景数字内容合并并且与至少一个增强特征合并来生成扩增实况内容。例如，成像管理器104将提取的对象118与场景数字内容110并且与增强特征116中的一个或多个增强特征合并以生成扩增实况内容120。场景数字内容110可以由后置相机106捕获，或者由成像管理器104基于双相机设备102的地理位置识别为附近的地标。场景数字内容110也可以是任何形式的数字内容，诸如静止数字图像、数字视频或GIF。如以上在408处指出的，增强特征116可以以任何数量的方式描绘环境或城市信息，诸如描绘双相机设备102所位于的城市的当前天气状况。

图5图示扩增实况内容的示例方法500，并且通常参考双相机设备和由设备实施的成像管理器来描述。描述方法的次序不旨在被解释为限制，并且能够以任何次序执行任何数量或组合的描述的方法操作以执行方法或替代方法。

在502处，利用设备的后置相机捕获场景数字内容并且利用设备的前置相机捕获用户数字内容。例如，双相机设备102的后置相机106捕获相机场景112的场景数字内容110，而双相机设备102的前置相机108捕获用户数字内容114。

在504处，提取用户数字内容中描绘的对象。例如，由双相机设备102实施的成像管理器104提取用户数字内容114中描绘的对象作为提取的对象118。在506处，确定设备的地理位置。例如，成像管理器104被实施有确定双相机设备102的地理位置218的位置模块216。

在508处，基于设备的地理位置将增强特征识别为地标或天气状况。例如，成像管理器104识别增强特征116，诸如城市或环境地标，或双相机设备102的地理位置处的当前天气状况。在510处，相对于场景数字内容中描绘的对象自动地定位提取的对象。例如，能够被实施为人工智能算法的成像管理器104对提取的对象118进行定位和/或尺寸调整到视觉视角，以及到与数字场景内容中描绘的其他对象成比例的尺寸和位置。

在512处，通过将提取的对象与场景数字内容合并并且与增强特征合并来生成扩增实况内容。例如，成像管理器104将提取的对象118与场景数字内容110合并并且与增强特征116合并以生成扩增实况内容120。在514处，将扩增实况内容作为实况视频流传送到附加设备。例如，双相机设备102将扩增实况内容120传送到附加设备。在实施方式中，双相机设备102是能够与其他支持通信的设备建立通信的移动电话，并且移动电话传送扩增实况内容120以用于在其他设备处查看。

图6图示能够在其中实施扩增实况内容的各方面的示例设备600的各种组件。能够将示例设备600实施为参考先前的图1到5描述的设备中的任何设备，诸如任何类型的移动设备、移动电话、翻盖电话、客户端设备、伴侣设备、配对设备、显示设备、平板设备、计算设备、通信设备、娱乐设备、游戏设备、媒体播放设备和/或任何其他类型的计算设备和/或电子设备。例如，可以将参考图1和图2描述的双相机设备102和移动设备202实施为示例设备600。

设备600包括与其他设备一起实施对设备数据604的有线通信和/或无线通信的通信收发器602。设备数据604能够包括各种设备和成像管理器生成、确定、接收和/或存储的数据中的任何。附加地，设备数据604能够包括任何类型的音频、视频和/或图像数据。示例通信收发器602包括遵守各种IEEE 802.15(蓝牙

设备600还可以包括一个或多个数据输入端口606，经由一个或多个数据输入端口606能够接收任何类型的数据、媒体内容和/或输入，诸如到设备的用户可选输入、通信、消息、音乐、电视内容、记录的内容、以及从任何内容和/或数据源接收到的任何其他类型的音频、视频和/或图像数据。数据输入端口可以包括USB端口、同轴线缆端口以及用于闪速存储器、DVD、CD等的其他串行或并行连接器(包括内部连接器)。这些数据输入端口可以用于将设备耦合到任何类型的组件、外围设备或诸如麦克风和/或相机的附件。

设备600包括一个或多个处理器(例如，微处理器、控制器等中的任何)的处理器系统608和/或被实施为处理计算机可执行指令的片上系统(SoC)的处理器和存储器系统。可以至少部分地在计算机硬件中实施处理器系统，计算机硬件能够包括集成电路或片上系统、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)的组件以及用硅和/或其他硬件的其他实施方式。替换地或另外，设备能够用软件、硬件、固件、或结合通常在610处识别的处理和控制电路实施的固定逻辑电路中的任何或组合来实施。设备600还可以包括耦合设备内的各种组件的任何类型的系统总线或其他数据和命令传输系统。系统总线能够包括不同总线结构和架构以及控制线和数据线中的任何一种或组合。

设备600还包括实施数据存储的存储器和/或存储器设备612(例如，计算机可读存储存储器)，诸如能够由计算设备访问并且提供数据和可执行指令(例如，软件应用、程序、函数等)的持久存储的数据存储设备。存储器设备612的示例包括易失性存储器和非易失性存储器、固定媒体设备和可移除媒体设备、以及维持数据以用于计算设备访问的任何合适的存储器设备或电子数据存储设备。存储器设备612能够在各种存储器设备配置中包括随机存取存储器(RAM)、只读存储器(ROM)、闪速存储器和其他类型的存储介质的各种实施方式。设备600还可以包括大容量存储介质设备。

存储器设备612(例如，作为计算机可读存储存储器)提供数据存储机制来存储设备数据604、其他类型的信息和/或数据以及各种设备应用614(例如，软件应用和/或模块)。例如，操作系统616能够被存储器设备维持为软件指令并且由处理器系统608执行。设备应用614还可以包括设备管理器618，诸如任何形式的控制应用、软件应用、信号处理和控制模块、特定于特定设备的代码、用于特定设备的硬件抽象层等。

在该示例中，设备600包括实施扩增实况内容的各方面的成像管理器620。成像管理器620可以用硬件组件来实施和/或用软件实施为设备应用614中的一个，诸如当设备600被实施为参考图1描述的双相机设备102或被实施为参考图2描述的移动设备202时。成像管理器620的示例包括由双相机设备102实施并且如所描述的由移动设备202实施的成像管理器104，诸如双相机设备中和/或移动设备中的软件应用和/或硬件组件。在实施方式中，成像管理器620可以包括独立处理组件、存储器组件和逻辑组件作为与示例设备600集成的计算设备和/或电子设备。

在该示例中，设备600还包括相机622以及诸如可以被实施为惯性测量单元(IMU)的组件的运动传感器624。运动传感器624能够用诸如陀螺仪、加速度计和/或其他类型的运动传感器的各种传感器来实施以感测设备的运动。运动传感器624能够生成具有指示设备的位置、定位、加速度、旋转速度和/或取向的三维参数(例如，x、y和z轴坐标中的旋转向量)的传感器数据向量。设备600还能够包括一个或多个电源626，诸如当设备被实施为移动设备时。电源可以包括充电系统和/或电源系统，并且能够被实施为柔性带电池、可再充电电池、充电超级电容器和/或任何其他类型的有源或无源电源。

设备600还能够包括生成用于音频系统630的音频数据并且/或者生成用于显示系统632的显示数据的音频和/或视频处理系统628。音频系统和/或显示系统可以包括处理、显示和/或以其他方式渲染音频、视频、显示和/或图像数据的任何设备。能够经由RF(射频)链路、S-视频链路、HDMI(高清晰度多媒体接口)、复合视频链路、分量视频链路、DVI(数字视频接口)、模拟音频连接或其他类似的通信链路，诸如经由媒体数据端口634，将显示数据和音频信号传送到音频组件和/或到显示组件。在实施方式中，音频系统和/或显示系统是示例设备的集成组件。替换地，音频系统和/或显示系统是示例设备的外部外围组件。

尽管已经用特定于特征和/或方法的语言描述了扩增实况内容的实施方式，但是所附权利要求的主题不一定限于描述的特定特征或方法。相反，特定特征和方法被公开为扩增实况内容的示例实施方式，并且其他等效特征和方法旨在处在所附权利要求的范围内。此外，描述了各种不同示例，并且应当认识到，能够独立地或结合一个或多个其他描述的示例实施描述的示例。本文讨论的技术、特征和/或方法的附加方面涉及以下中的一个或多个：

一种双相机设备，包括：后置相机，后置相机具有用于捕获相机场景的场景数字内容的第一成像器；前置相机，前置相机具有用于从与后置相机相反的视点捕获用户数字内容的第二成像器，第一成像器和第二成像器一起操作以大致同时地捕获场景数字内容和用户数字内容；成像管理器，成像管理器至少部分地实施在计算机硬件中以：识别用户数字内容中描绘的对象以用于提取为提取的对象；至少部分地基于双相机设备的地理位置来识别至少一个增强特征；并且通过将提取的对象与场景数字内容合并并且与至少一个增强特征合并来生成扩增实况内容。

替换地或者除了上述双相机设备之外，还有以下各项中的任何一个或组合：位置模块，位置模块至少部分地实施在计算机硬件中以确定双相机设备的地理位置。成像管理器被实施以发起对与场景数字内容合并并且与至少一个增强特征合并的提取的对象的扩增实况内容到附加设备的传送。扩增实况内容作为提取的对象和与至少一个增强特征合并的场景数字内容的实况视频流被传送到附加设备。成像管理器被实施以将存储场景内容确定为能与扩增实况内容一起使用的静止图像、数字视频或GIF中的至少一种。存储场景内容描绘在双相机设备的地理位置附近的地标。成像管理器相对于场景数字内容中描绘的对象自动地定位提取的对象。至少一个增强特征包括描绘当前在双相机设备的地理位置中发生的天气的视觉效果。至少一个增强特征包括刻画关于双相机设备的地理位置的信息的视觉效果。用户数字内容的提取的对象和场景数字内容是静止图像或数字视频中的一种。用户数字内容描绘由前置相机捕获的双相机设备的用户，并且提取的对象是用户数字内容中描绘的用户的裁剪块。

一种方法，包括：利用双相机设备的后置相机捕获相机场景的场景数字内容；利用前置相机从与后置相机相反的视点捕获用户数字内容，后置相机和前置相机一起操作以大致同时地捕获场景数字内容和用户数字内容；识别用户数字内容中描绘的对象以用于提取为提取的对象；至少部分地基于双相机设备的地理位置来识别至少一个增强特征；以及通过将提取的对象与场景数字内容合并并且与至少一个增强特征合并来生成扩增实况内容。

替换地或者除了上述方法之外，还有以下各项中的任何一个或组合：将扩增实况内容作为与场景数字内容合并并且与至少一个增强特征合并的提取的对象的实况视频流传送到附加设备。方法进一步包括将在双相机设备的地理位置附近的地标的描绘与扩增实况内容合并，地标的描绘包括静止图像、数字视频或GIF中的至少一种。方法进一步包括：确定双相机设备的地理位置中的天气状况；以及将天气状况描绘为扩增实况内容中的至少一个增强特征。方法进一步包括相对于场景数字内容中描绘的对象自动地定位提取的对象。

一种设备，包括：位置模块，位置模块至少部分地实施在计算机硬件中以确定设备的地理位置；成像管理器，成像管理器至少部分地实施在计算机硬件中以：识别用户数字内容中描绘的对象以用于提取为提取的对象；至少部分地基于双相机设备的地理位置来识别至少一个增强特征；并且通过将提取的对象与场景数字内容合并并且与至少一个增强特征合并来生成扩增实况内容。

替换地或者除了上述设备之外，还有以下各项中的任何一个或组合：多个成像器，多个成像器一起操作以利用后置相机捕获场景数字内容，并且利用前置相机捕获用户数字内容，用户数字内容包括用于提取的对象。成像管理器被实施为人工智能算法以从提取的对象、场景数字内容和至少一个增强特征生成扩增实况内容。成像管理器被实施以将存储场景内容确定为能与扩增实况内容一起使用的静止图像、数字视频或GIF中的至少一种。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：摩托罗拉移动有限责任公司;