掌桥专利:专业的专利平台
掌桥专利
首页

数字图像捕获会话和元数据关联

文献发布时间:2024-04-18 20:01:23


数字图像捕获会话和元数据关联

本申请是申请号为201880058710.6、申请日为2018年9月10日、发明名称为“数字图像捕获会话和元数据关联”的中国发明专利申请的分案申请。

相关申请的交叉引用

本申请要求于2017年9月13日提交的题为“Digital Image Capture Session andMetadata Association”的美国申请第15/703,556号的优先权,第15/703,556号申请根据35U.S.C.§119(e)要求于2017年9月12日提交的题为“Digital Image Capture Sessionand Metadata Association”的美国临时专利申请第62/557,668号的优先权,其全部公开内容通过引用并入本文。

背景技术

移动装置已经成为用户日常生活的组成部分。例如,移动电话可以用于阅读电子邮件、参与社交媒体、捕获数字图像、经由即时消息进行通信等等。同样,可穿戴装置诸如智能手表仍在继续扩大这种交互。因此,用户可以在各种使用场景中访问各种各样的装置。

然而,配置为移动装置可能在支持用户与这些装置的交互方面带来挑战和复杂性。例如,移动电话或智能手表可能在支持文本输入、在文件之间的导航等方面存在受限的功能。因此,与这些装置的用户交互可能受到限制并且因此引起计算效率低下。

发明内容

描述了数字图像捕获会话和元数据关联技术。这些技术帮助克服了用户与计算装置特别是与移动装置交互的常规挑战,并且具有比常规技术提高的计算效率。在一个示例中,接收到用户输入来发起图像捕获会话。在图像捕获会话期间使用数字摄像机捕获至少一个数字图像。在图像捕获会话期间还使用音频输入装置来收集音频输入数据,并将音频输入数据转换为文本数据,例如语音至文本。元数据是基于文本数据生成的,并且与至少一个数字图像相关联。作为图像捕获会话的完成,将至少一个数字图像输出为具有相关联的元数据。

本发明内容以简化的形式介绍了一些概念,这些概念将在下面的具体实施方式中被进一步描述。这样,本发明内容既不意在识别所要求保护的主题的必要特征,也不意在用于帮助确定所要求保护的主题的范围。

附图说明

参照附图描述具体实施方式。附图中表示的实体可以指示一个或更多个实体,并且因此在讨论中可以可互换地参考单个或多个形式的实体。

图1是可操作成采用本文描述的数字图像捕获系统技术的示例实现方式中的环境的图示。

图2更详细地描绘了示出图1的数字图像处理模块的操作的示例实现方式中的系统。

图3A和图3B描绘了与数字图像处理模块的用户交互作为图像捕获会话的示例。

图4描绘了多个数字图像捕获会话的结果的示例。

图5描绘了包括多个图像捕获会话的结果的虚拟库的示例实现方式。

图6也描绘了包括多个图像捕获会话的结果作为包括用户可定义采集的虚拟库的实现方式。

图7描绘了生成被捕获作为虚拟库的一部分的产品的列表的示例实现方式。

图8是描绘数字图像捕获会话和元数据的关联的示例实现方式中的过程的流程图。

图9示出了包括可以参照图1至图8所描述和/或利用图1至图8被实现为任何类型的计算装置以实现本文所描述的技术的实施方式的示例装置的各种部件的示例系统。

具体实施方式

概述

描述了数字图像捕获会话和元数据关联技术。这些技术有助于克服用户与计算装置尤其是与移动装置交互的常规挑战。与可能需要用户重复和修改输入以便完成期望动作的常规交互相比,这导致通过提高用户与装置交互的准确性来提高计算装置的操作的计算效率。

在一个示例中,计算装置被配置成将元数据与数字图像相关联。例如,数字图像处理模块可以通过选择在用户界面中的选项来接收用户输入以发起数字图像捕获会话。这使得数字图像处理模块在由显示装置输出的用户界面中调用数字摄像机的实时视图来发起图像捕获会话。

在会话期间,定时指示作为实时视图的一部分在用户界面中输出(即,实时输出)来指示要捕获数字图像的时间。例如,定时指示可以被配置为随着扩展圆向外到限定边界指示时间的流逝的径向计时器。因此,一旦扩展圆到达边界,便会由数字摄像机捕获数字图像。然后,在移动到用户界面的限定部分(例如,“停靠(dock)”)时,采用动画来显示数字图像的缩略图。以这种方式,数字图像处理模块可以在单个图像捕获会话内以高效且直观的方式依次捕获多个数字图像。

在图像捕获会话期间,数字图像处理模块还被配置成经由音频输入装置例如麦克风来捕获音频数据。音频数据然后用作生成与数字图像相关联的元数据的基础。因此,用户可以按住按钮来发起图像捕获会话,捕获多个数字图像,并且使用语音或其他声音以有效且直观的方式来关联元数据,这克服了移动装置的输入装置挑战。

元数据与数字图像的关联可以支持多种功能。例如,可以使用语音至文本功能将音频数据转换为文本。例如,用户可以标识包括在数字图像中的内容(例如,“艾菲尔铁塔”),并将与数字图像相关联的该元数据作为标签。以这种方式,用户可以与计算装置有效地交互以完成该期望动作。

在另一示例中,数字图像处理模块使用文本作为搜索的一部分来获得与数字图像相关的元数据。例如,可以经由网络(例如,因特网)将文本传送至服务提供商系统来获得元数据以标识作为数字图像的主题的特定产品。然后,该文本用于获得关于产品的附加信息,然后可以在用户界面中数字图像例如如上面描述的缩略图集合附近显示该信息。附加信息例如还可以标识产品(例如,产品的名称)、产品的平均成本作为在线拍卖或其他零售系统等的一部分。

然后,用户可以将数字图像和相关联的元数据保存在计算装置上的“库”中作为图像捕获会话的结果,图像捕获会话可以例如针对平均价格自动地更新。可以针对附加产品和服务(可以将其分组为集合)重复该处理并且因此提供了对销售产品、购买类似产品等潜在收益机会的更多了解。这些和其他示例的进一步讨论包括在以下各节中,并在相应的图中示出。

在以下讨论中,首先描述了可以采用本文所描述的技术的示例环境。还描述了可以在示例环境以及其他环境中执行的示例过程。因此,示例过程的执行不限于示例环境,并且示例环境不限于示例过程的执行。

示例环境

图1是在可操作成采用本文描述的数字图像捕获会话技术的示例实现方式中的数字媒体环境100的图示。所示的环境100包括可以以各个方式配置的计算装置102。

例如,计算装置102可以被配置为台式计算机、膝上型计算机、移动装置(例如,假设为所示的手持式配置诸如平板电脑或移动电话)等。因此,计算装置102的范围可以从具有大量存储器和处理器资源的全资源装置(例如,个人计算机、游戏机)到具有有限存储器和/或处理资源的低资源装置(例如,移动装置)。另外,尽管示出了单个计算装置102,但是计算装置102可以表示多个不同的装置,诸如由企业利用来执行如图9所示的“在云上”的操作的多个服务器。

计算装置102被示为在物理环境例如客厅106中由用户104持有。计算装置102包括数字摄像机108,数字摄像机108被配置成例如通过使用电荷耦合器件(CCD)传感器来捕获客厅106的数字图像110。然后,所捕获的数字图像110可以作为像素被存储在计算机可读存储介质中和/或由显示装置例如LCD、OLED、LED等来呈现以供显示。

计算装置102还包括音频输入装置112(例如,数字麦克风),音频输入装置112被配置成捕获音频输入数据114。音频输入数据114可以例如包括来自用户104的讲话发音、背景噪声等。音频输入数据114也可由计算机可读存储介质存储和/或由音频输出装置例如扬声器来呈现。

音频输入数据114和捕获的数字图像110两者都被提供给数字图像处理模块118。数字图像处理模块118至少部分地在计算装置102的硬件(例如,处理系统和计算机可读存储介质)中被实现成将元数据116与数字图像114相关联。元数据116例如可以由数字图像处理模块118本身本地生成,或者与可经由网络例如因特网访问的服务提供商系统120和服务管理器模块122组合生成。然后,数字图像114和元数据116由数字图像处理模块118输出用于由显示装置124呈现。

如前面所描述的,元数据116与数字图像114的关联可以支持多种功能。例如,用户104可以位于被各种不同的物理对象诸如灯126、枕头128、杯子130、水壶132等包围的客厅106中。用于确定对象的价值并且销售对象的常规技术可能会很麻烦,而且计算效率低下。

因此,在该示例中,数字图像处理模块118被配置成采用图像捕获会话来捕获这些对象的数字图像110。音频输入数据114还被捕获作为例如通过品牌名称、类别等描述对象的会话的一部分。用户例如104可以说出“品牌X杯”130,其被捕获为会话内的音频输入数据114。然后,音频输入数据114由数字图像处理模块118转换为文本,并被传送至服务提供商系统120,以获得描述数字图像110中的内容(即,杯子130)的元数据116。元数据116例如可以基于过去的在线拍卖、杯子130的品牌名称、库存图像等来描述杯子的平均价格。然后,用户104可以通过一系列连续的图像捕获会话来继续该处理以了解水壶132、灯126等。以这种方式,用户104以有效且直观的方式了解对象的潜在价值和特征。还考虑了图像捕获会话和相关联的功能的其他用途诸如用于图像标记、表格填写(例如,保险表格)、搜索等。

通常,可以在本节中描述的示例过程的情境中采用关于上面和下面的示例描述的功能、特征和概念。此外,关于本文中的不同附图和示例描述的功能、特征和概念可以彼此互换,并且不限于在特定附图或过程的情境中的实现。此外,与本文中不同的表示性过程和相应附图相关联的块可以以不同的方式一起应用和/或组合。因此,关于本文中的不同示例环境、装置、部件、图和过程描述的各个功能、特征和概念可以以任何合适的组合使用,并且不限于由本说明书中列举的示例表示的特定组合。

数字图像捕获会话

图2更详细地描绘了示出图1的数字图像处理模块118的操作的示例实现方式中的系统200。图3A和图3B描绘了使用第一阶段302、第二阶段304、第三阶段306、第四阶段308、第五阶段310和第六阶段312示出的与数字图像处理模块118的用户交互作为图像捕获会话的示例。图4描绘了多个数字图像捕获会话的结果的示例。图5描绘了包括多个图像捕获会话的结果的虚拟库的示例实现方式。图6还描绘了包括多个图像捕获会话的结果作为包括用户可定义的采集的虚拟库的实现方式。图7描绘了生成被捕获为虚拟库的一部分的产品的列表的示例实现方式。图8描绘了数字图像捕获会话和元数据的关联的示例实现方式中的过程800。

下文的讨论描述了可以利用先前描述的系统和装置来实现的技术。该过程的多个方面可以以硬件、固件、软件或其组合来实现。该过程被示为指定由一个或更多个装置执行的操作并且不必限于所示的用于由各个块执行的操作的顺序的一组块。在下文讨论的部分中,将照图2至图8。

首先,接收用户输入来发起图像捕获会话(块802),并且响应于数字图像处理模块118来发起图像捕获会话(块804)。如第一阶段302所示,例如,计算装置102在显示装置124上呈现用户界面314。用户界面314包括用户可选选项“开始捕获会话”316来发起例如使用显示装置124的触摸屏功能检测的图像捕获会话。这使得数字图像捕获模块202使数字摄像机108在图像捕获会话期间捕获至少一个数字图像110(块806)。

作为其一部分,在用户界面中输出可用于确定何时每个数字图像110将由数字摄像机108捕获的定时指示(块808)。如第二阶段304所示,边界318和定时指示320被配置成同心圆。这些同心圆可以例如对应于由用户来发起和继续图像捕获会话而做出的接触位置。例如,用户输入可以通过“按压并保持”被识别为手势,其中按压发起图像捕获会话,一旦释放使得该会话终止。

在这种情况下,定时指示320被配置成以从第二阶段304到第三阶段306和第四阶段308的进展所示的测量速率朝向边界318连续扩展。在第四阶段308,定时指示320已经到达边界。这使得数字图像处理模块118捕获数字图像110。如由虚线指示的当移动到用户界面的部分(块810)数字图像处理模块118还生成包括被捕获的数字图像的缩略图322的动画。如在单个图像捕获会话内在第五阶段310所示,该处理可以通过持续的用户输入(例如,维持“按压并保持”手势)来继续捕获附加的数字图像324、326。

再次返回到图2,音频输入数据114也在图像捕获会话期间由音频输入装置112捕获(块812),并且被转换为文本数据206(块814)。例如,用户104可以指示图3的水壶132的品牌名称。然后,将音频输入数据114提供给语音至文本识别模块204以通过使用库208来生成文本数据206。音频输入装置112可以例如包括模数转换器(ADC)以将模拟波信号转变到音频输入数据114。然后,通过使用库208检查音频输入数据114中的音素来由语音至文本识别模块204生成文本数据206。

然后,文本数据206被提供给元数据采集模块210以生成元数据212(块814)。在一个示例中,元数据212是本地生成的诸如用于标记数字图像110。在另一示例中,采用外部服务系统。例如,元数据采集模块210可以形成包括用于经由网络传输至服务提供商系统120的文本数据206的通信(块818)。服务提供商系统120采用服务管理器模块122至少部分地基于文本数据206来执行搜索。然后,由元数据采集模块210经由网络来接收用作生成元数据的基础的搜索结果(块820)。

服务提供商系统120可以以多个方式配置,并且因此元数据212也可以以多种方式变化。在一个这样的示例中,服务提供商系统120和服务管理器模块122被配置成支持商品和服务的出售。作为其一部分,在存储装置214中收集描述了要出售的商品(例如,品牌名称)、库存图像、产品描述和价格的数据。然后,该信息可以用于生成与在数字图像110中捕获的内容(例如,产品或服务)相关的元数据212。

然后,由元数据关联模块216将元数据212与至少一个数字图像114相关联(块822)。这可以包括将标签作为图像114的部分、作为相关联的数据文件的部分等包括在内。然后,采用用户界面呈现模块218诸如呈现数字图像114和相关联的元数据116,用于由显示装置220输出(块824)和/或存储在存储装置222例如计算机可读存储介质中。

再次返回图3B,在第六阶段312,接收到用户输入以停止图像捕获会话,例如,将用户的手的手指抬离计算装置102的触摸屏。这使得数字图像处理模块118选择在图像捕获会话期间捕获的数字图像110之一作为针对一组数字图像322至326的代表性数字图像328。该选择可以基于多种因素诸如图像特征来选择例如如使用机器学习来学习的具有最佳相对图像质量的数字图像114。然后,将该组“折叠”在所示的单个缩略图表示的后面。

与数字图像328相关联的元数据也同时显示在用户界面314中。在所示的实例中,元数据332包括从服务提供商系统120获得的产品名称和相关联的平均出售价格。还输出在图像捕获会话期间捕获的多个数字图像的指示330。以这种方式,用户可以通过数字图像和音频输入的组合来有效且直观地获得描述产品的元数据。

图4描绘了示出多个图像捕获会话的结果的示例系统400。在该示例中,用户104已经继续发起图像捕获会话以将关于客厅106中的各种其他对象的元数据相关联。所示的示例包括灯334和花瓶336的数字图像。这些示例中的每一个还包括具有产品名称和价格(例如,相同或相似产品的多次在线拍卖的平均价格)的元数据338、340以及在各个图像捕获会话期间捕获的多个数字图像的指示342、344。因此,在该示例中,用户可以快速地与不同的对象进行交互并且获得关于那些对象的信息。在一个实现方式中,这还可以涵盖物理图像(例如,来自杂志、书本)或作为来自社交网络系统等的例如网站、图像的屏幕快照的所捕获的数字图像。数字图像和元数据的这种组合可以用于支持多个功能,其示例将在下面进行描述并在相应的图中示出。

图5描绘了具有图像捕获会话的结果的虚拟库的示例实现方式500。在该示例中,由计算装置102输出包括如前面所描述的数字图像328、334、336、元数据332、338、340以及指示330、342、344的用户界面314。用户界面314还包括从服务管理器模块122从元数据更新模块504获得的当前库值502。

例如,元数据更新模块504可以响应于由服务管理器模块122确定的价格的变化响应于由元数据更新模块504对API的调用在访问虚拟库时以预定的间隔等按照推送模型之后获得对平均价格的更新。这可以反映在单个元数据332、338、340以及该组的当前库值502中。还输出指示平均价格趋势的元数据506、508、510,并因此可以向用户指示购买或销售产品的好时机。

技术还可以用于对图像捕获会话的结果进行分组。如图6的示例实现方式600所示,例如,输出描述总当前库值602的元数据以及描述对象和相关联的图像捕获会话的采集的元数据例如“客厅当前值$209.98”604。以这种方式,用户可以根据需要对图像捕获会话的结果进行分组和安排,并以有效且有组织的方式更新与会话相关联的元数据。在该示例中,结果中的每一个也是用户可选择的,以导航至具有附加信息和功能的屏幕,屏幕的示例在下文进行描述并在相应的图中示出。

图7描绘了由图6中的灯的缩略图334的用户选择而得到的用户界面314的配置。该用户界面314还包括来自先前屏幕的缩略图334和指示342以及指示平均价格的元数据。另外,用户界面314包括形成为价格趋势的图形指示702的附加元数据、产品的品牌名称704以及从服务提供商系统120获得的平均运输成本706。

用户界面314还包括利用图像捕获会话的数字图像和相关联的元数据的选项,在该示例中该选项是将要出售的图像捕获会话的对象主题列为“列出该项目”708。在用户界面中对该选项的选择使得数字图像处理模块118的列表模块710针对基于音频输入数据114的与在元数据116中标识的对象有关的列表数据714生成列表请求712。列表数据714包括取自其他列表的产品描述、运输成本、库存图像等,其然后可以“按原样”使用或进一步修改以生成列表。因此,使用元数据和图像捕获会话可以提高用户关于作为图像捕获会话的一部分捕获的内容的了解,并且还支持购买或销售图像捕获会话的产品的有效技术。

尽管在该示例中描述了商业数据的采集,但是可以采用本文描述的图像捕获会话以及作为涉及这些会话的一部分的元数据关联技术来支持多个其他功能。在一个示例中,采用音频输入数据以改进用于标识数字图像中的对象的对象标识技术,例如,充当“提示”以指导使用机器学习的模型选择。在另一示例中,还例如使用雷达技术收集附加信息以标识对象,在雷达技术中,Wi-Fi信号被用于生成对象的3D地图,然后该3D地图可以被用于指导相似对象的搜索。

示例系统和装置

图9示出了通常在900处包括示例计算装置902的示例系统,该示例计算装置902表示可以实现本文所描述的各种技术的一个或更多个计算系统和/或装置。这通过包括数字图像处理模块118来说明。计算装置902可以是例如服务提供商的服务器、与客户端相关联的装置(例如,客户端装置)、片上系统和/或任何其它合适的计算装置或计算系统。

所示出的示例计算装置902包括处理系统904、一个或更多个计算机可读介质906以及一个或更多个彼此可通信地耦接的I/O接口908。尽管未示出,计算装置902还可以包括系统总线或将各种部件彼此耦接的其他数据和命令传输系统。系统总线可以包括不同总线结构的任何一个或组合,总线结构诸如存储器总线或存储器控制器、外围总线、通用串行总线和/或利用各种总线架构中的任何一种的处理器或本地总线。还考虑了各种其他示例,诸如控制线和数据线。

处理系统904表示使用硬件执行一个或更多个操作的功能。因此,处理系统904被示为包括可以被配置成处理器、功能块等的硬件元件910。这可以包括在硬件中实现为使用一个或更多个半导体形成的专用集成电路或其他逻辑装置。硬件元件910不受形成它们的材料或其中采用的处理机制的限制。例如,处理器可以包括半导体和/或晶体管(例如,电子集成电路(IC))。在这样的情境中,处理器可执行指令可以是电子可执行指令。

计算机可读存储介质906被示为包括存储器/存储装置912。存储器/存储装置912表示与一种或更多种计算机可读介质相关联的存储器/存储装置容量。存储器/存储装置912可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置部件912可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存、可移动硬盘驱动器、光盘等)。可以按照下面进一步描述的各种其他方式来配置计算机可读介质906。

输入/输出接口908表示使得用户能够向计算装置902输入命令和信息并且还使得能够使用各种输入/输出装置将信息展现给用户和/或其他部件或装置的功能。输入装置的示例包括键盘、光标控制装置(例如鼠标)、麦克风、扫描仪、触摸功能(例如被配置成检测物理触摸的电容传感器或其他传感器)、摄像机(例如可以采用可见波长或不可见波长诸如红外频率来将移动识别为不涉及触摸的手势)等。输出装置的示例包括显示装置(例如,监测器或投影仪)、扬声器、打印机、网卡、触觉响应装置等。因此,可以如下文进一步描述的各种方式来配置计算装置902以支持用户交互。

在本文中,可以在软件、硬件元件或程序模块的通常情境中描述各种技术。通常,这样的模块包括执行特定任务或实现特定提取数据类型的例程、程序、对象、元件、部件、数据结构等。本文所使用的术语“模块”、“功能”和“部件”通常表示软件、固件、硬件或其组合。本文描述的技术的特征与平台无关,这意味着可以在具有各种处理器的各种商业计算平台上实现这些技术。

所描述的模块和技术的实现方式可以被存储在某种形式的计算机可读介质上或在某种形式的计算机可读介质上传输。计算机可读介质可以包括可以由计算装置902访问的各种介质。借助示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。

“计算机可读存储介质”可以指与仅信号传输、载波或信号本身相比能够实现信息的持久和/或非暂态存储的介质和/或装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括硬件诸如易失性和非易失性、可移动和不可移动介质和/或在适合于信息的存储的方法或技术中实现的存储装置诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其他存储技术、CD-ROM、数字多功能磁盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带、磁盘存储装置或其他磁性存储装置或者其他存储装置、有形介质或适合于存储期望信息且可由计算机访问的制造的物品。

“计算机可读信号介质”可以指被配置成例如经由网络将指令传输至计算装置902的硬件的信号承载介质。信号介质通常可以在调制数据信号诸如载波、数据信号或其他传输机制中实施计算机可读指令、数据结构、程序模块或其他数据。信号介质还包括任何信息传递介质。术语“调制数据信号”是指具有以将信息编码为信号的方式来设置或改变其特征中的一个或更多个的信号。借助示例而非限制,通信介质包括有线介质诸如有线网络或直接有线连接,以及无线介质诸如声学、RF、红外和其他无线介质。

如前面所描述的,硬件元件910和计算机可读介质906表示以硬件形式实现的模块、可编程装置逻辑和/或固定装置逻辑,硬件形式可以在一些实施方式中被采用以实现本文所描述的技术的至少某些方面诸如执行一个或更多个指令。硬件可以包括集成电路或片上系统的组件、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及在硅或其他硬件中的其他实现方式。在此情境中,硬件可以作为执行由指令限定的程序任务的处理装置和/或由硬件实施的逻辑以及用于存储用于执行诸如先前描述的计算机可读存储介质的指令的硬件来操作。

也可以采用前述的组合来实现本文描述的各种技术。因此,软件、硬件或可执行模块可以被实现为在某种形式的计算机可读存储介质上实施的一个或更多个指令和/或逻辑以及/或者由一个或更多个硬件元件910来实现。计算装置902可以被配置成实现与软件和/或硬件模块相对应的特定指令和/或功能。因此,可以例如至少部分地通过使用计算机可读存储介质和/或处理系统904的硬件元件910以硬件来实现由计算装置902作为软件可执行的模块的实现。指令和/或功能可以由一个或更多个制造的物品(例如,一个或更多个计算装置902和/或处理系统904)可执行/可操作以实现本文描述的技术、模块和示例。

本文描述的技术可以由计算装置902的各种配置支持,并且不限于本文描述的技术的特定示例。该功能还可以全部或部分地通过使用分布式系统来实现诸如如下面所描述的经由平台916在“云”914上实现。

云914包括和/或表示用于资源918的平台916。平台916提取云914的硬件(例如服务器)和软件资源的底层功能。资源918可以包括当在远离计算装置902的服务器上执行计算机处理时可以利用的应用和/或数据。资源918还可以包括通过因特网和/或通过订户网络诸如蜂窝网络或Wi-Fi网络所提供的服务。

平台916可以提取资源和功能以将计算装置902与其他计算装置连接。平台916还可以用于提取资源的缩放,以为经由平台916实现的针对资源918的遇到的需求提供相应的缩放级别。因此,在互连装置实施方式中,本文描述的功能的实现方式可以分布在整个系统900中。例如,该功能可以在计算装置902上部分实现,也可以经由提取云914的功能的平台916来实现。

结论

尽管本发明已经以具体到结构特征和/或方法行为的语言进行了描述,但是应当理解,所附权利要求中限定的本发明不一定限于所描述的特定特征或行为。而是公开了具体特征和行为作为实现所要求保护的发明的示例形式。

附记

本公开内容包括但不限于以下方案。

1.一种由计算装置实现的方法,所述方法包括:

由所述计算装置接收用户输入以发起图像捕获会话;

由所述计算装置在所述图像捕获会话期间使用数字摄像机捕获至少一个数字图像;

由所述计算装置在所述图像捕获会话期间使用音频输入装置收集音频输入数据;

由所述计算装置将所述音频输入数据转换为文本数据;

由所述计算装置使得基于所述文本数据生成元数据;

由所述计算装置将所述元数据与所述至少一个数字图像相关联;以及

作为所述图像捕获会话的完成,由所述计算装置将所述至少一个数字图像输出为具有相关联的元数据。

2.根据方案1所述的方法,其中,所述捕获包括在所述图像捕获会话期间捕获多个所述数字图像,并且还包括在所述计算装置的用户界面中输出定时指示,所述定时指示能够用于确定何时每个所述数字图像将由所述数字摄像机捕获。

3.根据方案1所述的方法,其中,所述捕获包括当移动到由所述计算装置输出的用户界面的一部分时,显示包括所述至少一个数字图像的缩略图的动画。

4.根据方案1所述的方法,其中,所述捕获包括在所述图像捕获会话期间捕获多个所述数字图像,并且所述输出包括从多个所述数字图像中选择所述至少一个数字图像作为多个所述数字图像的代表并且与所关联的元数据同时在用户界面中显示为缩略图。

5.根据方案1所述的方法,其中,所述使得包括:

形成用于经由网络传输至服务提供商系统的通信,所述通信包括所述文本数据;以及

经由所述网络接收用作生成所述元数据的基础的搜索结果,所述搜索结果作为由所述服务提供商系统至少部分地基于所述文本数据执行的搜索结果而生成。

6.根据方案5所述的方法,其中,所述至少一个数字图像包括产品或服务,并且所述音频输入数据标识所述产品或服务。

7.根据方案6所述的方法,其中,所述元数据描述所述产品或服务的价格或所述产品或服务的类别。

8.根据方案7所述的方法,其中,所述价格至少部分地基于由所述服务提供商系统提供出售的多个类似的产品或服务。

9.根据方案8所述的方法,其中,由所述服务提供商系统作为在线拍卖的一部分而提供出售所述多个类似的产品或服务。

10.根据方案1所述的方法,其中,所述元数据是作为标识所述至少一个图像中包括的内容的标签。

11.根据方案1所述的方法,其中,所述至少一个数字图像的所述捕获和所述音频输入数据的所述收集由所述计算装置同时执行。

12.一种系统,包括:

数字图像捕获模块,其至少部分地在计算装置的硬件中被实现成响应于接收到用于发起图像捕获会话的用户输入而使用数字摄像机来捕获至少一个数字图像;

语音至文本采集模块,其至少部分地在所述计算装置的硬件中被实现成将由音频输入装置收集的音频输入数据转换为文本数据;

元数据采集模块,其至少部分地在所述计算装置的硬件中被实现成使得基于文本数据生成元数据;

元数据关联模块,其至少部分地在所述计算装置的硬件中被实现成将所述元数据与所述至少一个数字图像相关联;以及

用户界面呈现模块,其至少部分地在所述计算装置的硬件中被实现成在用户界面将所述至少一个数字图像显示为具有所关联的元数据。

13.根据方案12所述的系统,其中,所述元数据收集模块被配置成:

形成用于经由网络传输至服务提供商系统的通信,所述通信包括所述文本数据;以及

经由所述网络接收用作生成所述元数据的基础的搜索结果,所述搜索结果作为由所述服务提供商系统至少部分地基于所述文本数据执行的搜索结果而生成。

14.根据方案13所述的系统,其中,所述至少一个数字图像包括产品或服务,所述音频输入数据标识所述产品或服务,并且所述元数据描述所述产品或服务的价格或所述产品或服务的类别。

15.根据方案14所述的系统,其中,所述价格至少部分地基于由所述服务提供商系统提供出售的多个相似的产品或服务。

16.根据方案12所述的系统,其中,所述数字图像捕获模块和所述语音至文本采集模块被配置成同时捕获所述至少一个数字图像并转换所述音频输入数据。

17.一种计算装置,包括:

音频输入装置;

数字摄像机;

处理系统和其上存储有指令的计算机可读存储介质,所述指令响应于所述计算装置的执行而使得所述计算装置执行以下操作,所述操作包括:

接收输入以发起图像捕获会话;

在所述图像捕获会话期间使用所述数字摄像机捕获至少一个数字图像;

在所述图像捕获会话期间使用所述音频输入装置收集音频输入数据;

将所述音频输入数据转换为文本数据;

使得基于所述文本数据生成元数据;

将所述元数据与至少一个数字图像相关联;以及

作为所述图像捕获会话的完成,将所述至少一个数字图像输出为具有相关联的元数据。

18.根据方案17所述的计算装置,其中,所述使得包括:

形成用于经由网络传输至服务提供商系统的通信,所述通信包括所述文本数据;以及

经由所述网络接收用作生成所述元数据的基础的搜索结果,所述搜索结果被生成为由所述服务提供商系统至少部分地基于所述文本数据执行的搜索的结果。

19.根据方案18所述的计算装置,其中,所述至少一个数字图像包括产品或服务,并且所述音频输入数据标识所述产品或服务。

20.根据方案19所述的计算装置,其中,所述元数据描述所述产品或服务的价格或所述产品或服务的类别。

相关技术
  • IP产品运营数据处理方法、装置、设备及可读存储介质
  • 数据仓库内数据处理方法、装置、计算机设备和存储介质
  • 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
  • 基于大数据平台的数据处理方法、装置、设备及介质
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 可食用产品安全数据处理方法、装置、设备、介质和产品
  • 产品数据的处理方法、装置、设备、存储介质及程序产品
技术分类

06120116548712