掌桥专利:专业的专利平台
掌桥专利
首页

用于在低资源设置中训练多语言ASR声学模型的基于音译的数据扩充

文献发布时间:2024-01-17 01:13:28


用于在低资源设置中训练多语言ASR声学模型的基于音译的数据扩充

背景技术

技术领域

本公开总体上涉及声学语音识别(ASR),并且更具体地涉及训练多语言ASR声学模型。

相关技术的描述

用于语音识别系统的声学模型通常涉及数百小时的任务特定的训练数据。然而,当用于任务特定的训练的可用资源量低时,例如,远小于典型的数百或数千小时的量(例如,数十小时),存在挑战。低资源设置使得难以充分训练声学模型。因此,这样的声学模型的错误率通常比存在足够训练资源的情况下高得多。

在这样的低资源设置中,来自其他语言的转录的数据可以用于构建多语言声学模型。然后,这样的多语言声学模型或者用于提取多语言瓶颈特征以用于后续处理,或者可以在对低资源语言执行微调步骤之后直接用作声学模型。解决低资源设置的问题的先前尝试包括将数据扩充应用于训练数据,这在训练声学模型中没有导致显著的改进,以及手动干预。

然而,即使用附加转录的数据,用低资源设置训练的声学模型的词错误率(WER)也相对较高。改善性能的先前尝试包括:(1)数据扩充以清洗语音;(2)声道长度扰动(VTLP);(3)音频速度和温度扰动,以及这些方法的各种组合。

因此,需要解决在低资源设置中以减小的WER训练多语言声学模型的问题。

发明内容

根据一个实施例,一种在低资源设置中构建用于自动语音识别的多语言声学模型的计算机实现的方法包括:用原始转录的训练数据在训练语言集上训练多语言网络,以创建基准多语言声学模型。通过经由多语言网络处理来自语言集的多个多语言数据类型并且输出音译数据池来执行转录的训练数据的音译。将过滤度量应用于音译数据输出池以选择音译数据的一个或多个部分用于声学模型的重新训练。通过将输出音译数据的一个或多个选择的部分添加回原始转录的训练数据来执行数据扩充以更新训练数据。用更新的训练数据训练新的多语言声学模型。该计算机实现的方法至少由于音译和数据扩充操作以及对输出的音译数据执行数据扩充而提供了对多语言声学模型的更准确的训练。将数据扩充应用于输出的音译数据,特别是低资源设置,还提供了声学模型的更多样和准确的训练,因为训练数据被改进和增加。

在一个实施例中,该计算机实现的方法还包括用更新的训练数据重新训练基准多语言声学模型。这种操作导致更准确和鲁棒的基准声学模型。

在一个实施例中,原始训练数据来自低资源语言,并且多语言网络包括神经网络,该神经网络包括多个语言特定输出层,该多个语言特定输出层被配置为分别对每种语言的符号集进行建模,并且其中神经网络将音译数据的语言特定部分输出到至少一个相应的语言特定输出层。神经网络的使用提供了更快和更有效的声学模型训练。

在一个实施例中,将输出音译数据的一个或多个选择的部分添加回原始转录的训练包括使用其他语言的符号由新的数据副本形成的重新标记的数据。使用其他语言的符号对由新的数据副本形成的数据进行重新标记辅助多语言网络训练多语言声学模型。

在一个实施例中,用包括数十小时的原始转录的数据的原始转录的训练数据的低资源设置来执行多语言网络在训练语言集上的训练。该方法提供了声学模型的更准确训练,因为否则低资源设置难以准确且高效地训练。

在一个实施例中,计算机实现的方法包括响应于由多语言神经网络处理未转录的数据而生成半监督标签。

在一个实施例中,通过选择音译数据池中与音译数据的剩余部分相比具有相对更高的符号计数的一个或多个部分来执行对音译数据池的过滤。该操作提供了训练更准确的声学模型。过滤度量的应用提供了对多语言声学模型的更鲁棒和准确的训练。

在一个实施例中,通过将音译数据中的符号与包括原始转录的训练数据的话语中的符号的比率进行比较,并且选择音译数据池中具有更高符号比率的一个或多个部分,来执行对音译数据池的度量过滤的应用。过滤度量的应用提供了对多语言声学模型的更鲁棒和准确的训练。

在一个实施例中,对多个多语言数据类型的处理包括以下处理:转录的训练数据、来自同一训练语言集的未转录的数据和来自不同语言的未转录的数据。

在一个实施例中,将新语言添加到多语言网络的输入中,并且输出新语言的音译数据。新语言增加了鲁棒模型的多样性以提高准确度和训练。

根据实施例,一种被配置用于多语言声学模型的基于音译的数据扩充的自动语音识别系统包括处理器和耦合到该处理器的存储器。存储器存储指令以使处理器执行动作,该动作包括:用原始转录的训练数据在训练语言集上训练多语言网络以构建基准多语言声学模型,通过经由多语言网络处理来自语言集的多个多语言数据类型来执行音译,并且输出音译数据池。将过滤度量应用于从多语言网络输出的音译数据池以选择音译数据的一个或多个部分用于声学模型的重新训练。通过将输出音译数据的一个或多个选择的部分添加回原始转录的训练数据来执行数据扩充以获得更新的训练数据。通过多语言网络处理更新的训练数据,并用更新的训练数据重新训练多语言声学模型。这种配置至少由于音译和数据扩充操作以及对输出的音译数据执行数据扩充而提供了对声学模型的更准确的训练。

在一个实施例中,多语言网络包括神经网络,该神经网络包括被配置为分别对每种语言的符号集进行建模的多个语言特定输出层,并且其中该神经网络被配置为将音译数据的语言特定部分输出到至少一个相应的语言特定输出层。神经网络的使用提供了更快和更有效的声学模型训练。

根据实施例,一种有形地体现具有计算机可读指令的计算机可读程序代码的非暂时性计算机可读存储介质,所述计算机可读指令在被执行时使计算机设备执行一种在低资源设置中构建用于自动语音识别的多语言声学模型的方法。该方法包括在从多种语言提取的池化数据集上训练具有端到端循环层的多语言模型。

通过将每个话语的声学特征正向传递通过经训练的网络来音译转录的训练数据。通过将属于用于训练网络的语言的未转录的训练数据正向传递通过网络来对该数据进行音译。应用过滤度量,该过滤度量包括话语的音译输出中的符号数量的计数或者音译语言中的符号计数与参考转录本的符号计数的比率中的至少一个。通过将音译数据添加到语言的训练池并且训练新的多语言模型来执行数据扩充。

从以下结合附图阅读的对本发明的说明性实施例的详细描述中,这些和其它特征将变得显而易见。

附图说明

附图是说明性实施例。它们没有示出所有实施例。除此之外或作为替代,可使用其它实施例。可以省略可能是明显的或不必要的细节以节省空间或用于更有效的说明。一些实施例可以用附加的部件或步骤和/或不用所示出的所有部件或步骤来实践。当相同的数字出现在不同的附图中时,它指的是相同或相似的部件或步骤。

图1提供了与说明性实施例一致的多语言网络的架构的概览。

图2示出了与说明性实施例一致的具有各种类型的训练数据和过滤度量的图1的多语言网络。

图3示出了与说明性实施例一致的声学模型性能。

图4示出了与说明性实施例一致的声学模型性能。

图5示出了与示例性实施例一致的在移植模型以包括新语言之后的按照词错误率(WER%)的模型性能。

图6是示出与所示实施例一致的建立用于ASR的多语言声学模型的计算机实现的方法的流程图。

图7是与说明性实施例一致的、可以与用于地震成像的系统的各种联网组件通信的计算机硬件平台的功能框图说明。

图8描绘了与说明性实施例一致的说明性云计算环境。

图9描绘了与说明性实施例一致的由云计算环境提供的一组功能抽象层。

具体实施方式

概述

在以下详细描述中,通过示例阐述了许多具体细节以提供对相关教导的透彻理解。然而,应理解,可在没有这些细节的情况下实践本教导。在其它实例中,已在相对较高层级上描述众所周知的方法、程序、组件和/或电路,而没有细节,以避免不必要地混淆本教导的方面。

虽然本公开的说明性实施例涉及在低资源设置中构建用于原始训练数据的多语言声学模型,但是计算机实现的方法和系统不限于这样的条件。低资源设置是例如仅有几十小时的训练数据可用的设置。应当理解,“低资源语言”是其中没有足够数量的语言资源来训练自动语音识别系统以可接受的词错误率进行操作的一种语言。在没有足够的训练数据可用的情况下,存在一些语言的多种方言。尽管本公开解决了如何克服训练自动语音识别系统的问题,但是这些教导也是可适用的,并且与可用于低资源设置的数十小时相比,这些教导向可能具有数千小时的可用训练数据的更高资源设置提供益处。

本公开的计算机实现的方法和设备提供了在诸如自动语音识别(ASR)系统之类的设备中使用的声学模型的训练和实现方式的准确度的改进,尤其是在存在可能不足以训练声学模型来以令人满意的准确率执行的训练数据的低资源设置的情况下。另外,本公开的计算机实现的方法和设备提供了计算机操作的效率的改进。例如,根据本文的教导,技术改进导致训练和操作ASR系统中的声学模型所需的处理能力的量的减少,因为更少的历元、迭代和更少的时间被用于获得提供准确结果的模型。减少和/或消除了对于校正声学模型操作中的错误的人类交互的需要,这使得计算机操作更有效。历元和迭代的减少还提供了计算机存储器使用的减少。使用本公开的教导,在产生更准确的声学模型时实现了时间节省。

示例架构

图1提供了与说明性实施例一致的多语言网络的示例架构100的概览。在该说明性实施例中,多语言网络105包括输入特征层110、多个共享语言独立循环层115以及语言特定输出层120a、120b和120c。还示出了转录的训练数据135。

输入特征层110接收原始转录的数据。原始转录的数据是口语或发出的声音(诸如话语)的表示。在自动语音识别系统中,话语被转录成与话语的语言相关联的符号。例如,英语话语被转录为英语,日语话语被转录为日语等。由多语言网络105推送(例如,处理)转录的数据。多语言网络可以是神经网络,并且如该说明性实施例中所示,神经网络的层执行语言处理的各种功能。共享的独立循环层通过执行诸如音译的操作来处理原始转录的数据。音译功能应用其它语言的符号来表示话语。由于人类发出的声音具有一定程度的共同性,英语话语可以被音译成不同语言(例如,印地语、蒙古语、爪哇语、西班牙语、普通话)的符号,以创建音译数据池。共享语言相关循环层115将注明日期的音译提供给语言特定输出层120a、120b、120c等。在该说明性实施例中,输出层120输出原始转录的数据,而输出层120a和120c是音译输出层,意味着存在音译数据的语言特定输出。转录的训练数据135包括在被添加回多语言网络的层以用于进一步处理之前经受附加处理功能的数据。

图2示出了与说明性实施例一致的具有各种类型的训练数据和过滤度量的图1的多语言网络的概览200。例如,图2示出了可以提供给输入特征层210的不同种类的输入数据。可以表示语言符号中的一个或多个话语的原始转录的训练数据205被示出为输入特征层210的输入之一。示出了附加数据,诸如与话语的转录的训练数据相同语言的第一未转录的数据207以及与话语的转录的数据的语言不同语言的第二未转录的数据209。未转录的数据中的一个或两个可以与原始转录的数据一起输入,以在训练自动语音识别系统中使用的声学模型的准确度和能力方面改进多语言声学模型的训练。

现在参考以上关于图1和图2的描述,图2中所示的语言特定输出层220a、220b、220c提供音译数据的输出池。输出数据池具有过滤度量225,其被应用来选择将增加声学模型的训练的准确度的数据。存在可以用作过滤度量225的若干功能。

根据过滤度量225的一种这样的过滤是通过针对每个语言特定输出执行音译数据的符号计数,并且选择最高符号计数或相对较高符号计数的组(相对于具有较低符号计数的语言)。更高的符号计数可以提供对音译数据的选择,该音译数据提供对多语言声学模型的更准确的训练。

可以根据过滤度量225执行的另一过滤功能是将音译数据中的符号与话语的原始转录的数据中的符号的比率进行比较,并且选择输出音译数据中具有更高符号比率的一个或多个部分。

然后可以通过将音译输出数据230的一个或多个选择的部分添加到原始转录的训练数据235来执行多语言数据扩充。图2标识了三个语言特定输出层的语言,其中235a、235c是由相应层220a、220c输出并经受过滤度量和数据扩充的语言。数据扩充之后的原始转录的数据235b是语言特定层220b在附加处理之后的输出。然后,将扩充的数据235a、235b、235c输入回多语言网络用于进一步处理。可以执行多次迭代,使得多语言声学模型的训练数据被创建,以提高声学模型的准确度。在低资源设置中,本公开的教导提供了多语言声学模型的更准确的训练,同时节省了计算资源。

图3是示出与说明性实施例一致的声学模型性能的表305。图3标识了对低资源语言的实验(标识为条件401、402、403和404)。这些单语言模型分别包括蒙古语、爪哇语、杜洛语和格鲁吉亚语。标签“C1”标识所有音译数据的使用,而“D1”标识通过过滤度量选择的数据,E1标识使用过滤度量的50小时的数据,并且F1标识使用过滤度量的100小时的数据。可以看出,通过使用音译训练数据,每种语言的词错误率百分比都降低了。随着资源数量的增加,每种语言都表现出词错误率百分比的提高。

图4示出了与说明性实施例一致的声学模型性能。与图3类似,示出了基准性能405和用未转录的训练数据的模型性能415。还示出了用未转录的跨语言数据420的模型性能。

基准性能405包括单语言和多语言条件。用未转录的训练数据415的模型性能包括半监督(ST)转录本。例如,多语言网络可用于转录未转录的数据。当未转录对应于用于训练多语言网络的语言的数据时,网络可产生针对该数据的转录本。由于标签是在没有人类标注的情况下自动生成的,因此其被称为半监督数据。另外,模型性能415包括音译(TL)语言符号。关于用未转录的跨语言数据420的模型性能,“CSR1”包括语言宿务语(Cebuano)、哈萨克语(Kazakh)、特拉古语(Telegu)和立陶宛语(Lithuanian),“CSR2”包括普什图语(Pashto)、巴拉圭瓜拉尼语(Paraguyan Guarani)、伊博语(Igbo)和阿姆哈拉语(Amharic)。

图5示出了与示例性实施例一致的在移植模型以包括新语言之后的模型性能(WER%)。图5示出了模型的移植以包括新语言(意大利语)。可以看出,随着训练时间的增加,存在性能的改善。

进一步关于图5,意大利语是正在被训练的新语言。例如,A4是当仅在意大利语上训练网络时的情况——随机初始化该网络的权重。在B4中,再次仅在意大利语上训练网络,但是这次网络被初始化以形成已经在许多语言上(但尚未在意大利语上)训练的多语言网络。在这种情况下,网络被更好地初始化,因此B4比A4更好。C4是训练多语言系统时的情况。意大利语现在是多语言语言之一,因此经训练的模型可用于处理意大利语。由于多语言训练,C4比A4或B4更好。D4是训练更好的多语言网络的情况。该模型现在使用附加的音译数据用于训练。

应当理解,针对ASR训练的声学模型通常被置于两类——混合声学模型或端到端声学模型。本公开的教导可以应用于这两类。因此,虽然联结主义时间分类(ConnectionistTemporal Classification,CTC)是一种可以在端到端声学模型训练中使用的训练方法,但是本公开不限于端到端声学模型训练。

示例过程

通过示例架构的前述概览,现在考虑示例过程的高级讨论可能是有帮助的。为此,结合图1-图5、图6描述了与说明性实施例一致的、图示包括配置阶段和执行阶段的地震成像操作的流程图600。过程600被示为逻辑流程图中的框的集合,其表示可以用硬件、软件或其组合来实现的操作序列。在软件的上下文中,这些框表示计算机可执行指令,这些指令在由一个或多个处理器执行时执行所叙述的操作。通常,计算机可执行指令可以包括执行功能或实现抽象数据类型的例程、程序、对象、组件、数据结构等。在每个过程中,描述操作的顺序不旨在被解释为限制,并且任何数量的所描述的框可以以任何顺序组合和/或并行执行以实现该过程。

现在参考图6,在操作605处,用原始转录的训练数据在训练语言集上训练多语言网络。该原始转录的训练数据例如是被转录成其母语的话语。例如,使用英语符号和字素(grapheme)来转录英语话语。然而,应当理解,可以使用其他符号。音位(phoneme)、子词、整个词等也可以代替或与字素一起使用。在该示例中,原始转录的设置是低资源设置,这意味着存在数十小时的训练数据(与典型资源设置中的数百或数千小时的训练数据相反)。

在操作610处,通过处理多个多语言数据来执行音译。在音译中,一种语言的话语由与做出话语的语言不同的语言的符号表示。在低资源设置环境中,音译数据池可以由多语言网络输出。

在操作615处,将过滤度量应用于从多语言网络输出的音译数据池以选择音译数据的一个或多个部分用于声学模型的重新训练。选择这些部分是为了重新训练声学模型以提高准确度(即,降低词错误率),并通过增加训练数据量来使声学模型更鲁棒。应用过滤度量的示例是选择音译数据的与音译数据的剩余部分相比具有相对更高的符号计数的一个或多个部分。例如,在话语的情况下,更高的符号计数可以更准确地定义话语。

在另一个示例中,通过将音译数据中的符号与包括原始转录的训练数据的话语中的符号的比率进行比较,并且选择输出音译数据的具有更高符号比率的一个或多个部分,来执行将过滤度量应用于音译数据的输出池。应当理解,在一个实施例中,如果存在多个选择的部分,则最高比率可以遵循顺序(例如,第一最高、第二最高、第三最高等)。

在操作620处,通过将经由应用过滤度量而选择的音译数据的一个或多个选择的部分添加回原始转录的数据来执行数据扩充。数据扩充可以提供例如话语的多个表示,既以原始转录的数据的语言,也以可以使用来自与话语的语言不同的语言的符号来表示话语的扩充的数据。例如,该话语可以是以英语的,但是扩充的数据可以使用印地语中的符号来表达该话语。因此,扩充的数据可以被认为是更新的训练数据。

在操作625处,多语言网络用更新的训练数据训练新的多语言声学模型。该过程在操作625之后结束。然而,应当理解,可以执行多个历元以增加多语言声学模型的准确度和鲁棒性。可以添加新语言并且生成附加的音译数据以增加多语言声学模型的准确度和鲁棒性。在本公开中,还可以用更新的训练数据来重新训练基准多语言声学模型。

图7提供了计算机硬件平台的功能框图图示700。具体地,图7示出了特别配置的网络或主机计算机平台700,其可以用于实现图6所示的方法。

计算机平台700可包括中央处理单元(CPU)704、硬盘驱动器(HDD)706、随机存取存储器(RAM)和/或只读存储器(ROM)708、键盘710、鼠标712、显示器714和通信接口716,它们连接到系统总线702。HDD 706可以包括数据存储。

在一个实施例中,HDD 706具有包括存储程序的能力,该程序可以以本文描述的方式执行各种处理,诸如自动语音识别705(ASR)操作。ASR模块705提供对自动语音识别过程的管理,诸如用于训练多语言声学模型742。网络处理模块710在低资源设置中处理训练数据以创建基准多语言声学模块。音译模块720使用来自至少一种语言的符号来表示以另一种语言说出的话语,并且网络处理模块720输出音译数据池。过滤度量模块730被配置用于对音译数据的输出池的应用,并且还被配置为选择音译数据的一个或多个部分用于声学模型742的重新训练。数据扩充模块735被配置为通过将输出的音译数据的一个或多个选择的部分添加回原始转录的数据来扩充训练数据,以重新训练声学模型742。训练样本模块740存储多语言数据以训练网络处理器模块。

示例云平台

如上所述,与环境和生态优化方法相关的功能可以包括云。应当理解,尽管本公开包括如下文所讨论的云计算的详细描述,但是本文所陈述的教导的实现不限于云计算环境。相反,本公开的实施例能够结合现在已知或以后开发的任何其他类型的计算环境来实现。

云计算是一种服务递送模型,用于实现对可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池的方便的按需网络访问,所述可配置计算资源可以以最小的管理努力或与服务的提供者的交互来快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。

特性如下:

按需自助:云消费者可以单方面地自动地根据需要提供计算能力,诸如服务器时间和网络存储,而不需要与服务的提供者进行人工交互。

广域网接入:能力在网络上可用,并且通过促进由异构的薄或厚客户端平台(例如,移动电话、膝上型计算机和PDA)使用的标准机制来访问。

资源池化:提供者的计算资源被池化以使用多租户模型来服务多个消费者,其中不同的物理和虚拟资源根据需求被动态地分配和重新分配。存在位置无关的意义,因为消费者通常不控制或不知道所提供的资源的确切位置,但是能够在更高抽象级别(例如国家、州或数据中心)指定位置。

快速弹性:在一些情况下,可以快速且弹性地提供快速向外扩展的能力和快速向内扩展的能力。对于消费者,可用于提供的能力通常看起来不受限制,并且可以在任何时间以任何数量购买。

测量服务:云系统通过利用在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某一抽象级别的计量能力来自动地控制和优化资源使用。可以监视、控制和报告资源使用,从而为所利用服务的提供者和消费者两者提供透明性。

服务模型如下:

软件即服务(SaaS):提供给消费者的能力是使用在云基础设施上运行的提供者的应用。应用可通过诸如web浏览器(例如,基于web的电子邮件)等薄客户端界面从各种客户端设备访问。消费者不管理或控制包括网络、服务器、操作系统、存储或甚至个别应用能力的底层云基础设施,可能的例外是有限的用户特定的应用配置设置。

平台即服务(PaaS):提供给消费者的能力是将消费者创建或获取的应用部署到云基础设施上,该消费者创建或获取的应用是使用由提供者支持的编程语言和工具创建的。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施,但具有对部署的应用和可能的应用托管环境配置的控制。

基础设施即服务(IaaS):提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其它基本计算资源,所述软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施,但具有对操作系统、存储、部署的应用的控制,以及可能对选择的联网组件(例如,主机防火墙)的有限控制。

部署模型如下:

私有云:云基础设施仅为组织操作。它可以由组织或第三方管理,并且可以存在于场所内或场所外。

社区云:云基础设施由若干组织共享,并且支持具有共享关注(例如,任务、安全要求、策略和合规性考虑)的特定社区。它可以由组织或第三方管理,并且可以存在于场所内或场所外。

公有云:云基础设施可用于一般公众或大型工业群组,并且由销售云服务的组织拥有。

混合云:云基础设施是两个或更多个云(私有、社区或公有)的组合,所述云保持唯一实体,但是通过使数据和应用能够移植的标准化或私有技术(例如,用于云之间的负载平衡的云突发)绑定在一起。

云计算环境是面向服务的,其焦点在于无状态、低耦合、模块性和语义互操作性。在云计算的核心是包括互连节点的网络的基础设施。

现在参考图8,描绘了利用云计算的说明性云计算环境800。如图所示,云计算环境800包括具有一个或多个云计算节点810的云850,云消费者使用的本地计算设备可以与所述云计算节点通信,所述本地计算设备诸如例如是个人数字助理(PDA)或蜂窝电话854A、台式计算机854B、膝上型计算机854C和/或汽车计算机系统854N。节点810可以彼此通信。它们可以被物理地或虚拟地分组(未示出)在一个或多个网络中,诸如如上文描述的私有云、社区云、公有云或混合云或其组合。这允许云计算环境800提供云消费者不需要为其维护本地计算设备上的资源的基础设施、平台和/或软件即服务。应当理解,图8中所示的计算设备854A-N的类型仅旨在说明,并且计算节点810和云计算环境850可以通过任何类型的网络和/或网络可寻址连接(例如,使用web浏览器)与任何类型的计算设备通信。

现在参考图9,示出了由云计算环境800(图8)提供的一组功能抽象层900。应当预先理解,图9中所示的组件、层和功能仅旨在说明,并且本公开的实施例不限于此。如所描绘的,提供了以下层和相应的功能:

硬件和软件层960包括硬件和软件组件。硬件组件的示例包括:大型主机961;基于RISC(精简指令集计算机)架构的服务器962;服务器963;刀片服务器964;存储设备965;以及网络和联网组件966。在一些实施例中,软件组件包括网络应用服务器软件967和数据库软件968。

虚拟化层970提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器971;虚拟存储972;虚拟网络973,包括虚拟专用网络;虚拟应用和操作系统974;以及虚拟客户端975。

在一个示例中,管理层980可以提供下面描述的功能。资源供应981提供计算资源和被利用来在云计算环境内执行任务的其它资源的动态采购。计量和定价982提供了在云计算环境内利用资源时的成本跟踪,以及针对这些资源的消耗的开账单或开发票。在一个示例中,这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证,以及为数据和其他资源提供保护。用户门户983为消费者和系统管理员提供对云计算环境的访问。服务级别管理984提供云计算资源分配和管理,使得满足所需的服务级别。服务级别协议(SLA)规划和履行985提供了对云计算资源的预安排和采购,其中根据SLA预期未来需求。

工作负载层990提供了可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括:绘图和导航991;软件开发和生命周期管理992;虚拟教室教育递送993;数据分析处理994;事务处理995;以及ASR模块996,用于在基于混合云的平台上执行地震成像,如本文所讨论的。

结论

已经出于说明的目的呈现了本教导的各种实施例的描述,但是不旨在是穷举的或限于所公开的实施例。在不背离所描述的实施例的范围的情况下,许多修改和变化对于本领域的普通技术人员将是显而易见的。选择本文所使用的术语以最好地解释实施例的原理、实际应用或对市场上存在的技术的改进,或使本领域的其他普通技术人员能够理解本文所公开的实施例。

虽然上文已描述了被认为是最佳状态的内容和/或其它示例,但应理解,可在其中作出各种修改,且本文所揭示的主题可以以各种形式和示例来实现,且所述教导可应用于许多应用中,本文仅描述了其中的一些应用。所附权利要求旨在要求保护落入本教导的真实范围内的任何和所有应用、修改和变型。

在此讨论的组件、步骤、特征、目的、益处和优点仅仅是说明性的。它们中的任何一个,或者与它们相关的讨论都不是要限制保护范围。虽然本文已经讨论了各种优点,但是将理解,并非所有实施例都必须包括所有优点。除非另有说明,否则在本说明书中包括所附权利要求中阐述的所有测量、值、评分、位置、大小、尺寸和其它规格是近似的,而不是精确的。它们旨在具有与它们相关的功能以及它们所属领域的惯例一致的合理范围。

也考虑了许多其它实施例。这些实施例包括具有更少、附加和/或不同组件、步骤、特征、目的、益处和优点的实施例。这些实施例还包括其中以不同方式布置和/或排序的组件和/或步骤的实施例。

本文的附图中的流程图和图表示出了根据本公开的各种实施例的可能实现方式的架构、功能和操作。

虽然已经结合示例性实施例描述了前述内容,但是应当理解,术语“示例性”仅意味着作为示例,而不是最佳或最优的。除了上文刚刚陈述的,无论是否在权利要求中陈述,已陈述或说明的内容都不打算或不应解释为导致任何组件、步骤、特征、目的、益处、优点或等效物专用于公众。

应当理解,除非在此另外阐述了特定的含义,否则在此使用的术语和表达具有与关于它们相应的各自的调查和研究领域的这些术语和表达一致的普通含义。诸如第一和第二等的关系术语可仅用于将一个实体或动作与另一个区分,而不必要求或暗示这些实体或动作之间的任何这种实际关系或顺序。术语“包括”、“包含”或其任何其它变化形式旨在涵盖非排他性的包括,使得包括一系列元素的过程、方法、物品或装置不仅包括那些元素,而且可以包括未明确列出的或对于这样的过程、方法、物品或装置是固有的其它元素。在没有进一步约束的情况下,前面有“一”或“一个”的元素不排除在包括该元素的过程、方法、物品或装置中存在附加的相同元素。

提供本公开的摘要以允许读者快速确定本技术公开的本质。应当理解,它不是用于解释或限制权利要求的范围或含义。另外,在前述具体实施方式中,可以看出,为了使本公开流畅的目的,在各种实施例中将各种特征分组在一起。这种公开方法不应被解释为反映了所要求保护的实施例具有比每个权利要求中明确记载的特征更多的特征的意图。相反,如所附权利要求所反映的,本发明性主题在于少于单个公开的实施例的所有特征。因此,以下权利要求由此被并入具体实施方式中,其中每个权利要求独立地作为单独要求保护的主题。

技术分类

06120116068383