掌桥专利:专业的专利平台
掌桥专利
首页

一种模型训练和实体识别方法

文献发布时间:2024-04-18 20:00:50


一种模型训练和实体识别方法

技术领域

本申请涉及计算机技术领域,尤其涉及一种模型训练和实体识别方法。

背景技术

随着人工智能技术的发展,自然语言处理(Natural Language Processing,NLP)受到了广泛的关注。其中,实体识别是NLP的一个重要组成部分,实体可以是人名、机构名、地名,更广泛的实体还包括数字、日期、货币、地址等。

目前,可以基于文本以及文本中实体词的标注训练实体识别模型,之后,根据训练后的实体识别模型对文本进行识别。

但在某些应用场景中,可能存在实体的全称的字数较多的情况。针对全称字数较多的实体,可以用缩略词代替实体的全称。例如,在设备维修记录中,用户为了提高记录效率,可以使用设备的缩略词代替设备的全称,将“低压加热器进汽电动门法兰渗油”记录为“低加进汽电动门法兰渗油”,这其中,“低加”即为全称词“低压加热器”的缩略词。由于在目前的实体识别模型的训练样本中,实体的缩略词的标注较少,导致实体识别模型在识别包含实体的缩略词的文本时,准确性较低。

发明内容

本申请提供一种模型训练和实体识别方法,以部分的解决现有技术存在的上述问题。

本申请采用下述技术方案:

本申请提供了一种模型训练方法,包括:

获取指定文本,并确定所述指定文本包含的各实体缩略词;

根据所述各实体缩略词在所述指定文本中的第一频次,以及所述各实体缩略词在通用语料库中的第二频次,分别确定所述各实体缩略词的参考指标;

根据所述各实体缩略词的参考指标,从所述各实体缩略词中确定所述指定文本对应的目标缩略词;

以所述指定文本作为训练样本,根据所述指定文本对应的目标缩略词,确定所述训练样本的标注;

根据所述训练样本和所述训练样本的标注,训练实体识别模型。

可选地,确定所述指定文本包含的各实体缩略词,具体包括:

获取目标树;其中,所述目标树基于多个实体全称词和各所述实体全称词分别对应的各参考缩略词构建得到;

将所述指定文本和所述目标树进行匹配,得到所述指定文本包含的各实体缩略词。

可选地,所述目标树的构建过程,具体包括:

根据各实体全称词包含的各字的排列顺序,以及各参考缩略词包含的各字的排列顺序,确定各节点的连接顺序;其中,所述各节点以所述各实体全称词包含的各字以及所述各参考缩略词包含的各字确定;

从所述各节点中确定目标节点,并根据所述各节点的连接顺序,确定所述目标节点的父节点和所述目标节点的子节点;

根据所述目标节点、所述目标节点的父节点和所述目标节点的子节点,构建目标树。

可选地,将所述指定文本和所述目标树进行匹配,得到所述指定文本包含的各实体缩略词,具体包括:

依次将所述指定文本包含的各字,与所述目标树的各节点进行匹配,确定所述指定文本在所述目标树中命中的目标路径;

根据所述目标路径上各节点对应的字,确定所述指定文本包含的各实体缩略词。

可选地,确定所述指定文本在所述目标树中命中的目标路径,具体包括:

依次将所述指定文本包含的各字,与所述目标树的各节点进行匹配,确定所述指定文本在所述目标树中命中的各路径;

确定所述指定文本在所述目标树中命中的各路径分别包含的节点数;

根据节点数大于预设阈值的路径,确定所述指定文本在所述目标树中命中的目标路径。

可选地,根据所述各实体缩略词在所述指定文本中的第一频次,以及所述各实体缩略词在通用语料库中的第二频次,分别确定所述各实体缩略词的参考指标,具体包括:

确定所述各实体缩略词分别对应的第一权重和至少一个第二权重;其中,所述第一权重为实体缩略词在对应的指定文本中的第一频次对应的权重,每一所述第二权重为实体缩略词在对应的通用语料库中的第二频次对应的权重;

根据所述第一权重和所述第二权重,对该实体缩略词在所述指定文本中第一频次以及该实体缩略词在通用语料库中第二频次加权求和,得到该实体缩略词的参考指标。

本申请提供了一种实体识别方法,包括:

获取实体识别请求;其中,所述实体识别请求对应于待识别文本;

利用实体识别模型得到所述待识别文本对应的实体缩略词;其中,所述实体识别模型基于上述的模型训练方法得到。

可选地,所述方法还包括:

响应于实体识别请求,将待识别文本与对应关系进行匹配;其中,所述对应关系用于表示指定文本的实体全称词和相对应的目标缩略词之间的关系;

响应于匹配到成功,将匹配到的目标缩略词作为所述待识别文本包含的实体缩略词;

所述利用所述实体识别模型得到所述待识别文本对应的实体缩略词,包括:

响应于匹配失败,将所述待识别文本输入训练完成的实体识别模型,得到所述实体识别模型输出的所述待识别文本包含的实体缩略词。

本申请提供了一种模型训练装置,包括:

第一获取模块,用于获取指定文本,并确定所述指定文本包含的各实体缩略词;

参考指标确定模块,用于根据所述各实体缩略词在所述指定文本中的第一频次,以及所述各实体缩略词在通用语料库中的第二频次,分别确定所述各实体缩略词的参考指标;

目标缩略词确定模块,用于根据所述各实体缩略词的参考指标,从所述各实体缩略词中确定所述指定文本对应的目标缩略词;

标注确定模块,用于以所述指定文本作为训练样本,根据所述指定文本对应的目标缩略词,确定所述训练样本的标注;

训练模块,用于根据所述训练样本和所述训练样本的标注,训练实体识别模型。

本申请提供了一种实体识别装置,包括:

请求获取模块,用于获取实体识别请求;其中,所述实体识别请求对应于待识别文本;

实体缩略词确定模块,用于利用实体识别模型得到所述待识别文本对应的实体缩略词;其中,所述实体识别模型基于上述的模型训练方法得到。

本申请提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练和实体识别方法。

本申请提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练和实体识别方法。

本申请采用的上述至少一个技术方案能够达到以下有益效果:

本申请提供的模型训练和实体识别方法中,根据指定文本包含的实体缩略词在指定文本中的第一频次和各实体缩略词在通用语料库中的第二频次,确定各实体缩略词的参考指标,根据各实体缩略词的参考指标,从各实体缩略词中确定指定文本对应的目标缩略词,进而以指定文本为训练样本,根据指定文本的目标缩略词确定训练样本的标注,基于训练样本及其标注训练实体识别模型。通过上述方案可实现自动挖掘缩略词的目的,无需人工标注,降低人力成本。并且,基于实体缩略词在指定文本中的第一频次和实体缩略词在通用语料库中的第二频次确定训练样本的标注的方式,可提高标注的准确性,进而提高实体识别模型的识别准确性。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请中一种模型训练方法的流程示意图;

图2为本申请中一种模型训练方法的流程示意图;

图3为本申请中一种目标树的示意图;

图4为本申请中一种模型训练方法的流程示意图;

图5为本申请中一种模型训练方法的流程示意图;

图6为本申请中一种实体识别方法的流程示意图;

图7为本申请提供的一种模型训练装置的示意图;

图8为本申请提供的一种实体识别装置的示意图;

图9为本申请提供的对应于图1或图6的电子设备示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

另外,需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。

随着人工智能技术的发展,NLP领域逐渐受到广泛关注。其中,实体识别(NamedEntity Recognition,NER)作为NLP中一项基础且重要的任务被广泛研究。目前,实体识别主要采取基于规则和字典的方法,以及基于机器学习的方法。

其中,基于规则和字典的方法通常采用专家经验构造规则模板,规则模板可以是正则表达式的形式,以规则模板和待识别文本相匹配,将命中模板的词语作为实体词。基于机器学习的方法则是将包含实体词的文本作为训练样本,将文本中的实体词进行标注得到训练样本的标注,将训练样本输入待训练的实体识别模型,通过实体识别模型输出训练样本包含的每个字的标识,以模型输出的每个字的标识和训练样本的标注之间的差异的最小化为训练目标,训练实体识别模型。

在上述两种方案中,基于规则和字典的方法往往依赖于具体语言、领域和文本风格,制定规则模板的过程耗时且难以涵盖所有领域中的语言,对于特定领域而言可移植性差,单一的规则模板不适用于各种不同领域的实体识别场景,需要基于专家经验逐个构造规则模板,构造周期长且召回率低。而基于机器学习的方法中,实体识别模型的准确度依赖于训练样本标注的数量和准确性,但对于特征领域而言,标注数据较少,且特定领域有特定类型的实体词,自动打标的准确性较低,只能依赖于人工打标,耗费人力资源且效率较差。

更进一步的,在某些应用场景中,还可能存在实体的全称的字数较多的情况。针对全称字数较多的实体,可以用缩略词代替实体的全称。例如,在设备维修记录中,用户为了提高记录效率,可以使用设备的缩略词代替设备的全称,将“低压加热器进汽电动门法兰渗油”记录为“低加进汽电动门法兰渗油”,这其中,“低加”即为全称词“低压加热器”的缩略词。针对包含实体缩略词的文本,构造规则模板和对训练样本进行标注的难度更大,导致规则模板和训练样本的标注更少。

基于此,本申请提供一种模型训练和实体识别方法,基于实体缩略词在指定文本中的第一频次和实体缩略词在通用语料库中的第二频次确定训练样本的标注的方式,可实现自动挖掘缩略词的目的,无需人工标注,并保证实体识别模型的识别准确性。

以下结合附图,详细说明本申请各实施例提供的技术方案。

图1为本申请提供的一种模型训练方法的流程示意图。

S100:获取指定文本,并确定所述指定文本包含的各实体缩略词。

本申请实施例中提供的一种模型训练方法,该模型训练方法可由用于模型训练的服务器等电子设备执行。另外,在实体识别模型训练完成后,所涉及到的基于训练完成的实体识别模型执行本申请提供的实体识别方法的电子设备,和执行模型训练方法的电子设备可以相同也可以不同,本申请对此不做限定。

在实际应用中,识别文本中的实体词能够避免分词错误、辅助语义分析。实体词实际上是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、机构名、日期时间、专有名词等。实体识别就是从非结构化的输入文本中抽取出上述类型的实体。另外,还可以按照业务需求识别出更多类别的实体,比如产品名称、型号、价格等。

在实体识别中,还存在一种特殊的应用场景。当实体的全称的字数较多时,用户更倾向于采用实体的缩略词表达实体的全称,以提高记录或表达的效率。缩略词是由较长的词语缩短省略而成的词语,在语言学中,缩略词是全称简化后的表达形式,又称“缩写”和“简称”。由于缩略词在表达上简洁精炼,在人们的日常生活中被大量使用。

基于文本中出现实体缩略词的情况,如果采用基于规则和字典的方法,则需要针对实体缩略词出现的语言领域构造规则模板。但这种方式极度依赖字典包含的实体缩略词的数量,且构造规则模板需要手工构造,难度较大且耗费人力。而采用基于机器学习的方式时,在目前的实体识别模型的训练样本中,实体的缩略词的标注较少,导致实体识别模型在识别包含实体的缩略词的文本时,准确性较低。

基于上述情况,在本申请实施例中,采取自动获取较为准确的实体缩略词的标注的方式,降低实体识别模型所需训练样本的标注的获取难度,以及标注的准确性。

为此,在此步骤中,首先获取指定文本。其中,指定文本可以是非结构化的文本,该指定文本可包含若干字、词。指定文本可以是特定领域的文本,也可以是通用语料库中的文本,本申请对此不做限定。但为了使得训练完成的实体识别模型能够识别特定领域的文本包含的实体缩略词,在本申请中,以指定文本是特定领域的文本为例,对具体的技术方案进行阐述。另外,指定文本中可以包含缩略词,也可以不包含缩略词而仅包含全称词,也可以既包含全称词也包含缩略词,当然,也可以既不包含缩略词也不包含全称词,本申请对此不做限定,并且,本申请对同一条指定文本中是否出现同一实体的多种表达(全称词或不同缩略形式的缩略词)也不做限定。

进一步的,确定指定文本包含的各实体缩略词。在实际应用中,如果实体的全称词字数较多,可以采用实体缩略词去表征相对应的实体。一般的,一个实体的全称词可以对应于多个不同缩略形式的缩略词,例如,对于实体全称词“低压加热器”,其缩略词可以是“低压”、“低加”、“低压加”、“低压加热”、“压加”、“压热”等缩略形式。基于此,在此步骤中,可将指定文本包含的实体缩略词逐一标注出来,确定指定文本包含的实体缩略词的方法可以是人工标注,也可以是基于预先构建的包含实体缩略词的目标树匹配得到,本申请对此不做限定。

另外,需要说明的是,即使在此步骤中指定文本中的实体缩略词是基于人工标注得到的,该人工标注的准确率可以不高,即,对标注人员的技术要求可以降低。这是由于在后续步骤S102至步骤S104还会对各实体缩略词表征实体的可靠性和准确性进行评估得到参考指标,进而基于参考指标对各实体缩略词进行筛选。因此,即使在此步骤中指定文本中的实体缩略词是基于人工标注得到的,相较于目前直接基于人工标注得到较为准确的实体词标注的方法,其耗费的人力也较低、且标注的效率也较高。

S102:根据所述各实体缩略词在所述指定文本中的第一频次,以及所述各实体缩略词在通用语料库中的第二频次,分别确定所述各实体缩略词的参考指标。

具体的,在步骤S100中确定了指定文本包含的各实体缩略词,但在实际应用中,用户采用缩略词去表达某一实体时,会使用符合自身表达习惯的缩略词去表征同一实体,因此,在不同的用户使用缩略词的习惯不同的情况下,即使多条指定文本来源于同一语言领域,也会出现同一实体对应于多个不同缩略形式的实体缩略词的情况。

为此,在此步骤中,需要确定各实体缩略词的参考指标,所述参考指标用于指示实体缩略词表征实体缩略词对应的实体的可靠程度和准确程度。

实体缩略词的可靠程度和准确程度指的是该实体缩略词能够指代相对应的实体的概率。一般的,认为用户采用某个实体缩略词指代相对应的实体时,该实体缩略词是较为准确和可靠的。越多的用户使用某个实体缩略词,则说明该实体缩略词指代相对应的实体的概率越高,该实体缩略词的可靠程度和准确程度就越高。因此,在本申请实施例中,通过各实体缩略词在文本中出现的频次,确定各实体缩略词的可靠程度和准确程度。

具体的,分别确定各实体缩略词在指定文本中的第一频次,以及,分别确定各实体缩略词在通用语料库中的第二频次。其中,实体缩略词在指定文本中的第一频次可以表征在指定文本对应的特定语言领域中,该实体缩略词的可靠程度和准确程度。实体缩略词在通用语料库中的第二频次可以表征在通用语言领域中该实体缩略词的可靠程度和准确程度。也即,确定各实体缩略词在特定语言领域中被使用的概率,以及各实体缩略词在通用语言领域中被使用的概率。

进一步的,根据各实体缩略词的第一频次,以及各实体缩略词的第二频次,分别确定各实体缩略词的参考指标。其中,参考指标与第一频次正相关,且与第二频次正相关,即,第一频次越大、第二频次越大,参考指标越大。

可选地,各实体缩略词的参考指标可以根据各实体缩略词的第一频次和第二频次的加权和确定,第一频次和第二频次的权重可根据先验经验确定,或人工预先设置,本申请对此不做限定。例如,对于实体缩略词“低加”而言,其在指定文本中出现的次数为5次,在通用语料库中出现的次数为3次,则可以确定实体缩略词“低加”的第一频次为5,第二频次为3,如果第一频次和第二频次的权重均为0.5,则实体缩略词“低加”的参考指标为4。

可选地,确定实体缩略词在指定文本的第一频次时,可基于该实体缩略词在指定文本中进行搜索召回,召回得到包含该实体缩略词的指定文本,确定该实体缩略词召回的指定文本的数量,再基于该实体缩略词召回的指定文本的数量确定该实体缩略词在指定文本的第一频次。相对应的,确定实体缩略词在通用语料库的第二频次时,可就该实体缩略词在通用语料库中进行搜索召回,召回得到在通用语料库中包含该实体缩略词的通用语料文本,确定该实体缩略词召回的通用语料文本的数量,在基于该实体缩略词召回的通用语料文本的数量确定该实体缩略词在通用语料库中的第二频次。

S104:根据所述各实体缩略词的参考指标,从所述各实体缩略词中确定所述指定文本对应的目标缩略词。

在实际应用中,由于用户的语言习惯不同,或者是由于缩略词存在歧义的,又或者是缩略词的缩略程度不同,同一实体对应的不同缩略形式的缩略词分别被使用到文本中的概率不一样,从而导致各实体缩略词的参考指标各不相同。一般的,参考指标越大,说明该实体缩略词被使用到文本中的概率越大,即,越多的用户在文本中使用了该实体缩略词,该实体缩略词指代相对应的实体的可靠程度和准确程度越高。因此,在确定指定文本对应的目标缩略词时,可针对每一条指定文本,根据该条指定文本包含的各实体缩略词对应的参考指标,将参考指标较大的若干个实体缩略词作为该条指定文本对应的目标缩略词。其中,目标缩略词的数量可以是一个,也可以是多个,本申请对此不做限定。

另外,也有可能出现某条指定文本中不包含实体缩略词的情况,此时,该条指定文本不存在对应的目标缩略词。

S106:以所述指定文本作为训练样本,根据所述指定文本对应的目标缩略词,确定所述训练样本的标注。

进一步地,本申请采用机器学习的方式,以指定文本为训练样本,以指定文本对应的目标缩略词确定训练样本的标注。具体的,以指定文本对应的目标缩略词确定训练样本的标注的方式可以是目前现有的任一实体标注方式,如BIO三元标注、BMES四元标注或者BIOES五元标注等序列标注方式,本申请对此不做限定。

例如,对于指定文本“低加进汽电动门法兰渗油”,其中的“低加”为该条指定文本的目标缩略词,则该条指定文本的标注可以是“BEOOOOOOOOO”。

S108:根据所述训练样本和所述训练样本的标注,训练实体识别模型。

具体的,采用有监督学习的方式,训练实体识别模型,即,将训练样本输入待训练的实体识别模型,得到所述实体识别模型输出的所述训练样本对应的预测标注,以所述预测标注和所述训练样本的标注之间的差异的最小化为训练目标,训练所述实体识别模型。其中,实体识别模型的模型结构可以是现有的任一可应用在实体识别任务中的机器学习模型结构,如Lattice LSTM、CAN-NER、FLAT等,本申请对此不做限定。

本说明提供的模型训练方法中,根据指定文本包含的实体缩略词在指定文本中的第一频次和各实体缩略词在通用语料库中的第二频次,确定各实体缩略词的参考指标,根据各实体缩略词的参考指标,从各实体缩略词中确定指定文本对应的目标缩略词,进而以指定文本为训练样本,根据指定文本的目标缩略词确定训练样本的标注,基于训练样本及其标注训练实体识别模型。通过上述方案可实现自动挖掘缩略词的目的,无需人工标注,降低人力成本。并且,基于实体缩略词在指定文本中的第一频次和实体缩略词在通用语料库中的第二频次确定训练样本的标注的方式,可提高标注的准确性,进而提高实体识别模型的识别准确性。

在本申请一个或多个实施例中,在如图1步骤S100确定所述指定文本包含的各实体缩略词中,除了基于人工标注的方法从指定文本中提取实体缩略词外,还可以基于目标树匹配的方式,从指定文本中提取实体缩略词,具体方案如下,如图2所示:

S200:获取目标树,其中,所述目标树基于多个实体全称词和各所述实体全称词分别对应的各参考缩略词构建得到。

具体的,在如图1步骤S100从指定文本中提取实体缩略词时,由于指定文本可以是特定语言领域的文本,指定文本中包含的实体缩略词可能是通用语言领域并不常用的缩略词,从而提高了标注人员的门槛。同时,还可能存在基于人工标注得到的实体缩略词遗漏、错误等情况。为了减少人工的耗费,并提高从指定文本中提取出的实体缩略词的准确性,可以采用基于目标树匹配的方法得到执行文本包含的各实体缩略词。其中,目标树可以是基于已知的实体缩略词构建的。而已知的实体缩略词可以基于已知的实体全称词经过枚举得到。

基于此,在此步骤中获取的目标树可以是基于多个实体全称词,以及各实体全称词分别对应的各参考缩略词构建得到的。其中,实体全称词可以与指定文本同属于一个特定语言领域,当然实体全称词也可以来源于通用语言库,本申请对此不做限定。

可选地,在本申请实施例中,对实体全称词进行缩略可以得到至少一个实体缩略词,而一般的,在中文领域中,实体缩略词的字数在两个或两个以上时才可能存在明确的指代实体的含义,并且,实体全称词的字数一般多于实体缩略词的字数,因此,在本申请实施例中,实体缩略词的字数可以是两个或两个以上,实体全称词的字数多于实体缩略词的字数,如三个或三个以上,本申请对实体全称词和实体缩略词的具体字数不做限定。

进一步的,由于构建出的目标树是用于与指定文本进行匹配,将指定文本中包含的实体缩略词提取出来的,因此,可以根据实体全称词对应的缩略词构建目标树。于是,在构建目标树之前,需要根据各实体全称词分别确定各实体全称词对应的各参考缩略词。

其中,确定实体全称词对应的参考缩略词的方式可以是基于增量构造的枚举子集的方式,或者是人工穷举的方式,本申请对此不做限定。

例如,对于实体全称词“低压加热器”,其参考缩略词可以是“低压”、“低加”、“低热”、“压加”、“压热”、“低压加”、“低压加热”等。

需要说明的是,在此步骤中,确定的实体全称词对应的各参考缩略词,并非每个参考缩略词都是该实体全称词的常用且准确的缩略形式,例如,对于上述参考缩略词“低压”而言,既可以是“低压加热器”的参考缩略词,也可以是其他实体全称词的参考缩略词,如“低压缸”。可见,同一参考缩略词可能对应于不同的实体全称词,因此,对于在此步骤中得到的各参考缩略词而言,其指代实体全称词的可靠程度和准确程度可以不高。

可选地,在确定各实体全称词对应的各参考缩略词后,可以针对每个实体全称词,构建该实体全称词和该实体全称词的各参考缩略词之间的对应关系并存储。

具体的,目标树由多个节点构成,各节点之间可以存在连接关系,以根节点为起始节点,向下延伸,直至延伸至叶子节点为止。一般的,对于目标树中的每个节点而言,在目标树中与该节点相邻且排序在该节点之前的节点为该节点的父节点,在目标树中与该节点相邻且排序在该节点之后的节点为该节点的子节点。于是,在本申请实施例中,基于各实体全称词和各参考缩略词构建的目标树中,节点可对应于一个字或多个字(词),对于每个节点而言,该节点的父节点所对应的字或词在实体全称词和/或各参考缩略词中,排列在该节点所对应的字或词的前面,相对应的,该节点的子节点所对应的字或词,在实体全称词和/或各参考缩略词中,排列在该节点所对应的字或词的后面。

在本申请一个或多个实施例中,可根据具体的应场景确定目标树所采用的树的结构,可以是二叉树、多叉树、线索树等任一现有的树的结构,本申请对此不做限定。

可选地,目标树可以是线索树,线索树是在二叉树或多叉树的基础上,对于树包含的每个节点均对应线索,所述线索为指向该节点的前驱节点和后继节点的指针。基于此,针对目标树包含的每个节点,根据与该节点相连的父节点和子节点,确定该节点的线索,并向目标树包含的各节点的线索进行存储,以便后续基于目标树和指定文本进行匹配时,可基于目标树包含的各节点的线索,确定指定文本命中的目标树中的路径。

另外,本申请一个或多个实施例中并不限制目标树每一层包含的节点的数量以及目标树树的深度不做限定。

例如,仍以上述“低压加热器”为例,基于该实体全称词及其各参考缩略词构建的目标树可以如图3所示,在图3中每一个节点对应于一个字,以“低”为根节点,按照实体全称词和各参考缩略词包含的各字的排列顺序,依次向下延伸,直至延伸到最后一个字。

S202:将所述指定文本和所述目标树进行匹配,得到所述指定文本包含的各实体缩略词。

基于各实体全称词和所述各参考缩略词构建出的目标树,可以表征各字、各词之间的位置信息和顺序信息,并且,由于目标树中每个节点都对应于字或词,在将目标树与指定文本进行匹配时,若指定文本包含的各字能够命中目标树中的一条路径,则可以根据该命中的路径包含的各节点所对应的字或词,确定指定文本包含的实体全称词或实体缩略词。其中,匹配的方式可以是基于AC自动机的方式。

例如,以图3所示的目标树为例,当指定文本为“低加进汽电动门法兰渗油”时,将指定文本中的每个字依次与该目标树的根节点进行匹配,当匹配到与根节点相同的字时,开始在该目标树上搜索路径,基于图三所示的目标树,上述指定文本搜索到的路径为根节点指向“加”字对应的节点,则确定该指定文本包含的实体缩略词为“低加”。

基于如图2所示的方法,根据指定文本和目标树进行匹配,自动从指定文本中提取实体缩略词。通过上述方案,可以实现自动确定指定文本中实体缩略词的目的,无需人工标注,减少人力的耗费。

在本申请一个或多个实施例中,如图2所示步骤S200目标树中,基于多个实体全称词及其对应的各参考缩略词构建出的目标树可以包括多个节点,每个节点可以对应于实体全称词或者参考缩略词中的字,基于此,目标树可以按照如下方式构建,如图4所示:

S300:根据所述各实体全称词包含的各字的排列顺序,以及所述各参考缩略词包含的各字的排列顺序,确定所述各节点的连接顺序,其中,所述各节点以所述各实体全称词包含的各字以及所述各参考缩略词包含的各字确定。

目标树包含多个节点,不同的节点可以对应于不同的字,因此,目标树包含的不同路径对应于由不同的字构成的词。为了构建目标树,可将各实体全称词分别包含的各字,以及各参考缩略词包含的各字均作为节点。

具体的,对于实体全称词或是参考缩略词而言,构成词的各字之间是存在排列顺序的,即,各字需要以一定的排列顺序依次排列,才能够组合成实体全称词或者参考缩略词。因此,在目标树中,可以根据各实体全称词包含的各字的排列顺序,以及所述各参考缩略词包含的各字的排列顺序,确定各节点的连接顺序。

其中,针对实体全称词包含的各字中的每个字,根据实体全称词包含的各字的排列顺序,确定与该字相邻且排列顺序在该字之前的字作为该字的前一个字,确定与该字相邻且排列顺序在该字之后的字作为该字的后一个字。参考缩略词同理。

由于在上述步骤S300中以各实体全称词包含的各字以及所述各参考缩略词包含的各字作为各节点,因此,可基于各实体全称词包含的各字以及各参考缩略词包含的各字之间的关系,确定各节点之间的连接顺序。

S302:从所述各节点中确定目标节点,并根据所述各节点的连接顺序,确定所述目标节点的父节点和所述目标节点的子节点。

在此步骤中,从各节点中确定目标节点,其中,该目标节点可以是各节点中的任意一个或多个节点,也可以是指代各节点中的每个节点。在实际应用中,可以根据各节点的连接顺序,依次确定每个节点的父节点和子节点。

具体的,针对目标节点,根据目标节点对应的字在各实体全称词以及各参考缩略词中的前一个字,确定与目标节点相连的父节点,根据目标节点对应的字在各实体全称词以及各参考缩略词中的后一个字,确定与目标节点相连的子节点。

其中,对于各节点中的目标节点而言,该目标节点可以存在多个父节点和/或多个子节点,本申请对此不做限定。

S304:根据所述目标节点、所述目标节点的父节点和所述目标节点的子节点,构建目标树。

具体的,将目标节点的父节点、目标节点和目标节点的子节点依次连接,形成目标树的至少一个分支。遍历多个目标节点,根据各目标节点及其父节点和子节点,形成多个分支,根据各分支构建目标树。

需要说明的是,在遍历各节点,分别确定各节点的父节点以及子节点中,当节点不存在父节点时,确定该节点对应的字在各实体全称词以及各参考缩略词中均作为首字,此时可以将该节点作为目标树的根节点。当节点不存在子节点时,确定该节点对应的字在各实体全称词以及各参考缩略词中均作为末尾字,此时可以将该节点作为目标树的叶子节点。

在本申请一个可选的实施例中,在如图2步骤S202将所述指定文本和所述目标树进行匹配,得到所述指定文本包含的各实体缩略词中,由于目标树包含的节点与实体全称词和参考缩略词包含的字相对应,因此,可以根据指定文本在目标树上命中的节点,确定指定文本包含的实体缩略词,具体方案如下:

第一步:依次将所述指定文本包含的各字,与所述目标树的各节点进行匹配,确定所述指定文本在所述目标树中命中的目标路径。

在本申请实施例中,指定文本可以指的是单条文本,该指定文本中可包含多个字构成的词语。基于此,在将指定文本与目标树进行匹配时,可以将指定文本包含的各字与目标树上的各节点依次进行匹配。由于在本申请实施例中,构建的目标树包含的各节点可以对应于单个字或者是一个词语,并且,目标树包含的多个节点所构成的词实际上对应于如图2步骤S200和步骤S202涉及的实体全称词和参考缩略词,当指定文本中包含的字或词能够与目标树的节点对应的字或词相匹配,说明该条指定文本中包含有实体缩略词。

具体的,当指定文本中包含的字或词能够与目标树的节点对应的字或词相匹配时,指定文本包含的多个字命中目标树中的多个节点,目标树中的多个节点可以构成一条路径,将指定文本在目标树上命中的多个节点连接而成的路径作为指定文本在目标树中命中的目标路径。当然,指定文本中还可以包含多个实体缩略词,此时,指定文本与目标树匹配时,可以命中目标树中的多个目标路径,本申请对目标路径的数量以及目标路径上节点的数量不做限定。

第二步:根据所述目标路径上各节点对应的字,确定所述指定文本包含的各实体缩略词。

将目标路径上各节点对应的字按照目标路径所指示的连接顺序依次连接,即可确定指定文本包含的各实体缩略词。

在本申请一个可选的实施例中,在上述第一步将指定文本包含的各字与目标树的各节点进行匹配时,可能存在指定文本在目标树上命中多个路径的情况,这可能是由于指定文本中包含互不嵌套的多个实体词,也可能是由于指定文本包含的实体词存在实体嵌套的情况。基于上述情况,可以基于下述步骤确定指定文本在目标树中命中的目标路径:

首先,依次将所述指定文本包含的各字,与所述目标树的各节点进行匹配,确定所述指定文本在所述目标树中命中的各路径。

此步骤中确定指定文本在目标树中命中的各路径,与上述步骤第一步类似,此处不再赘述。

其次,确定所述指定文本在所述目标树中命中的各路径分别包含的节点数。

当指定文本包含多个互不嵌套的实体词,或是指定文本包含实体嵌套的实体词时,指定文本在目标树中会命中多个路径,这多个路径分别包含的节点数可能不同,当然也可能相同。具体的,多个互不嵌套的实体词所命中的目标树上的多个路径分别包含的节点的数量可能相同,也可能不同;对于存在实体嵌套情况的实体词,一般多个路径分别包含的节点数不同。

然后,根据节点数大于预设阈值的路径,确定所述指定文本在所述目标树中命中的目标路径。

在此步骤中,将节点数大于预设阈值的路径作为指定文本命中的目标路径,以便后续步骤中,以目标路径包含的各节点所对应的字或词确定指定文本包含的实体缩略词。保留节点数较多的路径作为目标路径是为了避免从指定文本中提取出的实体缩略词的字数过于少,字数较少的缩略词可能存在不能准确表征实体全称词语义、产生歧义的问题,即使存在某些实体全称词的准确缩略词所包含的字数确实比较少,但是,相较于保留字数较少的实体缩略词而言,保留字数较多的实体缩略词的准确率较高。

其中,预设阈值可以是预先由人工设置的,也可以是基于指定文本命中的各路径分别包含的节点数的统计值确定的,本申请对此不做限定。

在本申请一个可选的实施例中,在如图1步骤S102分别确定所述各实体缩略词的参考指标之前,还需要确定步骤S100确定出的指定文本包含的各实体缩略词中不存在实体全称词。

具体的,由于目标树可以基于实体全称词及其参考缩略词进行构建,因此,目标树上的某条路径可能会对应于实体全称词,基于此,在基于目标树和指定文本匹配提取出词后,该词可能是实体全称词,也可能是实体缩略词,由于在本申请实施例中,从指定文本中提取出的词是要作为训练适用于识别实体缩略词的实体识别模型的标注的,因此,可以将从指定文本中提取出的实体全称词清洗掉,仅保留指定文本的实体缩略词。

在本申请一个或多个实施例中,在如图1步骤S102所示根据所述各实体缩略词在所述指定文本中的第一频次,以及所述各实体缩略词在通用语料库中的第二频次,分别确定所述各实体缩略词的参考指标中,第一频次和第二频次对参考指标的确定可以有不同程度的贡献,基于此,上述步骤S102还可以基于下述方案实现,如图5所示:

S400:确定所述各实体缩略词分别对应的第一权重和至少一个第二权重。其中,所述第一权重为实体缩略词在对应的指定文本中的第一频次对应的权重,每一所述第二权重为实体缩略词在对应的通用语料库中的第二频次对应的权重。

具体的,根据上述步骤S102所述,实体缩略词在指定文本中的第一频次可以表征在指定文本对应的特定语言领域中该实体缩略词的可靠程度和准确程度,实体缩略词在通用语料库中的第二频次可以表征在通用语言领域中该实体缩略词的可靠程度和准确程度。实体缩略词的参考指标用于指示该实体缩略词指代相对应的实体的概率。因此,该实体缩略词参考指标可根据第一频次和第二频次确定,而在基于第一频次和第二频次确定参考指标时,第一频次对确定参考指标的贡献度和第二频次对确定参考指标的贡献度可以不同,即第一频次和第二频次分别对应不同的权重。

在实际应用中,可以获取多个侧重点不同的通用语料库,这些通用语料库所包含的文本语料虽然都是通用语料,但侧重点不同的通用语料库中的文本语料中包含的实体词的缩略形式可能存在差异。因此,在多个不同的通用语料库中确定第二频次,可以进一步提高确定的该实体缩略词指代相对应的实体的概率的准确性。

因此,在本申请中,通用语料库可以有一个也可以是多个,从而,当通用语料库只有一个时,可确定实体缩略词在这一个通用语料库中的第二频次对应的第二权重。当通用语料库有多个时,实体缩略词在通用语料库中的第二频次指的是同一实体缩略词在多个不同的通用语料库中的分别得到的第二频次,从而,可确定实体缩略词在多个不同的通用语料库中的第二频次分别对应的第二权重。因此,在此步骤中,确定实体缩略词对应的第一权重,该第一权重为实体缩略词在对应的指定文本中第一频次对应的权重。并且,确定实体缩略词对应的至少一个第二权重,其中,每一第二权重为实体缩略词在相对应的通用语料库中第二频次对应的权重。本申请对第一权重、以及每一第二权重的大小可以根据具体的应用场景确定,本申请对此不做限定。

在实际应用中,如果确定实体缩略词指代相对应的实体的概率,更依赖于该实体缩略词在特定语言领域的指定文本中被使用的频次,则可设置第一频次的第一权重高于第二频次的第二权重。相对应的,如果确定实体缩略词指代相对应的实体的概率,更依赖于该实体缩略词在通用语言领域的通用文本中被使用的频次,则可设置第一频次的第一权重低于第二频次的第二权重。当然,如果确定实体缩略词指代相对应的实体的概率,对该实体缩略词在特定语言领域的指定文本中被使用的频次,以及该实体缩略词在通用语言领域的通用文本中被使用的频次的依赖程度是相当的,则第一频次的第一权重可以与第二频次的第二权重相同。

可选地,第一权重和第二权重的确定方式可以如下得到:预先获取参考实体全称词的第一参考缩略词和第二参考缩略词,获取第一参考缩略词指代参考实体全称词的参考指标,与第二参考缩略词指代参考实体全称词的参考指标之间的大小关系作为参考关系。初始化第一权重和第二权重;确定第一参考缩略词在第一语料库中的第一频次,以及在第二语料库中的第二频次,根据初始化的第一权重和第二权重对第一参考缩略词的第一频次和第二频次加权求和,得到第一参考缩略词的预测指标;确定第二参考缩略词在第一语料库中的第一频次,以及在第二语料库中的第二频次,根据初始化的第一权重和第二权重对第二参考缩略词的第一频次和第二频次加权求和,得到第二参考缩略词的预测指标;根据第一参考缩略词的预测指标与第二参考缩略词的预测指标之间的预测关系,以及所述参考关系之间的差异的最小化,优化第一权重和第二权重,得到优化后的第一权重和第二权重。

S402:根据所述第一权重和所述第二权重,对该实体缩略词在所述指定文本中第一频次以及该实体缩略词在通用语料库中第二频次加权求和,得到该实体缩略词的参考指标。

以W

W

其中,a表示第一频次对应的第一权重,b、c……m表示第二频次分别对应的第二权重。i表示通用语料库的数量,i的取值范围是[1,m]。并且,a+b+c+……+m=1。

在本说明书中,图6为本申请提供的一种实体识别方法的流程示意图。其中,执行该实体识别方法所采用的实体识别模型可以是基于图1~图5中任一示意图所示的训练方法训练的。以下结合附图,详细说明本申请提供的实体识别方法的技术方案。

S500:获取实体识别请求;其中,所述实体识别请求对应于待识别文本。

在基于上述步骤S100至步骤S108得到训练完成的实体识别模型后,可以将训练完成的实体识别模型部署在执行实体识别方法的电子设备中,当该电子设备接收到实体识别请求时,可从实体识别请求中解析得到待识别文本,该待识别文本即为实体识别请求对应需要进行实体识别的文本。本说明书对执行实体识别方法的电子设备和执行前述模型训练方法的电子设备是否相同并不做限定。

待识别文本可以是与指定文本同属于一个语言领域的文本,也可以是通用语言文本,本申请对待识别文本所属的语言领域、字数以及是否实际包含实体缩略词均不做限定。

S502:利用实体识别模型得到所述待识别文本对应的实体缩略词;其中,所述实体识别模型基于模型训练方法得到。

将待识别文本输入到训练完成的实体识别模型,通过实体识别模型的输出可以确定待识别文本包含的每个字的预测标注,基于模型输出的预测标注,可以确定待识别文本包含的实体缩略词。

在本申请一个或多个实施例中,上述步骤S502还可以按照下述方案实现:

首先,响应于实体识别请求,将待识别文本与对应关系进行匹配,其中,所述对应关系用于表示指定文本的实体全称词和相对应的目标缩略词之间的关系。

在前述图1步骤S104确定了指定文本对应的一个或多个目标缩略词后,可将指定文本中的实体全称词与一个或多个目标缩略词之间建立对应关系,并将该对应关系进行存储。在电子设备响应于实体识别请求,对待识别文本进行实体识别时,可在将待识别文本职级输入到实体识别模型之前,首先将待识别文本与对应关系进行匹配。

其中,对应关系可以指的是实体全称词及其相对应的一个或多个目标缩略词之间的绑定关系。在执行实体识别方法的电子设备中可存储有多个对应关系,不同的对应关系指示了不同的实体全称词及其对应的目标搜略次之间的绑定关系。基于该对应关系,通过实体全称词即可查找到相对应的一个或多个目标缩略词。因此,将待识别文本对于对应关系进行匹配,若待识别文本命中对应关系中的实体全称词,则可基于该对应关系,将实体全称词对应的一个或多个目标缩略词作为待识别文本的实体缩略词。

待识别文本与对应关系进行匹配的方式可以是按照待识别文本包含的每个字的先后顺序,依次确定对应关系中实体全称词是否与待识别文本相同的方式。

之后,响应于匹配到成功,将匹配到的目标缩略词作为所述待识别文本包含的实体缩略词。

如果匹配成功,说明电子设备存储的多个对应关系中,存在与待识别文本匹配的实体全称词,此时,可基于匹配到的实体全称词以及对应关系,确定一个或多个目标缩略词作为匹配到的目标缩略词,并将该目标缩略词作为待识别文本对对应的实体缩略词。并且,无需采用实体识别模型,提高实体识别的效率。

然后,响应于匹配失败,将所述待识别文本输入训练完成的实体识别模型,得到所述实体识别模型输出的所述待识别文本包含的实体缩略词

如果在电子设备存储的多个对应该系中并不存在与待识别文本匹配的实体全称词,也即,在匹配失败时,则需要基于训练完成的实体识别模型,对待识别文本进行实体识别,实体识别模型会输出待识别文本包含的每个字的预测标注,基于各字的预测标注,即可待识别文本包含的实体缩略词。

以上为本说明书的一个或多个实施例提供的模型训练方法和实体识别方法,基于同样的思路,本说明书还提供了相应的模型训练装置和实体识别装置,如图7和图8所示。

图7为本申请提供的一种模型训练装置示意图,具体包括:

第一获取模块600,用于获取指定文本,并确定所述指定文本包含的各实体缩略词;

参考指标确定模块602,用于根据所述各实体缩略词在所述指定文本中的第一频次,以及所述各实体缩略词在通用语料库中的第二频次,分别确定所述各实体缩略词的参考指标;

目标缩略词确定模块604,用于根据所述各实体缩略词的参考指标,从所述各实体缩略词中确定所述指定文本对应的目标缩略词;

标注确定模块606,用于以所述指定文本作为训练样本,根据所述指定文本对应的目标缩略词,确定所述训练样本的标注;

训练模块608,用于根据所述训练样本和所述训练样本的标注,训练实体识别模型。

可选地,所述第一获取模块600具体用于,获取目标树;其中,所述目标树基于多个实体全称词和各所述实体全称词分别对应的各参考缩略词构建得到;将所述指定文本和所述目标树进行匹配,得到所述指定文本包含的各实体缩略词。

可选地,所述装置还包括:

目标树构建模块610,具体用于根据各实体全称词包含的各字的排列顺序,以及各参考缩略词包含的各字的排列顺序,确定各节点的连接顺序;其中,所述各节点以所述各实体全称词包含的各字以及所述各参考缩略词包含的各字确定;从所述各节点中确定目标节点,并根据所述各节点的连接顺序,确定所述目标节点的父节点和所述目标节点的子节点;根据所述目标节点、所述目标节点的父节点和所述目标节点的子节点,构建目标树。

可选地,所述第一获取模块600具体用于,依次将所述指定文本包含的各字,与所述目标树的各节点进行匹配,确定所述指定文本在所述目标树中命中的目标路径;根据所述目标路径上各节点对应的字,确定所述指定文本包含的各实体缩略词。

可选地,所述第一获取模块600具体用于,依次将所述指定文本包含的各字,与所述目标树的各节点进行匹配,确定所述指定文本在所述目标树中命中的各路径;确定所述指定文本在所述目标树中命中的各路径分别包含的节点数;根据节点数大于预设阈值的路径,确定所述指定文本在所述目标树中命中的目标路径。

可选地,所述参考指标确定模块602具体用于,确定所述各实体缩略词分别对应的第一权重和至少一个第二权重;其中,所述第一权重为实体缩略词在对应的指定文本中的第一频次对应的权重,每一所述第二权重为实体缩略词在对应的通用语料库中的第二频次对应的权重;根据所述第一权重和所述第二权重,对该实体缩略词在所述指定文本中第一频次以及该实体缩略词在通用语料库中第二频次加权求和,得到该实体缩略词的参考指标。

图8为本申请提供的一种实体识别装置示意图,具体包括:

请求获取模块700,用于获取实体识别请求;其中,所述实体识别请求对应于待识别文本;

实体缩略词确定模块702,用于利用实体识别模型得到所述待识别文本对应的实体缩略词;其中,所述实体识别模型基于任一项所述的模型训练方法得到。

可选地,所述装置还包括:

匹配模块704,具体用于响应于实体识别请求,将待识别文本与对应关系进行匹配;其中,所述对应关系用于表示指定文本的实体全称词和相对应的目标缩略词之间的关系;响应于匹配到成功,将匹配到的目标缩略词作为所述待识别文本包含的实体缩略词;

可选地,所述实体缩略词确定模块702具体用于,响应于匹配失败,将所述待识别文本输入训练完成的实体识别模型,得到所述实体识别模型输出的所述待识别文本包含的实体缩略词。

本申请还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1所示的模型训练方法以及图6所示的实体识别方法。

本申请还提供了图7所示的电子设备的示意结构图。如图9所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所示的模型训练方法以及图6所示的实体识别方法。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

技术分类

06120116541806