掌桥专利:专业的专利平台
掌桥专利
首页

命名实体识别模型训练方法、样本标注方法、装置及设备

文献发布时间:2023-06-19 10:11:51


命名实体识别模型训练方法、样本标注方法、装置及设备

技术领域

本申请涉及文字识别技术领域,具体而言,涉及一种命名实体识别模型训练方法、样本标注方法、装置及设备。

背景技术

人们在工作时通常会使用沟通工具进行相互消息交互,例如:聊天工具等。利用这些沟通工具所得到的沟通文字,可以作为自然语言处理领域的语料。在自然语言处理领域,例如信息提取、问答系统、句法分析、机器翻译等领域,可以对上述的沟通文字等非结构化文字进行命名实体识别(Named Entity Recognition,简称NER),以抽取出多种命名实体。其中,利用命名实体识别模型抽取命名实体,是普遍使用的一种手段。命名实体识别模型需要预先训练得到。

目前,采用的识别方法主要是采用需要识别的类型的语料对现有的命名实体识别模型进行训练标注,进而对该类型的语料对应的文字进行识别。然而,当需要对不同类型的文字进行识别时,又需要重新设置训练语料对该模型进行训练,训练过程需要耗费大量的成本,导致了识别的成本较高。

发明内容

本申请的目的在于提供一种命名实体识别模型训练方法、样本标注方法、装置及设备,可以降低文本识别成本。

本申请的实施例是这样实现的:

本申请实施例的一方面,提供一种命名实体识别模型训练方法,该方法包括:

接收终端设备发送的会话文本;

使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备;

若接收到终端设备发送的调整后识别结果,则将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集;

基于更新后的训练集对命名实体识别模型进行训练。

可选地,基于更新后的训练集对命名实体识别模型进行训练,包括:

确定更新后的训练集中各样本的样本权重;

基于各样本的样本权重,对命名实体识别模型进行训练。

可选地,确定更新后的训练集中各样本的样本权重,包括:

根据各样本的时间顺序,确定各样本的样本权重。

可选地,确定更新后的训练集中各样本的样本权重,包括:

根据各样本的样本类别,确定各样本的样本权重。

可选地,基于更新后的训练集对命名实体识别模型进行训练,包括:

根据预设的更新策略判定是否对命名实体识别模型进行重新训练;

若是,则基于更新后的训练集对命名实体识别模型进行训练。

本申请实施例的另一方面,提供一种样本标注方法,该方法包括:

获取会话文本,并将会话文本发送给服务器;

接收服务器发送的会话文本的命名实体识别结果;

使用预设的样式显示命名实体识别结果;

若接收到用户输入的针对命名实体识别结果的调整后识别结果,则将调整后识别结果发送给服务器。

可选地,预设的样式包括:下划线、预设的背景颜色。

本申请实施例的另一方面,提供一种命名实体识别模型训练装置,该装置包括:文本接收模块、文本识别模块、调整识别模块、模型训练模块;

文本接收模块,用于接收终端设备发送的会话文本;

文本识别模块,用于使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备;

调整识别模块,用于若接收到终端设备发送的调整后识别结果,则将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集;

模型训练模块,用于基于更新后的训练集对命名实体识别模型进行训练。

可选地,模型训练模块,具体用于确定更新后的训练集中各样本的样本权重;基于各样本的样本权重,对命名实体识别模型进行训练。

可选地,模型训练模块,具体用于根据各样本的时间顺序,确定各样本的样本权重。

可选地,模型训练模块,具体用于根据各样本的样本类别,确定各样本的样本权重。

可选地,模型训练模块,具体用于根据预设的更新策略判定是否对命名实体识别模型进行重新训练;若是,则基于更新后的训练集对命名实体识别模型进行训练。

本申请实施例的另一方面,提供一种样本标注装置,该装置包括:文本发送模块、结果接收模块、结果显示模块、结果调整模块;

文本发送模块,用于获取会话文本,并将会话文本发送给服务器;

结果接收模块,用于接收服务器发送的会话文本的命名实体识别结果;

结果显示模块,用于使用预设的样式显示命名实体识别结果;

结果调整模块,用于若接收到用户输入的针对命名实体识别结果的调整后识别结果,则将调整后识别结果发送给服务器。

可选地,该装置中,预设的样式包括:下划线、预设的背景颜色。

本申请实施例的另一方面,提供一种服务器,包括:第一存储器、第一处理器,第一存储器中存储有可在第一处理器上运行的计算机程序,第一处理器执行计算机程序时,实现上述命名实体识别模型训练方法的步骤。

本申请实施例的另一方面,提供一种终端设备,包括:第二存储器、第二处理器,第二存储器中存储有可在第二处理器上运行的计算机程序,第二处理器执行计算机程序时,实现样本标注方法的步骤。

本申请实施例的另一方面,提供一种存储介质,存储介质上存储有计算机程序,该计算机程序被处理器执行时,实现上述命名实体识别模型训练方法和样本标注方法的步骤。

本申请实施例的有益效果包括:

本申请实施例提供的命名实体识别模型训练方法、样本标注方法、装置及设备中,可以接收终端设备发送的会话文本;使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备;若接收到终端设备发送的调整后识别结果,则将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集;基于更新后的训练集对命名实体识别模型进行训练。其中,通过将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,可以得到更新后的训练集并可以基于更新后的训练集对命名实体识别模型进行训练,进而不需要采用额外的训练样本对命名实体识别模型进行训练,实现了模型的自迭代训练,另外,还可以基于调整各样本的样本权重,对命名实体识别模型进行训练,进而可以适应不同的应用场景,不需要重新加入新的训练语料作为训练样本,相应地,可以降低文本识别的成本,节约人力和费用资源。另外,通过不断更新训练样本还可以提高模型识别的准确性和及时性。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的命名实体识别模型训练方法以及样本标注方法的应用场景示意图;

图2为本申请实施例提供的命名实体识别模型训练方法的流程示意图一;

图3为本申请实施例提供的命名实体识别模型训练方法的流程示意图二;

图4为本申请实施例提供的命名实体识别模型训练方法的流程示意图三;

图5为本申请实施例提供的样本标注方法的流程示意图;

图6为本申请实施例提供的服务器与终端设备的交互图;

图7为本申请实施例提供的命名实体识别模型训练装置的结构示意图;

图8为本申请实施例提供的样本标注装置的结构示意图;

图9为本申请实施例提供的服务器的结构示意图;

图10为本申请实施例提供的终端设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

为了便于理解本申请实施例所提供的方案,现对本申请实施例中应用的场景进行说明,本申请实施例中,上述命名实体识别模型训练方法应用于服务器,上述样本标注方法应用于终端设备,服务器与终端设备通信连接,其中,服务器可以是云端服务器或者本地服务器,在此不作限制;终端设备可以是计算机、手机、平板电脑或者专用电子设备等,在此也不作限制。

图1为本申请实施例提供的命名实体识别模型训练方法以及样本标注方法的应用场景示意图,请参照图1,该应用场景中包括:服务器100以及终端设备200,服务器100与终端设备200之间通信连接,该通信连接可以是有线通信连接,也可以是无线通信连接,图1中以有线通信连接为例。具体交互的信息可以包括:会话文本、命名实体识别结果、调整后识别结果。

下面来具体解释本申请实施例中提供的命名实体识别模型训练方法的具体实施过程。

图2为本申请实施例提供的命名实体识别模型训练方法的流程示意图一,请参照图2,该方法包括:

S110:接收终端设备发送的会话文本。

可选地,会话文本可以是包括文字信息的文本文件,具体例如可以是通过聊天软件或者办公软件(如:企业微信)等发送的文字消息。该会话文本可以是通过与服务器通信连接的终端设备发送得到的。

可选地,会话文本可以是终端设备直接发送给服务器的,也可以是终端设备响应于服务器发送的请求指令而对应发送的,在此不作限制。

S120:使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备。

可选地,命名实体识别模型(Named Entity Recognition,NER)可以是用于对文本进行信息提取、句法分析、机器翻译等处理的模型,具体可以识别文本中的三大类别:实体类、时间类、数字类以及七小类别:人名、机构名、地名、时间、日期、货币、百分比等进行识别,得到对应的识别结果,识别结果即是将该会话文本中通过上述命名实体识别模型进行识别后得到的其中某一个词语或者一段语句的所属类别。其中,命名实体识别模型可以是卷积神经网络模型,也可以是深度神经网络模型,凡是可以实现上述作用即可,在此不作限制。

例如:文本内容为“张三明天去上海玩”,则通过该命名实体识别模型,可以将“张三”识别为“人名”;“明天”识别为“时间”;“上海”识别为“地名”等。其中,“人名”“时间”“地名”等类别以及该类别对应的文本内容即为命名实体识别模型的识别结果。该命名实体识别结果即包括会话文本中的某一个词语或者一段语句以及该词语或者话对应的类别,也即是说,“‘张三’对应‘人名’”即为其中的一个识别结果,其他的识别结果也可以对应得到。

可选地,通过命名实体识别模型获取得到对应的识别结果之后,可以将该识别结果发送给与该服务器通信连接的终端设备上。

S130:若接收到终端设备发送的调整后识别结果,则将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集。

可选地,命名实体识别模型的训练集可以用于对命名实体识别模型进行模型训练,通过将调整后识别结果以及会话文本作为新的样本可以实现对训练集的更新,也即是给训练集中增加了新的样本。如果命名实体识别模型的识别结果有误,终端设备可以基于命名实体识别模型的识别结果进行相应的调整处理,并可以把调整后识别结果发送给服务器,若服务器接收到了终端设备发送的调整后识别结果可以对训练集进行更新,得到更新后的训练集。

S140:基于更新后的训练集对命名实体识别模型进行训练。

可选地,更新后的训练集中包括新的样本,新的样本是基于调整后识别结果以及会话文本得到的,因此,基于更新后的训练集对命名实体识别模型进行模型训练可以提高该命名实体识别模型对调整后识别结果对应的会话文本识别的准确性。

本申请实施例提供的命名实体识别模型训练方法中,可以接收终端设备发送的会话文本;使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备;若接收到终端设备发送的调整后识别结果,则将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集;基于更新后的训练集对命名实体识别模型进行训练。其中,通过将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,可以得到更新后的训练集并可以基于更新后的训练集对命名实体识别模型进行训练,进而不需要采用额外的训练样本对命名实体识别模型进行训练,实现了模型的自迭代训练,相应地,可以降低文本识别的成本,节约人力和费用资源。

下面来解释本申请实施例中提供的对命名实体识别模型进行训练的具体实施过程。

图3为本申请实施例提供的命名实体识别模型训练方法的流程示意图二,请参照图3,基于更新后的训练集对命名实体识别模型进行训练,包括:

S210:确定更新后的训练集中各样本的样本权重。

可选地,得到更新后的训练集后,可以确定训练集中的每个样本或者每种样本的样本权重,该样本权重可以根据实际需求进行设定。

其中,样本权重可以是表征每个样本重要程度的量,样本权重越大,则该样本在训练集中的重要程度越高,也即是在进行训练识别时的优先级更高。

S220:基于各样本的样本权重,对命名实体识别模型进行训练。

可选地,确定了各个样本的样本权重后,可以根据每个样本或者每种样本的样本权重对命名实体识别模型进行对应的模型训练,具体可以是对于样本权重高的样本进行大量训练,对于样本权重低的样本进行少量训练。

在一种可行的实施方式中,确定更新后的训练集中各样本的样本权重,包括:

根据各样本的时间顺序,确定各样本的样本权重。

可选地,时间顺序可以是每个样本输入到训练集中的先后顺序,可以将先输入到训练集中的每个样本的样本权重设置较大,也可以将后输入到训练集中的每个样本的样本权重设置较大,具体可以根据实际工作需求进行设置,在此不作限制。

示例性的,在某一天的上午和下午,终端设备分别发送了多个调整后识别结果,相应地,根据这些调整后识别结果以及对应的会话文本可以确定对应的新的样本,并将这些样本按照时间顺序依次输入到训练集中,在对训练集中的样本进行权重设置时,可以将上午输入的样本的权重设置较大,将下午输入的样本的权重设置较小。

在另一可行的实施方式中,确定更新后的训练集中各样本的样本权重,包括:

根据各样本的样本类别,确定各样本的样本权重。

可选地,样本类别可以是前述中命名实体识别模型识别结果中的三大类或者七小类,也可以是用户根据自身需求重新设置的一些类别,例如:根据样本的大小划分为不同的类别等。

示例性的,当需要使用该命名实体识别模型对“人名”进行识别时,可以将包括“人名”的样本划分为一类,不包括“人名”的样本划分为另一类,将包括“人名”的每个样本的样本权重设置较大,将不包括“人名”的每个样本的样本权重设置较小。相应地,若需要对其他类型的会话文本进行识别时,可以对应修改分类的方式并相应改变样本权重,具体分类方式可以根据使用命名实体识别模型进行具体识别工作而设置,在此不作限制。

本申请的实施例中,可以基于调整各样本的样本权重,对命名实体识别模型进行训练,进而可以适应不同的应用场景,不需要重新加入新的训练语料作为训练样本,只需要通过调整划分的类别,并赋予不同的类别的样本以不同的样本权重,进行模型训练即可,节约了训练样本的成本。另外,通过不断更新训练样本还可以提高模型识别的准确性和及时性。

下面来解释本申请实施例中提供的对命名实体识别模型进行训练的又一具体实施过程。

图4为本申请实施例提供的命名实体识别模型训练方法的流程示意图三,请参照图4,基于更新后的训练集对命名实体识别模型进行训练,包括:

S310:根据预设的更新策略判定是否对命名实体识别模型进行重新训练。

可选地,预设的更新策略可以是:已积累的更新样本数量、已积累的更新样本数量占总样本量的比例等,可以根据实际需求进行更新策略的设定,在此也不作限制。

可选地,可以根据预设的更新策略是否达到条件,例如:已积累的更新样本数量达到预设阈值、已积累的更新样本数量占总样本量的比例达到预设阈值等,若达到条件,则可以确定对命名实体识别模型进行重新训练,进而实现对命名实体识别模型的更新。

若是,则S320:基于更新后的训练集对命名实体识别模型进行训练。

可选地,若判定对命名实体识别模型进行重新训练,则可以根据前述得到的更新后的训练集对命名实体识别模型进行模型训练,需要说明的是,对命名实体识别模型进行模型训练的过程即为神经网络的训练过程,在此不加赘述。

可选地,若未达到条件,则可以不对命名实体识别模型更新,保持现有的命名实体识别模型不变。

下面来解释本申请实施例中提供的样本标注方法的具体实施过程。

图5为本申请实施例提供的样本标注方法的流程示意图,请参照图5,该方法包括:

S410:获取会话文本,并将会话文本发送给服务器。

可选地,会话文本可以是从终端设备内的应用程序中获取得到的,可以将该会话文本发送至与该终端设备通信连接的服务器中进行命名实体识别,具体识别过程在前述S120中已经进行了解释,在此不加赘述。

可选地,会话文本可以是通过应用软件中历史消息的记录内容中提取的,也可以是实时获取用户通过终端设备中的应用软件进行聊天或者消息交互时输入的。

S420:接收服务器发送的会话文本的命名实体识别结果。

可选地,当服务器对会话文本进行命名实体识别之后,可以将识别加过发送给终端设备,终端设备可以接收该会话文本的命名实体识别结果。其中,该命名实体识别结果即包括会话文本中的某一个词语或者一段语句以及该词语或者话对应的类别。

S430:使用预设的样式显示命名实体识别结果。

可选地,对于不同的类别可以设置有不同的预设样式,可以通过采用不同的预设样式对该类别对应的会话文本中的一个词语或者一段语句进行突出显示,以达到显示命名实体识别结果的效果。

例如:会话文本为“明天是十月一日”,命名实体识别结果为“‘十月一日’对应‘时间’”,则可以将时间这一类别预设一种样式,然后将会话文本中的“十月一日”显示为该预设的样式。

S440:若接收到用户输入的针对命名实体识别结果的调整后识别结果,则将调整后识别结果发送给服务器。

可选地,显示命名实体识别结果后,用户可以根据显示的内容进行判定,确定该识别结果是否满足用户的需求,若满足,则该识别结果即为正常的识别结果,可以输出该识别结果。

若不满足用户的需求,则用户可以输入针对命名实体识别结果的调整后识别结果,也即是可以对命名实体识别结果进行修改,修改为满足用户需求的识别结果作为调整后识别结果。

例如:会话文本为“我要爬上海边的山”,命名实体识别结果为“‘上海’对应‘地点’”,用户根据实际语义判断出该会话文本中的“上海”并非地点,可以通过输入针对命名实体识别结果的调整后识别结果的方式对命名实体识别结果进行修改,调整后识别结果可以为“‘海边的山’对应‘地点’”,然后将该调整后识别结果发送给服务器,服务器可以基于调整后识别结果建立新的样本重新对命名实体识别模型进行模型训练。

可选地,预设的样式包括:下划线、预设的背景颜色。

其中,下划线可以是在会话文本中命名实体识别结果的类别对应的词语或者语句的下方划一条直线或者曲线进行标记;预设的背景颜色可以是在会话文本中命名实体识别结果的类别对应的词语或者语句的背景上设置不同的颜色。可选地,可以通过不同的下划线形状或者预设背景颜色的种类来表征不同的类别。

可选地,除了上述预设的样式之外,还可以通过对文字进行加粗、框定、放大、调整字体等多种方式来进行显示,凡是能突出这些词语或者语句与会话文本中其他词语或者语句的区别即可,在此不作限制。

示例地,可以将“人名”设置为下划直线、“地点”设置为背景色为蓝色,“时间”设置为背景色为红色。则对于前述会话文本“张三明天去上海玩”,以及该文本对应的识别结果,可以将“张三”两个字的下方划上直线;将“明天”两个字的背景色设置为红色;将“上海”两个字的背景色设置为蓝色,进而实现对不同类别的突出显示。

图6为本申请实施例提供的服务器与终端设备的交互图,请参照图6,图6即为对于服务器与终端设备整体而言的执行方法,具体执行方法如下:

S510:终端设备获取会话文本,并将会话文本发送给服务器。

S520:服务器使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备。

S530:终端设备使用预设的样式显示命名实体识别结果。

S540:若终端设备接收到用户输入的针对命名实体识别结果的调整后识别结果,则将调整后识别结果发送给服务器。

S550:服务器将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集。

S560:服务器基于更新后的训练集对命名实体识别模型进行训练。

其中,上述S510-S560的方法执行的具体实施过程在前述S110-S140以及S410-S440中已经进行了解释,在此不加赘述。

下述对用以执行的本申请所提供命名实体识别模型训练方法以及样本标注方法对应的装置、设备及存储介质等进行说明,其具体的实现过程以及技术效果参见上述,下述不再赘述。

图7为本申请实施例提供的命名实体识别模型训练装置的结构示意图,请参照图7,该装置包括:文本接收模块110、文本识别模块120、调整识别模块130、模型训练模块140;

文本接收模块110,用于接收终端设备发送的会话文本;

文本识别模块120,用于使用命名实体识别模型对会话文本进行命名实体识别处理,得到会话文本的命名实体识别结果,并将命名实体识别结果发送给终端设备;

调整识别模块130,用于若接收到终端设备发送的调整后识别结果,则将调整后识别结果以及会话文本作为新的样本更新至命名实体识别模型的训练集,得到更新后的训练集;

模型训练模块140,用于基于更新后的训练集对命名实体识别模型进行训练。

可选地,模型训练模块140,具体用于确定更新后的训练集中各样本的样本权重;基于各样本的样本权重,对命名实体识别模型进行训练。

可选地,模型训练模块140,具体用于根据各样本的时间顺序,确定各样本的样本权重。

可选地,模型训练模块140,具体用于根据各样本的样本类别,确定各样本的样本权重。

可选地,模型训练模块140,具体用于根据预设的更新策略判定是否对命名实体识别模型进行重新训练;若是,则基于更新后的训练集对命名实体识别模型进行训练。

图8为本申请实施例提供的样本标注装置的结构示意图,请参照图8,该装置包括:文本发送模块210、结果接收模块220、结果显示模块230、结果调整模块240;

文本发送模块210,用于获取会话文本,并将会话文本发送给服务器;

结果接收模块220,用于接收服务器发送的会话文本的命名实体识别结果;

结果显示模块230,用于使用预设的样式显示命名实体识别结果;

结果调整模块240,用于若接收到用户输入的针对命名实体识别结果的调整后识别结果,则将调整后识别结果发送给服务器。

可选地,该装置中,预设的样式包括:下划线、预设的背景颜色。

上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。

图9为本申请实施例提供的服务器的结构示意图,请参照图9,服务器,包括:第一存储器310、第一处理器320,第一存储器310中存储有可在第一处理器320上运行的计算机程序,第一处理器320执行计算机程序时,实现上述命名实体识别模型训练方法的步骤。

图10为本申请实施例提供的终端设备的结构示意图,请参照图10,终端设备,包括:第二存储器410、第二处理器420,第二存储器410中存储有可在第二处理器420上运行的计算机程序,第二处理器420执行计算机程序时,实现样本标注方法的步骤。

本申请实施例的另一方面,还提供一种存储介质,存储介质上存储有计算机程序,该计算机程序被处理器执行时,实现上述命名实体识别模型训练方法和样本标注方法的步骤。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 命名实体识别模型训练方法、样本标注方法、装置及设备
  • 样本分级标注及模型训练方法、装置及电子设备
技术分类

06120112456432