掌桥专利:专业的专利平台
掌桥专利
首页

用于事件检测的网络训练方法及装置

文献发布时间:2023-06-19 09:30:39


用于事件检测的网络训练方法及装置

技术领域

本说明书一个或多个实施例涉及机器学习技术领域,尤其涉及用于事件检测的网络训练方法及装置。

背景技术

在各种新闻、消息爆量增长的环境下,从中检测出人们关心的各种事件,以便提供给需要者,使其及时充分地做出应对,是当前的一个重要研究方向。处理平台可以预先定义各种事件类型对应的事件触发词等,并为各种事件类型设置标签,通过对待检测文本中包含的词所归属的标签进行预测,进而从待检测文本中检测各种事件类型。例如,对于定义的“高层离职”事件类型,其对应的事件触发词可以包括高层离职、高层退休、管理层离职等等。从文本中检测其包含的事件类型,与对文本以及文本中词的语义理解密切相关。

因此,希望能有改进的方案,在对待检测文本进行事件检测时,可以更加准确地检测出其包含的事件类型。

发明内容

本说明书一个或多个实施例描述了用于事件检测的网络训练方法及装置,以提高事件检测的准确性。具体的技术方案如下。

第一方面,实施例提供了一种用于进行事件检测的动态感知网络训练方法,所述动态感知网络包含顺序排列的多个备选的计算层;所述方法通过处理平台执行,包括:

获取包含多个词的样本文本、多个词分别对应的初始特征向量和标注标签,所述标注标签包括与事件类型相关的第一类标签和与事件类型无关的第二类标签;

针对所述样本文本中的任意一个词,从所述动态感知网络中逐渐增加地选择前若干个计算层,并通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于第一分类器和该词的中间特征向量确定第一预测标签,当所述第一预测标签与对应的标注标签的第一差异小于第一预设阈值时,将所述前若干个计算层作为与该词对应的计算层,将该词的所述中间特征向量作为所述动态感知网络输出的该词的第一特征向量;预测标签是该词在所述第一类标签或所述第二类标签中归属的标签;

基于所述第一差异确定第一预测损失,向减小所述第一预测损失的方向,调整与该词对应的计算层中的模型参数。

在一种实施方式中,通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,包括:

通过所述前若干个计算层,基于该词的初始特征向量和所述样本文本中该词之前的词信息,确定该词的中间特征向量。

在一种实施方式中,确定该词的中间特征向量,包括:

将该词的初始特征向量和该词之前的词信息输入所述前若干个计算层中的第一个计算层,并至少将每个计算层的计算结果输入下一个计算层,将所述前若干个计算层中的最后一个计算层的计算结果,作为该词的中间特征向量。

在一种实施方式中,该方法还包括,将该词的初始特征向量输入所述下一个计算层。

在一种实施方式中,所述该词之前的词信息,基于该词之前的词的第一特征向量确定。

在一种实施方式中,基于第一分类器和该词的中间特征向量确定第一预测标签,包括:

基于该词的中间特征向量确定该词的特征概率,所述特征概率表示该中间特征向量作为第一特征向量的概率;

将该词的中间特征向量输入第一分类器,得到该词的初始预测标签;

基于该词的特征概率与该词的初始预测标签,确定该词的第一预测标签。

在一种实施方式中,当第一差异不小于所述第一预设阈值时,还包括:

继续向所述前若干个计算层中增加第一数量个计算层;

至少将该词的所述中间特征向量输入所述第一数量个计算层,得到更新后的该词的中间特征向量,继续执行基于第一分类器和该词的中间特征向量确定第一预测标签的步骤。

在一种实施方式中,所述第一数量为预先设定的数量;或者,所述第一数量基于所述第一差异和所述第一预设阈值的相对值确定。

第二方面,实施例提供了一种用于进行事件检测的目标反馈网络训练方法,所述方法通过处理平台执行,包括:

获取包含多个词的样本文本、多个词分别对应的第一特征向量和标注标签,所述第一特征向量采用第一方面训练的动态感知网络确定;

基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量;

按照所述样本文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络,采用以下递归方式依次确定多个词分别对应的隐向量:针对所述多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向量输入所述目标反馈网络,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第二预测标签;其中,所述前一个词的特征信息包括所述前一个词的第二预测标签和所述前一个词的隐向量;

基于各个词的第二预测标签与对应的标注标签之间的第二差异,确定第二预测损失,向减小所述第二预测损失的方向,调整所述目标反馈网络。

在一种实施方式中,针对所述多个词中的第一个词,所述第一个词的前一个词的特征信息包括预设标签和预设隐向量。

在一种实施方式中,所述确定多个词分别对应的隐向量的步骤,包括:

按照所述样本文本中多个词从前向后的排列顺序,基于多个词的第二特征向量,通过所述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第一隐向量;

按照所述样本文本中多个词从后向前的排列顺序,基于多个词的第二特征向量,通过所述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第二隐向量;

针对多个词中的任意一个词,将该词的第一隐向量和第二隐向量进行拼接,得到该词的隐向量。

在一种实施方式中,确定多个词分别对应的第二特征向量,包括:

采用自注意力机制,基于多个词分别对应的第一特征向量,确定多个词分别对应的更新后的第一特征向量;

获取所述样本文本的相邻文本的特征向量;所述相邻文本是所述样本文本所在的语料中与所述样本文本相邻的句子;

将多个词分别对应的更新后的第一特征向量,与所述相邻文本的特征向量进行特征融合,得到多个词分别对应的融合特征向量;

获取所述样本文本的多个词分别对应的初始特征向量;

将多个词中任意一个词的初始特征向量和融合特征向量进行拼接,得到该词的第二特征向量。

在一种实施方式中,所述目标反馈网络基于长短期记忆网络LSTM得到。

第三方面,实施例提供了一种结合动态感知网络和目标反馈网络的事件检测方法,通过计算机执行,所述方法包括:

获取包含多个词的待检测文本以及多个词分别对应的初始特征向量;

针对所述待检测文本中的任意一个词,从动态感知网络中逐渐增加地选择前若干个计算层,并通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于该词的中间特征向量确定该词的特征概率,当所述特征概率满足预设概率条件时,将该词的所述中间特征向量作为所述动态感知网络输出的该词的第一特征向量;所述动态感知网络采用第一方面的方法训练得到;所述特征概率表示中间特征向量作为第一特征向量的概率;

基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量;

按照所述待检测文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络,采用以下递归方式依次确定多个词分别对应的隐向量:针对所述多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向量输入所述目标反馈网络,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第三预测标签;所述目标反馈网络采用第二方面的方法训练得到;

基于所述待检测文本中多个词的第三预测标签,确定所述待检测文本包含的事件类型。

第四方面,实施例提供了一种用于进行事件检测的动态感知网络训练装置,所述动态感知网络包含顺序排列的多个备选的计算层;所述装置部署在处理平台中,包括:

第一获取模块,配置为,获取包含多个词的样本文本、多个词分别对应的初始特征向量和标注标签,所述标注标签包括与事件类型相关的第一类标签和与事件类型无关的第二类标签;

第一预测模块,配置为,针对所述样本文本中的任意一个词,从所述动态感知网络中逐渐增加地选择前若干个计算层,并通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于第一分类器和该词的中间特征向量确定第一预测标签,当所述第一预测标签与对应的标注标签的第一差异小于第一预设阈值时,将所述前若干个计算层作为与该词对应的计算层,将该词的所述中间特征向量作为所述动态感知网络输出的该词的第一特征向量;预测标签是该词在所述第一类标签或所述第二类标签中归属的预测标签;

第一调整模块,配置为,基于所述第一差异确定第一预测损失,向减小所述第一预测损失的方向,调整与该词对应的计算层中的模型参数。

在一种实施方式中,所述第一预测模块,通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量时,包括:

通过所述前若干个计算层,基于该词的初始特征向量和所述样本文本中该词之前的词信息,确定该词的中间特征向量。

在一种实施方式中,第一预测模块,确定该词的中间特征向量时,包括:

将该词的初始特征向量和该词之前的词信息输入所述前若干个计算层中的第一个计算层,并至少将每个计算层的计算结果输入下一个计算层,将前若干个计算层中的最后一个计算层的计算结果,作为该词的中间特征向量。

在一种实施方式中,所述第一预测模块,基于第一分类器和该词的中间特征向量确定第一预测标签时,包括:

基于该词的中间特征向量确定该词的特征概率,所述特征概率表示该中间特征向量作为第一特征向量的概率;

将该词的中间特征向量输入第一分类器,得到该词的初始预测标签;

基于该词的特征概率与该词的初始预测标签,确定该词的第一预测标签。

在一种实施方式中,所述第一预测模块还配置为:

当所述第一差异不小于所述第一预设阈值时,继续向所述前若干个计算层中增加第一数量个计算层;

至少将该词的所述中间特征向量输入所述第一数量个计算层,得到更新后的该词的中间特征向量,继续执行基于第一分类器和该词的中间特征向量确定第一预测标签。

第五方面,实施例提供了一种用于进行事件检测的目标反馈网络训练装置,所述装置部署在处理平台中,包括:

第二获取模块,配置为,获取包含多个词的样本文本、多个词分别对应的第一特征向量和标注标签,所述第一特征向量采用第一方面训练的动态感知网络确定;

第一确定模块,配置为,基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量;

第二预测模块,配置为,按照所述样本文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络,采用以下递归方式依次确定多个词分别对应的隐向量:针对所述多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向量输入所述目标反馈网络,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第二预测标签;其中,所述前一个词的特征信息包括所述前一个词的第二预测标签和所述前一个词的隐向量;

第二调整模块,配置为,基于各个词的第二预测标签与对应的标注标签之间的第二差异,确定第二预测损失,向减小所述第二预测损失的方向,调整所述目标反馈网络。

在一种实施方式中,针对所述多个词中的第一个词,所述第一个词的前一个词的特征信息包括预设标签和预设隐向量。

在一种实施方式中,第二预测模块确定多个词分别对应的隐向量时,包括:

按照所述样本文本中多个词从前向后的排列顺序,基于多个词的第二特征向量,通过所述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第一隐向量;

按照所述样本文本中多个词从后向前的排列顺序,基于多个词的第二特征向量,通过所述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第二隐向量;

针对多个词中的任意一个词,将该词的第一隐向量和第二隐向量进行拼接,得到该词的隐向量。

在一种实施方式中,所述目标反馈网络基于长短期记忆网络LSTM得到。

第六方面,实施例提供了一种结合动态感知网络和目标反馈网络的事件检测装置,所述装置部署在计算机中,包括:

第三获取模块,配置为,获取包含多个词的待检测文本以及多个词分别对应的初始特征向量;

特征提取模块,配置为,针对所述待检测文本中的任意一个词,从动态感知网络中逐渐增加地选择前若干个计算层,并通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于该词的中间特征向量确定该词的特征概率,当所述特征概率满足预设概率条件时,将该词的所述中间特征向量作为所述动态感知网络输出的该词的第一特征向量;所述动态感知网络采用第一方面的方法训练得到;所述特征概率表示中间特征向量作为第一特征向量的概率;

第一确定模块,配置为,基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量;

第三预测模块,配置为,按照所述待检测文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络,采用以下递归方式依次确定多个词分别对应的隐向量:针对所述多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向量输入所述目标反馈网络,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第三预测标签;所述目标反馈网络采用第二方面的方法训练得到;

第二确定模块,配置为,基于所述待检测文本中多个词的第三预测标签,确定所述待检测文本包含的事件类型。

第七方面,实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面至第六方面中任一项所述的方法。

第八方面,实施例提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面至第六方面中任一项所述的方法。

在本说明书实施例提供的方法及装置中,用于进行事件检测的动态感知网络包含多个备选的计算层。在对动态感知网络进行训练的过程中,针对样本文本的各个词提取其第一特征向量时,所采用的计算层数量可能不同,选择的计算层的数量与词的第一预测标签和标注标签的差异相关联,第一特征向量能够使得该词的第一预测标签与标注标签的差异小于阈值。这样,也就实现了对不同识别难度的词,采用不同数量的计算层对其进行特征提取。动态感知网络对较难识别的词进行的特征提取过程更久,所提取的特征也更准确,如此即能够提高对待检测文本中事件检测的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本说明书披露的一个实施例的实施场景示意图;

图2为实施例提供的一种用于进行事件检测的动态感知网络训练方法的流程示意图;

图3为采用动态感知网络N1确定样本文本中各个词的第一特征向量T1时所使用的计算层的示意图;

图4为动态感知网络N1的一种处理流程示意图;

图5为实施例提供的一种用于进行事件检测的目标反馈网络训练方法的流程示意图;

图6为目标反馈网络N2的一种处理流程示意图;

图7为实施例提供的一种结合动态感知网络和目标反馈网络的事件检测方法的流程示意图;

图8为实施例提供的一种用于进行事件检测的动态感知网络训练装置的示意性框图;

图9为实施例提供的一种用于进行事件检测的目标反馈网络训练装置的示意性框图;

图10为实施例提供的一种结合动态感知网络和目标反馈网络的事件检测装置的示意性框图。

具体实施方式

下面结合附图,对本说明书提供的方案进行描述。

图1为本说明书披露的一个实施例的实施场景示意图。其中包括动态感知网络N1和目标反馈网络N2。待检测文本A包含多个词,将每个词的初始特征向量T0分别输入动态感知网络N1中,从动态感知网络N1中得到每个词的第一特征向量T1。按照预设的特征处理机制,可以确定每个词分别对应的第二特征向量T2。然后,将多个词的第二特征向量T2分别输入目标反馈网络N2,得到每个词的隐向量T3,将每个词的隐向量T3输入分类器(图中未示出),可以得到每个词的预测标签Y。该预测标签Y用于标识某个词在第一类标签或第二类标签中归属的标签,第一类标签是与预先定义的事件类型相关的标签,第二类标签是与预先定义的事件类型无关的标签。例如,在图1中,第一类标签可以包括标签X和标签C,第二类标签可以包括标签O。根据待检测文本A中多个词的预测标签Y,可以确定该待检测文本A包括的事件类型,例如根据其包含的标签X和标签C等可以确定待检测文本A包含高层离职事件。在图1中,第一特征向量T1、第二特征向量T2和隐向量T3均采用圆圈表示。从纵向上看,图1中待检测文本A“…的总经理最近要离职…”中每个汉字均对应地存在初始特征向量T0、第一特征向量T1、第二特征向量T2、隐向量T3和预测标签Y。

其中,待检测文本可以包括一个或多个句子,例如可以是一段话、一篇文章或者一句话。待检测文本中的词,可以包括汉语中的单个汉字,也可以包括英语或其他语言中的单词,还可以包括将待检测文本进行分词之后得到的分词。

为了更准确地确定待检测文本包括的事件类型,一个关键点是更准确地确定待检测文本A中每个词的预测标签Y,即更准确地识别出事件类型包含的触发词。对于实际中产生的各类文本,其中有时触发词识别结果模棱两可,有时不同事件的触发词又在文本中成对出现。基于这些文本特点,本申请提供了一种事件检测方法,能够更准确地提取待检测文本中各个词的特征向量,其中使用了动态感知网络和目标反馈网络来提取词的特征向量。当词的特征向量能更准确地对词进行表达时,基于词的预测标签而进行的事件检测结果也会更准确。其中,动态感知网络用于提取词的第一特征向量,且针对不同的词采用不同数量的计算层进行特征提取,使得对模棱两可的词学习得更久。目标反馈网络用于进一步提取词的特征,得到词的隐向量,该目标反馈网络能够考虑词与词之间的标签关联性,使得成对出现的事件的触发词识别能够相互促进。下面,针对动态感知网络和目标反馈网络的训练过程分别进行说明。

图2为实施例提供的一种用于进行事件检测的动态感知网络训练方法的流程示意图。下面结合图1所示的场景示意图,对图2所示实施例进行说明。动态感知网络N1包含顺序排列的多个备选的计算层。每个计算层可以包括一个或多个神经元,神经元中包含对应的函数以及待训练参数。计算层存在输入和输出,相邻的计算层之间可以按照顺序传递数据。动态感知网络N1的计算层总数可以预先设定。该方法通过处理平台执行,该处理平台可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。该方法包括以下步骤S210~S230。

步骤S210,获取包含多个词的样本文本、多个词分别对应的初始特征向量T0和标注标签。标注标签包括与事件类型相关的第一类标签和与事件类型无关的第二类标签。

其中,样本文本可以是训练集中的任意一个。训练集可以包括多个样本文本。样本文本可以包括一个或多个句子,例如样本文本可以是一段话、一篇文章或者一句话。本说明书实施例中所提及的样本文本或待检测文本中的词,可以理解为进行特征提取时的最小单元,该最小单元可以是汉语中的单个汉字,也可以是英语或其他语言中的单词,还可以是将样本文本进行分词之后得到的分词,或者是其他表达形式。样本文本中多个词分别对应的初始特征向量T0和标注标签,可以从训练集中获取。其中,每个词都可以有其对应的初始特征向量和标注标签。

词的初始特征向量可以是利用词袋模型得到的特征表示,也可以是采用词集模型得到的特征表示,或者采用其他方式确定的样本文本中词的初始的特征向量。

步骤S220,针对样本文本中的任意一个词W,从动态感知网络N1中逐渐增加地选择前若干个计算层,并通过该前若干个计算层和该词W的初始特征向量确定该词W的中间特征向量,基于第一分类器和该词W的中间特征向量确定第一预测标签,当第一预测标签与对应的标注标签的第一差异小于第一预设阈值时,将前若干个计算层作为与该词W对应的计算层,将该词W的中间特征向量作为动态感知网络N1输出的该词W的第一特征向量T1。

其中,预测标签是该词W在第一类标签或第二类标签中归属的标签。上述第一分类器用于根据输入的词W的中间特征向量确定该词W对应的第一预测标签。第一分类器可以是采用线性回归、逻辑回归或者softmax等函数实现的分类器。

在本步骤中,可以针对样本文本中的每个词,都按照与上述词W相同的方式,来确定每个词的第一特征向量T1。多个词可以按照一定的顺序,依次地输入动态感知网络N1,动态感知网络N1按照本步骤提供的方式,分别确定多个词中每个词的第一特征向量T1。

当上述第一差异不小于第一预设阈值时,还可以继续向前若干个计算层中增加第一数量个计算层,至少将该词的中间特征向量输入第一数量个计算层,得到更新后的该词的中间特征向量,继续执行基于第一分类器和该词的中间特征向量确定第一预测标签的步骤。作为与该词W对应的计算层的前若干个计算层,是连续的前若干个计算层,且包含了每次增加的计算层。

下面以词W为例,来详细说明动态感知网络N1确定词W的第一特征向量T1的实施方式。针对词W,可以将词W的初始特征向量T0输入动态感知网络N1的第一个计算层,并采用前k1个计算层提取词W的特征,得到词W的中间特征向量。k1可以是预设数量,例如可以是1、2、3或其他数量。将该中间特征向量输入第一分类器,得到该词的第一预测标签,并计算第一预测标签与该词W的标注标签之间的第一差异,判断该第一差异是否小于第一预设阈值。

如果第一差异不小于第一预设阈值,认为该中间特征向量还不能够准确地表征词W的特征,可以继续向前K1个计算层中增加第一数量k2个计算层,将该词W的中间特征向量输入该第一数量k2个计算层,得到更新后的该词的中间特征向量,然后再返回继续执行将该词的中间特征向量输入第一分类器,得到该词的第一预测标签,重复执行计算第一预测标签与该词W的标注标签之间的第一差异,判断该第一差异是否小于第一预设阈值的步骤。

如果第一差异小于第一预设阈值,认为该中间特征向量已经足够准确,可以作为该词W的第一特征向量T1,并将此时的前若干个计算层作为与该词W对应的计算层,将该词W的中间特征向量作为动态感知网络N1输出的该词W的第一特征向量T1。

其中,上述第一数量k2可以为预先设定的数量,也可以基于第一差异和第一预设阈值的相对值确定。例如,当第一数量k2基于第一差异和第一预设阈值的相对值确定时,可以按照预先设定的不同相对值与数量之间的对应关系,确定该第一差异和第一预设阈值的相对值所对应的数量,并作为第一数量k2。具体的,当上述相对值较小时,可以设定对应较小的数量,当上述相对值较大时,可以设定其对应较大的数量。

在逐渐增加计算层的过程中,如果确定第一差异小于第一预设阈值,则停止增加计算层,可以将所有选择的计算层作为该词W对应的计算层。如果所有选择的计算层已经达到动态感知网络N1的最大计算层数量(即计算层总数),则即便此时第一差异不小于第一预设阈值,也停止增加计算层,将计算层总数对应的所有计算层作为该词W对应的计算层。

图3为采用动态感知网络N1确定样本文本中各个词的第一特征向量T1时所使用的计算层的示意图。其中,采用多个横线表示每个词对应的计算层。在图3右侧,以初始特征向量x9为例,示出了采用动态的计算层确定其第一特征向量T1的过程。其中,将初始特征向量x9输入第一个计算层,并采用k1个计算层确定该词“职”的中间特征向量t1,并将中间特征向量t1输入第一分类器以确定“职”的第一预测标签,计算第一预测标签与标注标签的第一差异,判断第一差异是否小于第一预设阈值,当不满足时,继续在k1个计算层的基础上增加k2个计算层,将中间特征向量t1输入k2个计算层,得到“职”的中间特征向量t2,并继续判断第一差异是否小于第一预设阈值。假设此时第一差异小于第一预设阈值,则将该中间特征向量t2作为动态感知网络N1输出的“职”的第一特征向量T1,将k1和k2个计算层共同作为该词“职”对应的计算层,也就是图3中“职”字上方所示的计算层。

各个计算层中的神经元对数据的计算方式,可以采用线性函数的计算方式,也可以采用卷积的计算方式,本说明书实施例对此不作具体限定。

步骤S230,基于第一差异确定第一预测损失,向减小第一预测损失的方向,调整与该词W对应的计算层中的模型参数。

基于第一差异确定第一预测损失时,可以将第一差异代入设定的损失函数中,计算得到第一预测损失。在调整计算层中的模型参数时,可以采用反向传播算法进行。

针对样本文本中不同的词,分别调整该词对应的计算层的模型参数。例如,针对图3中的“的”,调整动态感知网络N1中的前2个计算层的模型参数,针对“总”调整其前4个计算层的模型参数,针对“经”调整其前6个计算层的模型参数。

上述步骤S210~S230是针对一个样本文本进行的模型训练。针对训练集中的多个样本文本,可以分别对动态感知网络N1进行多次模型训练,直至满足预设的收敛条件。预设的收敛条件可以包括使用了足够数量的样本文本对动态感知网络N1进行了训练,或者足够数量的第一预测损失小于预设损失阈值等。上述步骤S220中对第一差异与第一预设阈值之间大小关系的判断,可以对中间特征向量是否足够准确进行判断,进而实现对较难识别的词采用更多个计算层提取特征,对于比较容易识别的词采用较少的计算层提取特征,这样既提高了对难识别词的识别准确率,也整体上尽可能地保证了处理效率。

由于文本中各个词之间是相互关联的,为了进一步提高动态感知网络对词特征的识别效率,在一种实施例中,步骤S220中通过前若干个计算层和该词W的初始特征向量确定该词W的中间特征向量时,具体可以通过前若干个计算层,基于该词W的初始特征向量和样本文本中该词W之前的词信息,确定该词W的中间特征向量。

在本实施例中,可以按照各个词在样本文本中的排列顺序,依次将各个词和该词之前的词信息输入动态感知网络N1,由动态感知网络N1分别确定每个词的第一特征向量T1。这样所得到的词W的第一特征向量T1,包含了样本文本中该词W之前各个词的特征信息,使得第一特征向量T1更加准确。

该词W之前的词信息,可以基于该词W之前的词的第一特征向量T1确定。例如,该词W之前的词信息,可以是该词W的前一个词的第一特征向量T1,也可以是与该词W的前一个词的特征信息相关联的信息。针对样本文本中的第一个词,该第一个词之前的词信息可以是预设数据,或者是随机确定的数据。

在确定该词的中间特征向量时,可以将该词W的初始特征向量T0和该词W之前的词信息输入前若干个计算层中的第一个计算层,并至少将每个计算层的计算结果输入下一个计算层,将前若干个计算层中的最后一个计算层的计算结果,作为该词的中间特征向量。在另一种实施方式中,还可以将该词W的初始特征向量T0输入下一个计算层。

图4为动态感知网络N1的一种处理流程示意图,其中显示了确定词t-1的第一特征向量的过程,以及确定词t的第一特征向量的过程。词t-1为词t的前一个词。以图4中左半部分为例,在确定第一特征向量的过程中,第一个计算层S0的输入项包括词t-1的初始特征向量x_t-1和该词t-1的前一个词的词信息(参见图4中圆圈S0左侧的箭头)。词t-1的初始特征向量可以直接输入各个计算层S0、S1…Sn,也可以将对其进行处理后的结果输入这些计算层。对初始特征向量x_t-1进行处理后的结果,可以基于初始特征向量x_t-1与第一参数矩阵的乘积得到,第一参数矩阵可以是动态感知网络N1中的待训练参数。

当计算层S0的计算结果不能够满足第一差异小于第一预设阈值的条件时,可以将该计算层S0的计算结果以及词t-1的初始特征向量x_t-1输入计算层S1,参见图4中指向圆圈S1的实线箭头和虚线箭头。

在另一实施例中,步骤S220中基于第一分类器和该词的中间特征向量确定第一预测标签的步骤,具体可以包括以下步骤1a~3a。

步骤1a,基于该词W的中间特征向量确定该词W的特征概率,该特征概率表示该中间特征向量作为第一特征向量的概率。在确定该词W的特征概率时,可以基于该词W的中间特征向量与第二参数矩阵的乘积得到。第二参数矩阵可以是动态感知网络N1中的待训练参数矩阵。

步骤2a,将该词W的中间特征向量输入第一分类器,得到该词W的初始预测标签。

步骤3a,基于该词W的特征概率与该词W的初始预测标签,确定该词W的第一预测标签。具体的,可以基于该词W的特征概率与该词W的初始预测标签的乘积,确定该词W的第一预测标签。

下面结合图4对本实施例进行说明。针对选择的若干个计算层,在从计算层Sn中得到词t-1的中间特征向量时,可以将其与第二参数矩阵进行作用,得到特征概率f_t-1。将词t-1的中间特征向量输入第一分类器,得到初始预测标签y_t-1,基于该词t-1的特征概率f_t-1与该词t-1的初始预测标签y_t-1的乘积,得到该词t-1的第一预测标签Y_t-1。

在前面实施例中提到,某个词之前的词信息,可以是该词的前一个词的第一特征向量,也可以是与该前一个词的特征信息相关联的信息。在图4所示例子中,词t-1为词t的前一个词,相对于词t来说,词t-1的词信息S_t-1可以基于计算层Sn的计算结果与特征概率f_t-1的乘积得到,此处计算层Sn的计算结果即是词t-1的第一特征向量。

以上内容说明了对动态感知网络进行训练的过程。下面继续对目标反馈网络的训练过程进行说明。

图5为实施例提供的一种用于进行事件检测的目标反馈网络训练方法的流程示意图。下面结合图1所示的场景示意图,对图5所示实施例进行说明。该方法通过处理平台执行,该处理平台可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。该方法包括以下步骤S510~S540。

步骤S510,获取包含多个词的样本文本、多个词分别对应的第一特征向量T1和标注标签,第一特征向量T1可以采用图2实施例中训练的动态感知网络N1确定。本步骤中获取的样本文本可以是训练集中的任意一个,样本文本中各个词的标注标签,可以从训练集中获取。关于样本文本以及标注标签的说明,可以参见步骤S210中的相关描述,此处不再赘述。

步骤S520,基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量。其中,预设的特征处理机制可以包括自注意力机制和/或特征融合机制等。

下面结合自注意力机制和特征融合机制对第一特征向量的处理过程进行说明。在确定多个词分别对应的第二特征向量T2,具体可以包括以下步骤1b~5b。

步骤1b,采用自注意力机制,基于多个词分别对应的第一特征向量T1,确定多个词分别对应的更新后的第一特征向量。具体的,可以利用自注意力机制和多个词分别对应的第一特征向量T1,确定每个词的权重,并将每个词的权重叠加值该词的第一特征向量T1中,得到更新后的第一特征向量。步骤1b是采用自注意力机制对第一特征向量进行处理的过程。利用自注意力机制的处理,能够针对不同词,给予不同的重视度,使得样本文本中各个词的特征更具合理性。

步骤2b,获取样本文本的相邻文本的特征向量,该相邻文本是样本文本所在的语料中与样本文本相邻的句子。当样本文本是一篇文章中的某一段时,该样本文本所在的预料即为该篇文章。当样本文本是一段文本中的若干句时,该样本文本所在的预料即为该段文本。相邻文本是与样本文本在语义上存在关联性的文本。

该相邻文本的特征向量,可以是基于该相邻文本中各个词的特征向量得到。该相邻文本中各个词的特征向量,可以是词的初始特征向量或者第一特征向量。该相邻文本的特征向量,是用于从整体上表征该相邻文本特征。

步骤3b,将多个词分别对应的更新后的第一特征向量,与该相邻文本的特征向量进行特征融合,得到多个词分别对应的融合特征向量。具体的,可以将多个词分别对应的更新后的第一特征向量构建成一个矩阵,基于该矩阵与该相邻文本的特征向量的乘积,得到融合矩阵,该融合矩阵可以包含多个词分别对应的融合特征向量。

上述步骤2b和3b可以理解为采用特征融合机制对第一特征向量进行处理的过程。该特征融合机制可以使得样本文本融合相邻文本的特征信息,使得样本文本中各个词的特征含义更加丰富。

步骤4b,获取样本文本的多个词分别对应的初始特征向量T0。

步骤5b,将多个词中任意一个词W的初始特征向量T0和该词W的融合特征向量进行拼接,得到该词W的第二特征向量T2。在拼接时,可以按照预设的规则,将初始特征向量T0放置于融合特征向量的前部或者后部。

对第一特征向量的处理,可以单独采用自注意力机制,或者单独采用特征融合机制。以上处理过程仅仅是几种可行的实施例,并不构成对本说明书实施例的限定。对第一特征向量的处理过程还可以采用更多其他的处理方式。

参见图1,经过步骤S520的处理,基于多个词的第一特征向量T1得到了多个词的第二特征向量T2。

步骤S530,按照样本文本中多个词的排列顺序,基于多个词的第二特征向量T2,通过目标反馈网络N2,采用以下递归方式依次确定多个词分别对应的隐向量:针对上述多个词中的任意一个词W,将该词W的前一个词的特征信息和该词W的第二特征向量T2输入目标反馈网络N2,得到该词W的隐向量T3;将该词W的隐向量T3输入第二分类器,得到该词W的第二预测标签。该隐向量是用于表征词W的特征,是该词W的更深层的特征表示。

其中,上述前一个词的特征信息包括该前一个词的第二预测标签和该前一个词的隐向量。针对多个词中的第一个词,该第一个词的前一个词的特征信息包括预设标签和预设隐向量,即可以将预设标签和预设隐向量等,当做该第一个词的前一个词的特征信息中的特征。此处的预设隐向量,还可以替换为随机确定的隐向量,本说明书对此并不做具体限定。

上述第二分类器用于根据输入的词W的隐向量确定该词W对应的第二预测标签,第二预测标签是该词W在第一类标签或第二类标签中归属的标签。第二分类器可以是采用线性回归、逻辑回归或者softmax等函数实现的分类器。

在本步骤中,将前一个词的第二预测标签和前一个词的隐向量,作为该词W的特征的一部分,以输入目标反馈网络N2,得到该词W的隐向量。也就是说,每个词的隐向量结合和样本文本中前面各个词的标签信息和特征信息,能够实现将已经得到的预测结果反馈给后面的各个词,进而能够更好地发现共现事件之间的关联性,提升隐向量的表达能力。

上述目标反馈网络N2可以基于长短期记忆网络(Long Short-Term Memory,LSTM)得到,通过对LSTM的结构进行改进,改变每个词的输入项,即将前一个词的预测标签和隐向量也作为输入项,与该词W的第二特征向量T2通过输入LSTM中。上述目标反馈网络N2也可以基于对循环神经网络(Recurrent Neural Network,RNN)的改进而得到。

图6为目标反馈网络N2的一种处理流程示意图。其中每个圆圈代表目标反馈网络N2针对样本文本中相应词的处理。针对任意一个词W,其输入包括前一个词的隐向量T3、前一个词的第二预测标签(图6中虚线所示)以及该词W的第二特征向量T2。

步骤S540,基于各个词的第二预测标签与对应的标注标签之间的第二差异,确定第二预测损失,向减小第二预测损失的方向,调整目标反馈网络N2。

基于第二差异确定第二预测损失时,可以将第二差异代入设定的损失函数中,计算得到第二预测损失。在调整目标反馈网络N2中的模型参数时,可以采用反向传播算法进行。在对目标反馈网络N2中的模型参数进行调整时,可以每个词调整一次,也可以综合多个词调整一次。

上述步骤S510~S540可以理解为针对一个样本文本进行的模型训练过程。针对训练集中的多个样本文本,可以分别对目标反馈网络N2进行多次模型训练,直至满足预设的收敛条件。该收敛条件可以包括使用了足够数量的样本文本对目标反馈网络N2进行了训练,或者足够数量的第二预测损失小于预设损失阈值等。

在本实施例中,在确定任意一个词W的隐向量时,将前一个词的第二预测标签和前一个词的隐向量,作为该词W特征的一部分,以输入目标反馈网络N2,得到该词W的隐向量。这样,能够将已经得到的预测结果反馈给后面的各个词,提升了隐向量的表达能力,进而能够更好地发现共现事件之间的关联性,使得成对出现的事件相互促进识别,提高事件检测的准确性。

在本说明书的另一实施例中,目标反馈网络N2还可以基于双向LSTM来实现。步骤S530中确定多个词分别对应的隐向量时,可以包括以下步骤1c~3c。

步骤1c,按照样本文本中多个词从前向后的排列顺序,基于多个词的第二特征向量T2,通过上述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第一隐向量。在确定某个词的第一隐向量之后,可以将该第一隐向量输入第二分类器,得到该词的第一子预测标签。

针对任意一个词W,将该词W的前一个词的第一子预测标签和第一隐向量,以及该词W的第二特征向量T2输入目标反馈网络,得到该词W的第一隐向量。

步骤2c,按照样本文本中多个词从后向前的排列顺序,基于多个词的第二特征向量T2,通过上述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第二隐向量。在确定某个词的第二隐向量之后,可以将该第二隐向量输入第二分类器,得到该词的第二子预测标签。

针对任意一个词W,将该词W的前一个词的第二子预测标签和第二隐向量,以及该词W的第二特征向量T2输入目标反馈网络,得到该词W的第二隐向量。

步骤3c,针对多个词中的任意一个词W,将该词W的第一隐向量和该词W第二隐向量进行拼接,得到该词W的隐向量。在得到该词W的隐向量之后,可以将该词W的隐向量输入第二分类器,得到该词的第二预测标签。基于双向LSTM实现上述步骤S530时,还可以存在其他实施方式,此处不再赘述。

本实施例中,利用双向LSTM可以提取样本文本更加深层的特征信息,使所得到的第二预测标签更加准确。

上述内容提供了针对动态感知网络N1和目标反馈网络N2的训练方法。在对这两个网络训练之后,可以分别或者结合地将这两个网络应用在对词的特征提取中,以得到更加深层、更准确的特征向量,进而可以使得基于这种特征向量的其他应用更加准确。其中,将动态感知网络N1和目标反馈网络N2结合起来应用在事件检测中,已经在本说明书开始部分以示例形式介绍过。下面,对该应用实施例进行更详细的介绍。

图7为实施例提供的一种结合动态感知网络和目标反馈网络的事件检测方法的流程示意图。下面结合图1所示实施例,对图7进行说明。该方法可以通过计算机执行,该计算机可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。该方法包括以下步骤S710~S750。

步骤S710,获取包含多个词的待检测文本以及多个词分别对应的初始特征向量T0。待检测文本可以包括一个或多个句子,例如可以是一段话、一篇文章或者一句话。待检测文本可以与上述的样本文本属于同类文本。对待检测文本中词的说明也可以参见步骤S210中对样本文本中词的说明,此处不再赘述。待检测文本中多个词分别对应的初始特征向量T0的获取方式,可以参见步骤S210中的说明。

步骤S720,针对待检测文本中的任意一个词,从动态感知网络N1中逐渐增加地选择前若干个计算层,并通过前若干个计算层和该词的初始特征向量T0确定该词的中间特征向量,基于该词的中间特征向量确定该词的特征概率,当该特征概率满足预设概率条件时,将该词的中间特征向量作为动态感知网络输出的该词的第一特征向量。

其中,动态感知网络可以采用图2的方法训练得到。特征概率表示中间特征向量作为第一特征向量的概率。

本步骤与步骤S220的区别,在于无需利用中间特征向量确定第一预测标签。取而代之的是,采用对特征概率的判断,来为每个词选择合适的计算层。对特征概率的说明可以参见针对图4的相关说明。

在步骤S720中,基于该词的中间特征向量确定该词的特征概率时,可以参见上述步骤1a中的说明,此处不再赘述。

上述预设概率条件可以包括,判断该特征概率大于预设概率阈值,或者,判断概率和值大于预设概率阈值。其中,概率和值为针对该词计算的多个特征概率的和值。例如,针对某个词,计算了三次特征概率,则需要进行三次判断,在每次判断中,都将前面几次特征概率的概率和值进行判断。最后一次判断时,将三次特征概率的概率和值与预设概率阈值进行比较。

步骤S730,基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量。本步骤的执行过程可以参见步骤S520中的具体说明。不同之处仅在于,本步骤中的多个词,是待检测文本中的多个词,而步骤S520中的多个词是样本文本中的多个词。

步骤S740,按照待检测文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络N2,采用以下递归方式依次确定多个词分别对应的隐向量:针对多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向T2量输入目标反馈网络N2,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第三预测标签。该第三预测标签是该词在第一类标签或第二类标签中归属的标签。第三预测标签是待检测文本中各个词的预测标签,第二预测标签是样本文本中各个词的预测标签。

上述目标反馈网络N2可以采用图5的方法训练得到。本步骤S740的具体实施方式可以参见步骤S530,此处不再赘述。

步骤S750,基于待检测文本中多个词的第三预测标签,确定待检测文本包含的事件类型。具体的,可以将多个词的第三预测标签中的第一类标签分别与预设的各个事件类型对应的标签进行比对,根据比对结果确定该待检测文本包含的事件类型。

在本实施例中,采用动态感知网络和目标反馈网络相结合,共同提取待检测文本中每个词的隐向量,动态感知网络能够提高对模棱两可的词的学习效果,目标反馈网络能够考虑词与词之间的标签关联性,使得成对出现的事件触发词的识别更准确。将两个网络结合起来,能够覆盖待检测文本中常常出现的难检测词,提高词特征的提取准确度,进而提高事件检测的准确性。

上述内容对本说明书的特定实施例进行了描述,其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行,并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的,或者可能是有利的。

图8为实施例提供的一种用于进行事件检测的动态感知网络训练装置的示意性框图。所述动态感知网络包含顺序排列的多个备选的计算层。该装置实施例与图2所示方法实施例相对应。该装置800部署在处理平台中,包括:

第一获取模块810,配置为,获取包含多个词的样本文本、多个词分别对应的初始特征向量和标注标签,所述标注标签包括与事件类型相关的第一类标签和与事件类型无关的第二类标签;

第一预测模块820,配置为,针对所述样本文本中的任意一个词,从所述动态感知网络中逐渐增加地选择前若干个计算层,并通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于第一分类器和该词的中间特征向量确定第一预测标签,当所述第一预测标签与对应的标注标签的第一差异小于第一预设阈值时,将所述前若干个计算层作为与该词对应的计算层,将该词的所述中间特征向量作为所述动态感知网络输出的该词的第一特征向量;预测标签是该词在所述第一类标签或所述第二类标签中归属的预测标签;

第一调整模块830,配置为,基于所述第一差异确定第一预测损失,向减小所述第一预测损失的方向,调整与该词对应的计算层中的模型参数。

在一种实施方式中,第一预测模块820,通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量时,包括:

通过所述前若干个计算层,基于该词的初始特征向量和所述样本文本中该词之前的词信息,确定该词的中间特征向量。

在一种实施方式中,第一预测模块820确定该词的中间特征向量时包括:

将该词的初始特征向量和该词之前的词信息输入前若干个计算层中的第一个计算层,并至少将每个计算层的计算结果输入下一个计算层,将所述前若干个计算层中的最后一个计算层的计算结果,作为该词的中间特征向量。

在一种实施方式中,第一预测模块820,至少将每个计算层的计算结果输入下一个计算层时,还将该词的初始特征向量输入下一个计算层。

在一种实施方式中,该词之前的词信息,基于该词之前的词的第一特征向量确定。

在一种实施方式中,第一预测模块820,基于第一分类器和该词的中间特征向量确定第一预测标签时,包括:

基于该词的中间特征向量确定该词的特征概率,所述特征概率表示该中间特征向量作为第一特征向量的概率;

将该词的中间特征向量输入第一分类器,得到该词的初始预测标签;

基于该词的特征概率与该词的初始预测标签,确定该词的第一预测标签。

在一种实施方式中,第一预测模块820,还配置为:

当第一差异不小于所述第一预设阈值时,继续向前若干个计算层中增加第一数量个计算层;

至少将该词的所述中间特征向量输入所述第一数量个计算层,得到更新后的该词的中间特征向量,继续执行基于第一分类器和该词的中间特征向量确定第一预测标签。

在一种实施方式中,所述第一数量为预先设定的数量;或者,所述第一数量基于所述第一差异和所述第一预设阈值的相对值确定。

图9为实施例提供的一种用于进行事件检测的目标反馈网络训练装置的示意性框图。该装置实施例与图5所示方法实施例相对应。该装置900部署在处理平台中,包括:

第二获取模块910,配置为,获取包含多个词的样本文本、多个词分别对应的第一特征向量和标注标签,所述第一特征向量采用权利要求1训练的动态感知网络确定;

第一确定模块920,配置为,基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量;

第二预测模块930,配置为,按照所述样本文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络,采用以下递归方式依次确定多个词分别对应的隐向量:针对所述多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向量输入所述目标反馈网络,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第二预测标签;其中,所述前一个词的特征信息包括所述前一个词的第二预测标签和所述前一个词的隐向量;

第二调整模块940,配置为,基于各个词的第二预测标签与对应的标注标签之间的第二差异,确定第二预测损失,向减小所述第二预测损失的方向,调整所述目标反馈网络。

在一种实施方式中,针对所述多个词中的第一个词,所述第一个词的前一个词的特征信息包括预设标签和预设隐向量。

在一种实施方式中,所述第二预测模块930,确定多个词分别对应的隐向量时,包括:

按照所述样本文本中多个词从前向后的排列顺序,基于多个词的第二特征向量,通过所述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第一隐向量;

按照所述样本文本中多个词从后向前的排列顺序,基于多个词的第二特征向量,通过所述递归方式依次确定多个词分别对应的隐向量,分别作为对应的第二隐向量;

针对多个词中的任意一个词,将该词的第一隐向量和第二隐向量进行拼接,得到该词的隐向量。

在一种实施方式中,第一确定模块920,具体配置为:

采用自注意力机制,基于多个词分别对应的第一特征向量,确定多个词分别对应的更新后的第一特征向量;

获取所述样本文本的相邻文本的特征向量;所述相邻文本是所述样本文本所在的语料中与所述样本文本相邻的句子;

将多个词分别对应的更新后的第一特征向量,与所述相邻文本的特征向量进行特征融合,得到多个词分别对应的融合特征向量;

获取所述样本文本的多个词分别对应的初始特征向量;

将多个词中任意一个词的初始特征向量和融合特征向量进行拼接,得到该词的第二特征向量。

在一种实施方式中,目标反馈网络基于长短期记忆网络LSTM得到。

图10为实施例提供的一种结合动态感知网络和目标反馈网络的事件检测装置的示意性框图。该装置实施例与图7所示方法实施例相对应。该装置100部署在计算机中,包括:

第三获取模块110,配置为,获取包含多个词的待检测文本以及多个词分别对应的初始特征向量;

特征提取模块120,配置为,针对所述待检测文本中的任意一个词,从动态感知网络中逐渐增加地选择前若干个计算层,并通过所述前若干个计算层和该词的初始特征向量确定该词的中间特征向量,基于该词的中间特征向量确定该词的特征概率,当所述特征概率满足预设概率条件时,将该词的所述中间特征向量作为所述动态感知网络输出的该词的第一特征向量;所述动态感知网络采用图2的方法训练得到;所述特征概率表示中间特征向量作为第一特征向量的概率;

第一确定模块130,配置为,基于多个词分别对应的第一特征向量,按照预设的特征处理机制,确定多个词分别对应的第二特征向量;

第三预测模块140,配置为,按照所述待检测文本中多个词的排列顺序,基于多个词的第二特征向量,通过目标反馈网络,采用以下递归方式依次确定多个词分别对应的隐向量:针对所述多个词中的任意一个词,将该词的前一个词的特征信息和该词的第二特征向量输入所述目标反馈网络,得到该词的隐向量;将该词的隐向量输入第二分类器,得到该词的第三预测标签;所述目标反馈网络采用图5的方法训练得到;

第二确定模块150,配置为,基于所述待检测文本中多个词的第三预测标签,确定所述待检测文本包含的事件类型。

上述装置实施例与方法实施例相对应,具体说明可以参见方法实施例部分的描述,此处不再赘述。装置实施例是基于对应的方法实施例得到,与对应的方法实施例具有同样的技术效果,具体说明可参见对应的方法实施例。

本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行图1至图7任一项所述的方法。

本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现图1至图7任一项所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于存储介质和计算设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

相关技术
  • 用于事件检测的网络训练方法及装置
  • 三维卷积神经网络训练方法、视频异常事件检测方法及装置
技术分类

06120112191271