掌桥专利:专业的专利平台
掌桥专利
首页

文本韵律边界预测的方法、装置、设备及存储介质

文献发布时间:2023-06-19 11:29:13


文本韵律边界预测的方法、装置、设备及存储介质

技术领域

本申请涉人工智能技术领域,尤其涉及一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质。

背景技术

随着科学与技术的发展,高自然度的语音合成成了人工智能、人机交互领域的一个重要研究课题,韵律边界的预测对于语音合成中语料库的韵律标注具有非常重要的意义,其预测的准确性关系到合成语音的自然度和可理解性。中文韵律的预测分为三个层级,分别是:韵律词、韵律短语和语调短语,然而目前大部分基于深度学习的韵律预测模型使用的是基于预训练语言(Bert)的词性标注模型(BLSTM-CRF),且三个层级的韵律边界预测分开,即要预测一句话的韵律边界,需要三次模型推理,再加上双向长短时记忆网络(BLSTM)本身的循环计算特性,无法并行计算,模型的运行效率较低,影响了整体的语音合成效率。

发明内容

本申请的主要目的在于提供一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质,旨在目前大部分基于深度学习的韵律预测模型,无法并行计算,模型的运行效率较低,影响了整体的语音合成效率的技术问题。

第一方面,本申请提供一种文本韵律边界预测的方法,所述文本韵律边界预测的方法包括以下步骤:

将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;

通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;

根据所述词向量信息,获取对应的多维向量信息;

通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;

通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。

第二方面,本申请还提供一种文本韵律边界预测装置,所述文本韵律边界预测装置包括:

第一获取模块,用于将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;

第二获取模块,用于通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;

第三获取模块,用于根据所述词向量信息,获取对应的多维向量信息;

第四获取模块,用于通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;

确定模块,用于通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。

第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的文本韵律边界预测的方法的步骤。

第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的文本韵律边界预测的方法的步骤。

本申请提供一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质,通过将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;根据所述词向量信息,获取对应的多维向量信息;通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种文本韵律边界预测的方法的流程示意图;

图2为图1中的文本韵律边界预测的方法的子步骤流程示意图;

图3为图1中的文本韵律边界预测的方法的子步骤流程示意图;

图4为图1中的文本韵律边界预测的方法的子步骤流程示意图;

图5为本申请实施例提供的另一种文本韵律边界预测的方法的流程示意图;

图6为本申请实施例提供的一种文本韵律边界预测装置的示意性框图;

图7为本申请一实施例涉及的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本申请实施例提供一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质。其中,该文本韵律边界预测的方法可应用于计算机设备中,该计算机设备可以是笔记本电脑、台式电脑等电子设备。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参照图1,图1为本申请的实施例提供的一种文本韵律边界预测的方法的流程示意图。

如图1所示,该文本韵律边界预测的方法包括步骤S101至步骤S105。

步骤S101、将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层。

示范性的,获取待预测文本,该待预测文本包括短语或短句等。获取的方法包括获取预置存储路径中的待预测数据,或,获取预置区块链中的存储的待预测数据,该待预测数据包括多个待预测文本。在获取到待预测文本时,将待预测文本输入到预置文本韵律边界模型,该预置文本韵律边界模型包括预训练语言模型和二维卷积模型。

步骤S102、通过所述预训练语言模型,获取所述待预测文本对应的词向量信息。

示范性的,直接将该待预测文本输入到预训练语言模型中,通过该预训练语言模型,得到待预测文本对应的词向量信息,该词向量信息的数据规则为{B、L、E},其中,B为待预测文本的样本标识,L为待预测文本的字词长度,E为预置词向量长度。

在一实施例中,具体地,参照图2,步骤S102包括:子步骤S1021至子步骤S1022。

子步骤S1021,通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度。

示范性的,将该待预测文本输入到预训练语言模型,通过该预训练语言模型的应用层对该待预测文本进行分析,获取待预测文本的样本标识和待预测文本中的字词长度。例如,该待预测文本包括至少一个样本,通过该预训练语言模型的应用层对该待预测文本进行分析,获取待预测文本中的样本标识。若该预测文本只有一个样本,则该样本标识为1;若该待预测文本有两个样本,则该样本标识为2。以及获取该样本中的字词长度,例如,该样本为8个字词组成,则该样本的字词长度为8。

子步骤S1022,基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。

示范性的,在获取到待预测文本的样本标识以及对应的字词长度,并获取预训练语言模型中的预置词向量长度。预训练语言模型的输出层通过该样本标识、字词长度以及预置词向量信息输出待预测文本的词向量信息。例如,获取待预测文本的样本标识B,待预测文本的字词长度L,预置词向量长度E,将获取到样本标识B、字词长度L以及预置词向量长度E进行组合,得到{B、L、E},将该{B、L、E}作为待预测文本的向量信息,其中当有多个字词长度时,取长度最长的字词长度。

步骤S103、根据所述词向量信息,获取对应的多维向量信息。

示范性的,在获取到待预测文本的词向量信息时,通过对该词向量信息进行维度变换和维度切分,得到对应的多维向量信息。

在一实施例中,具体的,所述词向量信息包括样本标识、字词长度和预置词向量长度;所述根据所述词向量信息,得到对应的多维向量信息,包括:获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。

示范性的,在获取到待预测文本的词向量信息时,对该词向量信息进行维度变换,得到对应的维度向量信息。例如,在获取到词向量信息为{B、L、E},将该{B、L、E}中的L维度和E维度调换位置,得到维度变换后的维度向量信息{B、E、L}。在得到维度向量信息时,对该维度向量信息进行维度拆分,例如,获取到待预测文本中字词长度E,将字词长度E按照预置维度,分为多段维度,若获取到待预测文本中字词长度E[1,2,3,4,5,6,7,8]被切分为了[1,2],[3,4],[5,6],[7,8],则变为二维向量[[1,2],[3,4],[5,6],[7,8]])。

步骤S104、通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息。

示范性的,在获取到待预测文本的多维向量信息时,将该多维向量信息输入到二维卷积模型中,通过该二维卷积模型中的多个卷积层对该多维向量进行卷积处理,得到该待预测文本中各个字词的分类标签信息。例如,该二维卷积模型中包括多个卷积层,每一个卷积层对多维向量信息进行卷积处理。

在一实施例中,具体地,参照图3,步骤S104包括:子步骤S1041至子步骤S1042。

子步骤S1041、根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息。

示范性的,该二维卷积模型包括卷积层,通过该卷积层对该多维向量信息进行卷积计算,得到该多维向量信息的目标数据规则信息。其中,该卷积层包括多层。例如,当第一层为depthwise分通道卷积,卷积核大小为3x3,padding=1,stride=1,即输出与输入的数据规格不变,多维向量信息中的数据规则依然为[B,E,H,W]。第二层为pointwise的1x1卷积,即卷积核大小为1x1,padding=0,stride=1,卷积核个数与通道数E相等,因此经过第二层后数据的规格依然不变,还是[B,E,H,W]。第三层与第一层一样,第四层与第二层相比,除了卷积核个数变为通道数E的一半外,其他不变,即第四层输出的数据规格为[B,E/2,H,W],且对输入数据进行1x1卷积,使得其数据规格与第四层的输出一致,两者进行残差连接,即相加作为第四层最终的输出。第五层为maxpooling层,输出的数据规格为[B,E/2,H/2,W/2]。第六层与第七层与第一第二层完全一样,因此得到的数据规格依然为[B,E/2,H/2,W/2]。

第八层为上采样层,基于全卷机网络中的逆卷积,使得第三、第四维度的规格变大一倍,即输出为[B,E/2,H,W]。接着将四维的数据恢复到原来的三维,变成[B,E/2,H*W],最为后续网络的输入。(原本数据维度为[B,E/2,H,W],现在需要将数据维度变回3维向量,即可将最后的两个维度相乘,即可得到维度为[B,E/2,H*W]的向量,作为下一层网络的输入),第八层采用一维卷积,卷积核大小为3x3,padding=1,stride=1,卷积核个数为E/4,因此该层输出数据的规格为[B,E/4,H*W],第九层与第八层类似,区别在于卷积核变成E/8,即输出为[B,E/8,H*W]。

子步骤S1042、基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。

示范性的,在获取到多维向量信息的目标数据规则信息时,将该目标数据规则信息输入到全连接层中,通过该全连接层对该目标数据规则信息进行分类,得到该待预测文本中各个字词的分类标签信息。

具体的,在所述基于所述全连接层对所述目标数据规则进行分类,得到所述待预测文本中各个字词的分类标签信息,包括:通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。

示范性的,该全连接层包括预置分类器,通过该预置分类型基于该目标数据规则信息进行分类,得到各个字词分类向量信息,通过预置权重矩阵和各个字词分类向量信息,得到各个字词的分类标签信息。

步骤S105、通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。

示范性的,在获取到各个字词的分类标签信息时,通过该各个字词的分类标签信息,确定各个字词的韵律边界。例如,该分类标签信息包括分类信息和分类标签信息,通过分类信息和标签信息确定待预测文本中各个字词的韵律边界信息信息。

在一实施例中,具体地,参照图4,步骤S105包括:子步骤S1051至子步骤S1054。

子步骤S1051、若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词。

示范性的,若分类信息为韵律分类,则获取该韵律分类对应的标签信息,通过该标签信息确定各个字词是否为韵律词。例如,若获取标签信息为0时,则该词不为韵律词,若获取到标签信息为1时,则该词为韵律词。

子步骤S1052、若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语。

示范性的,若分类信息为韵律短语分类,则获取该韵律短语分类对应的标签信息,通过该标签信息确定各个字词是否为韵律短语。例如,若获取标签信息为0时,则该词不为韵律短语,若获取到标签信息为1时,则该词为韵律短语。

子步骤S1053、若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语。

示范性的,若分类信息为语调短语分类,则获取该语调短语分类对应的标签信息,通过该标签信息确定各个字词是否为语调短语。例如,若获取标签信息为0时,则该词不为语调短语,若获取到标签信息为1时,则该词为语调短语。

子步骤S1054、若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。

示范性的,若分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定该字词为背景类。若确定该字词为背景类,则确定该字词不是韵律边界。

在本申请实施例中,通过将获取到的待预测文本输入到预置文本韵律边界模型中,通过该预置文本韵律边界模型中的预训练语言模型,得到该预置待预测文本的词向量信息,通过对词向量信息进行维度变换和维度切分,得到多维向量信息,通过二维卷积模型对该多维向量信息进行卷积处理,得到待预测文本中各个字词对应的分类标签信息,通过该分类标签信息,确定各个字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。

请参照图5,图5为本申请的实施例提供的另一种文本韵律边界预测的方法的流程示意图。

如图5所示,该文本韵律边界预测的方法包括步骤S201至步骤S209。

步骤S201、获取多个带标注文本。

示范性的,获取多个带标注文本,其中,每个带标注文本包括每个字词的标注信息,该标注信息包括分类信息以及标签信息。

步骤S202、将多个所述带标注文本输入预置待训练模型。

示范性的,在获取到多个带标注文本时,将多个带标注文本输入预置待训练模型中,该预置待训练模型包括预置预训练语言模型和预置二维卷积模型。

步骤S203、通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数。

示范性的,通过多个带标注文本对预置待训练模型进行训练,获取对应的损失交叉熵函数。例如,通过该带标注文本对预置待训练模型进行训练,得到对应的预测分类标签信息,通过该预测分类标签信息和带标注文本中的标注分类标签信息,得到对应的损失交叉熵函数。

步骤S204、通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。

示范性的,通过该损失交叉熵函数对预置待训练模型的模型参数进行更新,确定更新后的预置待训练模型是否处于收敛状态,若该预置待训练模型处于收敛状态,则生成对应的文本韵律边界模型,若不出收敛状态,则训练对预置待训练模型进行模型训练。

步骤S205、将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层。

示范性的,获取待预测文本,该待预测文本包括短语或短句等。获取的方法包括获取预置存储路径中的待预测数据,或,获取预置区块链中的存储的待预测数据,该待预测数据包括多个待预测文本。在获取到待预测文本时,将待预测文本输入到预置文本韵律边界模型,该预置文本韵律边界模型包括预训练语言模型和二维卷积模型。

步骤S206、通过所述预训练语言模型,获取所述待预测文本对应的词向量信息。

示范性的,直接将该待预测文本输入到预训练语言模型中,通过该预训练语言模型,得到待预测文本对应的词向量信息,该词向量信息的数据规则为{B、L、E},其中,B为待预测文本的样本标识,L为待预测文本的字词长度,E为预置词向量长度。

步骤S207、根据所述词向量信息,获取对应的多维向量信息。

示范性的,在获取到待预测文本的词向量信息时,通过对该词向量信息进行维度变换和维度切分,得到对应的多维向量信息。

具体的,所述根据所述词向量信息,得到对应的多维向量信息,包括:对所述词向量信息进行维度变换,得到对应的维度向量信息;对所述维度向量信息进行维度拆分,得到对应的多维向量信息。

示范性的,在获取到待预测文本的词向量信息时,对该词向量信息进行维度变换,得到对应的维度向量信息。例如,在获取到词向量信息为{B、L、E},将该{B、L、E}中的L维度和E维度调换位置,得到维度变换后的维度向量信息{B、E、L}。在得到维度向量信息时,对该维度向量信息进行维度拆分,例如,获取到待预测文本中字词长度E,将字词长度E按照预置维度,分为多段维度,若获取到待预测文本中字词长度E[1,2,3,4,5,6,7,8]被切分为了[1,2],[3,4],[5,6],[7,8],则变为二维向量[[1,2],[3,4],[5,6],[7,8]])。

步骤S208、通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息。

示范性的,在获取到待预测文本的多维向量信息时,将该多维向量信息输入到二维卷积模型中,通过该二维卷积模型中的多个卷积层对该多维向量进行卷积处理,得到该待预测文本中各个字词的分类标签信息。例如,该二维卷积模型中包括多个卷积层,每一个卷积层对多维向量信息进行卷积处理。

步骤S209、通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。

示范性的,在获取到各个字词的分类标签信息时,通过该各个字词的分类标签信息,确定各个字词的韵律边界。例如,该分类标签信息包括分类信息和分类标签信息,通过分类信息和标签信息确定待预测文本中各个字词的韵律边界信息信息。

在本申请实施例中,通过带标注文本对预置待训练模型进行训练,生成对应的文本韵律边界模型,通过该预置文本韵律边界模型中的预训练语言模型,得到该预置待预测文本的词向量信息,通过对词向量信息进行维度变换和维度切分,得到多维向量信息,通过二维卷积模型对该多维向量信息进行卷积处理,得到待预测文本中各个字词对应的分类标签信息,通过该分类标签信息,确定各个字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。

请参照图6,图6为本申请实施例提供的一种文本韵律边界预测装置的示意性框图。

如图6所示,该文本韵律边界预测装置400,包括:第一获取模块401、第二获取模块402、第三获取模块403、第四获取模块404、确定模块405。

第一获取模块401,用于将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;

第二获取模块402,用于通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;

第三获取模块403,用于根据所述词向量信息,获取对应的多维向量信息;

第四获取模块404,用于通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;

确定模块405,用于通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。

其中,第二获取模块402具体还用于:

通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度;

基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。

其中,第三获取模块403具体还用于:

获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;

对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。

其中,第四获取模块404具体还用于:

根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息;

基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。

其中,第四获取模块404具体还用于:

通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;

基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。

其中,确定模块405具体还用于:

若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词;

若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语;

若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语;

若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。

其中,文本韵律边界预测装置还用于:

获取多个带标注文本;

将多个所述带标注文本输入预置待训练模型;

通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数;

通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述文本韵律边界预测的方法实施例中的对应过程,在此不再赘述。

上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。

请参阅图7,图7为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为终端。

如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种文本韵律边界预测的方法。

处理器用于提供计算和控制能力,支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种文本韵律边界预测的方法。

该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:

将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;

通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;

根据所述词向量信息,获取对应的多维向量信息;

通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;

通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。

在一个实施例中,所述处理器所述预训练语言模型包括预置词向量长度;所述通过所述预训练语言模型,获取所述待预测文本对应的词向量信息实现时,用于实现:

通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度;

基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。

在一个实施例中,所述处理器所述词向量信息包括样本标识、字词长度和预置词向量长度;所述根据所述词向量信息,得到对应的多维向量信息实现时,用于实现:

获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;

对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。

在一个实施例中,所述处理器所述二维卷积模型包括卷积层和全连接层;所述通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息实现时,用于实现:

根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息;

基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。

在一个实施例中,所述处理器所述基于所述全连接层对所述目标数据规则进行分类,得到所述待预测文本中各个字词的分类标签信息实现时,用于实现:

通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;

基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。在一个实施例中,所述处理器所述分类标签信息包括分类信息和标签信息;所述通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息实现时,用于实现:

若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词;

若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语;

若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语;

若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。

在一个实施例中,所述处理器所述将获取到的待预测文本输入预置文本韵律边界模型中之前实现时,用于实现:

获取多个带标注文本;

将多个所述带标注文本输入预置待训练模型;

通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数;

通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请文本韵律边界预测的方法的各个实施例。

其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本申请所指区块链是预置文本韵律边界模型的存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 文本韵律边界预测的方法、装置、设备及存储介质
  • 一种文本韵律层级结构预测方法、装置、设备及存储介质
技术分类

06120112941585