掌桥专利:专业的专利平台
掌桥专利
首页

一种短文本分类方法、装置、电子设备以及存储介质

文献发布时间:2024-04-18 19:52:40


一种短文本分类方法、装置、电子设备以及存储介质

技术领域

本发明涉及数据处理技术领域,尤其涉及一种短文本分类方法。

背景技术

短文本是一种表征数较少的文本集合,包括短语、句字、段落等,短文本相比于长文本其包含的表征数量较少,能提取到的语义特征也相对较少,对于短文本表征的特征缺失会导致下游的分类、聚类等任务准确率低,容易受到噪声干扰。

发明内容

本发明提供一种短文本的分类方法,用以解决现有技术中短文本分类准确度低的缺陷,实现在文本特征较少时提高文本分类的准确性。

第一方面,本发明提供一种短文本分类方法,包括:

根据目标短文本,确定文本单元以及与所述文本单元对应的译文文本;

输入所述文本单元以及所述译文文本至预训练模型,得到所述预训练模型输出的文本单元向量以及译文文本向量;

输入目标增强向量至预设权重矩阵,得到所述预设权重矩阵输出的所述目标短文本的预设维度向量;

输入所述目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,所述目标增强向量是所述文本单元向量以及所述译文文本向量拼接得到的;所述预设权重矩阵是根据样本三元组训练得到的;所述预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量所属的样本分类结果训练得到的;

在一个实施例中,在所述根据目标短文本的目标增强向量以及预设权重矩阵,确定所述目标短文本的预设维度向量之前,所述方法还包括:

根据样本短文本构建样本三元组;

输入样本三元组中的样本第一增强向量和样本第二增强向量至样本权重矩阵中,获得样本权重矩阵输出的样本第一预设维度向量和样本第二预设维度向量;

输入所述样本第一预设维度向量、所述样本第二预设维度向量以及样本三元向量至第一神经网络,获得所述第一神经网络输出的二元激活值;

根据所述二元激活值、所述样本三元组中的样本分类标签以及第一预设函数,得到所述预设权重矩阵;

所述样本三元组是根据所述样本第一增强向量、所述样本第二增强向量,以及所述样本第一增强向量与所述样本第二增强向量之间的所述样本分类标签确定的;所述样本三元向量是根据所述样本第一增强向量、所述样本第二增强向量,以及所述样本第一增强向量与所述样本第二增强向量之差的绝对值确定的。

在一个实施例中,在所述根据目标短文本的目标增强向量以及预设权重矩阵,确定所述目标短文本的预设维度向量之前,所述方法还包括:

根据样本预设维度向量确定与所述样本预设维度对应的预设数量个样本分类结果;

输入所述样本预设维度向量至所述样本分类模型得到预设数量个分类激活值;

根据所述预设数量个分类激活值、所述预设数量个样本分类结果以及第二预设函数,处理所述样本分类模型,得到所述预设分类模型;

在一个实施例中,所述根据样本短文本构建样本三元组,包括:

根据语料分类库切分样本短文本,得到样本文本单元;

确定每一样本文本单元组的所述样本分类标签,所述样本文本单元组为样本第一文本单元与样本第二文本单元的组合;

对于任一样本文本单元组,确定所述样本文本单元组中样本第一文本单元的译文以及样本第二文本单元的译文;

输入所述样本第一文本单元及所述样本第一文本单元的译文至所述预训练模型,获取所述预训练模型输出的样本第一文本单元的向量以及样本第一文本单元的译文向量;输入所述样本第二文本单元及所述样本第二文本单元的译文至预训练模型,获取所述预训练模型输出的样本第二文本单元的向量以及样本第二文本单元的译文向量;

根据所述样本第一文本单元的向量以及所述样本第一文本单元的译文向量拼接得到所述样本第一增强向量;根据所述样本第二文本单元的向量以及所述样本第二文本单元的译文向量拼接得到所述样本第二增强向量;根据所述样本第一增强向量、所述样本第二增强向量以及所述样本分类标签,构建所述样本三元组;

在一个实施例中,所述确定每一样本文本单元组的所述样本分类标签,包括:

在确定所述样本第一文本单元与所述样本第二文本单元为同类文本的情况下,确定所述样本文本单元组为相同标签;

在确定所述样本第一文本单元与所述样本第二文本单元为不同类文本的情况下,确定所述样本文本单元组为不同标签;

在一个实施例中,所述译文向量为如下向量中的任一种:

任一语种对应的向量;

或者,多个语种组成的向量集合。

第二方面,本发明实施例提供一种短文本分类装置,包括:

文本确定单元,所述文本确定单元用于根据目标短文本,确定文本单元以及与所述文本单元对应的译文文本;

向量确定单元,所述向量确定单元用于根据目标短文本的目标增强向量以及预设权重矩阵,确定所述目标短文本的预设维度向量;

权重向量确定单元,所述权重向量确定单元用于根据目标短文本的目标增强向量以及预设权重矩阵,确定所述目标短文本的预设维度向量;

文本分类单元,所述文本分类单元用于输入所述目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,所述目标增强向量是所述文本单元向量以及所述译文文本向量拼接得到的;所述预设权重矩阵是根据样本三元组训练得到的;所述预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量所属的样本分类结果训练得到的。

第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种短文本分类方法。

第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述短文本分类方法。

第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述短文本分类方法。

本发明提供的短文本分类方法、装置、电子设备以及存储介质,通过将短文本拆分为文本单元,确定每个文本单元的译文文本,合并文本单元和译文文中的文本表征,生成文本单元增强表征的预设维度向量,可以有效增加短文本的表征数量,提高短文本的分类准确度,进一步地,通过构建预设分类模型,可以快速的通过预设维度向量确定短文本的分类结果,提高短文本的分类效率。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的短文本分类方法流程示意图;

图2是本发明实施例提供的确定预设权重矩阵的流程示意图;

图3是本发明实施例提供的样本权重矩阵的模型结构之一的示意图;

图4是本发明实施例提供的构建样本三元组的流程示意图;

图5是本发明实施例提供的训练预设分类模型的流程示意图;

图6是本发明实施例提供的预设分类模型的模型结构之一的示意图;

图7是本发明实施例提供的短文本分类装置结构示意图;

图8是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是本发明实施例提供的短文本分类方法流程示意图,如图1所示,该短文本分类方法,包括:

S110、根据目标短文本,确定文本单元以及与文本单元对应的译文文本;

S120、输入文本单元以及译文文本至预训练模型,得到预训练模型输出的文本单元向量以及译文文本向量;

S130、输入目标增强向量至预设权重矩阵,得到预设权重矩阵输出的目标短文本的预设维度向量;

S140、输入目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,目标增强向量是文本单元向量以及译文文本向量拼接得到的;预设权重矩阵是根据样本三元组训练得到的;预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量对应的样本分类结果训练得到的。

需要说明的是需要说明的是,本发明实施例提供的短文本分类方法,执行主体可以是计算机设备,例如手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(Ultra-Mobile Personal Computer,UMPC)、上网本或者个人数字助理(Personal Digital Assistant,PDA)等,本发明在此不做限定,本发明以短文本分类系统作为执行主体进行说明。

S110中,目标短文本表示需要进行分类的短文本,文本单元可以是将目标短文本按照一定粒度进行拆分得到的目标短文本的组成部分,例如目标短文本为一篇文档,按句对目标短文本进行拆分,获取所述目标短文本对应的10句话,其中10句话中的每一句话表示一个文本单元。

可以理解的是,拆分目标短文本得到文本单元的方式,可以是逐词、逐句、逐段进行拆分,本发明在此不做限定。

需要说明的是,根据每一个文本单元确定与每一个文本单元对应的译文文本,是指每一个文本单元可以对应一个或多个译文文本,例如文本单元为一句中文句子,其对应的译文文本可以是根据该文本单元的中文句子翻译得到的一句英文句子,也可以是根据该文本单元的中文句子翻译得到的一句英文句子、一句法语句子、一句德语句子的集合。

可以理解的是,翻译的方法可以是机器翻译,相较于人工翻译效率更高更准确,有利于短文本分类的准确性。

可以理解的是,通过增加译文文本补充短文本的文本表征,可以有效增加短文本分类的准确性。通过在增加译文文本的种类,可以进一步增加获取的文本表征数,进而提高短文本分类的精确度。

S120中,文本单元向量以及译文文本向量,是通过将文本单元以及译文文本转换为向量表达得到的,该转换方法可以是采用现有的预训练模型实现,例如语义表示模型(Embeddings from Language Models,ELMo)、语言表示模型模型(Bidirectional EncoderRepresentation from Transformers,BERT)、自然语言处理模型(Generative Pre-Trained Transformer,GPT)等,本发明在此不做限定。

S130中,目标增强向量是指通过预训练模型得到文本单元向量以及译文文本向量后,将两个向量拼接为一个向量,其拼接方法可以是垂直拼接、水平拼接等,本发明在此不做限定。

可以理解的是,通过将两个向量进行拼接得到目标增强向量,可以将文本单元向量以及译文文本向量中的文本表征结合到一起,相当于增加了这一文本的表征数量,有利于后续进行文本分类。

需要说明的是,通过预设权重矩阵可以增强向量转换为预设维度的向量,例如当文本向量单元的维度为m,译文文本的向量维度为n,此时,可以确定增强向量的维度为m+n,若预设维度为k,通过设置(m+n)*k的预设权重矩阵,可以将增强向量的维度转换为k维度的向量。

可以理解的是,本发明通过预设权重矩阵,将增强向量转换为预设维度向量,相当于将增强向量中的文本表征信息整合到预设维度向量中,有利于后续根据预设模型对预设维度向量进行处理,得到分类结果。

S140中,可以理解的是,输出的分类结果的数量,是根据S130中预设权重矩阵的输出的预设维度向量的维度确定的,例如S130中预设权重矩阵的输出的预设维度向量的维度为k,S140中输出的分类结果的数量也是k。

需要说明的是,预设分类模型是根据预设维度向量以及与其对应的分类结果训练得到的,例如可以通过已有的分类语料库确定文本单元的分类结果,将根据文本单元得到的增强向量与该分类结果组成的样本对,作为训练预设分类模型的样本。

需要说明的是,分类结果可以通过分类标签表示,例如可以有情感分析的标签、主体分类的标签、问答任务的标签、意图识别的标签、自然语言推理的标签,其中每一条文本对应各类标签中的至少一种,例如一条文本分类结果可以是,情感分析的标签是积极、消极或者中性;主题分类的标签是金融、体育、军事还是社会;问答任务的标签可以为是或否;意图识别的标签可以为天气查询、歌曲搜索或者随机闲聊;自然语言推理的标签可以为导出、矛盾或中立。

本发明实施例提供的一种短文本分类方法,通过将短文本拆分为文本单元,确定每个文本单元的译文文本,合并文本单元和译文文本的文本表征,生成文本单元增强表征的预设维度向量,可以有效增加短文本的表征数量,提高短文本的分类准确度,进一步地,通过构建预设分类模型,可以快速的通过预设维度向量确定短文本的分类结果,提高短文本的分类效率。

在一个实施例中,译文向量为如下向量中的任一种:

任一语种对应的向量;

或者,多个语种组成的向量集合。

需要说明的是,通过任一语种对应的向量作为译文向量进行分类也可以达到有效分类的效果,但是语种数量越多,其组成的译文向量集合所携带的表征数量越多,根据多个语种组成的译文向量集合确定的分类结果,相比一个语种对应的向量作为译文向量确定的分类结果而言更准确。

可以理解的是,在通过本发明实施例提供的短文本分类方法进行分类时,可以通过硬件设备的算力确定译文语种的数量,例如在硬件设备的算力较强的情况下,可以使用较多的语种组成的向量集合作为译文向量,在硬件设备的算力较弱的情况下,可以使用任一语种对应的译文向量进行分类。

本发明实施例提供的短文本分类方法,通过确定任一语种对应的向量作为译文向量,可以增加文本向量所携带的表征数据的数量,增加短文本分类的准确性,进一步通过构建多个语种组成的向量集合,可以极大程度的增加译文向量携带的表征数据的数量,进而对短文本进行更准确的分类。

图2是本发明实施例提供的确定预设权重矩阵的流程示意图,如图2所示,在根据目标短文本的目标增强向量以及预设权重矩阵,确定目标短文本的预设维度向量之前,短文本分类方法还包括:

S210、根据样本短文本构建样本三元组;

S220、输入样本三元组中的样本第一增强向量和样本第二增强向量至样本权重矩阵中,获得样本权重矩阵输出的样本第一预设维度向量和样本第二预设维度向量;

S230、输入样本第一预设维度向量、样本第二预设维度向量以及样本三元向量至第一神经网络,获得第一神经网络输出的二元激活值;

S240、根据二元激活值、样本三元组中的样本分类标签以及第一预设函数,得到预设权重矩阵;

样本三元组是根据样本第一增强向量、样本第二增强向量,以及样本第一增强向量样本第二增强向量对应的样本分类标签确定的;三元向量是根据样本第一增强向量、样本第二增强向量,以及样本第一增强向量与样本第二增强向量之差的绝对值确定的。

S210中,根据第一个实施例中的拆分方法,拆分样本短文本,得到样本文本单元,并进一步得到样本文本单元对应的样本增强向量,根据每两个样本增强向量以及这两个样本增强向量对应的样本分类标签,确定一个样本三元组。

例如,逐词拆分样本短文本后,得到4个词语,根据这4个词语得到与之对应的4个机器翻译的译文,将这4个词语的向量以及其各自对应的4个译文的向量进行拼接,得到4个增强向量,将其中2个增强向量以及这2个词语对应的样本分类标签构建为第一个样本三元组,将剩余2个增强向量以及剩余这2个词语对应的样本分类标签构建为第二个样本三元组。

可以理解的是,根据两个样本增强向量以及其对应的样本分类标签构建样本三元组,有利于后续训练样本权重矩阵时根据样本分类标签进行计算,进而确保训练得到的预设权重矩阵的准确性。

下面以输入其中一个样本三元组对样本权重进行训练为例说明S220的流程。S220中输入S220的样本第一增强向量和样本第二增强向量至样本权重矩阵,例如可以是(m+n)*k的样本权重矩阵中,得到样本权重矩阵输出的样本第一预设维度向量(例如可以记作X,X的维度为k)和样本第二预设维度向量(例如可以记作Y,Y的维度为k)。

S230中,根据S220中输出的向量X和向量Y以及向量X与Y的差的绝对值(例如可以记作|X-Y|),将X、Y和|X-Y|拼接得到一个样本三元向量(例如可以表示为(X、Y、|X-Y|)),将(X、Y、|X-Y|)输入至第一神经网络,得到二元激活值。

需要说明的是,第一神经网络可以是一个前馈神经网络。

可以理解的是,一个样本三元向量中包括有两个不同的样本增强向量,其中一个是样本第一增强向量,另一个是样本第二增强向量,除此之外,还包括有样本第一增强向量和样本第二增强向量的差的绝对值。通过样本第一增强向量和样本第二增强向量的差的绝对值构建样本三元向量,可以在训练样本权重矩阵时将样本第一增强向量以及样本第二增强向量的差异也代入训练,以此提高训练后的预设权重矩阵的拟合程度。

S240中,通过第一预设函数对S230中输出的二元激活值、S210中样本三元组中的样本分类标签的差异进行计算,根据计算结果调整样本权重矩阵内的参数。可以理解的是,通过大量样本的训练,反复调整样本权重矩阵内的参数,最终得到预设权重矩阵。

需要说明的是,第一预设函数可以是损失函数、代价函数等,例如交叉熵损失函数、感知损失函数等,本发明在此不做限定。

图3是本发明实施例提供的样本权重矩阵的模型结构之一的示意图,如图3所示,本实施例中训练样本权重矩阵的模型结构可以包括第一层为输入层,其内神经元个数可以为m+n;第二层为隐藏层,其内神经元个数可以为k;隐藏层输出可以接入一个前馈神经网络;由前馈神经网络的输出为一个二分类输出,例如可以输出上述二分类激活值,最终通过上述模型结构的训练,确定预设权重矩阵。

本发明实施例提供的短文本分类方法,通过构建样本三元组以及样本三元向量对样本权重矩阵进行训练,可以有效提高样本权重矩阵的拟合程度,进而提高后续文本分类的效率。

图4是本发明实施例提供的构建样本三元组的流程示意图,如图3所示,根据样本短文本构建样本三元组,包括:

S410、根据语料分类库切分样本短文本,得到样本文本单元;

S420、确定每一样本文本单元组的样本分类标签,样本文本单元组为样本第一文本单元与样本第二文本单元的组合;

S430、对于任一样本文本单元组,确定样本文本单元组中样本第一文本单元的译文以及样本第二文本单元的译文;

S440、输入样本第一文本单元及样本第一文本单元的译文至预训练模型,获取预训练模型输出的样本第一文本单元的向量以及样本第一文本单元的译文向量;输入样本第二文本单元及样本第二文本单元的译文至预训练模型,获取预训练模型输出的样本第二文本单元的向量以及样本第二文本单元的译文向量;

S450、根据样本第一文本单元的向量以及样本第一文本单元的译文向量拼接得到样本第一增强向量;根据第二文本单元的向量以及第二文本单元的译文向量拼接得到样本第二增强向量;根据样本第一增强向量、样本第二增强向量以及样本分类标签,构建样本三元组。

S410中,对已有的语料分类库中的样本短文本,按照一定粒度进行切分(例如逐词、逐句或逐段切分等),得到样本文本单元,例如逐词切分得到的每一个词语作为一个样本单元或逐句切分得到的每一个句子作为一个样本文本单元等。

S420中,样本文本组包括有两个不同的样本文本单元,这两个不同的文本单元分别为第一文本单元以及第二文本单元,根据分类语料库的分类,确定第一文本单元以及第二文本单元的样本分类标签。例如,第一文本单元以及第二文本单元均来自于分类标签为金融的样本短文本,则第一文本单元以及第二文本的样本分类标签为同类文本。

S430中,对每一个样本文本组内的第一文本单元和第二文本单元,通过机器翻译分别确定样本第一文本单元对应的样本第一文本单元译文,以及样本第二文本单元对应的样本第二文本单元译文。

S440中,将S420中确定的样本第一文本单元以及样本第二文本单元,以及S430中确定的样本第一文本单元译文以及样本第二文本单元译文输入至预训练模型(例如BERT模型)中,得到样本第一文本单元向量(例如可以记作E_s

S450中,将S440中得到的样本第一文本单元向量E_s

本发明实施例提供的短文本分类方法,通过已有的分类语料库确定样本分类标签,构建包括样本译文向量的样本三元组对样本矩阵权重进行训练,增加了后续根据增强向量进行分类的准确性。

在一个实施例中,确定每一样本文本单元组的样本分类标签,包括:

在确定样本第一文本单元与样本第二文本单元为同类文本的情况下,确定样本文本单元组为相同标签;

在确定样本第一文本单元与样本第二文本单元为不同类文本的情况下,确定样本文本单元组为不同标签。

例如,在确定样本第一文本单元与样本第二文本单元为同类文本的情况下,确定样本文本单元组为相同标签,标签可以用“1”表示;

在确定样本第一文本单元与样本第二文本单元为不同类文本的情况下,确定样本文本单元组为不同标签,标签可以用“0”表示。

需要说明的是,标签用于标识样本第一文本单元与样本第二文本单元是否为相同类型的文本,可以使用“1”和“0”进行标识,也可以使用“相同”和“不同”等其他的标签内容进行表示。

本发明实施例提供的短文本分类方法,通过“1”和“0”对样本第一文本单元与样本第二文本单元的分类标签进行简单标识,进而可以提高后续文本单元组、样本三元组的分类效率,简化训练样本的构建流程,并且保证训练样本的分类准确度。

图5是本发明实施例提供的训练预设分类模型的流程示意图。如图5所示,在根据目标短文本的目标增强向量以及预设权重矩阵,确定目标短文本的预设维度向量之前,还包括:

S510、根据样本预设维度向量确定与样本预设维度对应的预设数量个样本分类结果;

S520、输入样本预设维度向量至样本分类模型得到预设数量个分类激活值;

S530、根据预设数量个分类激活值、预设数量个样本分类结果以及第二预设函数,处理样本分类模型,得到预设分类模型。

S510中,需要说明的是,样本预设维度向量的维度数量,与样本分类结果的数量是对应的,例如样本预设维度向量是k,则样本分类有k个分类结果。在对样本分类模型进行训练时,根据预设的预设维度向量k,确定与预设维度向量对应的k个样本分类结果,将每一组k维度的样本预设维度向量与k个样本分类结果作为一个样本,用于样本分类模型中进行训练。

S520中,输入样本预设维度向量至样本分类模型得到预设数量个分类激活值,例如输入k维度的样本预设维度向量,得到样本分类模型输入的k个分类激活值。

S530中,第二预设分类函数可以是损失函数、代价函数等,例如交叉熵损失函数、感知损失函数等,本发明在此不做限定。通过第二预设函数计算预设数量个分类激活值和预设数量个样本分类结果的偏差值,根据偏差值对样本分类模型进行调整,通过大量样本训练得到预设分类模型。

图6是本发明实施例提供的预设分类模型的模型结构之一的示意图。下面结合图6说明本实施例中的预设分类模型。

图6中的样本分类模型为一个全连接的前馈神经网络,在训练时通过输入样本预设维度向量,得到输出的预设数量的分类激活值,结合第二预设函数对模型进行调整;在用于短文本分类时,通过输入待分类短文本的预设维度向量至该预设分类模型,得到预设分类模型输出的k个分类结果,完成分类。

本发明实施例提供的短文本分类方法,通过输入预设维度向量至预设分类模型,可以得到与预设维度向量对应的预设数量个分类结果,可以快速的通过预设维度向量确定短文本的分类结果,提高短文本的分类效率。

下面对本发明提供的短文本分类装置进行描述,下文描述的短文本分类装置与上文描述的短文本分类方法可相互对应参照。

图7是本发明实施例提供的短文本分类装置结构示意图。如图7所示,短文本分类装置包括:

文本确定单元710,文本确定单元用于根据目标短文本,确定文本单元以及与文本单元对应的译文文本;

向量确定单元720,向量确定单元用于根据目标短文本的目标增强向量以及预设权重矩阵,确定目标短文本的预设维度向量;

权重向量确定单元730,所述权重向量确定单元用于根据目标短文本的目标增强向量以及预设权重矩阵,确定目标短文本的预设维度向量;

文本分类单元740,文本分类单元用于输入目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,目标增强向量是所述文本单元向量以及译文文本向量拼接得到的;预设权重矩阵是根据样本三元组训练得到的;预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量对应的样本分类结果训练得到的。

本发明提供的短文本分类装置,通过将短文本拆分为文本单元,确定每个文本单元的译文文本,合并文本单元和译文文中的文本表征,生成文本单元增强表征的预设维度向量,可以有效增加短文本的表征数量,提高短文本的分类准确度,进一步地,通过构建预设分类模型,可以快速的通过预设维度向量确定短文本的分类结果,提高短文本的分类效率。

图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行短文本分类方法,该方法包括:

根据目标短文本,确定文本单元以及与文本单元对应的译文文本;

输入文本单元以及译文文本至预训练模型,得到预训练模型输出的文本单元向量以及译文文本向量;

输入目标增强向量至预设权重矩阵,得到预设权重矩阵输出的目标短文本的预设维度向量;

输入目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,目标增强向量是文本单元向量以及译文文本向量拼接得到的;预设权重矩阵是根据样本三元组训练得到的;预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量对应的样本分类结果训练得到的。

此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的短文本分类方法,该方法包括:

根据目标短文本,确定文本单元以及与文本单元对应的译文文本;

输入文本单元以及译文文本至预训练模型,得到预训练模型输出的文本单元向量以及译文文本向量;

输入目标增强向量至预设权重矩阵,得到预设权重矩阵输出的目标短文本的预设维度向量;

输入目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,目标增强向量是文本单元向量以及译文文本向量拼接得到的;预设权重矩阵是根据样本三元组训练得到的;预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量对应的样本分类结果训练得到的。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的短文本分类方法,该方法包括:

根据目标短文本,确定文本单元以及与文本单元对应的译文文本;

输入文本单元以及译文文本至预训练模型,得到预训练模型输出的文本单元向量以及译文文本向量;

输入目标增强向量至预设权重矩阵,得到预设权重矩阵输出的目标短文本的预设维度向量;

输入目标短文本的预设维度向量至预设分类模型,得到与预设维度对应的预设数量个分类结果;

其中,目标增强向量是文本单元向量以及译文文本向量拼接得到的;预设权重矩阵是根据样本三元组训练得到的;预设分类模型是根据所有样本预设维度向量,以及每一样本预设维度向量对应的样本分类结果训练得到的。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 燃料电池单体的制造方法和燃料电池单体
  • 固体氧化物型燃料电池用的电解质片、固体氧化物型燃料电池用的电解质片的制造方法以及固体氧化物型燃料电池用的单体电池
技术分类

06120116335792