掌桥专利:专业的专利平台
掌桥专利
首页

一种文本分类方法、装置、设备及存储介质

文献发布时间:2023-06-19 10:38:35


一种文本分类方法、装置、设备及存储介质

技术领域

本申请涉及自然语言处理技术领域,具体而言,涉及一种文本分类方法、装置、设备及存储介质。

背景技术

文本分类问题是自然语言处理领域的一个重要研究方向,在情感分析、信息检索领域均有相关应用。层次多标签文本分类方法是解决文本分类问题的一种重要的方法,近年来,备受学者关注。

目前,在层次多标签文本分类方法中,是通过假设标签间是相互独立的,然后将其转化为二分类问题,构建多个二分类器进行层次多标签文本分类。

然而,层次多标签文本分类任务中的标签之间存在复杂的依赖关系,采用现有技术的方式对层次多标签文本进行分类会使文本分类精度降低。

发明内容

本申请的目的在于,针对上述现有技术中的不足,提供一种文本分类方法、装置、设备及存储介质,可以提高对文本进行分类的精度。

为实现上述目的,本申请实施例采用的技术方案如下:

第一方面,本申请实施例提供了一种文本分类方法,所述方法包括:

将待分类文本中的至少一个词语分别转换成至少一个词向量;

将各所述词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到所述待分类文本对应的多个短语向量;

将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别输入所述文本分类模型中的标签注意力子模型,得到所述待分类文本的多个特征向量;

基于所述待分类文本的各特征向量,得到所述待分类文本的分类结果,所述分类结果用于表征所述待分类文本的类别。

可选地,所述标签注意力子模型包括:图卷积层、标签注意力层;

所述将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别输入所述文本分类模型中的标签注意力子模型,得到所述待分类文本的多个特征向量,包括:

将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别向量输入所述标签注意力层,由所述标签注意层根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量。

可选地,所述根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量,包括:

基于各所述候选类别向量以及各所述短语向量,确定各所述候选类别相对于各所述短语的权重;

根据各所述候选类别相对于各所述短语的权重以及各所述短语向量,得到所述待分类文本的多个特征向量。

可选地,所述将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别向量输入所述标签注意力层,由所述标签注意层根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量之前,所述方法还包括:

由所述图卷积层对所述层级标签结构中的各候选类别进行节点聚合处理,得到各候选类别向量。

可选地,所述短语注意力子模型包括:卷积层、双向长短期记忆层、以及短语注意力层;

可选地,所述将各所述词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到所述待分类文本对应的多个短语向量,包括:

将各所述词向量输入所述卷积层,得到短语序列特征;

将所述短语序列特征输入所述双向长短期记忆层,进行短语上下文语义特征提取,得到包含所述上下文语义的短语语义特征;

将所述短语语义特征输入所述短语注意力层,得到所述待分类文本对应的多个短语向量。

可选地,所述将所述短语语义特征输入所述短语注意力层,得到所述待分类文本对应的多个短语向量,包括:

根据所述短语语义特征,确定表示向量;

根据所述表示向量,确定所述短语语义特征的得分;

根据所述短语语义特征的得分以及所述短语语义特征,得到所述待分类文本对应的多个短语向量。

可选地,所述将待分类文本中的至少一个词语分别转换成至少一个词向量,包括:

将待分类文本中的至少一个词语输入预先训练得到的嵌入模型,得到各词语对应的词向量。

第二方面,本申请实施例还提供了一种文本分类装置,所述装置包括:

转换模块,用于将待分类文本中的至少一个词语分别转换成至少一个词向量;

第一输入模块,用于将各所述词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到所述待分类文本对应的多个短语向量;

第二输入模块,用于将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别输入所述文本分类模型中的标签注意力子模型,得到所述待分类文本的多个特征向量;

确定模块,用于基于所述待分类文本的各特征向量,得到所述待分类文本的分类结果,所述分类结果用于表征所述待分类文本的类别。

可选地,所述标签注意力子模型包括:图卷积层、标签注意力层;

相应地,所述第二输入模块,具体用于将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别向量输入所述标签注意力层,由所述标签注意层根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量。

可选地,所述第二输入模块,还具体用于基于各所述候选类别向量以及各所述短语向量,确定各所述候选类别相对于各所述短语的权重;根据各所述候选类别相对于各所述短语的权重以及各所述短语向量,得到所述待分类文本的多个特征向量。

可选地,所述装置还包括:

处理模块,用于由所述图卷积层对所述层级标签结构中的各候选类别进行节点聚合处理,得到各候选类别向量。

可选地,所述短语注意力子模型包括:卷积层、双向长短期记忆层、以及短语注意力层;

相应地,所述第一输入模块,具体用于将各所述词向量输入所述卷积层,得到短语序列特征;将所述短语序列特征输入所述双向长短期记忆层,进行短语上下文语义特征提取,得到包含所述上下文语义的短语语义特征;将所述短语语义特征输入所述短语注意力层,得到所述待分类文本对应的多个短语向量。

可选地,所述第一输入模块,还具体用于根据所述短语语义特征,确定表示向量;根据所述表示向量,确定所述短语语义特征的得分;根据所述短语语义特征的得分以及所述短语语义特征,得到所述待分类文本对应的多个短语向量。

可选地,所述转换模块,具体用于将待分类文本中的至少一个词语输入预先训练得到的嵌入模型,得到各词语对应的词向量。

第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行上述第一方面的所述文本分类方法的步骤。

第四方面,本申请实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面的所述文本分类方法的步骤。

本申请的有益效果是:

本申请实施例提供一种文本分类方法、装置、设备及存储介质,该方法包括:将待分类文本中的至少一个词语分别转换成至少一个词向量;将各词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到该待分类文本对应的多个短语向量;将多个短语向量以及该待分类文本对应的层级标签结构中的各候选类别输入该文本分类模型中的标签注意力子模型,得到该待分类文本的多个特征向量;基于该待分类文本的各特征向量,得到该待分类文本的分类结果,该分类结果用于表征所述待分类文本的类别。采用本申请实施例提供的文本分类方法,在用各短语向量表示待分类文本的语义的前提下,将该待分类文本对应的层级标签结构中的各候选类别输入文本分类模型中的标签注意力子模型中,利用该标签注意力子模型捕获各候选类别之间的依赖关系以及层级结构特征,再通过该标签注意力子模型将各短语向量与捕获得到的各候选类别之间的依赖关系以及层级结构特征相结合,得到该待分类文本的分类结果,这样可以提高对待分类文本进行分类的精度。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种文件分类方法的流程示意图;

图2为本申请实施例提供的一种文本分类模型结构示意图;

图3为本申请实施例提供的一种层级标签结构示意图;

图4为本申请实施例提供的另一种文本分类方法的流程示意图;

图5为本申请实施例提供的又一种文本分类方法的流程示意图;

图6为本申请实施例提供的一种文本分类装置的结构示意图;

图7为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在对本申请实施例进行详细解释之前,首先对本申请的应用场景进行介绍。该应用场景可以为某种业务场景,如学术论文分类、情感分析、新闻分类等场景中,本申请不对其进行限定。这里以新闻分类场景为例进行说明,在该新闻分类场景中,具有一定处理能力的设备(如服务器)对用户输入的文本进行处理,得到能够表示该文本语义信息的短语向量,该设备再基于该短语向量以及预先训练的文本分类模型得到该文本对应的类别。其中,用户输入的文本可能对应多个标签,标签之间存在依赖关系,应用本申请下述实施例可确定出用户输入的文本类别,即该文本对应的标签,例如,可确定出用户输入的文本对应的标签为体育新闻下的竞技类新闻,那么可将属于该体育新闻下的竞技类新闻推送给用户,这样可以更确切的将用户所期望的内容向用户推送,其他应用场景类似。

如下结合附图对本申请所提到的文本分类方法进行示例说明。图1为本申请实施例提供的一种文件分类方法的流程示意图。如图1所示,该方法可包括:

S101、将待分类文本中的至少一个词语分别转换成至少一个词向量。

其中,该待分类文本可以为一个物品的描述标题、一篇论文、一篇新闻稿件等,本申请不对该待分类文本的来源进行限定。可利用结巴(jieba)分词工具对该待分类文本进行切分,并删除该待分类文本中所包含的特殊符号、停用词等,最后得到该待分类文本中包含的多个词语。通过预先训练好的词语向量化模型对各词语进行向量化,该预先训练好的词语向量化模型可将各词语转化为对应的词向量,也就是说,各词语用预设维度(如300)的词向量表示。

S102、将各词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到该待分类文本对应的多个短语向量。

该文本分类模型中可包括短语注意力子模型、标签注意力子模型,如图2所示。可将训练前的短语注意力子模型以及训练前的标签注意力子模型作为一个整体进行训练,最后得到该文本分类模型,也可分别对训练前的短语注意力子模型以及训练前的标签注意力子模型进行训练,得到该短语注意力子模型以及该标签注意力子模型,最后结合该短语注意力子模型以及该标签注意力子模型得到该文本分类模型,需要说明的是,本申请不对其进行限定。

其中,该短语注意力子模型可将上述得到的用各词向量表征该待分类文本的文本特征转换为用多个短语向量表征该待分类文本的文本特征。也就是说,该短语注意力子模型可捕捉该待分类文本中多个词语组成的短语特征,这样可以提高获取该待分类文本的文本特征的准确度。

S103、将多个短语向量以及该待分类文本对应的层级标签结构中的各候选类别输入该文本分类模型中的标签注意力子模型,得到该待分类文本的多个特征向量。

S104、基于该待分类文本的各特征向量,得到该待分类文本的分类结果。

其中,该层级标签结构可如图3所示,该层级标签结构中的各候选类别相当于图3中的各节点,某个节点对应的标签可包含与其在一路上的其他节点对应的标签信息,例如,图3中竞技类新闻标签包含的内容是体育新闻下的竞技类新闻。该层级标签结构与该待分类文本所对应的应用场景相关,也就是说,假设该待分类文本属于一篇新闻稿件,那么该待分类文本对应的层级标签结构可如图3所示,如果该待分类文本属于一篇论文,那么该层级标签结构中各节点对应的标签可包括化学标签、生物标签、物理标签,该物理标签下可包括光学标签、等离子体标签等,即不同的应用场景,该层级标签结构可能不同。

可预先对该层级标签结构中的各候选类别进行编码,得到各候选类别对应的初始向量,其中,各候选类别的初始向量用于表征各候选类别的自身特征。将各候选类别的初始向量输入该标签注意力子模型中,该标签注意力子模型可捕获该层级标签结构中的各候选类别的依赖关系,得到各候选类别的目标向量,其中,某个候选类别的目标向量用于表征自身特征以及与其具有连接关系的其他候选类别对应的特征相结合的信息。

通过该标签注意力子模型,可将该待分类文本对应的各短语向量与各候选类别的目标向量相结合,可以得到该待分类文本与各候选类别之间的对应关系,该对应关系可用特征向量表征。最后将该待分类文本的各特征向量输入该标签注意力子模型中的全连接层,该全连接层输出该待测文本对应的类别。

综上所述,本申请提供的文本分类方法中,在用各短语向量表示待分类文本的语义的前提下,将该待分类文本对应的层级标签结构中的各候选类别输入文本分类模型中的标签注意力子模型中,利用该标签注意力子模型捕获各候选类别之间的依赖关系以及层级结构特征,再通过该标签注意力子模型将各短语向量与捕获得到的各候选类别之间的依赖关系以及层级结构特征相结合,得到该待分类文本的分类结果,这样可以提高对待分类文本进行分类的精度。

可选地,上述图2中的标签注意力子模型可包括:图卷积层、标签注意力层;上述将多个短语向量以及该待分类文本对应的层级标签结构中的各候选类别输入该文本分类模型中的标签注意力子模型,得到该待分类文本的多个特征向量,包括:

将多个短语向量以及该待分类文本对应的层级标签结构中的各候选类别向量输入该标签注意力层,由该标签注意层根据多个短语向量以及该图卷积层输出的各候选类别向量,得到该待分类文本的多个特征向量。

可根据预先训练好的词向量转换模型中的词嵌入矩阵得到该层级标签结构中各候选类别的初始向量,将各候选类别的初始向量输入到该图卷积层中,该图卷积层输出各候选类别向量,各候选类别向量相当于上述提到的各候选类别的目标向量。再将各短语向量以及各候选类别向量分别输入该标签注意力层,该标签注意力层可通过注意力机制得到该待分类文本与各候选类别向量的交互特征,该交互特征用于表征该待分类文本的多个特征向量。

可选地,图2中的标签注意力子模型还可包括输出层,该输出层可基于该待分类文本的各特征向量,输出该待分类文本的分类结果。

图4为本申请实施例提供的另一种文本分类方法的流程示意图。如图4所示,可选地,上述根据多个短语向量以及该图卷积层输出的各候选类别向量,得到该待分类文本的多个特征向量,包括:

S401、基于各候选类别向量以及各短语向量,确定各候选类别相对于各短语的权重。

其中,预先训练得到的文本分类模型中的标签注意力层参数(w

其中,b

在该标签注意力层中的各全连接层输出各候选类别特征(g

其中,i的取值为1-n,n表示短语向量的个数,通过公式(2),可得到各候选类别相对于各短语的权重(β

举例来说,假设P取值为2,即有2个候选类别向量,n取值为3,即有3个短语向量,则第一候选类别向量相对于第一短语向量、第二短语向量以及第三短语向量的权重为β

S402、根据各候选类别相对于各短语的权重以及各短语向量,得到该待分类文本的多个特征向量。

可分别将各候选类别相对于各短语的权重(β

继续上述举例来说,将第一候选类别向量相对于第一短语向量权重β

可选地,上述将多个短语向量以及该待分类文本对应的层级标签结构中的各候选类别向量输入该标签注意力层,由该标签注意层根据多个短语向量以及该图卷积层输出的各候选类别向量,得到该待分类文本的多个特征向量之前,该方法还包括:由该图卷积层对该层级标签结构中的各候选类别进行节点聚合处理,得到各候选类别向量。

其中,该图卷积层是一种图卷积网络(Graph Convolutional Network,GCN),通过该图卷积层可对该层级标签结构中各候选类别进行向量表示。具体的,如图3所示的层级标签结构中具有连接关系的节点(候选类别)作为彼此的邻居节点,该图卷积层可把中心节点的特征以及与该中心节点具有连接关系的各邻居节点的特征进行聚合,得到该中心节点的特征,该中心节点的特征可用与该中心节点对应的候选特征向量进行表征,该图卷积层可以捕获到节点与节点之间的层次关系以及依赖关系,可以更准确的表达各节点对应的候选特征向量。

当该图卷积层在有多层(如I层)的情况下时,后一层(l+1)基于前一层(l)上的候选类别向量的基础上进行更新,具体处理过程如下:

其中,

图5为本申请实施例提供的又一种文本分类方法的流程示意图。如图5所示,可选地,上述图2中的短语注意力子模型可包括:卷积层、双向长短期记忆层、以及短语注意力层;上述将各词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到该待分类文本对应的多个短语向量,包括:

S501、将各词向量输入该卷积层,得到短语序列特征。

其中,该卷积层可包括多个尺度为h的滤波器,将各词向量(x

尺度为h的滤波器按照预设的步长对该词向量序列进行卷积,得到短语序列特征的过程如下:

c

其中,j,b

S502、将该短语序列特征输入该双向长短期记忆层,进行短语上下文语义特征提取,得到包含该上下文语义的短语语义特征。

其中,该双向长短期记忆(Bi-LSTM)层可从左到右读取该短语序列特征,用

其中,h

S503、将该短语语义特征输入该短语注意力层,得到该待分类文本对应的多个短语向量。

可选地,根据该短语语义特征,确定表示向量;根据该表示向量,确定该短语语义特征的得分;根据该短语语义特征的得分以及该短语语义特征,得到该待分类文本对应的多个短语向量。

其中,预先对初始的文本分类模型进行训练,可以得到短语注意力层参数(w

μ

其中,b

在该短语注意力层中的全连接层输出表示向量(μ

最后将各短语语义特征与其对应的得分进行如下操作:

v

其中,v

可选地,上述将待分类文本中的至少一个词语分别转换成至少一个词向量,包括:将待分类文本中的至少一个词语输入预先训练得到的嵌入模型,得到各词语对应的词向量。

其中,图2中的嵌入模型是文本分类模型之外的一个模型,当然也可以作为该文本分类模型中的一个模型,本申请不对其进行限定。一般情况下,将嵌入模型以及文本分类模型作为两个独立的模型分别进行训练,对初始的嵌入模型进行训练时,可以通过训练word2vec模型得到。具体的,该word2vec模型可包括跳字模型(skip-gram)和连续词袋模型(continuous bag of words,CBOW),跳字模型对应的训练样本包括的特征为中心词,标签为中心词的上下文词;连续词袋模型对应的训练样本包括的特征为中心词的上下文词,标签为中心词,其中,该训练样本可从百科数据中获取。

不管是跳字模型还是连续词袋模型,在满足停止训练条件后,都可得到该嵌入模型,根据该嵌入模型中的词嵌入矩阵,可以得到该待分类文本中各词语对应的词向量。

下述对初始文本分类模型训练的过程进行简单描述。在一种可实现的实施例中,对初始文本分类模型中的初始短语注意力子模型以及初始标签注意力子模型作为一个整体进行训练。将第一训练样本输入该初始文本分类模型的初始短语注意力子模型中,该第一训练样本中的特征为文本对应的词向量,标签为该文本对应的类别,该类别为层级标签结构中所包含的候选类别中的一种,同时将该层级标签结构输入该初始文本分类模型的初始标签注意力子模型中,该初始文本分类模型可输出该文本所属分类类别的预测结果

其中,N为文本长度,C为文本的类别个数。

图6为本申请实施例提供的一种文本分类装置的结构示意图。如图6所示,该装置可以包括:

转换模块601,用于将待分类文本中的至少一个词语分别转换成至少一个词向量;

第一输入模块602,用于将各词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到该待分类文本对应的多个短语向量;

第二输入模块603,用于将多个短语向量以及该待分类文本对应的层级标签结构中的各候选类别输入该文本分类模型中的标签注意力子模型,得到该待分类文本的多个特征向量;

确定模块604,用于基于该待分类文本的各特征向量,得到该待分类文本的分类结果。

可选地,该标签注意力子模型包括:图卷积层、标签注意力层;

相应地,第二输入模块603,具体用于将多个短语向量以及待分类文本对应的层级标签结构中的各候选类别向量输入标签注意力层,由该标签注意层根据多个短语向量以及图卷积层输出的各候选类别向量,得到待分类文本的多个特征向量。

可选地,第二输入模块603,还具体用于基于各候选类别向量以及各短语向量,确定各候选类别相对于各短语的权重;根据各候选类别相对于各短语的权重以及各短语向量,得到该待分类文本的多个特征向量。

可选地,该装置还包括:处理模块,用于由该图卷积层对层级标签结构中的各候选类别进行节点聚合处理,得到各候选类别向量。

可选地,该短语注意力子模型包括:卷积层、双向长短期记忆层、以及短语注意力层;

相应地,第一输入模块602,具体用于将各词向量输入卷积层,得到短语序列特征;将该短语序列特征输入双向长短期记忆层,进行短语上下文语义特征提取,得到包含上下文语义的短语语义特征;将短语语义特征输入短语注意力层,得到待分类文本对应的多个短语向量。

可选地,第一输入模块602,还具体用于根据该短语语义特征,确定表示向量;根据表示向量,确定短语语义特征的得分;根据短语语义特征的得分以及短语语义特征,得到待分类文本对应的多个短语向量。

可选地,转换模块601,具体用于将待分类文本中的至少一个词语输入预先训练得到的嵌入模型,得到各词语对应的词向量。

上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Digital Signal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。

图7为本申请实施例提供的一种电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器701、存储介质702和总线703,存储介质702存储有处理器701可执行的机器可读指令,当该电子设备运行时,处理器701与存储介质702之间通过总线703通信,处理器701执行机器可读指令,以执行上述文本分类方法的步骤。具体实现方式和技术效果类似,这里不再赘述。

可选地,本申请还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述文本分类方法的步骤。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

相关技术
  • 文本分类方法、文本分类装置、计算机设备及存储介质
  • 一种文本分类方法、装置、设备及存储介质
技术分类

06120112623817