掌桥专利:专业的专利平台
掌桥专利
首页

数据分类方法、装置、电子设备、存储介质及程序产品

文献发布时间:2024-04-18 19:44:28


数据分类方法、装置、电子设备、存储介质及程序产品

技术领域

本发明实施例涉及信息处理领域,尤其涉及一种数据分类方法、装置、电子设备、存储介质及程序产品。

背景技术

大数据背景下,各行各业的各个数据中心汇聚了海量的数据资产,这些数据在各个数据中心以结构化和非结构化形式进行存储。对这些数据进行分类分级,能够有效实施数据安全管理,具体可以将数据按照不同的属性、特征等进行分类,对不同分类定义不同的级别从而采取不同的保护级别措施。

目前常见的分类分级系统中,对结构化数据主要采用的分类方法为:扫描库表数据,用预先配置的正则规则进行匹配,以对这些结构化数据进行分类分级。该分类方法在用户个人信息如姓名、手机号、地址等字段实现的效果表现良好,但是,可以理解分类分级的规范定义往往不止于用户个人信息,还有相当多的子类,该方法由于正则表达式的适用性的局限,无法达到对所有子类的自动化处理。另外,该方法也无法适用于非结构化数据的处理。

由此可见,目前亟需一种更加简单方便的交互方法。

发明内容

本发明实施例提供一种数据分类方法、电子设备、存储介质及计算机程序产品,以至少部分解决相关技术中存在的问题。

本发明实施例第一方面提供了一种数据分类方法,所述方法包括:

对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据;

根据所述待分类数据的文本数据和预先训练的文本分类模型,得到所述待分类数据的第一分类结果;

根据所述待分类数据的资源目录数据和各子类描述文本数据,得到所述待分类数据的第二分类结果;所述各子类描述文本数据是根据所述待分类数据对应的分类分级判定规范表中的子类描述文本得到的;

根据所述第一分类结果和所述第二分类结果,确定所述待分类数据所属子类。

可选地,在所述待分类数据为结构类数据的情况下,对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据,包括:

获取所述待分类数据的库表字段已有注释,确定为资源目录数据;

获取所述待分类数据的字段值,确定为数据文本。

可选地,在所述待分类数据为非结构数据的情况下,对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据,包括:

获取所述待分类数据的文件存储目录和文件名确定为资源目录数据;

对所述待分类数据的文本内容进行切分,得到分片文本,将所述分片文本确定为文本数据。

可选地,所述方法还包括:

获取所述待分类数据的分类分级判定规范表;

获取所述分类分级判定规范表中的各个子类及各个子类分别对应的子类描述文本;

对所述子类描述文本进行分词处理,得到各个子类分别对应的描述文本分词集合;

将每个子类对应的描述文本分词集合作为各子类描述文本数据。

可选地,根据所述待分类数据的文本数据和预先训练的文本分类模型,得到所述待分类数据的第一分类结果,包括:

将所述待分类文本数据的文本数据转换为句向量;

将所述句向量输入预先训练的文本分类模型,得到所述待分类数据的第一分类结果;

所述文本分类模型是基于带分类标签的样本文本数据对语义理解模型训练得到的。

可选地,根据所述待分类数据的资源目录数据和各子类描述文本数据,得到所述待分类数据的第二分类结果,包括:

将所述待分类数据的资源目录数据转换为第一文本特征向量;

将所述各子类描述文本数据转换为第二文本特征向量;

采用词袋模型对所述第一文本特征向量和所述第二文本特征向量,进行数值化向量表示,得到第一数值化向量和第二数值化向量;

基于所述第一数值化向量和第二数值化向量,采用余弦相似度比较方式,确定所述待分类数据的资源目录数据和各子类描述文本数据的相似度值;

根据所述待分类数据的资源目录数据和各子类描述文本数据的相似度值,确定第二分类结果。

本发明实施例第二方面提供了一种数据分类装置,所述装置包括:

数据处理模块,用于对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据;

第一分类模块,用于根据所述待分类数据的文本数据和预先训练的文本分类模型,得到所述待分类数据的第一分类结果;

第二分类模块,用于根据所述待分类数据的资源目录数据和各子类描述文本数据,得到所述待分类数据的第二分类结果;所述各子类描述文本数据是根据所述待分类数据对应的分类分级判定规范表中的子类描述文本得到的;

结果确定模块,用于根据所述第一分类结果和所述第二分类结果,确定所述待分类数据所属子类。

可选地,在所述待分类数据为结构类数据的情况下,所述数据处理模块,具体用于:

获取所述待分类数据的库表字段已有注释,确定为资源目录数据;

获取所述待分类数据的字段值,确定为数据文本。

可选地,在所述待分类数据为非结构数据的情况下,所述数据处理模块,具体用于:

获取所述待分类数据的文件存储目录和文件名确定为资源目录数据;

对所述待分类数据的文本内容进行切分,得到分片文本,将所述分片文本确定为文本数据。

可选地,所述装置还包括:

第一获取模块,用于获取所述待分类数据的分类分级判定规范表;

第二获取模块,用于获取所述分类分级判定规范表中的各个子类及各个子类分别对应的子类描述文本;

分词模块,用于对所述子类描述文本进行分词处理,得到各个子类分别对应的描述文本分词集合;

确定模块,用于将每个子类对应的描述文本分词集合作为各子类描述文本数据。

可选地,所述第一分类模块,具体用于:

将所述待分类文本数据的文本数据转换为句向量;

将所述句向量输入预先训练的文本分类模型,得到所述待分类数据的第一分类结果;

所述文本分类模型是基于带分类标签的样本文本数据对语义理解模型训练得到的。

可选地,所述第二分类模块,具体用于:

将所述待分类数据的资源目录数据转换为第一文本特征向量;

将所述各子类描述文本数据转换为第二文本特征向量;

采用词袋模型对所述第一文本特征向量和所述第二文本特征向量,进行数值化向量表示,得到第一数值化向量和第二数值化向量;

基于所述第一数值化向量和第二数值化向量,采用余弦相似度比较方式,确定所述待分类数据的资源目录数据和各子类描述文本数据的相似度值;

根据所述待分类数据的资源目录数据和各子类描述文本数据的相似度值,确定第二分类结果。

本发明实施例第三方面提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现如本发明第一方面所述的数据分类方法。

本发明实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现如本发明第一方面所述的数据分类方法。

本发明实施例第五方面提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本发明第一方面所述的数据分类方法。

本发明实施例中,根据待分类数据的文本数据得到第一分类结果,并且,根据待分类数据的资源目录数据得到第二分类结果,再结合第一分类结果和第二分类结果确定待分类数据所属子类。

本发明实施例提供的技术方案,不依赖正则表达式,不仅可以对结构类数据进行分类,也可以对非结构类数据进行分类,并且,本发明实施例提供的技术方案中,各子类描述文本数据是根据所述待分类数据对应的分类分级判定规范表中的子类描述文本得到的,基于待分类数据的资源目录数据和各子类描述文本数据,得到的待分类数据的第二分类结果,可以对分级分类判定规范表包括的所有子类进行扫描,以准确地确定出待分类数据的第二分类结果,进而准确地确定出待分类数据所属子类。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种数据分类方法的流程图;

图2是本发明实施例的另一种数据分类方法的流程图;

图3是本发明实施例的一种数据分类装置的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

具体的,本发明实施例提出了一种数据分类方法,参照图1,示出了本发明实施例的一种数据分类方法的流程图,所述方法包括以下步骤:

S101,对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据。

本发明实施例中,待分类数据可以为数据库中的数据。通常,待分类数据为某一个行业相关的数据,例如:图书数据库、人力资源管理数据库等。

本发明实施例中,待分类数据的文本数据,指的是待分类数据中包括的文本主体,例如:在待分类数据为数据库中的数据表的情况下,文本数据指的是各个字段对应的具体文本内容。

本发明实施例中,资源目录数据指的是待分类数据中包括的各个数据库、数据表或者字段的已有注释,或者文件的存储目录和文件名。

本发明实施例中,资源目录数据,一定程度上反应了待分类数据的文本数据对应的描述信息以及注释信息。

S102,根据所述待分类数据的文本数据和预先训练的文本分类模型,得到所述待分类数据的第一分类结果。

本发明实施例中,文本分类模型可以为语义理解模型,该模型可以提前学习样本文本数据和各个数据分类之间的对应关系。

本发明实施例中,第一分类结果表征:根据待分类数据的文本内容进行分类得到的分类结果。

S103,根据所述待分类数据的资源目录数据和各子类描述文本数据,得到所述待分类数据的第二分类结果。

其中,所述各子类描述文本数据是根据所述待分类数据对应的分类分级判定规范表中的子类描述文本得到的。

本发明实施例中,可以先获取待分类数据相对应的分类分级判定规范表,再从该分类分级判定规范表中获取到各个子类的描述文本。

优选地,本发明实施例中,可以获取该分类分级判定规范表中最小子类的描述文本,以得到更小粒度的分类结果。

本发明实施例中,待分类数据相对应的分类分级判定规范表可以根据待分类数据具体所属行业,按照行业常见分类分级判定规范得到。

本发明实施例中,考虑到数据库和文件库的管理特点之一为:在数据库中通过各个文本内容对应的字段、数据表或者数据库的已有注释可以反映对应的文本内容的描述信息以及注释信息,在文件库中,各个文件的文件名以及存储目录也可以反映该文件内容的描述信息以及注释信息。因此,本发明实施例中提出:根据待分类数据的资源目录数据(可以反映数据文本的描述信息以及注释信息)和各子类描述文本数据进行对比,得到第二分类结果。

本发明实施例第二分类结果表征:待分类数据的描述信息以及注释信息与各子类描述文本的相关性。

S104,根据所述第一分类结果和所述第二分类结果,确定所述待分类数据所属子类。

本发明实施例中,可以根据权重计算和阈值设定对第一分类结果和第二分类结果进行计算,得到最终的分类结果,以确定所述待分类数据所属子类

具体的,可以由技术人员根据经验以及需求设定第一分类结果的权重和第二分类结果的权重,还可以由技术人员根据经验以及需求设定第一分类结果的置信阈值和第二分类结果的置信阈值。

具体地,在本发明一种可选的实施方式中,提供了另一种数据分类方法的流程图,如图2所示,所述方法包括以下步骤:

S201,对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据。

本发明实施例中,考虑到结构性数据和非结构数据各自的特点,具体提出:

在所述待分类数据为结构数据的情况下,所述步骤S201包括以下子步骤:

S2011A,获取所述待分类数据的库表字段已有注释,确定为资源目录数据。

本发明实施例中,结构化数据指的是数据库形式的数据。

本发明实施例中,对于数据库接入方式采集到的结构化数据,可以获取该数据库的库/表/字段的已有注释,并对该数据库的库/表/字段的已有注释进行拼接,得到资源目录数据。

S2012A,获取所述待分类数据的字段值,确定为数据文本。

本发明实施例中,在待分类数据为数据表或者数据集或者数据库的情况下,可以根据待分类数据的字段值集合,得到数据文本。

本发明实施例中,考虑到同一个数据表或者数据集记录的文本数据一般对应同一个主题,因此,可以以该数据表或者数据集为单位对该数据进行分类。

优选地,本发明实施例中,考虑到同一个数据表或者数据集记录的文本数据一般对应同一个主题,因此各个字段对应的数据具有一定的相似性,因此,本发明实施例中,针对每个数据表或者数据集可以随机采集预设数量的数据行,得到待分类数据的字段值集合。

优选地,本发明实施例中,还可以对获取到的字段值集合进行聚合,得到该字段值集合中的出现频率较高的字段值作为中心字段值,将该中心字段值作为数据文本。

示例地,对于某数据表,可以获取该数据表的数据表注释作为资源目录数据,并随机获取该数据表中的100行数据,作为数据文本。

在所述待分类数据为非结构数据的情况下,所述步骤S201包括以下子步骤:

S2011B,获取所述待分类数据的文件存储目录和文件名确定为资源目录数据。

S2012B,对所述待分类数据的文本内容进行切分,得到分片文本,将所述分片文本确定为文本数据。

本发明实施例中,非结构化数据指的是,文件库形式的数据。

本发明实施例中,对于文件库接入方式采集到的非结构化数据,可以将文件的存储目录和文件名作为资源目录数据。

本发明实施例中,在待分类数据为文本文件形式的数据情况下,可以按照设定分段阈值对该文本文件的文件内容进行切分,得到多个分片文本,再对每个分片文本进行格式处理,以处理乱码、标点、特殊符号等问题,最后将各个分片文本确定为文本数据。

优选地,本发明实施例中,可以将各个分片文本输入阅读理解模型,获取到该待分类数据的文本内容的摘要信息或者关键词信息,将该摘要信息或者关键词信息确定为文本数据。

优选地,本发明实施例中,在得到待分类数据的文本数据之后,还可以先采用正则表达式判定其分类标签。从而,对于一些简单、规范的文本数据,可以直接采用正则表达式对其分类进行判定,无需后续步骤的判定。对于正则表达式无法进行判定的文本数据,则需采用后续步骤记性判定。

S202,根据所述待分类数据的文本数据和预先训练的文本分类模型,得到所述待分类数据的第一分类结果。

具体的,文本分类模型可以针对每一个子类,计算待分类数据的文本数据属于该子类的概率,从而得到待分类数据的文本数据属于任意一个子类的概率的排名。

具体的,本发明实施例中,可以设置文本分类模型按照输出待分类数据的文本数据分别属于前N个子类的概率,从而,第一分类结果可以表示为文本数据分别属于前N个子类的概率P1、P2、P3……

具体的,本发明实施例中,所述步骤S202可以包括以下子步骤:

S2021,将所述待分类文本数据的文本数据转换为句向量。

S2022,将所述句向量输入预先训练的文本分类模型,得到所述待分类数据的第一分类结果。

其中,所述文本分类模型是基于带分类标签的样本文本数据对语义理解模型训练得到的。

具体的,本发明实施例中,将已确定分类的文本数据作为样本文本数据,将该样本文本数据的分类作为样本标签。

本发明实施例中,本发明实施例中,文本分类模型是基于自然语言处理(NaturalLanguageProcessing,NLP)的神经网络模型。

本发明实施例中,可以从已确定分类分级的数据资源库通过数据或者文件库接入的方式,获取到样本数据,再将获取到的数据处理为行格式的样本数据,其中每行的第一列为分类编码,第二列为样本数据文本。

本发明实施例中,语义理解模型可以为基于Ernie的预训练文本分类模型ErnieFor Sequence Classification。本发明实施例中,可以采用基于Entailment任务的小样本训练方法,将NLP任务重新表述为entailment任务。

本发明实施例中,在模型训练的过程中,可以将样本文本数据表示成句向量,以样本文本数据的样本标签分类的概率为最大期望值,对该语义理解模型进行训练。

具体的,本发明实施例中,可以加载基于Ernie的预训练文本分类模型Ernie ForSequence Classification和分词器Tokenizer,并载入词嵌入模型,利用分词器将样本文本数据转化为数字,并调整批大小batch_size和文本最大截断长度max_seq_length进行数据加载,设置Adam的初始学习速率learning_rate和要执行的训练总数epochs,基于Entailment任务在Ernie For Sequence Classification最后一层叠加全连接层,将num_classes设置为2,将NLP Fine-tune任务转换统一转换为Entailment 2分类任务,定义训练所需的优化器、损失函数、评价指标等,进行模型训练。

本发明实施例中提出的文本分类模型采用基于Entailment的小样本训练方法,使得该模型在较小样本场景下也能有良好的判定精确度。

本发明实施例中,文本分类模型对文本数据属于每一个分类的概率进行分析预测,得到文本分类模型分别属于各个分类的概率,从而可以输出概率最高的前N个分类,作为第一分类结果。

本发明实施例中,N的取值可以由技术人员根据经验或者需求进行设定。

本发明实施例中,通过模型训练,采用人工智能技术对待分类数据的分类判定进行辅助,提高了分类分级任务的智能化程度,大量减少人工分类分级的工作量。本发明实施例中,通过训练基于NLP的文本分类模型,并且采用小样本训练方法进行模型训练,在较小样本场景下也能有良好的判定精确度。

S203,获取所述待分类数据的分类分级判定规范表。

S204,获取所述分类分级判定规范表中的各个子类及各个子类分别对应的子类描述文本。

S205,对所述子类描述文本进行分词处理,得到各个子类分别对应的描述文本分词集合。

S206,将每个子类对应的描述文本分词集合作为各子类描述文本数据。

本发明实施例中,所述步骤S203~206可以在步骤S201之前执行,也可以在步骤S201之后执行。

本发明实施例中,可以获取待分类数据的分类分级判定规范文本中,最小的子类的编码和各个子类分别对应的子类描述文本,将其处理成分类分级判定规范表。

具体的,本发明实施例中,可以对各个子类描述文本分别进行分词处理,得到各个子类分别对应的描述文本分词集合。进而可以将待分类数据的分类分级判定规范表预处理为{分类编码,分词集合}格式的分类分级规范表,每行第一列为分类编码,第二列为采用分词工具对该子类对应的描述文本分词集合。

优选地,本发明实施例中,可以筛去各个描述文本分词集合中无实际意义的部分分词,如“等”“和”等虚词,仅保留实体含义的分词,以提高后续计算效率。

S207,根据所述待分类数据的资源目录数据和各子类描述文本数据,得到所述待分类数据的第二分类结果。

具体地,本发明实施例中,所述步骤S207可以包括以下子步骤:

S2071,将所述待分类数据的资源目录数据转换为第一文本特征向量。

S2072,将所述各子类描述文本数据转换为第二文本特征向量。

S2073,采用词袋模型对所述第一文本特征向量和所述第二文本特征向量,进行数值化向量表示,得到第一数值化向量和第二数值化向量。

S2074,基于所述第一数值化向量和第二数值化向量,采用余弦相似度比较方式,确定所述待分类数据的资源目录数据和各子类描述文本数据的相似度值。

S2075,根据所述待分类数据的资源目录数据和各子类描述文本数据的相似度值,确定第二分类结果。

本发明实施例中,可以对待分类数据的资源目录数据和各子类描述文本数据分别进行相似度判定,以得到待分类数据的资源目录数据和各子类描述文本数据的相似度,在基于相似度进行排序,从而,本发明实施例中,第二分类结果可以输出相似度最高的前M个子类描述文本数据对应的分类。第二分类结果可以表示相似度最高的前M个子类描述文本数据对应的分类以及相似度Q1、Q2、Q3……

本发明实施例中,M的取值以由技术人员根据经验或者需求进行设定。其中,M的取值和N的取值可以相同,也可以不同。

S208,根据所述第一分类结果和所述第二分类结果,确定所述待分类数据所属子类。

具体的,本发明实施例中,可以由技术人员根据经验或者需求设定第一分类结果和第二分类结果的权重以及第一分类结果和第二分类结果的置信阈值。

将第一分类结果中包括的多个可能的类别中,概率大于第一分类结果对应的置信阈值的分类结果,作为第一可信类别,以及将第二分类结果中包括的多个可能的类别中,相似度大于第二分类结果对应的置信阈值的分类结果,作为第二可信类别。

优选地,本发明实施例中,可以将第一分类结果和第二分类结果中包括的非可信结果对应的概率或者相似度设置为零。

进而,本发明实施例中,可以按照第一可信类别对应的概率和第二可信类别中与该类别相同的类别对应的相似度,综合计算得到最终结果。

本发明实施例中,通过对待分类数据的预处理和分类分级判定规范文本的采集和数据预处理,得到待分类数据的文本数据和资源目录数据以及分类分级判定规范表。从而可以基于文本分类模型和文本数据判定得到第一分类结果。本发明实施例中,还考虑到数据库和文件库的管理特点,提出根据待分类数据的资源目录数据,与分类分级判定规范表中的各子类描述文本数据进行词向量的相似度比较,得到第二分类结果。最终基于第一分类结果和第二分类结果的权重计算和阈值设定得到最终分类结果,确定待分类数据所属子类。

由此,本发明实施例解决了目前正则表达式适用性的局限,可以达到对待分类数据可能所属的所有子类进行判定。另外,本发明实施例中,对非结构化数据尤其是应用性文件的判定也实现了智能化的判定。由此,本发明实施例可以整体上提高分类判定任务的智能化程度,本发明实施例中,还通过模型训练实现了人工智能技术对分类判定的辅助作用,大量减少人工分类分级的工作量,对于各个行业的数据分类可以通用。

本发明实施例提供的技术方案可以应用于数据安全管理技术领域,具体的,本发明实施例中,可以基于分类编码对各个子类的安全等级进行分级,因此,在得到待分类数据所属的子类的同时,也可以确定该待分类数据的安全等级,从而可以基于该该待分类数据的安全等级对该数据进行安全管理。

本发明实施例提供的技术方案还可以应用于:数据中台数据资产管理、业务系统数据分类分级管理、业务系统数据安全工具支持等。可以适用于目前常见的大数据管理平台,可以应用于需要对数据分类分级综合进行数据安全管控的场景,使分类分级判定工具智能化、自动化。

基于同一发明构思,本发明实施例提供一种数据分类装置。参考图3,图3是本发明实施例提供的数据分类装置的示意图。如图3所示,该装置包括:

数据处理模块301,用于对待分类数据进行处理,确定待分类数据的文本数据和资源目录数据;

第一分类模块302,用于根据所述待分类数据的文本数据和预先训练的文本分类模型,得到所述待分类数据的第一分类结果;

第二分类模块303,用于根据所述待分类数据的资源目录数据和各子类描述文本数据,得到所述待分类数据的第二分类结果;所述各子类描述文本数据是根据所述待分类数据对应的分类分级判定规范表中的子类描述文本得到的;

结果确定模块304,用于根据所述第一分类结果和所述第二分类结果,确定所述待分类数据所属子类。

可选地,在所述待分类数据为结构类数据的情况下,所述数据处理模块301,具体用于:

获取所述待分类数据的库表字段已有注释,确定为资源目录数据;

获取所述待分类数据的字段值,确定为数据文本。

可选地,在所述待分类数据为非结构数据的情况下,所述数据处理模块301,具体用于:

获取所述待分类数据的文件存储目录和文件名确定为资源目录数据;

对所述待分类数据的文本内容进行切分,得到分片文本,将所述分片文本确定为文本数据。

可选地,所述装置还包括:

第一获取模块,用于获取所述待分类数据的分类分级判定规范表;

第二获取模块,用于获取所述分类分级判定规范表中的各个子类及各个子类分别对应的子类描述文本;

分词模块,用于对所述子类描述文本进行分词处理,得到各个子类分别对应的描述文本分词集合;

确定模块,用于将每个子类对应的描述文本分词集合作为各子类描述文本数据。

可选地,所述第一分类模块302,具体用于:

将所述待分类文本数据的文本数据转换为句向量;

将所述句向量输入预先训练的文本分类模型,得到所述待分类数据的第一分类结果;

所述文本分类模型是基于带分类标签的样本文本数据对语义理解模型训练得到的。

可选地,所述第二分类模块303,具体用于:

将所述待分类数据的资源目录数据转换为第一文本特征向量;

将所述各子类描述文本数据转换为第二文本特征向量;

采用词袋模型对所述第一文本特征向量和所述第二文本特征向量,进行数值化向量表示,得到第一数值化向量和第二数值化向量;

基于所述第一数值化向量和第二数值化向量,采用余弦相似度比较方式,确定所述待分类数据的资源目录数据和各子类描述文本数据的相似度值;

根据所述待分类数据的资源目录数据和各子类描述文本数据的相似度值,确定第二分类结果。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行时实现上述任一实施例所述的数据分类方法中的步骤。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述任一实施例所述的数据分类方法中的步骤。

本发明实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述任一实施例所述的数据分类方法。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种数据分类方法、电子设备、存储介质及计算机程序产品,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 图像分类方法及装置、电子设备、计算机程序及存储介质
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 目标检测方法和装置、电子设备、存储介质、程序产品
  • 行人再识别方法和装置、电子设备、存储介质、程序产品
  • 文章分类方法、装置、电子设备、存储介质及程序产品
  • 数据分类方法、装置、设备、存储介质及计算机程序产品
技术分类

06120116302768