掌桥专利:专业的专利平台
掌桥专利
首页

数据分类分级方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 20:01:23


数据分类分级方法、装置、电子设备及存储介质

技术领域

本发明涉及数据处理技术领域,尤其涉及一种数据分类分级方法、装置、电子设备及存储介质。

背景技术

数据分类分级是按照分类分级规则,确定海量的业务数据的数据类别和数据级别,从而使业务系统确定业务数据的处理方式。

现有的分类分级方式,通常采用关键字、正则表达式和数据字典等技术,结合人工校验实现数据的分类分级。

但是,现有方式仅能对具有明显格式规律的数据集进行分类分级,数据分类分级的局限性较大,且数据分类分级依赖于人工,数据分类分级的效率和准确度也难以保证,亟待改进。

发明内容

本发明提供了一种数据分类分级方法、装置、电子设备及存储介质,提高了数据分类分级的泛化性、效率和准确度。

根据本发明的一方面,提供了一种数据分类分级方法,所述方法包括:

获取待分类分级数据集中至少一个字段的字段名称和对应的字段值;

在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述;

获取规则表格中至少一个规则的规则类别、规则级别和字段类别;其中,规则用于确定待分类分级数据集的处理方式;

针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别。

根据本发明的另一方面,提供了一种数据分类分级装置,所述装置包括:

待分类分级数据集获取模块,用于获取待分类分级数据集中至少一个字段的字段名称和对应的字段值;

字段描述确定模块,用于在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述;

规则类别获取模块,用于获取规则表格中至少一个规则的规则类别、规则级别和字段类别;其中,规则用于确定待分类分级数据集的处理方式;

数据分类分级模块,用于针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别。

根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据分类分级方法。

根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据分类分级方法。

本发明实施例的技术方案,通过获取待分类分级数据集的字段名称和对应的字段值,在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述,获取规则表格中至少一个规则的规则类别、规则级别和字段类别,针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别,解决了现有方式仅能对具有明显格式规律的数据集进行分类分级,存在数据分类分级的局限性较大的问题,提高了数据分类分级的泛化性,同时,也解决了数据分类分级依赖于人工,数据分类分级的效率和准确度也难以保证的问题,提高了数据分类分级的效率和准确度。

应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例一提供的一种数据分类分级方法的流程图;

图2是根据本发明实施例二提供的一种数据分类分级方法的流程图;

图3是根据本发明实施例二提供的一种数据分类分级方法的流程图;

图4是根据本发明实施例三提供的一种数据分类分级方法的流程图;

图5是根据本发明实施例三提供的一种数据分类分级方法的流程图;

图6是根据本发明实施例四提供的一种数据分类分级装置的结构示意图;

图7是实现本发明实施例的数据分类分级方法的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

图1为本发明实施例一提供的一种数据分类分级方法的流程图。本发明实施例可适用于对业务系统的业务数据进行分类分级的情况,该方法可以由数据分类分级装置来执行,该数据分类分级装置可以采用硬件和/或软件的形式实现,该数据分类分级装置可配置于承载数据分类分级功能的电子设备中。

参见图1所示的数据分类分级方法,包括:

S101、获取待分类分级数据集中至少一个字段的字段名称和对应的字段值。

业务系统中具有海量的业务数据,不同的业务数据需采用不同的处理方式。由此,需要对业务数据进行分类分级,以确定业务数据对应的处理方式。待分类分级数据集可以为业务系统中需要进行分类分级的数据集。示例性的,待分类分级数据集的数据形式可以为数据库表、Excel表格或文本等形式,在此不做限定。可选的,待分类分级数据可以包括至少一个字段。一个字段可以包含一个字段名称和对应的至少一个字段值。其中,字段名称可以用于标识属于同一属性的字段值。由于不同业务系统的配置方式不同,不同业务系统中属于同一属性的字段名称可能不同。示例性的,字段值的属性可以为行业信息;在业务系统1中,行业信息对应的字段名称可以为“hangye”;在业务系统2中,行业信息对应的字段名称可以为“HY”;在业务系统3中,行业信息对应的字段名称可以为“Industry”;在业务系统4中,行业信息对应的字段名称可以为“02”。其中,字段值可以为字段对应的业务数据的具体内容。参见前述示例,字段值可以为“能源”、“餐饮”、“服务”或“采矿业”等。

具体的,可以对业务系统进行查询,获取业务系统中待分类分级数据集的字段名称和对应的字段值。

S102、在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述。

从数据集的实际内容角度上,待分类分级数据集可以包括内容数据集和元数据集。可以理解为,内容数据集与元数据集包含的实际内容不同。其中,内容数据集可以用于记录业务系统的业务数据。内容数据集包括字段名称和对应的字段值。元数据集可以用于对业务系统的业务数据进行描述。元数据集包含字段名称,但对应的字段值为空。单个字段对应的字段值可以理解为具有同一字段名称的字段值。可选的,在内容数据集中,单个字段对应的字段值可以为内容数据集中同一行或者同一列的数据。字段描述可以为同一字段名称对应的字段值的属性。参见前述示例,字段描述可以为“行业信息”。

大语言模型可以用于对字段值的内容进行语义理解,推理字段值对应的属性。大语言模型经过海量且规格不同的自然语言文本的训练,能够充分理解自然语言的内在规律,可以辨析自然语言词汇含义,并且可以生成人类可读符合逻辑的对话。大语言模型可以将自然语言任务转化为对话任务,可以利用一套模型结构配合不同的微调参数应对各种各样的任务类型,同时,大语言模型也表现出了惊人的泛化和涌现能力。字段描述提示词可以用于提示大语言模型根据字段值的内容,推理字段值对应的字段描述。可选的,字段描述提示词可以包括需要进行描述的文本(即单个字段对应的字段值)和描述需求。示例性的,字段描述提示词可以为“请推测以下文本内容的属性、类型或用途:{Text}”;其中,{Text}为需要进行总结的文本,也即单个字段对应的字段值。可选的,字段描述提示词可以由技术人员预先生成并进行存储,可以在进行数据分类分级时进行调用。

具体的,可以对待分类分级数据集包含的实际内容进行检测,在检测到待分类分级数据集为内容数据集时,可以针对单个字段,获得预先生成的字段描述提示词。根据字段描述提示词,引导大语言模型,对单个字段对应的字段值进行语义理解,推理字段值的字段描述。

可选的,大语言模型可以为基于可迁移网络的自回归生成语言模型。能够根据一段文本推断下个单词的概率分布,并根据该分布确定下个单词。

示例性的,输入文本经过大语言模型的分词器得到其单词ID序列。单词序列经过大语言模型的嵌入层得到其单词嵌入序列。单词嵌入序列依次经过模型的所有词频块,得到下个单词的隐向量。下个单词的隐向量经过输出层得到下个单词的概率分布。选取概率最大的序号,作为下个单词的ID。

例如,可以采用以下公式,表征大语言模型计算计算流程:

其中,T

在本发明一个可选实施例中,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述,包括:针对单个字段,对内容数据集包含的字段值进行抽样,得到字段对应的字段值抽样结果;针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值抽样结果进行语义理解,得到字段值的字段描述。

字段值抽样结果可以为对单个字段对应的字段值的抽样结果。业务系统包含海量的业务数据。内容数据集中单个字段对应的字段值的数量非常多。对单个字段对应的字段值进行抽样,可以减少大语言模型的输入数据的数量。

具体的,可以针对单个字段,对内容数据集包含的字段值进行抽样,选取预设抽样数量的字段值,确定为字段对应的字段值抽样结果。可以针对单个字段,获取预先生成的字段描述提示词。可以根据字段描述提示词,引导大语言模型,对字段值抽样结果进行语义理解,推理字段值的字段描述。其中,预设抽样数量可以为预先设定的字段值的抽样数量。可选的,预设抽样数量可以由技术人员根据经验进行设定和调整。示例性的,预设抽样数量可以为5-10。

本方案通过对字段值进行预先抽样,得到字段对应的字段值抽样结果,采用大语言模型,对字段值抽样结果进行语义理解,确定字段值的字段描述,减少了大语言模型输入的字段值的数量,提高了大语言模型的数据处理效率;同时,也避免了输入的字段值的数量过多,大语言模型无法处理,提高了数据分类分级方法的容错性。

在本发明一个可选实施例中,在获取规则表格中至少一个规则的规则类别、规则级别和字段类别之前,还包括:在待分类分级数据集为元数据集时,针对单个字段,获取字段名称和对应的字段描述;针对单个字段,对字段名称、字段描述和字段值进行拼接,得到字段的字段拼接结果;其中,字段值为空。

元数据集可以用于对业务系统的业务数据进行描述。元数据集包含字段名称和对应的字段描述,但对应的字段值为空。元数据集具有字段对应的字段描述,可以直接使用,无需对字段描述进行推理。

具体的,在检测到待分类分级数据集为元数据集时,可以针对单个字段,获取字段名称和对应的字段描述。可以针对单个字段,采用内容分隔符,对字段名称、字段描述和字段值进行拼接,得到字段的字段拼接结果。

本方案通过在待分类分级数据集为元数据集时,直接获取字段名称和对应的字段描述,针对单个字段,对字段名称、字段描述和字段值进行拼接,得到了元数据集中字段的字段拼接结果,实现了对元数据集的分类分级,提高了元数据集分类分级的效率和准确度;此外,相较于内容数据集,元数据集的字段拼接结果的生成效率更高,提高了数据分类分级的灵活性。

S103、获取规则表格中至少一个规则的规则类别、规则级别和字段类别;其中,规则用于确定待分类分级数据集的处理方式。

规则表格可以作为数据分类分级的依据。规则表格可以来自于国标文件或行标文件。可选的,不同行业可以具有各自的规则表格。可选的,规则表格可以预先存储于数据库中。规则表格可以包括至少一个规则。规则可以用于确定待分类分级数据集的处理方式。一个规则可以包括规则类别、规则级别和字段类别。规则类别可以用于表征对某一行业的业务数据划分的类别。实质上,规则类别的划分是基于国标文件或行标文件。规则级别可以用于表征规则的重要程度、安全隐私程度或对业务系统的影响程度。一个规则类别可以对应一个规则级别。不同的规则级别对应的业务数据的处理方式不同。示例性的,规则级别可以为“1、2、3。”规则级别的数值越小,规则级别的安全隐私程度要求越高。例如,规则级别为3的业务数据,无需进行额外处理;规则级别为2的业务数据,需要进行脱敏处理;规则级别为1的业务数据,需要进行脱敏处理和加密处理。字段类别可以是对规则类别的进一步示例性描述。示例性的,规则类别可以为“鉴别辅助信息”;规则级别可以为3;字段类别可以为“动态口令”、“验证码”、“密码提示问答问题”和“声纹密码”等。

具体的,可以对数据库进行查询,获取规则表格中至少一个规则的规则类别、规则级别和字段类别。

S104、针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别。

数据类别可以是待分类分级数据集所属的类别。数据级别可以为待分类分级数据集所属的级别。数据级别可以用于表征待分类分级数据集的重要程度、安全隐私程度或对业务系统的影响程度。不同的数据级别具有不同的业务数据的处理方式。

具体的,可以针对单个字段,对字段名称、字段描述、对应的字段值进行向量化,得到字段对应的字段向量。可以对各规则的规则类别和字段类别进行向量化,得到各规则对应的规则向量。可以计算字段向量与各规则向量之间的相似度,并对单个字段向量与各规则向量之间的相似度进行排序,选择排序在前的至少一个规则,确定为字段对应的相似度较高的至少一个规则。可选的,可以采用欧氏距离、曼哈顿距离或余弦距离等方式,计算字段与各规则拼接结果之间的相似度。

示例性的,可以采用以下公式,计算字段向量:

式中,V

可以采用以下公式,计算规则向量:

式中,V

可以采用以下公式,计算字段向量与规则向量之间的相似度:

式中,S

可以采用以下公式,计算字段对应的相似度较高的K个规则:

式中,C

具体的,可以获取各字段对应的相似度较高的至少一个规则的规则类别和规则级别。可以将各规则类别,直接确定为待分类分级数据集的数据类别。可以将各规则类别对应的规则级别,直接确定为待分类分级数据集的数据级别。由此,可以根据待分类分级数据集的各字段对应的数据级别,对待分类分级数据集中各字段对应的字段值进行处理。

可选的,可以进一步对待分类分级数据集对应的各规则类别和规则级别的占比进行比较,将占比最大的规则类别和对应的规则级别确定为待分类分级数据集的数据类别和数据级别。由此,可以根据待分类分级数据集的数据级别对应的处理方式,对待分类分级数据集进行处理。

在本发明一个可选实施例中,所述针对单个所述字段,根据所述字段的字段名称、字段描述、对应的字段值、各所述规则的规则类别和字段类别,计算所述字段与各所述规则之间相似度,得到所述字段对应的相似度较高的至少一个所述规则,包括:针对单个字段,对字段名称、字段描述和字段值进行拼接,得到字段的字段拼接结果;针对单个字段,获取字段分类提示词,并根据字段分类提示词,采用大语言模型,对字段拼接结果进行语义理解,得到单个字段的初始类别;针对单个规则,对规则类别和字段类别进行拼接,得到规则对应的规则拼接结果;针对单个字段的初始类别,计算初始类别和各规则拼接结果之间相似度,得到字段对应的相似度较高的至少一个规则。

字段拼接结果可以用于代表内容数据集单个字段的字段内容。其中,字段名称可以用于标识单个字段及单个字段对应的字段值。字段描述可以用于表征单个字段对应的字段值的属性。字段值可以用于表征单个字段对应的具体内容。

规则拼接结果可以用于代表规则表格中单个规则的具体内容。其中,规则类别可以用于标识单个规则对应的类别。字段类别可以是对规则类别的进一步示例性描述。

初始类别可以为大语言模型对待分类分级数据集进行初始分类的结果。字段分类提示词可以用于提示大语言模型根据字段拼接结果的内容,推理字段拼接结果对应的单个字段的初始类别。可选的,字段分类提示词可以包括字段拼接结果和字段分类需求。示例性的,字段分类提示词可以为“以下字段属于哪个类别:{field}”;其中,{field}为字段拼接结果。可选的,字段分类提示词可以由技术人员预先生成并进行存储,可以在进行数据分类分级时进行调用。

具体的,可以针对单个字段,采用内容分隔符,对字段名称、字段描述和字段值进行拼接,得到字段的字段拼接结果。可选的,单个字段可以对应至少一个字段值,采用字段值分隔符,对各字段值进行进一步分隔。

示例性的,内容分隔符可以为“

具体的,可以针对单个字段,获取预先生成的字段分类提示词。可以根据字段分类提示词,引导大语言模型,对字段拼接结果进行分类,得到字段拼接结果的类别,确定为单个字段的初始类别。

具体的,可以针对单个规则,采用规则分隔符,对规则类别和字段类别进行拼接,得到规则对应的规则拼接结果。可选的,单个规则可以对应至少一个字段类别,可以采用字段类别分隔符,对各字段类别进行进一步分隔。可选的,规则分隔符与内容分隔符可以相同,也可以不同。字段值分隔符与字段类别分隔符可以相同,也可以不同。具体根据技术人员的经验进行设定和调整。

示例性的,规则分隔符可以为“

具体的,可以针对单个字段的初始类别,对初始类别进行向量化,得到初始类别对应的字段向量。可以对各规则拼接结果进行向量化,得到规则拼接结果对应的规则向量。可以计算字段向量与各规则向量之间的相似度,并对单个字段向量与各规则向量之间的相似度进行排序,选择排序在前的至少一个规则,确定为字段对应的相似度较高的至少一个规则。可选的,可以采用欧氏距离、曼哈顿距离或余弦距离等方式,计算字段与各规则拼接结果之间的相似度。

示例性的,可以采用以下公式,计算字段向量:

式中,V

本方案通过生成字段拼接结果和规则拼接结果,利用拼接结果进行数据分类分级,进一步提高了数据分类分级的效率;同时,通过大语言模型,对字段拼接结果进行初始分类,利用初始类别与规则拼接结果之间进行相似度匹配,实现数据的分类分级,进一步提高了数据分类分级的准确度。

现有技术中的数据分类分级方式,通常采用关键字、正则表达式和数据字典等技术,结合人工校验实现数据的分类分级。但是,现有方式仅能对具有明显格式规律的数据集进行分类分级,数据分类分级的局限性较大,且数据分类分级依赖于人工,数据分类分级的效率和准确度也难以保证。

本发明实施例的技术方案,通过获取待分类分级数据集的字段名称和对应的字段值,在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述,获取规则表格中至少一个规则的规则类别、规则级别和字段类别,针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别,引入了大语言模型,能够识别字段值中的词频规律,保证了所确定的字段描述的准确度,解决了数据分类分级存在局限性的问题,提高了数据分类分级方法的泛化性;同时,引入了规则表格,实现了对待分类分级数据集的分类分级,确定了对待分类分级数据集的数据处理方式;此外,在规则表格的基础上,在数据分类分级任务中应用大语言模型,实现了精准地数据分类分级,提高了数据分类分级的效率和准确度,也保障了业务系统中业务数据的准确处理。

实施例二

图2为本发明实施例二提供的一种数据分类分级方法的流程图。本发明实施例在上述实施例的基础上,将“大语言模型的训练样本的生成过程”具体化为“获取规则表格中至少一个规则的字段类别;针对单个字段类别,获取字段值生成提示词,并根据字段值生成提示词,采用大语言模型,对字段类别进行语义理解,得到单个字段类别对应的预设数量的字段值;生成字段类别对应的字段名称;根据各字段名称和对应的预设数量的字段值,生成大语言模型的训练样本”,进一步提高了字段描述的准确度。需要说明的是,在本发明实施例中未详述的部分,可参见其他实施例的表述。

参见图2所示的数据分类分级方法,包括:

S201、获取待分类分级数据集中至少一个字段的字段名称和对应的字段值。

S202、在待分类分级数据集为内容数据集时,针对单个字段,获取字段总结提示词,并根据字段总结提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述总结文本。

大语言模型可以将自然语言任务转化为对话任务,可以利用一套模型结构配合不同的提示词应对各种各样的任务类型。字段描述总结文本可以为同一字段名称对应的字段值的属性的总结文本。字段总结提示词可以用于提示大语言模型根据字段值的内容,推理字段值对应的属性的总结文本。可选的,字段总结提示词可以包括需要进行总结的文本(即单个字段对应的字段值)和总结需求。示例性的,字段总结提示词可以为“请推测以下文本内容的属性、类型或用途,总结成一句话:{Text}”;其中,{Text}为需要进行总结的文本,也即单个字段对应的字段值。示例性的,字段总结提示词还可以为“请推测以下文本内容的属性、类型或用途,总结成一句话,不要输出文本内容:{Text}”,通过增加“请不要输出文本内容”,可以避免字段描述总结文本中带有文本内容(即字段值),造成字段值的重复匹配,影响相似度匹配的效率,进一步提高了数据分类分级的效率。

具体的,可以针对单个字段,获取预先生成的字段总结提示词。可以根据字段总结提示词,引导大语言模型,对字段值进行语义理解,推理字段值的字段描述总结文本。

S203、针对单个字段,获取关键词抽取提示词,并根据关键词抽取提示词,采用大语言模型,对字段描述总结文本进行语义理解,得到字段描述总结文本的至少一个字段描述关键词。

字段描述关键词可以为字段描述总结文本中抽取的关键词。字段描述关键词可以用于表征字段值的属性。关键词抽取提示词可以用于提示大语言模型根据字段描述总结文本的内容,推理字段值对应的属性,得到字段描述关键词。可选的,字段描述总结文本的至少一个字段描述关键词可以为关键词列表的形式。可选的,关键词抽取提示词可以包括示例文本、示例文本的关键词列表、字段描述总结文本和关键词抽取需求。示例性的,关键词抽取提示词可以为“假设你是一个数据工程师,请参考示例根据文本生成它的关键词,每个关键词长度不超过四个字,

具体的,可以针对单个字段,获取预先生成的关键词抽取提示词。可以根据关键词抽取提示词,引导大语言模型,对字段描述总结文本进行语义理解,抽取字段描述总结文本的至少一个字段描述关键词。

S204、将各字段描述关键词,确定为字段值的字段描述。

具体的,可以将各字段描述关键词,确定为字段值的字段描述。

S205、获取规则表格中至少一个规则的规则类别、规则级别和字段类别;其中,规则用于确定待分类分级数据集的处理方式。

S206、针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别。

本发明实施例的技术方案,引入了字段总结提示词和关键词抽取提示词,通过先对字段值进行字段描述总结,再对字段描述总结文本进行关键词抽取,利用大语言模型的推理能力,进一步提高了字段描述的准确度。

可选的,本发明实施例还提供了一种数据分类分级系统。数据分类分级系统包括数据管理模块、提示词管理模块、模型管理模块、分类分级模块(即本装置)、数据生成模块和模型训练模块。

数据管理模块,用于存储业务数据,作为待分类分级数据集或大语言模型的训练样本。其中,业务数据可以为业务系统的使用方导入的数据。

提示词管理模块,用于存储大语言模型的提示词,引导大语言模型执行不同的自然语言任务。其中,大语言模型的提示词可以为业务系统的使用方导入的专家经验。示例性的,大语言模型的提示词可以包括字段描述提示词、字段总结提示词、关键词抽取提示词、字段分类提示词和字段值生成提示词等。

模型管理模块,用于存储分类分级时所用到的大语言模型结构定义和参数。

行业规则管理模块,用于存储数据分类分级的依据,即规则表格。其中,规则表格可以包括三列,分别是规则类别、规则描述和规则级别。规则表格来自于国标文件或行标文件。可选的,不同行业具有各自的规则表格。

分类分级模块,用于调用上述多个模块,实现数据分类分级任务的全流程。其中,分类分级模块包含内容总结子模块、关键词提取子模块、向量提取子模块和召回排序计算子模块。

其中,内容总结子模块,用于调用模型管理模块中的大语言模型和提示词管理模块中的字段总结提示词,总结字段值的类别或规则,输出一句话作为字段值的字段描述总结文本。示例性的,字段总结提示词可以为“请推测这段文本的类型和用途,总结成一句话,不要输出文本内容:{text}”;其中,{text}是需要总结的文本,即单个字段对应的字段值。

关键词提取子模块,用于调用模型管理模块中的大语言模型和提示词管理模块中的关键词抽取提示词,抽取输入文本(字段描述总结文本)中的关键词,输出关键词列表(即至少一个字段描述关键词)。示例性的,关键词抽取提示词为“假设你是一个数据工程师,请参考示例根据文本生成它的提示词,每个提示词长度不超过四个字。

向量提取子模块,用于将输入文本(即字段拼接结果(或初始类别)和规则拼接结果)变成具有语义的向量。由此,可以满足余弦度量,即可以计算两个向量之间的余弦值,也即两个文本之间的相似度。

召回排序计算子模块,用于接受两组向量,分别为字段向量和规则向量,计算每个字段向量和所有规则向量的余弦相似度。之后,该子模块过滤掉相似度低于预设阈值的规则向量,排序得到相似度最高的若干个规则向量。

图3为本发明实施例提供的一种数据分类分级方法的流程图。在上述实施例的基础上,图3是本发明的一种优选实施例。

参见图3所示的数据分类分级方法,包括:

S301、从数据管理模块提取需要待分类分级数据集;其中,待分类分级数据集包括内容数据集或元数据集。

其中,内容数据集可以定义为结构化数据库中的一张表。内容数据集的每一列是属于同一字段名称的各字段值;同一列中除字段名称之外每行的内容是一个字段值。元数据集可以定义为内容数据集的元信息。元数据集可以至少包含两列,即字段名称列和字段描述列;其中,字段名称列用于存储字段名称;字段描述列用于存储字段描述。单个元数据包括一个字段名称和一个字段描述。

S302、在待分类分级数据集为内容数据集时,针对单个字段,对内容数据集中的字段值进行抽样,得到至少一个字段值抽样结果;将单个字段值抽样结果输入到内容总结子模块中,得到单个字段的字段描述总结文本;将字段描述总结文本输入到关键词提取子模块中,得到字段描述总结文本的至少一个字段描述关键词,确定为字段值的字段描述。

S303、针对单个字段,将字段名称、字段描述和字段值抽样结果进行拼接,得到字段拼接结果。

示例性的,可以按照如下方式进行拼接,得到字段拼接结果:“名称:{name}

S304、将字段拼接结果输入大语言模型,获取字段分类提示词,得到字段拼接结果的初始类别。

示例性的,字段分类提示词可以为“以下字段属于哪个类别:{field}”,其中,{field}为字字段拼接结果。

S305、将各字段的初始类别分别输入向量提取子模块,得到每个字段的字段向量。

S306、从行业规则管理模块中提取规则表格;其中,规则表格包括至少一个规则的规则类别、规则描述和规则级别。

可选的,可以从每个规则的规则描述中解析字段类别,得到至少一个规则的规则三元组,即规则类别、规则级别和字段类别。

S307、将每个规则的规则三元组中规则类别和字段类别进行拼接,得到规则拼接结果;将规则拼接结果输入向量提取子模块,得到每个规则的规则向量。

S308、将所有字段的字段向量和所有规则的规则向量输入召回排序计算子模块中,得到每个字段最匹配的若干个规则。

S309、根据最匹配的若干规则的规则类别和规则级别,得到待分类分级数据集的数据类别和数据级别。

本方案提高了数据分类分级方法的泛化性、效率和准确度,也保障了业务系统中业务数据的准确处理。

实施例三

图4为本发明实施例三提供的一种数据分类分级方法的流程图。本发明实施例在上述实施例的基础上,进一步增加了“大语言模型的训练样本的生成过程”,具体包括“获取规则表格中至少一个规则的字段类别;针对单个字段类别,获取字段值生成提示词,并根据字段值生成提示词,采用大语言模型,对字段类别进行语义理解,得到单个字段类别对应的预设数量的字段值;生成字段类别对应的字段名称;根据各字段名称和对应的预设数量的字段值,生成大语言模型的训练样本”,避免了业务系统私密性的原因,导致大语言模型的训练样本不足的问题,通过公开的规则表格中的字段类别,实现了对训练样本的扩充,兼顾了业务系统的信息安全性和大语言模型训练的准确度。需要说明的是,在本发明实施例中未详述的部分,可参见其他实施例的表述。

参见图4所示的数据分类分级方法,包括:

S401、获取规则表格中至少一个规则的字段类别。

规则表格可以作为数据分类分级的依据。规则表格可以来自于国标文件或行标文件。可选的,不同行业可以具有各自的规则表格。可选的,规则表格可以预先存储于数据库中。规则表格可以包括至少一个规则。一个规则可以包括规则类别、规则级别和字段类别。字段类别可以是对规则类别的进一步示例性描述。

具体的,可以对数据库进行查询,直接获取规则表格中至少一个规则的字段类别。

在本发明一个可选实施例中,获取规则表格中至少一个规则的字段类别,包括:获取规则表格中至少一个规则的规则描述;针对单个规则描述,按照预设字段类别标识和预设分隔符进行拆分,得到规则描述对应的至少一个字段类别;根据各规则描述对应的字段类别,确定规则表格中至少一个规则的字段类别。

可选的,规则表格还可以包括规则类别、规则级别和规则描述。其中,规则描述可以用于对规则类别进行进一步描述。示例性的,规则描述可以包括规则类别的解释说明和示例性描述。预设字段类别标识可以为预先设定的规则描述中字段类别的内容位置的标识。示例性的,预设字段类别标识可以为“如……等”。预设分隔符可以为预先设定的规则描述中字段类别之间的分隔符。示例性的,预设分隔符可以为“、”。

具体的,可以对数据库进行查询,获取规则表格中至少一个规则的规则描述。可以针对单个规则描述,按照预设字段类别标识,确定规则描述中字段类别的内容位置。可以按照预设分隔符对规则描述中字段类别的内容位置包含的内容进行拆分,得到规则描述对应的至少一个字段类别。将各规则描述对应的字段类别,确定为规则表格中至少一个规则的字段类别。

本方案通过预设字段类别标识和预设分隔符,对规则描述进行拆分,得到规则表格的字段类别,进一步提高了字段类别与规则类别之间的关联性,提高了所确定的字段类别的全面性和准确性。

S402、针对单个字段类别,获取字段值生成提示词,并根据字段值生成提示词,采用大语言模型,对字段类别进行语义理解,得到单个字段类别对应的预设数量的字段值。

字段值生成提示词可以用于提示大语言模型根据字段类别的内容,对字段类别进行扩充,生成字段类别对应的多个字段值。可选的,字段值生成提示词可以包括字段类别和预设数量。示例性的,字段值生成提示词可以为“请生成10条:{fields}”;其中,{fields}为字段类别。可选的,字段值生成提示词还可以包括规则类别、规则类别对应的至少一个字段类别、字段值换行分隔符和预设数量。示例性的,字段值生成提示词可以为“请生成10条{cate},包括{fields}

具体的,可以针对单个字段类别,获取预先生成的字段值生成提示词。可以根据字段值生成提示词,引导大语言模型,对字段类别进行语义理解,扩充生成单个字段类别对应的预设数量的字段值。

S403、生成字段类别对应的字段名称。

字段名称可以用于标识属于同一属性的字段值。由于不同业务系统的配置方式不同,在不同业务系统中,属于同一属性的字段名称可能不同。

具体的,可以获取规则表格中字段类别对应的规则类别或规则级别,确定为字段类别对应的字段名称。

可选的,也可以基于各业务系统的配置方式,随机生成任一业务系统的配置方式对应的字段名称。

S404、根据各字段名称和对应的预设数量的字段值,生成大语言模型的训练样本,以通过训练样本对大语言模型进行预先训练。

训练样本可以用于对大语言模型进行训练。训练样本可以为内容数据集样本。可选的,训练样本可以包括至少一个字段名称和对应的字段值。

具体的,可以将各字段名称作为训练样本的首行(或首列),可以将字段名称对应的预设数量的字段值,作为字段名称所属同一列(或同一行)的内容,生成大语言模型的训练样本。可以通过训练样本,对大语言模型进行训练。

S405、获取待分类分级数据集中至少一个字段的字段名称和对应的字段值。

S406、在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述。

S407、获取规则表格中至少一个规则的规则类别、规则级别和字段类别;其中,规则用于确定待分类分级数据集的处理方式。

S408、针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别。

本发明实施例的技术方案,通过获取规则表格中至少一个规则的字段类别,针对单个字段类别,获取字段值生成提示词,并根据字段值生成提示词,采用大语言模型,对字段类别进行语义理解,得到单个字段类别对应的预设数量的字段值,生成字段类别对应的字段名称,根据各字段名称和对应的预设数量的字段值,生成大语言模型的训练样本,避免了业务系统私密性的原因,导致大语言模型的训练样本不足的问题,通过公开的规则表格中的字段类别,实现了对训练样本的扩充,兼顾了业务系统的信息安全性和大语言模型训练的准确度。

可选的,数据分类分级系统还包括数据生成模块和模型训练模块。

其中,数据生成模块,用于从行业规则管理模块获得规则表格,解析其中包含的字段名称,结合提示词管理模块中的字段值生成提示词生成预设数量的字段值,可以将所生成的字段值和对应的字段名称存储于数据管理模块中,作为训练样本。由此,可以解决初始时期大语言模型训练数据不足的问题。

模型训练模块,用于从数据管理模块中获得训练样本,从提示词管理模块获得大语言模型的提示词,从模型管理模块获得大语言模型的结构定义和参数,并训练模型执行数据分类分级的步骤。

图5为本发明实施例提供的一种数据分类分级方法的流程图。在上述实施例的基础上,图5是本发明的一种优选实施例。

参见图5所示的数据分类分级方法,包括:

S501、从行业规则管理模块中提取规则表格;其中,规则表格包括至少一个规则的规则类别、规则描述和规则级别。

S502、从每个规则的规则描述中解析字段类别。

具体的,可以截取规则描述中的“如...等”内的内容。可以按照顿号对内容拆分,得到规则描述对应的至少一个字段类别。

S503、从提示词管理模块中加载字段值生成提示词。

示例性的,字段值生成提示词可以为“请生成10条{cate},包括{fields}

S504、将规则表格包含的字段名称和字段值生成提示词输入数据生成模块,生成对应的内容数据集,确定为训练样本,存放于数据管理模块中。

S505、调用分类分级模块,对新生成的内容数据集进行分类分级,将大语言模型基于提示词的问答历史记录存放于数据管理模块中。

S506、人工校验新生成的问答历史,审核大语言模型所推理的字段描述总结文本、字段描述关键词和初始类别是否合理可靠。

S507、根据校验后的问答历史,采用反向传播和梯度下降方法训练大语言模型,将训练后的参数保存至模型管理模块中,得到改进版的大语言模型。

S508、使用改进版的大语言模型对待分类分级数据集进行分类分级,在分类分级完成之后,返回执行S506和S507,持续提升大语言模型的质量。

本方案采用大语言模型,对字段类别进行扩充,生成相应的训练样本,避免了业务系统的数据私密性或业务系统数据不足,对大语言模型训练准确度的影响,提高了大语言模型的准确度,同时,在数据分类分级之后,对大语言模型进行持续训练,进一步提高了大语言模型的准确度。

实施例四

图6为本发明实施例四提供的一种数据分类分级装置的结构示意图。本发明实施例可适用于对业务系统的业务数据进行分类分级的情况,该装置可以执行数据分类分级方法,该装置可以采用硬件和/或软件的形式实现,该装置可配置于承载数据分类分级功能的电子设备中。

参见图6所示的数据分类分级装置,包括:待分类分级数据集获取模块601、第一字段描述确定模块602、规则类别获取模块603和数据分类分级模块604。其中,待分类分级数据集获取模块601,用于获取待分类分级数据集中至少一个字段的字段名称和对应的字段值;第一字段描述确定模块602,用于在所述待分类分级数据集为内容数据集时,针对单个所述字段,获取字段描述提示词,并根据所述字段描述提示词,采用大语言模型,对所述字段值进行语义理解,得到所述字段值的字段描述;规则类别获取模块603,用于获取规则表格中至少一个规则的规则类别、规则级别和字段类别;其中,规则用于确定待分类分级数据集的处理方式;数据分类分级模块604,用于针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别。

本发明实施例的技术方案,通过获取待分类分级数据集的字段名称和对应的字段值,在待分类分级数据集为内容数据集时,针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述,获取规则表格中至少一个规则的规则类别、规则级别和字段类别,针对单个字段,根据字段的字段名称、字段描述、对应的字段值、各规则的规则类别和字段类别,计算字段与各规则之间相似度,得到字段对应的相似度较高的至少一个规则,确定待分类分级数据集的数据类别和数据级别,引入了大语言模型,能够识别字段值中的词频规律,保证了所确定的字段描述的准确度,解决了数据分类分级存在局限性的问题,提高了数据分类分级方法的泛化性;同时,引入了规则表格,实现了对待分类分级数据集的分类分级,确定了对待分类分级数据集的数据处理方式;此外,在规则表格的基础上,在数据分类分级任务中应用大语言模型,实现了精准地数据分类分级,提高了数据分类分级的效率和准确度,也保障了业务系统中业务数据的准确处理。

在本发明一个可选实施例中,第一字段描述确定模块602,包括:字段描述总结文本生成单元,用于针对单个字段,获取字段总结提示词,并根据字段总结提示词,采用大语言模型,对字段值进行语义理解,得到字段值的字段描述总结文本;字段描述关键词生成大原,用于针对单个字段,获取关键词抽取提示词,并根据关键词抽取提示词,采用大语言模型,对字段描述总结文本进行语义理解,得到字段描述总结文本的至少一个字段描述关键词;第一字段描述确定单元,用于将各字段描述关键词,确定为字段值的字段描述。

在本发明一个可选实施例中,数据分类分级模块604,包括:第一字段拼接结果确定单元,用于针对单个所述字段,对所述字段名称、所述字段描述和字段值进行拼接,得到字段的字段拼接结果;初始类别确定模块,用于在针对单个字段,对字段名称、字段描述和字段值进行拼接,得到字段的字段拼接结果之后,针对单个字段,获取字段分类提示词,并根据字段分类提示词,采用大语言模型,对字段拼接结果进行语义理解,得到单个字段的初始类别;规则拼接结果确定单元,用于针对单个规则,对规则类别、规则级别和字段类别进行拼接,得到规则对应的规则拼接结果;规则相似度匹配单元,用于针对单个字段的初始类别,计算初始类别和各规则拼接结果之间相似度,得到字段对应的相似度较高的至少一个规则。

在本发明一个可选实施例中,该装置,还包括训练样本生成模块;其中,训练样本生成模块,包括:字段类别获取单元,用于获取规则表格中至少一个规则的字段类别;字段值生成单元,用于针对单个字段类别,获取字段值生成提示词,并根据字段值生成提示词,采用大语言模型,对字段类别进行语义理解,得到单个字段类别对应的预设数量的字段值;字段名称生成单元,用于生成字段类别对应的字段名称;训练样本生成单元,用于根据各字段名称和对应的预设数量的字段值,生成大语言模型的训练样本,以通过训练样本对大语言模型进行预先训练。

在本发明一个可选实施例中,字段类别获取单元,包括:规则描述获取子单元,用于获取规则表格中至少一个规则的规则描述;第一字段类别确定子单元,用于针对单个规则描述,按照预设字段类别标识和预设分隔符进行拆分,得到规则描述对应的至少一个字段类别;第二字段类别确定子单元,用于根据各规则描述对应的字段类别,确定规则表格中至少一个规则的字段类别。

在本发明一个可选实施例中,第一字段描述确定模块602,包括:字段值抽样结果确定单元,用于针对单个字段,对内容数据集包含的字段值进行抽样,得到字段对应的字段值抽样结果;第二字段描述确定单元,用于针对单个字段,获取字段描述提示词,并根据字段描述提示词,采用大语言模型,对字段值抽样结果进行语义理解,得到字段值的字段描述。

在本发明一个可选实施例中,该装置,还包括:第二字段描述确定模块,用于在获取规则表格中至少一个规则的规则类别、规则级别和字段类别之前,在待分类分级数据集为元数据集时,针对单个字段,获取字段名称和对应的字段描述;第二字段拼接结果确定模块,用于针对单个字段,对字段名称、字段描述和字段值进行拼接,得到字段的字段拼接结果;其中,字段值为空。

本发明实施例所提供的数据分类分级装置可执行本发明任意实施例所提供的数据分类分级方法,具备执行方法相应的功能模块和有益效果。

本发明实施例的技术方案中,所涉及的待分类分级数据集中至少一个字段的字段名称、对应的字段值、字段描述提示词、规则表格中至少一个规则的规则类别、规则级别、字段类别、规则描述、字段总结提示词、关键词抽取提示词、字段分类提示词和字段值生成提示词等的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

实施例四

图7示出了可以用来实施本发明的实施例的电子设备700的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图7所示,电子设备700包括至少一个处理器701,以及与至少一个处理器701通信连接的存储器,如只读存储器(ROM)702、随机访问存储器(RAM)703等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器701可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储电子设备700操作所需的各种程序和数据。处理器701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

电子设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器701可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器701执行上文所描述的各个方法和处理,例如数据分类分级方法。

在一些实施例中,数据分类分级方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到电子设备700上。当计算机程序加载到RAM 703并由处理器701执行时,可以执行上文描述的数据分类分级方法的一个或多个步骤。备选地,在其他实施例中,处理器701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据分类分级方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS(VirtualPrivate Server,虚拟专用服务器)服务中,存在的管理难度大,业务扩展性弱的缺陷。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 一种基于拟态防御的密码服务监控系统及方法
  • 一种基于拟态防御的密码服务监控系统及方法
技术分类

06120116546237