掌桥专利:专业的专利平台
掌桥专利
首页

一种大数据中心智能数据分类管理方法、系统及存储介质

文献发布时间:2024-04-18 19:58:53


一种大数据中心智能数据分类管理方法、系统及存储介质

技术领域

本发明涉及数据管理领域,具体是涉及一种大数据中心智能数据分类管理方法、系统及存储介质。

背景技术

数据中心是用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息的特定设备网络,随着企业数字化的发展,对于数字数据的存储需求越来越大,现有的数据中心缺乏一套行之有效的数据分类管理方案,难以结合数据中心存储的数据种类,调用频率进行综合化的数据加密管理方案规划,导致数据中心难以保持高效化的数据存储管理。

发明内容

为解决上述技术问题,提供一种大数据中心智能数据分类管理方法、系统及存储介质,本技术方案解决了上述背景技术中提出的现有的数据中心缺乏一套行之有效的数据分类管理方案,难以结合数据中心存储的数据种类,调用频率进行综合化的数据加密管理方案规划,导致数据中心难以保持高效化的数据存储管理的问题。

为达到以上目的,本发明采用的技术方案为:

一种大数据中心智能数据分类管理方法,包括:

对大数据中心存储的数据进行分类,获得大数据中心存储的若干个数据类别;

对每个数据类别进行重要性划分,获得每个数据类别的重要权重,将所有数据类别的重要权重值组成数据权重矩阵;

确定大数据中心中存储的每个数据类别的数据量,将所有数据类别的数据量组成数据量矩阵;

确定大数据中心内置的若干种数据加密方式;

基于数据权重矩阵和数据量矩阵,确定大数据中心对于每个数据类别的最优动态加密管理方案;

按照最优动态加密管理方进行大数据中心的数据分类管理。

优选的,所述对每个数据类别进行重要性划分,获得每个数据类别的重要权重,将所有数据类别的重要权重值组成数据权重矩阵具体包括:

基于数据类别的数据重要等级,对数据类别施加一重要权重基准值;

获取大数据中心存储的每一个数据的历史调用数据,并基于历史调用数据计算数据对应的调用概率;

确定该数据对应的数据类别;

基于数据对应的数据类别的重要权重基准值和数据对应的调用概率,通过权重计算公式计算数据的重要权重;

基于数据类别对应的所有数据的重要权重求平均值,作为数据类别的重要权重;

将所有数据类别的重要权重值组成数据权重矩阵;

其中,所述权重计算公式具体为:

式中,

优选的,所述获取大数据中心存储的每一个数据的历史调用数据,并基于历史调用数据计算数据对应的调用概率具体包括:

基于大数据中心的运行日志,获取大数据中心的所有数据的历史总调用次数;

基于大数据中心的运行日志,获取每一个数据的历史调用次数;

以数据的历史调用次数在所有数据的历史总调用次数中的占比,作为数据对应的调用概率。

优选的,所述基于数据权重矩阵和数据量矩阵,确定大数据中心对于每个数据类别的最优动态加密管理方案具体包括:

通过加密确定算法,确定每个数据类别对应的最优数据加密方式,组成最优数据加密方案;

基于每个数据类别对应的重要权重,确定数据类别对应的重要等级;

基于数据类别对应的重要等级,确定该数据类别对应的密钥轮换频率;

按照确定的数据类别对应的密钥轮换频率,采用数据类别对应的最优数据加密方式对数据类别对应的每个数据进行动态加密更新。

优选的,所述加密确定算法具体为:

获取大数据中心的加密总算力;

确定大数据中心内置的若干个数据加密方式对应的加密算力基准值和若干个数据加密方式对应的加密等级指标;

基于数据量矩阵、数据加密方式对应的加密算力基准值和大数据中心的加密总算力,构建算力限制条件;

基于算力限制条件,生成若干个数据加密方案;

计算每一个数据加密方案的优化指标;

筛选出优化指标最大的数据加密方案,作为最优数据加密方案;

其中,所述算力限制条件的数学表达式为:

算力限制条件的数学表达式中,

数据加密方案的优化指标的计算公式为:

所述数据加密方案的优化指标的计算公式中,

确定大数据中心内置的数据加密方式总数,记为K;

对大数据中心内置的若干个数据加密方式进行编号,获取与数据加密方式一一对应的编号;

确定在满足算力限制条件下,每个数据类别对应的数据加密方式的编号,将所有数据类别对应的数据加密方式的编号,组成加密编号矩阵A,A=

记加密编号矩阵A为数据加密方案。

进一步的,提出一种大数据中心智能数据分类管理系统,用于实现如上述的大数据中心智能数据分类管理方法,包括:

数据分类统计模块,所述数据分类统计模块用于对大数据中心存储的数据进行分类,获得大数据中心存储的若干个数据类别;

重要性确定模块,所述重要性确定模块与所述数据分类统计模块电性连接,所述重要性确定模块用于对每个数据类别进行重要性划分,获得每个数据类别的重要权重,将所有数据类别的重要权重值组成数据权重矩阵;

数据量统计模块,所述数据量统计模块与所述数据分类统计模块电性连接,所述数据量统计模块用于确定大数据中心中存储的每个数据类别的数据量,将所有数据类别的数据量组成数据量矩阵;

管理方案确定模块,所述管理方案确定模块与所述重要性确定模块和所述数据量统计模块电性连接,所述管理方案确定模块用于基于数据权重矩阵和数据量矩阵,确定大数据中心对于每个数据类别的最优动态加密管理方案。

可选的,所述重要性确定模块包括:

调用概率统计单元,所述调用概率统计单元用于获取大数据中心存储的每一个数据的历史调用数据,并基于历史调用数据计算数据对应的调用概率;

数据权重计算单元,所述数据权重计算单元用于基于数据对应的数据类别的重要权重基准值和数据对应的调用概率,通过权重计算公式计算数据的重要权重;

类别权重计算单元,所述类别权重计算单元用于基于数据类别对应的所有数据的重要权重求平均值,作为数据类别的重要权重并将所有数据类别的重要权重值组成数据权重矩阵。

可选的,所述管理方案确定模块包括:

加密方式确定单元,所述加密方式确定单元用于通过加密确定算法,确定每个数据类别对应的最优数据加密方式,组成最优数据加密方案;

轮换确定单元,所述轮换确定单元用于基于每个数据类别对应的重要权重,确定数据类别对应的重要等级并基于数据类别对应的重要等级,确定该数据类别对应的密钥轮换频率。

进一步的,提出一种计算机可读存储介质,其上存储有计算机可读程序,所述计算机可读程序被调用时上述的大数据中心智能数据分类管理方法。

与现有技术相比,本发明的有益效果在于:

本发明提出了一种大数据中心智能数据分类管理方案,基于数据中心存储的数据种类和数据调用频率,结合数据中心的加密算力进行智能化的调整数据的加密方式和数据的密钥轮换频率,可对数据中心内存储的数据进行智能化的加密管理规划,进而保证在数据中心的加密算力限制下,可维持数据中心内存储的数据保持的最佳的加密状态,进而实现对于数据中心内部的数据的高效化,安全化管理。

附图说明

图1为本发明提出的大数据中心智能数据分类管理方法的方法流程图;

图2为本发明中的获得数据权重矩阵的方法流程图;

图3为本发明中的计算数据对应的调用概率的方法流程图;

图4为本发明中的确定最优动态加密管理方案的方法流程图;

图5为本发明中的加密确定算法的具体方法流程图;

图6为本发明中的生成数据加密方案的方法流程图。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。

参照图1所示,一种大数据中心智能数据分类管理方法,包括:

对大数据中心存储的数据进行分类,获得大数据中心存储的若干个数据类别;

对每个数据类别进行重要性划分,获得每个数据类别的重要权重,将所有数据类别的重要权重值组成数据权重矩阵;

确定大数据中心中存储的每个数据类别的数据量,将所有数据类别的数据量组成数据量矩阵,具体实现方法为,将每个数据类别对应的所有数据的数据量大小进行累加,即可得到数据类别的数据量;

确定大数据中心内置的若干种数据加密方式;

基于数据权重矩阵和数据量矩阵,确定大数据中心对于每个数据类别的最优动态加密管理方案;

按照最优动态加密管理方进行大数据中心的数据分类管理。

本方案基于数据中心存储的数据种类和数据调用频率,结合数据中心的加密算力进行智能化的调整数据的加密方式和数据的密钥轮换频率,可对数据中心内存储的数据进行智能化的加密管理规划。

参照图2所示,对每个数据类别进行重要性划分,获得每个数据类别的重要权重,将所有数据类别的重要权重值组成数据权重矩阵具体包括:

基于数据类别的数据重要等级,对数据类别施加一重要权重基准值;

获取大数据中心存储的每一个数据的历史调用数据,并基于历史调用数据计算数据对应的调用概率;

确定该数据对应的数据类别;

基于数据对应的数据类别的重要权重基准值和数据对应的调用概率,通过权重计算公式计算数据的重要权重;

基于数据类别对应的所有数据的重要权重求平均值,作为数据类别的重要权重;

将所有数据类别的重要权重值组成数据权重矩阵;

其中,权重计算公式具体为:

式中,

参照图3所示,获取大数据中心存储的每一个数据的历史调用数据,并基于历史调用数据计算数据对应的调用概率具体包括:

基于大数据中心的运行日志,获取大数据中心的所有数据的历史总调用次数;

基于大数据中心的运行日志,获取每一个数据的历史调用次数;

以数据的历史调用次数在所有数据的历史总调用次数中的占比,作为数据对应的调用概率。

可以理解的是,对于调用频率较高的数据,由于其在调用时需要进行频繁的解码,因此会占用数据中心更多的算力资源,基于此,本方案中对于调用频率较高的数据,进行适当的降低其重要权重,以期在后续确定数据的加密方式时,采用算力需求较低的数据加密方式,以降低数据调用时对于数据中心的算力资源需求,保证数据中心的运行稳定性。

参照图4所示,基于数据权重矩阵和数据量矩阵,确定大数据中心对于每个数据类别的最优动态加密管理方案具体包括:

通过加密确定算法,确定每个数据类别对应的最优数据加密方式,组成最优数据加密方案;

基于每个数据类别对应的重要权重,确定数据类别对应的重要等级;

基于数据类别对应的重要等级,确定该数据类别对应的密钥轮换频率;

按照确定的数据类别对应的密钥轮换频率,采用数据类别对应的最优数据加密方式对数据类别对应的每个数据进行动态加密更新。

可以理解的是,对于不同重要等级的数据,其所对应的密钥轮换频率存在不同,例如对于数据中心中存储的高重要等级数据,对于其密钥轮换频率应进行适当提高,以保证高重要等级数据的安全性;

在一些优选实施例中,数据中心将数据的重要等级分为5个等级,同时对于5个等级分别确定密钥轮换频率,并基于5个重要等级分别划定对应的重要权重范围,基于数据类别对应的重要权重落入重要等级对应的重要权重范围内,来确定数据类别对应的重要等级。

参照图5所示,加密确定算法具体为:

获取大数据中心的加密总算力;

确定大数据中心内置的若干个数据加密方式对应的加密算力基准值和若干个数据加密方式对应的加密等级指标;

基于数据量矩阵、数据加密方式对应的加密算力基准值和大数据中心的加密总算力,构建算力限制条件;

基于算力限制条件,生成若干个数据加密方案;

计算每一个数据加密方案的优化指标;

筛选出优化指标最大的数据加密方案,作为最优数据加密方案;

其中,算力限制条件的数学表达式为:

算力限制条件的数学表达式中,

数据加密方案的优化指标的计算公式为:

数据加密方案的优化指标的计算公式中,

参照图6所示,基于算力限制条件,生成若干个数据加密方案具体包括:

确定大数据中心内置的数据加密方式总数,记为K;

对大数据中心内置的若干个数据加密方式进行编号,获取与数据加密方式一一对应的编号;

确定在满足算力限制条件下,每个数据类别对应的数据加密方式的编号,将所有数据类别对应的数据加密方式的编号,组成加密编号矩阵A,A=

记加密编号矩阵A为数据加密方案。

通过保证对数据加密的总算力需求小于大数据中心的加密总算力进行构建算力限制条件,并对算力限制条件下生成的数据加密方案对于每一个数据类别的加密等级指标和重要权重值进行累加计算,得到数据加密方案的优化指标,该优化指标越大,则说明数据加密方案对于数据中心内的数据加密综合安全性越高,说明该数据加密方案越贴合数据中心内存储的数据状态。

进一步的,基于与上述大数据中心智能数据分类管理方法相同的发明构思,本方案还提出一种大数据中心智能数据分类管理系统,包括:

数据分类统计模块,数据分类统计模块用于对大数据中心存储的数据进行分类,获得大数据中心存储的若干个数据类别;

重要性确定模块,重要性确定模块与数据分类统计模块电性连接,重要性确定模块用于对每个数据类别进行重要性划分,获得每个数据类别的重要权重,将所有数据类别的重要权重值组成数据权重矩阵;

数据量统计模块,数据量统计模块与数据分类统计模块电性连接,数据量统计模块用于确定大数据中心中存储的每个数据类别的数据量,将所有数据类别的数据量组成数据量矩阵;

管理方案确定模块,管理方案确定模块与重要性确定模块和数据量统计模块电性连接,管理方案确定模块用于基于数据权重矩阵和数据量矩阵,确定大数据中心对于每个数据类别的最优动态加密管理方案。

重要性确定模块包括:

调用概率统计单元,调用概率统计单元用于获取大数据中心存储的每一个数据的历史调用数据,并基于历史调用数据计算数据对应的调用概率;

数据权重计算单元,数据权重计算单元用于基于数据对应的数据类别的重要权重基准值和数据对应的调用概率,通过权重计算公式计算数据的重要权重;

类别权重计算单元,类别权重计算单元用于基于数据类别对应的所有数据的重要权重求平均值,作为数据类别的重要权重并将所有数据类别的重要权重值组成数据权重矩阵。

管理方案确定模块包括:

加密方式确定单元,加密方式确定单元用于通过加密确定算法,确定每个数据类别对应的最优数据加密方式,组成最优数据加密方案;

轮换确定单元,轮换确定单元用于基于每个数据类别对应的重要权重,确定数据类别对应的重要等级并基于数据类别对应的重要等级,确定该数据类别对应的密钥轮换频率。

再进一步的,本方案还提出一种计算机可读存储介质,其上存储有计算机可读程序,计算机可读程序被调用时执行上述的基于地貌特征的无人机定位方法。

可以理解的是,存储介质可以是磁性介质,例如,软盘、硬盘、磁带;光介质例如,DVD;或者半导体介质例如固态硬盘SolidStateDisk,SSD等。

综上所述,本发明的优点在于:可对数据中心内存储的数据进行智能化的加密管理规划,进而保证在数据中心的加密算力限制下,可维持数据中心内存储的数据保持的最佳的加密状态,进而实现对于数据中心内部的数据的高效化,安全化管理。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

相关技术
  • 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质
  • 一种智能合约管理方法、系统、设备及计算机存储介质
  • 一种离线数据管理方法、系统、服务器及存储介质
  • 一种元数据管理方法、系统、设备及计算机可读存储介质
  • 基于云服务器大数据分析的电商平台商品配送中心商品智能分类管理方法
  • 一种基于大数据的风电机组智能管理方法、系统及存储介质
技术分类

06120116507480