掌桥专利:专业的专利平台
掌桥专利
首页

一种数据库的访问流量控制方法及系统

文献发布时间:2024-04-18 19:58:26


一种数据库的访问流量控制方法及系统

技术领域

本发明涉及数据流量控制技术领域,具体而言,涉及一种数据库的访问流量控制方法及系统。

背景技术

现代数据库系统在大数据时代中扮演着至关重要的角色,但随着数据量和用户访问量的迅速增加,数据库的访问流量控制问题愈发显著。传统数据库管理系统使用的静态流量控制方法往往无法适应复杂的动态环境,容易导致数据库性能下降、响应时间延长等问题。并且数据库流量控制方法的静态性和缺乏针对不同访问特征的差异化控制,这导致了数据库性能和系统安全性的妥协。此外,传统方法通常无法适应大规模数据库的需求,缺乏智能的流量控制策略。因此现需要一种能够智能和差异化控制访问流量的方法及系统,用于应对大数据环境下的流量管理需求,提高数据库性能和系统安全性。

发明内容

本发明的目的在于提供一种数据库的访问流量控制方法及系统,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:

一方面,本申请提供了一种数据库的访问流量控制方法,包括:

获取数据库的访问流量信息和数据库的访问速率信息;

将所述数据库的访问流量信息发送至特征提取模块进行特征提取,得到至少两个访问流量特征信息;

将所有的访问流量特征信息发送至层次分析模型进行分析,得到每个访问流量特征信息的相对权重;

将每个访问流量特征信息的相对权重和所述数据库的访问速率信息进行访问速率影响权重计算,得到每个访问流量特征信息的相对权重对于数据库的访问速率信息的影响权重值;

将所述影响权重值发送至预设的流量控制策略预测模型进行处理,得到流量控制策略信息。

另一方面,本申请还提供了一种数据库的访问流量控制系统,包括:

获取单元,用于获取数据库的访问流量信息和数据库的访问速率信息;

第一处理单元,用于将所述数据库的访问流量信息发送至特征提取模块进行特征提取,得到至少两个访问流量特征信息;

分析单元,用于将所有的访问流量特征信息发送至层次分析模型进行分析,得到每个访问流量特征信息的相对权重;

计算单元,用于将每个访问流量特征信息的相对权重和所述数据库的访问速率信息进行访问速率影响权重计算,得到每个访问流量特征信息的相对权重对于数据库的访问速率信息的影响权重值;

第二处理单元,用于将所述影响权重值发送至预设的流量控制策略预测模型进行处理,得到流量控制策略信息。

本发明的有益效果为:

本发明实现了自动化的流量控制,通过不断分析、学习和预测,使数据库在高负载、不同访问特征和速率下能够保持良好的性能和安全性,其中,本发明通过动态流量控制,能够更好地分配资源,减少了数据库性能下降的风险,对不同访问特征的智能控制,识别潜在的安全威胁,减少了系统受攻击的可能性,本发明能够处理大规模的数据库访问流量,为现代大数据环境提供了可扩展性。并且优化了访问速率,使用户能够更快速地获取所需数据,提高了用户体验。

本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例中所述的数据库的访问流量控制方法流程示意图;

图2为本发明实施例中所述的数据库的访问流量控制系统结构示意图。

图中:701、获取单元;702、第一处理单元;703、分析单元;704、计算单元;705、第二处理单元;7021、第一训练子单元;7022、第二训练子单元;7023、第一计算子单元;7031、第一分析子单元;7032、第二分析子单元;7033、第三分析子单元;7034、第四分析子单元;7041、第一处理子单元;7042、第二计算子单元;7043、第三计算子单元;7044、第二处理子单元;7045、第三处理子单元;7051、第五分析子单元;7052、第四处理子单元;7053、第三训练子单元;7054、第四训练子单元;7055、第五处理子单元;70531、第五训练子单元;70532、第六训练子单元。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

实施例1:

本实施例提供了一种数据库的访问流量控制方法。

参见图1,图中示出了本方法包括步骤S1、步骤S2、步骤S3、步骤S4和步骤S5。

步骤S1、获取数据库的访问流量信息和数据库的访问速率信息;

可以理解的是本步骤是获取数据库的访问流量信息和数据库的访问速率信息,以为后续流量控制策略的制定和优化提供必要的数据支持。本步骤可以实时追踪数据库的访问情况,包括请求频率和访问速率,其中所述数据库的访问流量信息包括了数据库接收到的查询请求、更新请求、连接请求等,通常以请求的类型、数量、频率、来源等信息为基础。这些信息可以通过数据库管理系统的监控模块或外部监控工具来获取;数据库的访问速率信息包括数据库的响应时间、吞吐量、并发连接数等,它们用来衡量数据库的性能和资源利用情况。通常,数据库管理系统会提供性能统计数据,以及外部监控工具也可以捕获这些信息。

步骤S2、将所述数据库的访问流量信息发送至特征提取模块进行特征提取,得到至少两个访问流量特征信息;

可以理解的是本步骤通过对数据库的访问流量信息进一步处理,以提取关键的特征信息,为后续的数据分析和流量控制提供更丰富的信息,以便更好地理解和管理数据库的访问流量。本步骤中,步骤S2包括步骤S21、步骤S22和步骤S23。

步骤S21、将所有的访问流量信息发送至Bert模型中进行预训练,得到数据库的访问流量信息中的特征语句;

可以理解的是本步骤通过Bert模型对数据库的访问流量信息进行预训练,确定其中的特征语句,使系统更好的理解用户查询的语义,进而使后续的分析更具备针对性,提高分析的效率。

步骤S22、将所述访问流量信息的特征语句发送至训练后的BP神经网络模型中进行训练,其中通过BP神经网络模型获取所述特征语句的特征值,所述特征值包括的特征语句的长度特征值、访问时间特征值和行为统计特征值;

步骤S23、将所述特征值与所述数据库的访问流量信息进行匹配度计算,并将匹配度大于预设阈值的特征值作为访问流量特征信息。

可以理解的是本步骤中BP神经网络模型是通过学习如何获取所述访问流量信息的特征语句的特征值,进而达到智能选择特征值的目的,进而通过将所述特征值与所述数据库的访问流量信息进行匹配度计算,确定两者的联系程度,提高后续分析的准确性,保障后续的流量能够精确控制,其中所述匹配度的计算公式如下所示:

其中,A为特征值与所述数据库的访问流量信息的匹配度值,

步骤S3、将所有的访问流量特征信息发送至层次分析模型进行分析,得到每个访问流量特征信息的相对权重;

可以理解的是本步骤通过层次分析模型,可以量化每个访问流量特征的重要性,帮助确定哪些特征对数据库访问的影响最大,本步骤中,步骤S3包括步骤S31、步骤S32、步骤S33和步骤S34。

步骤S31、将所有的访问流量特征信息进行聚类分析,得到至少一个聚类簇,并将所有的聚类簇按照聚类簇内的特征数量进行层级划分,得到层次结构模型;

可以理解的是本步骤通过将所有的访问流量特征信息进行聚类分析进而得到至少一个聚类簇,然后按照聚类簇内的特征数量对所有的聚类簇进行层级划分,进而得到一个多层级的结构模型,所述结构模型内包含所有的访问流量特征信息。

步骤S32、基于所述层次结构模型,逐层对每个层级内的特征的重要性进行比较,构造判别矩阵;

可以理解的是,本步骤通过对层次结构模型内每个层级的两两因素进行比较获得相对重要程度的关系,并使用1-9标度法对每个指标进行打分,并做归一化处理后得到判别矩阵,判别矩阵的公式如下所示:

其中:A为判别矩阵;

步骤S33、基于所述判别矩阵分别计算所述判别矩阵特征向量和最大特征值,并对所述判别矩阵进行一致性检验,得到检验结果;

可以理解的是本步骤通过对判别矩阵的向量进行归一化处理,得到正规化矩阵;然后再将正规化矩阵按行相加,得到特征向量,再基于特征向量计算所述最大特征值,进而通过所述特征向量和最大特征值进行一致性指标计算,进而可以确定一致性指标是否满足预设情况,进而得到检验结果,其中,一致性的指标的计算公式如下所示:

其中:R为一致性指标;

步骤S34、若所述检验结果为所述判别矩阵满足一致性指标,则基于所述特征向量和所述最大特征值对确定每个层次内的流量特征信息的相对权重。

可以理解的是本步骤在一致性检验通过后,就可以使用特征向量来确定每个访问流量特征的相对权重,其中,所述相对权重为归一化后每个访问流量特征信息的权重值。

步骤S4、将每个访问流量特征信息的相对权重和所述数据库的访问速率信息进行访问速率影响权重计算,得到每个访问流量特征信息的相对权重对于数据库的访问速率信息的影响权重值;

可以理解的是本步骤是为了确定每个访问流量特征对数据库性能的实际影响程度。其中本步骤将每个访问流量特征信息的相对权重与数据库的访问速率信息相结合,以计算每个访问流量特征信息对数据库的访问速率的影响权重值。这个过程有助于确定哪些特征对数据库访问速率产生更大的影响,从而为流量控制策略提供更准确的依据。本步骤中,步骤S4包括步骤S41、步骤S42、步骤S43、步骤S44和步骤S45。

步骤S41、基于字词向量转换方法对所述访问流量特征信息的相对权重进行向量转换,并基于转换得到的向量构建特征矩阵;

可以理解的是本步骤将原始的相对权重数据转化为更为复杂的多维向量表示,这使得后续的计算和分析可以更灵活地处理数据。其中,其中所述字词向量转换方法采用word2vec方法,将所述访问流量特征信息的相对权重转换成多维向量,所述特征矩阵中每一行表示所述访问流量特征信息的相对权重,每一列表示词向量的特定维度,通过使用Word2Vec方法,相对权重信息获得了更多的语义信息,有助于更准确地捕捉特征之间的关系和相互影响。

步骤S42、基于预设的至少两个卷积核对所述特征矩阵进行计算,得到所有卷积核计算得到的特征图;

可以理解的是本步骤通过卷积操作,可以捕捉特征矩阵中的不同局部特征或模式,其中,每个卷积核可以用于寻找不同的特征,使得特征提取更加多样化和丰富化。生成的特征图将在后续步骤中用于进一步的分析和计算。

步骤S43、基于预设的金字塔池化模型对所述特征图进行计算,得到固定长度的特征向量;

可以理解的是金字塔池化允许在不同尺度下提取特征,从而更全面地捕获图像或特征图的信息,其中金字塔池化操作通过在特征图上采样和池化操作,这个操作通常涉及在特征图上不同尺度下执行池化操作,然后将得到的特征向量进行合并或拼接,生成的固定长度特征向量包含了多尺度的信息,有助于提高模型的性能和适应性。

步骤S44、将所述固定长度的特征向量与全连接层进行连接,并使用Softmax函数将全连接层的输出与所述数据库的访问速率信息进行映射,映射得到一个概率分布向量,所述概率分布向量的每一维对应一个所述数据库的访问速率信息;

可以理解的是本步骤通过将特征向量与全连接层连接,然后基于Softmax函数将其转换为一个概率分布向量,从而预测每个访问速率信息的影响权重,这有助于确定哪些特征对于数据库的不同访问速率信息更具影响力。

步骤S45、将所述概率分布向量中的概率值作为所述数据库的访问速率信息的影响权重值。

可以理解的是本步骤通过使用概率值来量化每个数据库访问速率信息的影响权重,为之后的根据预测的权重值来调整流量控制策略做准备,进而可以更好地适应不同的访问速率情况。

步骤S5、将所述影响权重值发送至预设的流量控制策略预测模型进行处理,得到流量控制策略信息。

可以理解的是本步骤将影响权重值转化为实际的流量控制策略,从而能够更有效地管理数据库的访问流量,以适应不同的访问速率和需求。本步骤中,步骤S5包括步骤S51、步骤S52、步骤S53、步骤S54和步骤S55。

步骤S51、将预设的历史影响权重值、预设的历史流量控制策略信息进行关联分析,得到所述历史影响权重值和所述历史流量控制策略信息的关联度值,所述历史流量控制策略信息包括设置带宽阈值和设置流量优先等级;

可以理解的是本步骤通过基于关联分析的方式确定历史流量控制策略与数据库访问速率信息的关系,从而可以更好地理解策略对数据库性能的影响,为制定新的流量控制策略提供有力的依据。

步骤S52、将所述预设的历史影响权重值和所述历史流量控制策略信息进行分类,得到训练集和验证集;

可以理解的是本步骤通过将历史信息分类为训练集和验证集有助于建立模型和评估其性能,其中,训练集用于训练模型,验证集用于测试模型的准确性。

步骤S53、将训练集发送至LSTM神经网络模型进行处理,其中对训练集内的数据以分钟为单位进行分段,并将不同时段的训练集输入值LSTM神经网络进行处理,得到输出数据,所述输出数据为不同时段的历史流量控制策略信息;

可以理解的是本步骤通过LSTM神经网络对不同时段的历史流量控制策略信息进行预测,进而训练得到一个可以预测控制策略信息的模型,本步骤中,步骤S53包括步骤S531和步骤S532。

步骤S531、将所述训练集发送至自编码器进行训练,其中按照预设的编码公式进行编码,并采用反向传播和梯度下降算法调节所述自编码器的参数,得到每个时段的训练集的特征序列;

可以理解的是本步骤本发明采用自编码器-解码器对训练集数据进行降维,提取出相关性最大的数据进行预测,将增加预测的精度,其中自编码器-解码器的训练公式如下:

式中,i为历史影响权重值数据中各个时间段的索引,

L(X,Y)为X和Y之间的距离,L(X,Y)的计算公式如下:

其中,n为时间段的总数,i为历史影响权重值数据中各个时间段的索引,

步骤S532、将所述训练集和每个时段的训练集的特征序列发送至LSTM神经网络进行预测,得到不同时段的历史流量控制策略信息。

可以理解的是LSTM神经网络能够处理时间序列数据,捕捉数据的长期依赖性,本发明通过历史流量控制策略信息的预测,系统可以更加智能地管理数据库的访问流量,提高性能和资源利用率。

步骤S54、将所述验证集与所述输出数据进行对比,得到对比结果,若所述对比结果为所述验证集与所述输出数据不一致,则采用贝叶斯优化算法不断调节参数,直至所述对比结果为所述验证集与所述输出数据一致,得到训练后的流量控制策略预测模型,其中所述参数为LSTM神经网络的权值和偏置,所述LSTM神经网络的权值所述关联度值;

可以理解的是本步骤为了确保模型的准确性和性能。通过比对验证集和输出数据,模型可以不断改进,以更好地预测流量控制策略,其中通过贝叶斯优化算法可以加速模型的收敛并提高模型性能。并且,训练后的流量控制策略预测模型将具有较高的准确性,可用于预测数据库的访问流量控制策略,以实现更好的资源分配和性能优化。

步骤S55、将所述影响权重值发送至训练后的流量控制策略预测模型进行预测,得到不同时段的流量控制策略信息。

可以理解的是本步骤通过将所述影响权重值发送至训练后的流量控制策略预测模型进行预测,帮助数据库管理员或系统自动调整资源分配,满足不同时间段的需求,从而提高数据库性能和资源利用率。

实施例2:

如图2所示,本实施例提供了一种数据库的访问流量控制系统,参见图2所述系统包括获取单元701、第一处理单元702、分析单元703、计算单元704和第二处理单元705。

获取单元701,用于获取数据库的访问流量信息和数据库的访问速率信息;

第一处理单元702,用于将所述数据库的访问流量信息发送至特征提取模块进行特征提取,得到至少两个访问流量特征信息;

其中,所述第一处理单元702包括第一训练子单元7021、第二训练子单元7022和第一计算子单元7023。

第一训练子单元7021,用于将所有的访问流量信息发送至Bert模型中进行预训练,得到数据库的访问流量信息中的特征语句;

第二训练子单元7022,用于将所述访问流量信息的特征语句发送至训练后的BP神经网络模型中进行训练,其中通过BP神经网络模型获取所述特征语句的特征值,所述特征值包括的特征语句的长度特征值、访问时间特征值和行为统计特征值;

第一计算子单元7023,用于将所述特征值与所述数据库的访问流量信息进行匹配度计算,并将匹配度大于预设阈值的特征值作为访问流量特征信息。

分析单元703,用于将所有的访问流量特征信息发送至层次分析模型进行分析,得到每个访问流量特征信息的相对权重;

其中,所述分析单元703包括第一分析子单元7031、第二分析子单元7032、第三分析子单元7033和第四分析子单元7034。

第一分析子单元7031,用于将所有的访问流量特征信息进行聚类分析,得到至少一个聚类簇,并将所有的聚类簇按照聚类簇内的特征数量进行层级划分,得到层次结构模型;

第二分析子单元7032,用于基于所述层次结构模型,逐层对每个层级内的特征的重要性进行比较,构造判别矩阵;

第三分析子单元7033,用于基于所述判别矩阵分别计算所述判别矩阵特征向量和最大特征值,并对所述判别矩阵进行一致性检验,得到检验结果;

第四分析子单元7034,用于若所述检验结果为所述判别矩阵满足一致性指标,则基于所述特征向量和所述最大特征值对确定每个层次内的流量特征信息的相对权重。

计算单元704,用于将每个访问流量特征信息的相对权重和所述数据库的访问速率信息进行访问速率影响权重计算,得到每个访问流量特征信息的相对权重对于数据库的访问速率信息的影响权重值;

其中,所述计算单元704包括第一处理子单元7041、第二计算子单元7042、第三计算子单元7043、第二处理子单元7044和第三处理子单元7045。

第一处理子单元7041,用于基于字词向量转换方法对所述访问流量特征信息的相对权重进行向量转换,并基于转换得到的向量构建特征矩阵;

第二计算子单元7042,用于基于预设的至少两个卷积核对所述特征矩阵进行计算,得到所有卷积核计算得到的特征图;

第三计算子单元7043,用于基于预设的金字塔池化模型对所述特征图进行计算,得到固定长度的特征向量;

第二处理子单元7044,用于将所述固定长度的特征向量与全连接层进行连接,并使用Softmax函数将全连接层的输出与所述数据库的访问速率信息进行映射,映射得到一个概率分布向量,所述概率分布向量的每一维对应一个所述数据库的访问速率信息;

第三处理子单元7045,用于将所述概率分布向量中的概率值作为所述数据库的访问速率信息的影响权重值。

第二处理单元705,用于将所述影响权重值发送至预设的流量控制策略预测模型进行处理,得到流量控制策略信息。

其中,所述第二处理单元705包括第五分析子单元7051、第四处理子单元7052、第三训练子单元7053、第四训练子单元7054和第五处理子单元7055。

第五分析子单元7051,用于将预设的历史影响权重值、预设的历史流量控制策略信息进行关联分析,得到所述历史影响权重值和所述历史流量控制策略信息的关联度值,所述历史流量控制策略信息包括设置带宽阈值和设置流量优先等级;

第四处理子单元7052,用于将所述预设的历史影响权重值和所述历史流量控制策略信息进行分类,得到训练集和验证集;

第三训练子单元7053,用于将训练集发送至LSTM神经网络模型进行处理,其中对训练集内的数据以分钟为单位进行分段,并将不同时段的训练集输入值LSTM神经网络进行处理,得到输出数据,所述输出数据为不同时段的历史流量控制策略信息;

其中,所述第三训练子单元7053包括第五训练子单元70531和第六训练子单元70532。

第五训练子单元70531,用于将所述训练集发送至自编码器进行训练,其中按照预设的编码公式进行编码,并采用反向传播和梯度下降算法调节所述自编码器的参数,得到每个时段的训练集的特征序列;

第六训练子单元70532,用于将所述训练集和每个时段的训练集的特征序列发送至LSTM神经网络进行预测,得到不同时段的历史流量控制策略信息。

第四训练子单元7054,用于将所述验证集与所述输出数据进行对比,得到对比结果,若所述对比结果为所述验证集与所述输出数据不一致,则采用贝叶斯优化算法不断调节参数,直至所述对比结果为所述验证集与所述输出数据一致,得到训练后的流量控制策略预测模型,其中所述参数为LSTM神经网络的权值和偏置,所述LSTM神经网络的权值所述关联度值;

第五处理子单元7055,用于将所述影响权重值发送至训练后的流量控制策略预测模型进行预测,得到不同时段的流量控制策略信息。

需要说明的是,关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种数据库访问方法及其系统
  • 一种数据库系统、数据库系统访问方法及装置
  • 一种数据库系统、数据库系统访问方法及装置
技术分类

06120116492029