掌桥专利:专业的专利平台
掌桥专利
首页

一种磁盘数据缓冲区数据下刷的方法、装置、设备及介质

文献发布时间:2023-06-19 18:46:07


一种磁盘数据缓冲区数据下刷的方法、装置、设备及介质

技术领域

本发明涉及计算机领域,并且更具体地涉及一种磁盘数据缓冲区中数据下刷的方法、装置、设备及可读介质。

背景技术

底层引擎Bluestore(底层存储引擎)通过OBJ(Bluestore管理IO的基本单元)对IO进行数据管理。将一个OBJ在存储层面上划分为Data(磁盘数据存储区域)部分和Meta(磁盘元数据存储区域)部分,其中Data部分在IO过程中会根据当前的数据存储情况将数据动态地落入磁盘的Data区或者Journal(磁盘数据缓冲区)区。

写IO的执行过程中,第一步是尝试锁住该OBJ,获取Meta数据。第二步是根据读取的Meta数据计算当前写入的区域是否有数据,以及数据所在的位置,并据此判定新数据是写入Data区或者Journal区。第三步是将IO请求的数据写入第二步计算出的区域,最后更新Meta数据,并写入Meta区。

经过多轮IO写入后,同一OBJ会有部分数据在Journal区,部分在Data区。由于Journal区的总大小属于固定的。通常只占磁盘总量的很小一部分,所以当某块磁盘在执行了大量的写IO后,有可能出现Journal区写满的情况,会导致新的IO无法在正常写入。另外从单个OBJ的维度来说,OBJ数据从Journal区下刷至Data区的过程中,由于需要严格保证数据的一致性,故在下刷的过程中同样需要锁定该OBJ。所以一个OBJ的下刷过程中,如果有收到该OBJ正常的IO请求,则会因锁竞争而触发阻塞等待。两者的冲突会导致系统整体的IO性能下降,增大单个IO请求的时延,降低整个存储平台的IO稳定性和吞吐量。

发明内容

有鉴于此,本发明实施例的目的在于提出一种磁盘数据缓冲区中数据下刷的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够减少磁盘数据缓冲区空间不足的问题,能够减少同一OBJ IO与下刷冲突事件发生的概率,能够增强整个系统的IO稳定性,提升存储系统的性能。

基于上述目的,本发明的实施例的一个方面提供了一种磁盘数据缓冲区中数据下刷的方法,包括以下步骤:

根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序;

根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作。

根据本发明的一个实施例,根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率包括:

根据当前IO请求的时间、当前IO请求的类型和当前OBJ的热度值通过加权算法计算出当前OBJ的磁盘数据缓冲区的新的热度值。

根据本发明的一个实施例,响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序包括:

将监控到的磁盘数据缓冲区的使用率与使用率阈值进行比较;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,按照计算出的热度值从小到大的顺序将OBJ进行排序。

根据本发明的一个实施例,根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作包括:

构建磁盘数据缓冲区的使用率和选取OBJ数量的对应表格,表格中记录磁盘数据缓冲区的各个使用率与选取OBJ数量的对应关系;

基于监控得到的使用率在表格中查找需选取OBJ的数量,并选取出热度值低的对应数量的OBJ;

获取OBJ的元数据并将OBJ锁定;

根据OBJ的元数据信息获取OBJ存在于磁盘数据缓冲区的数据信息,并向磁盘数据缓冲区对应的位置发起读请求以读取数据;

根据OBJ的元数据信息标识将读取的数据写入数据存储区对应的位置;

更新OBJ的元数据信息,并将更新后的元数据写入元数据存储区。

本发明的实施例的另一个方面,还提供了一种磁盘数据缓冲区中数据下刷的装置,装置包括:

计算模块,计算模块配置为根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率;

排序模块,排序模块配置为响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序;

处理模块,处理模块配置为根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作。

根据本发明的一个实施例,计算模块还配置为:

根据当前IO请求的时间、当前IO请求的类型和当前OBJ的热度值通过加权算法计算出当前OBJ的磁盘数据缓冲区的新的热度值。

根据本发明的一个实施例,排序模块还配置为:

将监控到的磁盘数据缓冲区的使用率与使用率阈值进行比较;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,按照计算出的热度值从小到大的顺序将OBJ进行排序。

根据本发明的一个实施例,处理模块还配置为:

构建磁盘数据缓冲区的使用率和选取OBJ数量的对应表格,表格中记录磁盘数据缓冲区的各个使用率与选取OBJ数量的对应关系;

基于监控得到的使用率在表格中查找需选取OBJ的数量,并选取出热度值低的对应数量的OBJ;

获取OBJ的元数据并将OBJ锁定;

根据OBJ的元数据信息获取OBJ存在于磁盘数据缓冲区的数据信息,并向磁盘数据缓冲区对应的位置发起读请求以读取数据;

根据OBJ的元数据信息标识将读取的数据写入数据存储区对应的位置;

更新OBJ的元数据信息,并将更新后的元数据写入元数据存储区。

本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:

至少一个处理器;以及

存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。

本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。

本发明具有以下有益技术效果:本发明实施例提供的磁盘数据缓冲区中数据下刷的方法,通过根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率;响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序;根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作的技术方案,能够减少磁盘数据缓冲区空间不足的问题,能够减少同一OBJ IO与下刷冲突事件发生的概率,能够增强整个系统的IO稳定性,提升存储系统的性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为根据本发明一个实施例的磁盘数据缓冲区中数据下刷的方法的示意性流程图;

图2为根据本发明一个实施例的磁盘数据缓冲区中数据下刷的装置的示意图;

图3为根据本发明一个实施例的计算机设备的示意图;

图4为根据本发明一个实施例的计算机可读存储介质的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

基于上述目的,本发明的实施例的第一个方面,提出了一种磁盘数据缓冲区中数据下刷的方法的一个实施例。图1示出的是该方法的示意性流程图。

如图1中所示,该方法可以包括以下步骤:

S1根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率。IO模块接收到IO请求后,会按照正常的IO流程进行IO读写,当IO流程涉及到Journal区的读写时候,则根据当前IO的时间、当前IO的类型以及当前OBJ旧的热度值,通过特定加权算法计算出当前OBJ的Journal区的新的热度值,并更新热度值。

S2响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序。根据需求设定一个使用率阈值,实时将监控到的使用率与使用率阈值进行比较,当监控到的磁盘数据缓冲区的使用率超过使用率阈值时,按照计算出的热度值从小到大的顺序将OBJ进行排序。

S3根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作。Journal区下刷的速度与Journal区的使用率成正比例关系,当Journal区的使用率越高,Journal下刷的速度也就越快。比如:当Journal区的使用率达到50%的时候,开始触发下刷,每次发起的下刷OBJ数量为1个,如果此时有大量的IO下发,一段时间以后Journal区的使用率达到了75%,则此时每次发起的下刷OBJ数量则增加为5个,总体来说就是当剩余的空间越少的时候,增加Journal下刷速度,从而保证Journal区剩余空间的充足。下刷的OBJ是从排序的结果列表中选取出热度值最低的一定数量的OBJ,批量对这些OBJ发起Journal数据的下刷操作。Journal数据下刷时,首先或下刷OBJ的元数据并将该OBJ锁定,避免并发操作引发数据不一致问题。然后根据OBJ的元数据信息,获取该OBJ存在于Journal区的数据信息,并向Journal区对应的位置发起读请求,读取该部分数据。最后根据元数据信息标识将读取的数据写入Data区对应的位置,更新OBJ的元数据信息,并将更新后的元数据写入Meta区,完成该OBJ Journal下刷操作。

通过使用本发明的技术方案,能够减少磁盘数据缓冲区空间不足的问题,能够减少同一OBJ IO与下刷冲突事件发生的概率,能够增强整个系统的IO稳定性,提升存储系统的性能。

在本发明的一个优选实施例中,根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率包括:

根据当前IO请求的时间、当前IO请求的类型和当前OBJ的热度值通过加权算法计算出当前OBJ的磁盘数据缓冲区的新的热度值。可以使用任意其他算法计算磁盘数据缓冲区的热度值。

在本发明的一个优选实施例中,响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序包括:

将监控到的磁盘数据缓冲区的使用率与使用率阈值进行比较;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,按照计算出的热度值从小到大的顺序将OBJ进行排序。选取下刷的OBJ时,根据排序进行顺序选取,也就是选取的OBJ是热度最低的几个OBJ。

在本发明的一个优选实施例中,根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作包括:

构建磁盘数据缓冲区的使用率和选取OBJ数量的对应表格,表格中记录磁盘数据缓冲区的各个使用率与选取OBJ数量的对应关系;

基于监控得到的使用率在表格中查找需选取OBJ的数量,并选取出热度值低的对应数量的OBJ;

获取OBJ的元数据并将OBJ锁定;

根据OBJ的元数据信息获取OBJ存在于磁盘数据缓冲区的数据信息,并向磁盘数据缓冲区对应的位置发起读请求以读取数据;

根据OBJ的元数据信息标识将读取的数据写入数据存储区对应的位置;

更新OBJ的元数据信息,并将更新后的元数据写入元数据存储区。表格中记录了使用率与OBJ数量的对应关系,例如,使用50%时,对应1个OBJ,使用率75%时,对应5个OBJ,也就是说在使用率为50%时,选取热度值低的1个OBJ进行下刷,在使用率为75%时,选取热度值低的5个OBJ进行下刷。

本发明涉及了底层存储引擎的IO处理流程和Journal下刷流程。通过IO流程动态影响和调整Journal下刷的对象和方式,从而减少两个流程之间的相互影响,达到提高性能,增强稳定性的目的。本发明重在实现Journal数据下刷的控制,主要体现在Journal下刷的启动机制,Journal下刷速度的控制方法,以及下刷OBJ的选择算法。主要作用是在保证正常的Journal数据下刷功能的前提下,尽量减少触发Journal区空间不足的问题,或者同一OBJ IO与下刷冲突等事件发生的概率,能够在保证正常功能的基础上,增强整个系统的IO稳定性,提升存储系统的性能。

需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。

基于上述目的,本发明的实施例的第二个方面,提出了一种磁盘数据缓冲区中数据下刷的装置,如图2所示,装置200包括:

计算模块,计算模块配置为根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率;

排序模块,排序模块配置为响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序;

处理模块,处理模块配置为根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作。

在本发明的一个优选实施例中,计算模块还配置为:

根据当前IO请求的时间、当前IO请求的类型和当前OBJ的热度值通过加权算法计算出当前OBJ的磁盘数据缓冲区的新的热度值。

在本发明的一个优选实施例中,排序模块还配置为:

将监控到的磁盘数据缓冲区的使用率与使用率阈值进行比较;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,按照计算出的热度值从小到大的顺序将OBJ进行排序。

在本发明的一个优选实施例中,处理模块还配置为:

构建磁盘数据缓冲区的使用率和选取OBJ数量的对应表格,表格中记录磁盘数据缓冲区的各个使用率与选取OBJ数量的对应关系;

基于监控得到的使用率在表格中查找需选取OBJ的数量,并选取出热度值低的对应数量的OBJ;

获取OBJ的元数据并将OBJ锁定;

根据OBJ的元数据信息获取OBJ存在于磁盘数据缓冲区的数据信息,并向磁盘数据缓冲区对应的位置发起读请求以读取数据;

根据OBJ的元数据信息标识将读取的数据写入数据存储区对应的位置;

更新OBJ的元数据信息,并将更新后的元数据写入元数据存储区。

基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例包括如下装置:至少一个处理器21;以及存储器22,存储器22存储有可在处理器上运行的计算机指令23,指令由处理器执行时实现以下方法:

根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序;

根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作。

在本发明的一个优选实施例中,根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率包括:

根据当前IO请求的时间、当前IO请求的类型和当前OBJ的热度值通过加权算法计算出当前OBJ的磁盘数据缓冲区的新的热度值。

在本发明的一个优选实施例中,响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序包括:

将监控到的磁盘数据缓冲区的使用率与使用率阈值进行比较;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,按照计算出的热度值从小到大的顺序将OBJ进行排序。

在本发明的一个优选实施例中,根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作包括:

构建磁盘数据缓冲区的使用率和选取OBJ数量的对应表格,表格中记录磁盘数据缓冲区的各个使用率与选取OBJ数量的对应关系;

基于监控得到的使用率在表格中查找需选取OBJ的数量,并选取出热度值低的对应数量的OBJ;

获取OBJ的元数据并将OBJ锁定;

根据OBJ的元数据信息获取OBJ存在于磁盘数据缓冲区的数据信息,并向磁盘数据缓冲区对应的位置发起读请求以读取数据;

根据OBJ的元数据信息标识将读取的数据写入数据存储区对应的位置;

更新OBJ的元数据信息,并将更新后的元数据写入元数据存储区。

基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质31存储有被处理器执行时执行如下方法的计算机程序32:

根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序;

根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作。

在本发明的一个优选实施例中,根据IO请求的信息计算当前OBJ的热度值,并监控磁盘数据缓冲区的使用率包括:

根据当前IO请求的时间、当前IO请求的类型和当前OBJ的热度值通过加权算法计算出当前OBJ的磁盘数据缓冲区的新的热度值。

在本发明的一个优选实施例中,响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,根据OBJ的热度值将OBJ进行排序包括:

将监控到的磁盘数据缓冲区的使用率与使用率阈值进行比较;

响应于监控到的磁盘数据缓冲区的使用率超过使用率阈值,按照计算出的热度值从小到大的顺序将OBJ进行排序。

在本发明的一个优选实施例中,根据监控得到的使用率选取设定数量的OBJ发起磁盘数据缓冲区数据的下刷操作包括:

构建磁盘数据缓冲区的使用率和选取OBJ数量的对应表格,表格中记录磁盘数据缓冲区的各个使用率与选取OBJ数量的对应关系;

基于监控得到的使用率在表格中查找需选取OBJ的数量,并选取出热度值低的对应数量的OBJ;

获取OBJ的元数据并将OBJ锁定;

根据OBJ的元数据信息获取OBJ存在于磁盘数据缓冲区的数据信息,并向磁盘数据缓冲区对应的位置发起读请求以读取数据;

根据OBJ的元数据信息标识将读取的数据写入数据存储区对应的位置;

更新OBJ的元数据信息,并将更新后的元数据写入元数据存储区。

此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。

此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。

以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。

应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。

上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

相关技术
  • 一种磁盘数据上云方法、系统、设备及计算机存储介质
  • 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
  • 一种数据配置方法及装置、一种计算设备及存储介质
  • 一种数据存储方法及装置、一种计算设备及存储介质
  • 一种数据存储方法及装置、一种计算设备及存储介质
  • 一种脏数据下刷方法、装置、设备及计算机可读存储介质
  • 一种数据重删的下刷方法、装置、设备和介质
技术分类

06120115687407