掌桥专利:专业的专利平台
掌桥专利
首页

一种数据处理方法、装置、设备及可读存储介质

文献发布时间:2023-06-19 11:29:13


一种数据处理方法、装置、设备及可读存储介质

技术领域

本申请涉及计算机技术领域,特别涉及一种数据处理方法、装置、设备及可读存储介质。

背景技术

在固态硬盘及Nand Flash存储介质中,可以通过垃圾回收来释放无效数据页占用的空间,以实现可用空间的回收。其中,垃圾回收操作即擦除块,擦除块会带来有效数据页的迁移,当有效数据页较多时,会导致数据写入量增大(即写放大),而数据写入量增大会加剧存储介质的磨损,降低存储介质的寿命和性能。

以固态硬盘为例,固态硬盘中包括多个物理块,每个物理块包括多个数据页。若通过擦除块来释放存储空间,则需要将当前物理块中的有效数据页中的数据迁移至其他物理块中,以便释放当前物理块的存储空间。若当前物理块中的有效数据页较多,那么数据迁移量和写入量会比较大,因此会直接影响固态硬盘的性能。

因此,如何降低存储介质的磨损,提高存储介质的寿命和性能,是本领域技术人员需要解决的问题。

发明内容

有鉴于此,本申请的目的在于提供一种数据处理方法、装置、设备及可读存储介质,以降低存储介质的磨损,提高存储介质的寿命和性能。其具体方案如下:

第一方面,本申请提供了一种数据处理方法,包括:

接收垃圾回收指令;

确定所述垃圾回收指令对应的物理数据页;

查询所述物理数据页对应的逻辑地址;

增大所述逻辑地址的更新周期,获得目标更新周期;所述更新周期表示所述物理数据页中的数据的活跃度;

计算所述目标更新周期与每个分组的预设周期的差异度;

将所述物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块。

优选地,所述增大所述逻辑地址的更新周期,获得目标更新周期,包括:

将所述更新周期加倍,获得所述目标更新周期。

优选地,所述将所述物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块之后,还包括:

获取所述逻辑地址对应的I/O数据;

确定所述I/O数据对应的操作I/O时间戳;

判断所述记录I/O时间戳是否为初始时间戳;

若否,则将所述逻辑地址的更新周期更新为所述操作I/O时间戳与所述记录I/O时间戳的差值;

将所述记录I/O时间戳更新为所述操作I/O时间戳;

分别计算所述更新周期与每个分组的预设周期的差异度;

将所述I/O数据存储至最小差异度对应的目标分组所对应的目标物理块。

优选地,还包括:

若所述记录I/O时间戳为所述初始时间戳,则判断所述更新周期是否为初始周期;

若是,则将所述记录I/O时间戳更新为所述操作I/O时间戳,并将所述更新周期更新为最小预设周期;

将所述I/O数据存储至所述最小预设周期对应的对象分组所对应的对象物理块。

优选地,所述将所述I/O数据存储至最小差异度对应的目标分组所对应的目标物理块,包括:

将所述I/O数据写入所述目标分组对应的目标数据页,所述目标数据页为所述目标物理块中的物理数据页。

优选地,还包括:

将所述目标分组的预设周期更新为所述目标分组对应的所有逻辑地址的更新周期的平均值。

优选地,还包括:

判断所述目标分组对应的数据页个数是否为其他分组对应的数据页个数的两倍;

若是,则关闭所有分组中的数据页个数最少的分组,将所述目标分组拆分为两个分组,并建立所述两个分组与所述目标物理块的对应关系。

第二方面,本申请提供了一种数据处理装置,包括:

获取模块,用于获取垃圾回收指令;

确定模块,用于确定所述垃圾回收指令对应的物理数据页;

查询模块,用于查询所述物理数据页对应的逻辑地址;

增大模块,用于增大所述逻辑地址的更新周期,获得目标更新周期;所述更新周期表示所述物理数据页中的数据的活跃度;

计算模块,用于计算所述目标更新周期与每个分组的预设周期的差异度;

迁移模块,用于将所述物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块。

第三方面,本申请提供了一种数据处理设备,包括:存储单元和主控制器,其中:

所述存储单元包括物理块,所述物理块中的物理数据页用于存储I/O数据;

所述主控制器用于执行前述公开的数据处理方法。

第四方面,本申请提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的数据处理方法。

通过以上方案可知,本申请提供了一种数据处理方法,包括:接收垃圾回收指令;确定所述垃圾回收指令对应的物理数据页;查询所述物理数据页对应的逻辑地址;增大所述逻辑地址的更新周期,获得目标更新周期;所述更新周期表示所述物理数据页中的数据的活跃度;计算所述目标更新周期与每个分组的预设周期的差异度;将所述物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块。

在本申请中,逻辑地址对应有更新周期,更新周期表示当前逻辑地址对应的物理数据页中的数据的活跃度,更新周期越短,表示数据越活跃;更新周期越长,表示数据越不活跃。若对逻辑地址执行垃圾回收操作(即擦除该逻辑地址对应的物理数据页中的数据),那么增大逻辑地址的更新周期,获得目标更新周期;计算目标更新周期与每个分组的预设周期的差异度;将物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块。理想情况下,垃圾回收操作仅迁移少量数据,因此在执行垃圾回收操作时,增大逻辑地址的更新周期,可降低当前迁移的数据的活跃度,使其与其他数据(与当前迁移的数据具有相近活跃度的数据)存储在同一物理块中,实现冷热数据的分开存储。如此一来,若通过擦除块来释放存储空间,那么物理块中存留的有效数据页将大大减少,因此可以降低数据写入量和存储介质的磨损,提高存储介质的寿命和性能。

需要说明的是,实现冷热数据的分开存储后,若再次执行垃圾回收操作,则需要迁移的数据量会大大减少,因此本申请还可以提高垃圾回收操作的执行效率。

相应地,本申请提供的一种数据处理装置、设备及可读存储介质,也同样具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请公开的第一种数据处理方法流程图;

图2为本申请公开的第二种数据处理方法流程图;

图3为本申请公开的第三种数据处理方法流程图;

图4为本申请公开的一种数据处理装置示意图;

图5为本申请公开的一种数据处理设备示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,现有技术在通过擦除块来释放存储空间时,数据迁移量和写入量比较大,会加剧存储介质的磨损,降低存储介质的寿命和性能。为此,本申请提供了一种数据处理方案,能够降低存储介质的磨损,提高存储介质的寿命和性能。

参见图1所示,本申请实施例公开了第一种数据处理方法,包括:

S101、接收垃圾回收指令。

S102、确定垃圾回收指令对应的物理数据页。

S103、查询物理数据页对应的逻辑地址。

具体的,垃圾回收指令会携带有物理数据页的物理地址,因此可从垃圾回收指令中获取物理地址,进而依据物理地址与逻辑地址的映射表,确定逻辑地址。

S104、增大逻辑地址的更新周期,获得目标更新周期。

其中,更新周期表示物理数据页中的数据的活跃度。更新周期越短,表示数据越活跃;更新周期越长,表示数据越不活跃。活跃数据可看作热数据,不活跃的数据可看作冷数据。

S105、计算目标更新周期与每个分组的预设周期的差异度。

S106、将物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块。

在一种优选地具体实施方式中,增大逻辑地址的更新周期,获得目标更新周期,包括:将更新周期加倍,获得目标更新周期。例如:原更新周期为3,将更新周期加倍后,获得的目标更新周期为3+3=6。在获得目标更新周期后,可计算目标更新周期与每个分组的预设周期的差异度,并将物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块,如此可以实现冷热数据的分开存储。

需要说明的是,若某个物理块中存在有效物理数据页,则做垃圾回收时需要迁移出有效物理数据页;如果一个物理块做垃圾回收时需要迁移的有效物理数据页多,表明分组不准确。因此,一旦垃圾回收时需要搬移有效物理数据页,表明该有效物理数据页的分组是不准确的,需要对其进行惩罚重新调整分组。因此,本实施例中,通过垃圾回收指令确定需要迁移的有效物理数据页,再通过该有效物理数据页的物理地址查询该有效物理数据页对应的逻辑地址,最后通过增大该逻辑地址的更新周期进行惩罚调整分组。

在本实施例中,逻辑地址不仅对应有更新周期,还对应有记录I/O时间戳。记录I/O时间戳可以用于确定更新周期。

需要说明的是,本实施例预设有多个分组,每个分组对应有预设周期,且各个分组与物理块具有对应关系。其中,若当前存储介质为固态硬盘,那么分组的数量不大于固态硬盘的并行度,并行度是指可以同时写的最大物理块数目。各个分组对应的预设周期表示已写入数据的活跃度,因此若逻辑地址的更新周期与分组的预设周期的差异度越小,说明当前需要写入的I/O数据与已写入数据的活跃度相近。

例如:固态硬盘的并行度为3,则最多可预设3个分组:第一分组、第二分组、第三分组。假设第一分组的当前预设周期为8ms、第二分组的当前预设周期为16ms、第三分组的当前预设周期为32ms。固态硬盘初始化后,分组的第一个预设周期可以根据经验或当前固态硬盘支持的业务的规律人为确定。假设逻辑地址对应的更新后的更新周期为16ms,那么该更新周期与第二分组的预设周期的差异度最小,因此将该逻辑地址对应的I/O数据存储至第二分组对应的物理块。

需要说明的是,实现冷热数据的分开存储后,若再次执行垃圾回收操作,则需要迁移的数据量会大大减少,因此本申请还可以提高垃圾回收操作的执行效率。

可见,在本申请实施例中,逻辑地址对应有更新周期。若对逻辑地址执行垃圾回收操作(即擦除该逻辑地址对应的物理数据页中的数据),那么增大逻辑地址的更新周期,从而降低当前迁移的数据的活跃度,使其与其他数据(与当前迁移的数据具有相近活跃度的数据)存储在同一物理块中,实现冷热数据的分开存储。如此一来,若通过擦除块来释放存储空间,那么物理块中存留的有效数据页将大大减少,因此可以降低数据写入量和存储介质的磨损,提高存储介质的寿命和性能。

基于上述实施例,需要说明的是,若执行完垃圾回收操作后,获取到上述实施例描述的垃圾回收操作所对应的逻辑地址的I/O数据,则可按照本实施例提供的方法处理该I/O数据。

参见图2所示,本申请实施例公开了第二种数据处理方法,包括:

S201、获取垃圾回收操作的逻辑地址对应的I/O数据,并确定I/O数据对应的操作I/O时间戳。

其中,I/O数据可以是主机写操作对应的数据,也可以是垃圾回收操作对应的数据(即需要迁移的有效数据页中的数据)。

S202、判断逻辑地址的记录I/O时间戳是否为初始时间戳;若是,则执行S207;若否,则执行S203。

S203、将逻辑地址的更新周期更新为操作I/O时间戳与记录I/O时间戳的差值。

S204、将记录I/O时间戳更新为操作I/O时间戳。

S205、分别计算更新周期与每个分组的预设周期的差异度。

其中,计算更新周期与预设周期的差异度时,使用的更新后的更新周期。例如:S203步骤将更新周期由A更新为B,那么S205步骤计算的是B与每个分组的预设周期的差异度,从而获得多个差异度。

S206、将I/O数据存储至最小差异度对应的目标分组所对应的目标物理块。

在一种优选地具体实施方式中,将I/O数据存储至最小差异度对应的目标分组所对应的目标物理块,包括:将I/O数据写入目标分组对应的目标数据页,目标数据页为目标物理块中的物理数据页。

具体的,将I/O数据存储至最小差异度对应的目标分组所对应的目标物理块,包括:确定最小差异度对应的目标分组;对当前逻辑地址进行标记,以便当前逻辑地址与目标分组相对应,进而将I/O数据写入目标分组对应的目标数据页。其中,逻辑地址与分组的对应关系随更新周期和预设周期的变化而变化,因此逻辑地址与分组的对应关系是实时变化的。

需要说明的是,分组对应的预设周期根据其对应的逻辑地址的更新周期的更新而更新。例如:某一分组的当前预设周期为8,且I/O数据对应的逻辑地址的更新周期与预设周期8的差异度最小,则当前I/O数据写入该分组对应的物理块后,可根据当前逻辑地址的更新周期更新当前分组的预设周期。在一种优选地具体实施方式中,可以将预设周期更新为当前分组对应的所有逻辑地址的更新周期的平均值。

在本实施例中,可以将目标分组的预设周期更新为目标分组对应的所有逻辑地址的更新周期的平均值。

在一种优选地具体实施方式中,将I/O数据存储至最小预设周期对应的目标分组所对应的目标物理块之后,还包括分组拆分步骤。分组拆分步骤具体包括:判断目标分组对应的数据页个数是否为其他分组对应的数据页个数的两倍;若是,则关闭所有分组中的数据页个数最少的分组,将目标分组拆分为两个分组,并建立两个分组与目标物理块的对应关系。

在一种优选地具体实施方式中,将I/O数据存储至最小预设周期对应的目标分组所对应的目标物理块之前,还包括分组拆分步骤。分组拆分步骤具体包括:判断目标分组对应的数据页个数是否为其他分组对应的数据页个数的两倍;若是,则关闭所有分组中的数据页个数最少的分组,将目标分组拆分为两个分组,并建立两个分组与目标物理块的对应关系。

也就是说,当目标分组对应的数据页个数较多时,将其拆分为2个分组。若当前分组的数量等于固态硬盘的并行度,为避免分组的数量大于固态硬盘的并行度,因此将所有分组中的数据页个数最少的分组关闭。由上述可知:当满足分组拆分条件时,分组的拆分步骤可在I/O数据存储至物理块之前执行,也可在I/O数据存储至物理块之后执行。

按照上述拆分步骤的核心思想,分组拆分步骤可以包括:

判断目标分组对应的数据页个数是否为其他分组对应的数据页个数的N倍;N为实数且不小于2;若是,则将所有分组按照其对应的数据页个数从小到大排序,获得分组序列,删除分组序列中的前N-1个分组;将目标分组拆分为N-1个子分组,并建立N-1个子分组和目标物理块的对应关系。

S207、判断更新周期是否为初始周期;若是,则执行S208;若否,则保留更新周期,并执行S204。

S208、将记录I/O时间戳更新为操作I/O时间戳,并将更新周期更新为最小预设周期。

S209、将I/O数据存储至最小预设周期对应的对象分组所对应的对象物理块。

需要说明的是,若当前逻辑地址的更新周期和记录I/O时间戳均为初始值,表示该逻辑地址从未被写过数据,此种情况下,无法准确确定当前更新周期与哪个预设周期差异度最小,因此直接将I/O数据存储至最小预设周期对应的对象分组所对应的对象物理块。最小预设周期的更新周期最短,短时间内发生垃圾回收的可能性最大,可通过提前让这些I/O数据发生垃圾回收,以尽早暴露出分组是否准确,如果不准确,及时做分组调整(即更新逻辑地址的更新周期,以使下次该逻辑地址上有数据写入时,将数据存储至与其热度更接近的物理块)。其中,最小预设周期为当前所有预设周期中的最小值。由于各个分组的预设周期会实时变化,所以最小预设周期也是实时变化的。

其中,对象分组和目标分组可能是同一个分组,也可能是两个不同的分组。因此对象物理块和目标物理块可能是同一个物理块,也可能是两个不同的物理块。

在一种优选地具体实施方式中,将I/O数据存储至最小预设周期对应的对象分组所对应的对象物理块,包括:将I/O数据写入对象分组对应的对象数据页,对象数据页为对象物理块中的物理数据页。

在本实施例中,可以将对象分组的预设周期更新为对象分组对应的所有逻辑地址的更新周期的平均值。

在一种优选地具体实施方式中,将I/O数据存储至最小预设周期对应的对象分组所对应的对象物理块之后,还包括分组拆分步骤。分组拆分步骤具体包括:判断对象分组对应的数据页个数是否为其他分组对应的数据页个数的两倍;若是,则关闭所有分组中的数据页个数最少的分组,将对象分组拆分为两个分组,并建立两个分组与对象物理块的对应关系。

在一种优选地具体实施方式中,将I/O数据存储至最小预设周期对应的对象分组所对应的对象物理块之前,还包括分组拆分步骤。分组拆分步骤具体包括:判断对象分组对应的数据页个数是否为其他分组对应的数据页个数的两倍;若是,则关闭所有分组中的数据页个数最少的分组,将对象分组拆分为两个分组,并建立两个分组与对象物理块的对应关系。

也就是说,当对象分组对应的数据页个数较多时,将其拆分为2个分组。若当前分组的数量等于固态硬盘的并行度,为避免分组的数量大于固态硬盘的并行度,因此将所有分组中的数据页个数最少的分组关闭。由上述可知:当满足分组拆分条件时,分组的拆分步骤可在I/O数据存储至物理块之前执行,也可在I/O数据存储至物理块之后执行。

按照上述拆分步骤的核心思想,分组拆分步骤可以包括:

判断对象分组对应的数据页个数是否为其他分组对应的数据页个数的N倍;N为实数且不小于2;若是,则将所有分组按照其对应的数据页个数从小到大排序,获得分组序列,删除分组序列中的前N-1个分组;将对象分组拆分为N-1个子分组,并建立N-1个子分组和对象物理块的对应关系。

在一种优选地具体实施方式中,判断逻辑地址的记录I/O时间戳是否为初始时间戳之前,还包括:确定逻辑地址所属的地址范围,将地址范围的记录I/O时间戳和更新周期确定为逻辑地址的记录I/O时间戳和更新周期。

需要说明的是,逻辑地址的数量较多,若每个逻辑地址都对应一个记录I/O时间戳和一个更新周期,那么需要维护的记录I/O时间戳和更新周期将非常多,如此不利于方案实施,会增加计算开销。为此,可以将逻辑地址进行分段,分段后,属于同一地址段(即地址范围)的多个逻辑地址将对应同一个记录I/O时间戳和同一个更新周期,从而降低计算开销。

可见,若垃圾回收操作的逻辑地址上有I/O数据需要写入,那么判断逻辑地址的记录I/O时间戳是否为初始时间戳;若否,则更新该逻辑地址的记录I/O时间戳和更新周期,进而确定更新周期与各个分组的预设周期的差异度,并将当前I/O数据存储至最小差异度对应的目标分组所对应的目标物理块,从而使具有相近活跃度的数据存储在同一物理块中,也就实现了冷热数据的分开存储。如此一来,若通过擦除块来释放存储空间,那么物理块中存留的有效数据页将大大减少,因此可以降低数据写入量和存储介质的磨损,提高存储介质的寿命和性能。

基于图2所示的数据处理方法,若接收到Trim操作指令,可实现如图3所示的第三种数据处理方法,包括:

S301、若接收到Trim操作指令,则根据Trim操作指令确定逻辑地址。

具体的,Trim操作指令中会携带逻辑地址,因此可从Trim操作指令中获取逻辑地址,以便确定逻辑地址。

S302、将逻辑地址的更新周期更新为Trim操作指令的指令时间戳与逻辑地址的记录I/O时间戳的差值。

其中,更新周期表示通过逻辑地址存储的数据的活跃度。更新周期越短,表示数据越活跃;更新周期越长,表示数据越不活跃。

S303、将逻辑地址的记录I/O时间戳更新为初始时间戳。

S304、若获取到逻辑地址对应的I/O数据,则根据更新周期和记录I/O时间戳存储I/O数据。

在本实施例中,逻辑地址对应有记录I/O时间戳和更新周期。记录I/O时间戳可以用于确定更新周期。

在更新Trim操作对应的逻辑地址的记录I/O时间戳和更新周期后,可根据更新周期和记录I/O时间戳存储该逻辑地址上的I/O数据。更新周期越短,表示数据越活跃;更新周期越长,表示数据越不活跃。活跃数据可看作热数据,不活跃的数据可看作冷数据。因此根据更新周期和记录I/O时间戳存储数据,可以实现冷热数据的分开存储。

需要说明的是,实现冷热数据的分开存储后,若需要执行Trim操作,则需要处理的无效数据也会减少,因此本申请还可以提高Trim操作的执行效率。

可见,在本申请实施例中,逻辑地址对应有记录I/O时间戳和更新周期。若接收到Trim操作指令后,根据Trim操作指令确定逻辑地址;将逻辑地址的更新周期更新为Trim操作指令的指令时间戳与逻辑地址的记录I/O时间戳的差值;将逻辑地址的记录I/O时间戳更新为初始时间戳;后续若获取到逻辑地址对应的I/O数据,则根据更新周期和记录I/O时间戳存储I/O数据。如此一来,若通过擦除块来释放存储空间,那么物理块中存留的有效数据页将大大减少,因此可以降低数据写入量和存储介质的磨损,提高存储介质的寿命和性能。

参照图1、图2和图3所示的方法流程,可实现如下方案,具体实现过程包括:初始化部分以及更新部分。

一、初始化部分包括:初始化LBA(Logical Block Address,逻辑地址)生命周期表和初始化分组。

(1)初始化LBA生命周期表包括:

在固态硬盘内部建立LBA生命周期表,LBA生命周期表包括的字段如表1所示。

表1

在表1中,行号表示某一地址范围,包括多个逻辑地址;记录I/O时间戳和更新周期即当前地址范围对应的记录I/O时间戳和更新周期。在本实施例中,将距离当前时间最近的任意一个逻辑地址的操作I/O时间戳记录为记录I/O时间戳。当然,还可以将当前行号包括的所有逻辑地址的操作I/O时间戳的平均值记录为记录I/O时间戳。

各个行号对应的初始时间戳为-1,初始周期为0。由于多个逻辑地址对应一行,因此任何一个逻辑地址上有写操作发生,该行的记录I/O时间戳和更新周期就可能发生改变。

其中,同一个逻辑地址上有两次写操作的时间间隔,称为当前逻辑地址的更新周期,用两次操作I/O时间戳的差来表示,单位一般为微妙。当然,同一行号的不同逻辑地址的最近一次写操作的时间间隔,也成为当前逻辑地址的更新周期,用两个不同逻辑地址的两次操作,I/O时间戳的差来表示,单位一般为微妙。更新周期越短,表示被操作数据越活跃(即数据越热);更新周期越长,表示被操作数据越不活跃(即数据越冷)。

其中,记录I/O时间戳可以采用浮点数微妙为单位进行计算,也可以通过自定义定时器(比如若干时钟周期为一个定时周期)利用整数进行计算。如果利用浮点数,则需要64位来记录I/O时间戳,如果利用整数,则需要32位来记录I/O时间戳。

(2)初始化分组具体包括:

在固态硬盘内部建立8个分组,从0到7编号,并设置每个分组对应的预设周期,每个分组对应的物理块。其中,不同分组对应不同物理块。8为当前固态硬盘的并行度。各个分组与预设周期请参见表2。

表2

二、更新部分包括:更新LBA生命周期表和更新预设周期。

(1)更新LBA生命周期表具体包括:

若任一个逻辑地址上发生写操作(此写操作可以是主机写操作,也可以是垃圾回收操作时对有效数据页的迁移写操作),则确定当前写操作的操作I/O时间戳;同时判断逻辑地址的记录I/O时间戳是否为初始时间戳;若否,则将逻辑地址的更新周期更新为操作I/O时间戳与记录I/O时间戳的差值;将记录I/O时间戳更新为操作I/O时间戳;若记录I/O时间戳为初始时间戳,则判断更新周期是否为初始周期;若是,则将记录I/O时间戳更新为操作I/O时间戳,并将更新周期更新为最小预设周期。若更新周期不是初始周期,则保留更新周期,并将记录I/O时间戳更新为操作I/O时间戳。记录I/O时间戳和更新周期完成更新后,可按照相应流程写入当前写操作对应的数据,以实现冷热数据的分开存储。具体过程可参见图2,本实施例不再赘述。

若接收到Trim操作指令,则根据Trim操作指令确定逻辑地址;将逻辑地址的更新周期更新为Trim操作指令的指令时间戳与逻辑地址的记录I/O时间戳的差值;将逻辑地址的记录I/O时间戳更新为初始时间戳;后续若获取到逻辑地址对应的I/O数据,则根据更新周期和记录I/O时间戳存储I/O数据,从而实现冷热数据的分开存储。

若对逻辑地址执行垃圾回收操作(即擦除该逻辑地址对应的物理数据页中的数据),那么增大逻辑地址的更新周期,获得目标更新周期;计算目标更新周期与每个分组的预设周期的差异度;将物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块,从而使具有相近活跃度的数据存储在同一物理块中,实现冷热数据的分开存储。

(2)更新预设周期具体包括:

根据当前逻辑地址对应的当前更新周期更新当前逻辑地址对应的分组的预设周期。即:将当前分组的预设周期更新为当前分组对应的所有逻辑地址的更新周期的平均值。

可见,本实施提供的方案以分组的思想来存储冷热数据,从而可降低写放大,从而延长固态硬盘的寿命,降低成本,同时提高固态硬盘的性能。

下面对本申请实施例提供的一种数据处理装置进行介绍,下文描述的一种数据处理装置与上文描述的一种数据处理方法可以相互参照。

参见图4所示,本申请实施例公开了一种数据处理装置,包括:

获取模块401,用于获取垃圾回收指令;

确定模块402,用于确定所述垃圾回收指令对应的物理数据页;

查询模块403,用于查询所述物理数据页对应的逻辑地址;

增大模块404,用于增大所述逻辑地址的更新周期,获得目标更新周期;所述更新周期表示所述物理数据页中的数据的活跃度;

计算模块405,用于计算所述目标更新周期与每个分组的预设周期的差异度;

迁移模块406,用于将所述物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块。

优选地,所述增大模块具体用于:

将所述更新周期加倍,获得所述目标更新周期。

优选地,所述将所述物理数据页中的数据迁移至最小差异度对应的分组所对应的物理块之后,还包括:

I/O数据获取模块,用于获取所述逻辑地址对应的I/O数据;

操作I/O时间戳确定模块,用于确定所述I/O数据对应的操作I/O时间戳;

判断模块,用于判断逻辑地址的记录I/O时间戳是否为初始时间戳;

第一更新模块,用于若记录I/O时间戳不是初始时间戳,则将逻辑地址的更新周期更新为操作I/O时间戳与记录I/O时间戳的差值;

第二更新模块,用于将记录I/O时间戳更新为操作I/O时间戳;

差异度计算模块,用于分别计算更新周期与每个分组的预设周期的差异度;

存储模块,用于将I/O数据存储至最小差异度对应的目标分组所对应的目标物理块。

在一种优选地具体实施方式中,还包括:

更新周期判断模块,用于若记录I/O时间戳为初始时间戳,则判断更新周期是否为初始周期;

第三更新模块,用于若更新周期为初始周期,将记录I/O时间戳更新为操作I/O时间戳,并将更新周期更新为最小预设周期;

将I/O数据存储至最小预设周期对应的对象分组所对应的对象物理块。

在一种优选地具体实施方式中,还包括:

执行模块,用于若更新周期不是初始周期,则保留更新周期,并执行第二更新模块、差异度计算模块以及存储模块中的步骤。

在一种优选地具体实施方式中,存储模块具体用于:

将I/O数据写入目标分组对应的目标数据页,目标数据页为目标物理块中的物理数据页。

在一种优选地具体实施方式中,还包括:

第四更新模块,用于将目标分组的预设周期更新为目标分组对应的所有逻辑地址的更新周期的平均值。

在一种优选地具体实施方式中,还包括:

分组拆分判断模块,用于判断目标分组对应的数据页个数是否为其他分组对应的数据页个数的两倍;

拆分模块,用于若目标分组对应的数据页个数为其他分组对应的数据页个数的两倍,则关闭所有分组中的数据页个数最少的分组,将目标分组拆分为两个分组,并建立两个分组与目标物理块的对应关系。

在一种优选地具体实施方式中,还包括:

地址范围确定模块,用于确定逻辑地址所属的地址范围,将地址范围的记录I/O时间戳和更新周期确定为逻辑地址的记录I/O时间戳和更新周期。

其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。

可见,本实施例提供了一种数据处理装置,该装置可降低写放大,从而延长固态硬盘的寿命,降低成本,同时提高固态硬盘的性能。

下面对本申请实施例提供的一种数据处理设备进行介绍,下文描述的一种数据处理设备与上文描述的一种数据处理方法及装置可以相互参照。

参见图5所示,本申请实施例公开了一种数据处理设备,包括:存储单元501和主控制器502,其中:

存储单元包括物理块,物理块中的物理数据页用于存储I/O数据;

主控制器用于执行前述任意实施例公开的数据处理方法。

下面对本申请实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种数据处理方法、装置及设备可以相互参照。

一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的数据处理方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。

本申请涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。

需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 一种音频数据处理方法、装置、设备及可读存储介质
  • 一种数据处理方法、装置、电子设备及机器可读存储介质
技术分类

06120112941937