掌桥专利:专业的专利平台
掌桥专利
首页

管理备份数据的方法、电子设备和计算机程序产品

文献发布时间:2023-06-19 12:19:35


管理备份数据的方法、电子设备和计算机程序产品

技术领域

本公开的实施例涉及计算机领域,并且更具体地,涉及管理备份数据的方法、电子设备和计算机程序产品。

背景技术

近年来,随着计算机技术的发展,人们越来越关注数据存储的安全性。数据备份也逐渐成为保证数据安全性的一项常用技术。随着用户备份的数据的规模变得越来越大,备份数据所需要的存储空间也越来越大。因此,如何有效地组织备份数据的存储已经成为当前的一个关注焦点。

发明内容

本公开的实施例提供一种用于管理备份数据的方案。

根据本公开的第一方面,提出了一种管理备份数据的方法。该方法包括:确定已对备份数据块执行的空间回收操作的次数;基于次数确定备份数据块的当前热度,当前热度至少指示备份数据块在将要执行的空间回收操作中被回收的可能性;以及根据备份数据块所在的原存储区域与当前热度不对应的确定,将备份数据块移动到与热度相对应的目标存储区域。

根据本公开的第二方面,提出了一种电子设备。该设备包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作,该动作包括:确定已对备份数据块执行的空间回收操作的次数;基于次数确定备份数据块的当前热度,当前热度至少指示备份数据块在将要执行的空间回收操作中被回收的可能性;以及根据备份数据块所在的原存储区域与当前热度不对应的确定,将备份数据块移动到与热度相对应的目标存储区域。

在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令,该机器可执行指令在设备中运行时使该设备执行根据本公开的第一方面所描述的方法的任意步骤。

提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。

图1图示了本公开的多个实施例能够在其中实现的示例环境的示意图;

图2示出了示例空间回收过程的示意图;

图3图示了根据本公开实施例的管理备份数据的过程的流程图;

图4图示了根据本公开实施例的移动备份数据的示意图;

图5图示了根据本公开实施例的移动备份数据的示例过程的流程图;以及

图6图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

图1示出了本公开实施例可以在其中被实施的环境100的示意图。如图1所示,环境100包括计算设备110和备份存储装置120。备份存储装置120可以包括多个存储块130,每个存储块中130可以存储预定大小的备份数据块135。计算设备120可以管理备份存储装置120中的备份数据块135的组织。

例如,备份存储装置120中的备份数据块135可能因为备份到期而失效。作为示例,计算设备110可以设置规则以使得备份数据块135在没有被任何备份文件引用的一段时间后将被标记为失效。由于备份存储块装置120总是以存储块130为单位来统一分配或释放,计算设备110可以通过空间回收过程(例如,垃圾回收)来释放无效备份数据块135所占用的存储空间。图2示出了根据示例空间回收过程的示意图200。

如图2所示,存储块130-1中包括多个备份数据块212-228,存储块130-2中包括多个备份数据块232-248,其中以斜线示出的备份数据块220、224、226、234、240、242、244、246和248表示这些备份数据块已经因为备份过期或备份被删除而处于无效状态。在空间回收过程中,计算设备110例如可以通过申请新的存储块210,并将原存储块130-1和存储块130-2中未被标记为无效的备份数据块212、214、216、218、222、228、232、236和238写入到新的存储块210中。随后,计算设备110可以释放原有的存储块130-1和130-2,从而实现对空间的回收。

由于计算设备110需要以存储块为单位来申请和回收空间,这使得在空间回收过程中,计算设备110需要对部分备份数据块进行重复写入。例如,对于图2中的示例,如果存储块210在新的空间回收过程中需要与又一存储块进行有效备份数据块的合并,但是例如备份数据块212仍然被标记为有效状态。在这种情况下,备份数据块212将再一次被写入到新的存储块。在备份系统中,备份数据块通常是被随机组织的,因此,诸如备份数据块212这种比较稳定的备份数据块可能在空间回收过程中经历反复的重复写入。

目前,越来越多的高性能存储装置(例如,固态硬盘)被用作备份存储装置120。这样的高性能存储装置通常具有更优的性能,然而它们的可写入次数通常往往更加有限。备份数据块的反复重复写入将严重影响备份存储块装置120的可用寿命,这是用户所不期望的。

根据本公开的实施例,提供了一种管理备份数据的方案。在该方案中,已对备份数据块执行的空间回收操作的次数被确定,并且随后被用于数确定备份数据块的当前热度,其中当前热度至少指示备份数据块在将要执行的空间回收操作中被回收的可能性。当备份数据块所在的原存储区域与当前热度不对应时,备份数据块将被移动到与热度相对应的目标存储区域。基于这样的方式,备份数据块总是按照热度来被组织,从而使得在空间回收过程中较大几率被回收的备份数据块将被大概率被聚集到相同的存储区域中。这能够使得存储热度较低的备份数据块的存储区域更加稳定,从而减少因为后续空间回收而导致的数据重写。

下文将参考图3至图5来描述根据本公开实施例的存储管理的过程。图3示出了根据本公开的一些实施例的管理备份数据的过程300的流程图。过程300例如可以由图1中所示的计算设备110来实现。

在框302,计算设备110确定已对备份数据块135执行的空间回收操作的次数。例如,计算设备110可以为每个备份数据块135记录其已经经历的空间回收操作的次数。经历了多次空间回收操作次数但仍未被回收,这可以表示该备份数据块135在备份系统中较为稳定。

应当理解,框302的过程可以周期性地被执行,也可以在每次空间回收操作后而被执行。此外,框302的过程也可以响应于管理员的请求而被执行。应当理解,上述示例仅仅是说明性的而非限制性的,本公开不旨在对此进行限制。

在框304,计算设备110基于次数确定备份数据块的当前热度,其中当前热度至少指示备份数据块在将要执行的空间回收操作中被回收的可能性。

在一些实施例中,计算设备110可以根据次数与预定次数阈值的比较确定当前热度。具体地,在一些实施例中,当确定次数大于或等于次数阈值时,计算设备110可以将当前热度确定为预定值。例如,当次数大于预定的次数阈值(例如,10次)时,计算设备110可以将该备份数据块的当前热度例如确定为0,以指示该备份数据块非常稳定,以后也较小可能被回收。

在一些实施例中,在确定次数小于次数阈值时,计算设备110可以基于次数与次数阈值的差来确定当前热度。在一些实施例中,计算设备110例如可以基于以下的公式(1)来确定备份数据块的当前热度:

C

例如,以C

在框306,计算设备110根据备份数据块所在的原存储区域与当前热度不对应的确定,将备份数据块移动到与热度相对应的目标存储区域。

在一些实施例中,计算设备110可以将备份存储设备120中的空间预先组织为多个不同存储区域,其中一个存储区域可以为包括一个或多个存储块。例如,计算设备110可以通过预先申请多个不同的连续空间作为不同的存储区域。进一步地,计算设备110可以将不同的存储区域与不同的热度相关联,使得同一存储区域中总是存储相同热度的备份数据块。

以图4作为示例,图4示出了根据本公开实施例的移动备份数据的示意图400。如图4所示,备份存储设备120可以包括不同的存储区域410和420,其中例如存储区域410与较低的热度(例如,1)相关联,而存储区域420与较高的热度(例如,2)相关联。

在一些实施例中,伴随着新的空间回收操作,备份数据块的当前热度可能会被更新。在这种情况下,它们需要被移动到新的存储区域中。具体地,计算设备110首先可以确定与所述原存储区域相对应的原热度。

以图4中的备份数据块458和466为例,在经历了新的空间回收过程后,备份数据块458和466的当前热度基于等式(1)被确定为1。它们先前被确定的原热度则是与存储区域450相对应的热度(例如,2)。在确定所述原热度与所述当前热度不同时,计算设备110可以确定所述备份数据块所在的原存储区域与所述当前热度不对应。在这种情况下,计算设备110可以移动备份数据块458和466。

以下将参考图5来描述移动备份数据块具体过程,图5示出了根据本公开实施例的移动备份数据的示例过程的流程图。如图5所示,在框502,计算设备110可以从一组预定存储区域中确定与所述当前热度相对应的所述目标存储区域。继续以图4中的备份数据块458和466作为示例,在确定了它们的当前热度为1后,计算设备110可以从与不同热度相对应的一组存储区域中确定与热度1相对应的存储区域为存储区域410。

在框504,计算设备110可以将所述备份数据块移动到所述目标存储区域中的可用存储空间。如图所示,计算设备110可以在存储区域410中的分配新的存储空间以用于存储备份数据块458和466中的数据,即形成新的备份数据块430和432。进一步地,计算设备110可以将存储区域450中用于存储数据块458和466的存储空间标记为无效。应当理解,以上示例中关于热度的具体数值都是示意性的,本公开不旨在对此进行限制。

由于存储区域410是预先分配的较大的存储空间,计算设备110可以在尾部的可用空间中依次写入新的备份数据块430和432,而不会影响其它已有的备份数据块。通常,计算设备110只有在一个存储块中的无效备份数据块的占比达到预定阈值时才执行存储块的合并以及释放。因此,考虑到存储区域410中的备份数据块在未来的空间回收操作中均较低概率失效,存储区域410中无效备份数据块的占比超过阈值的可能性将会非常小,这使得该存储区域中的备份数据块不用发生重复写入。

考虑到较低热度的存储区域410中的部分备份数据块仍然可能会因为备份文件删除等原因而被标记为无效,在一些实施例中,对于同一个存储区域410中的不同存储块,计算设备110仍然可以按照传统方式进行合并写入来释放存储块的空间。例如,计算设备110可以通过扫描同一存储区域410中的每个存储块中的无效备份数据块,来确定无效备份数据块的占比是否超过阈值。在确定无效备份数据块的占比超过阈值时,计算设备110可以在该存储区域申请新的一个存储块来写入超过阈值的存储块中的有效备份数据块,并且随后释放先前超过阈值的存储块。基于这样的方式,计算设备110可以提高同一存储区域410中的空间利用率。

根据以上所描述的方法,本公开的实施例可以按照热度来组织不同的存储区域。基于这样的方式,在经历新的空间回收操作时,与较低热度相关联的存储区域中存储的数据均是热度较低的备份数据块。因此,这些备份数据块在未来的空间回收操作中将较大概率仍保持有效,从而使得与较低热度相关联的存储区域在后续的空间回收过程中将较低概率发生重复写入的操作。与传统的随机存储方式相比,本公开的实施例能够延长备份存储设备的可使用寿命。

图6示出了可以用来实施本公开内容的实施例的示例设备600的示意性框图。例如,根据本公开实施例的计算设备110可以由设备600来实施。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的各个过程和处理,例如过程300,可由处理单元601执行。例如,在一些实施例中,过程300可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时,可以执行上文描述的过程300的一个或多个动作。

本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

相关技术
  • 管理备份数据的方法、电子设备和计算机程序产品
  • 用于备份数据的方法、电子设备和计算机程序产品
技术分类

06120113255996