掌桥专利:专业的专利平台
掌桥专利
首页

管理备份系统的方法、电子设备和计算机程序产品

文献发布时间:2023-06-19 11:29:13


管理备份系统的方法、电子设备和计算机程序产品

技术领域

本公开的实施例涉及计算机领域,并且更具体地,涉及管理备份系统的方法、电子设备和计算机程序产品。

背景技术

近年来,随着计算机技术的发展,人们越来越关注数据存储的安全性。数据备份也逐渐成为保证数据安全性的一项常用技术。用户通常可以通过定制备份计划来使得备份系统自动地对数据进行备份,备份系统的任何异常都可能会影响用户的备份计划或者数据的安全性。因而,用户期望能够及时了解备份系统的健康状态。

发明内容

本公开的实施例提供一种用于管理备份系统的方案。

根据本公开的第一方面,提出了一种管理备份系统的方法。该方法包括:基于备份系统在第一时间段内的历史备份信息,确定与第一时间段相对应的至少一个时序特征,历史备份信息指示备份系统在第一时间段内执行的备份作业的数目的集合;基于至少一个时序特征,确定备份系统在第二时间段内预期执行的备份作业的一组预期数目;以及基于一组预期数目和备份系统在第二时间段内实际执行的备份作业的一组实际数目,确定备份系统的健康状态。

根据本公开的第二方面,提出了一种电子设备。该设备包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作,该动作包括:基于备份系统在第一时间段内的历史备份信息,确定与第一时间段相对应的至少一个时序特征,历史备份信息指示备份系统在第一时间段内执行的备份作业的数目的集合;基于至少一个时序特征,确定备份系统在第二时间段内预期执行的备份作业的一组预期数目;以及基于一组预期数目和备份系统在第二时间段内实际执行的备份作业的一组实际数目,确定备份系统的健康状态。

在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令,该机器可执行指令在设备中运行时使该设备执行根据本公开的第一方面所描述的方法的任意步骤。

提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。

图1图示了本公开的实施例可以在其中实现的示例环境的示意图;

图2图示了根据本公开实施例的管理备份系统的示例方法的流程图;

图3A至图3D图示了根据本公开实施例的提取时序特征的示意图;

图4图示了根据本公开实施例的确定备份系统的健康状态的示例方法的示意图;

图5图示了根据本公开实施例的确定备份系统的健康状态的示例方法的流程图;以及

图6图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

在数据备份系统中,用户通常可以通过定制数据备份计划来使得数据备份系统自动地执行数据备份。例如,用户可以通过规定什么数据需要被备份、什么时候进行备份、备份的周期或者备份的模式(增量式备份还是替换式备份)。在执行数据备份时,备份系统通常仅仅向用户反馈备份任务是否被顺利地完成,用户而无法获知备份系统当前是否健康。例如,由于某些设备的老化,备份的耗时可能大幅增加,这可能会影响到用户备份计划的执行。

一般地,在规定了备份计划后,用户不会高频率修改备份计划,并且待备份的数据也不会发生巨大的改变。因此,不同备份周期之间的备份情况通常具有一定的规律性。例如,在以一周为备份周期的示例中,不同周内的七天的备份作业的变化趋势将具有一定的相似性。这样的相似性可以用于帮助确定备份系统的健康状态。

根据本公开的实施例,提供了一种管理备份系统的方案。在该方案中,首先可以获取备份系统在第一时间段内的历史备份信息,并基于历史备份信息确定与第一时间段相对应的至少一个时序特征。至少一个时序特征随后可以用于确定备份系统在第二时间段内预期执行的备份作业的一组预期数目。进一步地,通过比较一组预期数目和备份系统在第二时间段内实际执行的备份作业的一组实际数目,可以确定备份系统的健康状态。基于这样的方式,本公开的实施例可以及时地确定备份系统的健康状态。

以下将参照附图来具体描述本公开的实施例。图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。如图1所示,计算设备140可以用于管理备份系统110。备份系统110可以用于接收用户规定的备份计划,并将需要备份的数据存储到备份存储设备中。在执行数据备份的过程中,备份系统110可以生成并保存备份日志,以指示所执行的历史备份作业。

计算设备140可以从备份系统接收历史备份信息120。历史备份信息120可以指示备份系统110在第一时间段内执行的备份作业的数目的集合。在一些实施例中,计算设备140可以获取备份系统110在第一时间段内的备份日志。备份日志例如可以记录每个备份作业的起始时刻和完成时刻。计算设备140可以对备份日志进行聚合,以确定备份系统110确定备份系统在第一时间段内执行的备份作业的数目的集合。在本公开的实施例中,“所执行的备份作业的数目”可以是指在单位时间内所接收的备份作业的数目、所完成的备份作业的数目或者是该单位时间内共执行的备份作业的总数目。

在一些实施例中,计算设备140可以根据备份系统110的备份周期,将第一时间段的备份日志聚合到比备份周期粒度更小的单位时间,从而获得数目集合。例如,当备份周期为一天时,计算设备140可以按照每个小时所执行的备份作业的数目来对备份日志进行聚合。在另一示例,当备份周期为一周时,计算设备140可以按照每天所执行的备份作业的数目来对备份日志进行聚合。

在一些实施例中,由于日志记录系统的异常,所确定的历史备份信息130可以具有某些异常数据(例如,前后小时均有备份作业,但中间小时为0)。计算设备140例如可以利用线性拟合的方式来修改这些异常数据。例如,计算设备140可以基于前后小时的备份作业的数目的平均值作为中间小时的备份数目的值。

在接收到史备份信息130后,计算设备140可以基于历史备份信息130来预测备份系统110在第二时间段内执行的备份作业的一组预期数目。在一些实施例中,为了预测的准确性,第一时间段通常长于第二时间段。如图1所示,计算设备140还可以从备份系统110接收备份系统110在第二时间段内实际执行的备份作业的一组实际数目130,并根据一组预期数目与一组实际数目130的比较来确定备份系统110的健康状态150。

下文将参考图2至图5来描述根据本公开实施例的管理备份系统的过程。图2示出了根据本公开的一些实施例的管理备份系统的方法200的流程图。方法200例如可以由图1中所示的计算设备140来实现。

如图2所示,在框202,计算设备140基于备份系统110在第一时间段内的历史备份信息120,确定与第一时间段相对应的至少一个时序特征,其中历史备份信息120指示备份系统110在第一时间段内执行的备份作业的数目的集合。

如参考图1所讨论的,计算设备140例如可以基于备份系统110的备份日志来获取历史备份信息120。历史备份信息120例如可以被表示为在第一时间段内的多个单位时间内所执行的备份作业的数目。图3A示出了根据本公开的实施例的与示例历史备份信息对应的时序数据300A。在图3A中,横坐标表示时间,纵坐标表示备份作业的数目。如图3A所示,时序数据300A中的每个点表示在每个小时内所执行的备份作业的数目。能够看到,不同天之间各小时的备份作业数目的变化趋势具有一定的相似性。

在一些实施例中,计算设备140可以对与历史备份信息对应的时序数据进行分解。具体地,计算设备140例如可以将时序数据分解为三种特征:趋势特征(trend),其指示时序数据的变化特征;周期特征(seasonal),指示时序数据的周期特征;或者随机特征(residual),指示时序数据除变化特征和周期特征外的随机性。图3B至图3D分别示出了对图3A所示的时序数据300A进行分解所获得的趋势特征300B、周期特征300C和随机特征300D。

在框204,计算设备140基于至少一个时序特征确定备份系统110在第二时间段内预期执行的备份作业的一组预期数目。在一些实施例中,计算设备140可以利用时序预测模型来处理至少一个时序特征以确定一组预期数目。时序预测模型可以是基于备份系统110先前的备份信息而构建的。

在一些实施例中,计算设备140例如可以利用SARIMA(季节时间序列)模型来确定一组预期数目。SARIMA模型是考虑了季节性的ARIMA模型,其可以表示为等式(1):

(p,d,q)×(P,D,Q)m (1)

p、d、q、P、D、Q和m是该模型的参数,其中p、d、q、P、D和Q是取值为1或者0的参数,m表示模型的周期参数。当备份周期为一天时,m例如可以被设置为24;当备份周期为一周时,m例如可以被设置为7;当备份周期为一年时,m例如可以被设置为12。

在一些实施例中,计算设备140可以利用备份系统110的先前的备份信息来确定SARIMA模型的参数。具体地,计算设备140可以选择如公式(2)表示的赤池(Akaike)信息量准则(AIC)来作为目标函数:

AIC=-2log(L)+2(p+q+k) (2)

其中L是数据的似然性,p是自回归部分的阶数,q是移动平均部分的阶数。k代表ARIMA模型的截距。对于AIC,如果k=1,则ARIMA模型中存在一个截距(c≠0),如果k=0,则ARIMA模型中不存在截距(c=0)。

进一步地,计算设备140可以通过对p、d、q、P、D和Q的可能取值(0或1)进行遍历,并根据备份系统110的先前备份信息来选择使得总的AIC最小的参数作为SARIMA模型的参数。具体地,计算设备140可以基于备份系统110的先前备份信息来提取一段时间内(例如,前1个月)的时序特征,并用来预测后一天内的备份作业数目。在完成SARIMA模型的训练后,计算设备140可以将与第一时间段相关联的时序特征输入到该模型中,进而获得备份系统110在第二时间段内预期执行的备份作业的一组预期数目。

在框206,计算设备140基于一组预期数目和备份系统110在第二时间段内实际执行的备份作业的一组实际数目130,确定备份系统110的健康状态150。

在一些实施例中,第二时间段例如可以仅包括一个单位时间。例如,在备份周期为天的示例中,计算设备140可以预测在第二天的第一个小时所执行的备份作业的预期数目,并在第二天获取实际数目。计算设备140例如可以通过比较预期数目与实际数目的差值来确定备份系统110是否异常。

在一些实施例中,为了避免模型不确定性所带来的影响,本公开中的第二时间段可以包括多个单位时间(例如,一个完整的备份周期)。图4示出了根据本公开实施例的确定健康状态150的示意图。如图4所示,计算设备140例如可以确定在未来一周的一组预期数目为:第一天所对应的预期数目402、第二天所对应的预期数目404、第三天所对应的预期数目406、第四天所对应的预期数目408、第五天所对应的预期数目410、第六天所对应的预期数目412以及第七天所对应的预期数目414。

如图4所示,计算设备140例如还可以在未来一周结束是确定备份系统110在过去一周真实执行的备份作业的一组实际数目:第一天所对应的实际数目442、第二天所对应的实际数目444、第三天所对应的实际数目446、第四天所对应的实际数目448、第五天所对应的实际数目450、第六天所对应的实际数目452以及第七天所对应的实际数目454。

在一些实施例中,计算设备140可以通过比较一组预期数目和一组实际数目来确定备份系统110的健康状态150。在一些实施例中,计算设备140例如可以将每个实际数目与对应的预期数目进行比较,以确定两者的差异是否大于预定的阈值。计算设备140进一步可以确定差异大于预定阈值的单位时间的数目。以图4为例,计算设备140例如可以确定以下预期数目和实际数目的差距大于阈值:预期数目404和实际数目444,预期数目408和实际数目448,预期数目412和实际数目452,预期数目414和实际数目454。也即,在图4的示例中,计算设备140可以确定存在4个单位时间,其中实际数目与对应的预期数目的差异大于阈值。

在一些实施例中,计算设备140进一步可以根据差异大于阈值的单位时间的数目或者比例来确定备份系统110的健康状态150。例如,对于图4的示例,计算设备140可以根据其中差异大于阈值的单位时间的数目(4)超过阈值(2),来确定备份系统110异常。备选地,计算设备140页可以根据其中差异大于阈值的单位时间的数目所占的比例(4/7)超过阈值(50%)来确定备份系统110异常。

在一些实施例中,计算设备140还可以进一步根据模型输出的置信度来确定备份系统110的健康状态150。以下将结合图5来描述框206的具体过程。图5示出了根据本公开实施例的确定备份系统的健康状态的示例方法的流程图。

如图5所示,在框502,针对一组预期数目中的第一预期数目,计算设备140可以确定与第一预期数目相关联的数目区间,数目区间内的数目的置信度高于预定的阈值。以图4作为示例,以预期数目402作为第一预期数目的示例,计算设备140可以确定与预期数目402相关联的数目区间422。考虑到模型输出的预期数目是预测数目的值与对应置信度的关系。例如,预期数目402可以具有最高的置信度,而比预期数目402的值更高或者更低的值具有相对低的置信度。因此,计算设备140可以确定对应的数目区间422,数目区间422中的每个数目的置信度都高于预定的阈值(例如,0.7)。应当理解,阈值的具体数值仅是示意性的,可以根据需要进行适应性地设置。

在框504,计算设备140可以从一组实际数目中确定与第一预期数目对应的第一实际数目。继续图4的示例,计算设备140可以确定与第一预期数目402对应的第一实际数目为实际数目422。

在框506,计算设备140可以通过比较第一实际数目和数目区间,确定备份系统110的健康状态150。继续图4的示例,计算设备140可以通过确定实际数目442是否落入数目区间422内来确定备份系统110的健康状态150。在第二时间段仅包括一个单位时间的实施例中,计算设备140例如可以仅基于第一实际数目与数目区间的比较结果来确定备份系统110的健康状态150。

备选地,对于在第二时间段仅包括多个单位时间的情形,计算设备140可以确定一组实际数目中落入与对应的数目区间中的实际数目的比例。继续图4的示例,计算设备140可以确定:实际数目442落入数目区间422,实际数目444未落入数目区间424,实际数目446落入数目区间426,实际数目448未落入数目区间428,实际数目450落入数目区间430,实际数目452未落入数目区间432,实际数目454未落入数目区间434。也即,计算设备140可以确定一组实际数目中落入与对应的数目区间中的实际数目的比例为3/7。

附加地,计算设备140可以将该比例与预定的比例阈值进行比较,并且响应于确定比例小于预定的比例阈值来确定备份系统110异常。例如,比例阈值可以被设置为50%,此时,计算设备140可以确定备份系统110异常。

在另一实施例中,对于在第二时间段仅包括多个单位时间的情形,计算设备140还可以确定一组实际数目中落入与对应的数目区间中的实际数目的个数。继续图4的示例,计算设备140可以确定一组实际数目中落入与对应的数目区间中的实际数目的个数为3。

附加地,计算设备140可以将该个数与预定的数目阈值进行比较,并且响应于确定个数小于预定的数目阈值来确定备份系统110异常。例如,数目阈值可以被设置为4,此时,计算设备140可以确定备份系统110异常。应当理解,上文中所涉及的所有具体数值仅是示意性的,不旨在作为对本公开的限制。

在一些实施例中,在确定健康状态150指示备份系统110的异常时,计算设备140可以提供关于异常的报警。计算设备140可以通过任何适当的方式(例如,文本、音频、视频、震动等)来提供关于异常的报警。

基于以上描述的方法,本公开的实施例利用备份系统中存在的周期性特点,通过将预测备份情况与真实备份情况进行比较来确定备份系统是否异常。本公开的实施例可以检测备份系统可能发生异常,进而提高了备份系统的稳定性。

图6示出了可以用来实施本公开内容的实施例的示例设备600的示意性框图。例如,根据本公开实施例的计算设备140可以由设备600来实施。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的各个过程和处理,例如方法200,可由处理单元601执行。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元606而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时,可以执行上文描述的方法200的一个或多个动作。

本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

相关技术
  • 管理备份系统的方法、电子设备和计算机程序产品
  • 用于管理备份系统的方法、装置和计算机程序产品
技术分类

06120112942052