基于电子卷宗的数据备份系统及数据恢复方法及装置
文献发布时间:2023-06-19 13:45:04
技术领域
本发明涉及数据处理领域,尤其涉及基于电子卷宗的数据备份系统及数据恢复方法及装置。
背景技术
随着司法信息化建设的深入,当前各级司法部门(法院、检察院、司法行政机关)存储的刑事案件卷宗每年以千万级的数量递增。为了便于刑事案件办理和节约卷宗管理成本,各级司法部门初步建设了电子化刑事案件卷宗和各自的网上办案业务系统。
现有的网上办案业务系统大多只是有个大致的功能框架,针对一些细节方面的问题仍未得到完善,而电子卷宗对于办案来说属于十分重要的资料,如果不能够保证其电子数据的安全性,将会对相关业务带来极为严重的隐患。
发明内容
本发明的目的是为了至少解决现有技术的不足之一,提供基于电子卷宗的数据备份系统及数据恢复方法及装置。
为了实现上述目的,本发明采用以下的技术方案:
具体的,提出基于电子卷宗的数据备份系统及数据恢复方法,包括以下:
获取原始的电子卷宗数据;
将原始的所述电子卷宗数据进行数据分割得到N块数据,将N块所述数据分别存储于分布式存储系统的N个存储节点中;
根据N块所述数据通过编码生成M块新的数据块,并确保N块数据与M块新的数据中的任意N块数据组合能够解码得到N块所述数据,将M块新的数据块分别存储于分布式存储系统的另外的M个存储节点中;
获取分布式存储节点中的N+M块存储节点的损坏节点值,判断所述损坏节点值是否小于N,若是则获取未损坏的存储节点的数据块的信息;
根据未损坏的存储节点的数据块的信息解码得到N块所述数据,并根据N块所述数据进行数据还原得到原始的电子卷宗数据。
进一步,所述方法还包括,
定义所述分布式存储系统中的部分存储节点为主存储节点,在所述主存储节点发生数据更新时,将更新前的存储数据版本予以保存,在发生文件覆盖或删除的情况时,通过版本恢复的方式进行数据恢复,在发生整个目录覆盖或删除的情况时,通过 CDP 数据持续保护机制进行数据恢复。
进一步,所述方法还包括,
将原始的所述电子卷宗数据同时存储于至少2个数据中心,即至少2个分布式存储系统,每个数据中心均在同城灾备数据中心进行数据备份,在所有数据中心均出现数据故障时,智能DNS自动切换IP解析至同城灾备数据中心,保障业务运行。
进一步,所述数据中心的数量为2个。
进一步,所述方法还包括,
设定一个阈值时间,在将更新前的存储数据版本的保存时长达到所述阈值时间时,自动清除所述存储数据版本。
本发明还提出基于电子卷宗的数据备份系统及数据恢复系统,包括以下:
数据获取模块,用于获取原始的电子卷宗数据;
数据分割模块,用于将原始的所述电子卷宗数据进行数据分割得到N块数据,将N块所述数据分别存储于分布式存储系统的N个存储节点中;
数据编码模块,用于根据N块所述数据通过编码生成M块新的数据块,并确保N块数据与M块新的数据中的任意N块数据组合能够解码得到N块所述数据,将M块新的数据块分别存储于分布式存储系统的另外的M个存储节点中;
判断模块,用于获取分布式存储节点中的N+M块存储节点的损坏节点值,判断所述损坏节点值是否小于N,若是则获取未损坏的存储节点的数据块的信息;
数据还原模块,用于根据未损坏的存储节点的数据块的信息解码得到N块所述数据,并根据N块所述数据进行数据还原得到原始的电子卷宗数据。。
进一步,所述系统还包括,
数据恢复模块,用于定义所述分布式存储系统中的部分存储节点为主存储节点,在所述主存储节点发生数据更新时,将更新前的存储数据版本予以保存,在发生文件覆盖或删除的情况时,通过版本恢复的方式进行数据恢复,在发生整个目录覆盖或删除的情况时,通过 CDP 数据持续保护机制进行数据恢复。
进一步,所述系统还包括,
容灾备份模块,用于将原始的所述电子卷宗数据同时存储于至少2个数据中心,即至少2个分布式存储系统,每个数据中心均在同城灾备数据中心进行数据备份,在所有数据中心均出现数据故障时,智能DNS自动切换IP解析至同城灾备数据中心,保障业务运行。
本发明还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述方法的步骤。
本发明的有益效果为:
本发明提出为电子卷宗的数据存储系统提供一个数据备份方法,将电子卷宗数据分割成N个数据块,并为N个数据块编码得到M个新的数据块,利用N+M个数据块中至少N个数据块的信息即可还原得到原始的电子卷宗数据,能够抵抗最多M个存储节点损坏的风险,能够极大的确保电子卷宗数据的安全性,为电子卷宗的相关业务提供保障。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为本发明基于电子卷宗的数据备份系统及数据恢复方法流程图;
图2所示为本发明基于电子卷宗的数据备份系统及数据恢复系统的结构示意图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。
参照图1,实施例1,本发明提出基于电子卷宗的数据备份系统及数据恢复方法,包括以下:
步骤110、获取原始的电子卷宗数据;
步骤120、将原始的所述电子卷宗数据进行数据分割得到N块数据,将N块所述数据分别存储于分布式存储系统的N个存储节点中;
步骤130、根据N块所述数据通过编码生成M块新的数据块,并确保N块数据与M块新的数据中的任意N块数据组合能够解码得到N块所述数据,将M块新的数据块分别存储于分布式存储系统的另外的M个存储节点中;
步骤140、获取分布式存储节点中的N+M块存储节点的损坏节点值,判断所述损坏节点值是否小于N,若是则获取未损坏的存储节点的数据块的信息;
步骤150、根据未损坏的存储节点的数据块的信息解码得到N块所述数据,并根据N块所述数据进行数据还原得到原始的电子卷宗数据。
在本实施例1中,为电子卷宗的数据存储系统提供一个数据备份方法,将电子卷宗数据分割成N个数据块,并为N个数据块编码得到M个新的数据块,利用N+M个数据块中至少N个数据块的信息即可还原得到原始的电子卷宗数据,能够抵抗最多M个存储节点损坏的风险,能够极大的确保电子卷宗数据的安全性,为电子卷宗的相关业务提供保障。
作为本发明的优选实施方式,所述方法还包括,
定义所述分布式存储系统中的部分存储节点为主存储节点,在所述主存储节点发生数据更新时,将更新前的存储数据版本予以保存,在发生文件覆盖或删除的情况时,通过版本恢复的方式进行数据恢复,在发生整个目录覆盖或删除的情况时,通过 CDP 数据持续保护机制进行数据恢复。
作为本发明的优选实施方式,所述方法还包括,
将原始的所述电子卷宗数据同时存储于至少2个数据中心,即至少2个分布式存储系统,每个数据中心均在同城灾备数据中心进行数据备份,在所有数据中心均出现数据故障时,智能DNS自动切换IP解析至同城灾备数据中心,保障业务运行。
作为本发明的优选实施方式,所述数据中心的数量为2个。
该方案带来的优势包括:
备份容灾由存储提供,无需单独的备份软件,节省备份软件的license费用
解决了传统存储及备份方案在大量非结构化数据的备份速度慢,安全性低,资源消耗大的痛点
支持单个文件快速回滚,少量文件恢复效率高
结合持续数据保护特性,可以恢复到三个月内的任何一个时间点。
当主存储的数据发生文件覆盖时,可以直接利用多版本恢复。如果是目录级别出现整个目录的覆盖或者删除,则可以通过 CDP 数据持续保护机制进行恢复。如果整个主存储文件丢失,则可以通过同城灾备数据中心的另一套分布式存储恢复,确保数据的安全。
作为本发明的优选实施方式,所述方法还包括,
设定一个阈值时间,在将更新前的存储数据版本的保存时长达到所述阈值时间时,自动清除所述存储数据版本。优选的,阈值时间设置为3个月。
参照图2,实施例2,本发明还提出基于电子卷宗的数据备份系统及数据恢复系统,包括以下:
数据获取模块,用于获取原始的电子卷宗数据;
数据分割模块,用于将原始的所述电子卷宗数据进行数据分割得到N块数据,将N块所述数据分别存储于分布式存储系统的N个存储节点中;
数据编码模块,用于根据N块所述数据通过编码生成M块新的数据块,并确保N块数据与M块新的数据中的任意N块数据组合能够解码得到N块所述数据,将M块新的数据块分别存储于分布式存储系统的另外的M个存储节点中;
判断模块,用于获取分布式存储节点中的N+M块存储节点的损坏节点值,判断所述损坏节点值是否小于N,若是则获取未损坏的存储节点的数据块的信息;
数据还原模块,用于根据未损坏的存储节点的数据块的信息解码得到N块所述数据,并根据N块所述数据进行数据还原得到原始的电子卷宗数据。。
作为本发明的优选实施方式,所述系统还包括,
数据恢复模块,用于定义所述分布式存储系统中的部分存储节点为主存储节点,在所述主存储节点发生数据更新时,将更新前的存储数据版本予以保存,在发生文件覆盖或删除的情况时,通过版本恢复的方式进行数据恢复,在发生整个目录覆盖或删除的情况时,通过 CDP 数据持续保护机制进行数据恢复。
作为本发明的优选实施方式,所述系统还包括,
容灾备份模块,用于将原始的所述电子卷宗数据同时存储于至少2个数据中心,即至少2个分布式存储系统,每个数据中心均在同城灾备数据中心进行数据备份,在所有数据中心均出现数据故障时,智能DNS自动切换IP解析至同城灾备数据中心,保障业务运行。
备份的目的是解决文件误删除、误覆盖导致的数据问题,通过备份可以恢复出历史的数据。海量非结构化数据的备份一直是传统存储以及备份方案的一大痛点,海量非结构化数据备份时间长,速度慢,安全性低,难恢复。
分布式对象存储内置文件多版本机制,文件的每次删除、覆盖历史的版本都会对应一个版本保存,单个文件覆盖或者被删除,都可以利用多版本机制进行恢复。如果是因为批量操作错误,导致大量文件被误删或者误覆盖,可以利用对象存储内置的数据持续保护功能,对桶数据进行三个月内的任意时间点的恢复。
本发明还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述方法的步骤。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例中的方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储的介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
- 基于电子卷宗的数据备份系统及数据恢复方法及装置
- 一种嵌入式数据库的数据备份系统及数据备份和恢复方法