掌桥专利:专业的专利平台
掌桥专利
首页

基于区块链的数据生命周期管理系统

文献发布时间:2023-06-19 11:16:08


基于区块链的数据生命周期管理系统

技术领域

本发明涉及数据生命周期管理技术领域,具体提供一种基于区块链的数据生命周期管理系统。

背景技术

数据生命周期管理是一套基于策略,用来管理数据库和数据资产的技术。用于管理信息系统的数据在整个生命周期内的流动:从创建和初始存储,直至过时被删除。如何存储数据的流转记录是数据生命周期管理的核心。数据流转记录指数据在系统中的处理记录,包括了同一条数据修改记录,和从源数据处理获得新数据的记录两种形式。

现有的数据生命周期管理方法中,数据流转记录被集中存储在传统数据库中,这对数据的安全性和不可篡改性存在很大的挑战。

区块链技术,也被称之为分布式账本技术,是一种由若干台计算设备共同参与“记账”,共同维护一份完整的分布式数据库的新兴技术。由于区块链技术具有去中心化、公开透明、每台计算设备可以参与数据库记录、并且各计算设备之间可以快速的进行数据同步的特性,利用区块链技术来搭建去中心化系统,并在区块链的分布式数据库中收录各种执行程序进行自动执行,已在众多的领域中广泛的进行应用。

发明内容

为了解决现有的数据生命周期管理方法存在的缺陷,本发明提供了一种数据生命周期管理系统,其具体技术方案如下:

一种基于区块链的数据生命周期管理系统,其包括多个数据处理组件节点和管理组件节点组成的区块链,其中:

所述管理组件节点用于通过分发秘钥管理所述数据处理组件节点的身份认证、加入及退出;

所述数据处理组件节点用于:

对与其对应的数据处理组件上传的交易数据进行源数据存在性验证,驳回未通过源数据存在性验证的交易数据并返回错误码,对通过源数据存在性验证的交易数据进行签名并在区块链上广播,以触发其他数据处理组件节点对所述交易数据进行验证及上链。

在一些实施例中,所述交易数据包括数据流转记录及与所述数据流转记录对应的源数据的哈希码,所述数据流转记录包括数据生成记录和数据修改记录。

在一些实施例中,所述对数据处理组件上传的交易数据进行源数据存在性验证包括:从所述数据处理组件上传的交易数据中获取所述数据流转记录对应的源数据的哈希码;基于所述源数据的哈希码确定所述对应的源数据是否存在,如果存在,则通过源数据存在性验证,否则,未通过源数据存在性验证。

在一些实施例中,所述管理组件节点为每个所述数据处理组件节点分发一对私钥及公钥;所述数据处理组件节点采用自己的私钥对通过源数据存在性验证的交易数据进行签名并在区块链上广播;其他数据处理组件节点使用上传所述交易数据的数据处理组件节点的公钥对所述交易数据进行身份验证,驳回未通过验证的交易数据并返回错误码,将通过验证的交易数据存储至区块链。

在一些实施例中,所述数据处理组件节点将通过验证的交易数据存储至区块链包括:若所述通过验证的交易数据中的数据流转记录为数据生成记录,则将所述通过验证的交易数据处理成初始流转记录块并存储至区块链;若所述通过验证的交易数据中的数据流转记录为数据修改记录,则将所述通过验证的交易数据处理成修改流转记录块并存储至区块链。

在一些实施例中,所述交易数据中的所述数据流转记录均带有时间戳。

在一些实施例中,所述区块链为私有链或联盟链。

与现有技术相比,本发明具有以下突出的有益效果:所述数据流转记录被存储在区块链上,从而保证了数据流转记录的不可篡改和可追溯,保证数据的安全,具有良好的推广应用价值。

附图说明

图1为本发明中的基于区块链的数据生命周期管理系统的示意图;

图2为本发明中数据在生命周期内的流转过程示意图;

图3为本发明中数据处理组件节点将数据流转记录存储至区块链的流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

现有的数据生命周期管理方法中,数据流转记录被集中存储在传统数据库中,这对数据的安全性和不可篡改性存在很大的挑战。

鉴于此,本发明提出了一种基于区块链的数据生命周期管理系统,如图1所示,其包括由若干数据处理组件节点和管理组件节点(未图示)组成的区块链。其中:

管理组件节点为与管理组件对应的授权节点,其通过分发秘钥管理每个数据处理组件节点的身份认证、加入及退出。即,管理组件节点给每个具有权限的数据处理组件节点均分发一对公私钥,其中私钥返回给数据处理组件节点,公钥则被存储至区块链中以供其他所有的数据处理组件节点使用。

数据处理组件节点与数据处理组件一一对应的数据处理节点,数据处理组件用于存储及处理数据,其在处理过程中即能产生数据流转记录。根据数据处理的具体类型,可以将数据流转记录区分为数据生成记录和数据修改记录。

如果,当前的数据处理组件从外部的数据源处获得数据并基于获得的数据产生新数据时,此时,伴随其产生的数据流转记录为数据生成记录;而如果,当前的数据处理组件接收其他数据处理组件提供的已存在于系统中的数据并对该数据进行处理产生新数据时,此时,伴随其产生的数据流转记录为数据修改记录。

当然,无论是数据生成记录还是数据修改记录,其均应存在相应的源数据,如,数据生成记录对应的源数据即为对应的数据处理组件从外部数据源处获得的数据。该外部数据源数据即为数据的原始来源。数据修改记录则为对应的数据处理组件接收到的其他数据处理组件提供的已存在于系统中的数据。

为了将数据流转记录与其源数据进行关联存储,数据处理组件通过哈希运算将源数据转换为哈希码,并将数据流转记录与其对应的源数据的哈希码关联(或者说是打包)在一起以形成一条完整的交易数据。

数据处理组件生成交易数据后,通过与其对应的数据处理组件节点将该交易数据存放至区块链数据库中,从而实现对数据流转记录的上链存储。

当然,在此之前,需要开发出区块链系统适配器,以实现数据处理组件节点与区块链数据库之间的数据交互。

继续参考图1和图3所示,在一个具体实施例中,本发明共包括四个数据处理组节点,分别为数据处理组件节点A、数据处理组件节点B、数据处理组件节点C及数据处理组件节点D,在一个应用例中,某个数据的数据流转记录的上链过程大致如下:

数据处理组节点A对应的数据处理组件从外部数据源处获取到外部源数据(即将外部源数据引入至系统内),数据处理组节点A对应的数据处理组件在完成对外部源数据的处理后生成两条新数据,记为数据Ar1和数据Ar2,在此过程中,数据处理组件内相应形成两条数据流转记录(未数据生成记录)。数据处理组节点A将两条数据流转记录及对应的源数据(外部源数据)的哈希码经区块链系统适配器上传至区块链数据库,区块链数据库内即生成两个对应的数据记录块,记为初期流转记录块1和初始流转记录块2。

数据Ar1和数据Ar2被数据处理组节点B对应的数据处理组件获取,数据处理组节点B对应的数据处理组件对数据Ar1和数据Ar2进行处理从而获得一条新数据,记为数据Br,在此过程中,数据处理组件内相应形成一条数据流转记录(为数据修改记录)。数据处理组节点B将该数据流转记录及对应的源数据(数据Ar1和数据Ar2)的哈希码经区块链系统适配器上传至区块链数据库,区块链数据库内生成一个对应的数据记录块,记为修改流转记录块3,该修改流转记录块3经哈希指针分别与初期流转记录块1和初始流转记录块2链接。

接着,数据Br被数据处理组节点C对应的数据处理组件获取,数据处理组节点C对应的数据处理组件对数据Br进行修改处理获得一条新数据,记为Cr,在此过程中,数据处理组件内相应形成一条数据流转记录(为数据修改记录)。数据处理组节点C将该数据流转记录及对应的源数据(数据Br)的哈希码经区块链系统适配器上传至区块链数据库,区块链数据库内生成一个对应的数据记录块,记为修改流转记录块4。该修改流转记录块4经哈希指针与流转记录块3链接。

接着,数据Cr被数据处理组节点D对应的数据处理组件获取,并接着形成新的修改流转记录块。

可见,外部源数据自进入本发明的数据生命周期管理系统后,其生命周期内的每个流转环节均被记录至区块链内,且各数据流转记录块按着其生成的时间顺序依次关联,从而形成一条完整的数据流转线索链。

为了使得本领域技术人员更清楚地了解本发明的技术方案,下文将结合图3以某个数据处理组件节点为例,对本发明中的数据流转记录的上链过程进行更加详细的描述。为了描述方面,我们将该数据处理组件节点记为数据处理组件节点E。

如图3所示,在一些具体实施例中,数据处理组件节点E将数据流转记录存储至区块链数据库(数据上链)的过程具体如下:

首先,数据处理组件节点E接收对应的数据处理组件发送的交易数据,该交易数据包括数据流转记录及与数据流转记录对应的源数据的哈希码,数据流转记录为数据生成记录或数据修改记录。

数据处理组件节点E从接收到的交易数据中取出与数据流转记录对应的源数据的哈希码,并基于该源数据的哈希码判断对应的源数据是否存在于系统中。如果存在,说明该数据流转记录是可信的,通过源数据存在性验证。否则,说明该数据流转记录不可信,直接返回错误码,上链过程提前结束。

数据处理组件节点A采用自己的私钥对通过源数据存在性验证的交易数据进行签名,然后将完成签名后的交易数据提交至区块链并在区块链上广播。

其他数据处理组件节点从区块链上取得与数据处理组件节点A的私钥成对生成的公钥,并使用公钥对签名后的交易数据进行验证以实现对数据处理组件节点A的身份验证。验证通过,则将交易数据进行哈希处理后存储至区块链数据库中。否则,驳回未通过验证的交易数据并返回错误码。

继续参考图3,将经过哈希处理后的交易数据存储至区块链数据库的具体过程如下:

若通过验证的交易数据中的数据流转记录为数据生成记录,则将该通过验证的交易数据打包成初始流转记录块并存储至区块链数据库内。

若通过验证的交易数中的数据流转记录为数据修改记录,则将该通过验证的交易数据打包成修改流转记录块并存储至区块链中,特别的,新生成的修改流转记录块与上一个流转记录块通过哈希指针连接。

从前文描述可知,使用本发明的数据生命周期管理系统进行数据管理,数据在其生命周期中的每个环节的流转情况及对应的源数据的哈希码均被永久性、无篡改地存储在区块链数据库中,且各数据流转记录块按生成的时间顺序依次连接成链。因此,其在实现数据溯源、数据恢复方面具有极大的优势。

数据溯源:

如图1和图2所示,由于各数据流转记录块按着其生成的时间顺序依次关联并形成一条完整的数据流转线索链。因此,只需要顺着该数据流转线索链即能了解到数据在整个生命周期中的演变过程,并追溯到生成该数据的原始数据,即最初被引入至系统的外部源数据。

数据恢复:

由于每条数据流转记录均带有时间戳,如果需要将数据回滚到某个时间戳的历史状态。只需要通过数据溯源先获得数据的外部源数据,然后从该外部数据源开始按着数据流转线索链重新执行相应的数据流转过程即能将数据的回滚到该时间戳对应的历史状态。

上文对本发明进行了足够详细的具有一定特殊性的描述。所属领域内的普通技术人员应该理解,实施例中的描述仅仅是示例性的,在不偏离本发明的真实精神和范围的前提下做出所有改变都应该属于本发明的保护范围。本发明所要求保护的范围是由所述的权利要求书进行限定的,而不是由实施例中的上述描述来限定的。

相关技术
  • 基于区块链的数据生命周期管理系统
  • 一种基于区块链技术的设备全生命周期管理系统及其方法
技术分类

06120112859605