掌桥专利:专业的专利平台
掌桥专利
首页

一种基于区块链内容唯一性的检测报告脱敏数据的管理方法

文献发布时间:2023-06-19 13:49:36


一种基于区块链内容唯一性的检测报告脱敏数据的管理方法

技术领域

本发明涉及医疗检测报告脱敏技术领域,尤其涉及一种基于区块链内容唯一性的检测报告脱敏数据的管理方法。

背景技术

随着医疗领域的数字化发展,医疗检测报告实现数字化交流传输,在临床研究及科研活动中,会对医疗检测报告数据先进行脱敏,将与病人和伦理相关的数据标签与检测报告解绑或删除,再提供给科研人员使用。反之,在特别情况下,也有从科研使用的脱敏数据反向找回相应原始数据,以查询病人等敏感信息的需求。

现有的脱敏数据管理方法是基于各种脱敏数据ID,通过检测报告的绑定组合,达到报告和脱敏数据间的映射关系。其缺点在于如果脱敏数据的ID有改动,则会失去这些ID源数据的信息,从而丢失原始数据与脱敏数据的对应关系。

为了克服上述不足,我们发明了一种基于区块链内容唯一性的检测报告脱敏数据的管理方法。

发明内容

本发明的发明目的在于解决现有的脱敏数据管理方法,存在如果脱敏数据的ID有改动,则会失去这些ID源数据的信息,从而丢失原始数据与脱敏数据的对应关系的问题。其具体解决方案如下:

一种基于区块链内容唯一性的检测报告脱敏数据的管理方法,按照以下的步骤进行:

步骤1,获取医疗检测报告的源数据a及其附带的多个数据标签,绑定源数据a与数据标签关系生成t1表,存放于数据库中;

步骤2,为每个数据标签生成其内容唯一且有对应关系的ID,即多个tag_id,tag_id与t1表的t1_id数据对应关系生成t2表,存放于数据库中;

步骤3,获取医疗检测报告脱敏后的源数据a对应的脱敏数据A;

步骤4,将t2表的t2_id数据与脱敏数据A进行绑定,生成t3表,存放于数据库中;

步骤5,获取数据库中t1、t2表中所有记录的对应关系,上传至区块链中;

步骤6,删除数据库中的t1表中的所有记录;

步骤7,当数据库中的t2或t3表中数据进行修改或者发生改变时,得到修改记录β;

步骤8,对修改记录β计算并生成新的唯一的hash值,上传到区块链中;

步骤9,当需要获取源数据a时,根据唯一hash值在区块链中查找对应区块。

进一步地,步骤1中所述数据标签为n个,数据标签与源数据a的对应关系为:n:1。

进一步地,所述t1表中列有n个t1_id数据。

进一步地,步骤2中所述tag_id为n个,tag_id与t1_id的对应关系为1:1。

进一步地,所述t2表中列有n个t2_id数据。

进一步地,所述t2_id与脱敏数据A的对应关系为n:1。

进一步地,步骤5中所述获取数据库中t1、t2表中所有记录的对应关系的方法如下:

步骤5-1,关联t1、t2表获取对应关系

α=源数据a:数据标签:t1_id:tag_id:t2_id,

多个数据标签对应多个α,每个数据标签对应一个α;

步骤5-2,将每一个α计算出hash值,上传区块链,作为其初始区块。

进一步地,步骤9中所述获取源数据a的方法如下:

步骤9-1,当唯一hash值查找到的是初始区块,则直接获取初始区块中的对应关系α,得到数据标签及源数据a;

步骤9-2,当唯一hash值查找到的不是初始区块,则通过区块中的修改记录β,一直回溯直至找到初始区块中的对应关系α,得到数据标签及源数据a。

进一步地,所述hash值为SHA256哈希值。

进一步地,所述n为大于1的自然数。

综上所述,采用本发明的技术方案具有以下有益效果:

本方案解决了现有的脱敏数据管理方法,存在如果脱敏数据的ID有改动,则会失去这些ID源数据的信息,从而丢失原始数据与脱敏数据的对应关系的问题。本方案利用区块链的技术,采用时序数据结构的特点,对原始数据以及脱敏数据标签或ID进行上链留存,保证数据不被篡改,其共识信任机制和多节点数据保存的方式,也避免了易丢失的问题。

利用原始数据与脱敏数据内容的映射唯一性及借助区块链时序数据结构的内容唯一性来管理脱敏数据,可以保证除非所有共识情况下的数据内容被修改,否则无论任一节点的标签修改或者本地数据库中的ID修改,都能保证脱敏数据与原始数据的对应关系,因此更高效、更安全地保证了其一一映射关系。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还能够根据这些附图获得其他的附图。

图1为本发明一种基于区块链内容唯一性的检测报告脱敏数据的管理方法的步骤图;

图2为本发明的源数据a、数据标签、ID、脱敏数据A的对应关系图;

图3为本发明的区块链的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1、2、3所示,一种基于区块链内容唯一性的检测报告脱敏数据的管理方法,按照以下的步骤进行:

S1,获取医疗检测报告的源数据a及其附带的多个数据标签,绑定源数据a与数据标签关系生成t1表,存放于数据库中;

S2,为每个数据标签生成其内容唯一且有对应关系的ID,即多个tag_id(也就是数据标签ID),tag_id与t1表的t1_id数据对应关系生成t2表,存放于数据库中;

S3,获取医疗检测报告脱敏后的源数据a对应的脱敏数据A;

S4,将t2表的t2_id数据与脱敏数据A进行绑定,生成t3表,存放于数据库中;

S5,获取数据库中t1、t2表中所有记录的对应关系,上传至区块链中;

S6,删除数据库中的t1表中的所有记录;

S7,当数据库中的t2或t3表中数据进行修改或者发生改变时,得到修改记录β;

S8,对修改记录β计算并生成新的唯一的hash值(hash值即哈希值,是通过对文件内容进行加密运算得到的一组二进制值,主要用途是用于文件校验或签名或加密),上传到区块链中;

S9,当需要获取源数据a时,根据唯一hash值在区块链中查找对应区块。

进一步地,S1中数据标签为n个,数据标签与源数据a的对应关系为:n:1。

进一步地,t1表中列有n个t1_id数据。

进一步地,S2中tag_id为n个,tag_id与t1_id的对应关系为1:1。

进一步地,t2表中列有n个t2_id数据。

进一步地,t2_id与脱敏数据A的对应关系为n:1。

进一步地,S5中获取数据库中t1、t2表中所有记录的对应关系的方法如下:

S5-1,关联t1、t2表获取对应关系

α=源数据a:数据标签:t1_id:tag_id:t2_id,

多个(即n个)数据标签对应多个α(比如:α1、α2…αn),每个数据标签对应一个α;

S5-2,将每一个α计算出hash值,上传区块链,作为其初始区块。

进一步地,S9中获取源数据a的方法如下:

S9-1,当唯一hash值查找到的是初始区块,则直接获取初始区块中的对应关系α,得到数据标签及源数据a;

S9-2,当唯一hash值查找到的不是初始区块,则通过区块中的修改记录β,一直回溯直至找到初始区块中的对应关系α,得到数据标签及源数据a。

进一步地,hash值为SHA256哈希值。(SHA256是安全散列算法SHA(Secure HashAlgorithm)系列算法之一,SHA256只是hash加密的一种方式)进一步地,n为大于1的自然数。

t1表

t2表

t3表

从图2中,可以看出数据标签ID,比如:ID-001、ID-002、…ID-00n,也可以理解为脱敏数据的ID。下面结合一个实例来说明本发明:

实施例1:

cDNA-L1检测数据分析报告-L000001(源数据)

cDNA-L1检测数据分析报告-TDA75536(脱敏数据)

在数据库中的t1表中,存储以下数据

在数据库中的t2表中,存储以下数据

在数据库中的t3表中,存储以下数据

根据t1、t2表关联后的对应关系,可以获取数据关系

α1=L000001:(姓名:张三):t101:ID-001:t201

α2=L000001:(性别:女):t102:ID-002:t202

α3=L000001:(年龄:37):t103:ID-003:t203

α4=L000001:(籍贯:四川):t104:ID-004:t204

α5=L000001:(送检编号:755268):t105:ID-005:t205

α6=L000001:(送检单位:人民医院):t106:ID-006:t206

α7=L000001:(检测者:蒋测):t107:ID-007:t207

α8=L000001:(审核者:沈禾):t108:ID-008:t208

α1在经过SHA256计算后得到哈希值:

7fd12b5b0f9741cb0bf9ef40f019b472e855e5ea8fefca0d82e9dcc74be28047

α2在经过SHA256计算后得到哈希值:

d8af3c37a489776f59223a7cc853b923df79213bfefc19b005de99012e0a003b

α3在经过SHA256计算后得到哈希值:

1982327ed96a94883123653f32ca57b851609809858cfa4d875fac061801d72d

……

α8在经过SHA256计算后得到哈希值:

5ff2b599b7bec63cbd2ed4f60675e447a8af71774e62d46142e669fd93279ecc

将α1至α8的数据关系及哈希值均上链至区块链中,作为其初始区块

删除数据库中的t1表

当数据标签(年龄:37)修改为(年龄:38)时,获取数据关系

β3=L000001:(年龄:38):t103:ID-003:t203

β3在经过SHA256计算后得到哈希值:

1ad7a250c41251a16c6fadf6c9c74317479ac06e8474e9b9d0fea91f9585fbc5

将β3的数据关系及哈希值上传至区块链中的α3对应区块链条的最后一个区块

当需要进行科学研究需要脱敏数据(也就是脱敏数据A)还原为源数据(也就是源数据a)时,根据哈希值

7fd12b5b0f9741cb0bf9ef40f019b472e855e5ea8fefca0d82e9dcc74be28047

查找到区块链条中的α1初始区块,获取其数据关系

α1=L000001:(姓名:张三):t101:ID-001:t201

当需要进行科学研究需要脱敏数据还原为源数据时,根据哈希值

1ad7a250c41251a16c6fadf6c9c74317479ac06e8474e9b9d0fea91f9585fbc5

查找到β3的区块,根据当前区块回溯区块链条,得到的α3初始区块,获取其数据关系

α3=L000001:(年龄:37):t103:ID-003:t203

依据如此方法,将其所有数据标签找回

而后,根据TAG-ID查找数据关系中对应的数据标签

如,TAG-ID=ID-001

根据ID-001在α1中,得到(姓名:张三)及t203

之后,根据t203在t3表中,获取脱敏数据TDA75536,根据脱敏标签所在位置,替换脱敏报告中的数据,即ID-001替换为(姓名:张三),则最终脱敏数据报告TDA75536显示如下:

cDNA-L1检测数据分析报告-TDA75536(脱敏数据)

综上所述,采用本发明的技术方案具有以下有益效果:

本方案解决了现有的脱敏数据管理方法,存在如果脱敏数据的ID(ID即Identitydocument缩写,是身份证标识号、账号、唯一编码、专属号码)有改动,则会失去这些ID源数据(即源数据a)的信息,从而丢失原始数据(即初始数据)与脱敏数据的对应关系的问题。本方案利用区块链的技术,采用时序数据结构的特点,对原始数据以及脱敏数据标签或ID进行上链留存,保证数据不被篡改,其共识信任机制和多节点数据保存的方式,也避免了易丢失的问题。

利用原始数据与脱敏数据内容的映射唯一性及借助区块链时序数据结构的内容唯一性来管理脱敏数据,可以保证除非所有共识情况下的数据内容被修改,否则无论任一节点的标签(即数据标签)修改或者本地数据库中的ID修改,都能保证脱敏数据与原始数据的对应关系,因此更高效、更安全地保证了其一一映射关系。

以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。

技术分类

06120113822115