掌桥专利:专业的专利平台
掌桥专利
首页

一种数据脱敏方法和装置

文献发布时间:2023-06-19 11:39:06


一种数据脱敏方法和装置

技术领域

本发明涉及计算机软件领域,特别涉及一种证券业敏感数据的脱敏方法和装置。

背景技术

随着信息技术的高速发展,企业业务系统经过多年沉淀,积累了大量个人隐私数据和企业高价值信息。海量数据除了内部流转,还需要进行外部“共享”,这亦是国家大数据发展战略规划的需求和前提。如何保证数据在产生、交换、共享,开发测试等场景下的安全可用,成为目前客户急需解决的关键问题。而数据脱敏也成为以上问题解决的重要手段之一。

数据脱敏顾名思义就是对敏感数据进行变形处理,其目的是保护隐私数据等信息的安全,例如机构和企业收集的个人身份信息、手机号码、银行卡信息等敏感数据。数据脱敏技术一般应用于数据外发场景,例如需要将生产数据导出发送给开发人员、测试人员、分析人员等。

现有静态脱敏产品和技术,更多的是基于通用的个人隐私数据,如身份证号,手机号,电子邮箱等进行遮蔽或仿真算法的脱敏处理。其中,遮蔽方式主要是针对高敏数据进行一部分信息,通过*等无效字符进行替换,以达到数据降低敏感程度的目的。仿真是通过符合数据格式要求的算法生产一个数据格式符合要求,但内容已经无意义的新数据进行替换,例如对身份证号进行符合格式要求的数字替换,得到另一仿真身份证号。

然而,现有技术主要是针对通用个人隐私信息进行脱敏处理,而对于证券行业专有特性的高价值及高敏数据或数据趋势缺乏有针对性的脱敏算法支持,造成证券行业特有高敏数据缺乏保护手段。

特别重要地,目前的脱敏技术更多的是针对单独的数据或同一条数据的关联性进行相应的脱敏处理。例如一条身份证号,一个手机号,或者保持一条数据中身份证号和生日的关联关系的脱敏处理,而缺乏对于连续数据所能体现的趋势性的高价值信息进行脱敏掩盖的能力。由于证券行业相关敏感数据往往可通过大结构或大额用户的证券交易趋势暴露证券交易市场一定走向,对证券交易会产生很大的指导性影响,因此证券交易趋势在证券行业是非常高价值的信息情报。目前脱敏技术和产品均无法对该类高敏信息进行安全保护处理。

发明内容

因此,发明人认为,有必要发明一种可安全有效遮蔽证券交易趋势信息的数据脱敏方案。

基于此,发明人提出了一种数据脱敏方法,包括如下步骤:

获取待脱敏数据;

根据所述待脱敏数据建立第一趋势数据和第二趋势数据;

获取用户密码,根据所述用户密码和预设的动态密钥方案获取动态密钥;

根据所述用户密码和动态密钥,对所述第一趋势数据进行变更处理,得到新第一趋势数据;

通过所述新第一趋势数据建立新第二趋势数据,并根据所述新第二趋势数据、用户密码和动态密钥,对所述第二趋势数据做变更处理。

进一步地,所述的数据脱敏方法中,所述步骤“根据所述用户密码和预设的动态密钥方案获取动态密钥”具体包括:根据设备唯一序列号和基于时间的随机数获取动态因子;

根据动态因子生成密钥队列,所述密钥队列长度大于102400;

对所述密钥队列做加密处理,所述加密处理方法包括DES或SHA;

根据所述用户密码获取密钥因子;

根据所述密钥因子生成动态密钥。

进一步地,所述的数据脱敏方法中,所述步骤“根据所述密钥因子生成动态密钥”具体包括:

通过所述密钥因子从所述密钥队列中获取动态密钥定义块并对其进行解密;

获取动态密钥的类型定义;

通过所述动态密钥的类型定义和所述密钥因子生成动态密钥。

进一步地,所述的数据脱敏方法中,所述待脱敏数据的数量为3*N,其中N为用户配制的最小条目数量的10倍;所述第一趋势数据以N条待脱敏数据作为基线。

进一步地,所述的数据脱敏方法中,在经过对待脱敏数据的变更处理后,还包括数据还原过程,具体包括如下步骤:

从已经过脱敏处理的数据中获取待还原数据,所述待还原数据的数量为3*N,其中N为用户配制的最小条目数量的10倍;

获取用户密码,根据所述用户密码获取解密密钥;

根据用户密钥和解密密钥对所述待还原数据进行第一还原处理并拆分为3份,获得第一还原数据;

根据用户密钥和解密密钥对所述第一还原数据进行第二还原处理,获得第二还原数据。

发明人同时提出了一种数据脱敏装置,包括通讯单元、存储单元、趋势模型获取单元、动态密钥获取单元和加密单元;

所述通讯单元用于获取待脱敏数据并将其存储于所述存储单元;

所述趋势模型获取单元用于根据所述待脱敏数据建立第一趋势数据和第二趋势数据;

所述通讯单元还用于获取用户密码,所述动态密钥获取单元用于根据所述用户密码和预设的动态密钥方案获取动态密钥;

所述加密单元用于根据所述用户密码和动态密钥,对所述第一趋势数据进行变更处理,得到新第一趋势数据;

所述加密单元还用于通过所述新第一趋势数据建立新第二趋势数据,并根据所述新第二趋势数据、用户密码和动态密钥,对所述第二趋势数据做变更处理。

进一步地,所述的数据脱敏装置中,所述所述动态密钥获取单元“根据所述用户密码和预设的动态密钥方案获取动态密钥”具体包括:

根据设备唯一序列号和基于时间的随机数获取动态因子;

根据动态因子生成密钥队列,所述密钥队列长度大于102400;

对所述密钥队列做加密处理,所述加密处理方法包括DES或SHA;

根据所述用户密码获取密钥因子;

根据所述密钥因子生成动态密钥。

进一步地,所述的数据脱敏装置中,所述动态密钥获取单元“根据所述密钥因子生成动态密钥”具体包括:

通过所述密钥因子从所述密钥队列中获取动态密钥定义块并对其进行解密;

获取动态密钥的类型定义;

通过所述动态密钥的类型定义和所述密钥因子生成动态密钥。

进一步地,所述的数据脱敏装置中,所述待脱敏数据的数量为3*N,其中N为用户配制的最小条目数量的10倍;所述第一趋势数据以N条待脱敏数据作为基线。

进一步地,所述的数据脱敏装置中,还包括还原单元,所述还原单元用于在经过对待脱敏数据的变更处理后,对数据进行还原过程,具体包括:

从已经过脱敏处理的数据中获取待还原数据,所述待还原数据的数量为3*N,其中N为用户配制的最小条目数量的10倍;

获取用户密码,根据所述用户密码获取解密密钥;

根据用户密钥和解密密钥对所述待还原数据进行第一还原处理并拆分为3份,获得第一还原数据;

根据用户密钥和解密密钥对所述第一还原数据进行第二还原处理,获得第二还原数据。

本发明技术方案通过多级动态因子和双因子(用户密钥结合动态密钥)对证券交易流水的趋势情况,通过分割数据单元,扰乱两级数据单元的方式最终实现证券交易流水趋势的高价值信息进行遮蔽和掩盖,从而保证数据在共享、传递、测试环境等多个场景中的安全,避免泄露。同时该算法支持可恢复方式,保证了数据被授权后,便捷,安全再利用的能力。由于动态多因子的不可预估和猜测的条件,极大的提高了数据脱敏后被破解的难度,大大提高的数据的安全性。

附图说明

图1为本发明一实施方式所述的数据脱敏方法的流程图;

图2为本发明一实施方式所述的数据脱敏装置的结构示意图。

附图标记说明:

1-通讯单元

2-存储单元

3-趋势模型获取单元

4-动态密钥获取单元;41-动态因子获取模块;42-密钥队列获取模块;

43-密钥因子获取模块

5-加密单元

6-还原单元

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。

请参阅图1,为本发明一实施方式所述的数据脱敏方法的流程图;所述方法包括如下步骤:

S1、获取待脱敏数据;

S2、根据所述待脱敏数据建立第一趋势数据和第二趋势数据;

S3、获取用户密码,根据所述用户密码和预设的动态密钥方案获取动态密钥;

S4、根据所述用户密码和动态密钥,对所述第一趋势数据进行变更处理,得到新第一趋势数据;

S5、通过所述新第一趋势数据建立新第二趋势数据,并根据所述新第二趋势数据、用户密码和动态密钥,对所述第二趋势数据做变更处理。

在某些实施方式中,步骤S3所述的“根据所述用户密码和预设的动态密钥方案获取动态密钥”具体包括:

S31、根据设备唯一序列号和基于时间的随机数获取动态因子;

S32、根据动态因子生成密钥队列,所述密钥队列长度大于102400;

S33、对所述密钥队列做加密处理,所述加密处理方法包括DES或SHA;所述加密处理是对密钥队列的每一字段逐一进行加密处理;

S34、根据所述用户密码获取密钥因子;

S35、根据所述密钥因子生成动态密钥。

进一步地,在另外一些实施方式中,步骤S35所述的“根据所述密钥因子生成动态密钥”又具体包括:

通过所述密钥因子从所述密钥队列中获取动态密钥定义块并对其进行解密;

获取动态密钥的类型定义;

通过所述动态密钥的类型定义和所述密钥因子生成动态密钥。

也就是说,所述动态密钥的获取中,动态密钥的类型定义是具有随机性质的,这样保证了动态密钥的具体定义组成是动态和随机的,其中没有人为参与的成分,这就可以在相当程度上保证了密钥破解的难度。对密钥队列的加密保证了该密钥队列只有在获取动态密钥定义块之后才对该定义块进行解密,从而更大程度地保证了动态密钥生产的安全性。

此外,步骤S1所述的“获取待脱敏数据”在有些实施方式中直接获取数量为3*N的所述待脱敏数据。在另外一些实施方式中,还可能是从获取的大量数据中随机或根据需要选取的数量为3*N的所述待脱敏数据(3*N条数据是连续的)。其中N为用户配制的最小条目数量M的10倍;M为用户配置的大于或等于1的正整数。然后,根据所述第一趋势数据以N条待脱敏数据作为基线。

进一步地,所述的数据脱敏方法中,在经过对待脱敏数据的变更处理后,还包括步骤S6:数据还原过程,具体包括如下步骤:

S61、从已经过脱敏处理的数据中获取待还原数据,所述待还原数据的数量为3*N,其中N为用户配制的最小条目数量的10倍;

S62、获取用户密码,根据所述用户密码获取解密密钥;

S63、根据用户密钥和解密密钥对所述待还原数据进行第一还原处理并拆分为3份,获得第一还原数据;

S64、根据用户密钥和解密密钥对所述第一还原数据进行第二还原处理,获得第二还原数据。

发明人同时提出了一种数据脱敏装置,包括通讯单元1、存储单元2、趋势模型获取单元3、动态密钥获取单元4和加密单元5;

所述通讯单元1用于获取待脱敏数据并将其存储于所述存储单元2;

所述趋势模型获取单元3用于根据所述待脱敏数据建立第一趋势数据和第二趋势数据;

所述通讯单元1还用于获取用户密码,所述动态密钥获取单元4用于根据所述用户密码和预设的动态密钥方案获取动态密钥;

所述加密单元5用于根据所述用户密码和动态密钥,对所述第一趋势数据进行变更处理,得到新第一趋势数据;

所述加密单元5还用于通过所述新第一趋势数据建立新第二趋势数据,并根据所述新第二趋势数据、用户密码和动态密钥,对所述第二趋势数据做变更处理。

进一步地,在某些实施方式中,所述的数据脱敏装置中,所述所述动态密钥获取单元4“根据所述用户密码和预设的动态密钥方案获取动态密钥”还具体包括:

所述动态密钥获取单元4还包括动态因子获取模块41、密钥队列获取模块42和密钥因子获取模块43;动态密钥获取单元4获取动态密钥具体通过如下方式:

S31、动态因子获取模块41根据设备唯一序列号和基于时间的随机数获取动态因子;

S32、密钥队列获取模块42根据动态因子生成密钥队列,所述密钥队列长度大于102400;

S33、所述加密单元5对所述密钥队列做加密处理,所述加密处理方法包括DES或SHA;所述加密处理是对密钥队列的每一字段逐一进行加密处理;

S34、密钥因子获取模块43根据所述用户密码获取密钥因子;

S35、所述动态密钥获取单元4根据所述密钥因子生成动态密钥。

进一步地,在另外一些实施方式中,所述动态密钥获取单元4“根据所述密钥因子生成动态密钥”又具体包括:

通过所述密钥因子从所述密钥队列中获取动态密钥定义块并对其进行解密;

获取动态密钥的类型定义;

通过所述动态密钥的类型定义和所述密钥因子生成动态密钥。

也就是说,所述动态密钥的获取中,动态密钥的类型定义是具有随机性质的,这样保证了动态密钥的具体定义组成是动态和随机的,其中没有人为参与的成分,这就可以在相当程度上保证了密钥破解的难度。对密钥队列的加密保证了该密钥队列只有在获取动态密钥定义块之后才对该定义块进行解密,从而更大程度地保证了动态密钥生产的安全性。

进一步地,所述的数据脱敏装置中,通讯单元1“获取待脱敏数据”在有些实施方式中直接获取数量为3*N的所述待脱敏数据,在另外一些实施方式中,还可能是从获取的大量数据中随机或根据需要选取的数量为3*N的所述待脱敏数据。其中N为用户配制的最小条目数量M的10倍;M为用户配置的大于或等于1的正整数。然后,根据所述第一趋势数据以N条待脱敏数据作为基线。

进一步地,所述的数据脱敏装置中,还包括还原单元6,所述还原单元6用于在经过对待脱敏数据的变更处理后,对数据进行还原过程,具体包括:

从已经过脱敏处理的数据中获取待还原数据,所述待还原数据的数量为3*N,其中N为用户配制的最小条目数量的10倍;

获取用户密码,根据所述用户密码获取解密密钥;

根据用户密钥和解密密钥对所述待还原数据进行第一还原处理并拆分为3份,获得第一还原数据;

根据用户密钥和解密密钥对所述第一还原数据进行第二还原处理,获得第二还原数据。

本发明技术方案创新性地针对金融交易数据形成的趋势信息所具有的独特特征,通过多级动态因子和双因子(用户密钥结合动态密钥)对证券交易流水的趋势情况,通过分割数据单元,扰乱两级数据单元的方式最终实现证券交易流水趋势的高价值信息进行遮蔽和掩盖,此外动态因子的生产方式还具有高离散的特征,如此一来保证数据在共享、传递、测试环境等多个场景中的安全,避免泄露。同时该算法支持可恢复方式,保证了数据被授权后,便捷,安全再利用的能力。由于动态多因子的不可预估和猜测的条件,极大的提高了数据脱敏后被破解的难度,大大提高的数据的安全性。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。

本领域内的技术人员应明白,上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机设备可读取的存储介质中,用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备,包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等;所述的存储介质,包括但不限于:RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。

上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器,使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中,使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机设备上,使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。

相关技术
  • 一种数据脱敏方法、装置及数据脱敏设备
  • 数据脱敏方法、数据脱敏装置、设备及存储介质
技术分类

06120113004297