掌桥专利:专业的专利平台
掌桥专利
首页

一种数据库SQL字符串操作隐私保护方法及系统

文献发布时间:2023-06-19 18:37:28


一种数据库SQL字符串操作隐私保护方法及系统

技术领域

本发明属于信息安全技术领域,特别是涉及一种数据库SQL字符串操作隐私保护方法及系统。

背景技术

随着云服务器的发展,越来越多的企业和个人把数据外包到公有云的数据库系统上进行管理。但是,云服务器数据泄露事件时有发生,数据安全成为用户采用云计算和云数据库的重大顾虑。

在数据库加密隐私保护领域,早年的技术手段是使用DES、AES等对称加密算法,但由于对称加密本身要求密文分布足够随机,无法对于密文再做一定的同态操作,故数据库服务器执行查询时仍然需要解密再做明文查询,这在一定程度上降低了隐私保护的强度。近年来,应用同态加密的技术手段被以增加数据库服务器直接对密文进行操作的能力的技术手段开始使用,有效提升隐私保护的强度。但是由于密码算法本身的特点,现有的数据库同态加密隐私保护方案几乎都是对数值类型的数据有较为完整的解决方案,例如数值加法、减法、乘法等等。无法适用于字符型的数据和操作类型占比更重的字符型数据库。

为了支持对数据库的隐私字段字符串数据进行大部分标准的SQL字符串操作,提出一种数据库SQL字符串操作隐私保护方法及系统。

发明内容

本发明实施例提出一种数据库SQL字符串操作隐私保护方法及系统,以至少解决相关技术中不能支持对数据库的隐私字段字符串数据进行大部分标准的SQL字符串操作的问题。

根据本发明的一个实施例,提出一种数据库SQL字符串操作隐私保护方法,包括:

对数据库隐私字段的字符串数据执行同态加密;

根据隐私字段字符串信息和同态加密信息计算辅助信息;

根据加密后的数据和辅助信息构建密文数据表;

识别涉及隐私字段的字符串操作类型;

根据字符串操作类型使用数乘同态和/或加法同态和/或减法同态计算隐私字段字符串操作后的密文结果;

根据隐私字段字符串操作后的密文结果和非隐私字段的查询结果得到用户的最终查询结果。

在一个示例性实施例中,所述对数据库隐私字段的字符串数据执行同态加密,包括步骤:

生成数据库中所需的明文二维表Table_P;设Table_P表共有m条数据与n个字段;

用户指定其中的t个字段为隐私字段,分别为PF1,…,PFt;

选取随机的1024-bit的素数p和q,计算模数N=p·q,

令g=N+1,λ=(p-1)·(q-1),计算μ=λ

用户所持Paillier公钥为pk=(N,g),私钥为sk=(λ,μ);

令i=1,2,…,t,j=1,2,…,m,用户使用Paillier公钥pk同态加密所有隐私字段的字符串数据PF

在一个示例性实施例中,所述根据隐私字段字符串信息和同态加密信息计算辅助信息,包括步骤:

使用Paillier公钥pk加密PF

计算字符串数据PF

在(0,N)中选取l个不同的随机数r

将每个单字符的密文PF

在一个示例性实施例中,所述根据加密后的数据和辅助信息构建密文数据表,包括步骤:

在明文数据表Table_P中,用密文数据PF

新增t个字段,其中第i字段的第j行储存字符串PF

上传密文数据表Table_C至数据库服务器进行储存。

在一个示例性实施例中,所述识别涉及隐私字段的字符串操作类型,包括步骤:

用户提交涉及隐私字段的字符串操作SQL语句,记为SQL_State;

数据库服务器DBS分析语句SQL_State,确定隐私字段的字符串操作类型;所述字符串操作类型包括CONCAT(PF1,PF2)连接操作、SUBSTR(PF,start,len)取子串操作、POSITION(str in PF)返回位置操作、TRIM(char from PF)删除字符操作、UPPER(PF)转大写操作、LOWER(PF)转小写操作、INITCAP(PF)首字母转大写操作。

在一个示例性实施例中,所述根据字符串操作类型使用数乘同态和/或加法同态和/或减法同态计算隐私字段字符串操作后的密文结果,包括步骤:

识别字符串操作类型所对应的整数操作;

利用辅助信息将整数操作转化为同态操作并以此计算隐私字段字符串操作后的密文结果。

在一个示例性实施例中,所述识别字符串操作类型所对应的整数操作,包括:

所述CONCAT(PF1,PF2)连接操作是连接隐私字段PF1和PF2的对应字符串,其整数操作:Comp=Int(PF1)*256^Len(PF2)+Int(PF2);

所述SUBSTR(PF,start,len)取子串操作是截取隐私字段PF字符串从start开始,长度为len的子串的对应字符串,其整数操作:Comp=Int(s

所述POSITION(str in PF)返回位置操作是返回子串str在隐私字段PF字符串中的起始位置的对应字符串,其整数操作:对于某个k,Int(PF)-Int(str)*256^k的字符串形式中有Len(str)个连续的0字符,则位置为Len(PF)-Len(str)+1-k;

所述TRIM(char from PF)删除字符操作是删除隐私字段PF字符串中的前导重复字符char的对应字符串,其整数操作:Comp=Int(PF)-Int(k char’s)*256^(Len(PF)–k+1);

所述UPPER(PF)转大写操作是将隐私字段PF字符串所有字符转成大写的对应字符串,其整数操作:Comp=Int(PF)+32*(1+256+…+256^(Len(PF)-1));

所述LOWER(PF)转小写操作是将隐私字段PF字符串所有字符转成小写的对应字符串,其整数操作:Comp=Int(PF)-32*(1+256+…+256^(Len(PF)-1));

所述INITCAP(PF)首字母转大写操作是将隐私字段PF字符串首字符转成大写的对应字符串,其整数操作:Comp=Int(PF)+32*256^(Len(PF)-1)。

在一个示例性实施例中,所述使用同态操作计算隐私字段字符串操作后的密文结果,包括:

CONCAT(PF1,PF2)连接操作:利用辅助信息中的字符串长度,使用Paillier数乘同态结合Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

SUBSTR(PF,start,len)取子串操作:利用辅助信息中的单字符加密结果,使用Paillier数乘同态结合Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

POSITION(str in PF)返回位置操作:利用辅助信息中的字符串长度,使用Paillier数乘同态结合Paillier减法同态,即对于j=1,2,…,m,k=1,2,…,Len(PF)-Len(str),计算密文结果Comp

TRIM(char from PF)删除字符操作:利用辅助信息中的字符串长度,使用Paillier数乘同态结合Paillier减法同态,即对于j=1,2,…,m,计算密文结果Comp

UPPER(PF)转大写操作:利用辅助信息中的字符串长度,用Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

LOWER(PF)转小写操作:利用辅助信息中的字符串长度,用Paillier减法同态,即对于j=1,2,…,m,计算密文结果Comp

INITCAP(PF)首字符转大写操作:利用辅助信息中的字符串长度,用Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

在一个示例性实施例中,所述根据隐私字段字符串操作的密文结果和非隐私字段的查询结果得到用户的最终查询结果,包括步骤:

服务器将隐私字段字符串操作的密文结果Comp_C连同非隐私字段的查询结果Res返回给用户;

用户利用Paillier私钥sk执行对隐私字段字符串操作的密文结果进行解密;用户结合隐私字段字符串的解密结果和非隐私字段的查询结果得到最终查询结果。

根据本发明的另一个实施例,提供了一种数据库SQL字符串操作隐私保护系统,包括:

处理器;

存储器;

以及

一个或多个程序,其中所述一个或多个程序被存储在存储器中,并且被配置成由所述处理器执行,所述程序使计算机执行上述方法。

本发明的数据库SQL字符串操作隐私保护方法及系统具有的优点是:

(1)根据隐私字段字符串信息和同态加密信息计算辅助信息并根据加密后的数据和辅助信息构建密文数据表,相比传统的数据库加密技术方案,可以有效降低数据库加密的复杂性,提高数据库的密文查询效率。

(2)根据字符串操作类型使用Paillier数乘同态和/或Paillier加法同态和/或Paillier减法同态计算隐私字段字符串操作后的密文结果,相比传统的只能对数值类型数据进行加密操作的技术方案,可以有效实现对字符类数据库的加密操作,提高数据库查询的保密性。

(3)根据隐私字段字符串操作后的密文结果和非隐私字段的查询结果得到用户的最终查询结果,相比传统的仅支持明文操作或仅支持密文操作的数据库技术方案,可以有效实现数据库明文和密文的混合操作,提高加密数据库的场景适应性。

(4)将隐私字段的字符串分割为多段并根据各段字符串的长度相似度和/或字符串的汉明重量相似度和/或重复字符的比例计算字符串段之间的关联值,根据关联值对字符串进行组合重构,相比传统的对完整字符串操作的技术方案,可以有效增加冗余,降低大范围出错的概率,提高加密数据库查询效率。

附图说明

图1是本发明实施例的一种数据库SQL字符串操作隐私保护方法的流程图;

图2是本发明实施例的子步骤S01的流程图;

图3是本发明实施例的子步骤S02的流程图;

图4是本发明实施例的子步骤S03的流程图;

图5是本发明实施例的子步骤S04的流程图;

图6是本发明实施例的子步骤S05的流程图;

图7是本发明实施例的子步骤S06的流程图;

图8是本发明实施例的一种数据库SQL字符串操作隐私保护系统结构示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。

本发明实施例的一种数据库SQL字符串操作隐私保护方法,流程图如图1所示,包括步骤:

步骤S01、对数据库隐私字段的字符串数据执行同态加密;

步骤S02、根据隐私字段字符串信息和同态加密信息计算辅助信息;

步骤S03、根据加密后的数据和辅助信息构建密文数据表;

步骤S04、识别涉及隐私字段的字符串操作类型;

步骤S05、根据字符串操作类型使用数乘同态和/或加法同态和/或减法同态计算隐私字段字符串操作后的密文结果;

步骤S06、根据隐私字段字符串操作后的密文结果和非隐私字段的查询结果得到用户的最终查询结果;

在一个示例性实施例中,所述步骤S01,流程图如图2所示,包括:

步骤S011、生成数据库中所需的明文二维表Table_P;设Table_P表共有m条数据与n个字段;

步骤S012、用户指定其中的t个字段为隐私字段,分别为PF1,…,PFt;

步骤S013、选取随机的1024-bit的素数p和q,计算模数N=p·q;令g=N+1,λ=(p-1)·(q-1),计算μ=λ

步骤S014、用户所持Paillier公钥为pk=(N,g),私钥为sk=(λ,μ);

步骤S015、令i=1,2,…,t,j=1,2,…,m,用户使用Paillier公钥pk同态加密所有隐私字段的字符串数据PF

在一个示例性实施例中,所述步骤S02,流程图如图3所示,包括:

步骤S021、使用Paillier公钥pk加密PF

步骤S022、计算字符串数据PF

步骤S023、在(0,N)中选取l个不同的随机数r

步骤S024、将每个单字符的密文PF

在一个示例性实施例中,所述步骤S03,流程图如图4所示,包括:

步骤S031、在明文数据表Table_P中,用密文数据PF

步骤S032、新增t个字段,其中第i字段的第j行储存字符串PF

步骤S033、上传密文数据表Table_C至数据库服务器进行储存。

在一个示例性实施例中,所述步骤S04,流程图如图5所示,包括:

步骤S041、用户提交涉及隐私字段的字符串操作SQL语句,记为SQL_State;

步骤S042、数据库服务器DBS分析语句SQL_State,确定隐私字段的字符串操作类型;所述字符串操作类型包括CONCAT(PF1,PF2)连接操作、SUBSTR(PF,start,len)取子串操作、POSITION(str in PF)返回位置操作、TRIM(char from PF)删除字符操作、UPPER(PF)转大写操作、LOWER(PF)转小写操作、INITCAP(PF)首字母转大写操作。

在一个示例性实施例中,所述步骤S05,流程图如图6所示,包括:

步骤S051、识别字符串操作类型所对应的整数操作;

步骤S052、利用辅助信息将整数操作转化为同态操作并以此计算隐私字段字符串操作后的密文结果。

本实施例中,云服务器CS将所有结果comp

可信第三方TTP对于解密结果大整数dec

在一个示例性实施例中,所述步骤S051中各字符串操作类型所对应的证书操作包括:所述CONCAT(PF1,PF2)连接操作是连接隐私字段PF1和PF2的对应字符串,其整数操作:Comp=Int(PF1)*256^Len(PF2)+Int(PF2);

所述SUBSTR(PF,start,len)取子串操作是截取隐私字段PF字符串从start开始,长度为len的子串的对应字符串,其整数操作:Comp=Int(s

所述POSITION(str in PF)返回位置操作是返回子串str在隐私字段PF字符串中的起始位置的对应字符串,其整数操作:对于某个k,Int(PF)-Int(str)*256^k的字符串形式中有Len(str)个连续的0字符,则位置为Len(PF)-Len(str)+1-k;

所述TRIM(char from PF)删除字符操作是删除隐私字段PF字符串中的前导重复字符char的对应字符串,其整数操作:Comp=Int(PF)-Int(k char’s)*256^(Len(PF)–k+1);

所述UPPER(PF)转大写操作是将隐私字段PF字符串所有字符转成大写的对应字符串,其整数操作:Comp=Int(PF)+32*(1+256+…+256^(Len(PF)-1));

所述LOWER(PF)转小写操作是将隐私字段PF字符串所有字符转成小写的对应字符串,其整数操作:Comp=Int(PF)-32*(1+256+…+256^(Len(PF)-1));

所述INITCAP(PF)首字母转大写操作是将隐私字段PF字符串首字符转成大写的对应字符串,其整数操作:Comp=Int(PF)+32*256^(Len(PF)-1)。

在一个示例性实施例中,所述步骤S051中各字符串操作类型使用同态操作计算隐私字段字符串操作后的密文结果,包括:CONCAT(PF1,PF2)连接操作:利用辅助信息中的字符串长度,使用Paillier数乘同态结合Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

SUBSTR(PF,start,len)取子串操作:利用辅助信息中的单字符加密结果,使用Paillier数乘同态结合Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

POSITION(str in PF)返回位置操作:利用辅助信息中的字符串长度,使用Paillier数乘同态结合Paillier减法同态,即对于j=1,2,…,m,k=1,2,…,Len(PF)-Len(str),计算密文结果Comp

TRIM(char from PF)删除字符操作:利用辅助信息中的字符串长度,使用Paillier数乘同态结合Paillier减法同态,即对于j=1,2,…,m,计算密文结果Comp

UPPER(PF)转大写操作:利用辅助信息中的字符串长度,用Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

LOWER(PF)转小写操作:利用辅助信息中的字符串长度,用Paillier减法同态,即对于j=1,2,…,m,计算密文结果Comp

INITCAP(PF)首字符转大写操作:利用辅助信息中的字符串长度,用Paillier加法同态,即对于j=1,2,…,m,计算密文结果Comp

本实施例中,所述TRIM(char from PF)删除字符操作需要提前知道前导重复字符char的个数k;所述UPPER(PF)转大写操作需要原字符串所有字母均为小写;所述LOWER(PF)转小写操作需要原字符串所有字母均为大写;INITCAP(PF)首字符转大写操作需要原字符串所有字母均为小写。

以POSITION(str in PF)返回位置操作为例,计算dec

在一个示例性实施例中,在步骤S052之前,还包括步骤:

将隐私字段的字符串平均分割或随机分割为多段;

根据各段字符串的长度相似度和/或字符串的汉明重量相似度和/或重复字符的比例计算字符串段之间的关联值;

将关联值大于或等于设定阈值的字符串进行组合连接,并根据上述实施方式所述的字符串操作类型对应的操作计算相应的密文结果;

将关联值小于设定阈值的字符串单独执行上述实施方式所述的字符串操作类型对应的操作计算相应的密文结果;

对密文结果按照原字符串连接方式进行重新组合,形成完整密文结果。

本实施例中,所述根据各段字符串的长度相似度和/或字符串的汉明重量相似度和/或重复字符的比例计算字符串段之间的关联值,是:根据字符串的长度相似度与字符串段之间的关联值的正相关关系计算字符串段之间的关联值、根据字符串的汉明重量相似度与同态标示值的正相关关系计算字符串段之间的关联值、根据重复字符的比例与字符串段之间的关联值的正相关关系计算字符串段之间的关联值、根据字符串的长度相似度和字符串的汉明重量相似度与字符串段之间的关联值的正相关关系计算字符串段之间的关联值、根据字符串的长度相似度和重复字符的比例与字符串段之间的关联值的正相关关系计算字符串段之间的关联值、根据字符串的汉明重量相似度和重复字符的比例与字符串段之间的关联值的正相关关系计算字符串段之间的关联值、根据字符串的长度相似度和字符串的汉明重量相似度和重复字符的比例与字符串段之间的关联值的正相关关系计算字符串段之间的关联值的任一项,字符串段之间的关联值用变量x表示。

表A中A1~A7表示计算字符串段之间的关联值的不同实施方式,表A中任一项所述的方法用于计算某两段字符串之间的关联值,为便于表达,字符串的长度相似度表示为e,字符串的汉明重量相似度表示为w,重复字符的比例表示为y。

表A计算字符串段之间的关联值的不同实施方式

本实施例中,事先设置的关联阈值X=2,根据表A中任一项计算得到某两个字符串之间的关联值x(例如A7)>X,则判定这两个字符串之间关联性强(属于同等处理的概率大),将两个字符串进行组合连接并根据上述实施方式所述的字符串操作类型对应的操作计算相应的密文结果。对两两字符串执行上述步骤,并将得到的所有密文结果按照原字符串的顺序拆分组合形成完整的密文结果。

在一个示例性实施例中,所述步骤S06,流程图如图7所示,包括步骤:

步骤S061、服务器将隐私字段字符串操作的密文结果Comp_C连同非隐私字段的查询结果Res返回给用户;

步骤S062、用户利用Paillier私钥sk执行对隐私字段字符串操作的密文结果进行解密;

步骤S063、用户结合隐私字段字符串的解密结果和非隐私字段的查询结果得到最终查询结果。

本实施例中,用户利用Paillier私钥sk执行对隐私字段计算结果Comp

用户结合隐私字段与非隐私字段的查询结果,即dec与Res,得到最终查询结果,完成查询。

为了帮助更好地理解本发明的细节,以下举出一个SQL字符串SUBSTR同态操作的具体实施示例。由于数据规模的限制,这里只采用Paillier加密中模数n=p*q为128比特的情形进行阐述。在实际过程中应采用更大的安全参数。

1)Paillier加密参数设置:

p=12458956711587562123,

q=14717327422403960303,

pk:N=p*q=183362545265991497115233232112238403269,

sk:λ=(p-1)*(q-1)=183362545265991497088056947978246880844,

μ=λ

2)假设某个明文数据表中包含隐私字段“邮箱”,而某条数据记录的邮箱字段值为“amanda79@gmail.com”,其ASCII编码序列为[0x61,0x6D,0x61,0x6E,0x64,0x61,0x37,0x39,0x40,0x67,0x6D,0x61,0x69,0x6C,0x2E,0x63,0x6F,0x6D]=[97,109,97,110,100,97,55,57,64,103,109,97,105,108,46,99,111,109]。其对应的整数为97*256

该字符串“amanda79@gmail.com”的明文整数用Paillier同态加密后密文s_C=16421177971230616094813243732203526778897157164570988834906208124785563949299。

辅助信息则由字符串“amanda79@gmail.com”的每个单字符执行加密以及该字符串长度“18”所组成,所有18个单字符加密结果组成的密文向量[s

[1864489722459001359312327125958837142062865807877209715040460012822396283732,15263343186963627304869080496271834382145558360014068134662778915138566223363,6715269770448632728391703563179078453094980520399663395962437087134567250503,18893740853837748132975971667582067229976106623749238440289811757525469116026,2980953922938028319993702417697035673139395881943227317937883060001563865424,11475882251610573976169113982398288919955165842406294580041752853430500074444,13064814761293642240963133155092137630695556935172293379016921198530535922999,2658233846968359448304435075388864285945241033662408417519729464335496178379,15779358333698166913199594616241838968949372892689754396103627816196600032597,27825391136944981953732818771975339608498232926262033037177831720162541638862,26505800618604023912862812670043831520548887181407206426166364104178644809064,23969404367943273699010230965953984781840693284099007632678936204532325120969,3874152071131510947011054498463468726685155673515181577371034303432544268758,26506071894494143103619603069059918073606482995356414647167708018946942264419,28240719218912120573511318707469946481633069873045299976890962868024472662318,25639547039614734088419586561744832422706237547806718986839514816057387455392,23253415027892258386566699319903676051739114008581022132868458021250194602686,6115016326737349251199728856507746440860045399298894819054060909576479607405].

3)假设查询者输入查询语句SUBSTR(邮箱,0,6),即截取所有邮箱数据的前6个字符组成的子串,并提交查询给数据库服务器。

4)数据库服务器解析该查询语句,发现其是对隐私字段“邮箱”进行SUBSTR操作,则其会将根据“邮箱”的辅助信息进行同态操作,对于明文邮箱“amanda79@gmail.com”对应的这条记录,利用辅助信息中的字符串长度l=18,及密文向量[s

5)查询用户将收到的密文计算结果执行同态解密,得到解密结果为107122413954145,再对其进行256进制表示,假设字符统一长度上限为20,由于107122413954145=97*256

本发明实施例的一种数据库SQL字符串操作隐私保护系统,结构示意图如图8所示,包括:

处理器;

存储器;

以及

一个或多个程序,其中所述一个或多个程序被存储在存储器中,并且被配置成由所述处理器执行,所述程序使计算机执行上述方法。

当然,本技术领域中的普通技术人员应当认识到,以上实施例仅是用来说明本发明的,而并非作为对本发明的限定,只要在本发明的范围内,对以上实施例的变化、变型都将落入本发明的保护范围。

技术分类

06120115631651