掌桥专利:专业的专利平台
掌桥专利
首页

一种基于自编码器的穿戴设备数据隐私保护方法

文献发布时间:2023-06-19 10:43:23


一种基于自编码器的穿戴设备数据隐私保护方法

技术领域

本发明涉及穿戴设备技术领域,具体涉及一种基于自编码器的穿戴设备数据隐私保护方法。

背景技术

穿戴设备技术的快速发展极大地方便了人们的生活,在运动、医疗、娱乐等多个领域发挥了重要作用。穿戴设备中嵌入的加速度、陀螺仪、磁感器等诸多传感器收集丰富的用户数据,用于分析用户的健康状态、运动行为等。然而,这些传感器数据却可能泄露用户隐私,如体重、性别、年龄等敏感信息,给用户带来不必要的麻烦,故而需要将传感器数据匿名化处理后再发布给第三方。

目前已有的研究成果大多关注于穿戴设备数据集的离线发布,并且在研究过程中已大量涉及了各类模型和算法。然而,对于云服务中的个人数据的实时发布的相关研究较少。该项研究存在三个目标:1)需要最大化数据在活动识别任务上的可用性;2)需要最小化数据在身份识别任务上的可用性;3)需要最小化数据失真。传统的隐私保护数据发布方法难以同时实现上述目标,而基于深度学习的数据发布方法则能够良好地权衡数据的可用性与隐私性。自编码器模型通过特征提取与数据重构实现端到端的数据变换,以对抗的方式训练自编码器可以使得提取的特征尽可能不包含敏感信息,从而保护个人隐私。

专利文献CN110175950A公开了一种基于可穿戴设备的隐私保护方法及可穿戴设备,该发明研究的是避免在视频通话中无意泄露他人面部信息,根据预设合法用户的面部特征在待处理视频图像中确定出显示区域和虚化区域,在虚化处理后再发送给接收端。但该项研究针对的数据类型是图像。

发明内容

有鉴于此,本发明的目的在于提供一种基于自编码器的穿戴设备数据隐私保护方法,从而在保护个人隐私的情况下,提供安全的活动识别服务。

经研究,本发明提供以下技术方案:

一种基于自编码器的穿戴设备数据隐私保护方法,包括以下步骤:

1)通过分块离散余弦变换将流数据转换为频谱数据块;

2)构建并训练自编码器模型;

3)构建并训练活动识别模型与身份识别模型;

4)将活动识别模型与身份识别模型连接到自编码器的输出层,通过多目标损失函数再次训练自编码器;

5)根据分块离散余弦变换,自编码器变换,逆分块离散余弦变换实时发布脱敏数据。

进一步的,所述步骤1)中,将穿戴设备传感器流数据划分为子序列,然后将子序列转换成频谱数据块。

进一步的,所述将穿戴设备传感器流数据划分为子序列,然后将子序列转换成频谱数据,具体为:将时序传感数据按滑动时间窗口W划分为子序列集合X;然后对每个子序列分别进行分块离散余弦变换(block discrete cosine transform,Block-DCT);将各子块堆叠组合成频谱数据块,再利用公式Ⅰ对频谱数据块进行Z-score标准化:

式Ⅰ中,X

进一步的,所述步骤2)中,构建自编码器模型,自编码器模型由编码器与解码器串联构成,编码器包括多个卷积层,激活层和池化层,解码器包括多个转置卷积层,激活层和卷积层。

进一步的,所述激活层采用线性整流函数(Rectified Linear Unit,ReLU);所述池化层采用最大池化(max-pooling);所述转置卷积层可以实现上采样与升维,使解码器输出维度与编码器输入维度一致,且解码器的输入为编码器的输出,然后,通过式Ⅱ计算均方误差(mean square error,MSE)损失来训练自编码器:

式Ⅱ中,Enc表示编码器;X

进一步的,所述步骤3)中,构建并训练活动识别模型与身份识别模型,具体为:训练可识别自编码器输出对应活动类别或身份类别的分类器;通过编码器得到X

式Ⅲ中,L

进一步的,所述步骤4)中,将训练好的EncAct与EncId分类器分别连接到编码器的输出层;将训练好的DecAct与DecId分类器分别连接到解码器的输出层;再次以X

进一步的,所述多目标损失由分类损失、隐私损失、重构失真损失构成;

根据式Ⅳ计算活动识别分类损失L

式Ⅳ中,M表示真实的活动标签;

根据式Ⅴ计算身份识别隐私损失L

式Ⅴ中,P表示真实的身份标签;

根据式Ⅵ计算重构失真损失L

式Ⅵ中,X

根据式Ⅶ计算多目标损失L

L

进一步的,所述步骤5)中,在训练好自编码器后,即可发布匿名数据;将流数据按滑动窗口划分为子序列,对其做Block-DCT变换,然后输入自编码器中得到脱敏的频谱数据块,利用与Block-DCT互逆的逆分块离散余弦变换(inversed block discrete cosinetransform,Block-IDCT)重构回时序子序列,发布给第三方。

本发明的有益效果在于:

本发明的一种基于自编码器的穿戴设备数据隐私保护方法,针对现有方法在保护数据效用性方面不足的问题,设计多目标损失函数来训练自编码器,能够更好地权衡效用性与隐私性。同时,提出将原数据通过Block-DCT变换为频谱后再脱敏处理,避免了直接扰动原始时序数据,对于降低数据失真有重要意义。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究,对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

图1为本发明的一种基于自编码器的穿戴设备数据隐私保护方法的总体流程示意图;

图2为本发明的一种基于自编码器的穿戴设备数据隐私保护方法中自编码器的网络结构图。

具体实施方式

为使本发明的技术方案、优点和目的更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本申请的保护范围。

下面结合附图和实施例对本发明作进一步说明。

实施例1

如图1所示,一种基于自编码器的穿戴设备数据隐私保护方法,包括以下步骤:

步骤1)通过Block-DCT算法将穿戴设备传感器流数据转换成频谱数据,具体包括以下步骤:

步骤1.1:将时序传感数据按滑动时间窗口W划分为子序列集合X;

步骤1.2:通过Block-DCT算法将每个子序列变换为频谱数据块,具体包括以下步骤:

步骤1.2.1:将X按时间维度分割为c个子块;

步骤1.2.2:对各子块分别进行DCT变换;

步骤1.2.3:将所有子块堆叠组合为待处理的频谱数据块;

步骤1.3:利用式Ⅰ对频谱数据块进行Z-score标准化:

式Ⅰ中,X

步骤2)构建并训练自编码器模型,具体包括以下步骤:

步骤2.1:构建自编码器模型,即自编码器网络结构,如图2所示的自编码器网络结构由编码器与解码器串联构成;编码器主要有多个卷积层、激活层、池化层组成,解码器主要由多个转置卷积层、激活层、卷积层组成;其中,激活层为线性整流函数(RectifiedLinear Unit,ReLU),池化层采用最大池化(max-pooling),转置卷积可以实现上采样与升维,使解码器输出维度与编码器输入维度一致;将编码器的输出层连接到解码器的输入层,构成自编码器模型;

步骤2.2:训练自编码器,通过式Ⅱ计算均方误差(mean square error,MSE)损失来训练自编码器:

式Ⅱ中,Enc表示编码器;X

步骤2.3:通过反向传播和Adam算法训练网络,待验证集MSE损失不再降低后停止训练,保存自编码器模型参数;

步骤3)构建并训练活动识别模型与身份识别模型。具体包括以下步骤:

步骤3.1:加载训练好的编码器与解码器;

步骤3.2:将X

步骤3.3:将X

步骤3.3:构建分类模型网络结构,所有分类器皆通过卷积层、激活层、池化层、批量归一化层和全连接层构建。具体包括以下步骤:

步骤3.3.1:以X

步骤3.3.2:以

步骤3.4:通过交叉熵损失函数式Ⅲ来分别训练各分类器:

式Ⅲ中,L

L

步骤3.5:待分类模型训练收敛后,保存模型参数;

步骤4)利用活动识别模型与身份识别模型计算自编码器输出的分类损失和隐私损失,与重构损失一起构成多目标损失,再次训练自编码器。具体包括以下步骤:

步骤4.1:将训练好的EncAct与EncId分类器分别连接在编码器的输出层后;

步骤4.2:将训练好的DecAct与DecId分类器分别连接在解码器的输出层后;

步骤4.3:冻结EncAct、EncId、DecAct、DecId的网络权重;

步骤4.4:再次以X

步骤4.4.1:根据式Ⅳ计算活动识别分类损失L

式Ⅳ中,M表示真实的活动标签;

步骤4.4.2:根据式Ⅴ计算身份识别隐私损失L

式Ⅴ中,P表示真实的身份标签;

步骤4.4.3:根据式Ⅵ计算重构失真损失L

式Ⅵ中,X

步骤4.4.3:根据式Ⅶ计算多目标损失L

L

步骤4.5:以L

步骤5)利用Block-DCT、自编码器、Block-IDCT实现脱敏匿名发布;具体包括以下步骤:

步骤5.1:加载自编码器模型;

步骤5.2:将测试传感器数据按滑动时间窗口W划分为子序列X;

步骤5.3:利用Block-DCT将X变换为频谱X

步骤5.4:将X

步骤5.5:利用Block-IDCT将

步骤5.5.1:对

步骤5.5.2:将堆叠的c个子块平铺展开得到

步骤5.6:将变换的子序列

在Motion-Sense数据集上的实验表明,利用该算法实行脱敏后,活动识别的准确度由95.6%降低至93.5%,而身份识别的准确度由93.2%降低至6.5%,重构失真仅为0.69,从而证明了本发明的一种基于自编码器的穿戴设备数据隐私保护方法能够良好地保护穿戴设备传感器数据的效用性并且降低个人隐私泄露的风险。

本发明的一种基于自编码器的穿戴设备数据隐私保护方法,针对现有方法在保护数据效用性方面不足的问题,设计多目标损失函数来训练自编码器,能够更好地权衡效用性与隐私性。同时,提出将原数据通过Block-DCT变换为频谱后再脱敏处理,避免了直接扰动原始时序数据,对于降低数据失真有重要意义。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的保护范围当中。

相关技术
  • 一种基于自编码器的穿戴设备数据隐私保护方法
  • 一种基于可穿戴设备的隐私保护方法及可穿戴设备
技术分类

06120112657068