掌桥专利:专业的专利平台
掌桥专利
首页

一种DWT注意机制的能量迹噪声自适应方法

文献发布时间:2023-06-19 11:26:00


一种DWT注意机制的能量迹噪声自适应方法

技术领域

本发明涉及密码安全技术领域,尤其涉及一种DWT注意机制的能量迹噪声自适应方法。

背景技术

侧信道攻击在1996年被首次提出,利用密码设备在加密计算过程中存在的时间、功耗、电磁、甚至是声音等物理泄露信息恢复密码芯片中的密钥信息。

攻击者通过在密码设备加密的过程中采集功耗或者电磁能量迹,并通过建模或者统计分析等方法恢复密码设备的密钥信息。随着侧信道攻击的发展,逐渐形成了一类特有的攻击——Profiled侧信道攻击。

Profiled侧信道攻击具有一个比较强的假设,即攻击者手上有一块和待攻击设备(Device2)相同的密码设备(Device1),攻击者能完全的控制密码设备包括设置内部密码算法的密钥信息。Profiled侧信道攻击主要分为建模阶段和攻击阶段,在建模阶段中,攻击者在Device1密码设备上采集大量的能量迹,并利用采集的能量迹进行建模,生成攻击模型。然后在攻击阶段,在待攻击的设备Device2上采集攻击能量迹,并利用建模阶段得到的攻击模型进行密钥恢复。

在此之后,卷积神经网络模型作为一种Profiled攻击模型被引进到了侧信道攻击中。作为一种侧信道攻击模型,在整个攻击过程中也是被分为两个阶段:建模阶段和攻击阶段。在建模阶段,采集Device1设备的能量迹,并对每一条能量迹生成一个标签。利用能量迹和标签训练CNN模型,然后在攻击阶段,采集待攻击设备Device2的能量迹并利用训练好的CNN模型恢复密钥信息。

虽然卷积神经网络模型是一种有效的攻击模型,但是和侧信道攻击的结合还是存在一定的问题,其中的一个问题就是能量迹中的噪声问题。在采集密码设备加密过程中的能量轨迹时,环境噪声或者电子噪声是不可避免的,轨迹中一般都含有大量的电子噪声。电子噪声的存在会严重干扰神经网络模型的学习效果,而得到一个好的网络模型是攻击成功的关键。因此如何减少能量轨迹中噪声对神经网络学习过程的影响目前亟需解决的问题。

在噪声处理方面,最开始使用的去噪方法是对能量迹做平均,该方法的基础是能量迹中存在的电子噪声是满足高斯分布且分布的均值为0,因此平均可以有效的去除噪声,但是需要使用大量的轨迹。Le等人在预处理阶段使用四阶累积量移除能量迹中的噪声,该方法主要利用了能量迹中具有非高斯分布的有效信号量以及具有高斯分布的噪声量的特性。高斯分布的噪声在大于二阶的累计量中为0,即有用信号和高斯噪声四阶累计量等于有用信号的累计量。Wei等人在预处理阶段使用截至频率为60MHz低通滤波的方法移除高斯噪声。另一些方法是从特征工程的角度进行去噪,通过使用主成分分析(PCA)、核判别分析(KDA)以及已知密文的CPA分析从能量迹中选取一些含有有用信息的兴趣点,从而减少能量迹中其他采样点的噪声的引入,但是这种方法打破了能量迹中采样点之间的相关性,对于一些具有掩码防护措施的加密算法攻击很差。Wu等人使用深度学习中的自编码器作为预处理阶段的去噪模型,自编码器的输入为具有噪声的能量迹,输出为去噪过后的能量迹。该过程主要分为两个阶段:编码阶段和解码阶段,编码阶段将输入能量迹进行压缩,压缩过后的能量迹保有最大的信息量,接着再进行解码,输出的轨迹具有和输入轨迹相同的维度。但是自编码器方法在训练的过程中也同样需要大量的轨迹,这无疑将加重了能量采集过程中的复杂度。综上所示,目前已经存在的噪声处理方法主要有以下几点不足:

1、在预处理去噪阶段就需要大量的轨迹,而训练卷积神经网络本身就需要大量轨迹,使得轨迹采集阶段的工作量很大。

2、预处理去噪方法会影响能量迹之间的相关性,对于一些有防护措施的加密算法,反而会减弱网络的攻击能力。

3、预处理去噪方法需要花费不少的时间,增加了整个攻击过程中的复杂度。

发明内容

本发明的目的是提供一种DWT注意机制的能量迹噪声自适应方法,为提高卷积神经网络模型在侧信道攻击中对能量迹噪声的鲁棒性提供了一个可行性方案。

本发明的目的是通过以下技术方案实现的:

一种DWT注意机制的能量迹噪声自适应方法,包括:

对于卷积操作之后提取的能量轨迹中的特征,通过离散小波变换转换为高频特征分量和低频特征分量,并按照通道维度进行合并;其中高频特征分量为能量迹特征中的细节特征分量,低频特征分量为能量迹特征中的近似特征分量;

对于合并后的特征,通过通道注意模块来增强非噪声的特征信息,以及通过空间注意模块来增强非噪声位置的特征信息,从而得到强化后的特征信息。

由上述本发明提供的技术方案可以看出,通过利用DWT将特征划分为高频部分和低频部分并利用注意机制对这两种特征赋予权重来减少卷积神经网络模型对噪声的学习。同时,该方法也提升了卷积神经网络模型在学习过程中对能量轨迹中噪声的鲁棒性,在不需要对能量迹进行预处理的情况下,减少噪声带来的影响,从而提升了卷积神经网络在有噪声的能量轨迹上的适应能力。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种DWT注意机制的能量迹噪声自适应方法的示意图;

图2为本发明实施例提供的卷积神经网络模型的基本结构示意图;

图3为本发明实施例提供的DWT层的原理图;

图4为本发明实施例提供的通道注意模块的原理图;

图5为本发明实施例提供的空间注意模块的原理图。

具体实施方式

下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。

本发明实施例提供一种DWT注意机制的能量迹噪声自适应方法,如图1所示,其主要,包括:对卷积操作之后提取的能量轨迹中的特征,通过离散小波变换(DWT)转换为高频特征分量和低频特征分量,并按照通道维度进行合并;对于合并后的特征,通过通道注意模块(Channel Module)来增强非噪声的特征信息,以及通过空间注意模块(Spatial Midule)来增强非噪声位置的特征信息,从而得到强化后的特征信息。

本发明实施例提供的上述方案中,由于DWT操作得到高频特征分量和低频特征分量是通过通道维度进行合并的,注意机制中的通道注意机制是对通道维度的特征赋予权重,这个权重的赋予是在网络的学习过程中不断进行调整的,因此会根据不同特征对预测结果的影响来进行调整;因此,利用DWT将特征划分为高频部分和低频部分并利用注意机制对这两种特征赋予权重来减少卷积神经网络模型对噪声的学习。

值得注意的是,上述方案可以提升卷积神经网络模型在学习过程中对能量轨迹中噪声的鲁棒性,在不需要对能量迹进行预处理的情况下,减少噪声带来的影响,从而提升了卷积神经网络在有噪声的能量轨迹上的适应能力。当然,从技术本身而言,以上方案可以提升模型的攻击效果,但本发明并不保护模型的后续应用,用户可以根据实际情况选择模型的应用方向,比如,科研机构可用于特定测试任务等。

为了便于理解,下面针对本发明做详细的介绍。

一、卷积神经网络模型的设计与实现。

本发明实施例上述方案应用于卷积神经网络模型的学习过程,因此,首先针对卷积神经网络模型做相关说明。

如图2所示,提供一种卷积神经网络模型的结构,其包含若干依次连接的残差块,最后一个残差块之后依次设有展平层(flatten层)、全连接层(FC)与softmax层(s),相邻残差块之间通过基础块连接,所述基础块为依次设置的激活函数(σ)和池化层(δ);每一残差块设有多个卷积层(γ),卷积层之间设有激活函数,并且通过捷径链接(shortcutconnection)的方式连接残差块的输入与输出。

本发明实施例中,softmax层输出能量迹属于每一个类别的预测概率。示例性的,可以使用S盒的输出作为类别标签,因此有256类。

本发明实施例中,卷积神经网络模型的架构可以用如下公式表示:

其中,上式公式省略了flatten层的操作;n

下面示例性的给出卷积神经网络模型超参参数:

a)全连接层的层数设置为2。

b)每一个残差块都是由两个卷积层加上一个激活函数组成,使用的激活函数ReLU。

c)第一个残差块部分的f为卷积操作和平均池化操作,之后的f为卷积操作,使残差块的输入和输出具有相同的维度,便于shortcut connection操作。

d)对于卷积层,filter的大小设置为11,步长为1。

e)对于池化层,使用平均池化,池化步长设置为2,池化窗口也为2。

二、DWT注意机制的设计与实现。

如图1所示,离散小波变换所处理的能量迹中的特征为第一个残差块中最后一个卷积层的输出,第一个残差块的输出则为所述强化后的特征信息。具体来说,DWT注意机制主要包括三部分:DWT层,通道注意模块和空间注意模块。首先,通过DWT层将卷机层输出的特征分解为高频特征分量和低频特征分量,通过将两类特征进行分解并按照通道维度进行合并,更有利于下一步对关键信息的学习。在下一步通过选择性的学习高频特征也就是噪声分量,来减少对噪声的学习。随后的通道注意模块即可选择性的学习特征,重要特征对应的权重相对较大,而不重要特征的权重相对较小,通过对不同的特征赋予权重信息来学习到关键的特征信息。最后是空间注意模块,该模块主要定位关键信息所在的空间位置,由于并不是特征中的每一个点都是有用信息,因此对特征的空间位置赋予权重可以减少无关位置的特征学习,从而进一步强化特征。通过以上三个部分,可以自发的减少卷积神经网络模型在学习过程中对能量轨迹中噪声的学习,大大提升了卷积神经网络在有噪声的能量轨迹上的适应能力。

下面针对DWT注意机制的实现原理做详细的介绍。

1、DWT的设计与实现。

如图3所示,利用离散小波变换能够将卷机层输出的特征分为细节特征分量和近似特征分量,其中细节特征分量表示特征中代表的高频信号,噪声部分一般位于该分量,而近似特征分量表示特征中的信号分量。

本发明实施例中,所述离散小波变换使用的小波基为haar,高频特征分量和低频特征分量分别通过高通滤波器h

高通滤波器允许高频信息通过,这部分信息对应局部的波动值,变化比较快,噪声一般位于这一部分。而低通滤波器允许低频信息通过,这部分信息对应局部的平均值,变化比较慢。在haar小波基中,高通滤波器h

2、注意机制的设计与实现

本发明实施例中,使用的注意机制是由Woo等人提出的卷积块注意机制(Convolutional Block Attention Module,CBAM),CBAM主要分为两个部分,从两个维度来强调特征:通道维度和空间维度。通道维度主要是用来强调有用的特征信息,而空间维度是用来定位能量迹中重要特征的位置。

1)通道注意模块。

如图4所示,通道注意模块的工作过程包括:对于合并后的特征中的每个通道特征F,独立的使用全局平均池化操作(Global Average Pooling,GAP)和全局最大池化操作(Global Max Pooling,GMP),获得平均特征和最大特征,将平均特征和最大特征分别输入至共享层,随后使用激活函数ReLU生成通道权重,该通道权重是模型在学习的过程中分配给各个特征的权重,之后与相应的通道特征相乘,得到通道加权特征;示例性的,共享层可以由具有一层隐藏层的MLP(多层感知器)组成。

通道注意模块工作过程使用公式表示为:

其中,M

2)空间注意模块。

如图5所示,空间注意模块的工作过程包括:沿着输入特征Q的空间维度分别使用平均池化操作(average-pooling,AP)和最大池化操作(max-pooling,MP),生成平均特征采样向量和最大特征采样向量;然后将这两个向量级联起来并使用一个卷积层和一个激活函数ReLU来生成空间权重信息,所述空间权重信息包含了特征中每一个空间位置的权重信息;最后将输入特征Q的每一个空间位置与相应的权重信息相乘,获得空间加权特征。

空间注意模块的工作过程使用公式表示为:

其中,M

以上为发明所涉及的相关原理介绍,下面结合判断指标来说明模型性能。

使用Rank作为描述模型性能的指标。假如给定的N

其中,

Rank表示正确密钥k*在密钥猜测向量g里的位置(即在密钥猜测向量里面寻找正确密钥所对应的下标位置),当Rank等于0的时候,也就是正确密钥的概率大于其他猜测的密钥,表示攻击成功。目的是使用最少的能量轨迹恢复出正确密钥。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

相关技术
  • 一种DWT注意机制的能量迹噪声自适应方法
  • 一种基于注意力机制的领域自适应方法
技术分类

06120112922629