一种针对故障诊断模型的通用对抗扰动生成方法
文献发布时间:2024-04-18 19:57:31
技术领域
本发明公开一种针对故障诊断模型的通用对抗扰动生成方法,属于电数字处理技术领域。
背景技术
故障诊断是现代工业中广泛应用的监测工业旋转机运行稳定性和可靠性的技术。因此,诊断系统的鲁棒性是的关键。近年来,基于深度神经网络的智能故障诊断系统已成为等各个工业领域的流行技术,如旋转机械故障诊断、自动驾驶系统和风力涡轮机,其中应用在智能故障诊断系统的深度神经网络又称为故障诊断模型。然而,深度神经网络已被证明非常容易受到对抗性扰动。这些扰动通常无法被人类察觉,但它们对故障诊断模型的影响是灾难性的。研究更高明的针对故障诊断模型的对抗攻击方法,能够先于恶意攻击者找到系统的漏洞,建立防御策略,对于维系工业安全等具有较高的现实意义。
现有技术的攻击方法并未考虑到故障诊断模型的实际应用场景,在现实世界中是不可行的。首先,这些方法在攻击时间预算充足,且检测信号已知的设定下展开的。但在实际应用中,耗时的迭代更新扰动对于快速传递的检测信号流是不切实际的。其次,在自然工业环境中,用于故障诊断的信号往往从一段长信号序列中随机采样,而不是以固定的频率采样,因此在攻击前很难知道诊断模型的输入信号,往往导致攻击失效。
发明内容
本发明的目的在于提供一种针对故障诊断模型的通用对抗扰动生成方法,以解决现有技术中,故障诊断系统真实场景中攻击实时性要求高、攻击数据信息有限等约束导致的攻击可行性低的问题。
一种针对故障诊断模型的通用对抗扰动生成方法,包括设计、优化、训练通用对抗扰动生成网络;
S1.通用对抗扰动生成网络为G,是多层感知机模型,包含三个全连接层,在每一个全连接层后使用批范数层避免梯度消失,使用RELU作为非线性层;
S2.优化通用对抗扰动生成网络包括对抗性提升、通用性提升和隐蔽性提升;
S3.训练通用对抗扰动生成网络包括:
S3.1.在前向传播阶段,给定一个固定的随机向量U输入生成网络G,产生单个扰动
;
表示对抗样本,输入对抗样本至故障检测模型/>
S3.2.在反向传播阶段,通过最小化损失函数更新G的参数,攻击成功率表示模型对添加了对抗扰动的检测信号的误分类比率,每次生成网络的参数更新后,通过计算信噪比和攻击成功率来评估优化结果,如果信噪比大于最小阈值,同时攻击成功率超过预期比值,停止训练并返回对抗扰动
S2包括:
S2.1.对抗性提升包括:
有目标对抗扰动的对抗性优化的目标函数
;
无目标对抗扰动的对抗性优化的目标函数
;
其中,
S2包括:
S2.2.通用性提升包括:
S2.2.1.添加置信阈值k,对抗性优化的目标函数更新为
;
式中,untargeted表示无目标,targeted表示有目标;
在非目标攻击中,如果
在目标攻击中,如果
S2包括:
S2.2.2.设计攻击注意力权重,以真实标签的预测概率
;
攻击注意力权重
;
则通用性提升优化后的目标函数变为:
。
S2包括:隐蔽性提升包括:
S2.3.使用
对抗扰动的优化目标函数Loss为:
。
相对比现有技术,本发明具有以下有益效果:综合考虑了提升了对抗扰动的对抗性、隐蔽性以及通用性的提升策略,生成单一对抗扰动的攻击策略也较大幅度的降低了攻击者的攻击成本,进一步提升了攻击效率。达到了故障诊断领域对抗攻击当前先进的水平。
附图说明
图1是本发明的技术流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种针对故障诊断模型的通用对抗扰动生成方法,包括设计、优化、训练通用对抗扰动生成网络;
S1.通用对抗扰动生成网络为G,是多层感知机模型,包含三个全连接层,在每一个全连接层后使用批范数层避免梯度消失,使用RELU作为非线性层;
S2.优化通用对抗扰动生成网络包括对抗性提升、通用性提升和隐蔽性提升;
S3.训练通用对抗扰动生成网络包括:
S3.1.在前向传播阶段,给定一个固定的随机向量U输入生成网络G,产生单个扰动
;
表示对抗样本,输入对抗样本至故障检测模型/>
S3.2.在反向传播阶段,通过最小化损失函数更新G的参数,攻击成功率表示模型对添加了对抗扰动的检测信号的误分类比率,每次生成网络的参数更新后,通过计算信噪比和攻击成功率来评估优化结果,如果信噪比大于最小阈值,同时攻击成功率超过预期比值,停止训练并返回对抗扰动
S2包括:
S2.1.对抗性提升包括:
有目标对抗扰动的对抗性优化的目标函数
;
无目标对抗扰动的对抗性优化的目标函数
;
其中,
S2包括:
S2.2.通用性提升包括:
S2.2.1.添加置信阈值k,对抗性优化的目标函数更新为
;
式中,untargeted表示无目标,targeted表示有目标;
在非目标攻击中,如果
在目标攻击中,如果
S2包括:
S2.2.2.设计攻击注意力权重,以真实标签的预测概率
;
攻击注意力权重
;
则通用性提升优化后的目标函数变为:
。
S2包括:隐蔽性提升包括:
S2.3.使用
对抗扰动的优化目标函数Loss为:
。
本发明技术流程如图1所示,检测信号、生成网络和通用扰动一起输入对抗扰动,导入故障诊断模型,分别进行攻击困难度和攻击性提升损失处理,分别得到攻击注意力和困难样本筛选,完成焦点增强,然后输入目标函数,同时目标函数进行梯度回传,和随机向量一起进入生成网络,依次输入通用扰动和扰动损失,回到目标函数。对抗性提升中,对抗性反映的是对抗扰动对故障诊断模型诊断的误导能力。根据故障诊断模型误导结果是否可控通常将对抗扰动分为有目标对抗扰动和无目标对抗扰动,对应的攻击方式分类为有目标攻击和无目标攻击。具有较好对抗性的对抗扰动表现为模型对于被扰动的检测信号的诊断产生了置信度较高的误分类结果。
对于最小化目标函数
通用性提升中,通用性是反应对抗扰动对故障诊断模型对不同检测信号诊断干扰的泛化能力。具备较好通用性的对抗扰动表现为将相同的对抗扰动加入不同的检测信号中,均能误导模型对检测信号的分类。这种攻击方式也被称为通用攻击。在通用攻击中,一些检测信号添加了在优化后的扰动后很容易被攻击,同时也有一部分“硬样本”很难被欺骗。这些“硬样本”在添加了对抗扰动后仍会在真实的标签上获得一个很高的置信度分数。为了增强对抗样本攻击时的泛化性,在扰动的优化时设计了焦点增强机制,以置信阈值κ过滤难易检测信号,利用攻击注意力权重w迫使对抗扰动优化时更关注对“硬样本”进行攻击,以增强对抗扰动的通用性。
隐蔽性提升中,对抗扰动的隐蔽性通常用信噪比衡量,由于本发明生成的是通用扰动,信噪比与扰动的二范数的平方成反比。通过最小化目标函数Loss优化生成网络G,以生成具备较好对抗性、通用性及隐蔽性的扰动δ。
选取了5个最常用的故障诊断模型在3个最流行的数据集上验证本发明攻击算法有效性,同时,为了体现本发明算法的先进性,选取了4种当前最流行的轴承故障诊断对抗攻击算法进行对比。为了公平,设定实际攻击场景是实时性的且输入的检测信号不可知。对抗扰动的衡量指标通常为信噪比和攻击成功率。本发明的无目标攻击和有目标攻击的实验结果中,发明算法远优于现有对抗攻击算法,且能很好的适应实时性要求高和检测信号未知的攻击场景。
以上实施例仅用于说明本发明的技术方案,而非对其限制,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换,而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
- 一种基于生成对抗网络的通用扰动生成方法
- 一种基于生成对抗网络的通用扰动生成方法