掌桥专利:专业的专利平台
掌桥专利
首页

基于分布式联邦学习的识别低轨卫星网络攻击方法及装置

文献发布时间:2024-04-18 20:01:30


基于分布式联邦学习的识别低轨卫星网络攻击方法及装置

技术领域

本申请涉及卫星网络安全技术领域,特别是涉及一种基于分布式联邦学习的识别低轨卫星网络攻击方法及装置。

背景技术

低轨卫星网络拥有不同于地面网络的独特的周期性和可预测性。然而,这些特点也使它们容易受到不同形式的威胁和攻击。攻击者可以通过分布式拒绝服务(DistributedDenial of Service,DDoS)攻击,霸占众多正常主机,用过量的数据包淹没服务器,从而消耗网络资源和链接带宽。一旦卫星网络成为网络攻击的牺牲品,其网络资源就会被迅速耗尽,即使有防火墙系统,网络被破坏的可能性也会持续存在。

流量是检测对低地轨道卫星网络的攻击和威胁的一个重要指标。卫星网络流量与预设阈值的重大偏差可以预示网络的异常和网络攻击的可能性。因此,监测所有卫星网络设备的流量是至关重要的。入侵检测系统(Intrusion Detection System,IDS)是一种防御基于流量的攻击的有效方法,它涉及到对传入的网络流量或子网的连续分析,以区分网络内的良性和恶意流量。然而,尽管深度学习技术已经成功地应用于IDS,通常需要收集用户数据发送到中央实体进行处理,但随着网络规模的扩大,识别威胁的准确性可能会逐渐降低。此外,由于卫星上的资源有限,通过卫星网络传输的信息必须有更高的安全和隐私水平。因此,确保数据安全和隐私已经成为低轨卫星网络中需要解决的一个紧迫问题。

另一方面,由于数据特征之间往往存在一定的自相关性,如果处理不当,会产生信息冗余和噪声,从而降低识别准确率问题。

发明内容

基于此,有必要针对上述技术问题,提供一种能够降低信息冗余和噪声,提高网络攻击识别率,并且能够保护信息安全和数据隐私的基于分布式联邦学习的识别低轨卫星网络攻击方法及装置。

一种基于分布式联邦学习的识别低轨卫星网络攻击方法,所述方法包括:

获取数据集,对所述数据集特征进行最大最小化处理,得到归一化数据集;

采用MIC-CFS融合算法,对所述归一化数据集进行处理,得到样本特征集;

对所述样本特征集进行降维处理,得到训练数据集;

客户端从服务器端获取初始训练模型,基于所述训练数据集对所述初始训练模型进行训练,得到初始更新模型;

对所述初始更新模型进行同态加密,并发送至服务器端;

服务器端对接收的同态加密后的初始更新模型进行解密,基于解密后的所述初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端。

其中一个实施例中,所述MIC-CFS融合算法表示为:

式中,

其中一个实施例中,对所述样本特征集进行降维处理,得到训练数据集,包括:

基于线性函数或多项式函数或径向函数对所述样本特征集进行降维处理,将所述样本特征集中的非线性数据映射到高维空间使其线性可分,得到训练数据集。

其中一个实施例中,所述初始训练模型包括若干隐藏层与输出层;所述隐藏层后具有Dropout层。

其中一个实施例中,所述输出层表示为:

式中,w是样本的权重,b表示偏置项,f(.)可以是任何类型的激活函数。

其中一个实施例中,客户端从服务器端获取初始训练模型,基于所述训练数据集对所述初始训练模型进行训练,得到初始更新模型,包括:

基于所述训练数据集对所述初始训练模型进行训练,训练过程中优化目标公式表示为:

式中,f

其中一个实施例中,对所述初始更新模型进行同态加密,并发送至服务器端;服务器端对接收的同态加密后的初始更新模型进行解密,基于解密后的所述初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端,同态加密解密的方法包括:

设置所述初始更新模型的参数矩阵为W

生成加密使用的公钥和私钥对;

对所述参数矩阵W

服务器端基于所述参数密文c

其中一个实施例中,对所述参数矩阵W

选择随机数s,满足(0≤s<r);

令参数密文c

式中,m

其中一个实施例中,服务器端基于所述参数密文c

d(c)=m(c)=L(c

式中,(λ,μ)为私钥。

一种基于分布式联邦学习的识别低轨卫星网络攻击装置,所述装置包括:

数据获取模块,用于获取数据集,对所述数据集特征进行最大最小化处理,得到归一化数据集;

数据处理模块,用于采用MIC-CFS融合算法,对所述归一化数据集进行处理,得到样本特征集;对所述样本特征集进行降维处理,将所述样本特征集中的非线性数据转化为线性数据,得到训练数据集;

初始训练模块,用于客户端从服务器端获取初始训练模型,基于所述训练数据集对所述初始训练模型进行训练,得到初始更新模型;

加密模块,用于对所述初始更新模型进行同态加密,并发送至服务器端;

聚合更新模块,用于服务器端对接收的同态加密后的初始更新模型进行解密,基于解密后的所述初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端。

上述基于分布式联邦学习的识别低轨卫星网络攻击方法及装置,通过获取数据集,对数据集特征进行最大最小化处理,得到归一化数据集;采用MIC-CFS融合算法,对归一化数据集进行处理,得到样本特征集;对样本特征集进行降维处理,将样本特征集中的非线性数据转化为线性数据,得到训练数据集;客户端从服务器端获取初始训练模型,基于训练数据集对初始训练模型进行训练,得到初始更新模型;对初始更新模型进行同态加密,并发送至服务器端;服务器端对接收的同态加密后的初始更新模型进行解密,并基于解密后的初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端。

本发明通过MIC-CFS融合算法结合降维处理的特征选择方式,分析数据集中特征之间的非线性关系,能够有效剔除冗余的特征信息和噪声,提高攻击识别率;客户端从服务端获取初始训练模型,然后用各自的训练数据集进行训练后将初始更新模型上传服务器端进行聚合更新,整个过程不共享训练数据集,而优先考虑数据隐私,并通过只交换模型参数而不是大量的原始数据样本而减少通信负担;同时,通过同态加密的方法,确保数据和模型隐私不被泄露。整体上,本发明提供的方法能够在保护隐私的同时提高了识别攻击的准确性,并且随着客户端与中央服务器之间通信次数的增加,识别攻击的准确率和召回率也有所提高,为低轨卫星网络的安全防御提供了一种思路。

附图说明

图1为一个实施例中基于分布式联邦学习的识别低轨卫星网络攻击方法的流程示意图;

图2为一个实施例中基于分布式联邦学习的识别低轨卫星网络攻击装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请发明人在实现本申请发明技术方案的过程中,发现联合学习可以解决卫星网络和地面网络之间的数据孤岛问题,实现联合训练而不共享数据,于是将联邦学习应用于识别低轨卫星网络攻击场景,特别是针对卫星网络传输的信息安全和隐私保护的问题,提出了一种基于分布式联邦学习的识别低轨卫星网络攻击方法。针对特征之间往往存在一定的自相关性,如果处理不当,会产生信息冗余和噪声,从而降低识别准确率问题,设计了一种新的数据处理方法,即MIC-CFS融合算法,通过该算法结合降维处理来进行特征选择,可以剔除冗余的特征信息和噪声,提高攻击识别率,有效提高模型训练准确率;其次,考虑到客户端上传的梯度参数仍会有隐私泄露的风险,通过同态加密方法与联邦学习结合,以保护数据隐私并降低通信成本。

可以理解,该方法主要针对识别低轨卫星网络攻击场景,假设三颗低轨卫星位于同一轨道上,并且始终可见,可以与关口站通信。另一方面,在地面部分,每个地面域包括一个环形拓扑网络,该环形拓扑网络由一个网关、三个路由器和两个客户端组成。为了监测各种网络流量的状态和行为,使系统能够快速响应并识别已知和未知的威胁,在地面网络控制中心部署了IDS。最后,将关口站作为联邦学习的中央服务器端,它将负责接收本地模型的更新,将其汇总到中央服务器中,并将其分发给低轨卫星和地面网关。这些低轨卫星端和地面网关端将作为联邦学习的客户端,在每一轮通信期间从中央服务器端上下载全局模型,利用客户端本地数据集进行模型训练更新,然后将它们的本地更新上传到关口站以进行下一轮通信。整个过程不共享本地数据集而优先考虑数据隐私,并通过只交换模型参数而不是大量的原始数据样本而减少通信负担。在模型训练阶段,设计了一种MIC-CFS融合算法结合降维处理的特征选择方法来分析特征之间的非线性关系,提高模型训练准确率;在模型上传阶段,为了避免模型参数发生发生隐私泄露,在联邦学习中还引入同态加密方法。

在一个实施例中,如图1所示,提供了一种基于分布式联邦学习的识别低轨卫星网络攻击方法,包括以下步骤:

步骤102,获取数据集,对数据集特征进行最大最小化处理,得到归一化数据集。

具体地,这里的数据集包括卫星数据集和地面数据集;进一步地,卫星数据集包括Syn_DDos和UDP_DDos两种攻击类型,地面数据集中包括Botnet attack,Web attack,Backdoor,LDAP_DDos,MSSQL_DDos,NetBIOS_DDos,Portmap_DDos,Syn_DDos和UDP_DDos九种攻击类型九,这些都属于非数据型特征,需要使用独热编码方法将将这些攻击类型转为数值型。

进行训练时,低轨卫星端通过卫星数据集进行本地训练,地面网关端通过地面数据集进行本地训练,数据之间不共享,只交换模型参数,减少通信负担。

由于每个特征数据的来源和维度不同,为了消除范围的影响,减少模型的误差,对特征数据进行最大最小化处理,过程如公式所示:

其中X为每个特征的值,X

步骤104,采用MIC-CFS融合算法,对归一化数据集进行处理,得到样本特征集。

可以理解,数据集包含流量等31个特征信息,如果将所有的特征信息输入模型进行训练,特征之间会产生噪声反而影响训练效果。基于此,设计一种MIC-CFS融合算法,该算法的主要思想是:对归一化数据集进行特征分析,筛选出与攻击类别属性相关性较高且特征之间相关性较低的特征子集,选择具有更多属性取值的特征作为样本特征集,然后在通过度量特征线性、非线性以及非函数的复杂关系,从而克服信息系数在处理连续变量上的不足。

其中一个实施例中,MIC-CFS融合算法表示如下:

式中,

步骤106,对样本特征集进行降维处理,得到训练数据集。

可以理解,根据MIC-CFS融合算法选择出来的样本特征集,如果特征维度过大,在训练过程中会提高模型的复杂度,因此,对样本特征集进行降维处理,可以对数据进行简化,提高计算效率,避免维度灾难,同时通过可视化降维后的数据,可以揭示数据中的模式和结构,帮助我们对数据有更直观的认识,并且在降为过程中,通过特征选择,能够排除无关或冗余的特征,提高模型的预测性能。

本实施例优选采用核主成分分析(KPCA)对样本特征即进行降维。核主成分分析(KPCA)是基于核函数的原理。它将输入空间通过非线性空间通过非线性映射投射到高纬度特征空间,然后进行主成分分析,具有很强的非线性处理能力。

在其中一个实施例中,采用线性函数或多项式函数或径向函数对样本特征集进行降维处理,将样本特征集中的非线性数据映射到高维空间使其线性可分,得到客户端模型训练数据集,其中:

线性函数表达式为:K(x,x

多项式函数表达式为:K(x,x

径向函数表达式为:

式中,p表示多项式的阶数,σ为高斯核函数的一个超参数。

步骤108,客户端从服务器端获取初始训练模型,基于训练数据集对初始训练模型进行训练,得到初始更新模型。

可以理解,在每个客户端,都会根据上述步骤生成相关的训练数据集,将训练数据集输入各客户端获取到到的初始训练模型种进行训练。

在其中一个实施例中,初始训练模型包括若干隐藏层与输出层;隐藏层后具有Dropout层。

具体地,初始训练模型包括三个隐藏层与输出层,每个隐藏层后面都有一个Dropout层,并只在训练期间使用,以防止模型过度拟合训练数据。

在其中一个实施例中,SoftMax函数被作为输出层的激活函数,以获得每种攻击被识别的概率。在初始训练模型的神经网络中,输出层可以表示为前一层的输入和偏置的加权和的函数,输出层表示为:

式中,w是样本的权重,b表示偏置项,f(.)可以是任何类型的激活函数。

另一方面,在初始更新模型上传阶段,在每一次通讯轮次中,客户端使用自己的数据,即训练数据集执行本地计算,并发送加密计算后的初始更新模型或模型更新值给服务器端,因此整个联邦学习的优化目标可描述为:

其中,f

步骤110,对初始更新模型进行同态加密,并发送至服务器端。

可以理解,在加密阶段,设置第k个(1≤k≤K)客户端的初始更新模型的参数矩阵为W

在其中一个实施例中,同态加密解密的方法包括:

步骤202,设置所述初始更新模型的参数矩阵为W

步骤204,生成加密使用的公钥和私钥对。

步骤206,对参数矩阵W

步骤208,服务器端基于所述参数密文c

在其中一个实施例中,生成加密使用的公钥和私钥对,包括以下步骤:

步骤214,随机选取两个大素数p和q,且pq和(p-1)(q-1)互质,长度相等。

步骤224,计算r=pq和λ=lcm(p-1,q-1),其中lcm为最小公倍数,g=r+1。

步骤234,令函数L(x)=(x-1)/r,则计算可得μ=(L(g

在其中一个实施例中,对参数矩阵W

步骤216,选择随机数s,满足(0≤s<r);

步骤226,令参数密文c

式中,m

根据步骤216和步骤226得出所有参与客户端的密文,即c

步骤112,服务器端对接收的同态加密后的初始更新模型进行解密,基于解密后的所述初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端。

可以理解,服务器端聚合参数对密文进行解密并更新全局模型。在每一轮通信轮次中,服务器端聚合各客户端上传的初始更新模型参数密文c=c

在其中一个实施例中,服务器端基于参数密文c

d(c)=m(c)=L(c

式中,(λ,μ)为私钥。

利用同态性质,简要证明方案的可行性:

至此,服务器端得到各客户端上传的模型参数明文,进行参数聚合,然后将更新后的全局模型参数下发到各客户端继续进行训练。

重复上述步骤直到模型收敛,获取整个分布式联邦学习过程的最终识别攻击结果。

上述基于分布式联邦学习的识别低轨卫星网络攻击方法,通过获取数据集,对数据集特征进行最大最小化处理,得到归一化数据集;采用MIC-CFS融合算法,对归一化数据集进行处理,得到样本特征集;对样本特征集进行降维处理,将样本特征集中的非线性数据转化为线性数据,得到训练数据集;客户端从服务器端获取初始训练模型,基于训练数据集对初始训练模型进行训练,得到初始更新模型;对初始更新模型进行同态加密,并发送至服务器端;服务器端对接收的同态加密后的初始更新模型进行解密,基于解密后的初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端。

本发明通过MIC-CFS融合算法结合降维处理的特征选择方式,分析数据集中特征之间的非线性关系,能够有效剔除冗余的特征信息和噪声,提高攻击识别率;客户端从服务端获取初始训练模型,然后用各自的训练数据集进行训练后将初始更新模型上传服务器端进行聚合更新,整个过程不共享训练数据集,而优先考虑数据隐私,并通过只交换模型参数而不是大量的原始数据样本而减少通信负担;同时,通过同态加密的方法,确保数据和模型隐私不被泄露。整体上,本发明提供的方法能够在保护隐私的同时提高了识别攻击的准确性,并且随着客户端与中央服务器之间通信次数的增加,识别攻击的准确率和召回率也有所提高,为低轨卫星网络的安全防御提供了一种思路。应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图2所示,提供了一种基于分布式联邦学习的识别低轨卫星网络攻击装置,包括:数据获取模块302、数据处理模块304、初始训练模块306、加密模块308和聚合更新模块310,其中:

数据获取模块302,用于获取数据集,对数据集特征进行最大最小化处理,得到归一化数据集。

数据处理模块304,用于采用MIC-CFS融合算法,对归一化数据集进行处理,得到样本特征集;对样本特征集进行降维处理,将样本特征集中的非线性数据转化为线性数据,得到训练数据集。

初始训练模块306,用于客户端从服务器端获取初始训练模型,基于训练数据集对初始训练模型进行训练,得到初始更新模型。

加密模块308,用于对初始更新模型进行同态加密,并发送至服务器端。

聚合更新模块310,用于服务器端对接收的同态加密后的初始更新模型进行解密,基于解密后的初始更新模型对全局模型进行聚合更新,并将聚合更新后的模型发送给客户端。

关于基于分布式联邦学习的识别低轨卫星网络攻击装置的具体限定可以参见上文中对于基于分布式联邦学习的识别低轨卫星网络攻击方法的限定,在此不再赘述。上述基于分布式联邦学习的识别低轨卫星网络攻击装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

技术分类

06120116561903