掌桥专利:专业的专利平台
掌桥专利
首页

一种基于电网大数据的网络安全态势智能预测方法

文献发布时间:2024-04-18 19:58:26


一种基于电网大数据的网络安全态势智能预测方法

技术领域

本发明涉及电网安全技术领域,尤其涉及一种基于电网大数据的网络安全态势智能预测方法。

背景技术

网络安全态势是指网络安全状况及其变化趋势的综合表征,是网络安全防护的重要依据。电力行业作为国家关键信息基础设施的重要组成部分,其网络安全态势直接关系到电力系统的安全稳定运行和电力可靠供应。随着电力系统的规模不断扩大,电网数据的规模和复杂度也不断增加,传统的网络安全态势感知方法难以满足电力行业对网络安全态势的实时监测和动态预测的需求。

发明内容

本发明提供了一种基于电网大数据的网络安全态势智能预测方法,包括:

Step1、收集电网相关的数据,包括电网设备状态数据、电网运行参数数据、电网网络流量数据、电网安全事件数据;

Step2、对收集的数据进行预处理,包括数据清洗、数据融合、数据压缩;

Step3、对预处理后的数据进行特征提取;

Step4、根据提取的特征使用多维度指标体系计算安全态势分值,根据安全态势分值划分安全态势等级;

Step5、建立安全态势预测模型,使用滑动窗口法输入网络安全态势分值序列,输出未来预定周期内的安全态势预测结果。

如上所述的一种基于电网大数据的网络安全态势智能预测方法,其中对收集的数据进行数据清理,包括以下子步骤:

使用平均值填补缺失值;

使用箱线图检测异常值;

使用哈希函数检测重复值;

使用规则匹配检测不一致值;

将检测到的异常值、重复值、不一致值进行删除。

如上所述的一种基于电网大数据的网络安全态势智能预测方法,其中对预处理后的数据进行特征提取,具体包括以下子步骤:

根据电网安全事件数据每次事件时间、时间来源查询相关电网数据;

将查询结果以事件类型标识分类;

将不同事件类型下的电网数据分别形成数据集;

将数据集作为输入集进行关联分析;

根据输出结果确定同一事件类型下的第一特征、第二特征和第三特征。

如上所述的一种基于电网大数据的网络安全态势智能预测方法,其中使用多维度指标体系计算安全态势分值,具体包括以下子步骤:

确定多维度指标体系;

对电网特征进行加权和归一化;

计算电网网络安全态势的分值;

记录不同维度指标下的网络安全态势分值。

如上所述的一种基于电网大数据的网络安全态势智能预测方法,其中使用聚类算法划分安全态势等级,具体包括以下子步骤:

计算最优K值;

将各维度指标下的电网网络安全态势分值按照距离最近原则划分为K个簇,进行聚类分析;

根据簇内分值的高低确定各个簇的等级。

如上所述的一种基于电网大数据的网络安全态势智能预测方法,其中建立安全态势预测模型,具体包括以下子步骤:

建立时间序列下包含不同指标维度的电网网络安全态势的分值集;

将上述分值集作为训练数据集,使用滑动窗口法对训练数据集进行切分和输入;

以简单季节性模型做为基础预测模型进行拟合得到安全态势预测模型。

如上所述的一种基于电网大数据的网络安全态势智能预测方法,其中对安全态势进行智能预测,具体包括以下子步骤:

使用滑动窗口法输入网络安全态势分值序列;

输出预测周期下的网络安全态势分数;

输入网络安全态势分数到安全态势等级确定函数;

返回安全态势等级。

本发明还提供一种基于电网大数据的网络安全态势智能预测系统,包括:电网数据收集模块、电网数据预处理模块、电网数据特征提取模块、安全态势评估模块、安全态势预测模块;

电网数据收集模块用于收集电网相关的数据;

电网数据预处理模块用于对电网数据收集模块收集的数据进行预处理;

电网数据预处理模块用于对预处理后的数据进行特征提取;

安全态势评估模块用于对提取的特征进行安全态势评估;

安全态势预测模块用于对安全态势进行智能预测。

如上所述的一种基于电网大数据的网络安全态势智能预测系统,其中电网数据预处理模块包括:数据清洗子模块、数据融合子模块、数据压缩子模块;

数据清洗子模块用于对收集的电网数据进行质量检验和错误纠正;

数据融合子模块用于对收集的电网数据进行整合和关联,包括将不同来源、不同格式、不同维度的电网数据进行统一和对齐;

数据压缩子模块用于对收集的电网数据进行压缩和简化。

本发明实现的有益效果如下:利用大数据分析技术与人工智能技术,对电网相关的数据进行特征提取、安全态势评估和智能预测,能够有效地利用电网大数据,实现对电网网络安全态势的实时监测和动态预测,为电网网络安全防护提供科学依据和决策支持。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种基于电网大数据的网络安全态势智能预测方法流程图。

具体实施方式

下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

如图1所示,本发明实施例一提供一种基于电网大数据的网络安全态势智能预测方法,包括:

步骤S10:收集电网相关的数据,包括电网设备状态数据、电网运行参数数据、电网网络流量数据、电网安全事件数据;

获取电网网络安全态势的原始信息,为后续的特征提取、安全态势评估和智能预测提供数据支持,具体地:

电网设备状态数据:该数据反映了电网设备的运行状况,包括设备的在线状态、故障状态、温度状态、电压状态、电流状态等;该数据可以通过设备自身的传感器或监控系统采集,也可以通过人工巡检或维护记录获取;该数据对于分析电网设备是否存在异常或潜在的安全隐患具有重要意义。

电网运行参数数据:该数据反映了电网系统的运行参数,包括电压、电流、频率、功率、负荷等;该数据可以通过电力调度系统或智能电表采集,也可以通过历史数据或统计报表获取;该数据对于分析电网系统是否处于正常或稳定的运行状态具有重要意义。

电网网络流量数据:该数据反映了电网网络的通信流量,包括网络协议、源地址、目的地址、端口号、数据包大小、时间戳等;该数据可以通过网络监控系统或网络分析工具采集,也可以通过网络日志或报警信息获取;该数据对于分析电网网络是否存在异常或恶意的通信行为具有重要意义。

电网安全事件数据:该数据反映了电网网络的安全事件,包括事件类型、事件级别、事件来源、事件目标、事件时间、事件影响等;该数据可以通过安全管理系统或安全分析工具采集,也可以通过安全报告或安全评估获取;该数据对于分析电网网络是否遭受过攻击或威胁具有重要意义。

步骤S20:对收集的数据进行预处理,包括数据清洗、数据融合、数据压缩;

数据清洗:对收集的电网数据进行质量检验和错误纠正,包括删除或修复缺失值、异常值、重复值、不一致值;使用平均值填补缺失值,使用箱线图检测异常值,使用哈希函数检测重复值,使用规则匹配检测不一致值,将检测到的异常值、重复值、不一致值进行删除。

数据融合:对收集的电网数据进行整合和关联,包括将不同来源、不同格式、不同维度的电网数据进行统一和对齐,使用JSON格式将不同来源的电网数据进行转换,使用时间戳或设备编号将不同格式的电网数据进行对齐,使用降维或升维方法将不同维度的电网数据进行整合。

数据压缩:对收集的电网数据进行压缩和简化,包括减少电网数据的存储空间和传输时间,保留电网数据的主要信息和特征。通过数据采样方法和数据编码方法实现,使用分层采样方法将大量的电网数据进行抽样,使用无损压缩将冗余或无关的电网数据进行压缩编码。

步骤S30:对预处理后的数据进行特征提取;

根据电网安全事件数据的事件时间、事件来源查询电网设备状态数据、电网运行参数数据、电网网络流量数据中相关电网数据,得到安全事件发生时的电网数据,并将查询结果以事件类型标识分类;

将不同事件类型下的电网数据分别形成数据集,进行关联分析,设置最小支持度为0.5,不同事件类型的电网数据集分别作为输入集,经过关联分析后得到不同事件类型的安全事件的诱发因素,按支持度进行排序,支持度即诱发因素在同一事件类型中出现的次数,出现越多则说明该诱发因素对造成安全事件的影响越大,取输出结果支持度前三的频繁项集,频繁项集的内容就是上述诱发因素,分别作为同一事件类型下的第一特征、第二特征和第三特征。

步骤S40:根据提取的特征使用多维度指标体系计算安全态势分值,根据安全态势分值划分安全态势等级;

确定多维度指标体系,包括:设备状态指标、运行参数指标、网络流量指标、安全事件指标;对电网特征进行加权和归一化,计算出电网网络安全态势的分值,反映电网网络安全状况的好坏,计算公式为:

根据安全态势分值划分安全态势等级:对电网网络安全态势分值进行聚类和划分,确定出电网网络安全态势的等级,反映电网网络安全状况的严重程度,将各维度指标下的电网网络安全态势分值按照距离最近原则划分为K个簇,然后根据簇内分值的高低确定各个簇的等级,高、中、低,及每个等级所表示的分数范围;K值的计算公式为:

步骤S50:建立安全态势预测模型,使用滑动窗口法输入网络安全态势分值序列,输出未来预定周期内的安全态势预测结果。

结合电网网络安全态势的分值与分安全态势等级建立安全态势预测模型,首先建立时间序列下包含不同指标维度的电网网络安全态势的分值集,

将上述分值集作为训练数据集,使用滑动窗口法对训练数据集进行切分和输入,通过设置和调整滑动窗口法的参数实现,例如设置滑动窗口的大小为5分钟或10分钟,表示每个数据子序列包含5分钟或10分钟内的安全态势数据;设置滑动窗口的步长为1分钟或2分钟,表示每个子序列之间相差1分钟或2分钟的安全态势数据;以简单季节性模型做为基础预测模型进行拟合,最终得到安全态势预测模型:

使用安全态势预测模型对安全态势进行智能预测,首先通过使用滑动窗口法输入网络安全态势分值序列,即不同时间序列下网络安全态势分值集合,经过安全态势预测模型进行预测,输出预测周期下的网络安全态势分数;

根据预测周期下的网络安全态势分数确定预测周期内的安全态势等级,将输出的预测结果输入安全态势等级确定函数中,返回安全态势等级,安全态势等级确定函数为case when语句组成的判断函数,判断输入值属于高、中、低三个等级中具体哪一等级的分数范围。

实施例二

本发明实施例二提供一种基于电网大数据的网络安全态势智能预测系统,包括:电网数据收集模块、电网数据预处理模块、电网数据特征提取模块、安全态势评估模块、安全态势预测模块;

电网数据收集模块用于收集电网相关的数据,包括电网设备状态数据、电网运行参数数据、电网网络流量数据、电网安全事件数据,并将收集的数据传输至电网数据预处理模块;支持以太网、4G、RS485等接口,支持文件导入。

电网数据预处理模块用于对电网数据收集模块收集的数据进行预处理,并将预处理完成的数据传输至电网数据特征提取模块,包括:数据清洗子模块、数据融合子模块、数据压缩子模块;数据清洗子模块用于对收集的电网数据进行质量检验和错误纠正,包括删除或修复缺失值、异常值、重复值、不一致值;数据融合子模块用于对收集的电网数据进行整合和关联,包括将不同来源、不同格式、不同维度的电网数据进行统一和对齐;数据压缩子模块用于对收集的电网数据进行压缩和简化,包括减少电网数据的存储空间和传输时间,保留电网数据的主要信息和特征。

电网数据预处理模块用于对预处理后的数据进行特征提取;

安全态势评估模块用于对提取的特征进行安全态势评估,包括使用多维度指标体系计算安全态势分值、使用聚类算法划分安全态势等级;

安全态势预测模块用于对安全态势进行智能预测,包括建立安全态势预测模型、使用滑动窗口法输入历史安全态势数据、输出未来预定周期内的安全态势预测结果。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

相关技术
  • 一种基于电网大数据的网络安全态势智能预测方法
  • 一种基于电网大数据的网络安全态势智能预测方法
技术分类

06120116494787