一种电力系统冗余数据筛除装置
文献发布时间:2024-04-18 20:02:18
技术领域
本发明涉及数据检测技术领域。
背景技术
随着科技的发展,电力系统电源结构发生重大改变,电力系统也将进行电网规划和储能投建,用于缓解电力系统调峰压力并保证新能源消纳。对于规模庞大的含多类电源的省级电力系统,有必要对拟定的规划方案进行评估,验证规划方案的合理性。
电力系统的海量数据融合是未来发展的趋势,在SCADA系统的潮流数据中,识别并筛除冗余数据是支撑电力系统的海量数据融合中重要的一部分;但是在目前对电力系统冗余数据进行筛选的技术中,当电力数据过于庞大或者复杂的时候,无法从大量的数据中准确筛选出冗余数据,或者筛选出来的冗余数据会存在一定的误差。
发明内容
本发明的目的是为了解决现有的冗余数据进行筛选方法针对复杂电力数据时,筛除误差大的问题,提出了一种电力系统冗余数据筛除装置。
本发明所述的一种电力系统冗余数据筛除装置,该筛除装置包括数据获取模块、数据处理模块、计算模块、离散处理模块、匹配模块以及外壳;
所述数据获取模块、数据处理模块、计算模块、离散处理模块、匹配模块分别设置在外壳内;
数据获取模块,用于获取第一数据与第二数据,所述第一数据为SCADA系统中产生的潮流数据集,所述第二数据为数据项集支持度的选择阈值;
数据处理模块,用于对数据获取模块获取的第一数据进行多源异构能源数据融合处理,获得第三数据;
计算模块,用于对数据处理模块获取的第三数据与数据获取模块获取的第二数据进行逐层扫描与迭代计算,获得潮流数据频繁项集;
离散处理模块,用于对计算模块获取的潮流频繁项集进行离散处理,获得离散结果;
匹配模块,用于将离散处理模块获取的离散结果作为Apriori算法中新的事务,构建强关联规则,并基于所述强关联规则筛除电力系统中的冗余数据。
进一步的,所述计算模块采用的是用Apriori算法对所述第三数据与所述第二数据进行逐层扫描与迭代计算,获得潮流数据频繁项集。
进一步的,所述计算模块包括遍历模块、子计算模块、判断模块以及迭代模块;
遍历模块,用于根据项集规则,遍历所述第三数据,获得第四数据;
子计算模块,用于在所述第四数据中,计算每个项集数据对应的支持度计数,并根据所述支持度计数阈值对所述第四数据进行剪枝,将留下来的项集数据构成连接集合L;
判断模块,用于计算连接集合L的支持度,当该支持度大于等于支持度选择阈值时,则该项集为频繁项集;
迭代模块,用于当生成的连接集合L为空集,结束迭代过程,获得潮流数据频繁项集。
进一步的,所述离散处理模块通过K-Means算法对所述潮流频繁项集进行离散处理,获得离散结果。
进一步的,所述离散处理模块获得离散结果的具体方法为:
设定聚类簇的数量为N,并计算所述潮流频繁项集中,每一个数据点到各个质心的欧式距离,并将数据点分配到离他最近的质心,并更新簇内离质心最近的点为新的质心,直到质心位置不再变动,获得N个离散结果。
进一步的,所述匹配模块包括关联模块、对比模块以及筛除模块;
关联模块,用于分别对离散结果不同的频繁项集进行关联操作,并计算关联规则的支持度和置信度;
对比模块,用于当关联规则的支持度大于等于支持度选择阈值,且关联规则的置信度大于等于置信度选择阈值,则该关联规则称为强关联规则;
筛除模块,用于基于所述强关联规则,匹配电力数据中的冗余数据,并将冗余数据进行筛除。
本发明的有益效果为:通过计算模块和离散处理模块以及匹配模块的合理配合,将Apriori算法、K-Means算法以及关联规则结合起来,对电力系统中产生的冗余数据进行筛选并剔除的过程,能够准确筛选出相对应的冗余数据,减小了识别冗余数据的误差。
附图说明
图1为具体实施方式一所述的一种电力系统冗余数据筛除装置结构框图。
具体实施方式
具体实施方式一、结合图1说明本实施方式,本实施方式所述的一种电力系统冗余数据筛除装置,该筛除装置包括数据获取模块1、数据处理模块2、计算模块3、离散处理模块4、匹配模块5以及外壳6;
所述数据获取模块1、数据处理模块2、计算模块3、离散处理模块4、匹配模块5分别设置在外壳6内;
数据获取模块1,用于获取第一数据与第二数据,所述第一数据为SCADA系统中产生的潮流数据集,所述第二数据为数据项集支持度的选择阈值;
数据处理模块2,用于对数据获取模块1获取的第一数据进行多源异构能源数据融合处理,获得第三数据;
计算模块3,用于对数据处理模块2获取的第三数据与数据获取模块1获取的第二数据进行逐层扫描与迭代计算,获得潮流数据频繁项集;
离散处理模块4,用于对计算模块3获取的潮流频繁项集进行离散处理,获得离散结果;
匹配模块5,用于将离散处理模块4获取的离散结果作为Apriori算法中新的事务,构建强关联规则,并基于所述强关联规则筛除电力系统中的冗余数据。
在本实施方式中,外壳6用于对数据获取模块1、数据处理模块2、计算模块3、离散处理模块4和匹配模块5进行保护,防止外力破坏。
优选实施例中,所述计算模块3采用的是用Apriori算法对所述第三数据与所述第二数据进行逐层扫描与迭代计算,获得潮流数据频繁项集。
优选实施例中,所述计算模块3包括遍历模块、子计算模块、判断模块以及迭代模块;
遍历模块,用于根据项集规则,遍历所述第三数据,获得第四数据;
子计算模块,用于在所述第四数据中,计算每个项集数据对应的支持度计数,并根据所述支持度计数阈值对所述第四数据进行剪枝,将留下来的项集数据构成连接集合L;
判断模块,用于计算连接集合L的支持度,当该支持度大于等于支持度选择阈值时,则该项集为频繁项集;
迭代模块,用于当生成的连接集合L为空集,结束迭代过程,获得潮流数据频繁项集。
优选实施例中,所述离散处理模块4通过K-Means算法对所述潮流频繁项集进行离散处理,获得离散结果。
优选实施例中,所述离散处理模块4获得离散结果的具体方法为:
设定聚类簇的数量为N,并计算所述潮流频繁项集中,每一个数据点到各个质心的欧式距离,并将数据点分配到离他最近的质心,并更新簇内离质心最近的点为新的质心,直到质心位置不再变动,获得N个离散结果。
在本实施方式中,N为大于5的整数。
优选实施例中,所述匹配模块5包括关联模块、对比模块以及筛除模块;
关联模块,用于分别对离散结果不同的频繁项集进行关联操作,并计算关联规则的支持度和置信度;
对比模块,用于当关联规则的支持度大于等于支持度选择阈值,且关联规则的置信度大于等于置信度选择阈值,则该关联规则称为强关联规则;
筛除模块,用于基于所述强关联规则,匹配电力数据中的冗余数据,并将冗余数据进行筛除。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
- 一种全自动谷物鼓风筛除杂质装置
- 冗余数据库中数据采集点的主键生成方法、装置及设备
- 一种电力系统冗余数据筛除方法、系统及介质
- 一种数据库数据文件的冗余方法与装置