掌桥专利:专业的专利平台
掌桥专利
首页

卫星状态异常检测方法、系统、计算机设备及存储介质

文献发布时间:2023-06-19 18:37:28


卫星状态异常检测方法、系统、计算机设备及存储介质

技术领域

本发明属于卫星状态异常检测领域,具体涉及一种卫星状态异常检测方法、系统、计算机设备及存储介质。

背景技术

随着硬件设施的发展和工程制造水平的提升,航天器仪器部件日益灵敏精细。同时,为满足更高目标任务的实施要求,航天器组成结构也日益复杂。人造卫星是精密航天器中的一种,在国防、经济、生态、社会发展和国民生活的方方面面都发挥了重要作用,占据着举足轻重的地位。

然而,由于外太空环境复杂,卫星长期在极端温度、空间大气、太阳风暴、强电磁辐射的恶劣环境中运行;加之,卫星由成千上万个元器件组成,元器件性能随时间推移逐渐退化,卫星在轨期间难免会发生状态异常。倘若异常不能及时处理,轻则导致卫星某部分功能无法正常执行,重则造成卫星整体功能丧失,将带来巨大的经济损失,影响人们的日常生活,甚至产生更加严重的后果。

若能在卫星状态有异常倾向,但尚未发生严重故障时就检测出来,并采取有效干预措施进行修正,及时止损,将有利于保障卫星稳定、安全、可靠运行,延长卫星寿命,最大化任务收益。因此,异常检测是卫星故障诊断排查和实时健康监控的重要途径。

遥测数据是地面运管人员检测卫星状态的主要依据。由于卫星由多个分系统组成,遥测参数维度高、数据量巨大,且参数间常常关联变化,依靠人工分析是十分困难、不切实际的。数据挖掘是探索、挖掘大数据中隐藏规律、模式的一种技术方法,能从海量数据中自动提取出具有潜在价值、所期望获取的有效信息。

基于数据挖掘检测卫星状态,是近年来航天领域广为关注的研究热点。聚类分析是数据挖掘的方法之一,许多研究人员都曾将聚类分析用于车辆驾驶行为、电力大数据、核电站、航空器飞行轨迹等的工程异常检测问题中,并取得了不错的效果。

然而,每种聚类算法都有各自的优缺点,常见的不足包括易受初始质心的影响,效果对参数敏感、在缺乏先验知识的情况下参数难以确定,可能陷入局部最优等。例如,BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)算法中聚类质量对分支因子、阈值等超参数高度敏感,参数的微小差异就可能导致全然不同的结果,不同数据集也对应不同的最佳参数。目前还没有简便的参数设置方法,在缺乏先验知识的情况下,要得到合理的参数取值极为困难。实际应用中,常常需要通过“类似遍历”网格搜索的方式,测试各种参数组合,选择聚类效果最优的参数。显然,这个过程是耗时耗力的。

发明内容

本发明的目的在于克服使用聚类算法进行卫星状态异常检测时参数确定困难的缺陷。

为了实现上述目的,本发明提出了一种卫星状态异常检测方法,用于根据卫星遥测数据检测卫星状态,所述方法包括:

对卫星遥测数据进行预处理;

采用UMOEAsII_BIRCH算法对预处理后数据进行聚类分析,为卫星状态异常检测提供数据支持。

所述UMOEAsII_BIRCH算法利用UMOEAs-II算法得到BIRCH算法所需参数值,采用BIRCH算法对预处理后的数据进行聚类分析。

作为上述方法的一种改进,所述对卫星遥测数据进行预处理包括:特征选择、数据标准化和主成分分析。

作为上述方法的一种改进,所述特征选择具体包括:

删除遥测数据中反映模式、标志的状态量,以及不具有实际意义的保留字段;

利用皮尔森相关系数、斯皮尔曼相关系数或肯德尔相关系数进行特征选择。

作为上述方法的一种改进,所述数据标准化采用Z-Score标准化、Min-Max标准化、小数定标标准化、向量归一化或指数转换方法。

作为上述方法的一种改进,所述采用UMOEAsII_BIRCH算法对预处理后数据进行聚类分析,为卫星状态异常检测提供数据支持具体为:

选取效果评价指标F1-score,把1/F1-score作为目标函数的值;利用UMOEAs-II算法搜索使得目标函数值最小的解向量,得到BIRCH算法的近似最优参数;

利用BIRCH算法对预处理后的数据进行聚类分析。

作为上述方法的一种改进,所述目标函数的输入为BIRCH算法的超参数阈值和分支因子的取值组合,输出为1/F1-score。

作为上述方法的一种改进,所述UMOEAs-II算法,输入为BIRCH算法的超参数阈值和分支因子的取值范围,输出为使得目标函数值最小的超参数取值和此时的目标函数值。

本发明还提供一种卫星状态异常检测系统,其特征在于,所述系统包括:

数据预处理模块,用于对卫星遥测数据进行预处理;

数据分析模块,用于采用UMOEAsII_BIRCH算法对预处理后数据进行聚类分析,为卫星状态异常检测提供数据支持。

所述UMOEAsII_BIRCH算法利用UMOEAs-II算法得到BIRCH算法所需参数值,采用BIRCH算法对预处理后的数据进行聚类分析。

本发明还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述的方法。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如上述任一项所述的方法。

与现有技术相比,本发明的优势在于:

与通过网格搜索的原始BIRCH算法相比,改进的UMOEAsII_BIRCH算法在决策空间内搜寻,克服了“近似遍历”网格搜索方式中搜索精细程度与效率之间的矛盾平衡问题,能够发现更加优异的解。此外,改进的UMOEAsII_BIRCH算法需要较少的人工干预,不受先验知识的限制,实现了最优聚类参数的自适应选择,达到了改进的预期效果,能够应用于卫星异常状态检测,保障卫星安全稳定运行。

附图说明

图1所示为卫星状态异常检测方法流程图;

图2所示由上到下为UMOEAs-II方法找到的最优解的3次运行算法演化过程曲线图;左侧图横坐标是评价次数,纵坐标是适应度值;右侧图横坐标是评价次数,纵坐标是F1-score;

图3所示为以柱形图形式展示的实验结果。

具体实施方式

为了实现聚类参数的高效自动选择,本发明将聚类超参数的选择转化为了单目标优化问题,并应用智能优化算法求解。在这个问题中,要求的解向量即为待选择的聚类参数,决策空间为参数的取值范围,目标函数值为选取的某个聚类效果评价指标。UMOEAs-II算法对于单目标优化问题有较好的解决效果,据此本发明将UMOEAs-II算法与BIRCH算法结合,提出了UMOEAsII_BIRCH算法,以实现聚类算法参数的自适应寻优。

下面结合附图对本发明的技术方案进行详细的说明。

如图1所示,本发明一种卫星状态异常检测方法包括:

针对待检测的原始遥测数据,首先进行数据预处理,包括特征选择、数据标准化、主成分分析。

(1)特征选择

本方法所研究的卫星状态异常检测针对点异常中的集体异常,研究对象是模拟量。因此,首先删除遥测数据中反映模式、标志的状态量,以及不具有实际意义的保留字段。

剩余属性均为模拟量,属于研究范围。但各属性间并非独立的,很多属性相互关联,有的还高度相关。对于相关性高的属性,所包含的信息往往极为相似。删除相似属性,可以减少特征冗余,提高效率。

常见的相关性度量指标包括皮尔森(pearson)相关系数、斯皮尔曼(spearman)相关系数和肯德尔(kendall)相关系数。这里选择皮尔森相关系数。皮尔森相关系数可以衡量线性相关的连续变量之间的相关程度。假设有两个变量X、Y,cov(X,Y)是两个变量间的协方差矩阵,σ为方差,ρ

皮尔森系数ρ

(2)数据标准化

常用的标准化方法包括Z-Score标准化、Min-Max标准化、小数定标标准化、向量归一化和指数转换等。本方法选择Z-Score标准化,即标准差标准化,将数据转化为标准正态分布。设原始数据为X,其均值为μ,标准差为σ,标准化后的数据为X

该方法对于后续主成分分析和聚类的距离相似性度量有较好的效果。同时,使用这一方法一定程度上可以避免Min-Max标准化等对异常值敏感的问题。

(3)主成分分析

经特征选择,数据属性已大幅减少,但仍具有较高维度,影响聚类效率。因此,通过主成分分析进一步降维。

把预处理后的数据作为UMOEAsII_BIRCH算法的输入,针对卫星在轨状态异常检测,本方法的处理过程为:选取异常检测中常用的效果评价指标F1-score,把1/F1-score作为目标函数值,该值越小、越接近1,异常检测效果越好;然后利用UMOEAs-II算法自动搜索使得目标函数值最小的解向量,即得到BIRCH算法解决该问题的近似最优参数。

在UMOEAs-II和BIRCH算法结合过程中,目标函数为联系两个算法的桥梁,其设计是UMOEAsII_BIRCH算法实现的关键。设定目标函数的输入为BIRCH算法超参数(即阈值threshold和分支因子branching_factor)的某种取值组合,输出为1/F1-score。在目标函数中,根据输入的BIRCH算法超参数,完成对预处理后的卫星遥测数据的聚类和异常检测。对于UMOEAs-II算法,其输入为BIRCH算法要调整的超参数的取值范围,输出为使得目标函数值取得最小(对应F1-score最大,异常检测效果最好)的聚类超参数取值和此时的目标函数值。

在UMOEAsII_BIRCH算法实现过程中,通过不断迭代使适应度收敛至某一最小值。经算法多次测试,找到最终适应度值最小的循环,其求得的解向量即为问题近似最优解。最优解对应聚类的超参数,通过上述过程实现了启发式自动搜索使得聚类质量最高的参数的目的,在本研究问题中意味着异常检测效果最好。

UMOEAsII_BIRCH算法框架如下,首先给出目标函数定义的伪代码:

目标函数定义:

在定义了目标函数的基础上,算法整体框架如下:

以我国某空间科学卫星为例进行实验。选取电源主要包括2020年12月的部分延时遥测数据进行算法验证,采样周期为1s,共获得58维特征,10万条数据样本。在原始正常数据的基础上,根据各属性含义和取值范围等先验知识,结合专家经验,模拟注入异常,得到模拟的含有点异常的卫星遥测数据(异常数据占比0.33%)供后续实验。

对于智能优化算法的测试,为避免偶然情况的干扰,需要重复运行多次,求得最小值、最大值、均值和方差,来综合评定算法性能。对于UMOEAs-II算法,本实验设定的重复运行次数为30次。统计UMOEAsII_BIRCH算法30次运行结果,得到如下统计量:最优解best=1.1614(对应F1-score=0.8610),最差解worst=1.1798(对应F1-score=0.8476),均值mean=1.1669,方差std=0.003936。

30次运行中共有3次找到了最优解。为观察算法收敛过程,依据记录点画出适应度最优值演化过程图和对应的F1-score演化过程图,如图2所示。由上到下是找到最优解的3次运行算法演化过程曲线,横坐标是评价次数,纵坐标左图是适应度值,右图是F1-score。可以看出,算法在2000~2700次评价达到收敛,30次运行结果方差小,算法具有较强的稳定性。

为比较不同聚类方法的效果,分别选取基于划分的K-Means,基于密度的MeanShift、OPTICS、DBSCAN和传统的基于层次的BIRCH算法,采用“近似遍历”网格搜索的方式,选择异常检测效果最好的参数。

对于异常检测,通常选取精确率、召回率、F1-score和假阳率作为效果评价指标。但倘若只单独分析精确率或者召回率是意义不大的,要综合考虑召回率和精确率,才能反映真实效果。F1分数(F1-score)是精确率和召回率的加权调和平均,取值范围为[0,1],其值越接近1,说明异常检测质量越高。F1-score是评价各算法异常检测效果最为重要的度量,也是本实验重点对比的指标。

在最优聚类参数下,统计各算法异常检测的精确率、召回率、F1-score和假阳率,并将异常检测效果与UMOEAsII_BIRCH算法对比,综合评定各算法性能,结果如表1所示。

表1算法测试结果

将实验结果以柱形图形式展示,如图3所示。比较传统聚类算法K-Means、MeanShift、OPTICS、DBSCAN和BIRCH的F1-score,可以发现基于层次的BIRCH聚类异常检测效果最好。同时,与通过网格搜索的原始BIRCH算法相比,改进的UMOEAsII_BIRCH算法在决策空间内搜寻,克服了“近似遍历”网格搜索方式中搜索精细程度与效率之间的矛盾平衡问题,能够发现更加优异的解。此外,本发明提出的算法需要较少的人工干预,实现了最优聚类参数的自动选择。

为实现聚类参数的自适应选择,本发明将参数调整视为一个单目标优化问题,并引入智能优化算法进行求解。将基于层次的聚类算法BIRCH和改进的联合多算子进化算法UMOEAs-II结合,提出了UMOEAsII_BIRCH算法。该算法能自适应寻得更精细、更优的参数取值,无需过多人工干预,能够应用于卫星实时监测、检测异常状态,有利于保障卫星安全稳定运行。

本发明将智能优化算法与聚类分析相结合,将聚类超参数的选择转化为单目标优化问题,并利用进化算法能够高效搜索近似最优解的能力,实现聚类参数的自适应选择,减少人工干预。

本发明还可提供的一种计算机设备,包括:至少一个处理器、存储器、至少一个网络接口和用户接口。该设备中的各个组件通过总线系统耦合在一起。可理解,总线系统用于实现这些组件之间的连接通信。总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。

其中,用户接口可以包括显示器、键盘或者点击设备。例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。

可以理解,本申请公开实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本文描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中,存储器存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。

其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本公开实施例方法的程序可以包含在应用程序中。

在本上述的实施例中,还可通过调用存储器存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器用于:

执行上述方法的步骤。

上述方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行上述公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合上述公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。

可以理解的是,本发明描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits,ASIC)、数字信号处理器(Digital SignalProcessing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(ProgrammableLogic Device,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本发明的功能模块(例如过程、函数等)来实现本发明技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本发明还可提供一种非易失性存储介质,用于存储计算机程序。当该计算机程序被处理器执行时可以实现上述方法实施例中的各个步骤。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

技术分类

06120115636655